董兰军(中国科学院文献情报中心)
科学数据产生于科研活动当中,它是一种既能反映科研活动特征,又能展示事物间规律的数据集。[1]E-science开放环境下,数据密集型(Data Intensive)科研的兴起对科学数据的管理与共享提出更高的要求。当前科研活动中产生的科学数据大多为个人或团队所拥有,通常缺乏专人管理,加之缺乏完善的数据共享政策、数据管理标准不统一等问题,使科学数据传播与共享工作变得更加艰难,严重阻碍数字科研的进步。高校图书馆作为科研活动的重要参与者与服务者,一直通过其丰富的馆藏资源助力科研活动,在科研创新中发挥着不可替代的作用。美国图书馆协会在《2015美国图书馆状态报告》中指出,图书馆在专注馆藏资源之余要致力于提供数据服务。[2]约翰霍普金斯大学图书馆、剑桥大学图书馆、维也纳大学图书馆、斯坦福大学图书馆分别建立了专属的知识库JHU Data Archive、DSpace平台、U:Scholar、SDR数字仓储,用来管理并共享科学数据。[3]第十六届数字图书馆理论和实践国际会议上,科学数据管理(Data Curation)被列入重要议题之一。
图书馆参与科学数据管理与服务,其人才队伍建设问题直接影响图书馆提供科学数据服务的质量和效率。其中,高层次信息管理人才建设是重中之重。黄如花等研究者指出,培养科学数据管理人才对提高我国科学数据共享水平有重要的促进作用。[4]然而,科学数据管理人才匮乏正是我国高校图书馆当前面临的问题。
国外高校在数据管理理论和实践方面有较为丰富的经验,并已形成成熟的体系。与之相比,我国对该领域的理论研究和实践较少,特别是在高校图书馆科学数据管理人才建设的问题上缺乏相关研究,加之我国对数据管理人才前期培养不足,因此对该领域高级专业人才需求更为迫切。国内图书馆应积极借鉴国外先进经验,尝试设置各类馆员岗位,建立成熟的人才培养模式,加快人才队伍建设,为图书馆参与科学数据管理服务提供人才保障。
国外一些著名的高校图书馆率先意识到科学数据管理人才建设的重要性,并取得显著成效。如,加利福尼亚大学伯克利分校在科学数据管理方面有不俗的水平,其中,最主要的原因在于该校非常重视人才教育并拥有强大的科学数据管理人才队伍。其下属的数据科学研究所 (Berkeley Institution for Data Science,BIDS)人才社区在开展服务时,会根据服务人员的学科优势进行分组,通过组与组之间的协调合作,BIDS可以更好地把握时下的科研热点和实践应用现状,为后续的科研项目服务奠定良好的基础。[5]同时,该校图书馆设有Data Lab,专门培训数据管理人才,从数据管理理论知识的灌输到实践技能传授,已形成较为成熟的人才培养体系。
新墨西哥大学图书馆主持的地球观测数据网(Data Observation Network for Earth,Data ONE) 项目指出了科学数据管理人才的职责,[6]即借助数据管理计划 (Data Management Planning Tool,DMP Tool) 帮助科研人员制定项目管理规划,确定和应用相关元数据模式,帮助科研人员确定相应的存储库。
2008年,牛津大学成立图书馆数据管理工作组,并启动“研究数据存储服务”(ScopingDigitalRepositoryServices for Research Data Management,SDRSRDM) 合作研究项目。[7]该项目以“围绕科研人员的发展为建设核心”的原则开展工作,对数据馆员进行实时数据管理培训与技能训练,建立了完善的培训体系。英国皇家学会在2012年发表的《科学是开放事业报告》中指出,政府应支持相关数据管理软件的开发和人员技能的培训等。
另外,美国麻省理工大学、约翰霍普金斯大学,澳大利亚的悉尼大学、墨尔本大学等也都建立了相对完善的人才培训体系。[8]
对科学数据产生、收集、处理、利用等环节进行管理的过程,即是对科学数据生命周期进行管理的过程。这个过程不仅需要对科学数据本身进行管理,还需要对科学数据产生的过程、内外部环境、使用的技术、对象等进行管理。[9]结合上述科学数据生命周期管理理论,按照管理主体工作性质和内容的不同,可将科学数据管理人才分为数据管理研究人才、数据分析人才、数据管理技术人才、数据监管人才和高层数据主管5大类(见下图)。
图 科学数据管理人才模型
(1)科学数据管理研究型人才主要指与科研团队有紧密沟通、对目标科学数据管理有整体、全面地把握,能够明确科研数据所有权与知识产权权益的科研工作者。其工作性质具有整体性、学术性和创造性,负责科学数据的收集与数据管理计划的制定。俄勒岗州大学下属机构数字学术与服务中心非常注重对科学数据管理的研究,如,该机构会依照NSF、NIH的相关规定,帮助科研人员制定合理的数据管理计划。[10]
(2)数据分析人才是实现数据价值挖掘的重要人才,利用数据分析工具和数据管理系统,研究人员可以基于元数据进行数据挖掘。元数据是描述和管理对象数据的数据,是数据描述、集成与归档工作的专业基础知识。图书馆的数据管理平台中心每天都在产生大量的元数据,这些元数据保存在内部的超大规模服务器中,当用户发生查询行为时,内部调度系统将会利用元数据调度对象数据库中的数据,为用户提供服务。这类人才是数据管理人才的主体,在数据管理人才结构中所占的比例较大。
(3)数据管理技术人才主要负责数据的共享、利用与可视化分析与服务,通过搭建科学数据共享平台的方式,开发科学数据的潜在价值,提供个性化数据咨询服务。[11]技术能力属于E-research环境下馆员的“硬”技能。[12]这类人才在社会上通常被冠以初级(高级)程序员、网络(高级)工程师、高级技术总监(Chief of Technology Officer,CTO)等称呼。数据管理技术人才有很强的现代信息技术开发和应用能力,包括网络安全、数据库、知识库的开发技术。
(4)数据监管人才主要负责科学数据的备份与存储。规范科研数据的存储类型、标准与期限,强调数据的安全性与保密性。科研数据的长期保存除赋予资源以相应的档案价值外,还赋予资源可用性价值,[13]对未来的科研活动十分重要,这正是数据监管人才工作价值的真实体现。约翰·霍普金斯大学Data Conservancy、哈佛大学 DataverseNetwork、康奈尔大学 Data Staging Repository等提供了科学数据监护平台运营经验。[14]此外,这类人才还应对数据资源管理方面的问题有所关注,特别是在数据隐私、数据版权、数据伦理等方面。[15]
(5)高层数据主管主要负责科学数据管理的战略规划。作为科学数据管理层中的核心决策人员,规划好图书馆的科学数据管理只是其中一环,该类人员还要对科研数据的发布、引用、出版进行严格控制,对科研数据的传播限制、发布机制进行详细规范。
研究图书馆科学数据管理人才素质问题,离不开对数据管理人才的基本素质、知识结构、智能结构的分析。文章从以上三个角度对未来科学数据管理人才的职业素质要求进行剖析(见下表),以期为我国高校图书馆人才教育培养提供借鉴与指导。
(1)科学数据管理人才的基本素质。数据素养是数据管理人才应具备的基本素质,这些素质主要包括系统的数据管理知识体系、专业的数据管理技能、敏锐的“数据嗅觉”、遵守数据政策、伦理规范等。国外很多高校很早就重视培养图书馆员的数据素养能力,如,2012年美国博物馆和图书馆服务协会(Institute of Museum and Library Services,IMLS) 合作开展的“数据信息素养项目”,旨在提高科研人员的数据意识。此外,科学数据管理人才还应具备良好的人际交往和沟通能力,较强的奉献精神和服务意识。
(2)科学数据管理人才的知识结构。科学数据管理人才的知识结构是在长期学习和工作实践中形成的较为稳定的意识形态,是形成科学数据管理专业素质的基础。科学数据管理人才的知识结构应该具有系统性,在计算机技能、数据分析技术、数据管理知识、管理学理论等方面有系统的知识储备。
就个体而言,知识结构在不同类型的数据管理人才中各有侧重点。如,科学数据管理研究型人才必须全面系统地掌握科学数据管理的基础理论和研究方法,关注学科领域的最新进展,时刻留意科研人员的动态,并及时进行沟通,为制定良好的科学数据管理计划做好准备;数据分析人才除掌握各种数据统计分析软件外,还应具有对科研数据进行揭示与描述的能力,制定相应元数据标准,对数据资源进行准确描述;数据管理技术人才应侧重于对其计算机专业知识的考核,良好的计算机专业背景加上主动的服务意识,是此类人员进行数据挖掘和管理的基础;数据监管人才要掌握数据存储的相关知识,对数据具有较强的敏感度,善于分析和组织数据;高层数据主管则应在了解基本的计算机理论和数据管理理论的基础上,具有较强的管理能力和组织协调能力,利用丰富的管理实践经验对数据和人员进行管理。随着越来越多的图书馆参与到科研数据管理中,高层数据主管的地位越来越重要,他们在数据图书馆建设中充当着总规划师的角色,特别是在规划图书馆数据化管理战略方面,有着重要的作用。因此,高层数据主管不仅需要懂得计算机和数据管理相关的理论,而且需要在数据管理的实践和战略规划等方面具备较深的造诣。
(3)科学数据管理人才的智能结构。科学数据管理人才的智能结构体现在其特有的思维方式、情绪心理和性格行为特征中,一般包括敏锐的观察能力、严谨的思维方式、较强的学习能力、良好的组织管理水平和创新意识等方面。依据科学数据管理人才的工作性质,其智能结构也会有所侧重。研究型人才在理论素养和逻辑思维方面应该更加出色,这能够帮助他们与科研人员进行有效的沟通,让科研数据信息流可以在整个生命周期中焕发活力。数据分析型人才在观察和思维方面应该有出色的表现,这让他们能够从数据中发现问题、挖掘数据价值。除此以外,这类人员还应该具有持之以恒的工作态度和积极进取的创新意识,努力发掘数据背后隐藏的信息。数据管理技术人才应该有较强的执行力、沟通表达能力和数据服务意识,善于发现和解决数据管理的技术性问题。数据监管人才应该有良好的数据安全意识,并且能够与时俱进,具有持续学习的能力和创造性思维。高层数据主管应该具备战略性的眼光和项目管理能力,能从管理的上层角度对数据进行分析、判断和策划,用以领导科学数据管理团队,加强图书馆的科学数据管理建设。
从指导思想的角度看,科学数据管理人才的培养要有科学的指导思想作为支持。科学的指导思想是专业素养的体现。因此,学校及其他教育培训机构应该重视数据管理理论知识和计算机应用技能的培训,将科学数据生命周期管理的相关理论纳入到专业课程的学习当中,结合多种教学模式展开教育,为图书馆提供专业性强、适应性强的科学数据管理者做好铺垫。
就过去的教育实践而言,我国对于图书情报的学科教育偏重于文献信息管理。然而从目前的实践来看,这些教育内容并不能充分满足各级各类图书馆、科技情报部门的实际需要,特别是在科学数据管理和服务方面,学校缺乏科学数据管理相关的理论、技术和方法教育。
表 科学数据管理人才的构成与素质要求简表
从培养目标的角度来看,科学数据管理人才要注重对通用型、专门型和复合型人才进行培养,以培养宽口径应用型人才为主。“通才”与“专才”可从两个角度去认定。一是就人才个体而言,素质上的“通”与“专”。科学数据管理人才是既掌握数据管理方面的理论知识,又具备某种专业技能的人才。二是就整个教育层次而言,指具有一定数据素养,能够在整个科学数据管理领域中发挥作用的专业人才。宽口径,强调人才具有庞大而完整的知识结构,掌握多门学科知识,并能融会贯通,对科学数据管理中的各个方面有很强的适应性。具体而言,高校可在开展基础学科教育的同时,注意发掘学生在科学数据管理方面的潜能,根据图书馆的实际发展情况开展个性化教育。
在E-science环境下,如果想要更好地培养科研数据的管理人才,就要建立科学完整的科学数据管理人才培养体系。只有全面开展多层次、多类型的教育模式,才能扩大科研数据管理人才培养规模,提高人才培养的质量。欧美很多高校开展的数据管理专业都已纳入硕博层次的教育体系,可见,我国在研究生培养方面必须重视数据素养教育的开展。
要培养出图书馆科学数据管理的优秀人才,需要从学生的素质和能力入手。在设置教育课程体系时,学校要充分调研图书馆科学数据管理的实践现状,依据目前科学数据共享服务中馆员应具备的素质和能力开设课程。从该思路出发,科研数据管理人才的培养过程即是“因材施教”的过程。数据管理研究型人才的课程设置应以信息管理学、信息检索、信息组织等课程为主;数据分析型人才的课程设置应包括数据挖掘、数据统计和分析工具的使用等;数据管理技术型人才的课程设置应以计算机网络、数据结构、数据可视化等课程为主;数据监管人才的课程设置应围绕数据库系统、数据协议等专业课程来设置;高层数据主管的课程体系结构除了应包括计算机基础、管理学基础以外,还应包括一些跨学科领域的课程,如,教育学、心理学等。另外,学校的课程设置一定要把学科数据管理的理论课程和实践课程结合,这样才能构建一个科学完整的学科数据管理课程体系。
(1)跨学科培养。如,计算机与信息管理系联合培养具有复合型结构的科研数据服务人才。兰卡斯特大学将计算机技术、应用统计与信息管理相结合,进行跨学科培养。[16]加利福尼亚大学圣地亚哥分校数据服务主任职责之一是与图书馆学科服务项目合作,提供研究数据管理计划支持服务。[17]
(2)提升服务技能。图书馆提供科研数据服务必定对服务人员的技能有一定的要求。对于同国外高校联合培养科研数据管理人才,可利用国外较为成熟的理论体系和实践条件,使学生有机会参加欧美高校图书馆的数据实践工作,以弥补国内科学数据管理专业教育方式和课程设置上的不足。
[参考文献]
[1]敖龙,李进华.E-science环境下的科学工作流实现及其应用研究(Ⅱ)——生命周期与应用分析[J].情报科学,2011(1):113-117.
[2]ThestateofAmerica’slibraries2015[EB/OL].[2016-12-15].http://www.ala.org/news/sites/ala.orgnews/.
[3]董坤,顾立平.若干国家科研数据开放政策框架研究[J].中国科技资源导刊,2016(3):51-57.
[4]黄如花,等.促进我国科学数据共享的对策[J].图书馆,2014(3):7-13.
[5]黄如花,林焱.加州大学伯克利分校数据管理的实践剖析[J].图书情报工作,2016,60(3):26-31.
[6]WMichener,etal.DataONE:DataObservationNetworkforEarth-PreservingDataandEnablingInnovation intheBiologicalandEnvironmentalSciences [EB/OL].[2012-01-10].http://www.dlib.org/dlib/january11/michener/01michener.html.
[7]Uribe L M.Finding of the scoping study interviews and the research data management workshop[EB/OL].[2016-12-15].https://ora.ox.ac.uk/objects/uuid:4e.
[8]毛玉容,许春漫.E-science环境下高校图书馆科学数据馆员制度建设研究[J].图书馆学研究,2016(16):85-95.
[9]丁宁,马浩琴.国外高校科学数据生命周期管理模型比较研究及借鉴[J].图书情报工作,2013,57(6):18-22.
[10]OregonStateUniversity.Datamanagement[EB/OL].[2016-12-15].http://cdss.library.oregonstate.
[11]尹春晓,鄢小燕.研究型图书馆在科学数据管理中的角色问题研究[J].图书馆学研究,2014(15):48-52,64.
[12]王琦,陈文勇.E-research环境下图书馆员角色重定位及其技能研究[J].大学图书情报学刊,2015,33(4):5-10.
[13]穆向阳,洪跃.学科馆员在科研数据管理中的角色分析[J].新世纪图书馆,2015(8):17-21.
[14]宋秀芬,邓仲华.美国高校数据监护平台研究与借鉴 [J].图书与情报,2015 (3):90-96.
[15]孟祥保,钱鹏.国外高校图书馆数据馆员岗位设置与管理机制[J].图书与情报,2013(4):12-17.
[16]完颜邓邓,高峰.国外数据管理专业人才培养调查及启示[J].图书馆理论与实践,2016(6):21-26.
[17]Director,research data curation services[EB/OL].[2016-12-15].http://www.iassistdata.org/.