孙俐玲
摘 要 论文通过对框架的分析和解读,提出明确研究数据馆员角色及职能要求、建立研究数据管理制度、制定研究数据馆员评价标准、加强研究数据馆员队伍建设、开展数据管理培训项目等建议。
关键词 研究图书馆协会 研究数据馆员 职业能力培训
分类号 G252.6
DOI 10.16810/j.cnki.1672-514X.2017.10.xxx
Abstract Through the analysis and interpretation of the framework, this paper puts forward the strategy of defining the roles and functions of research data librarians, establishing the research data management system, developing the evaluation criteria of research librarians, strengthening the construction of research data librarians, and carrying out data management training programs.
Keywords Research library association. Research data librarian.Professional competence training.
0 引言
随着数据驱动的科研第四范式的发展,科研人员的研究方式发生了质的变化,研究数据越来越成为验证或驳斥一种观点或结论的最直接、最有力、最客观的证据[1],其作用和地位被提到了前所未有的高度。在这种环境下,良好的研究数据管理(Research Data Management,简称RDM)对确保科学研究的透明度,保存和实现数据重复利用至关重要。因此,研究数据(Research Data,简称RD) 的收集、存储、分析和传播等问题成为专业学科领域尤其是图书情报界关注的焦点[2]。
在国外,研究数据管理受到许多大学及研究机构的重视,为培养研究数据管理专业人才,牛津大学(University of Oxford)、诺丁汉大学(The University of Nottingham)、康奈尔大学(Cornell University)、波士顿大学(Boston University)、爱丁堡大学(The University of Edinburgh)等积极研究适合本机构的数据馆员能力政策和评价标准[3],但对研究数据馆员能力的通用评价标准尚不统一。2016年6月,北美研究图书馆协会(ARL)、欧洲研究图书馆协会(LIBER)、加拿大研究图书馆协会(CARL)和开放获取知识库联盟(COAR) 共同颁布了《研究数据馆员能力框架》。该能力框架由多个国际研究型图书馆机构联合制定,研制过程严谨、规范,具有较强的信度和效度,有助于图书馆员认识自身所在机构在技能方面的差距。依据职位能力标准的描述,可供自我评估和职业能力培训参考。本文通过对该标准的分析和解读,为国内研究数据馆员能力标准构建提供借鉴[7]。
1 研究数据相关概念综述
1.1 研究数据
研究数据一般是专指数字化的科学研究数据,即科学研究中通过测算、观察、访淡、调研、实验、建模等方法获得产生的数据,而研究数据管理是指支持研究数据整个生命周期管理所涉及的服务、工具和基础设施,通常分布在不同的支持服务部门和学术部门(如研究办公室,信息技术服务,图书馆)。
研究数据可分为两类。(1) 文本数据:包括文本或Word文档,电子表格、实验室笔记本,现场笔记本,日记问卷,成绩单,录音带、照片,幻灯片,文物,标本等;(2) 电子数据:包括研究过程中获取和生成的数字对象、数据文件和数据库内容,如视频,音频,图像模型,算法,脚本应用程序(包括用于分析软件的日志文件、模拟软件、模式方法和工作流标准操作程序和协议) 等[8]。
根据研究数据按使用目的和过程,研究数据获取方式分为以下5类。(1) 观察法:包括实时捕获的数据,通常是不可替代的(如传感器数据、调查数据、样本数据、神经学图像等);(2) 实验法:主要来自实验室设备的数据,此类数据一般是可重复的,但代价较为高昂(如基因序列、色谱图、环形磁场数据等);(3)模拟法:从测试模型生成的数据,其中模型和元数据比输出数据更重要(如气候模型、经济模型等);(4)派生或编译法:文本和数据挖掘编译(如编译数据库,3D模型等);(5) 参考或规范法:通过数据集的集合,实现数据的发布和策划(如基因序列数据库;化学结构等)[9]。
1.2 研究数据馆员
Davenport和 Patil[10]认为数据馆员是指在数据管理、保存和存储方面经过系统、专门性训练,具有专业资质的技术人员。数据馆员作为研究数据管理的核心研究和服务人员,在对科学研究产生的数据进行管理、服务的过程方面,需要对涉及的规划、组织、安全性问题、记录和共享、存储和长期保存的数据集、版权、使用许可和知识产权等诸多领域提供支持服务。
2 《研究数据馆员能力框架》解读与分析
一般来说,研究数据管理需要与研究人员进行较高程度的沟通互动,也会与其他支持服务机构合作,因此,建议RDM培训与学科专家密切合作,以确保术语和实践与研究人员及其工作领域相关。在过去几年中,根据赞助商的要求来支持研究人员创建和实施數据管理计划的需求大大增加,对此,图书馆通常是与其他服务单位(如研究办公室、信息技术服务、法律顾问、伦理委员会) 合作,并将合作范围扩展到图书馆员和利益相关者的其他机构培训场所。endprint
本《研究数据馆员能力框架》 共分为图书馆角色、核心竞争力、职位列表、相关服务领域和职位四大模块,以下对四大模块和细目分类做分析和解读。2.1 图书馆角色
基于利益相关者理论,在研究数据管理过程中,图书馆被划分为核心利益相关者,其职能涉及为研究人员提供数据访问服务、帮助研究人员认识和管理数据、管理数据集3个领域,这些相关领域的内容存在部分重叠情况,但每个领域都有一些独特的服务和技能要求[11]。
2.1.1 提供数据访问服务
这一领域反映了图书馆在研究数据管理上更为传统的服务,即为寻找数据集的研究人员提供咨询和参考服务,具体包括 能识别和定位数据集、能提供条件支持数据的访问和再利用、 能识别软件或代码,以便理解和重用数据、 掌握发现和分析工具方面的技能、熟悉数据引用和参考知识。
2.1.2 帮助研究人员认识和管理数据
这一领域需要图书馆与研究人员直接合作,帮助其了解数据管理和共享的重要性,并在研究数据的全生命周期过程提供支持,该部分包括2个子模块。 (1) 政策和宣传职能:①能阐明研究数据管理的好处;②能促进数据共享和再利用;③熟悉研究数据的相关支持和培训政策;④能提高对RDM需求和选择的意识;⑤能教授数据知识(如元数据标准,格式等);⑥能协助完成RDM计划;⑦能识别有效的服务工作流程;⑧能识别数据标准和格式,以及元数据标准;⑨能识别存储库或数据存档;⑩能提供有关软件管理的建议。(2) 数据审计职能:①能确定数据集的范围;②能开发数据整理配置文件。
2.1.3 管理数据集
学者Nielsen H J和Hjrland B认为,研究型图书馆可以在某些时候成为保管、管理、利用数据的最佳场所[12]。该部分包括2个子模块。(1) 数据采集职能:①掌握数据存储能力;②评估、选择和将数据提取到数据管理存储库;③管理数据集和元数据。(2) 数据保存职能:①确保数据真实性;②更新数字媒体和迁移数据;③对数据进行备份和存储。
2.2 研究数据馆员职业能力核心竞争力
大多数情况下,图书馆员需要储备一定学科知识来支持研究数据管理,并对RDM相关学科领域、规范和标准有基本的了解,研究数据馆员职业核心能力分为如下3个子模块。
2.2.1 具备提供对数据的访问能力
根据能力框架,研究数据馆员职能之一是为用户提供数据访问服务,为满足职能需求,必须具备4项知识技能,即充分熟悉现有的数据中心、存储库和数据集,以及数据发现机制;有效认知数据操作和分析技术及工具;掌握数据在集合中的组织和结构方式;熟悉数据许可和知识产权问题。
2.2.2 具备数据管理的倡导和支持能力
根据能力框架,研究数据馆员职能之一是倡导和支持用户进行数据管理,为满足职能需求,必须具备7项知识技能和4项认知技能。
(1) 知识技能:①熟悉资助商的政策和要求;②掌握数据中心(存储库和数据集)知识;③了解数据结构(如类型、格式、词汇、本体和元数据);④熟悉数据管理计划和DMP工具;⑤熟悉期刊的数据发布要求; ⑥数字数据共享选项(开放访问、IPR、许可证);⑦数据引用和参考实践。
(2) 认知能力:①熟悉研究实践和工作流程;②熟悉数据共享和重用的优势;③熟悉承办数据审计和评估工具;④具备数据管理的纪律规范和标准能力。
2.2.3 具备管理数据集能力
根据能力框架,研究数据馆员职能之一是管理数据集,为满足职能需求,必须具备5项知识技能和4项实践技能。
(1) 知识技能:①熟悉元数据标准和模式(数据格式,域本体,标识符,数据引用,数据许可);②熟悉发现工具;③熟悉数据库设计类型和结构;④熟悉数据链接和数据集成技术;⑤熟悉数据存储库和存储平台。
(2) 实践能力:①能选择和评估数据集;②能积极管理研究数据;③能进行数字保存活动;④熟悉数字技术的取证过程[13]。
2.3 研究数据馆员职位列表
能力框架列出了研究数据馆员的职位列表,按照不同职能将其划分三大类共14项,第一类是提供对数据访问的职位,包括(研究) 数据馆员、社会科学数据馆员和地理信息系统(GIS) 馆员;第二类是支持和宣传研究管理数据,包括数据管理规划咨询顾问、研究数据管理服务开发专业人员、研究数据管理项目主管、数据管理专家、数据支持专家、研究数据支持专家、数字研究馆员和研究数据管理协调员;第三类是管理数据收集的职位,包括研究数据管理员、研究数据服务管理员和数据仓储管理员。
2.4 相关服务领域和职位
能力框架对研究数据馆员职位列表做出详细划分之余,还罗列了与研究数据馆员职业相关的其他图书馆服务领域和相关职位,具体划分了大领域的10个岗位。相关服务领域包括: 开放获取和机构知识库领域、馆藏发展领域、咨询服务(版权,政策等) 领域、信息素养领域、数字化管理领域、数字保存领域、数字馆藏领域。
职位相关者岗位包括数据创建者(Data Creator)、数据科学家(Data Scientist)、研究协调员或管理员(Research Coordinator/Manager)、数据保管库(Data Curator)、数字保存馆员(Digital Preservation Librarian)、保存库管理员(Repository Manager)、学科馆员(Subject Librarian)、法律顾问(Legal Advisor)、研究伦理顾问(Research Ethics Advisor)、数据访问管理员(Data Access Manager)[14]。
3 研究数据馆员职业能力构建策略
解读能力框架可知,国外研究型图书馆机构已经建立了较为全面的研究数据馆员职业能力评价体系,对研究数据管理的关注和重视可见一斑。大数据环境加速了E-science的快速发展,我国高校图书馆也应顺势设置特定研究数据馆员职位,推动研究数据的管理和共享。为此,国内图书馆要充分认识建设研究数据館员评价标准的重要性,基于国情、研情和馆情,借鉴国外图书馆的先进经验,从明确研究数据馆员角色及职责、制定研究数据馆员评价标准、加强人才队伍建设、完善管理制度等方面入手,提升研究数据馆员培养质量。endprint
3.1 明确研究数据馆员角色及职能要求
大数据时代下,“研究数据馆员”顾名思义即研究数据的馆员,为“数据管理者”。由于研究数据馆员在数据相关职业角色中占据非常重要的位置,是图书馆研究服务能力提升的保障,因此各高校图书馆在设置职位时,首先要根据实际馆情,清晰界定研究数据馆员的角色,厘清与馆内组织机构其他职位的关系,避免出现机构重叠、职能冗赘的情况。角色定位与职能要求之间是相互依存的关系,对研究数据馆员的角色界定明晰后,需要进一步明确、具体化研究数据馆员职能,为其开展数据管理工作提供准则纲要,也有助于服务效能的提升[15]。
3.2 建立研究数据管理制度
国外很多研究型图书馆委员会都制定了鼓励或强制建立研究数据管理制度的政策,并要求将研究数据存储在公认的数据中心中。如辛辛那提大学图书馆2014年联手McMicken文理学院,共建数字学术中心(Center of Digital Scholarship,简称CDS),制定了完善的管理制度,一方面开设专门网站,为用户提供数据查询、数据组织、数据处理、数据保存等服务,另一方面按照管理制度规范服务流程和规范,实现高效和标准化服务。当前,国内图书馆目前尚无此类制度,可积极借鉴国外图书馆经验,发挥后发优势,积极制定适合中国国情的数据管理政策,运用新兴技术,通过制度管理和共享研究数据,增强科研效率,实现科研价值[ 16]。
3.3 制定研究数据馆员评价标准
一套行之有效的研究数据馆员评价标准,不仅是界定数据馆员是否具备提供研究数据管理和服务能力的标准,也是检验其服务效果的手段和标杆。在高校图书馆研究数据服务提供中,职业能力框架对职位能力的详细描述有助于数据馆员进行自我认知和评估,弥补自身数据技能的不足。目前,国内研究数据管理工作尚处于起步阶段,研究数据馆员的相关标准研究和实践还是空白,高校图书馆可积极借鉴国外研究数据服务和相关标准实践,制定一套适合我国科研特色和馆情特色的指标体系[17]。一是构建职业资格认证制度,提升研究数据馆员队伍水平,确保专业数据服务的质量水准;二是优化考核制度,考察内容涵盖研究数据馆员的综合素质、服务质量、用户满意度等各个方面,考核方式以自评、互评、用户评价、组织评价相结合的方式进行全方位考核,具体实践中可以参考学科馆员的考核制度;三是完善竞争奖励制度,采取物质、荣誉等多种奖励模式,鼓励创新,在竞争中提升研究数据馆员的整体素质。
3.4 加强研究数据馆员队伍建设
从科学研究生命周期和数据生命周期角度看,图书馆员都能够通过提供相关研究数据管理服务,融入到科研人员的研究活动中去。研究數据馆员的素质直接影响服务水准,也将影响科研人员对图书馆提供研究数据服务的直接观感和满意度。当前,国内图书馆有关研究数据管理和服务依然停留在理论探讨阶段,实践成果较少,这与研究数据数据管理专门人才的稀缺有密切联系。对此,要从以下两方面着手加强。一是引进高素质的专业人才优选科学研究与图书情报领域知识兼备复合型人才,如计算机科学与图书情报学专业结合的双专业人才;二是从图书馆原有馆员中挖掘和培养优秀人才,对馆员需进行岗前培训,重点培训研究数据管理的理念、流程以及信息技术专业知识。2016年3月,中科院文献情报中心举办首届研究数据馆员培训班,让学员认识国家推动数据驱动社会发展的政策与个人职业素养的关系,让学员操作开源软件掌握数据存储、数据处理、数据分析、数据解读的能力,受到学界好评[18]。
3.5 开展数据管理培训项目
为数据管理过程提供详细指导,既方便用户随时随地接受数据管理培训,也丰富了图书馆的服务项目。图书馆在提供研究数据服务时,应加大研究数据管理培训力度,注重培养用户的数据管理意识,注重用户的数据素养培训。如英国爱丁堡大学图书馆的在线数据素养培训课程——MANTRA,免费为科研用户开放,内容涉及数据处理软件、数据引用与存储、数据共享、数据管理计划等多方面,深受用户欢迎。
4 结语
随着数据密集型研究的快速发展,图书馆员的工作也正逐渐延伸至研究数据管理或数据支持服务领域。国内图书馆应把握机遇,积极改革,创新服务内容,适应时代发展。研究数据馆员制度建设是一项系统工程,不可一蹴而就,应根据我国科研特色和图书馆实际不断调整和完善,同时要积极借鉴国外研究型图书馆有益经验,推动我国研究数据管理事业的健康发展。endprint