余思琨,崔 征
(中国地质大学(武汉)图书馆,湖北 武汉 430074)
数据一直是科学研究中不可或缺的重要部分,随着网络发展和e-science环境的进程加快,数据被从实验室和笔记本中带出,进入了网络空间。Alan Blatecky[1]提出“数据是研究的新货币”。科学研究的更加紧密合作和跨专业,也使得数据生产数量达到了空前高度,Milner[2]提出科研数据每年以127%的速度增长。大数据的技术发展使得大量珍贵的科研数据能够得到保存与管理,DATAONE等许多图书馆合作的科研数据管理项目致力于在全球范围内共享和重复利用数据。图书馆作为知识服务提供者和科学文献的集散地,更应利用自身优势,提供更好的数据管理服务。据此图书馆馆员应在科研数据管理中适应新的角色定位,对自己提出更高要求。
在2016年的ACRL趋势报告中明确提出科研数据服务是图书馆的首要发展趋势[3],图书馆员需为研究人员提供整个科研过程中的存储、组织、分享、记录和处理等工具与服务,确保科研数据的可访问性、可靠性和及时性。许多高校特设了数据馆员岗位,或是将数据服务视作是参考咨询服务的新领域,甚至有高校将图书馆员嵌入科研团队中进行数据管理。在现有文献中,胡元元[4]对数据馆员岗位设置和服务内容进行梳理,穆向阳[5]探讨科研数据管理与学科馆员之间的关系,蔡韶莹[6]调研国内各大高校图书馆在科研数据管理中的实践。而本文结合DATAONE项目成功案例,进一步梳理图书馆员在科研数据管理项目中所扮演的角色及定位。
DATAONE(Data Observation Network for Earth)是一个多机构跨学科合作项目,致力于构建出新的全球网络基础设施的组织结构,解决生物、生态和环境研究领域中整个数据生命周期问题的数据管理集成工具。学术图书馆(加利福尼亚大学数字图书馆、田纳西大学和伊利诺伊大学芝加哥分校图书馆)、学术机构、环境观测站、基金和政府组织等多种机构都是DATAONE的开发合作机构。DATAONE的管理团队设在新墨西哥大学,超过25%的DATAONE成员来自图书馆学或是图书馆员[7]。
DATAONE项目吸引了广泛的利益相关者参与,而小组的跨学科组成产生了富有成效的思想交流。随着小组成员的不断互动,对各领域的数据再利用有了充分的理解,并形成了综合性的处理方法。融合研究已被确定为NSF的十大理念之一,并被NSF定义为深度整合多个领域知识、技术和专长,形成新的和扩展的框架[8]。融合研究通过让利益相关者参与合作,利用不同的专业知识,以增强创新和解决问题的潜力。正因为DATAONE项目中的融合思想,使得在识别利益相关者时并不是通过学科分类,而是通过使用者的身份与环境来考虑。
如图1所示,DATAONE认为科学家是最主要的利益相关者,将其放在利益相关者网络的中心,并识别到5种科学研究环境:私营组织、学术界、社区、政府、非营利和私营组织,每一个环境中都有次要利益相关者,组织用方框表示,个人用椭圆形表示。可以看到图书馆及图书馆员存在于多个环境中,且图书馆在5种科学研究环境中都提供支持服务。因如此,DATAONE一开始就将图书馆及图书馆员列为最重要的次要利益相关者。
图1 DATAONE利益相关者网络
DATAONE以数据为核心,立足于整个数据生命周期的问题,建立了一个简单易懂的可视化模型,如图2所示,用来确定科学家、图书馆员及其他用户在使用数据时的各种阶段和过程,满足所有科研数据管理的要求。
图2 DATAONE数据生命周期
图书馆员在整个数据生命周期过程中都可以提供支持和服务。在规划阶段,图书馆开发的DMPTool(Data Management Planning Tool)可以帮助研究人员在线制定和创建数据计划;在数据收集阶段,图书馆员可以提高收集效率和准确率;在质量保证阶段,图书馆员可以协助科学家制定对已收集数据的筛选和质量保证策略;在数据描述阶段,图书馆员针对数据的类别和特点帮助研究人员理解、选择和生成适合的元数据;在数据保存阶段,图书馆员也将根据研究的内容提供安全、稳定、分类清晰的数据库,以便于数据的二次利用;在数据发现阶段,图书馆员则利用自身专业优势帮助用户更快更好精准检索和访问数据;在数据整合与分析阶段,图书馆员能增强科研人员生成集成数据集的能力,并针对科研人员的研究要求提供可视化分析工具。
图书馆员在DATAONE科研数据管理项目中不仅能作为研究者从DATAONE中受益,并且能够参与项目的管理工作,更好为融合研究服务,更能从利益相关者的角度为科研数据管理提出建议,推动科研数据管理发展。
3.1.1 科学研究参与者
2006年10月在美国国家科学基金委员会和研讨图书馆协会召开的会议上就曾提出图书馆员参与数据管理的角色应从科研数据生命周期下游向上游拓展与延伸[9]。因此,图书馆员应作为科学研究的参与者,从研究初始阶段就与科研人员密切接触,深入到科学各环节。一方面将发挥图书馆员的信息管理学和图书情报学专业优势与科研人员专业知识的优势互补,在进行科研时查阅到最新研究动态,时刻掌握学科前沿动态,加快科学研究进程;另一方面也能加深对科研项目内容的理解,提升图书馆员的自身专业科研水平,增长业务能力,从某种程度来说,图书馆员作为科研团队成员是一种双赢。正因如此,康奈尔大学、麻省理工大学、哥伦比亚大学等高校已对数据馆员提出了参与科研项目的岗位要求,且已有图书馆员团队嵌入国家科学基金项目中[10]。
3.1.2 数据管理服务者
DATAONE项目中图书馆员能在数据生命周期的各个环节提供支撑与服务,并且为了能更好提供服务,创建用户画像以突出特点,形成用户场景,并根据个性化的需求提供定制化服务。而这些被展示在DATAONE网站中提供外部潜在用户浏览,进一步了解科研数据管理所能提供的服务,扩宽用户群体。而服务对象层次的提升,服务要求的细化,都促使数据管理服务者的服务层次不断深入。不仅需要随时跟进项目进度,还需要通过项目开展前中后期多次的评估了解用户的需求变化,调整服务模式。
3.1.3 科研数据管理者
已有研究指出了创新团队中边界跨越者的重要性[11]。边界跨越者可以跨学科转换不同的信息,减少学科边界造成的不连续性鸿沟等负面影响。科研人员知道如何就自己学科以外的学科提出问题,沟通解决问题。Tenopir 也认为“图书馆员在数据服务方面具有天然的领导作用,因为他们是机构中能够看到所有组成部分或学科广泛情况的人”[12]。在DATAONE项目组中,新墨西哥大学图书馆成立了SC(社会文化问题)和U&A(可用性与评估)两个工作组,前者负责从社会文化、国际和跨学科等不同的角度为DATAONE提供信息,创建可广泛用于科学界的模型、框架、定义和理论;后者则为DATAONE建立计划绩效指标,利用可用性分析原则衡量使用情况。
3.2.1 数据管理培训师
图书馆一直致力于提高全民信息素养,推动信息素养教育发展,而数据素养是信息素养教育的重要组成部分,更应受到重视,在数据生命周期各个阶段中的数据管理素养和意识都应给予培训与提高。教育对于DATAONE项目的成功尤其重要,因为大多数科学家不了解元数据标准、数据共享方式和存档工具以及数据管理方法。图书馆员通过发布教程文档、召开研讨会、座谈会等形式为用户在科研数据管理的流程、标准、资源、管理计划制定、技术、平台选择、工具使用等多种方面提供专业指导。与图书馆数据素养培训不同的是,数据管理培训应更加注重元数据的教育和应用。元数据是数据发现和理解至关重要的必要描述,但广泛使用的元数据标准被采用率却很低。高校图书馆员也应关注和指导学生进行数据管理实践,提高大学生的数据素养,以便为他们的学习或职业生涯做好准备。
3.2.2 科研数据管理产品经理
新墨西哥大学图书馆成立的U&A(可用性与评估)工作组反复进行产品的可用性测试,每两个月列出报告与SC组(社会文化问题)开会进行探讨。前中后期的多次评估、创建人物角色、搭建用户场景都有助于推动产品和服务的开发。根据反馈意见和问题,U&A工作组改善了DATAONE网站的外观,调整搜索区的功能,增强了页面上的用户体验,提高产品对科研数据管理和资源的利用价值,确保利益相关者的使用体验良好。而图书馆员对于数据库与数据管理工具的高度使用,对这些软件和网站的优缺点有充分的认识与了解,在开发维护的过程中可担任产品经理的角色,与开发人员合作,推动产品更好为提高科研效率服务。
科研数据管理给图书馆提出新挑战,图书馆员更应尽快适应新角色。
(1)以用户为核心,促进交流。图书馆员需要从用户的实际角度出发,全面了解科研用户在数据管理中存在的困难与需求。在初期用户的态度、行为和对科研管理期望值都是图书馆员需要理解和学习的,中期的在线咨询都可以加强图书馆员与用户的交流。提升与科研人员合作和沟通的技巧。
(2)增强自身数据素养。充分调动图书馆员的数据意识和敏锐度,加强对科研数据生命周期的理解和把握,全面了解科研数据管理的政策和法规,深入学习数据分析工具、语义描述语言、元数据的标准与格式、数据库等专业知识和计算机技术。在保持自己优秀科研数据管理水平的基础上,应投入时间和精力了解科研用户的学科内容,深入理解用户的科研数据管理需求。