朱彩萍
(青海师范大学图书馆 青海西宁 810016)
信息技术的快速发展与E-Science、E-Research环境的形成,使得传统的科学研究向着数据密集型研究方向转变,产生于实验与科研过程中的实验、信息行为等科学数据都成为了科学研究的主要对象,基于科学数据的新一代研究范式即Dan Fay等人提出的科学研究第四范式——数据密集型科学发现正在形成并快速发展。在第四科研范式下,由于科学数据成为了研究人员的主要研究对象,且随着大数据时代的来临,类型复杂的数据如产生于智能移动终端、社交网络的非结构化数据、半结构化数据都成为了科研数据的组成部分,因而对其的收集、分析、管理、保存和共享都成为了数据管理、服务机构和部门的工作拓展领域。在此发展环境和需求背景下,西方图书馆界提出了科学数据服务的概念,即图书馆提供给研究者的科学数据相关服务,如科学数据的咨询、管理、分析、存储与组织等服务(也有一些组织、协(学)会、学者将科学数据服务称为数据管理服务、科研数据服务、数据监管服务等,但其内涵都是管理科学数据、协助科研工作者开展研究,促进科学数据资源价值增值)。
对高校图书馆来说,由于其服务的对象是以科研为主要任务的所在院校师生,在当前科研资源交流、汇集与共享且数量呈几何级数式增长、数据内容覆盖多个学科的数据密集化趋势下,数据的管理、开发、组织与利用已成为了其主要的工作任务之一。在ACRL颁布的2012美国大学图书馆十大发展趋势中指出,随着多种数据类型的产生和数据标准的持续更新,数据应用的挑战日益严峻,高校图书馆作为科研教学的辅助机构,必须适应这些发展趋势,发挥专业技术优势,以帮助科研社团尽快适应环境变化。因此,高校图书馆如何在大数据时代适应用户的发展需求,为科研人员提供嵌入到科研过程的科学数据服务,成为他们在新时期思考的问题之一。
作为以信息资源的组织、收藏、利用和服务为存在之本的高校图书馆来说,利用其在用户中的信息中心地位提供科学数据的推广服务有着得天独厚的优势。从目前的实践来看,一些高校图书馆也已经提供了诸如科学数据的管理介绍、科学数据的管理指南撰写、在线咨询与指导等服务。根据我国学者司莉等人的调查,在US News于2012年10月发布的2012世界大学综合排名前50名的高校图书馆中,有23所高校图书馆提供诸如“什么是科学数据”“为什么进行科学数据管理”等问题的介绍、咨询服务,如麻省理工学院图书馆的“数据管理与出版”专题指南就专门介绍了“什么是科学数据”、“为什么要进行数据管理”等不了解科学数据的用户可能问到的问题与答案;澳大利亚昆士兰大学图书馆以PPT的形式对科学数据服务进行了介绍;有21所高校图书馆提供科学数据管理指南的撰写与在线咨询等服务,如哥伦比亚大学等大学图书馆既为用户提供如何创建科学数据管理计划的详细说明(如数据格式、法律(政策)与伦理问题等),也提供有科学数据管理常见问题回答。
向用户提供科学数据的咨询、培训等管理服务也是高校图书馆进行科学数据服务的主要措施。根据美国大学与研究图书馆协会于2012年6月出版的关于学术图书馆与科学数据服务的白皮书,统计显示截止2011年年底,在报告所统计的221所成员馆中,23.3%的图书馆提供科学数据的培训服务,有40%以上的图书馆提供诸如科学数据的查找、引用等咨询服务。且随着高校图书馆科学数据服务的推进,越来越多的图书馆通过嵌入式学科服务将科学数据的咨询等服务提供给了用户,如麻省理工学院图书馆通过与科研人员(团队)合作,将科学数据咨询服务馆员嵌入到科研工作过程之中,为科研人员提供及时、准确的科学数据需求。康奈尔大学图书馆还成立了科学数据服务组织直接嵌入到科研工作过程中,为科研工作者提供科学数据管理规范制定以及科学数据的收集整理、数据分析、软件工具的开发和数据交流出版等个性化科学数据服务。
为了确保科学数据的长期再发现和再利用,因而贯穿于科学数据生命周期的标引、存储、维护等工作显得非常重要,业界将这类对科学数据的管理与完善活动称之为数据监护。在司莉等学者对50所美国高校图书馆的科学数据服务调查中,发现有包括剑桥大学等在内的15所高校图书馆提供数据监护服务。
目前业界开展数据监护服务最好的是英国数据监护中心(DDC),其活动已涉及到了数据监护的内容、对象、方法与工具等方面。高校图书馆通过与DDC的合作,如在DDC的前期构建过程中广泛参与,共享数据监护经验与实践案例,在DDC建成后又一方面提供指导与帮助来完善DDC的监护服务功能。如巴斯大学图书馆调查了工学、建筑学、社会学一般数据及视频数据的利用机制。另一方面通过引进和应用DDC的一些监护服务工具来提高自身科学数据的监护服务功能。如剑桥大学图书馆通过引进和向用户推荐由DDC开发、可以帮助科研人员方便地编制符合要求的数据管理计划的交互式数据管理计划编制工具DMPonline来实现自己的科学数据管理计划编制服务。
科学数据的管理与应用涉及到了数据的存储、获取、分析等过程,而大规模、多结构科学数据的出现,则为科学数据的应用和推广提出了难题,因而为用户提供科学数据的标示、组织、存储等技术支持服务成为了高校图书馆科学数据服务必不可少的组成部分。根据美国大学与研究图书馆协会于2012年6月出版的关于学术图书馆与科学数据服务的白皮书显示,在所调查的221所高校图书馆中已有部分图书馆提供数据标识、数据更新、创建或更改元数据等科学数据技术支持服务,尽管从目前看数量较少,大多数图书馆都暂未开展此类服务,但近三分之一的图书馆计划在两年内提供此类服务,说明该类服务是未来高校图书馆科学数据服务的主要增长点。
通过以上高校图书馆的科学数据服务可以看出,尽管在一些发达国家如美国的高校图书馆中开展如科学数据的管理等服务成为了主要服务内容之一,也表达了在未来改进和完善服务的意愿,在科学数据的宣传推广与科研人员的管理应用、技术支持等方面发挥了高校图书馆的技术、资源与服务优势,但仔细分析也存在着一定的不足之处。客观的认识和定位当前高校图书馆的科学数据服务水平,了解服务的不足之处,对我国高校图书馆的科学数据开展与发展将有着巨大的启示作用。
首先,现有的服务实践还主要停留于科学数据的浅层次管理方面。不管是科学数据的宣传推广、管理应用与技术支持,还是嵌入到科研过程的数据标示、数据监护等服务,都只是或对现有数据进行检索、获取和利用,或对增加数据的标示、存档与管理,但在能够提高数据的应用和管理水平的数据的关联、语义化、分析、挖掘以及基于这些数据的平台开发、知识组织、知识发现等方面存在着严重不足。而所缺失的这些服务,或许在大数据时代来临的大时代才可能是高校图书馆在数据挖掘、资源配置、平台开发与知识组织等方面的优势领域所在。
其次,现有的服务实践还主要面向所在院校的科研工作者。高校图书馆立足本校,主要面向所在院校的科研工作者提供文献、知识服务从高校图书馆的建设之使命来说本无可厚非,但随着信息社会的发展而出现的信息全球化、资源共享化趋势愈加清晰,以及高校图书馆面向社会开放的呼声与行动推动,越来越多的高校图书馆实现了向社会公众开放。科学数据服务做为一项体现高校图书馆在人才、资源、技术等方面优势的信息服务内容,也应该面向社会,以拓展科学数据的应用范围、提高科学数据的应用效率、加速科学数据的发展速度。
再次,现有的服务实践协作性不强。大数据时代的到来,使得数据的类型、格式、存储媒介等都发生了巨大的变化,对高校图书馆来说由于资源组成、来源以及技术、人员所限,因而凭借一个机构的力量远远无法实现对用户所需数据的拥有与分析、组织、服务,走协作、联盟等合作路线是大数据时代的信息服务特征。从上述的现有科学数据服务实践来看这种协作特征并不明显,但随着高校图书馆的科学数据服务深入发展,高校图书馆间的协作将逐渐加强,如图书馆间的资源共享协作、图书馆与技术开发公司之间的服务平台开发协作等。
科学数据服务尽管已在美国等发达国家和地区得到了科研界的重视,高校图书馆也积极应对出现的用户新需求开展了科学数据查询、科学数据管理等服务,走出了实践的探索步伐,但对我国高校图书馆来说其还是一个新鲜的事物,目前还停留在对其的理论研究、实践介绍阶段,不管是笔者调查国内的高校图书馆信息服务现状,还是相关研究文献交待,都还没有发现有一家图书馆真正提供此类服务。但了解国外高校图书馆的科学数据服务途径、内容与方法,客观分析这些实践的不足和发展空间,也能为我国高校图书馆的科学数据服务开展给予启迪和帮助。
(1)以科学数据的咨询服务为切入点。从上述国外高校图书馆的科学数据服务实践来看,以科学数据的咨询服务是大多数高校图书馆开展的服务内容之一,究其原因,我们认为是与科学数据服务是简单、初级的服务,对从业者的要求相对较低有关。因此对尚无服务经验、其它服务条件并不成熟的我国高校图书馆来说咨询服务是一个很好的切入点,通过为科研工作者提供国内外已有科学数据的信息,如检索、组织,获取整理等,积累服务经验,完善服务条件,为未来科学数据的深层次服务打好基础。
(2)加强内外部合作。合作、共享、交流是新时期高校图书馆的发展旋律,而持续、健康、深层次的科学数据服务也更需要高校图书馆的内外部合作。对内部而言,图书馆需整合资源建设、技术开发、学科服务等业务部门之间的业务,理清图书馆服务链条上的服务结点与协作机制;对外部而言,一方面需与科研管理部门、学校主管机构加强协作,通过科研管理机制等实现科研工作者与图书馆的紧密合作,提高图书馆科学数据服务的影响力与认可度。另一方面,图书馆需其它高校图书馆、技术开发公司、科学数据服务机构的合作,通过优势互补、资源采购等实现科学数据服务内容更加宽泛、效果更加凸显、机制更加灵活。
科学数据服务因数据密集型科学研究范式和大数据时代的到来而成了高校图书馆的主要服务内容,从国外高校图书馆的服务实践可以看出,从简单的科学数据介绍、咨询入手,科学数据服务的内容涵盖了数据管理、数据监护、技术支持等多个方面,嵌入到科研过程之中也成为了科学数据服务的主要途径。对我国高校图书馆来说,国外这些服务的成功经验给予了我们一定的启示,但也应该看到,我国高校图书馆还需重视在服务意识、人才等方面的建设,以为科学数据服务的开展创造条件。
[1]潘教峰,张晓林.第四范式:数据密集型科学发现[M].北京:科学出版社,2012.
[2]闫娜.2012年美国大学图书馆十大发展趋势的解读与思考[J].国家图书馆学刊,2013,(5):85-91.
[3]邢文明,吴方枝,司莉.高校图书馆开展科研数据管理与共享服务调查分析[J].图书馆论坛,2013,(6):19-26.
[4]Tenopir C,Birch B,Allard S.Academic Libraries and Research Data Services:Current Practices and Plans for the Future[EB/OL].[2012-11-29].http://www.acrl.ala.or g/acrlinsider/archives/6297.
[5]Lincoln Laboratory Grid (LLGrid)[EB/OL].[2014-03-23].http://www.11.mit.edu/news/11grid.html.
[6]Research Data Management Service Group (RDMSG)[EB/OL].[2014-03-23].http://confluence.cornell.edu/display/rdmsgweb/Home;jsessionid=73DF1608333FB2D6 F0FDCB976AB20C76.
[7]DMPonline[EB/OL].[2014-03-23].http://dmponline.dcc.ac.uk/.