科研数据策管对我国高校图书馆的挑战

2015-05-13 05:33介凤王娟
新世纪图书馆 2015年8期
关键词:图书馆资源服务

介凤王娟

数据策管是为满足当前和未来研究人员再次利用科研数据的需要,对一系列可信赖的数字信息进行管理保存,并对其加工增值的一个过程[1],是贯穿数据整个生命的持续性管理活动。数据策管超越了单一保存的层面,它包括了管理规划、加工组织和保存三个阶段[1]。国外一些国家的数据策管已经有了多年的实践积累,并通过自发组织成立了全球科研数据联盟 (Research Data Alliance,RDA)[2],为实现E-Science环境下科研数据更广泛的再利用而努力。而我国还处于基础理论研究阶段,以概念分析、应用展望的成果为主,还未能从实践的角度深入研究数据策管。因此,本文循着信息资源管理和服务实践过程,将数据策管与我国高校图书馆的传统资源管理相比较,分析科研数据作为新兴资源在其策管过程中的挑战,同时考虑数据策管相关的外力因素,厘清我国高校图书馆开展数据策管工作要面临的挑战,以及就如何应对这些挑战展开讨论。

1 科研数据作为高校图书馆新兴资源带来的挑战

高校以其在科学研究中占据的重要地位,成为科研数据生产的主力之一,而作为保存高校各种信息资源并为用户提供服务的图书馆,具备了科研数据存储和服务所需要的软硬件设施、从事科研数据加工组织和存储的经验、开展服务的人力资源。因此,科研数据正成为国内外高校图书馆的研究对象,被纳入馆藏资源建设的范围,并将成为图书馆馆藏的重要组成部分。

科研数据开发和利用的现实环境与研究人员要求便利地再次利用科研数据之间的不匹配,迫切要求高校图书馆成为科研数据生命周期内的积极参与者,并为扮演重要角色而做好准备[3]。此外,科研数据自身的复杂性决定了其在策管和服务方面有别于传统的书刊和文档等馆藏资源,从而也使得探索科研数据的采集、组织加工、管理和服务成为E-science环境下图书馆界新的研究热点和实践增长点。

1.1 资源的采集需多部门合作

虽然高校图书馆在内外部环境急剧变革的条件下,实施了按需采购,读者驱动采购和读者推荐等一系列创新采购文献资源的做法,从而也吸收部分机构的用户参与采购,如教务处、学院科研负责人、教师和科研人员等,但是,传统信息资源采集的主动权仍把握在采访馆员手中。然而科研数据则迥异,它掌握在研究人员和师生手中,资源是否愿意出让和与他人共享完全取决于掌握数据者个人的意愿。因此,为了实现科研数据的储存和共享,一方面,迫切需要图书馆主动与科研成果和人事管理部门开展合作,以不损害数据拥有者的利益为原则,并根据科研数据利用的实际情况,制订合理的科研数据呈交和管理保障制度,以促进科研数据的共享和再次使用价值的提升;另一方面,需要相关职能部门制定详尽的鼓励政策和强制措施,并加强对科研数据的管理和监督,进而保障科研数据的安全存储和实现不同范围的共享。

1.2 资源的组织加工有待探索

图书馆传统资源的描述包括题名、责任者、出版机构、分类或主题等多个信息描述项,共同组成该资源的书目数据记录,进而通过分类对信息有序化加工,实现书目数据记录按照分类规则进行组织。科研数据的标识过程也包括外在特征和内容特征的标识,但是远比传统资源的描述要复杂。外在特征方面包括如科研数据集的数据所有者、联系人、课题名称等,还有实验条件、数据记录列表、数据生成步骤、数据模型文档,以及数据用于分析的操作步骤等;内容特征则更为复杂,主要从语义角度解释特定数据集内容、结构和含义。相对于传统资源的一维描述,科研数据需要是多维度的,除数据本身的描述,还需要有同其他数据的关系、存储位置、使用方法等的描述,为实现不同角度的信息与数据集的链接奠定基础,从而实现被描述对象的分析和再利用。

科研数据的组织加工是针对科研过程中产生的数据和信息进行筛选、元数据标识、文档之间的关联,以及分类和主题标引等加工流程。除信息描述外,科研数据的关联更为重要。数据的产生基于特定实验条件和时间,背景属性与数据集的关联;同时,科研数据产生的生命周期赋予了数据动态发展的特性,不同阶段产生的数据需相互关联;数据的记录、处理、分析等方法和工具等描述文件之间做关联;以及数据与相关出版文献的关联等。对关系的描述成为科研数据加工的重要部分,而关联关系呈指数型增长趋势,这对信息资源组织和加工提出了新要求[4]。关联数据为扩展科研数据资源的发现服务、语义检索,以及与网络资源的链接等创造了条件,进而将有助于研究人员方便再次利用科研数据,并将促进科研数据在学术研究和交流中发挥更大的作用。

科研数据的组织难度相对传统资源较大,目前仍未有统一的标准和操作规范,国际自发组织RDA正在为之努力[2],但是其目标的实现仍需图书馆界共同努力。

1.3 资源的管理方式需要转变

传统资源的管理涉及保存、评价和剔除等问题,而科研数据管理方面,笔者则认为其涵盖的范围更宽泛,不仅包括组织加工前期的数据筛选和质量审核,还包括科研周期内对数据集描述的增补,以及获取访问的认证管理等内容。相对传统资源而言,科研数据管理更加需要实现从数据产生之初开始,直至覆盖科研整个生命周期的过程管理,是一个动态跟进的过程。管理的目标是对科研数据或科研数据集进行标引以实现数据分析和知识发现,实现数据与其它出版物的关联和聚合等[5];以促进保证科研数据的便于发现和再利用。

1.4 资源的服务内容需要拓展

科研数据策管需要多方合作,从而使得数据提供服务也将涉及合作各方,以致与提供传统资源服务相比增加了难度。因此,一些研究人员认为,图书馆在科研数据服务方面的作为有限。持这种观点的代表之一Rich Luce认为,图书馆本身没有能力存储管理日渐增长的海量科研数据,应该坚持自身的核心竞争力,发挥数字图书馆在信息描述、检索整合、保存文献方面的优势,而在技术、学科知识服务等方面需要与其他组织进行合作[6]。

但是,美国哈佛-麻省理工数据中心、爱丁堡大学图书馆建立的数据仓库、哥伦比亚大学图书馆建立的数据门户等多个案例证明了图书馆完全有能力开展科研数据服务[7]。实践表明,图书馆可以结合自身的情况,开展不同层次的科研数据服务:管理咨询、数据加工、保存、获取的初级服务;数据链接、可视化分析和添加注释等再加工服务;以及知识挖掘、分析服务等[8]。此外,鉴于科研数据产生的过程有别于论文、报告的生产,因此,开展对科研数据生产者进行提交、保存和共享方面的信息素养教育显得尤为重要。为此,图书馆在对科研数据生产者开展信息素养教育时,应根据科研数据保存和再次利用的特点,变革科研数据信息素养教育的内容,创新传统信息素养教育的方式。尽管数字图书馆在资源的加工、存储、可视化、内容超链接和提供服务等方面积累了一定的经验,但是基于科研数据本身的复杂性,以及随着科研进程的快速发展,对服务内容和形式的创新提出了更高的要求。

2 科研数据策管相关环境因素带来的挑战

高校图书馆开展科研数据策管与服务相关的因素很多,其中包括科研工作资助和管理机构的政策,科学传播过程中图书馆上下游相关行业的变革,及科研人员对便捷利用科研数据的要求等都是影响图书馆策划和管理好科研数据的重要因素。

2.1 开放获取政策环境的推动

经济合作与发展组织(OECD)成员国2004年签署的一个宣言,提倡所有受公共资金支持获得的研究数据都应为公众获取、共享,并于2007年发表了《公共资助科研数据开放获取的原则和指南》[9]。随后,美国、英国等一些重要的基金机构也提出了数据开放政策指南,如美国国家科学基金会(NSF),从2011年开始,要求接受资助的项目提交科研数据的管理与共享计划。2013年2月,美国科技政策办公室(OSTP)签署“提高联邦政府资助的科学研究结果公众获取度”[10],提到由联邦资金资助的研究项目,所产生的非保密的科学研究数据应该存储并为公众最大化提供免费访问,可支持数据的检索和分析。国外的科研数据服务正是在这些政策的推动下快速成长发展起来的。

国家和基金组织制订的这些相关政策既有效地确保了数据的及时公开发布,又有效地保证了数据拥有者的著作权。从而成为推动图书馆加强科研数据策管的重要力量。同时也成为在坚持信息平等获取条件下,图书馆承担协助科研人员科研数据策管,并完成科研数据开放获取和支持公众获取利用数据的重要历史使命。

2.2 出版行业新趋势的推动

出版界作为商业机构也积极参与到了科研数据策管中来。以Elsevier集团的ScienceDirect(SD)为例,基于科技文献和科研数据的互操作,建立关联,管理数据集[11]。集团的目标是实现数据集和论文的无缝互操作,“无论数据集存储在什么平台上”。Elsevier目前正在做的一项工作是和一些组织合作,例如Gen-Bank、CCDC(Cambridge Crystallographic Data Centre)和 PANGAEA(Publishing Network for Geoscientific&Environmental Data)等,将论文内容中描述的实体与涉及的数据实现链接;同时在SD论文平台上实现外部存储数据集的实时统计、可视化操作应用。具体链接模式见图1[11]。

从数字学术信息资源出版的趋势看,科研数据出版逐渐成为可能,沿着最初为电子期刊提供科研数据集链接、科研数据与科学文献混合出版、同行评议的科研数据独立出版的发展路线演变[12]。图书馆与出版行业的紧密关系,决定了其在科研数据策管中也应积极行动。借助科研数据公开获取的政策优势,高校图书馆以共享科研数据为目标,加强与出版界的合作,在为科研人员提供科研数据策管和服务的同时,借助出版界的平台加速科研数据的传播,进而使得科研数据得到增值。

2.3 科研人员需求的推动

目前高校科研成果产出,即以科技论文和专利等形式发布的科技文献作为科研机构绩效考核的主要依据。然而随着社会的进步和考核指标的修正,全社会越来越重视科研成果转化所创造的社会和经济价值,以及产生的社会影响力。

有科学家指出,在不久的将来,科研数据将以通过同行评议的方式独立出版,这样一来,即使数据的研究者自身没有能够从数据中提炼出新的科学发现,但因所提供的科研数据具有价值而赢得科学界的认可[13]。由此,将越来越引起全体科研人员对生产科研数据的重视。此外,科研数据本身的价值和科研人员进行科学创新迫切需要再次使用的要求,成为推动图书馆加强科研数据策管的根本动力因素。

3结语

总而言之,科研数据正在成为高校图书馆需要加强管理并提供服务的一种新型资源。从而使得图书馆既面临着需要优化科研数据策管和服务的严峻挑战,同时也迎来了图书馆通过拓展服务内容,进而提升自身地位的发展机遇。

在云计算环境下,仅以一馆的力量已经根本无法承担科研数据选择、存储和服务等方面的工作。为实现科研数据的知识挖掘和分析功能,这就需要图书馆界深入探索科研数据的组织加工方法,针对科研数据动态形成的特点实现严格的过程管理,以用户需求出发而先于需求,开发潜在需求,指导用户提升利用数据的能力等方面,协同技术等部门搞好协调和合作。

[1] 时婉璐,任树怀.数据策管:图书馆服务的新创举[J].图书馆杂志.2012,31(10):24-27.

[2]RDA-Research Data SharingWithout Barries[EB/OL].[2014-10-30].https://rd-alliance.org/.

[3]Tenopir C,Birch B,Allard S.Academic Librariesand Research Data Services-Current Practices and Plans for the Future[EB/OL].[2014-10-30].http://www.acrl.ala.org/acrlinsider/archives/6297.

[4] 钱鹏,郑建明.基于资源描述框架的图书馆科研数据组织初探[J].情报理论与实践,2012(3):100-102.

[5]Lord P,Macdonald A.E-Science Curation Report:Data Curation for e-Science in the UK:an Audit to Establish Requirements for Future Curation and Provision[EB/OL].Jisc.[2014-10-30].http://www.jisc.ac.uk/whatwedo/programmes/preservation/escience.aspx.

[6] Rick L.New Collaborative Relationships:The Role of Academic Libraries in the Digital Data Universe[C].Librarians and eScience:Focusing towards 20/20.Purdue.2008.

[7] 李晓辉.图书馆科研数据管理与服务模式探讨[J].中国图书馆学报.2011,37(5):46-52.

[8] 师荣华,刘细文.基于数据生命周期的图书馆科研数据服务研究[J].图书情报工作,2011(1):39-42.

[9] Science and Technology Policy-Organisation for Economic Co-operation and Development[EB/OL].[2014-01-30].http://www.oecd.org/sti/sci-tech/oecdprinciplesandguidelinesforaccesstoresearchdatafrompublicfund ing.htm.

[10] Expanding Public Access to the Results of Federally Funded Research|TheWhite House[EB/OL].[2014-01-30].http://www.whitehouse.gov/blog/2013/02/22/expan ding-public-access-results-federally-funded-research.

[11] Jan Aalbersberg I,Ove K.Supporting Science through the Interoperability of Data and Articles[J/OL].[2014-01-30].D-Lib Magazine.2011,17 (1-2).http://www.dlib.org/dlib/january11/aalbersberg/01aalbersberg.htm l.

[12] 钱鹏,郑建明.高校科研数据组织与服务初探[J].情报理论与实践,2011(2):27-29.

[13] Towards2020 Science:Roadmap[EB/OL].[2014-01-30].http://research.microsoft.com/en-us/um/cambridge/projects/towards2020science/downloads/T2020S_Roadmap.pdf.

猜你喜欢
图书馆资源服务
聚焦“五个一” 打通为侨服务渠道
基础教育资源展示
我给资源分分类
资源回收
做好绿色资源保护和开发
图书馆
采掘服务个股表现
去图书馆
读者反馈 订阅服务
服务与咨询