大数据环境下高校图书馆开放获取文献的采访策略

2016-01-25 02:23蓝冬梅
河南图书馆学刊 2016年1期
关键词:开放获取大数据环境高校图书馆

蓝冬梅

(广西民族师范学院图书馆,广西 崇左 532200)



大数据环境下高校图书馆开放获取文献的采访策略

蓝冬梅

(广西民族师范学院图书馆,广西 崇左 532200)

关键词:高校图书馆;文献采访;开放获取;大数据环境

摘 要:文章从大数据环境与开放获取文献资源、大数据环境下高校图书馆开放获取文献采访来源、大数据环境下高校图书馆开放获取文献采访程序三个方面,对大数据环境下高校图书馆开放获取文献的采访策略进行了研究。

1 大数据环境与开放获取文献资源

1.1 大数据及其解读

大数据是指体量巨大、高速获取、类型多样化、具有真实价值的数据。伴随着2013年“大数据元年”的脚步,大数据时代正在快步走来。在大数据环境下,大数据无处不在,它对人们的研究、工作、学习和生活各方面施加着越来越重要的影响。由于大数据是需要采用新的处理模式和处理技术才能开发、利用和增值其中蕴含的信息价值的数据信息资产,因此,大数据已经被视为一种新的生产要素和创新驱动力而格外受到重视。大数据技术和大数据应用的战略意义在于,在掌握大数据信息的基础上,对这些用户所需要的含有实际意义和利用价值的大数据进行专业化检索、获取、整序、加工和处理,从而实现数据价值的提升,所以,大数据的价值含量和获取成本比大数据的数量本身更为重要。对于很多行业而言,如何利用这些大数据已经成为事业成功的关键所在。

1.2 大数据环境下的开放获取文献数据

大数据可分为结构化数据、半结构化数据和非结构化数据,与图书馆文献型数据相关的多为非结构化数据[1],尤其是其中的数字化文献数据,包括文本数据、图像数据、声音数据、影像数据、超媒体数据、三维数据等。根据国际数据公司的测算,与文献密切相关的非结构化数据量在2005年为22EB,2015年将增加到1,600EB,年复合增长率约60%,远远高于结构化数据年复合增长率20%的速度。其中,对于非结构化大数据中具有“学术共产主义”性质的开放获取文献数据,已经引起全球相关行业和机构的高度重视。2012年,由美国、德国科学基金会和中国科学院等11家机构发起,创立了旨在探讨和寻求国际科学发展方略,推动和实现国际科技合作的全球研究理事会。在2014年北京召开的全球研究理事会上,中国科学院与中国国家自然科学基金委员会发布了各自的开放获取政策,引起世界各国科研资助和教育机构、国际知名学会、国际出版组织及国际图书馆界的高度重视,对中国以文献大数据为核心的开放获取发展倍加期待。

1.3 大数据环境下的我国开放获取文献资源体系

目前我国非常重视大数据工作,2015年9月国务院印发了《关于促进大数据发展的行动纲要》,从国家层面系统地部署了我国的大数据发展工作。事实上,我国目前已经基本形成了具有一定规模的开放获取文献资源体系。这一体系具有开放获取文献资源类型多样化、文献资源格式多样化、文献资源数量巨大、学科专业门类齐全、下载获取方式多样化等特点[2]。目前我国开放获取文献资源的类型已经达到约50种,分别隶属于常规文献、教学文献、科研文献、特种文献、历史文献、格式文献、其他文献和综合文献系列,分为正常和非正常下载获取两种主要方式。这些丰富的开放获取文献资源,无疑为我国高校图书馆开放获取文献采访提供了极为丰富的文献来源。因此,研究我国高校图书馆开放获取文献采访策略,充分采访互联网上的开放获取文献资源,成为高校图书馆开放获取文献采访工作中亟待研究的课题。

2 大数据环境下高校图书馆开放获取文献的采访来源

2.1 文献采访来源策略

在高校图书馆利用文献资源为用户开展服务工作的过程中,需要使用到各种类型、内容、格式、系列、利用方式的开放获取文献资源。正是由于开放获取文献资源具有成本为零、类型多样、数量巨大、使用方便的特点,因此,它们顺理成章地就成为高校图书馆数字化文献资源采访的重要来源之一[3]。而通过哪些采访来源策略,可以使这些开放获取文献资源顺利进入到高校图书馆的文献资源体系中,就成为高校图书馆开放获取文献资源采访策略需要研究和实践的重要内容。高校图书馆开放获取文献资源的采访来源策略主要可分为4种,即文献资源网站链接采访来源策略、文献资源在线利用采访来源策略、文献资源下载获取采访来源策略和新建文献资源网站采访来源策略。

2.2 文献资源网站链接

对于拥有大量开放获取文献资源的网站,由于其文献资源数量过多,实在不方便下载获取。因此,可以将其网站名称及其所对应的网址与本馆的网站进行链接,即所谓的单线链接,使之成为本馆开放获取文献资源的采访来源资源,使本馆的用户可以通过本馆网站链接到此类来源文献资源网站,从而实现对于其开放获取文献资源的有效利用[4]。同时,这也是高校图书馆开放获取文献采访中最为简便的采访来源策略,因为它可以使高校图书馆在使用最少的人力资源投入,在投入最少工作量的条件下,可以完成对大量开放获取文献资源网站的链接采访工作,并且可以用最短的时间拥有大量的开放获取文献资源。所以,它应当成为高校图书馆开放获取文献资源首选的采访来源策略。

2.3 文献资源在线利用

对于那些无法下载获取的开放获取文献资源,在作为高校图书馆开放获取文献采访来源时,也可以通过由高校图书馆直接给用户提供网址的方法,让用户直接在线利用文献资源网站的开放获取文献资源。此外,高校图书馆本身也可以将这种开放获取文献资源作为文献采访的一种来源加以利用。当然,这种在线利用的采访来源策略是有局限性的,它们一般除了适用于那些只能在线利用,而无法下载获取的开放获取文献资源之外,还适用于既可以下载获取,同时又可以在线利用的开放获取文献资源。当然,对于此类开放获取文献资源,高校图书馆也同样可以作为一种文献采访来源,使之成为高校图书馆开放获取文献资源的组成部分。

2.4 文献资源下载获取

这是指将那些允许开放下载获取,而高校图书馆或用户又需要下载获取利用的开放获取文献资源进行下载获取采访来源的策略。也就是说,可以使高校图书馆或用户能够实实在在地通过下载获取拥有所需要的开放获取文献资源[5],这种采访来源策略也是文献采访来源中效果最好的一种。当然,它也存在着如果下载获取文献的数量过多,不仅需要耗费大量的下载获取时间,而且也需要对这些已经下载获取的开放获取文献资源腾出大量的存储空间进行存储和保管的问题。所以,这种采访来源策略一般仅适用于那些用户特定需要的文献,或者对于高校图书馆而言是重要的和具有长久保存价值的文献资源,如:古籍善本文献资源等的采访。

2.5 新建文献资源网站

是指可以利用开放获取文献资源网站链接或下载获取的文献资源,重新建设高校图书馆自己的开放获取文献资源网站。也就是说,这是在文献采访中采用拿来主义,将互联网上的开放获取文献资源转化为高校图书馆本馆馆藏文献资源的采访来源策略。这种文献采访来源策略的意义在于,高校图书馆可以在新建文献资源网站的过程中,对互联网上的开放获取文献资源进行一定标准的筛选,将符合本校教育教学、科学研究和学校管理所需要的开放获取文献进行汇聚和集中,在新建的文献资源网站上发布出来,供本校用户和其他用户利用。这样一来,可以为用户解决自己在互联网上需要花费大量的时间查找,但是查找的效果却往往不甚理想的问题与困扰。

3 大数据环境下高校图书馆开放获取文献的采访程序

3.1 文献采访调研

调研互联网大数据中的开放获取文献资源,是高校图书馆开放获取文献采访的首要程序策略。因为能否采访到本馆所需要的开放获取文献资源,是最终衡量高校图书馆开放获取文献采访工作成败或质量优劣的重要标准[6]。采访调研的内容有多种,其中涉及选择利用不同品牌的网络浏览器以及不同的网络搜索引擎等检索工具。由于不同品牌的浏览器和搜索引擎,在反映和揭示开放获取文献资源方面具有收录网页数量不同、检索功能不同的特点,从而导致对于开放获取文献检索和获取的全面性和精准度不同,有时候甚至会差异很大。所以,高校图书馆在进行开放获取文献资源采访时,需要提前进行相关的调研工作,了解和熟练掌握不同品牌浏览器和搜索引擎的综合状况。在同样的条件下,尽量选用检索全面、功能强大、方便快捷的浏览器和搜索引擎品牌,以便取得更好的检索和获取效果。此外,高校图书馆还需要调研选择利用的检索方法和检索技术。如:检索方法包括简单检索、高级检索、限定检索等文献检索方法,检索技术包括中文文献检索技术、外文文献检索技术、外文文献中文利用检索技术等。

3.2 文献采访验证

由于来源于互联网上的开放获取文献资源都属于免费的文献资源,不存在任何法律和版权保护方面的问题(实际上是自动获得了知识创用共享协议的法律保护[7])。因此,互联网上相当多的开放获取文献资源具有稳定性差的特点,具体表现为某些开放获取文献资源在互联网上时有时无、资源网站时开时闭、文献资源在网页上的位置也不固定以及存在一些表面上看起来为开放获取文献资源,而实际上则是收费的非开放获取文献资源等情况。所以,为了确保高校图书馆开放获取文献采访的准确性和真实性,需要对互联网上的开放获取文献资源进行必要的验证。验证的目的就是要证实开放获取文献资源的真实性和可用性,满足高校图书馆开放获取文献资源采访的需求,防止出现虚假的和无法实际使用的开放获取文献资源,从而影响到高校图书馆开放获取文献资源的采访质量。验证互联网大数据中的开放获取文献资源,包括对于开放获取文献资源网站的验证、对于开放获取文献资源的验证以及对于开放获取文献资源下载获取可行性的验证等方面。

3.3 文献采访下载

高校图书馆开放获取文献资源采访的目的,是要使来源于互联网上的开放获取文献资源通过采访工作程序,成为高校图书馆数字化馆藏文献资源建设体系中的重要构成成分,与商业化数据库文献资源和自建数字化文献资源组成一个相互补充、相互依托、相得益彰的高校图书馆数字化文献资源体系[8]。因此,根据高校图书馆开放获取文献资源的采访计划,应当对高校图书馆所需要的开放获取文献资源进行下载获取、保存管理和研究利用。所以,下载获取互联网上的开放获取文献资源就成为高校图书馆开放获取文献资源采访工作的重要环节。因为只有通过采访下载环节,才能使原本散布于互联网上各处的开放获取文献资源,成为高校图书馆开放获取文献资源体系中的有机组成部分。采访下载互联网大数据中的开放获取文献资源包括:常规采访下载获取,如:在线阅读获取和直接下载获取;非常规采访下载获取,如:利用专用下载器、专用下载软件、特定下载方法下载获取。

3.4 文献采访分析

为了进一步提高开放获取文献资源采访工作的质量和水平,其中一项重要任务就是要对互联网大数据中的开放获取文献资源以及下载获取到本地的开放获取文献资源进行分析和研究。分析研究的内容包括对于开放获取文献资源的文献类型、采用格式、所属系列、所属学科、所属专业、文献容量、文献来源等多种因素进行分析和研究[9]。分析研究的目的是使高校图书馆采访工作对于所采访的开放获取文献资源,做到心中有数、心里有底,从而可以有的放矢地根据本校各学科教育教学、科学研究和学校管理工作的需要,采访到最具有价值、利用率最高的开放获取文献资源。高校图书馆开放获取文献采访分析策略的另一项内容,就是要分析和研究不同学科专业开放获取文献的生命周期,这样才可以能够科学地、有根据地预测这些开放获取文献资源的使用高峰期时限,从而为及时更新不同学科专业的开放获取文献资源、及时剔旧已经进入衰退期的开放获取文献提供科学依据,保持馆藏开放获取文献资源旺盛的生命力。

3.5 文献采访建库

为了使开放获取文献资源采访工作具有可持续性,便于统计分析采访到的开放获取文献资源,及时了解开放获取文献资源的整体状况,了解开放获取文献资源在高校图书馆整体文献资源和数字化文献资源体系中的地位与作用,应当建设相应的高校图书馆开放获取文献资源采访数据库[10]。在这个数据库中,应包含高校图书馆历年来所采访到的开放获取文献资源。采访数据库的项目应当尽可能详尽, 如:应设置有开放获取文献资源的所属类型、采用格式、文献容量、所属系列、所属学科、所属专业、中国分类号、多级主题词、来源渠道、互联网网址、下载获取方法、采访时间、采访人员、备注说明等信息。这些高校图书馆开放获取文献资源采访数据库的各项内容信息数据,应当可以通过高校图书馆文献管理软件的相应功能,很方便地调入高校图书馆的馆藏文献资源总数据库中,成为高校图书馆文献资源管理大数据中开放获取文献资源数据的重要组成部分。

4 结语

随着互联网时代和大数据时代的到来,互联网上的大数据正在迅速增加。随着我国政府对于大数据的日益重视,大数据事业必将会有一个爆发性的发展前景。在国内外各种开放获取政策落实的环境下,与互联网文献大数据紧密相关的开放获取文献资源,正在成为高校图书馆文献采访的巨大宝库。因此,深入研究大数据环境下高校图书馆开放获取文献的采访策略,势必会提升高校图书馆数字化开放获取文献资源的建设与服务水平。

参考文献:

[1] 马晓亭.大数据时代图书馆数据可用性:价值、挑战和保障[J].图书馆理论与实践,2014(10): 5-8.

[2] 袁明伦.我国开放获取模式下的文献信息资源体系研究[J].现代情报,2015(7):153-155,161.

[3] 薛冬.学术共产主义开放获取文献资源网站研究[J].办公室业务,2015(7):26,29.

[4] 刘文云,翟羽佳,王文颖.基于链接分析法的高校图书馆网站影响力评价研究[J].情报科学,2013(6):99-102,106.

[5] 张玲.大数据2.0时代文献资源融合与共享利用研究:以图书、情报、档案文献信息资源为例[J].档案管理,2015(1):36-37.

[6] 姚小萍.网络环境下图书馆文献采访的前期调研[J].河南图书馆学刊,2014(7):64-67.

[7] 张媛,王伟.大数据时代图书馆OA文献资源建设研究[J].兰台世界,2015(11):129-130.

[8] 黄丽娟,邹荫生.基于开放获取的数字图书馆文献资源建设[J].兰台世界,2015(17):134-135.

[9] 王晓燕.图书馆应用大数据的文献分析与思考[J].大学图书情报学刊,2015(1):55-60.

[10] 张志广,张潇.基于高校图书馆文献采访分布式数据库挖掘的合作协同模式[J].农业图书情报学刊,2015(6):65-68.

(编校:崔 萌)

作者简介:蓝冬梅(1972— ),广西民族师范学院图书馆馆员。

收稿日期:2015 - 12 - 04

中图分类号:G253.1

文献标识码:A

文章编号:1003 - 1588 ( 2016 ) 01 - 0065 - 03

猜你喜欢
开放获取大数据环境高校图书馆
浅谈MOOC与信息素养教育
“大学图书馆发展趋势与服务创新论坛”综述
基于大数据环境的新闻编辑理念变革创新机制
国外开放获取平台对我国科技期刊OA发展的启示
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆阅读推广实践探讨
高校图书馆电子资源的宣传与推广
开放获取对国际眼科学期刊文献计量学指标的影响