沈沁滢
摘 要:[目的/意义]图书馆在知识社会发展中扮演着重要角色,图书馆信息资源开放共享有利于人们利用数据创造知识。[方法/过程]通过对图书馆开放数据类型、开放数据服务内容、开放数据对图书馆信息资源共享的影响三个方面综述要素,并以综述结果为基础分析了图书馆开放数据服务的优势以及图书馆开放数据发展趋势。[结果/结论]开放科学和开放数据环境从根本上改变了学术交流的速度与模式。在这一机遇下,专业图书馆应该深入理解开放数据的内涵,认识到开放数据的优势与目标,变革图书馆服务理念与模式,最终实现开放数据环境下的共享共用。
关键词:开放数据;图书馆;信息资源共享
开放数据是在开源的理念与文化推动下,应开放获取运动的实践与新需求而产生的。与文献、视频等资源的共享相比,数据的开放共享更易实现重用,不同用户对同一条数据的多次共享意味着对开放数据价值的挖掘和整个信息共享空间的增值。对图书馆而言,开放数据正是图书馆抓住机遇,顺应大数据发展趋势,变革服务模式、创新服务内容的应对战略。
1 开放数据概述
1)开放数据的概念。开放数据迅速发展并与各领域相互融合,可以分为政府数据、公共数据、商业数据、科学数据以及个人数据。一般来说,开放数据(Open Data)主要包括非文字的数据素材,如地图、化学分子、数学以及科学公式等。数据开放使人们可以自由阅读、分享、发布和使用相关数据,挖掘出其隐藏的价值和作用,以寻求信息数据最大可能的无限获取和重用。正如Open Science中所阐述的那样:我们越是了解科学及其复杂性,那么这些科学数据被公开共享就更有意义[1]。
2)开放数据的特点。从上述定义可知,开放数据不限制数据发布者的身份、数据发布地点和目的,是可以为公众免费获取使用、再利用以及重新发布的数据。具体表现为:法律上的开放、社会上的开放和技术上的开放。也就是说,其版权允许任何人再利用和分发,不限制以商业利益为目的的出售和分发,允许修改和演绎;使用开放数据无技术限制,可免费获取,且其格式机器可读。总的来说,开放数据具有以下五大特点:一是开放授权;二是开放格式且机器可读;三是数据具有完整性;四是电子化可下载;五是可免费公开获取[2]。
2 图书馆开放数据服务内容
大数据赋予开放数据的新要求也意味着大数据时代的图书馆开放数据服务将被赋予新的要求,大数据时代的图书馆开放数据服务,主要有:
1)多领域数据源的整合与开放服务。从目前的开放数据运动发展来看,主要实践有开放政府数据、开放存取学术期刊与机构知识库,距大数据时代所要求的多类型、多领域发展程度要求尚远。图书馆由于有着涵盖了所有领域的丰富馆藏资源,是大数据时代数据开放与整合的最佳实践者。
2)基于知识联盟的数据开放与共享服务。由于大数据时代的开放数据是整合了不同系统、政府和部门之间的数据集,这就需要建立一个数据共享和互操作的框架,如运输部利用采集到的数据(在汽车制造商的管辖下)能够发现诸如拥堵和交通流等问题,而这些功能通常是由当地或全国的政府交通运输部门负责。图书馆可借鉴这些成功的案例进行构建或参与到由政府、企业、社会机构组成的知识联盟,利用协作分析技术对数据和系统进行无缝隙整合。
3)基于一站式服务平台的知识发现服务。数据“开放”的核心是为了用户更高效的发现和利用,以缩小信息所有者和用户的信息不对称距离。EDS、PRIMO、SUMMON等一站式知识发现平台的应用为图书馆的开放数据知识发现服务提供了方便,图书馆可应用这些平台对用户提供知识咨询等服务[3]。
4)数据的开发、创建、共享与转换服务。此类服务在图书馆界已有着成功的实践,如開源站点biblios.net采用了类似维基模式向图书馆界提供开放MARC数据的开发、创建、共享、转换服务,目前以3000万余条数据成为为全球最大的免费图书馆编目数据平台,德国国家图书馆、大英图书馆也宣布对外提供开放数据服务。
5)数据监管服务。开放数据的检索、价值挖掘与应用实现,必须经过一定的排列、存档与管理过程,而这些数据有可能是来自于有数据组织经验和能力的政府、企业、公益组织等,也可能是来自于只提供数据而没有数据组织或没有组织意愿的公众、机构。图书馆可发挥自身的信息组织、信息分类特长,对这些数据进行修改、合并、标引、分析与索引,即提供数据监管服务,使数据集合之后获取最大
收益。
6)数据分析服务。大数据时代的信息服务主要是数据分析服务,如可视化分析、影响力分析等,开放数据的价值也需要此类以工具、平台应用为基础的数据分析才能实现,图书馆可为用户提供这一服务,以提高开放数据的应用效率和价值。
7)政策、标准的制定与咨询服务。数据的统一格式与数据源的互相提供,保证了开放数据的信息易被用户检索、获取与利用。为了保证不同机构、联盟、系统间的数据格式统一和共享机制成熟,以及避免可能出现的版权等政策限制,开放数据的相关标准、政策制定必不可少[4]。
3 图书馆开放数据服务的优势
现阶段,开放数据运动在各国的主要实践主体是政府,图书馆作为信息共享推动者必须准确定位自己的角色,发挥自身优势。图书馆在长期承担文献信息中心和社会教育职责中积累的经验优势为大数据环境下开放数据服务奠定了基础。
1)在信息资源组织与管理上的经验。文献信息资源是图书馆的重要组成部分,对文献信息的整理与保存是图书馆产生的根源。长期以来,图书馆对纸质文献信息资源的标引、分类、管理以及元数据著录、内容提取分析等不同层次的组织与管理活动成为图书馆的专业优势。这一优势在数字文献信息资源的组织与管理中得以延续和丰富,也将在大数据环境下成为图书馆开放数据管理和组织能力的基础。图书馆可将在信息资源组织与管理上的经验拓展到数据的组织、描述、管理和利用领域[5]。
2)在开放获取研究与实践中的经验。开放数据是开放获取在大数据时代全面推广的产物,其实质是开放获取的一个衍生品。图书馆是开放获取运动各类实践形式的主要参与者与推动者,在开放获取资源搜集、选择、评价、有效整合和揭示上已有一定的研究基础和实践经验。在图书馆的推动下,开放运动不断丰富,出现了开放存取期刊、学科知识库、机构知识库、教学资源网站等一系列开放资源实践形式。图书馆开放数据将汲取以往开放存取运动的实践经验并进一步丰富开放存取运动的内容。
3)在信息服务宣传推广上的经验。大数据时代数据需求凸显的背景下,数据服务势必迅速发展,各种数据媒介将大量涌现。在竞争激烈且多元化的今天,图书馆并非是获取数据服务的唯一途径,网络就足以让用户跨越时间、地理限制,分享数据。OCLC公布的《对图书馆与信息资源的认知》报告显示,只有1%的用户把图书馆作为搜索信息的起点,图书馆很少被用作获取信息资源的第一选择。鉴于此,图书馆在数据搜索获取中的地位也不会太乐观。因此,开放数据服务的宣传推广必不可少[6]。
图书馆在信息服务营销中与目标群体有广泛的接触,對目标用户的个性需求和信息行为有一定的了解,甚至收获了一部分忠诚度较高的用户群体,这将有助于确定开放数据营销的目标群体,提高开放数据服务宣传和推广的效果。此外,图书馆在信息服务营销中确立的关系推广、品牌推广、网络推广等策略在开放数据服务推广中仍有一定的适用性[7]。
参考文献
[1]中国科技期刊开放获取平台.关于OA[EB/OL].(2017-02-25)[2018-06-08].http://www.oaj.cas.cn/aboutoa/index.jhtml.
[2]孙福临.开放数据及其应用[J].河南科技,2017(11):39-42.
[3][5]肖敏,李贵品.大数据环境下图书馆开放数据服务研究[J].四川图书馆学报,2017(01):23-26.
[4]张峥嵘,刘亚丽.大数据时代的图书馆开放数据服务探析[J].图书与情报,2014(02):120-122.
[6]余红,刘娟.开放数据及其对图书馆信息资源共享的影响[J].图书馆,2014(04):87-90.
[7]张学敏,刘娜.中国图书馆开放数据论文计量分析[J].中国科技信息,2017(02):15-17.