基于大数据的图书馆开放数据信息服务系统研究——以安徽大学图书馆为例

2016-11-30 05:52
大学图书情报学刊 2016年6期
关键词:安徽大学资源整合检索

钟 萍

(安徽大学,合肥 230039)



基于大数据的图书馆开放数据信息服务系统研究
——以安徽大学图书馆为例

钟 萍

(安徽大学,合肥 230039)

大数据时代为图书馆构建开放数据信息服务系统提供了新环境,同时也对图书馆服务系统提出了更高要求。文章在对大数据环境下图书馆开放数据信息服务进行整体分析的基础上,对该服务系统的构建要素进行分析阐释,提出图书馆开放数据信息服务系统的四个构建版块,以期促进图书馆开放数据信息服务的发展。

大数据;图书馆;开放信息资源;开放数据信息服务

大数据环境下,我国图书馆的开放数据信息服务发展愈加迅速,国内外学者也对开放数据信息服务进行了深入的讨论研究。有效地利用大数据的背景环境,图书馆可以进一步解决开放存取资源和本馆数字资源整合等问题。目前,图书馆界的数字资源整合方式大致上经历了数据整合、信息整合和知识整合三个阶段,三者是交叉存在于图书馆信息服务过程中,而非链性的继承关系。实际上,图书馆数字资源整合的最高形态正是数据信息知识整合,这也是未来图书馆资源服务发展的趋势。

1 基于大数据的图书馆开放数据信息服务整体分析

大数据环境下,图书馆开放数据信息服务整体上要从服务思路、服务目标、服务层次三方面进行把握,以在宏观上加深对开放数据信息服务的理解。

1.1 开放数据信息服务的思路

所谓开放数据信息服务,是指将分散在网络上多种形式、多种内容的数字资源服务,通过一定的整合方式进行有效组织并达到集成目的的一种服务方式。目前广泛使用的开放数据信息服务以OA资源整合为主,例如跨库检索系统的OA资源整合、基于OPAC系统的数字资源整合等。这些数据信息整合方式体现了大数据环境下资源开放获取的内涵。要注意的是,图书馆的开放数据信息服务不仅要实现资源层面的大量整合,还要实现相关服务的绑定与一体化,切忌将资源与服务分裂开来,只有融合了数据信息与服务的一站式开放数据信息服务,才能更好地满足用户的需求。

1.2 开放数据信息服务的目标

在明确服务思路的基础上,笔者认为开放数据信息服务要实现以下三个目标:(1)创建行之有效的OA资源收集机制。很多科研机构和数据库出版商都陆续加入到了OA运动中,使得网络上形成了大量的OA学术资源,图书馆OA资源建设应利用多种渠道搜集完善自身的数据库,从而实现数据的全面覆盖。(2)搭建OA资源一站式检索平台。大数据环境下的开放信息资源收集与整合,必须依靠一站式检索平台为用户提供无障碍检索服务,将面向用户的信息资源透明化[1]。(3)实现分布式OA数据资源的集成整合。OA资源内容多、分布广,单一的信息服务机构很难全面覆盖,图书馆可以采用集成的方式将分散的资源整合起来,以便于用户的检索与获取。

1.3 开放数据信息服务的层次

基于大数据的图书馆开放数据信息服务可具化为信息整合层次。以马文峰为代表的学者认为信息整合是指通过某种标准或机制,描述、整合、链接不同形式与不同载体的信息资源,使得相对独立的数据信息之间搭建起联系,实现信息的全面整合与用户的方便获取。其中,信息内容的深层次整合表现形式主要有引文链接、全文搜索、信息门户等,而浅层次的信息整合方式则有OPAC目录整合、导航模式等多种类型。

2 基于大数据的图书馆开放数据信息服务系统构建要素

基于大数据的图书馆开放数据信息服务系统包含四个构建要素:资源层、数据处理层、应用层以及用户交互层。

2.1 资源层——存取资源

资源层的作用在于存取各种开放的资源信息,宏观方面包括OA期刊、IR、Eprints、OA搜索引擎、深网资源、个人学术站点和其它Web资源等等。微观方面,资源层主要是指MARC、DC、OAI、DOI、Open URL 和 RDF等描述OA资源的各种元数据。目前安徽大学图书馆基本实现OA资源的收集与展示,中国光学期刊网、中国植物数据库等开放数据信息免费向该校读者提供使用[2]。总之,资源层是构建大数据环境下图书馆开放数据信息服务系统的核心要素。

2.2 数据处理层——数据分类

大数据环境下图书馆开放数据信息服务系统宏观方面的数据处理层往往并不复杂。一般来说,不需要繁琐复杂的技术手段支持,也不需要开发者投入过多的智力劳动。数据处理层的主要作用是将OA资源进行分类处理,从而形成数据上的逻辑统一。微观层面的元数据处理则是OA资源整合的关键层次,主要在于对元数据的提取、加工和处理,最终形成统一的元数据标准,并进行本地化存储。

2.3 应用层——应用服务

数据处理层宏观层面的简单运作使得应用层的宏观作用也相对简单,主要在于提供给用户简单的链接和检索服务。例如安徽大学图书馆主页的OA资源版块即提供了中国科技期刊开放获取平台的链接,方便本校师生直接获取该平台的开放数据资源。而微观层面的应用层相对复杂,主要为用户提供元数据的检索服务、OPAC检索服务以及个性化服务等应用,是大数据环境下图书馆开放数据信息服务系统的创新所在。

2.4 用户交互层——交流交互

用户交流层在宏观方面形成的面向用户的终端服务普遍突破了学科导航、资源导航等单向提供数据服务的方式,取而代之的是可以提供信息门户、一站式检索平台等服务,便于图书馆发挥信息技术的优势,加强用户与图书馆的交流,从而重新界定了图书馆和用户之间的关系,实现彼此间的即时交互。

总而言之,基于大数据的图书馆开放数据信息服务系统模型四要素是以资源层为基础,以数据处理层为技术环节,在应用层具体体现,并最终呈现在用户交互层,形成一项完整的开放式数据信息服务流程(见图 1)。

3 基于大数据的图书馆开放数据信息服务系统

在分析了大数据背景下图书馆开放数据信息服务系统四要素的基础上,笔者提出该系统构建如下:建立图书馆本馆IR,实现开放存取资源整合;架构SOA模型,实现用户服务资源整合;应用OLAP技术,实现开放资源知识整合;搭建OA资源导航系统,实现统一检索。

图1 基于大数据的图书馆开放数据信息服务系统四要素[3]

3.1 构建本馆IR,实现开放存取资源整合

图书馆通常被认为是知识的存储机构,担负着保存文献与数据的任务。在大数据环境下,图书馆有责任与义务收集保存数字信息,创建开放数据信息环境。以李春明为代表的学者提出:图书馆在开放信息资源服务过程中应该构建属于本馆的IR,依托IR来提供长期且持续的开放式服务,达到长期保存和可持续获取的图书馆功能[4]。目前,斯坦福大学的LOCKSS系统、英国大学图书馆联合体的CEDRAS等都是取得成功的该馆IR先例。基于大数据的图书馆开放数据信息服务IR模型构建把整个过程分为资源层、元数据管理层、数据仓储构建层和应用层四个层面(见图2)。资源层主要指开放网络环境下各种类型的存取数字资源,既包括OA期刊资源、OA机构知识库、OA学科知识库,也包括预印本和其它形式的开放资源,而元数据管理层的作用则是利用元数据抽取转换协议从资源层中的OA资源中提取元数据,并将其标准化,以实现元数据和数据管理的统一和标准。与此同时,元数据的管理层将不同类型的数据信息和元数据进行转化,完成相关的有效操作。数据仓储构建层的作用在于将统一标准的元数据和数据进行存储,并按照元数据、数据内容分门别类形成各种类型的数据库,为应用层提供数据支持。IR系统在应用层主要实现的就是查询和检索功能,这种系统不仅可以提供用户服务,同时还可以为其它系统提供元数据。由此可见,大数据背景下的开放数据信息服务系统模型中,图书馆既是数据提供者,也是数据服务者。

图2 基于开放存取资源整合图书馆IR构建逻辑框架图[5]

3.2 架构SOA模型,实现用户服务资源整合

基于大数据的图书馆开放数据信息服务系统还要以用户服务为构建导向,即利用中间技术实现各分布式子系统的有机组织和集成,最终达到有效整合庞杂数据信息的目的,其构建指导思想是以信息技术为支撑,以用户服务为中心。首先对用户进行客观而全面的分析,并提供符合读者用户需求的高效增值服务模式,这种模式又被称为SOA模型。将SOA引入图书馆开放数据信息服务系统构建中,有利于解决现存的数据库异构性等问题,原因在于SOA架构定义了服务提供者、服务注册中心和服务请求者三种角色,三者定位明确,能够实现用户服务资源整合,真正将图书馆开放数据信息服务系统打造成为集知识资源与服务为一体的开放式服务系统。

3.3 应用OLAP技术,实现开放资源知识整合

图书馆开放资源知识整合从一定程度上来说是一种理想化的构建模式,其运作流程为:将开放存取资源纳入到图书馆的数字资源体系中,利用OLAP技术实现针对分布式环境下的数字资源的统一检索和获取目标资源的无缝链接,同时为注册用户提供多种类型的个性化服务,最后通过开发的知识整合系统,集提供信息、资源和服务于一体。大数据的环境背景决定了图书馆开放资源知识整合需要在异构数据信息系统中不断进行收集和集成整合工作,通过对OA资源知识的筛选和提取,存储相应的数据要素,最终构建起图书馆的本体库。其中,开放数据信息服务系统的基础是信息整合部分,而OA数据资源的来源和渠道十分广泛,既可以是学术性较强的公共网络,也可以是数字图书馆,还可以是图书馆OPAC系统。

3.4 搭建OA资源导航系统,实现统一检索平台

图书馆OA资源信息导航系统是将不同的信息资源的检索入口统一整合在一起,提供信息的集成式服务,是将不同数据库中电子资源数据按照类型、顺序、学科等角度进行分类的平台。OA资源导航系统的基本功能有利于帮助用户在开放式数据网络环境下,通过资源分类、关键词等方式快速定位数据信息。在OA资源导航系统构建方面,安徽大学图书馆取得了一定突破。安徽大学图书馆首页上设置了专门的OA资源窗口,作为大数据环境下图书馆开放数据信息服务系统的统一检索平台,该校OA资源库提供了30个开放数据库,并按照不同类型、不同来源进行分类,同时支持读者用户的自助检索,使全校读者切实享受到大数据背景下图书馆构建开放数据信息服务的便利性。

4 结语

综上所述,在基于大数据的图书馆开放数据信息服务系统构建过程中,要明确构建思路、服务目标与服务层次,从资源层、数据处理层、应用层以及用户交互层四要素着手,构建本馆IR、架构SOA模型、应用OLAP技术、搭建OA资源导航系统,以实现图书馆开放数据信息服务系统有效实施。

[1] 孙坦.开放信息环境:学术图书馆信息资源建设的重定义与再造[J].中国图书馆学报,2013(3):9-17.

[2] 安徽大学图书馆[EB/OL].[2016-06-07]http://www.lib.ahu.edu.cn/do/list.php?fid=19.

[3] 蒋玲.开放存取模式下图书馆发展对策研究[D].大连.辽宁师范大学,2007.

[4] 黎艳.图书馆如何开发与利用开放存取资源[J].现代情报,2010(1):66-69.

[5] 马漫江.开放存取期刊与高校图书馆电子期刊资源建设发展策略研究[D].湘潭.湘潭大学,2009.

(责任编辑:王靖雯)

Research on the Model of Open Data Information Service System in Library Based on Big Data——Taking the Library of Anhui University as an Example

ZHONG Ping

(Anhui University, Hefei 230039, China)

The era of big data provides a new environment for the construction of open data information service system in library, and puts forward higher requirements for the library service system. Based on the interpretation of the open data information service in library under the environment of big data,this paper analyzes and expounds the construction elements of the service system, and finally puts forward four construction sections in the open data information service system in library, in order to promote the open data library information service.

big data; library; open information resources; open data information service

2015省级质量工程项目(2015jyxm768);安徽大学图书馆科研项目(TSG14806)

G255.76

A

1006-1525(2016)06-0070-04

钟 萍,女,研究馆员。

2016-05-08

猜你喜欢
安徽大学资源整合检索
少先队活动与校外资源整合的实践与探索
“五育并举”下家校社资源整合的价值意义
读《安徽大学藏战国竹简》(一)札记
海外并购中的人力资源整合之道
智慧高速资源整合方式实践
行政违法行为检察监督的实践与探索
秦晓玥作品
陈成亮作品
专利检索中“语义”的表现
国际标准检索