高校图书馆数字资源整合方式研究

2013-08-15 00:49刘子辉陈强彭渝秦小铁
关键词:中间件资源整合异构

刘子辉,陈强,彭渝,秦小铁

目前,图书馆都非常重视数字资源建设。“教育部高校图书馆事实数据库”中,2009年,468所高校图书馆采购数字资源的总费用为4.98亿元,每馆平均花费为106.5万元,约占馆均文献资源采购费用的32%,高校图书馆用于数字资源采购的费用不低。2009年,上海交通大学图书馆采购费为1 350万元,浙江大学图书馆采购费为1 215万元,大连理工大学图书馆为1 117万元,清华大学图书馆为1 111万元,中山大学图书馆为1 076万元[1]。据笔者对重庆地区数字资源采购情况统计,重庆大学图书馆采购了150多个数据库数据,西南大学图书馆采购近100个数据库数据,重庆科技学院采购了50多个数据库数据。高校图书馆采购的大量数字资源为读者带来极大方便的同时,也给读者带来了困惑。读者要到各个数据数据库中分别检索所需要资源,因每种数据库检索方式不同,数据格式不同,阅读器不同,给读者使用资源带来极大的不便,所以必须对数字资源系统进行整合。所谓数字资源整合是指数字资源优化组合的一种存在状态,是依据一定的需要,对各个相对独立关系进行融合、类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的数字资源体系[2]。通过数字资源整合读者只需要通过“一站式”检索,即可实现对各异构系统的统一访问,提高检索效率,节约读者时间。

一、数字资源整合的研究

我国图书情报界的信息资源整合研究10年前已经开始,在理论研究和实践方面取得了不少成绩,信息资源整合研究已经越来越受到图书情报界的重视,研究内容也日益丰富起来,从介绍性文字到研究论文,从理论的研究到技术实现的实践,涌现出一大批从事这方面研究的专家学者,发表了大量有价值的论文和专著。笔者以“信息资源整合”为检索词,从中国期刊网全文数字库检索出文献483篇,说明对信息资源整合的研究较多。经过年份逐一统计,发现每年论文发表数量在增多。以 “图书馆信息资源整合”为检索词,从中国期刊网全文数字库检索到63篇高度相关论文。

在理论研究方面,马文峰对数字资源整合的理论基础、特征、方式,详细论述了基于数据仓库,基于中间件的,基于链接的整合模式,同时提出了基于知识组织的理论与方法。在基于应用层的研究方面,李玲俐,赵爱芹研究了基于XML中间件的企业异构数据整合系统的实现[19]。陈萍,张蓓,吕洁论述了基于中间件跨校资源整合的设计与实现。基于应用层的数据整合具有很大的优势,但也存在固有的缺点,所以很多研究者提出从数据层实现资源整合,林毅,宁洪,王挺,刘文杰等研究了基于元数据在数据整合平台的应用苏志芳,孟凡静,王乐等论述了Open URL技术在异构资源整合中的原理,作用及相应的应用。但是对于相关技术,协议理论阐述较多,应用研究不是很多,也不是很深入。

二、图书馆数字资源类型分析

按引进方式,可将数字资源分为商业数据库,自建数据库和网络免费资源三种类型。

(一)商业数据库

商业数据库是指图书馆通过数据商采购的数字资源,此类数字资源数据量庞大,种类众多,有中国期刊全文数据库、超星图书、书生图书、Springer等,商业数据库按照是否可以建立本地镜像可分为镜像资源和远程资源,按照资源类型可以分为图书、期刊、视频等,还可以分为全文数据库和文摘数据库。此类数据库具有很高的学术价值,所以很多图书馆都非常重视引进商业数据库,高校图书馆存在重复建设问题。此类数据库采用的平台、开发语言,数据库、数据格式、阅读器、元数据格式等都不一样,所以此类数据库的整合也最复杂。根据不同的数字资源可采取不同的整合方式。

(二)自建数据库

各个高校根据本校的实际情况,专业设置,学科优势,都会自己建设一些特色数据库。例如上海交通大学的机器人信息数据、中南大学的有色金属文摘、重庆医科大学的临床检验诊断学知识平台等,很多图书馆都建有学位论文数据库、光盘数据库。此类数据库资源量并不是很大,有全文数据库,也有文摘数据库,虽然数据量不大,但是具有很强的针对性,具有很强的学术价值、受到本校师生的喜欢。但此类数据库也存在系统异构的问题。很多高校图书馆都建设本校的光盘数据库系统,重复建设严重,由于光盘资源占存储空间很大,对本馆存储空间造成很大压力,以重庆科技学院为例,光盘数据库所占的空间为2T,随时间增长,其存储空间日益紧张。

(三)网络免费资源

网络免费资源为图书馆对网络数字资源进行筛选、重新组织、使杂乱无章的资源有序化,也有来自出版社的免费数字资源。此类数字资源种类比较多,但杂乱无章,需要进行整理,去粗取精,去伪存真。

三、数字资源整合方式

(一)基于OPAC模式实现资源整合

OPAC系统是用户最熟悉的系统,图书馆可以通过OPAC系统将本馆的纸质资源与数字资源有机统一起来,用户在检索到纸质资源的同时,可以通过点击链接获取对应的电子图书、电子期刊、视频资源,实现了数字资源与纸质资源的整合。OPAC整合模式是通过在MARC记录中增加856字段,856字段是用于网络信息资源编目的,当某纸质资源有电子资源是,我们可以在856字段中添加资源的URL,例如:856 1#uftp://uiarchive.cso.uiuc.edu/oedip 10.txt, 此字段可以重复。另一种方式是建立区域图书馆OPAC系统,图书馆之间可以通过Z39.50协议,实现本馆与其它图书馆之间资源的统一查询。此模式实现起来比较简单,但缺点也比较明显:(1)工作量大,要向MARC中添加资源URL,当资源URL改变时,还要重新修改URL,工作量非常大;(2)整合力度小,OPAC整合模式只是实现了纸质文献与数字资源之前的整合,并没有实现各数据库系统之间的整合,效果并不好[3]。

(二)基于元数据的数字资源整合模式

基于元数据的资源整合是指对异构系统中分散存储的元数据,通过对元数据清洗,统一收割到集中的元数据仓储中。读者对本地元数据仓储统一检索,通过元数据中的全文路径实现对对象数据的定位,从而打破保异构系统,实现数字资源整合的目的。该模式整合的前提是能获取各异构系统的元数据,由于知识产权问题,元数据获取不是很容易,图书馆可以通过和数据商谈判获取元数据的使用权,商业的中文数据库,自建数据库比较容易获取元数据,而外文数据库很难获取元数据。该模式的优点为:(1)系统具有很强的灵活性,扩展性,在构建统一的元数据仓储的同时,各分散的资源系统仍然可以独立运行,提供服务。当需要整合新增加的资源时,系统只需要抽取新系统的元数据即可,有很强的扩展性。(2)速度快,基于元数据的资源整合要比基于中间件的整合模式检索速度快,由于构建了统一的元数据仓储,读者在检索数据库时,只是对本地的系统进行检索,速度很快。而基于中间件的整合模式中,中间件要检索各异构系统的数据库,通过去重、合并生成统一的界面,最后返回给读者,所以速度比较慢。(3)可以开展深层次的数据挖掘服务,提供决策支持。缺点:元数据不容易获取,对于无法获取元数据的异构数据库,该模式无法整合。

(三)基于中间件的数字资源整合模式

各异构系统由多个开发商提供,系统之间采用的服务平台、程序和数据库都不一样,这些异构使用户无法统一访问各系统。如何屏蔽各系统差异,让用户感觉不到系统的差异而能统一访问异构系统,是开发人员须考虑的问题。中间件是一些系统软件,位于操作系统与各应用程序之间,中间件具有通用的程序接口和协议,可以对不同的操作系统与硬件平台进行操作,由于标准接口对于可移植性和标准协议对于互操作性的重要性,中间件已成为许多标准化工作的主要部分。中间件通过包装器/协调器将用户需求的信息从各异构系统中读取出来,统一显示在用户的界面上,使用不同开发商产品的最终用户或者开发人员创造了浑然一体的连通性,从而达到数字资源整合的目的[4]。其优点是:这种资源整合方式在于所获取的资源与各个异构数据库之中的数字资源没有时滞,保证了信息的及时的更新。缺点为:当集成的异构数据资源较少时,系统有较好的表现,但当集成的异构数据库较多时,中间件要分别访问各个异构的数据库,检索的效率自然就偏低。

(四)基于语义思想实现资源整合

传统信息检索技术是基于关键词进行检索,例如,题名,作者,主题词等,是基于字面进行检索,因此查询结果往往会出现误检,漏检等情况,查全率与查准率都不高,弊端比较多,如何能为用户提供更加智能化的,高质量的信息服务,成为图书情报领域研究的重点。用户期望能够提供基于概念进行检索的系统,提供基于语义级别的信息检索,所而提高信息检索效率。《语义数字图书馆研究综述》基于知识本体的资源整合方式是基于语义思想实现异构系统的整合,本体是定义了某领域的词汇表中的基本概念及概念之间的关系,以及结合这些术语和关系来定义词汇表外延的规则,通过各个知识库的基于本体知识关联和逻辑推理等知识链接手段形成知识网络,从而使本领域的知识得到共享和重用,使领域内不同的系统、模型之间能够进行互操作,实现基于语义的资源整合和利用[5]。基于语义思想的资源整合是资源整合的发展方向,但是现在还在发展之是,应用并不普遍。

四、结语

数字资源的整合是资源建设发展的必然,打破异构系统,实现数字资源的一站式检索,是资源整合的目标,随着用户需求的增加,数字资源整合必须向深层次发展,整合后的系统更加符合用户的需求,更加智能化是发展方向。就目前而言,由于数字资源的特点不同,所以没有哪一种技术可以实现对所有资源的统一整合。因此,资源整合要根据资源特点,采用不同的技术或者是技术组合。

[1]中国图书馆学会,国家图书馆.中国图书馆事业发展报告2010[M].北京:北京图书馆出版社,2011:87-88.

[2]韩梅.我国数字资源整合研究的现状、实践与热点[J].大学图书情报学刊,2010(2).

[3]刘罡.图书馆数字资源的整合方式[J].情报探索,2009(8).

[4]曾国林,傅秀芬,吕占德.异构数据库集成中间件的设计与实现[J].计算机技术与发展,2011(3).

[5]严安.基于语义Web服务的数字图书馆资源整合研究[J].图书情报工作,2010(20).

猜你喜欢
中间件资源整合异构
试论同课异构之“同”与“异”
少先队活动与校外资源整合的实践与探索
“五育并举”下家校社资源整合的价值意义
海外并购中的人力资源整合之道
RFID中间件技术及其应用研究
智慧高速资源整合方式实践
基于Android 平台的OSGi 架构中间件的研究与应用
异构醇醚在超浓缩洗衣液中的应用探索
overlay SDN实现异构兼容的关键技术
LTE异构网技术与组网研究