数字信息资源整合关键技术和策略研究❋

2013-08-15 00:49刘洪辉黄浩波
图书馆 2013年6期
关键词:数字信息异构资源整合

叶 青 刘洪辉 易 娟 陈 莹 黄浩波

(1.广西医科大学图书馆 广西南宁 530021;2.广东省立中山图书馆 广东广州 510110)

1 数字信息资源整合的关键技术

数字信息资源整合是依据一定的需要,利用数字资源整合技术、网络技术和其它相关技术,对分布式、异构条件下各个相对独立关系的数字信息资源进行融合、类聚和重组,将它们重新构建为一个信息无缝透明链接而效能更高的新数字信息资源检索系统。经过整合的数字资源检索系统具有集成检索功能,是跨平台、跨数据库、跨内容的新型数字信息资源体系,有以下几种技术类型:

1.1 XML中间件技术

XML是一种可以对信息进行自我描述的语言,它有使用普通文本、自定义复杂的标记结构以及跨平台的优点。〔1〕当用户需获取来自不同来源、不同格式的数据时,用户就通过XML与这些数据库进行交互,收到经过XML中间件处理的统一格式的数据。

1.2 SFX 整合技术

SFX是一个基于开放的统一资源定位器(Open URL)标准而实现不同数据库之间上下文互连的参考链接系统,它能把不同通信协议和不同数据库系统来源的信息融合,实现不同类型、不同格式的数字信息资源无缝链接。

1.3 Web Service技术

Web Service是为实现基于web无缝集成目标而提出的一个全新概念,主要是为了使原来各孤立站点之间的信息能够相互通信、共享而提出的一种接口。〔2-3〕

1.4 DOI技术

DOI技术是为数字环境中的图书、期刊等数字资源对象分配唯一的、永久性的含有出版商本身DOI前缀的DOI标识码,方便对数字资源的管理和使用。

除上述数字资源整合关键技术外,还有CGI、ODBC、JDBC、ASP技术、JSP技术和地域性索引服务平台技术等在数字资源整合中应用。

2 图书馆数字资源的整合策略

为使读者快速检索到所需信息,笔者提出以下七点整合策略:

2.1 导航整合策略

导航整合策略是一种简单的数字资源著录整合,通过导航引导进入某个具体的数字资源库进行单库检索。该策略可用SFX整合技术实现,但整合程度较低。

2.2 OPAC 整合策略

OPAC策略依托OPAC系统的功能,通过对系统功能扩展实现对图书馆各种数字资源的整合。该策略技术实现较容易,整合质量也较高,但由于很多数字资源无法提供独立的URL,且有些数字资源链接的IP地址常发生变化而造成数据的不能正常访问,系统需进行长期不间断的维护。

2.3 数字图书馆应用系统整合策略

数字图书馆应用系统整合策略是指进行数字图书馆系统设计时利用跨库检索技术建立一跨库检索平台,〔4〕然后利用这一平台的支持分布式系统操作、数据无缝交换及信息共享的功能,来构建数字信息资源逻辑上的集成信息服务机制,并根据其逻辑关系把它们组织成相互联系的立体网络资源系统。

2.4 跨库检索整合策略

跨库检索整合策略是指建立实现多个数据库同时检索的跨库检索平台。〔5〕跨库检索具有使用方便、操作快捷的优点,避免了单库检索需掌握多种检索方法和重复输入检索条件的麻烦。但它整合的一般只是同一系统中数据结构相似而文献类型不同的数据库,并非异地、异平台的异构数据库。

2.5 链接系统整合策略

基于链接系统的整合策略是指依靠网络的超文本链接功能将存在于异构数据源的虚拟信息与真实信息实体的内在关系进行整合。该策略实现较为容易,但只有简单的链接功能,没有检索功能。

2.6 元数据整合策略

元数据的整合策略是对多个异构、不同标准的原始数据源采用同一标准标引建成一个按数据库方式储存的元数据集,通过Web Service发布系统与客户端进行信息交换。它是目前应用较多的跨平台系统。但是,在原始数据源的集成过程中容易造成命名、模式结构等冲突而导致元数据与原文数据源之间同步性差的现象。

2.7 数据仓库整合策略

数据仓库整合策略是指将异地、异构数据库系统中分散、不一致的数据进行整合建成一个集成同构的数据仓储集合并提供统一的检索。〔6〕该策略对硬件设备要求较高。

3 广西医科大学图书馆数字资源整合策略

笔者现结合广西医科大学图书馆(以下简称“广医馆”)数字资源的异构特征,并提出相应的整合策略。

3.1 数字资源异构特征

广医馆现有文献数字资源库共29个,这些数字资源的异构特征表现在四个方面:一是数据模型的异构:有层次、网状、关系和面向对象4种;二是数据结构有的用0ralce结构,有的则用Sybase数据结构,或是半结构或非结构的;三是系统控制方式的不同,该馆数字资源有的采用集中式系统控制,有的则采用分布式系统控制;四是通信协议和通信结构模式的不同:有Z39.50通信协议、HTTP标准和非标准通信协议;通信结构模式有主从结构、浏览器/服务器模式和客户服务器模式。

3.2 数字资源整合策略

通过对数字资源整合技术和整合策略的对比研究,结合广医馆数字资源的异构特征和学校资金能力,采用基于OpenURL协议与XML Schema的元数据整合策略建立广西医科大学统一检索平台。一是借鉴丹麦的MARCXchange模式结构,对ISO2709基本组成部分进行相应的处理,建立用于描述CNMARC和UNMARC格式的XML Schema文档。数字文献信息资源整合由Wrappers模型结构来实现中间件框架与XML Schema结合的中间件技术,并通过保留和建立语义约束对不同结构文献库中的元数据进行提取、转化和合并来实现图书馆数字信息资源库的半自动化整合。二是统一检索平台,建立以IPAC检索页面为中心的一站式数字资源镜像地址的检索和链接服务,满足OpenURL协议的镜像地址动态修改的需求。平台还以HORIZONIPAC检索页面为嵌入对象,重新构建添加了新的链接信息的IPAC检索页面,即读者输入检索信息后,返回的检索结果页面显示检索命中该馆所拥有的资源类型(图书、期刊论文、学位论文或会议论文等)及记录数,另外还显示对这些命中数字资源记录的链接。

4 讨论

4.1 制定数据库结构等相关文献数字资源的国家标准

通过制订数据库结构等数字资源相关国家标准,让数字资源数据库系统建设有章可循,数据互相兼容、方便移植,使不同的数字信息资源真正实现无缝、透明地链接,实现一站式检索目的,节省用户的检索时间,提高检索效率和信息资源的利用率,从而提高图书馆的服务水平。

4.2 研制开发科技信息国际联机检索系统

美国Dialog系统、德日两国合建的STN系统以及法国的QuesteloOrbit系统是数字信息资源整合的典范,可同时在几个甚至几十个数据库中进行跨库检索,是科技信息资源收藏、传播、共享和利用最重要的方式和手段。因此,可借鉴国际联机检索系统的经验,研发符合我国国情的科技信息国际联机检索系统,提高我国数字资源的整合能力和水平。

4.3 加强数字资源整合理论和应用研究

目前我国的数字资源的整合研究虽然取得了一些成果,也有了不小的进展。但起步较晚,经济技术相对落后,国家和各级政府应该在政策和资金等方面给予鼓励和支持,加强数字信息资源整合的理论和应用研究,不断探索新的整合技术和研究新的整合策略以提高我国数字信息资源的整合能力和水平,加强图书馆数字信息资源的开发利用。

1.柏永斌等.基于XML和WebService的异构数据整合技术应用研究.电脑知识与技术,2009,5(8):1796 -1797

2.Tsalgatidou Aphrodite,Athanasopoulos George,Pantazoglou Michael.Interoperability Among Heterogeneous Services:The case of Integration of P2P Services with Web Services.International Journal of Web Services Research,2008,5(4):79 -110

3.Yunk,Liuw,Zhou A.A framework ofWeb service composi- tion for distributed XML query evaluation.APWeb 2005,WebTechnologiesResearch and Development.Springer,LNCS3399.2005.572 -578

4.Hao Ding,Solvberg,Ingeborg T.Semantic Data Integration Framework in Peer-to-Peer based Digital Libraries.Journal of Digital Information Management,2005,3(2):71 -75

5.翟姗姗,陈卓群,夏立新.基于OGSA的数字图书馆跨库检索平台构建.情报科学,2011(2):294-297

6.Tseng,Frank S.C,Chia - Wei Chen.Integrating heterogeneous data warehouses using XML technologies.Journal of Information Science,2005,31(3):209 -229

猜你喜欢
数字信息异构资源整合
试论同课异构之“同”与“异”
少先队活动与校外资源整合的实践与探索
“五育并举”下家校社资源整合的价值意义
基于BIM的企业数字信息归档与利用模式研究
北京尚水数字信息产品介绍
海外并购中的人力资源整合之道
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
吴健:多元异构的数字敦煌
智慧高速资源整合方式实践
异构醇醚在超浓缩洗衣液中的应用探索