图书馆数字资源整合模式探讨

2010-04-11 17:34张玉琴
河南图书馆学刊 2010年2期
关键词:资源整合导航系统检索

张玉琴

(济源职业技术学院图书馆,河南 济源 454650)

1 引言

随着数字图书馆的蓬勃发展,全球范围内的数字资源激增,资源的种类越来越丰富,数字资源建设已经成为图书馆文献资源建设的重要组成部分,在保障读者的需求方面发挥着不可替代的作用。但是,随着科学技术的迅速发展,学科数量愈来愈多,结构愈来愈复杂,学科间的相互渗透、纵横交叉、综合,不仅使得信息量剧增,而且更进一步导致了资源的无序和分散。不同的数字资源又有其物理和逻辑结构,具有各自不同的检索系统和发布系统,检索方式、检索手段各式各样,造成了数据冗余、相互关联程度低,大量的信息孤岛出现,同时用户的检索负担也日益加重。因此,需要有一种手段把这些信息集中、整序、关联起来,把检索系统集成起来,使用户知道到哪里可以找到所需要的信息,怎样去查找这些信息,如何筛选检索结果。本文就图书馆数字资源的整合模式进行分析、综述,以供借鉴。

2 图书馆数字资源的类型

面对种类、数量、形式、品种多样的数字资源,不同学者从不同的角度对图书馆数字资源的类型进行划分。本文根据图书馆数字资源建设的实践,按图书馆数字资源的来源,将图书馆数字资源分为以下几种类型:

2.1 自建特色数据库。包括图书馆的中外文馆藏资源数据库、中外文献目次库,学位论文及会议论文数据库,教学参考书数据库及馆藏特色数据库等。

2.2 外购数据库。图书馆引进的各种国内外商用数据库,类型包括文摘、题录、全文数据库等,如CNKI数字图书馆、万方数据库、维普、超星数字图书馆、Springer鄄Link等数据库。

2.3 光盘资源。包括图书馆购买的大量的多媒体光盘、随书光盘、网络光盘数据库等。

2.4 图书馆收集的因特网上一些免费的网络数字资源等。

3 图书馆数字资源整合的必要性

目前已有的数字资源整合方案或系统在一定程度上为用户提供了期望的一站式服务。然而,面对层出不穷的整合系统,用户并没有真正享受到满意的服务[1]。由于数字资源过于丰富和分散,为资源整合带来了巨大的障碍。同时,由于缺乏完整的理论体系,统一的思想认识、相应的标准和规范、科学的规划和组织,一些问题就凸现出来,具体表现在以下几个方面:3.1 高校图书馆的数字资源除了有部分是自建数据库外,大部分都采用了由不同的数据库商提供的数据库、学术期刊、会议文献等。如CNKI数字图书馆、万方数据库、维普、超星数字图书馆、SpringerLink等资源,内容交叉重复,影响用户对信息的选择与获取,造成了数字资源整合中的重复建设。

3.2 存在冗余信息。多数数据库的资源收录原则是“全”,使得大量使用价值不高的信息进入资源系统,干扰用户对信息的获取。

3.3 知识关联程度低。现有数据库资源系统内的数据对象大都是孤立存在的,无法体现学科知识的内在联系。

3.4 从技术角度看,数字资源不同的描述和表达方式,每个数据资源又都有其自身独特的检索界面、查询方法和下载格式。这就需要读者进入到不同的检索界面,采取不同查询方法进行检索,并且需要下载安装不同的阅读器,这就给用户实际利用带来了麻烦。

3.5 由于缺乏规范、统一的标准,不同的数据商开发的数据库在数据结构上、字段上存在互异,并且拥有各自的检索系统,因而在检索上存在着差异,这对实现同一检索平台下的分布式检索造成了困难。

4 图书馆数字资源整合的基本模式

4.1 基于OPAC系统的数字资源整合

OPAC(Online Public Access Catalog)即联机公共目录检索系统,将MARC记录纳入本馆的OPAC系统,使OPAC真正成为揭示全部馆藏的目录检索系统。根据整合对象的不同,可将基于OPAC系统的资源整合分为馆内整合与馆外整合两种。馆内整合是通过在MARC记录里增加856字段——“电子资源地址与存取”字段,实现在实体馆藏中揭示并链接全文电子文献。馆外整合的实质是实现本馆与不同异构OPAC系统的整合,当前较多的是通过采用Z39.50协议来完成。通过执行Z39.50标准,将所要整合的图书馆的书目数据库先映像成自己专用的模型,再根据本馆要求建立统一的检索接口。因此,基于OPAC的信息数字资源整合可实现:(1)馆际馆藏书目数据资源的整合。(2)馆藏图书与随书光盘资源的整合。(3)馆藏图书与电子图书的整合。(4)馆藏期刊与电子期刊的整合。(5)与其它数据库的整合等。

基于OPAC系统的数字资源整合,充分利用了OPAC系统高访问率的优势,提高数字资源的利用率,在某种程度上起到非常积极的作用。但它也是一种不完全的整合方式,有着先天性的不足。

4.1.1 目前很多电子资源尚不能稳定彻底地支持开放链接(OpenRUL)标准,链接地址稳定性差,信息源数据的更新或任何一点地址变动都可能产生死链,导致整合工作不能得到持续有效的保障。

4.1.2 整合依赖于图书馆OPAC系统功能的完善程度,如要支持856字段的能力、要有修改书目记录显示字段的功能等,而这些功能的实现往往需要系统开发商的配合。

4.1.3 直接利用MARC格式组织电子资源时显得费时费力,不仅数据加工成本较高,而且很难实现批量更新和维护。

4.1.4 基于OPAC系统的资源整合实际上是一种目录级的整合,只是对信息源进行加工,并没有涉及到数字资源的内容、结构,因而并没有真正解决数字资源异构、交叉带来的使用问题。

4.2 基于导航系统的数字资源整合

数字资源导航系统是指将数字资源的检索入口整合在一起,建立数字资源导航库,提供按资源名、关键词、资源标识等获取数字资源的途径。它通常按资源类型、学科主题等把数字资源组织起来,通过数字资源的URL,并利用超文本链接提供检索入口。按资源类型不同,可以分别建立电子期刊导航系统、数据库导航系统、电子图书导航系统、电子报纸导航系统、学科专题导航系统等。数字资源导航系统一般都有三个功能:字顺浏览功能、分类浏览功能、关键词检索功能。这三个功能可以帮助用户迅速找到数字资源,并利用超文本链接提供检索入口,对该数字资源进行检索。

数字资源导航系统同样仅定位在数字资源的形式层,不能提供内容层面上的服务,用户仍需要通过导航系统分别访问每个数字资源系统的检索界面。读者不能按主题、作者查询文献,而且由于数据商、出版商大多没有提供充分的URL信息,数据库不能创立URL,所以数字资源的导航系统只能引导读者进入到所在数据库的界面,读者必须对信息系统进行检索。

4.3 基于链接系统的数字资源整合

利用网络超文本链接特性,将文献的有关知识点链接起来,最终达到将有关的数字资源链接在一起,形成一个具有内在联系的有机整体。链接整合主要有:一是封闭式静态链接系统,所有链接都存在本地数据(封闭式),所有链接都通过专门程序事先计算、并通过嵌入URL来表达(静态链接),链接准确性高;二是开放式静态链接系统,解决如何为链接源中包含的别人拥有的链接对象提供链接;三是开放式动态链接系统,在用户需要链接时才根据一定规则计算链接路径进行链接,可对用户链接前出现的链接对象或位置予以链接,也可在链接计算规则中嵌入选择规则实现选择性链接。如OpenURL,SFX,CrossRef/DOI等。

目前使用最多的是开放式动态链接系统SFX,它是ExLibris公司推出的新的网络电子资源无缝链接整合软件系统,也可以称为上下文敏感参考文献链接解决方案。SFX采用Open URL技术,通过 HTTP请求和元数据传递,对数据进行分析、搜寻,链接到目标信息源,并根据目标信息源的可获取情况,动态地创建链接到全文、摘要、期刊目录等不同的级别,从而使用户能够实现统一界面检索,直接获取目标信息源,真正实现了信息数据库之间的无缝链接。它还能够实现在数据库中点击一篇文章的记录后显示所有能够得到的与这篇文章相关的服务选项列表,实现了在知识整体层面对信息资源进行管理的整合。在实际的应用中也依然存在一些问题:它基于一定的OpenURL协议标准,对于发展比较规范的国外数据库资源比较适用,但是对于早期遗留数据库和资源数据库构建技术不同、标准不统一的国内数据库存在着很大的难度。各个数据库根据OpenURL标准制定的接口依然有很大差异,若要根据自己的需求自行开发依然比较困难。此外,SFX技术对检索数据需要在二次检索的扩展服务中完成“一步到位式”参考链接。

4.4 基于跨文库检索系统的数字资源整合

某个学科的文献资料可能包含在多种数据库中,读者要完成某个课题的检索,往往要通过多个数据库进行多次检索,才能将与该课题有关的文献找全。而每个数据资源又都有其自身独特的检索界面、查询方法、下载格式、检索式构、检索字段等都不尽相同,这给用户的资源检索造成很大的困难。如果能在同一个检索平台下,实现多数据库同时检索,将大大提高用户对信息资源获取的效率。

跨库整合检索可分两个层次:第一层次是检索界面的整合。许多数字资源检索界面存在一定的相似性,可将这些相似性形成统一的参数表,构成统一的检索界面,共享多个数据库的索引技术和检索技术。第二层次是实现数字资源系统间的分布式异构整合检索。检索界面整合的常见模式是构建中间层,当用户提出检索请求后,其请求被交给服务器端的一个Agent程序,Agent将用户请求转换成相应信息系统的查询语言和检索方法,再将请求发送到各数据库,然后将各个系统返回的命中结果经过筛选、去重、归并等处理后在同一界面上呈现给用户。在不改变现有信息系统的数据组织结构和检索方法的条件下,实现对异构的多数据源的统一访问,即提供“一站式”检索服务。

实现分布异构环境下的跨库检索,情况比较复杂。一方面,追求对所有资源的跨库检索只是一种理想状态,实际上只能做到兼容尽可能多的资源。另一方面,对几十种以上的资源笼统地实现跨库检索并无实用价值,用户的需求是针对学科范畴、针对文献类型或者针对个性化需求定制而进行的资源检索和导航。人们逐渐认识到,跨库检索实际上是作为一种关键技术应用在图书馆的“资源门户”中,与开放链接、聚类导航、个性化空间与信息定制、用户认证和权限控制等功能一起构成一个实用的数字资源整合系统。

5 结语

图书馆的数字资源整合是一项复杂的系统工程,无论采用何种整合模式和技术,要本着“以实用为主”的原则,了解最终用户的需求,明确本馆的资源状况和目标,要将复杂的应用问题转化为简洁、实用、友好的方案呈现给用户,使用户在面对类型各异的大量数据资源时,不会再无所适从,充分发挥数字资源的效能。

[1]沈芳.高校图书馆信息资源整合的结构、模式分析[J].现代情报,2007,(10).

[2]陈永选,郑乐丹.基于网络的图书馆信息资源整合模式研究[J].科技情报开发与经济,2008,(5).

[3]谢玲.论现阶段数字资源整合的实用技术及发展趋势[J].现代情报,2007,(8).

[4]张文德,戴晓翔.信息资源整合系统与技术研究[J].现代图书情报技术,2003,(6).

[5]田向阳.图书馆数字资源整合研究[D].陕西师范大学硕士学位论文,2007.

猜你喜欢
资源整合导航系统检索
少先队活动与校外资源整合的实践与探索
“五育并举”下家校社资源整合的价值意义
说说“北斗导航系统”
海外并购中的人力资源整合之道
“北斗”导航系统是怎样炼成的
智慧高速资源整合方式实践
一种GNSS/SINS容错深组合导航系统设计
解读全球第四大导航系统
专利检索中“语义”的表现
国际标准检索