高校图书馆OPAC系统中书目扩展信息应用情况研究

2014-10-22 21:50王昆鹏陈钰王树斌
电脑知识与技术 2014年27期

王昆鹏 陈钰 王树斌

摘要:利用MASHUP技术,可以实现书目扩展信息应用,在OPAC系统中显示图书封面、章节目录等内容。现在在大部分的OPAC系统中都可以实现,但应用的情况比较混乱,缺乏统一的标准规范。

关键词:MASHUP技术;OPAC系统;书目扩展信息

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2014)27-6391-02

Abstract: MASHUP technology, can achieve bibliography extended information applications, display book covers, chapter directory and other content in OPAC system. Now most of the OPAC system can be achieved, but the situation is chaotic applications, the lack of uniform standards.

Key words: MASHUP technology; OPAC system; bibliography extended information

OPAC,即联机公共查询目录 (Online Public Access Catalogue),是图书馆重要的馆藏检索工具。OPAC是随着信息技术在图书馆领域的应用而产生的,最初只是对传统卡片目录的简单数字化,给读者提供一种计算机检索工具。随着互联网的快速发展和普及,OPAC已经取代卡片目录,作为馆藏的主要检索工具,是现代图书馆信息管理系统一个必不可少的部分。

OPAC的检索数据源是图书馆的书目元数据,即MARC数据。MARC数据是一种结构化的数据,这使得检索非常方便。但目前的MARC数据容纳的字段有限,例如国内普遍使用的CNMARC,就不含书籍封面、章节目录等信息,这些没在MARC中定义的书目信息,可以称之为书目扩展信息。在OPAC系统中,书目扩展信息因为不是图书馆书目元数据的内容,所以无法向读者提供。这不仅与现在互联网的丰富内容相较有些脱节,也不利于对馆藏书目的揭示,不能更好地方便读者对书目信息的检索利用。

1 实现书目扩展信息应用的途径

在OPAC系统中显示MARC定义内容以外的书目扩展信息,目前主要采用MASHUP技术实现。所谓MASHUP技术是将两种以上使用公共或者私有数据库的web应用加在一起,形成一个整合应用,利用从系统外部第三方数据源获取的内容和功能来创建全新的服务。通过MASHUP技术,可以将外部的书目扩展数据和图书馆的书目数据整合显示在OPAC系统中,从而实现书目扩展信息服务。

书目扩展信息服务最主要的问题是如何获取数据,图书馆在进行书目著录时并没有包含这些信息。现在获取数据的方法主要有三种:

1) 采集著录书目扩展信息数据,构建新的元数据。采集整理书籍封面、章节目录、内容简介、作者简介等内容信息,作为原来书目数据的补充,在OPAC系统中提供给读者。清华大学图书馆为了在OPAC中显示图书封面,便对馆藏书目封面进行过扫描采集。自建数据的方法能够完善馆藏书目信息,并在数据质量、使用权限等方面有足够保障。但不足之处在于成本过高,新建数据需要对馆藏书目逐一进行信息采集,对于现在许多藏书量以百万计的图书馆来说,这会是一项浩繁的工作。

2) 从互联网上免费获取书目扩展信息。互联网上拥有大量的书目数据信息,这些信息直接面向网络用户,虽然不如图书馆的数据规范详实,但却在很多地方更加实用,而且有些内容正是图书馆数据中缺少的。比如图书封面、章节目录、内容简介、试读内容等等,这些信息亚马逊、当当网、豆瓣网、超星数字图书馆等网站上都比较完备。除此之外,还可以获取图书销量、书评等内容提供给读者作为参考。获取信息的技术有两种,一种是通过网站提供的API接口,目前豆瓣网就有开放的API接口;二是当网站不对外提供API接口时,通常采用屏幕抓取技术来实现。南京大学图书馆以豆瓣网作为数据源,实现了在OPAC系统中显示书目扩展信息。免费获取数据虽然方便、成本低,但也存在着较多问题。首先是数据的覆盖面有限,互联网上的书目数据主要集中在畅销类和大众普及读物方面的图书,专业性强的或者是出版时间较早的图书数据较少涉及。而这两类图书又恰好是很多图书馆尤其是高校图书馆的主要馆藏。所以,采用免费从互联网获取数据源的方法,获取的数据有限,只能满足部分需求。其次,获取的数据质量难以保障,互联网数据虽然内容丰富,但并没有统一的标准约束,随意性较为明显,且不能确保内容正确。第三,数据源缺乏稳定性,从互联网获取数据,无法有效的控制数据源,数据源有任何的变动都有可能造成获取数据失败,让书目扩展信息服务无法保证持续稳定。

3) 在自建和免费获取两种方式获取数据之外,现在也有商业数据提供。有机构或厂商已经完成了书目扩展信息的数据采集,并构建了规范的数据源。以云计算的方式提供给图书馆,同样使用MASHUP技术与图书馆OPAC系统整合,实现书目扩展信息服务。这种方式可以免去图书馆采集数据的繁琐工作,在书目数据的覆盖量、质量、稳定性等方面也能保障。只是需要支付一定的费用。

2 书目扩展信息应用情况调查

虽然通过技术手段或商业方法可以在图书馆OPAC系统中整合进书目扩展信息,但这个服务并不是必不可少的内容,受限于观念、技术和经费等原因,书目扩展信息服务在国内高校图书馆OPAC系统中应用的水平差距较大。个别技术能力强和经费充足的图书馆,通过自己开发建设,已经具备了很好的书目扩展信息服务。而其他的大部分图书馆,主要是依靠本馆OPAC系统自身的功能。

OPAC系统一般是作为自动化业务的一部分与图书馆信息系统集成在一起的。国内高校图书馆采用的集成管理系统不尽相同,既有国外开发的系统,也有国内开发的系统。国外的系统有UNICORN/ HORIZON、INNOPAC、ALEPH 等,国内的系统有汇文、ILAS、melinets、金盘、妙思、SULCMIS等。在“211”高校中,使用国外管理系统的有28所,站总数的24%,使用国内管理系统有90所高校图书馆,站总数的76%。国外管理系统用户分别为ALEPH 11家,UNICORN/ HORIZON 10家,INNOPAC 7 家。使用国外管理系统主要集中在重点高校图书馆,39所“985”高校中,使用国外系统的有 18家,占总数的46%。国内管理系统用户分别为汇文、melinets、金盘几个系统用户数比较多。

使用国外管理系统用户中,有部分用户实现了书目扩展信息服务,OPAC中可以显示图书封面、章节目录、内容简介等内容。所有这些扩展信息服务都是通过商业付费的形式,由Ex Libris公司的Primo系统实现。Primo提供完整的Web 2.0功能:包括检索词提示、标签、评论、以及Wiki、网络摘要、著者简介、网络目次等各种资源,并采用Mashup技术将这些内容整合在一起,呈现一个信息丰富的页面。

国内管理系统中,用户最多的汇文系统,其最新版的OPAC整合了豆瓣网的内容,直接可以显示图书封面、章节目录等内容,而较前的旧版本则没有此功能。Melinets系统和金盘系统本身没有实现书目扩展信息显示的功能,但最新版的OPAC预留了接口和显示空间,需要用户提供对接数据源,部分用户采用商业付费的形式从第三方获取了书目扩展信息数据和服务,主要使用的是联图(libtop)公司的XOPAC,可以在opac系统中显示图书封面、作者简介、摘要、目录、Tag标签、网络书评等内容。

3 结束语

在OPAC中实现书目扩展信息服务,在技术上难度不大,主要的困难依然是数据源。如果图书馆进行单独的开发不太现实,需要投入大量的人力财力,而且很多图书馆在没有这个能力。所以依靠OPAC系统自身实现,或借助第三方服务商实现都是不错的途径。但现在的书目扩展信息服务还比较混乱,一方面获取到的数据不规范,不同的数据来源内容也不一样;另一方面由于很多OPAC系统没有开放的接口,从第三方获取的服务与OPAC对接比较麻烦,致使很多前端用户接口显示杂乱不友好。所以,为了能在OPAC中提供良好的书目扩展信息服务,制定一个关于元数据和API接口的标准规范是非常有必要的。

参考文献:

[1] 乔欢,刘漫,陈志新. OPAC历史沿革及其发展趋势[J]. 国家图书馆学刊, 2006 (4): 5-9.

[2] 王海英,汪其英. 国内现有主要OPAC的调查研究[J]. 农业图书情报学刊, 2011 (12): 48-53.

[3] 李田章. 基于Mashup模式的OPAC资源整合_以整合豆瓣网图书封面为例 [J]. 图书馆论坛, 2011(5): 119-121.

[4] 冯亚惠. 我国图书馆新型OPAC系统现状的调查_冯亚惠[J]. 图书馆杂志, 2010(1): 46-55.

[5] 司莉,陈新元. 我国高校图书馆OPAC系统的功能_省略_校排名30强图书馆的OPAC为例_司莉[J]. 现代图书情报技术, 2009(Z1): 28-32.

[6] 周虹,张蓓,窦天芳,等. 清华大学图书馆OPAC书封服务的设计与实现_周虹[J]. 现代图书情报技术, 2008(8): 84-87.

[7] 雷艳,杨静海. 简述CNMARC与UNIMARC的不同之处_雷艳[J]. 图书情报工作, 1993(6): 38-39+64.