新一代OPAC的实现及相关开源软件的应用

2011-05-03 08:31:38陈艳周馨

图书馆学刊 2011年3期

陈艳周馨

（上海大学图书馆，上海 200444）

1 引言

Web2.0概念的出现及其强调用户体验和社会性的特点给图书馆界带来了全新的思考。越来越多的图书馆希望运用Web2.0技术和理念来提高服务并吸引用户。OPAC（Online Public Access Catalogue）作为图书馆资源与用户交互的前沿，同时也是Web2.0在图书馆实践与应用的前沿，其中不乏具有Web2.0元素的应用，诸如分类浏览、搜索建议、检索词纠错及相关搜索推荐、RSS订阅、用户评论评级、添加标签等。但具有Web2.0元素的OPAC是否就是新一代OPAC，新一代OPAC有何发展趋势，图书馆如何实现新一代OPAC，以及开源软件在其中又扮演了什么样的角色？这是目前对于新一代OPAC的研究仍未完全解决的问题。

图1 研究型图书馆OPAC的复兴之策

2 OPAC的发展趋势

2006年3月，康奈尔大学的Karen Calhoun受美国国会图书馆委托，发布了一份题为《改变目录性质、与其他发现工具集成》的研究报告[1]。在这份研究报告中，Karen以研究型图书馆的目录为研究对象对OPAC的现状及未来发展进行了分析，并认为OPAC已经到了生命周期的尽头。根据Theodore Levitt的产品生命周期论，Karen从用户与应用两个方面出发提出了OPAC的复兴之策（见图1）。

①针对现有用户推广现有应用，如略微强化现有目录。

②针对现有用户开发新应用，如电子期刊导航、主题导航、输出到书目管理软件。

③为现有应用寻找新用户，如新生教育、将图书馆的数据推送到学校和课程站点的入口。

④寻找新应用与新用户，如大规模数字化、与其他系统大范围集成、扩大访问。

由图1可以看出，虽然Web2.0为新一代OPAC提供了许多新理念和新技术，但是新一代OPAC不应该只是各种新技术和应用的简单堆砌，更多的应该借鉴Web2.0以用户为中心的理念，从用户需求出发，着重考虑易用性、交互性、个性化等特点，并将可检索资源范围扩展到数字资源乃至图书馆之外。

2.1 强化OPAC的检索功能，加大图书的揭示深度

调查研究显示，相当多的用户包括学生、教师及专业人员查找资料时最先想到的信息源是公共搜索引擎，如Google等，而非OPAC或者图书馆购买的商业电子资源[2-3]。究其主要原因是公共搜索引擎带给用户良好的搜索体验和强大的检索功能。尽管面临着搜索引擎和网上书店等成功网络服务带来的巨大挑战，图书馆现有OPAC仍然具有显著而独特的资源优势，这些信息都是经过专业人员筛选和组织的。OPAC完全可以借鉴这些搜索引擎和网上书店的成功经验，加强OPAC的浏览检索功能，建立健全检索结果的排序机制，将本馆书目数据与谷歌、亚马逊、豆瓣等网站中相关图书的诸如封面、简介、内容评论、用户评论等信息相结合，更加深入地揭示图书内容、形态、受关注程度等。

2.2 提升OPAC的社会性，增加用户的参与和体验

Web2.0的核心是以用户为中心，想用户所想，鼓励用户参与，充分调动用户的积极性和热情，构建交互式的用户环境。Tim Spalding在其博客中提出了“OPAC应该是有趣的”[4]。OPAC的有趣体现在其吸引用户参与的新应用开发上，即实现新闻聚合、博客服务、标签、用户评论、对外链接、推荐书目等社会性功能，从而提高现有用户对OPAC的依赖度和忠诚度。图书馆可以通过提供blog widgets和RSS feeds，让用户可以在自己的博客或网站上发布其正在阅读和思考的问题；在检索不到相关信息时提供更有趣味性的反馈和建议；允许用户添加图书相关链接，如链接图书的其他评论、其他载体的获得路径等；允许用户推荐相同主题的其他优秀图书；允许用户通过标签、评级和评论与馆藏目录进行交互或者彼此之间进行交流。

2.3 实现OPAC的主动推送，吸引更多的用户群体

互联网的迅猛发展和各种信息搜索工具的出现，使用户即使脱离了OPAC依然能够有效地搜索到图书信息甚至学术性期刊文献全文。如通过Google学术搜索，用户可以搜索到来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的论文、图书、摘要和文章。在此情形下，OPAC应当走出图书馆，根据用户群体的不同特征和网络利用习惯，推出个性化的用户定制界面，主动推送到用户经常造访的网络空间。诸如图书馆可以与搜索引擎公司合作，通过网络检索平台发布目录信息；浏览器工具条的应用，用户无须经由图书馆网站就能方便地利用OPAC；OPAC机器人的出现，用户只需在MSN中通过与机器人的对话就能得到检索结果。这种主动推送的方式可以吸引到更多的用户群体，从而提高OPAC现有资源的利用率。

2.4 扩大OPAC的搜索范围，提供更多元的服务方式

当前图书馆收藏的资源已由印本资源独占演变到与数字资源二分天下的局面。但是目前绝大多数OPAC的搜索范围并未涵盖到图书馆订购的多种电子资源。如何将数字资源纳入OPAC的检索体系，将印本资源和数字资源以简明、有效的方式揭示并送达给用户，是当前OPAC面临的最大挑战。此外，OPAC检索的范围还应该突破馆藏限制，扩大到网络信息、公共文化信息和其他机构的信息资源。新一代OPAC要以数据为关键核心，集成任何对用户有用的各种类型信息资源，以奠定图书馆的信息主导地位。另外，新兴手机图书馆的出现，各种媒介平台的兴起，也要求OPAC提供更加多元化的服务方式来吸引用户。

3 新一代OPAC的实现方式

OPAC一直以来被作为图书馆集成系统（Integrated Library System，简称ILS）的一部分看待，但Casey Bisson却指出这是个最基础的错误[5]。一成不变的OPAC系统已经不再符合时代发展的需要，图书馆和用户需要的是把OPAC作为一种独立于ILS的应用，能够根据用户的需求和爱好不断进行修改完善的系统。而数据库和索引技术的发展也使OPAC独立于ILS成为可能。依据OPAC的上述发展趋势，新一代OPAC的实现主要涉及来自3个方面的群体，即图书馆集成系统供应商（以下简称ILS供应商）、图书馆内部技术人员以及与图书馆具有密切联系的第三方机构团体[6]。与此相对地，新一代OPAC实现的方式也可以相应地划分为如下3种：ILS供应商的OPAC升级、利用开源软件自主实现和第三方独立于ILS的OPAC，如图2所示。

图2 新一代OPAC的3种实现方式

3.1 ILS供应商的OPAC升级

伴随着Web2.0理念的兴起及其技术的推广应用，图书馆要求对OPAC进行变革的呼声越来越高。在这种环境下，部分ILS供应商开始在其OPAC中加入2.0元素，有些厂商甚至开发出了全新的系统。这些ILS供应商以国外居多，如Innovative Interfaces公司新开发的资源搜索平台Encore，Ex Libris公司的Primo新型图书馆自动化系统等。上述OPAC都已投入使用，以Primo为例目前在全球的用户达到了61家[7]。国内江苏汇文在这方面走在了前列，率先结合Web2.0技术推出了新一代的图书馆OPAC系统，目前已有21家高校图书馆采用了汇文新版OPAC系统[8]。

这种实现方式拥有来自于商业公司的支持和服务，系统稳定性较好，容易维护，OPAC基本具备Web2.0的部分功能，而且ILS整个体系架构的前瞻性和先进性使OPAC系统更具灵活性、扩展性和跨平台性。缺点是费用较高，OPAC受MARC的限制要进行彻底变革具有较大阻碍。

3.2 利用开源软件自主实现

以Linux为代表的开放源代码运动很普及，以此为基础的各种开源软件和工具层出不穷。同时，ILS的开源趋势也推动了OPAC的开源发展，图书馆自主开发和改进OPAC系统成为可能。近年来，图书馆作为开放源代码运动的支持者，利用开源软件和工具开发了不少新一代的OPAC，其中最具代表性的当属Scriblio、SOPAC、VuFind等。基于对OPAC功能的不同认识以及所投入的精力多少，这些系统可以划分为功能增强型、外观更新型、前端替代型和ILMS替代型，功能逐渐强大，开发成本和实现难度也逐级递增[9]。

图书馆利用开源软件自主实现新一代OPAC的方式基本囊括了Web2.0所有最主要的要素。图书馆更具有主动性，可以根据用户需求随时添加新的功能，也能够做到向搜索引擎开放图书馆书目资源。缺点是需要有相应的技术人员，系统的日常维护和升级是一大瓶颈，相关技术人员的离开会导致系统的可持续运行和发展受到影响。

3.3 第三方独立于ILS的OPAC

随着图书馆越来越多的业务被外包，尤其是与OPAC有关的编目业务，以及对新一代OPAC的研究深入，图书馆开始与第三方（此处泛指除图书馆与ILS以外的其他群体）合作开发OPAC。这类OPAC的显著特点是独立于ILS，因此也被称为前端或外挂。在这种方式下，通常图书馆将其具有核心价值的书目数据交给第三方处理、发布和管理。经过第三方重组后的OPAC系统可以为用户提供更开放、更符合用户需要和使用习惯的高质量书目信息服务。这一方式的典型代表包括信息可视化的 AquaBrowser Library、Endeca、BiblioCommons等。AquaBrowser Library是美国The Library Corporation公司和荷兰Medialab Solutions BV公司联合推出的图书馆目录查询可视化系统[10]，是目前用户群最大、影响最大的第三方研发的OPAC。图书馆只需将其馆藏书目数据交给该公司重建索引后，便可使用其定制的OPAC。

从整体考虑，这一方式比较中庸，既具备了Web2.0和新一代OPAC的要素，又有商业公司的支持和服务，且费用相对低廉。购买独立于ILS的OPAC外挂，图书馆只需将馆藏书目数据提供给系统商，由其提供书目数据处理与检索服务，减轻图书馆在人力资源和管理方面的负担。但和其他新一代OPAC相比，用户的参与程度还不够，如缺乏用户评论、添加标签等功能。

4 开源软件在新一代OPAC的应用

上述3种方式中，利用开源软件的方式因其赋予图书馆更大的自主权而深受图书馆的青睐，越来越多的图书馆已经使用或开始考虑开源软件的应用。下面对一些具有代表性的、有一定实际应用的开源软件进行分析。

4.1 Scriblio（原名为 WPopac）

Scriblio[11]是美国马塞诸塞州普利茅斯州立大学信息技术工程师Casey Bisson于2006年试验性开发的基于Web2.0的新一代图书馆OPAC系统软件，并于当年在该大学的Lamson图书馆投入试用。Scriblio原名为WPopac，其核心模块为WordPress平台、OpenSearch搜索引擎和 Amazon提供的OpenGL API，支持SRW/SRU协议。Scriblio是一个建立在博客平台上的OPAC，它将每条书目信息变为一个博客页面供用户浏览，这样外部搜索引擎可搜索到书目信息。每个博客页面具有评论和引用功能，使得用户对书目信息可自由添加评论并与图书馆展开互动。同时，Scriblio向用户提供博客标签和书签，提供新书的书目信息RSS订阅。Scriblio保留了WordPress丰富的API应用和主题结构，因此拥有该博客平台所有用户以及软件设计人员、开发人员和管理人员的参与和支持。这正是使用流行的开源软件作为OPAC前端基础结构的好处之一，可以获取丰富的社区知识。目前有Lamson图书馆和香港科技大学图书馆等5家机构在使用Scriblio。

4.2 SOPAC

SOPAC[12]最初在Ann Arbor District Library开发并实现，是“Social OPAC”的简称，基本上是将一系列社会性网络工具整合到AADL的目录之中，提供丰富的内容信息链接、OPAC检索结果的RSS订阅、用户可以标注卡片目录以及对馆藏进行评级、标签、评论、回复评论等。SOPAC使用开源的Drupal内容管理系统作为结构，可适用于各种图书馆集成系统，侧重于加强OPAC的社会性功能。

首先，用户的书目检索请求被发送到Drupal，该软件再将用户请求转换成相应格式发送至图书馆集成管理系统，收到图书馆集成管理系统的回应后，Drupal对其进行处理得到题名、作者、主题、借阅信息等关键字段，并将这些信息与存储在Drupal中的其他信息（诸如评级、标签、评论、封面等）组合在一起，生成一个新网页发送至用户的浏览器。

4.3 VuFind

VuFind是Villanova University图书馆的工作人员为本馆设计开发的资源门户，其目的是替代传统OPAC，成为检索、浏览图书馆所有数据资源的一站式图书馆资源门户，获2008年梅隆奖[13]。早在2008年8月该馆正式应用该软件以前，已经有包括澳大利亚国家图书馆在内的两家图书馆率先采用VuFind作为其新一代OPAC，目前VuFind是图书馆界应用较多的开源OPAC之一。VuFind基于Apache Solr，完全实现了模块化运行，可独立于图书馆管理系统。检索资源包括书目记录、数字图书馆条目、机构存储、机构书目和其他图书馆的收藏。作为VuFind核心部分的Apache Solr是一种基于Lucene可供企业使用的搜索服务器。这种Lucene/Solr组合在开源OPAC设计中比较受到青睐，诸如Blacklight等都适用这种模式，甚至一些商业性厂商的产品也采用这种组合，比如Ex Libris公司的Primo。

4.4 Endeca

最初构思OPAC前端独立于ILMS并付诸实施的是北卡州立大学图书馆的工作人员，他们早在2006年1月就推出了Endeca OPAC的实际应用。这个系统以商业性软件Endeca作为关键词检索的搜索引擎，检索界面则由图书馆工作人员以Java开发而成，负责向Endeca的后端HTTP服务——MDEX引擎发送请求，并显示返回的检索结果。该OPAC能够应用到不同的图书馆集成管理系统中，开创了OPAC与ILMS分离应用的先例，并且首次推出了检索结果相关性排序、关键词检索之外的多途径浏览帮助。根据其开发主创Andrew Pace[14]的说法，Endeca IAP是第一个真正具有下一代OPAC特征的图书馆目录系统。不管这种说法是否属实，Endeca应用的确启发了后来的开源OPAC开发，为OPAC的创新发展提供了灵感。Endeca应用的OPAC模式基本奠定了新一代OPAC的基本结构，分面组配浏览几乎成为所有开源OPAC的开发重点。从这一点来看，其功不可没。

5 结语

在当前Web技术不断推陈出新的环境下，OPAC的革新并向新一代OPAC发展是必然趋势。正如文中所述，新一代OPAC实现的3种方式各有利弊。在3种方式中，开源OPAC软件是一个不断发展更新的领域。图书馆应从自身实际出发，深入研究用户需求，选择最适合本馆的实现方式，为用户提供最佳的服务。

[1] Karen Calhoun.The Changing Nature of the Catalog and its Integration with Other Discovery Tools[EB/OL].[2010-05-19].http://www.loc.gov/catdir/calhoun-report-final.pdf.

[2] OCLC.The 2003 OCLC Environmental Scan:Pattern Recognition[EB/OL].[2010-04-09].http://www.oclc.org/membership/escan/default.htm.

[3] OCLC．College students'perceptions of libraries and information resources[M]．Ohio:OCLC Online Computer Library Center，2005：1-11.

[4] Tim Spalding.Is your 0PAC fun?[EB/OL].[2010-04-05].http://www.librarything.com/blogs/thin gology/2006/12/isyour-opac-fun-a-manifesto-of-sorts/.

[5]Levine J.Library 2.0 in the RealWorld[EB/OL].[2010-05-15].http://www.alatechsource.org/blog/2006/01/library-20-in-the-real-world.html.

[6] 王海英，汪其英，张晓苗.图书馆升级OPAC的三种途径及其比较[J].情报杂志，2010（7）：166-168.

[7]Marshall Breeding.Library Technology Guides——Key resources in the field of Library Automation[EB/OL].[2009-12-25].http://www.librarytechnology.org/index.pl.

[8] 冯亚惠.我国图书馆新型OPAC系统现状的调查[J].图书馆杂志，2010（1）：46-55.

[9] Murray P E．Links to OPAC enhancements，wrappers，and replacements．[2010-03-30]．http://dltj.org/article/nisodiscovery-presentation-links/.

[10] Medialab Solutions.Amsterdam Redefines the library[EB/OL].[2010-08-16].http://www.librarytechnology.org/ltgdisplaytext.pl?RC=12460.

[11] About Scriblio[EB/OL].[2009-12-28].http://about.scriblio.net/.

[12] Blyberg J．AADL.org goes socia1[EB/OL].2007-01-21.[2010-03-10].http://www.blyberg.net/2007/01/21/aadlorggoes-social/.

[13] Houser J.The VuFind implementation at Villanova University[J].Library Hi Tech,2009（1）：93-105.

[14]Antalman K，Lynema E，Pace A K.Toward a twenty-first century library catalog[J].Information Technology and Libraries,2006（9）：129-138.