□朱本军 聂 华
下一代图书馆界面(the Next Generation Library Catalog)是一种一站式发现图书馆资源并可直接获取电子全文的工具。目前,国际上已经出现了一些比较成熟的下一代图书馆界面的相关产品:商业产品如 AquaBrowser、Encore、Endeca、Primo、Worldcat Local和 Polaris Library System 等,开源产品如Scriblio和Vufind。2008年以来,我国高校图书馆陆续开始关注和实施下一代图书馆界面。目前,国内应用下一代图书馆界面的至少有两家:一是使用Ex Libris公司的产品Primo的上海交通大学图书馆,二是使用Innovative公司的产品 Encore的华东师范大学图书馆。还有一些高校图书馆在开源产品方面进行试验并取得了一定成果,比如香港科技大学图书馆[1]和北京大学图书馆。
本文基于对下一代图书馆界面的发展回顾,以北京大学图书馆试验、部署和测试下一代图书馆界面产品为例,总结和分享图书馆在部署下一代图书馆发现与获取界面方面的经验。
2006年以来,国内外出现了大量关于传统OPAC(注:本文提到的“传统 OPAC”指的是与图书馆自动化系统集成在一起的书目检索工具)如何落伍以及如何改进的讨论和研究,如Karen 2006年在博客“ALA TechSource”上一连发了三篇博文来探讨传统OPAC的问题及其在功能上可能的改进[2][3][4],Marshall 2007年对图书馆下一代OPAC也进行了全面总结与思考[5]等。早期对传统OPAC的批评和讨论主要集中在界面不友好、检索功能差等方面,以及如何在这些方面进行改进。
应该说,图书馆对传统OPAC的不满和批评,源于图书馆自身不断的发展和变化:图书馆资源结构从以纸本为主到以纸质和电子资源并重,甚至以电子资源为主;资源揭示范围从ILS书目信息扩展到二次文献数据库、本馆数字特藏和丰富的电子全文;资源处理平台从单一的联机编目模块扩充到多元的、独立的特藏资源管理与检索平台,如学位论文管理系统、古文献资源系统等;服务对象从普通人群扩展到习惯和精通网络的用户,等等。在 ILS系统的设计理念的框架下,即使对传统OPAC进行功能和界面方面的不断改进,仍然无法满足图书馆的资源发展和服务需求。
“下一代图书馆界面”概念的首次提出和完整阐释,是在2007年美国图书馆协会(American Library Association)的一份报告中[6]。报告的术语部分对“下一代”进行了阐释,指出“下一代”并不是一种在将来才会出现的图书馆资源检索和获取工具,采用“下一代”主要是为避免在叙述时与传统OPAC相混淆。该报告对已经广泛应用于图书馆领域的5个下一代产品(AquaBrowser、Endeca、Encore、Primo 和 WorldCat Local)的特点与功能进行了深入研究和分析总结。从该报告的分析中可以看出,下一代图书馆界面产品的发展有两条路径:一是图书馆系统软件商在捕捉到图书馆发展趋势与需求之后,设计开发的资源检索和揭示产品 ,如Primo、Encore 、WorldCat Local等 ;二是将其他领域的资源检索和揭示产品引入到图书馆,如Endeca,其早期产品并非专门为图书馆设计开发,而是一个功能强大、丰富的搜索引擎,广泛应用于沃尔玛、波音、思科等企业的网站,后来由北卡罗莱纳州立大学首先将其应用于图书馆书目查询。
最近几年,ILS系统软件商根据图书馆的需求,致力于改进传统OPAC。使OPAC在界面和功能方面发生了很大变化,如Ex Libris公司ILS产品Aleph 500自带的OPAC工具Web OPAC、Innovative公司 ILS产品Mellinum自带的 OPAC工具WebPAC Pro、VTLS公司 ILS产品Virtua自带的OPAC工具Iportal、SirsiDynix公司 ILS产品 Symphony自带的 OPAC工具 Ilink或 Elibrary等。通过对传统OPAC改进后的产品与下一代图书馆界面产品进行比较,可发现二者在用户界面和部分功能上逐渐趋于一致,如:
·界面可定制:图书馆可根据自己的偏好定制检索框,既可定制为简洁如Google搜索界面的风格,进行关键词检索;也可定制为类似传统 OPAC高级检索的风格,进行关键词组配检索。同时,还可以对结果集页面进行内容增强方面的定制。
·排序功能:可对结果集按题名、著者、出版日期,甚至相关度进行排序,将匹配程度高的记录放在结果集最前面。
·内容增强:记录信息不再仅限于MARC记录涵盖的范围,而可从不同的资源和服务提供商获取封面、目次、简介、书评等增强内容。
·注重个性化与社会化网络功能:终端用户可以管理个人借阅信息,同时还增加了用户评分、书评功能,鼓励用户参与。
·应用web2.0相关技术和理念:如利用 Ajax技术,读者可以评分;利用 Mashup混搭技术,将来源不同的封面、目次等信息与MARC记录信息整合在一起。
随着新技术的不断应用,在可预见的将来,改进后的传统OPAC,在界面和某些功能方面完全有可能与下一代图书馆界面产品趋于一致,除了前文提到的功能外,还有检索结果聚类(result clustering)、分面导航(facet navigation)、拼写检查和标签云等。
尽管改进后的OPAC与下一代图书馆界面在新技术应用方面殊途同归,但并不意味着传统ILS系统的OPAC模块仍然满足图书馆资源和服务发展的需求。下一代图书馆界面的设计理念和目标并不仅仅局限于对传统OPAC的界面和功能进行改进与完善,而在于能够更好地适应图书馆资源和服务的扩展,以及用户习惯的变化,图书馆下一代界面的很多功能和特点是改进后的传统OPAC所无法替代的,如以下几个方面。
·检索范围的扩展
传统OPAC的显著特点之一是被设计为图书馆自动化集成系统的一个子系统,与自动化系统的采访、编目、流通等子系统高度集成,密不可分。所检索的资源范围为已著录的书目信息,通常仅针对印刷型资源。ILS系统针对印刷型资源设计,采用严谨而繁琐的MARC格式进行著录,无法有效而灵活地针对自建的古籍、学位论文、音视频、图片等特藏资源以及订购的商业电子资源进行著录和管理。下一代图书馆界面最重要的功能就是将分布于各个异构系统的数据整合在一起,将检索范围从传统的印刷型图书期刊的书目信息,扩大到图书馆自建特藏资源。并进一步通过对统一检索引擎的调用,扩大到对商业电子资源的整合揭示,这一点将在后文中详细介绍。
·引导发现
通过关键词检索,将检索结果以相关度排序的方式进行揭示,精确定位到所需资源的书目信息,这是OPAC的基本功能之一。
下一代图书馆界面的重要特点之一是在相关度的基础上提供检索结果的聚类和分面导航,及其他一些导览项,特别是链接到外部资源的URL链接地址,引导读者从一个资源发现其他有价值的、新的相关资源,比如通过扩展或者缩小检索范围引导检索,以及通过“读过这本书的读者还读过……”等方式进行推介等。
·整合检索与全文获取
下一代图书馆界面产品的核心设计观念之一是能够对图书馆订购的电子资源进行跨库联邦检索,并在检索定位结果的同时直接获得电子全文。
在下一代图书馆检索界面问世之前,图书馆一般是经由一个独立的界面通过元搜索的方式进行商业数据库的跨库检索。下一代图书馆界面试图在检索图书馆本地馆藏的元数据信息的同时,将商业数据库资源也集成进来,通过对资源调度产品的调用,实现直接的全文获取功能。例如,Primo产品通过集成Metalib(一款基于元搜索技术的跨库检索产品)和SFX(一款用于解析链接以获取电子全文的产品)达到整合检索并直接获取全文的目的,Encore产品通过集成Search Pro(基于元搜索技术的跨库检索产品)和Pathfinder Pro(用于解析链接以获取电子全文的产品)以达到整合检索并直接获取全文的目的[7][8]。
通过对下一代图书馆界面开源软件Scriblio和Vufind,以及数个商业产品的考察和调研,可以总结出下一代图书馆界面产品的一般工作原理(图1),如下:
其工作流程为:
数据收割:从各个不同数据源收割数据,收割的方式可以通过导入导出的方式,也可以通过OAI协议方式。从其工作原理可知,下一代图书馆界面产品的一个重要的设计考虑,即数据来源的多元化。
数据处理:对收割的数据字段进行XM L结构化处理、内容增强(如增加书封、网络摘要、书评、外部链接配置等)等操作。
索引:对处理完毕的数据库进行关键词索引,如对题名、主题词、作者、出版社等进行索引。
用户界面:用户通过一个较为简洁的界面进行检索。以Encore和Scriblio的检索结果集页面为例(如图2、3),其特点是对检索结果进行相关度排序、内容增强、结果聚类、分面导航和增加导览项等进行功能和界面的可视化设计,在精确定位资源的同时引导用户发现和探索新的资源。
图3 下一代图书馆界面开源软件Scriblio的检索结果页[1]
2008年4月以来,北京大学图书馆在部署和测试下一代图书馆界面方面进行了一系列试验[10]。从遇到的挑战和测试反馈的问题来看,图书馆在部署下一代图书馆界面时应在如下四个方面进行重点考察。
终端用户界面的设计至为关键,它直接决定用户从视觉角度感性评价界面的友好性。界面设计包括检索界面设计、结果集界面设计以及单条记录界面设计三个方面。终端用户界面设计并非简单地按照图书馆的喜好来定制是否设计为“简洁如Google搜索界面”的模式,其背后是一个庞大而复杂的资源组织与管理理念的框架,包括如何有效揭示图书馆馆藏资源、如何便捷定位到所需资源、如何引导用户发现新的资源,同时还要考虑与产品本身的功能和特性的最佳结合,以及如何在终端用户与图书馆专业人员使用习惯之间进行平衡[11]。北京大学图书馆在终端用户界面设计方面收到来自不同人员的多样化的意见和建议。另外,从上海交通大学图书馆部署下一代检索界面的经验,也可以看出设计终端用户界面的重要性[12]。
下一代图书馆界面可整合几乎所有的馆藏资源,提供一站式检索和分面导航,因此在部署时需要考虑的问题:一是是否所有已有的数据都有可能被整合?也就是能否接纳不同结构的数据;二是未来的增量数据能否被自动收割;三是对来源不同的数据是否能够进行有效的查重、合并,由于检索范围的扩大,纸本图书、电子资源之间的重复度大大提高,对所有数据作查重、合并之类的优化处理,也是一个非常重要的方面。
北京大学图书馆在试验中,尝试将古文献资源、北大名师特藏、民国报刊特藏、多媒体资源(包括北大讲座等)等数字特藏和馆藏书目数据整合在一起进行揭示。不同来源的数据格式不一:古籍数据是以古籍元数据著录规则著录的ISO2709格式数据、“北大名师”是自建的ACCESS数据库、民国报刊和多媒体资源是XML结构的数据,馆藏书目是 USMARC和CNMARC数据。在进行下一代图书馆界面的部署时,首先需要系统能够将已有的资源整合在一起,其次,要考虑各个数据系统未来的增量数据同步更新的问题。可以想见,如果全部更新都需要系统管理员手工导入导出,会增加很大工作量和工作负担。
应用系统的多样化所带来的不同系统商的系统之间的兼容一直是图书馆所面临的一个问题,在进行下一代图书馆界面产品的部署时也同样无法回避。这样,下一代图书馆界面与各异构系统之间的整合和接口处理就尤为重要。从北大图书馆部署和测试的经验来看,除了与统一认证、联邦检索等系统的整合外,与图书馆自动化集成管理系统的整合是非常关键的一环,涉及三个非常重要的方面:(1)馆藏书目数据增量的处理,即对书目数据增、删、改的同步更新;(2)馆藏实时流通信息的获取,特别是涉及到期刊合订本实时信息的获取和处理;(3)读者借阅状态信息的获取和联动,比如实时反映读者能否预约、续借等操作。
解决前面三个问题后,最后一个重要环节是在系统整合与数据同步基础上,对下一代图书馆界面产品功能特性的充分发挥。以商业产品 Primo、Encore、AquaBrouser、Endeca和 WorldCat Local为例[6],各个产品的功能特性,系统的开放性、灵活性等各有千秋,而图书馆对于产品功能和性能的认识、挖掘和应用,更是决定其应用的效率和效果的关键所在。
以上四个方面可以作为图书馆对下一代图书馆界面产品进行评估、选型和部署应用时的参考要点。
下一代图书馆界面是图书馆整合全部馆藏资源,并进行统一揭示与调度的一个非常值得关注的产品。虽然传统OPAC在界面设计和功能改进后与下一代图书馆界面有诸多相似之处,但改进后的所谓OPAC2.0远远不能替代下一代图书馆界面。下一代图书馆界面在扩展检索涵盖范围、引导发现、发现并获取等方面的创新功能使其成为值得图书馆在未来一段时间重点关注的应用系统之一。
从北京大学图书馆对下一代图书馆界面的探索与实践中发现,图书馆在下一代图书馆界面产品选型和部署中尤应注意与既有资源和系统的整合、终端用户界面设计以及本地化功能定制等方面。
1 香港科技大学图书馆试验系统.[2010-01-29].http://catalog.ust.hk/catalog/smartcat.php
2 Karen G.Schneider.How OPACs Such,Part 1:Relevance Rank(Or the Lack of It).2006-03-13.[2010-01-28].http://www.techsource.ala.org/blog/2006/03/how-opacs-suck-part-1-relevance-rank-or-the-lack-of-it.html
3 Karen G.Schneider.How OPACs Such,Part 2:T he Checklist of Shame.2006-04-03.[2010-01-28].http://www.techsource.ala.org/blog/2006/04/how-opacs-suck-part-2-the-checklist-of-shame.html
4 Karen G.Schneider.How OPACs Such,Part 3:the Big Picture.2006-05-20.[2010-01-28].http://www.alatechsource.org/blog/2006/05/how-opacs-suck-part-3-the-big-picture.html
5 Marshall Breeding.Thinking About Your Nex t OPAC.Computers in Libraries,2007(4)
6 Marshall Breeding.Next-Generation Library Catalogs.ALA T echSource,July 2007
7 Innovative公司网址.[2010-2-6].http://www.iii.com/products/discovery.shtml
8 Ex Libris公司网址.[2010-2-6].http://www.exlibris.com.cn/index.asp
9 Encore产品香港中文大学图书馆访问地址.[2010-1-29].http://www.lib.cuhk.edu.hk/,
10 朱本军,聂华.利用开源软件Scriblio搭建下一代图书馆界面低成本实现一站式全文检索.中国网络教育,2009(12):56-57
11 Online Catalogs:What Users and Librarians Want.An OCLC Report:2009.Published:OCLC Online Computer Library Center,Inc.[2010-01-29].http://www.oclc.org/us/en/reports/onlinecatalog s/fullreport.pdf
12 潘卫.Primo实施与应用.2009年11月17日 Ex Libris公司大中华区年会发言