王 元,汤罡辉
(中山大学图书馆,广东 广州 510275)
随着数字资源产业的发展,让图书馆引进了不少数字资源数据库,少则几十种,多则上百种。读者面对如此众多的数据库资源有一种眼花缭乱的感觉,不知道在哪些数据库中才能找到自己需要的资源。而且各个数据库数字资源描述和表达方式的不同,导致其检索途径和方法的不同,再加上使用不同的检索软件而造成的数据库检索接口不同,风格迥异,同样的查询题目,读者需频繁登录与退出各个数据库,在不同的数据系统中重复输入检索词,重复查找。在这个过程中,读者需要根据自己查找内容的学科方向,选择涵盖该主题的数据库,选择后,还要逐个熟悉各个数据库的用户界面和检索规则等。这些无疑都会增加读者检索的时间,降低了其检索效率。跨库检索技术的出现和发展则是解决这个问题的有效方法。它向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式,并发的检索本地和互联网上的多个分布式异构数据库,并对检索结果加以整合,在经过去重和排序以后,以统一格式将结果呈现给用户,而且这一过程用户只需要以单一身份、单次登录和单一的检索方式就可以实现。
目前跨库检索系统的种类可依两个角度进行划分:(1)按可检索的数据库类型,分为目录型跨库检索系统、文摘型跨库检索系统、全文型跨库检索系统以及混合型跨库检索系统。目录型跨库检索主要是以互联网上不同操作平台、不同自动化系统的图书馆OPAC为检索对象。比如中国人民大学图书馆的书目整合检索系统、上海交通大学图书馆的多节点数据库检索、台湾图书馆Z39.50联合目录、汇文系统的一站式检索等。文摘型跨库检索系统则以ISI Web of Knowledge为代表,主要检索的数据库类型是文摘型数据库。全文型的跨库检索系统则比较多,目前市场出现的大多数产品都属于此类。国外的产品有webFeat公司的WebFeat,Fretwell Downing公司的Zortal,Ex Libris公司的Metalib,CoperniC公司的Aggregator,Endeabor公司的ENCompass等,国内则有清华同方(USP)、重庆维普、南京优康、浙江天宇、北京拓尔思(TRS)、Calis、中科院文献情报中心等单位研发的相应产品。混合型则是指检索的对象包括目录、文摘、全文等在内的各种类型信息。目前,大多数跨库检索系统都在向这种类型过渡。(2)按系统开发者的角度,可分为图书馆自行研发的跨库检索系统和商业公司研发的跨库检索系统。图书馆自行研发的跨库检索系统有上面所提到的基于Z39.50的OPAC跨库检索系统,其他则有美国新墨西哥州洛斯阿拉莫斯国家实验室研究图书馆的FlashPoint、美国加利福尼亚大学为其数字图书馆项目开发的SearchLight、美国国立医学图书馆下属的李斯特希尔国立生物医学交流中心研发的NLM Gateway、西安交通大学、华中科技大学的跨库检索系统、中科院文献情报中心的Crosssearch等。但并不是所有的图书馆都有足够的技术力量和精力来开发自己的跨库检索系统,而且各馆采购的数据库很大一部分都是相同的,因此,这就给商业公司开发跨库检索系统提供了机会。开发商只要在其产品中集成了各馆使用比较普遍的数据库资源,就可以满足绝大多数图书馆的需要。图书馆只要付钱就可以使用这些现成的产品。这类产品非常多,上面提到的Metalib、ENCompass、TRS、USP、OCLC Researeh的OCLC Sitesearch等都属于这一类。笔者拟介绍的荷兰SwetsWise期刊跨库统一检索平台,则属于商业公司研发的混合型跨库检索系统,而且是专业跨库检索期刊的国际化平台,有一定的代表性,目前还未见其相关介绍,为此下文作初步评介。对图书馆选择夸库检索平台或改进现有的检索系统也具有现实的参考意义。
纵观近年来的跨库统一检索平台的发展现状,笔者认为跨库系统设计时不能盲目的追求“大而全”目标。一方面是资源类型有其特别之处,例如,一、二、三次文献具有不同的使用目的,图书、期刊有其不同的出版方式,专利、标准、图书、普通网页都有不同表达需求及格式。检索时,囊括其内再由读者加以区别,不利于不同类型读者对特定需求信息的直接获取。另外一方面是全文搜索方式已有Google、百度等商业公司发展,这种基于全文,深入到字词层面的检索方式,可作为资源检索的辅助方式,没必要发展雷同检索平台。中科院文献情报中心的跨库检索系统曾追求跨库检索所有购买的资源,意图“一站式”达到。但从“实验”结果来看,是不理想的。之后,其采取与Google公司合作开发了基于全文的“E划通”检索软件,然后在图书馆网页布局再回归理性,按照图书馆读者查检资料的习惯,给予提供一站式的“查找期刊”、“查找图书”、“查找电子期刊”等入口。
由于知识资源的产生方式、流通发行方式、知识内容的时效性都有不同之处,而且时至今日,这种有区别的出版模式依然没有改变,图书出版社不会把期刊挪来编辑出版,期刊编辑社也不会把期刊积压成单行本一年仅发行一次。在图书馆里,也需要把资料按照一定的划分标准分别存储管理。信息检索实现了曾不可思议的全文检索后,也要考虑到资源是不断膨胀发展的,一个大筐,什么都往里装,再统一检索,罗列出一大堆信息,并不是最理想的“一站式”检索。SwetsWise期刊跨库统一检索平台作为专业的期刊检索工具,应在盲目追求大跨库检索系统背景下,显示出其独特的优势。
目前世界上每年出版的期刊约有25万种左右,专门收录期刊的目录工具有乌利希期刊指南、国际期刊代理商SWETSWISE、EBSCO以及各个国家内的期刊代理公司商业目录;图书馆为实现资源共享,也制作有国家级、地方级的期刊联合目录,如中科院图书馆组织的全国期刊联合目录。但从收藏期刊书目的数量来看,Swetswise是首屈一指的,其收录超过300,000种以上期刊目录,且随时新增扩充。数据更新比较高效,方便用户查检最新且确定性的期刊出版发行信息。据笔者了解,CALIS期刊统一检索平台所使用的数据源也是从Swetswise引进并加以选择使用。
2.2.1 内容检索
其检索工具条的“内容检索”选项,是供读者检索浏览文章与期刊的检入点。有5种方式检索或浏览全文:(1)按文章检索。(2)按期刊名称进行检索或浏览。(3)按专业分类检索或浏览期刊清单。(4)按数据库清单检索或浏览。(5)按出版社检索。
2.2.2 文章检索
在文章检索选项下,用户可选择采用基本与高级两种检索方式。在基本文章检索选项,读者可在以下几个字段中执行一个关键词检索:文章篇名、文章摘要、作者定义之关键词、作者或者全部字段。同时用户可将检索范围限制为:(1)图书馆订购的所有期刊清单。(2)图书馆订购的期刊目次清单。(3)图书馆订购的所有全文期刊清单。(4)所有新的订阅期刊。(5)我的期刊收藏清单(需要预先设置)。(6)院(系、所)部门期刊收藏清单(需要预先设置)。(7)图书馆有做馆藏注记的期刊清单。(8)可经由单篇文献付费订购的全文期刊清单。
用户可以把经常检索的某一特定范围、年代、主题类别或是期刊等条件组合储存起来,方便下一次检索使用。比如用户按照喜好填写想要储存的检索条件,点选“储存设定的条件”即可。所有可下拉选项字段的标准都将储存起来,当用户下次欲使用该设定时,只需要点选“使用设定的标准”键。用户完成关键词与选择好设定条件后,点选“检索”键,即会列出检索结果。基本文章检索最多只会列出100条检索结果,若要浏览更多的检索结果,可以在高级文献检索中再做设定。
在高级检索下提供以下几项新增的检索字段:ISSN、刊名与出版社。除此之外,用户还可以设定检索结果的排列顺序及设定检索结果条数。与基本检索一样,读者也可限制在特定组合条件的检索范围,例如:期刊、主题类别与年代,甚至使用某些检索符号。
2.2.3 检索结果
设定好检索条件与点选执行检索后,会连结至检索结果。在检索结果画面最上方首先会先列出该次检索下的检索条件,在此用户可以点选“新增为最新专题选粹服务”将该检索设定为“最新专题选粹服务”,或是回到检索画面执行另一项新的检索。接着画面将显示出此次检索总共检索了多少篇文章及符合检索条件结果之条数;而检索结果可依“关联性”或是“年份”排序,如果没有设定,则系统预设是以“关联性”排序,最有关联的文章会排列在清单的第一位。在检索结果中只要是符合检索条件者都会以红色显示,每笔检索结果都包含了文章篇名、连接到“期刊目次”、摘要与全文、基本数据书目。此外可以点选“期刊目次”连结至该卷期的期刊目次画面,点选“摘要”看该篇文章摘要,点选“全文”看该篇文章的全文,或是点选 “新增至检索结果储存档”将此检索结果储存在filing cabinet中,或者以“文件传递”或是“单篇文献付费”方式订购该篇全文。如果图书馆另外订购其它全文检索数据库,也可以经由(Open URL)做数据库链接,读者可以再链接至其它数据库进行其它的检索。
2.2.4 期刊检索
在每笔电子期刊前都会标示该期刊可被浏览层级(包括TOC,abstract或full text),系统在画面的左方以V或是X做为层级标示,经由此层级标示,读者可以知道那些电子期刊是为自己图书馆订购。不同标示的意义会解释在每个显示画面的下方,四种层级标示分别有以下几种解释:A、图书馆有订购,因此可以用在检索。B、SwetsWise收录的期刊,但图书馆并未订购该电子期刊,因此不能检索。C、图书馆有订购,可以检索,但浏览仍在设定中。D、指该期刊并没有提供该数据型态,如果图书馆有进行馆藏注记(holdings information)动作,该馆藏注记会出现在该笔电子期刊下方。
新增期刊目次通告(TOC Alert)可在期刊检索下找出感兴趣的期刊,然后在期刊卷期清单画面点选“新增为期刊目次通告”(add as TOC alert)键,用户将被带到新增期刊目次通告画面(add TOC alert),进行相关的设置。
2.2.5 其他检索方式
例如专业分类检索(SubjectSearch)是透过主题检索的另一检索期刊方式。数据库检索画面允许读者检索并浏览图书馆购买的数据库,并支持浏览某一数据库清单。每个数据库可链接内容的层级不同,有些数据库只有目次信息、摘要信息,有的可能提供文章的全文。出版社检索范围仅包括在“SwetsWise电子全文检索系统”(SwetsWise Online Content)所拥有的期刊之出版社。读者也可由出版社清单浏览期刊全文,点选导引选单(navigation menu)上的“出版社检索”链接至出版社清单。读者可点选欲检索的出版社名称,就会进入到该出版社在SwetsWise的所有期刊清单画面。
以上罗列的检索方式,基本能满足常规检索的要求,并一次性的跨库检索到不同期刊出版社的数据库平台,对所要查找的资料也同步获取其馆藏信息。
众所周知,期刊的出版周期一般有规则与不规则之别,出版顺序号的标识符号体系包括年份、卷期、总期数、当年期数、月份等等,出版时间、发行时差都没有绝对的标准,这些因素导致图书馆员在查核是否刊物到齐、是否需要催缺时深感困扰,同时,当馆员服务读者时,也不能给读者明确的答复。但SwetsWise在这个节点上,具有独到的优势,提供了出版信息的列表,这不仅解决了图书馆的查核需求,也便于读者了解出版动态,便于读者了解图书馆的工作进度、效率。
每个图书馆都有自己的一套自动化管理系统,如何兼容之,使读者的检索循着原来的轨迹就能扩展检索内容,这是跨库检索数据商目前推出的新功能,例如:豆瓣、超星数字图书馆、CNKI、百度图书、WorldCat都提供了这类服务,SwetsWise检索系统也不例外。例如,与现有系统兼容后,让读者使用本馆自动化系统查找资料时,就能一并使用到SwetsWise的检索功能及检索结果。
在检索设计的流程上,充分整合了图书馆员及个体读者对期刊资源管理的个性化需求。在资源载体类型上,实现了纸本及电子载体的无缝链接统一检索。使读者站在全球期刊资源高度上,有针对性地一站式检索这一类资源。在书目数据维护上,也真正实现“一劳永逸”,让图书馆、读者共享其书目资源,避免重复劳动。尤其是电子期刊资源的著录,以往困扰图书馆的统一资源定位字段问题,得到实质性的解决。不用担心URL地址的变更,造成高额维护成本,所有的电子期刊资源在SwetsWise平台都能准确链接。
跨库检索实现的前提是要清楚了解各种数据库的结构、设计方法等基本情况,然而,数据库商出于各自的商业利益和数据安全的需要,几乎都不愿意将这些基本情况公开给其他跨库检索系统的研制者,相反不断想法设法将检索语句进行加密,或者通过Session进行用户识别,因此跨库检索系统整合的资源是有限的。但期刊库的整合,由于纸本及电子期刊采用的标准都基本相同,使SwetsWise在期刊这块有限的领域获得无限发展的整合能力。而且其检索界面也设计的比较简洁、实用,与其专业期刊跨库检索的性质相互映衬。
跨库检索要通过“中间件”将检索请求“翻译”成各个数据库的检索语句,然后再获取各数据库的检索结果,当检索系统兼容的数据库种类和数量非常大的时候,这就必然造成检索效率的低下,用户需要等待较长时间。例如,中科院文献情报中心原自制的跨库检索系统基本是华而不实用。而SwetsWise在期刊篇名目次(TOC)层次上有自己的一套数据,检索仅是跨越期刊全文与TOC,使其检索效率比较高。
目前,很多跨库检索系统还不能对获取的数据进行合并、去重等操作,这实际虽然减少了读者查检各数据库的重复登录和查检的时间,但是却把更多地信息进行了罗列,加重了读者鉴别的负担。而SwetsWise的期刊数据库资料兼有订购目录功能,自动去除了冗余信息。
商业公司研发的跨库检索系统一般由软件开发商以成品形式提供,在交付图书馆使用之前,软件开发商已经将该系统能够检索的数据库做了配置。图书馆购买后,不需要繁琐的配置就可以直接使用,对于没有被配置的数据库,图书馆不能对其进行扩充,而且系统提供的各项功能,图书馆也不能在其基础上继续开发,也不利于图书馆仿照研发。目前,各软件商开发的跨库检索产品大多数都属于这种类型。除了这个通用问题外,目前的SwetsWise期刊跨库统一检索平台还存在一些其他问题,例如检索期刊时,我们通常有意识的期待查全,也要查准。虽然SwetsWise本着商业利益,会尽力维护好书目数据库,但数据量繁多,期刊出版不规则,变动多,维护有一定的滞后性,对著录标准的理解与图书馆员有微小区别,这些问题都会导致图书馆员、读者在使用其检索平台时,发现有歧义的数据。例如,某期刊更换了出版社,但又隶属于某个出版集团,且其电子资源平台的维护是外包的,这就给出版社、电子资源角度检索带来困扰。又如,期刊的标准号ISSN与刊名不同步变更时,会降低检索查准率。但这些问题都不是特别重要的,只是使用过程中会因此发现期刊出版发行的复杂性与数据维护的困难。
该数据库商的期刊书目数据丰富,但没有提供基于ISO2709标准、Z39.50数据传输协议的服务。这是美中不足的问题。而乌利希期刊数据库商则提供了Z39.50的检索服务内容,很值得SwetsWise效仿。使其原本具有的书目数据资源在功能上得到进一步挖掘。在数据资源的语种上,局限于英语为主,尤其是不能覆盖中文语种期刊,这也是其所谓国际级别的软肋。作为商业公司开发的期刊检索统一平台,必然以赢利为目的,对经费不充裕的个体图书馆而言,若要购买还有一定的经济负担,仅仅是适合大型图书馆及图书馆联盟组织引进使用。
[1]何显华.数字图书馆中跨库检索系统研究[D].2007年兰州大学计算机应用技术硕士论文.
[2]Swetswise Title Bank期刊导航平台[EB/OL].www.swetswise.com.cn/direct.do.
[3]张云秋.国内外跨库检索系统功能的比较研究[J].图书情报工作,2006,(8).