资源发现服务:图书馆服务与研究的新视角

2013-11-15 18:09郑丽君
图书与情报 2013年3期
关键词:检索图书馆资源

郑丽君

(华南农业大学图书馆 广东广州 510640)

随着信息数据的网络化、数字化的发展及信息搜索引擎技术的快速发展,图书馆文献信息资源的组成形式、类型和数量都发生了极大的变化,这些发展与变化为读者的多途径、多空间获得与发现所需的信息资源提供了方便与可能。然而,丰富多样的资源在满足读者需求的同时,却也因为不同的信息资源在组织结构、资源分布和访问方式等方面的差异,给读者的资源利用带来了极大的不便。图书馆也一直通过利用技术,如建设门户网站与数据库、提供OPAC检索与全文链接等,来努力实现对数字资源的最大程度整合,但这些以通过资源名称检索和链接来揭示资源存在的服务并不能满足用户的需求,使得用户在社会信息活动中需要信息资源时想到的信息获取途径往往是利用谷歌、百度、搜狐等一站式搜索引擎和Google Scholar、SCIRUS、INFOMINE 等学术搜索引擎,使得图书馆处于一个非常尴尬的境地,也使得不少商家看到了其中存在的巨大商业价值。于是,在元数据检索、关联检索等技术发展的基础上,一些一站式资源发现系统应 运 而 生 , 如 Primo、EBSCO Discovery Service(EDS)、Encore等,OCLC也推出了自己的一站式知识资源发现与服务系统WorldcatLocal,这些系统通过类似Google的简单检索框,采用统一路径以实现对图书馆各种资源的发现和获取。

1 从资源整合到资源发现

计算机技术与通信网络技术的发展,推动着图书馆快速的完成了自动化、网络化管理系统建设。但随着各类数字资源在图书馆馆藏中所占比重的升高,传统的OPAC等查询检索系统不能对丰富的数字资源、网络资源、OA资源进行一站式检索的弊端进一步显现,为了为读者提供统一的资源一站式检索接口,图书馆将追求的目光开始转向了更深层次的资源整合方向,图书馆界掀起了一股大到国家共享工程项目,小到每个图书馆的特色文献资源数据库、机构知识库、文献数字化建设的资源整合热潮,但由于建设时期、开发平台、建设标准等方面的差异,致使这些资源的联合统一检索无法轻易实现,如何实现资源数据的收割、获取、融合与展现,成为了资源进一步整合的攻克方向。

数据关联整合、实时跨库检索和元数据集中索引检索是图书馆界解决上述问题的主要方式。数据关联整合通过检索词准确定位资源,如通过作者、主题词等找出密切相关联的资源;实时跨库检索是在对各异构分布资源平台、数据和协议充分研究的基础上,采用XML标准数据格式和Open URL、ODL、OAI等标准通用检索协议,借助计算机强大的实时处理能力,将读者的查询请求即时构造成各数据源特定的检索表达式,同时并行分发给各分布异构数据源,经各数据源实时检索处理后,将检索结果聚合、去重、排序整合后,统一呈现给读者;元数据集中索引检索是在分析各个分布式异构数据库的元数据特性基础上,参照元数据国际标准规范,构建新的元数据体系,再通过数据映射、抽取等技术手段,对各数据源的元数据进行收集、收割,经查重、聚合、修正等数据规范化加工后,集中存储到中心元数据仓储中,实现对所有异构资源的元数据分类聚合与统一,最终建立一个单一的元数据集中式索引。

这些多种更深层次的资源整合技术的出现,让图书馆的资源整合走向了深入,向着资源语义化等方向发展,但在实际的整合中,数据的关联整合须建立在规范的数据描述基础上,而目前对数据的规范描述特别是科学数据的规范描述还没有形成统一的规范标准,OCLC等机构间的规范标准也相差较多;实时跨库检索尽管实现了对异构资源库的实时并发检索,但却因为受限于数据库的协议标准、访问方式和网络联通状况等因素,随着外部数据源的逐渐增多,整合难度随之加大,容易出现整合检索进程缓慢与中断现象;元数据集中索引的整合检索需要数据提供商许可才可采集、索引元数据,如果数据提供商不许可则完全不能整合。可以看出,每一种资源整合技术都展现出了自己颇具优势的一面,如关联整合展现出了在提高检索深度方面的巨大优势,但对目前环境下的图书馆资源进行全部的关联整合还不现实。因此,如何集成多种技术,进而为读者提供既有资源整合、又能实现资源发现的检索成为了图书馆资源建设的下一个课题。Primo等资源发现系统就是实现了跨库检索与元数据集中检索的功能集中与融合,这些资源发现系统对用户的检索请求都是从跨库检索与元数据集中索引两个层面进行检索,最后经去重整合后统一展现给用户,巧妙的利用了两大整合技术的优势,提升了用户的检索体验,满足了读者一站式资源检索需求,实现了从资源整合到资源发现的图书馆资源服务转变。

2 图书馆资源发现服务的实现与实践

资源发现服务主要是通过资源发现系统来实现的,工作原理是系统提供商通过与出版社等内容提供商的合作,对海量的、来自异构资源的元数据和部分对象数据,采用分析、抽取等手段进行预收集,并将这些数据按映射转换规则转换为标准的格式,纳入到元数据标准体系中,形成一个预聚合的元数据联合索引库,在本地或者远程中心平台提供统一的搜索服务。自2009年Proquest旗下的Serials Solution公司推出第一款网络级资源发现系统Summon以来,短短几年间,越来越多的资源发现系统陆续发布,越来越多的图书馆也进行了引进和应用。据2009年一项针对美国ARL(Association of Research Libraries)的100所高校图书馆成员使用新一代资源发现系统情况的调查显示,超过三分之一的高校成员馆采用了新一代资源发现界面。另一项调查也显示,仅在2010年引进Summon、Primo、Worldcat Local与 Encore 四大主要资源发现系统的图书馆就有1270家,累计安装达2875家。我国的图书馆特别是一些高校图书馆也陆续开始了资源发现服务系统的引进与应用,如北京大学图书馆、浙江大学图书馆、西安交通大学图书馆以及北京师范大学图书馆引进了Summon系统,清华大学图书馆、上海交通大学图书馆、中科院高能所图书馆、农科院图书馆、中国社科院图书馆引进了Primo系统。

3 资源发现服务的研究关注点

尽管国内外一些图书馆已成功的应用资源发现系统,但对大多数图书馆来说,资源发现系统还是一个较为新鲜的事物。一方面,引进资源发现系统的图书馆数量非常有限,且主要集中在高校。另一方面,我国还没有一款自主开发的资源发现系统,对其的学术研究也还不深入。现有的研究主题从对资源发现系统的介绍与比较、系统的发展趋势、系统的产生场景与需求等较为宏观浅层的研究深化到了发现系统的算法优化设计、基于DOM中间件技术的资源发现模式等涉及系统算法设计优化、平台开发创新的较深层面,但由于研究群体较为单薄,研究成果有限,资源发现服务还有待进一步深化研究。

3.1 资源发现服务的需求与场景分析

以数据密集型科学研究为代表的科学研究第四范式随着信息技术的发展与大量科学数据的产生而到来,图书馆用户特别是其中的科研人员的信息需求将随之发生变化,为满足这些用户信息需求的嵌入式学科服务也正在进一步深化与转变,基于结构复杂、类型多样、数量巨大的大数据相关业务也逐渐成为支撑这些服务开展的基础与保障,利用数据分析、数据挖掘、数据抓取、数据语义化等大数据技术去实现不同用户、不同场景、不同需求的信息需求是图书馆在大数据时代的信息服务保障。对资源发现服务来说,如何从这些存在差异的场景、需求中去发现用户的差异需求,进而提高可以解决用户问题的信息知识,都值得关注和研究。

3.2 资源发现服务系统的选择

目前,图书馆应用的资源发现系统主要是Summon、Primo、Worldcat Local与Encore等,这些资源发现系统在资源的检索原理、元数据获取方式、服务模式等基本相同,但在数据来源与数据量、功能与服务、定价方式等方面存在着差异,随着图书馆对资源发现服务的重视,将有越来越多的资源发现系统会投入市场,如何根据自身需求进行服务系统的选择资源发现服务系统,将变得越来越困难,资源发现系统的选择对图书馆来说是一个难题。对我国的图书馆来说,还需考虑到汉化的情况。如何根据自身的服务特征、存在场景与用户需求,进而得出最优的选择方案无疑将是未来资源发现服务的另一大关注点。

3.3 资源发现服务的接口与标准化

目前市场上的发现系统主要由以色列、美国等国的公司或OCLC等组织研发,对于国际元数据收录较多、中文元数据收录较少,如全球图书馆行业的领军机构OCLC推出的Worldcat Local以强大的Worldcat为基础,提供了全世界近2万个图书馆的馆藏纸质资源和部分数字资源的信息共17亿条,但其中收录的中文元数据资源却只有国家图书馆2010年上传的230万条中文资源数据。因此,在我国图书馆的引进和应用系统时,如何实现对用户需求最大的中文元数据覆盖收录与自己馆藏资源的覆盖收录都会是系统选择中的一大考虑因素。资源发现系统规范标准的缺失使得市场上的系统之间存在较大差异,除以上中文资源欠缺之外,资源发现系统的元数据访问获取方式、服务功能等都也存在差异,在实践应用中,为了与现有的资源数据、服务平台等无缝、安全对接,如,馆藏资源和系统覆盖资源的外部访问和调用;通过资源调用接口特定的资源内容、格式、使用数量和频度等权限信息,保护资源提供者的资源在可控范围内被合法和安全利用范围内;等等。将有越来越多的开放接口API被开发和应用,系统开发的标准化研究也会日益被重视。

4 结语

近几年兴起的资源发现服务系统自推出以来,国内外图书馆的快速引进与应用说明了其存在的价值与竞争力,但目前从其发展的系统数量较少且无中文系统、研究文献不足、应用还不普遍等现状都可以看出,资源发现服务将是未来图书馆延伸服务、科学研究的增长点。对其的关注点也还可能不仅仅局限于系统的本身服务以及文中所述的接口与标准化等方面,还可能随着科学研究第四科学研究范式和大数据时代的到来,对非结构化数据的处理、对用户个体场景的分析等都可能是需要关注和研究的热点,本文的研究只是关于资源发现服务的一个初步探索。

[1]熊拥军.数据挖掘在数字图书馆个性化服务中的应用[D].长沙:中南大学计算机应用专业,2005.

[2]李晓莹.图书馆异构数据库检索系统功能分析[J].情报杂志,2007,(2):134-136.

[3]严武军,马小燕.高校数字图书馆元数据检索系统的设计与实现[J].计算机工程与设计,2006,(1):168-170.

[4]聂华.发现服务——通向深度整合与便捷获取的路径[C].2011高校图书馆发展论坛暨数字图书馆前沿问题高级研讨班,四川成都,2011.

[5]包凌,蒋颖.图书馆统一资源发现系统的比较研究[J].情报资料工作,2012,(5):67-72.

[6]韩志萍.美国图书馆界新一代资源发现前端的兴起及应用—兼议对中国高校图书馆的启示[J].图书馆管理,2009,(30):55-62.

[7]Breeding Marshall.The new frontier[J].Library Journal,2011,136(6):24-34.

[8]北京大学启用Serials Solutions Summon发现服务[EB/OL].[2012-12-10].http://www.serialssolutions.com/news/serialssolutions-peking-university-summon-simplified.

[9]Prim资源发现与获取系统案例[EB/OL].[2012-12-10].http://www.exlibris.com.cn/support/casestudy.Html.

[10]项英,李向军.高校图书馆资源发现服务系统应用研究[J].情报科学,2012,(11):1682-1685.

[11]孙杨.OCLCWorldcat local发展综述[J].山东图书馆学刊,2011,(5):46-54.

[12]国家图书馆加入OCLC WorldCat资源共享网络[EB/OL].[2011-07-19].http://www.ccnt.gov.cn/xxfb/xwzx/whxw/201004/t20100429_78833.html.

猜你喜欢
检索图书馆资源
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
我给资源分分类
瑞典专利数据库的检索技巧
挖掘文本资源 有效落实语言实践
资源回收
图书馆
英国知识产权局商标数据库信息检索
激活村庄内部治理资源
去图书馆