高校图书馆资源发现系统架构下的信息服务探索

2014-09-18 11:05:16罗铿

大学图书情报学刊 2014年5期

罗铿

(嘉应学院，梅州514015)

1 引言

从Roy Tennan等人提出的整合检索到Anurag Acharya等开发的Google Scholar，特别是服务系统集成商和资源提供(数据库)商的积极加入，资源发现系统得到了迅速发展，图书馆多平台且无序的服务现状得到改变。据2009年一项针对美国ARL(Association of Research Libraries)所属的100所高校图书馆成员使用新一代资源发现系统情况的调查显示，超过三分之一的高校成员馆采用了新一代资源发现界面。另一项调查显示，仅2010年引进Summon、Primo、Worldcat Local与 Encore 四大主要资源发现系统的图书馆就有1270家，累计安装达2875家［1］。种种迹象表明，依托庞大的元数据集合，通过类似Google的简单检索框，采用统一的路径，实现对图书馆各种资源的发现和获取，资源发现系统已然成为下一代图书馆系统中的核心一环［2］。在此趋势下，随着下一代图书馆系统的研发、用户界面的改进与升级、机构知识库的建设等图书馆系统的更新与发展，必将冲击图书馆传统的信息交流和服务环境，给高校图书馆的信息服务带来一种全新的理念与模式。

2 高校图书馆资源发现系统的建设、开发模式

就类型而言，目前市场上资源发现系统的类型主要有以下几种:国外的有 EBSCO Discovery Service(EDS)、ExLibris(PrimoDiscoveryand Delivery)、Serials Solutions Summon(web － scale discovery)、Innovative Interfaces Encore Discovery、OCLC WorldCat Local五种;国内有 CALIS的 e读(易读)搜索、读秀学术搜索、超星经纬学术发现系统、指针搜索、百链、smartlib的 find plus、CNKI学术搜索、KDN知识发现网络平台等等［2］。从资源发现系统开发机构的性质来看，资源发现系统的开发机构主要由数据库生产商及图书馆集成系统开发商两大类组成，这两类开发机构要么拥有海量元数据，要么拥有先进的搜索技术，其产品也各具特色。

从资源发现系统产品评估的商业角度来看，可以认为所有资源发现系统都具有四个共同的核心要素:元数据要素、架构与功能要素、检索与界面要素、商务因素等。元数据要素方面主要涵括其规模(总量、收录范围)、质量(薄/厚数据、规范)、对本馆资源的覆盖度、OA与免费资源的集成及更新速度等;架构与功能要素方面则由资源发现系统的部署模式、模块与子系统、本馆数据提交方式、与OPAC的融合度、与WOS的集成、可扩展性、中文支持、资源导航、移动界面以及其他特色功能组成;检索与界面要素方面则考察其分面功能、高级检索功能、相应时间、相关度排序、用户界面等;商务因素方面主要由性价比、用户情况、本地支持、定制开发及其与已有系统的兼容性组成。

以上四个核心要素是高校图书馆在引进、建设与开发资源发现系统时必须进行详细比较分析的因素。通过对国内“985”工程高校资源发现系统应用进行调查了解可知［2］，就国内高校而言，对所需的资源发现系统主要采取直接采购、联合研发以及自建等三种方式进行建设。直接采购主要是直接选购成熟产品，如 EDS、Primo、Summon、超星经纬发现和指针搜索等系统。它们技术先进，数据规模比较大，具有专业研发队伍，对图书馆业务熟悉的系统。直接采购的好处是在资源发现系统投入应用的时间、技术支持、元数据制作、本地化应用等方面具有优势，如上海交通大学的思源探索和北京大学的未名学术搜索。联合开发方式主要是与数据资源商或技术开发商联合研发，以提高图书馆的技术人员素质，在后期的系统维护，节约建设开发资金，培养、增强图书馆的技术力量等方面具有优势，如南京大学的“Fine+知识发现平台”。自建方式有两种，一种是采用开源软件开发建设资源发现系统，另一种是自己设计软件进行资源整合开发。高校图书馆在资源发现系统的建设上采用自建方式，具有可灵活配置自己的需求，系统自主维护性高等优势，但由于高校图书馆本身不具备技术优势及海量数据储备优势，采用自建方式开发资源发现系统容易面临建设成本高，建设周期长，开发经验不足等缺点，因此一般的高校图书馆不采用自建方式进行资源发现系统的建设。从现阶段看，在以上三种方式中，以直接采购方式建设资源发现系统成为国内大部分高校图书馆的主要选择。

3 资源发现系统的服务架构

资源发现系统的一般原理是系统提供商通过与出版社等内容提供商的合作，对海量的、来自异构资源的元数据和部分对象数据，采取分析、抽取等手段进行预收集(pre－harvested)，并将这些数据按映射转换规则转换为标准格式，纳入到元数据标准体系中，形成一个预聚合的元数据联合索引库，在本地或者远程中心平台提供统一的搜索服务［3］。图1为这一过程的示意图。

图1 资源发现系统工作原理［4］

资源发现系统的基本服务体系架构根据工作原理划分为四层:数据资源层、资源组织层、知识发现层、应用服务层［5］。

数据资源层是整个发现系统中最基础的层级，是整个资源发现系统服务的基础。在这个层级中，通过各种方式完成对形式多样、结构异同、数量庞大的元数据的数据集成工作，主要通过与出版商或内容商签订商业协议的方式进行获取收集。核心是集成数据的数量、质量及对学术资源的覆盖度。

资源组织层是对集成的海量数据进行规范化处理工作的层级。通过对收集的数据进行内容比对、去重、合并及补充等完成对元数据的规范格式处理，确保元数据的品质，同时对规范化的元数据进行索引，实现对异构资源有序化的转换。核心是元数据品质的保证及不同属性规范词表的(关联)建立。

知识发现层是完成对多来源资源定向的数据分析、挖掘及管理的层级，利用分类、聚类、关联分析及序列模式等数据挖掘方法，以问题的理解和定义、相关数据收集和提取、数据探索和清理、数据工程、算法选择、运行数据挖掘算法、结果的评价等为步骤实现内容知识的智能化发现和扩展。核心是识别过程，从数据库中发现新的模式、知识和规律，进而预测规律，将新发现的知识整序后存放到知识库中，建立数据库与知识库之间子类结构与知识素结点间的一一对应关系。

应用服务层是整个系统中的最上层级，是系统与用户交互并实现服务的层级。在这个层级中，包括检索结果展示、关联知识获取、平台监控与管理、应用服务接口等内容。核心是提供丰富而有效的结果展示方式及用户需求的深度分析(日志分析)。

通过以上四个层级的架构，资源发现系统完成对分布、异构、海量资源的集合、整序、分析和发现并有效提供的过程。其提供的完美状态下的理想服务场景可以描述为用户通过统一检索入口，获得当前用户需求知识解决的全部资源展示，依靠其提供的各种资源共享的机制或云共享服务模式完成对非本地(拥有)资源的获取，最终实现用户知识需求的满足及对知识发现的持续探索。

4 基于资源发现系统架构的高校图书馆信息服务

4.1 基于营销方式的资源发现系统推广及应用培训

图书馆的信息服务是以信息资源为基础，利用各种方法或技术手段对信息进行收集、整理、使用并提供相关信息产品和服务的一种活动［6］。以此概念来理解图书馆的信息服务，结合资源发现系统的原理及其服务架构，可以看出，资源发现系统本身就是图书馆信息服务方式的一种。从信息服务行为的角度看，以资源发现系统为服务主体的信息服务方式是一种无人工参与的一站式信息服务类型。在这个类型中，信息服务需求者即用户对资源发现系统功能及应用的感知变得尤为重要，在用户利用资源发现系统实现个性化服务、全方位信息及深层次信息获取直至知识发现的过程中，图书馆提供的提高用户对服务系统功能有效感知度的培训及宣传将成为新信息服务模式中的首要环节。

近年来，“图书馆需要营销”这一观点被图书馆界广泛接受，在实际应用中，营销的确是图书馆提升服务效益和资源效益的一种必要手段，因此，结合资源发现系统中提供的相关数据分析并采用营销方式提供培训及宣传将是图书馆提高用户有效感知度的主要信息服务方式。根据用户数据的搜集完成用户信息行为特点分析，如以用户信息习惯及网络依赖度作为分析因素，在此基础上制定包括宣传力度、渠道方式、活动类型、合作和参与及体验反馈在内的系统服务推广策略，从而让资源发现系统可以成功地定位于服务大众用户的范畴，成为信息搜索利用的首选。

4.2 基于数据服务的关联数据应用服务

资源发现系统提供的一站式信息服务方式在很大程度上取代了图书馆传统信息服务的基础服务内容，如原文传递、参考咨询、馆际互借等，在资源(实体资源和电子资源)全面获取的层面上甚至比传统模式下人工参与提供的资源服务更方便、快捷。因此，图书馆新信息服务内容重心将逐渐转移到数据服务，依靠资源发现系统的数据资源层及资源组织层，提供基于关联数据的应用服务，实现由传统信息服务向知识集成服务的转变。

4.2.1 关联数据的发布

关联数据的发布指采用RDF(Resource Description Framework，资源描述框架)和 HTTP(超文本传输协议)技术在Web上发布结构化信息。关联数据是新一代语义互联网的基础，其应用前景非常广泛。无论是SKOS通过搭建知识组织系统(如分类表、词表)到关联数据之间的桥梁以实现全面关联数字化，还是OCLC利用SRU服务为VIAF(虚拟国际规范文档)项目提供关联数据等，都表明了图书馆界已开展关联数据的发布及应用，从而推动关联数据的实用化。图书馆的规范记录、MARC数据、主题标目等资源都可以发布为关联数据。通过将图书馆资源发布为关联数据的应用，为本地数据建立外部关联，使得图书馆的资源和外部世界可以相互连接起来，这不仅可以增强和扩展图书馆的发现平台，凸显图书馆在现代学术交流环境下作为创建者和出版者的作用，在吸引用户方面，还可以通过将图书馆的特色数据发布成关联数据，增加用户回到图书馆的途径。

4.2.2 多数据混搭的应用服务

提供多层次的知识关联集成服务是多种类型数据混搭的应用服务之一。从用户的角度看，资源发现系统中，关联数据通过对多个分布式异构数据源进行整合的关联访问，将来自非同一数据源的同一对象进行整合，以统一视图提供给用户关于该对象的所有信息，从而使用户发现和共享网络中不同类型的数据、信息、知识成为可能，这使得用户所面对的数据和信息呈指数级增长。而关联数据通过在数据层建立链接机制，其数据的结构信息得到很好的描述，以URI(Uniform Resource Identifier，通用资源标示符)确保系统能够自动链接各种数据，为信息聚合的智能化和自动化提供了基础。充分利用关联数据源中的关联关系，实现有序组织、集成和关联知识单元，进行知识内容的关联及深层次的展示。如在一些大学图书馆的实际应用中，应用关联数据实现包括人员、机构单位、研究成果、会议资源、科研项目等在内的具有关联属性的知识内容整合和集成，为用户提供多层次的知识关联集成服务。

其次，多数据混搭应用服务还可以应用于手机、IPAD等移动终端，实现不同领域和场景中的移动服务。关联数据以其语义独立的知识单元描述和发布规范，为普适的、无所不在的移动服务带来了可重用、可参考、普遍联系的资源基础。如DBpedia Mobile在移动环境中的应用，DBpedia实现了Wikipedia的关联数据化，描述了其中218万多个实体，其中包含了近30万条的地理位置。DBpedia Mobile充分利用这些位置数据，通过GPS信号，结合DBpedia与其他LOD数据集的关联，自动发现当前位置附近的相关内容，并通过浏览器提供地图化的界面［7］。在图书馆的应用服务中，通过图书馆区域内地理实体的导航和相关信息的实时获取，使得图书馆提供移动参考咨询服务成为可能。

5 结语

资源发现系统在高校图书馆的快速普及应用说明了其价值与竞争力。对于图书馆新信息服务模式而言，采取主动措施，通过有效的用户培训及品牌宣传，使大部分用户选择图书馆作为首要信息来源之一，继而依靠有效培训获得信息素质能力，通过以资源发现系统为核心的服务系统解决实现用户的自服务模式，而图书馆则从传统信息服务模式转向以数据服务为核心的知识服务，提供信息资源深度整合及信息产品产出模式的个性化服务。

［1］郑丽君.资源发现服务:图书馆服务与研究的新视角［J］.图书与情报，2013，(3):132 －134.

［2］胡玮.“985工程”高校图书馆资源发现系统现状分析和思考［J］.图书馆学研究.2013，(16):43－48.

［3］聂华.发现服务——通向深度整合与便捷获取的路径［C］.2011高校图书馆发展论坛暨数字图书馆前沿问题高级研讨班.成都，2011.

［4］朱本军.基于联合索引的下一代图书馆学术资源搜索研究［C］.2010年教育部高校图工委信息技术应用年会.上海，2010.

［5］杨会等.网络级知识发现服务的功能分析及问题探讨［J］情报杂志，2013，(11):149－153.

［6］张树华等.数字时代的图书馆信息服务［M］.北京:北京图书馆出版社，2005.1－9.

［7］沈志宏，张晓林.关联数据及其应用现状综述［J］.现代图书情报技术，2010.10:1－9.