国内高校科研信息发现系统的发展困惑与破解方案❋

2014-12-25 02:15
图书馆 2014年4期
关键词:检索个性化图书馆

(天津农学院图书馆 天津 300384)

1 高校科研信息发现平台的发展背景

网络信息技术的快速发展和信息资源的持续激增,为高校用户科研信息的发现和获取提供了多种可能,如何在海量的信息浪潮中快捷发现并有效获取目标资源,是目前图书馆和信息服务机构需深入研究的重要课题。虽然资源整合和联邦检索曾在一定程度上提高了资源查找的便捷性,但由于其无法对图书馆所有可用资源和服务系统的统一管理,不能满足现代高校科研用户的信息诉求。Google、Amazon等商业网站简洁快捷的信息获取方式和丰富相关性的获取结果,为科研用户提供了全新信息获取体验。在这种信息诉求和信息环境下,起源于OPAC和联邦搜索的网络级资源发现系统应运而生并在高校图书馆得到迅速发展。〔1〕网络级科研信息发现系统通过建立大型元数据中心索引库,在图书馆所有可用资源和用户的需求之间架起了桥梁,为用户科研信息的快捷发现和有效获取提供了一站式解决方案。目前国外在资源发现系统研发和图书馆应用方面一直走在前列,较典型的成熟产品有:EDS、Primo、Summon、Encore等;国内近两年也有相应的主要针对中文发现的产品出现,如CALIS的e读搜索、读秀学术搜索、超星经纬学术发现系统、指针搜索、百链、CNKI学术搜索、KDN知识发现网络平台等。〔2〕这些发现产品以简单、快速、易用、有效的检索体验颠覆了传统的图书馆整合检索系统带给用户的感受。由于发现服务是新生事物,在其推广应用中仍存在资源覆盖不足、信息滞后、个性化服务缺失等诸多困惑,通过对国内高校科研信息发现服务的发展困惑与原因的深层分析,为发现系统破解困惑、持续发展提供决策参考。

2 高校科研信息发现服务的发展困惑与破解对策

2.1 国内缺乏成熟的品牌产品

通过对有关发现系统研究资料的梳理和分析,发现目前国内高校图书馆使用的资源发现系统都是由国外的数据库生产商或者图书馆集成系统开发商推出的,相对于国外许多研究者已陆续开发的新系统,我国对发现系统的研究还较为薄弱,由于技术和资源限制等方面的原因,还没有一个集成了中外文数据资源的成熟产品问世,〔3〕更是缺乏基于用户需求的研究。现阶段国内对图书馆资源发现系统的研究多以介绍国外发现系统的功能、实践经验、本地化推广方案等;从发现的角度,以定量分析的方法来研究用户需求的文章还很少见。〔4〕以用户需求为导向,进行发现系统的设计和架构,提供面向需求、适应变化和灵活深入的发现机制,是发现服务持续发展的根本,也是以用户为中心的服务理念的充分体现。因此对资源发现服务的研究有待进一步深化。

发展对策:发现系统是面向学术信息的知识发现平台,是一个网络搜索引擎,索引库中元数据的质量和数量对系统的发现功能产生很大的影响。〔5〕因此对发现服务系统的研究首先要研究其元数据的深度整合和标准化处理流程,以此提升其元数据的质量和覆盖率;二是研究其网络环境下的系统架构和智能化发现功能的提升;三是进一步研究用户的信息行为和信息需求,构建以用户需求为导向的资源发现系统。

2.2 资源覆盖不足

通过对发现系统有关研究资料的调查,发现当前国内无论引进还是自己研发的的发现系统,普遍存在资源覆盖不足的问题。其主要体现在以下方面,一是对各类型资源数据提供发现揭示的机会不平衡,多数集中在对图书、期刊文献资源的发现揭示,对图片、音乐、影片等类型的信息数据则较少涉及;〔6〕二是发现服务并不能够完全替代图书馆其他重要的信息检索和发现工具以及全部图书馆信息资源,对于某些给定的学科,发现服务不能覆盖的内容还是非常可观的;〔7〕三是中文电子资源内容的覆盖是当前几家主流发现系统Summon、Primo和EDS等在中国市场推广应用的一个首当其冲的瓶颈;而国内研发的超星和中国知网等发现系统又明显存在外文资源的缺失,由此可见资源的覆盖率是发现系统的一大困惑。

针对发现系统资源覆盖率不足的问题,笔者认为应采用以下对策:一是利用仓储技术和大数据技术加大信息资源采集的深度和广度,力求图书馆可用资源的全覆盖;二是利用连接技术和关联技术增加对远程信息资源的获取渠道;三是加大数据库商、系统商以及各发现系统的通力合作。

2.3 信息安全隐患

图书馆用户对资源发现系统的需求日趋强烈,但资源发现系统进入市场后,由于元数据过度集中到系统开发商,致使发现服务对于出版商和内容提供商的支持与合作的依赖;特别是自建库中元数据与引进系统元数据融合建立联合索引,通过SaaS服务模式向用户提供服务,或通过OpenURL完成电子资源有效关联等,致使图书馆部分特色资源被国外商业公司控制,存在安全隐患。出于对信息安全的保护,某些图书馆不愿意将自有数据提供给商业公司,这也是资源覆盖不足,部分国外发现产品不支持中文数据库原因之一。

解决信息的安全隐患,要做好以下几点:一是仿照Primo的架构模式,将元数据仓部署在云端,将本馆馆藏和自建资源数据部署在本地,这种“云+本地”的复合部署,一方面解决了国外发现产品不支持中文数据库的问题,同时规避了自有数据的安全隐患。如上海交通大学将超星数字图书的元数据部署在本地,使发现系统增加了对中文电子图书的支持;〔8〕二是对部署在云端的自有数据做详细的访问权限设置;三是建立部分自有数据元数据仓储,利用SFX与发现服务系统链接,形成关联访问。

2.4 用户对发现系统的功能感知有待提高

刘颉颃、陈定权等通过对广州大学城高校图书馆用户对系统价值的感知调研,指出:检索结果的相关度排序、显示馆藏信息、网络链接等是用户认为最有用的功能,而资源发现系统开发商重点推介的检索结果分面显示和分主题检索,并没有受到用户的好评;Tag标签等Web 2.0元素,受到一般网络用户的追捧,但图书馆用户对此并不感兴趣。但Web 2.0元素可打造信息交流和共享平台、为用户提升网络交流体验提供准备;主题限定搜索和分面浏览为用户个性化服务提供了基础,但用户并没感知到这些功能的有用性,由此可见用户对资源发现系统的功能感知有待提升。

针对用户对资源发现系统功能感知的提升,笔者认为应采用以下对策:一是向用户积极宣传和推介发现系统的核心功能,如主题限定检索和分面浏览,引导用户发现这些功能的的妙处并使用这些功能;二是在系统中嵌入智能化链接软件,对用户的功能需求提供智能化自动切入;三是通过培训讲座,提高学生的信息素养。

2.5 个性化服务有待完善

文章所指的个性化服务是指图书馆学术用户对其专业领域的深度检索和用户个性化推介服务等。科研信息发现系统通过大型元数据索引为用户科研信息的快捷发现提供了一站式检索方案,但一些高层次的教授、研究生等资深用户对其感到有用性不强,认为所有信息集中到一个索引库的信息管理造成大量不相关检索结果的出现,阻碍了对其专业领域深度检索和对目标资源的发现与获取,他们更希望在自己专业数据库获得针对性更强、深层的信息资源,因此就目前国内引进和构建的资源发现系统存在对专业领域的深层检索问题。〔9〕另一方面,据有关学者统计,目前国内几家引进和自建的资源发现系统,普遍缺乏基于用户需求的个性化发现服务,如个性化定制、个性化推荐、移动和web2.0服务等。

针对发现系统个性化服务缺失问题,笔者认为应采用如下技术措施:一是从信息资源的组织和揭示上入手,提供个性化信息资源的匹配揭示,如充分利用相关技术对中心索引库中的元数据进行深度融合、分类重组,构建基于学科的元数据网络关联分布体系,以满足资深科研用户个性化的信息需求。二是采用Primo的服务模式,构建元数据索引库和专业领域元数据仓储,使索引库和专业数据仓储捆绑,以此实现对专业信息资源的深度检索。三是通过数据挖掘、数据分析,对用户学术搜索行为日志进行分析与挖掘,找出用户的兴趣爱好、特色需求及学术背景,为用户提供基于推荐引擎的“情境发现”服务。〔10〕四是对索引库检索端口嵌入各种个性化服务软件如个人信息管理门户、web2.0元素、移动和社会网络、参考咨询、第三方资源、学科趋势分析和可视化展示等,通过个性化界面设置、分面定制和第三方资源混搭等,为用户提供一个交流互动,协同创作和无所不在的科研信息发现与获取环境。

2.6 发现系统的选择问题

目前越来越多的资源发现系统投入市场,国外几家较成熟的发现系统 Summon、Primo、Worldcat Local与 Encore等,在技术原理、元数据获取和服务模式方面基本相同,但在数据来源、数据量和服务功能等方面有所不同;国内近年推出的超星、中国知网等发现服务平台主要提供中文学术资源的发现与获取。随着资源发现系统的不断推出和图书馆对发现服务的重视,如何根据自身的需求进行发现系统的选择将是图书馆的一个难题。〔11〕

对我国高校图书馆来说,在引进和应用发现服务系统时,首先要重点关注对用户需求最大的中文元数据的覆盖、中文资源的排序和中外文资源的语义匹配等问题;其次对学术元数据收录的数量和质量,系统接口、标准化、检索界面功能扩展等问题也要重点关注;同时系统对非结构数据的处理能力、检索界面的易用性、以及与图书馆现有资源类型和服务平台的无缝对接等都是高校图书馆系统选择需要关注的内容。〔12〕

2.7 信息滞后问题

网络级发现服务是通过对海量的来自异构资源的元数据和部分对象数据通过抽取、映射、收割、导入等手段进行预收集,并通过归并映射到一个标准的表达式进行预聚合,形成统一的元数据索引,通过单一但功能强大的搜索引擎向终端用户提供一站式的资源发现与获取服务的系统。由于通过信息资源预收集和预聚合而构建的元数据中心索引库,不像Google学术搜索能直接从数据库厂商抓取内容,而是根据一个时间表依次从元数据仓库更新,这就存在信息滞后问题,从而影响着发现系统信息检索的时效性。〔13〕针对发现系统信息滞后问题,应采用以下技术方案:一是利用一定的标准协议和工具,对数据资源进行标准处理,实现图书馆可用资源的统一管理和一体化架构,从而提升资源的匹配速度;二是加强图书馆与数据库商或出版商合作,利用链接技术直接从出版商或数据库商获取元数据,从而提升资源发现的时效性;三是通过MARC记录映射客制化和RTA实时馆藏状态的同步。

3 规范的运行机制是系统破解困惑的有效方案

发现系统越来越得到国内高校图书馆的重视,但其在运行中仍存诸多困惑,而有效的运行机制是科研发现服务破解困惑和持续发展的有力保障。通过对图书馆发现服务系统的困惑和破解对策的分析,将发现系统运行机制分为以下几个方面(发现系统发展困惑和运行机制如图1所示):

图1 科研发现系统的发展困惑与破解机制

3.1 资源的深度整合机制

通过对馆藏资源和服务系统多类型、多渠道、多角度的收录和深度整合,为发现系统可用资源的全覆盖、提升发现系统的发现功能及构架国际一流的发现平台提供基础准备。

3.2 标准化机制

信息管理和运行机制的标准化,是信息资源深度整合和有效关联的基础。发现系统标准的元数据集中索引是发现服务的关键,是实现各异构资源元数据分类聚合与一体化调度的基础准备。同时发现系统运行机制的标准化,是系统兼容性、通用性和可扩展性,提高系统响应速度和提供各种标准化接口的基础。

3.3 有效的关联机制

系统通过关联技术和OpenURL技术将图书馆所有可用资源优化匹配,为用户检索发现提供最佳的逻辑结构,并针对不同类型的信息资源给出最优的获取和扩展获取方式。如目标内容为纸质图书,发现系统给出该图书的馆藏位置、流通信息、电子版链接及其他获取方式,并自动推出最佳获取方案,真正体现了发现系统的发现功能。有效的关联机制可进一步完善系统的个性化服务功能。

3.4 信息挖掘机制

发现系统利用数据挖掘技术,一方面通过用户学术搜索行为日志分析,发现用户的真实需求,为用户提供针对性的信息推介服务,另一方面是对元数据索引库数据的深度挖掘,并针对用户的信息请求,提供最佳的选择方案。智能化的数据挖掘机制是为用户提供个性化推介服务、满足资深科研用户信息需求的有力保障。

3.5 嵌入机制

嵌入技术的应用,使发现系统灵活多样的发现服务提供了可能,如在用户的检索界面嵌入移动、web2.0、分面定制、社会网络、第三方资源等应用软件,为发现系统个性化、多样化、互动化、共享化等各种发现功能的实现提供技术支持。

4 结语

发现系统为用户科研信息的快捷发现与获取提供了一站式解决方案,由于研究较薄弱,国内高校在引用和实施过程中仍存在资源覆盖不足、个性化服务不强、信息滞后等诸多困惑。通过分析发现系统诸多困惑和破解方案的基础上,提出有效的运行机制是科研发现服务破解困惑和持续发展的有力保障,以此为国内高校科研发现系统的建设提供理论借鉴。

1.刘颉颃,陈定权,郭婵.用户对图书馆资源发现系统功能的期望.图书情报工作,2012(7):27-31

2.胡玮.“985工程”高校图书馆资源发现系统现状分析和思考.图书馆学研究,2013(16):43-45

3.巩林立.高校图书馆资源发现服务系统体系构建.图书馆学研究,2012(12):69-70

4.廖志江.知识发现及数字图书馆知识服务平台建设研究.情报科学,2012(9):1849-1853

5.窦天芳,姜爱蓉.资源发现系统功能分析及应用前景.图书情报工作,2012(7):38-41

6.陈丽冰.读者服务视角下的图书馆资源发现服务.情报资料工作2012(4):68-69

7.聂华,朱玲.网络级发现服务-通向深度整合与便捷获取的路径.大学图书馆学报,2011(6):8-10

8.秦鸿,钱国富,钟远薪.三种发现服务系统的比较研究.大学图书馆学报,2012(5):9-10

9.欧阳剑.数字图书馆信息资源的可发现性研究.图书馆论坛,2013(1):33-35

10.欧阳剑.数字图书馆信息资源发现模式研究.图书情报工作,2013(4):140-142

11.郑丽君.资源发现服务:图书馆服务与研究的新视角.图书与情报,2013(3):133-134

12.孙杨.OCLC WorldCat Local发展综述.山东图书馆学刊,2011(5):48-54

13.宋敏,吴倩倩.图书馆网络级发现服务的比较和选择.情报探索,2013(7):111-113

猜你喜欢
检索个性化图书馆
坚持个性化的写作
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
图书馆
上汽大通:C2B个性化定制未来
专利检索中“语义”的表现
同桌宝贝
满足群众的个性化需求
去图书馆