刘金玲 默蓉
摘 要:在图书馆共享联盟内,要实现信息资源的共享,首先必须解决信息资源状况的通报问题,即信息资源的共知。在现代信息技术条件下,图书馆联盟的信息资源共知体系建设,要充分运用知识挖掘、知识聚类和元数据整合技术,以基于元数据整合的共享联合目录体系建设作为主线,正确地处理好纸质资源与数字资源的关系,解决好馆藏联合目录与数字资源导航体系的整合,构建起跨系统、跨平台、跨地域的多馆信息资源联合目录揭示系统。
关键词:元数据;图书馆联盟;信息资源;整合
中图分类号: G250.73 文献标志码: A 文章编号:16720539(2013)06011404
在图书馆共享联盟内,由于各成员馆信息资源分散保存在不同的地理空间,相互之间对资源的种类、互补性、可用性等信息都不了解。要实现这些信息资源的共享,首先需要知道各自有什么資源可以共享,向谁索取,这就必须解决信息资源状况的通报问题,即信息资源的共知。
一、现代图书馆信息资源共知面临的主要问题
尽管数字图书馆十几年的发展成就有目共睹,但随之而来的种种问题也日显突出。家底模糊不清、信息孤岛障碍是现代图书馆建设面临的主要矛盾。
(一)家底模糊不清
为了解决联盟成员之间的信息资源共知问题,人们曾通过联合编制手工目录和联合编制MARC机读书目等方式来建立统一的信息搜索通道。在传统图书馆时代,馆藏目录和各类联合目录的组织是人类组织、控制和管理文献资源的主要手段,也是开展读者服务和资源共享的最主要工具。通过目录系统,图书馆和读者都可以清晰地知道本馆乃至一定范围内的其他图书馆有哪些资源,有多少品种和数量,在什么位置。我们甚至能准确掌握资源的学科保障能力,并据此不断调整和优化馆藏资源结构。
但是,在进入数字化时代的现代图书馆,由于技术和观念等因素的制约,虽然国际国内也陆续出台了相应的标准规范,但绝大多数图书馆都没有开展数字资源的统一编目工作,还只能以数据库列表链接方式向读者提供数字资源的查询与全文资源访问服务。这就导致各图书馆虽然购买了大量数字资源,却很难准确知道已购买资源的品种结构、重复情况,也难以提供类似传统图书馆卡片式目录系统那样的资源统一目录体系和统一检索平台,从而导致在资源建设、宣传推广与资源共享等方面出现问题。在这种背景下,建立馆际之间的资源统一目录和统一检索系统就更加艰难,读者难以方便、快捷、准确地掌握可用资源的状况,没有了共知,共享也就无从入手。
(二)信息孤岛负面效应
由于是不同公司开发的独立产品,各数据库的学科范围、收录品种、收录年限等各不相同,在使用界面、使用方法上也都自成体系,缺乏互通性,因此,读者必须把握每个数据库的适用范围,逐个学习每个数据库平台的功能、使用方法和技巧。同时,当读者从一个个数据库中检索出相关信息时,由于没有合适的工具与平台对这些结果进行去重分析,只能凭着记忆用手工方法去重,也无法判断在分散检索中是否会遗漏重要文献线索。这些数据库成了一个个信息孤岛。
在读者调查中发现,由于使用不方便,加之很多读者信息意识欠缺,当有多个相同类型数据库时,他们往往只使用自己熟悉的数据库进行检索,除非找不到所要文献,他们基本上放弃再查别的数据库,这就导致许多数据库得不到充分利用。为此,各类图书馆一年四季都需要花费大量的精力开展培训工作,但面对几万用户(高校)乃至几十万、上百万用户(公共图书馆),再好的培训、讲座,每次受益人群是十分有限的,数据库利用的瓶颈难以有效消除。
在联盟环境下,信息孤岛效应更加突出。除了各图书馆自身数字资源之间缺乏统一揭示外,不同图书馆资源之间的交叉、重复更难以把握,加之数字资源访问权限的约束,读者要在如此海量的资源里找到、得到自己所需要的资源非常艰难。
二、元数据整合
百度百科给出的定义:整合是把一些零散的东西通过某种方式彼此衔接,从而实现信息系统的资源共享和协同工作[1]。
由此,我们可以给出元数据整合的描述,就是把来自不同信息系统的分散元数据有机地集成为一个有序整体,从而实现异构、异地多个信息系统数据的一站式快速搜索的信息处理过程。元数据整合所实现的主要功能包括:
(1)著录描述:通过标准化手段,对各类数据信息单元进行详细、全面的著录描述,从而言简意赅地揭示数据元素涵盖的核心内容、载体形态、存储位置、获取方式、制作与利用方法等基础信息。
(2)定位检索:通过统一的元数据存储建立高效的数据索引,从而帮助人们快速、高效地一站式完成海量信息资源的检索,以及信息资源存在状态和可用状态的确认。
(3)资源调度:通过信息交互链接技术,支持信息资源的存储管理和使用管理,实现目标信息资源的一站式获取与利用。
三、基于元数据整合的信息资源共知体系
在传统的信息资源共享体系建设中,由于各图书馆信息化管理系统的选择各不相同,其数据库结构、编程语言、操作界面都不相同,集成系统缺乏标准化,这为实现信息资源的共知增加了难度。
(一)基于元数据的信息资源整合
现代图书馆的信息资源共知体系建设,要充分运用元数据整合技术,以基于元数据整合的共享联合目录体系建设作为主线,正确地处理好纸质资源与数字资源的关系,解决好馆藏联合目录与数字资源导航体系的整合,构建起跨系统、跨平台、跨地域的多馆信息资源联合目录揭示系统,实现信息资源的共知,并最终实现信息资源的共享,这是图书馆开放服务的基本保障。
1.基于元数据进行信息资源整合
信息资源整合的目的是为了满足读者利用信息资源的需求,而将各种不同类型、相对独立的信息资源进行重组,形成具有内在联系的、统一、高效的信息资源整体和利用环境。基于元数据进行信息资源整合,就是以元数据仓储技术为基础,将各种信息资源的元数据进行统一整合,并按照图书馆目录管理的方法,对信息资源进行分类,构建科学、合理、实用、统一的信息资源索引体系架构,实现对异构、异地海量信息资源的统一整合、统一搜索、统一导航、统一全文调度和文献传递服务等综合信息服务功能,最终实现图书馆内部和馆与馆之间信息资源的一站式利用。
2.整合的范围
基于元数据的信息资源整合不仅涵盖了纸本书目元数据资源和购买的商业数字资源元数据,还包括自建数字资源、开放存取数字资源以及其它网络资源的元数据。有基于单馆的信息资源整合和基于多馆异地分布的异构资源的整合两大类型。
基于单馆信息资源的整合是指将图书馆收藏的所有信息资源,有机地整合在一起,建立统一的检索平台,提供给读者使用。其整合目标涵盖本馆所拥有的图书、期刊、报纸、会议论文、学位论文、标准、专利,乃至音频、视频、图像等各种类型的纸质、电子载体文献,从而形成馆内所有信息资源元数据的统一揭示,实现多种载体信息资源的一站式检索,极大地减少读者使用的困难,提高资源利用率,发挥信息资源的最大效益。
基于多馆异地分布的异构资源的整合是指圖书馆与其他成员馆进行资源整合,打破“信息孤岛”的局面,实现相互间信息资源的互通互联,发挥信息资源的整体效益。其整合目标主要涵盖成员馆的某类(如单一的馆藏图书联合目录、数据库联合导航等)或全部信息资源,从而形成多馆信息资源元数据的统一仓储,实现多馆(多地)、多系统、异构的不同类型信息资源的统一整合、统一联合导航和一站式的统一检索,并为基于共享的全文馆际互借与文献传递服务创造条件。
(二)典型整合平台介绍
目前,在我国图书馆界较有影响的典型整合平台主要有以下两个类型:
1.基于联邦检索的资源整合平台
基于跨库检索系统的数字资源整合,也称联邦检索,是将一个检索请求同时转换并发送到多个异构的数据库,将检索结果进行归并和统一展示的整合系统[2]。
目前,基于联邦检索的资源整合平台以国外的MetaLib、ResearchPro、MUSE、Swets Wise等和我国清华同方公司的TRS、江苏汇文软件有限公司的Mylibrary为代表。
2.基于元数据仓储的资源整合平台
基于元数据仓储的资源整合平台是对来自异构资源的海量元数据和部分对象数据进行抽取、映射、收割、导入等处理[3],进行检索前预收集,并通过归并映射到一个标准的表达式进行预聚合,形成统一的元数据索引,向终端用户提供统一检索服务的平台[4]。
目前,基于元数据仓储的资源整合的国外平台主要有OCLC的WorldCat、Serials Solutions的Summon、EBSCO的EBSCO Discovery Service(EDS)和Ex Libris的Primo Central等,国内用户还较少。国内超星公司的读秀、Medalink和百链系统(2006年发布),已建立数十个图书馆联合目录系统和联盟共享服务平台;此外,北京万方公司的整合系统、CALIS的e读系统也属于元数据整合类的平台。
3.基于元数据进行信息资源整合的优势
以元数据为基础建立的统一整合和联合导航系统,将整合范围内的全部馆藏书目、商业数字资源、自建特色资源和网上免费资源等各类资源进行有效去重和标准化管理,所形成的联合目录与资源导航体系将大大减少共享体系资源的重叠浪费,为充分发挥相互间的资源互补性扫清障碍。与第一代的跨库联邦检索整合等技术相比,元数据整合具有明显的优势。
(二)技术层面优势
元数据整合可以有效兼容网络信息描述,提高网络资源的可获取性,从而增加读者可查询信息的范围;在尽量不改变信息资源原有格式的同时,整合后,计算机可以访问以不同形式描述的信息资源,实现异构资源的统一搜索;读者是对预先建立的元数据库索引进行检索,所以检索速度非常快。
(三)功能层面优势
现代图书馆的信息资源种类繁多,不仅有书刊等传统资源,还有视频等新型资源,既有纸质资源,也有数字资源[5],还有网络开放存取信息资源。在进行资源整合时,不仅要整合本馆的资源,还要整合联盟内各成员馆的信息资源。
基于元数据进行信息资源整合,收录的元数据描述字段可以包括资源名称、学科分类、资源类型、时间跨度、语种、出版商、资源检索平台等,将元数据通过收割、复制、导入等技术聚合起来,建立联合资源仓储,可以较好地实现多种类型信息资源与传统馆藏文献书目数据的统一整合。同时,可以将元数据仓储建构在云计算、云存储网络之上,使得全国各个区域联盟的元数据很容易在云中心打通,从而在更高、更广层面实现跨联盟的资源整合,在同一个检索界面实现本馆所有资源与联盟内所有成员馆资源,甚至是全国各个联盟信息资源的统一检索,极大地扩大了图书馆文献资源的服务范围。
四、结语
综上所述,元数据能够描述和揭示各种动态的网络数字资源,是管理和利用数字资源的基础。图书馆联盟在进行信息资源共知体系建设时,应充分发挥基于元数据进行信息资源整合的优势,选择适合本联盟的数据服务与技术提供商,进行基于元数据的资源整合与揭示系统建设,便捷高效地实现图书馆联盟信息资源的共知,进而实现图书馆联盟的建设目标——信息资源共享。
参考文献:
[1]百度百科.整合.[EB/OL].(2013-01-30)[2013-03-27].http://baike.baidu.com/view/57967.htm#sub8058650.
[2]秦鸿,钱国富,钟远薪.三种发现服务系统的比较研究[J].大学图书馆学报,2012,(5):5-11,17.
[3]王淑娟.数字资源整合平台优化研究[J].情报探索,2011,(3):64-66.
[4]聂华,朱玲.网络级发现服务——通向深度整合与便捷获取的路径[J].大学图书馆学报,2011,(6):5-10.
[5]刘金玲.基于商业平台的信息资源整合研究[J].图书馆理论与实践,2012,(7):34-35.
编辑:韩冬苗