刘春金
〔摘 要〕分析高校图书馆各类数字资源建设现状,并对数字资源在其信息生命周期如何降低管理成本获得最大信息价值进行探讨。
〔关键词〕数字资源;信息生命周期管理;分级存储;数据迁移
〔中图分类号〕G201 〔文献标识码〕A 〔文章编号〕1008-0821(2009)07-0067-03
Research on University Library Digital Resource
Based on Information Lifecycle ManagementLiu Chunjin
(Library,Zhejiang Chinese Medical University,Hangzhou 310053,China)
〔Abstract〕In this paper,the different types of digital resources in university library and how to get the maximum benefit with the minimum costs from digital resources by applying the information lifecycle was discussed.
〔Key words〕digital resource;information life cycle management;hierarchical storage;data migration
人类社会进入21世纪以来,信息、物质和能源构成了现代人类生存和社会发展的三大基本资源。信息社会中,信息的积累呈几何级数增长,各数据中心的信息存储量几乎每18~24个月就会翻番。在信息爆炸的时代,信息过量几乎成为人人都需要面对的问题。如何管理海量信息,使之发挥最大价值,已经成为大多数高校图书馆亟待解决的问题。
1 信息生命周期管理的提出
美国著名信息资源管理专家霍顿曾提出,信息是有生命的,信息资源是一种具有生命周期的资源。他认为,信息生命周期(Information Lifecycle)是指信息运动的自然规律,一般由信息需求的确定以及信息资源的生产、采集、传播、处理、存储和利用等阶段所组成。信息就如同人类以及其他生物一样,是具有生命特征的,会随着生命周期的不同阶段而起落。
为了让信息更好地在其生命周期中有序地流动,并在流动过程中实现其最大价值,就要对信息进行必要的管理,于是产生了信息生命周期管理(Information Lifecycle Management,ILM)这一概念。信息生命周期管理不是一个新的存储解决方案,也不是某个硬件或软件产品,而是评估和管理信息的存储方式,是一种信息管理模型,贯穿信息整个生命过程并对其进行管理,从创建、使用到归档和处理[1]。信息生命周期管理就是要在信息生命周期的不同阶段,根据信息价值的不同而采取不同程度的管理,达到以最低的成本在信息生命周期的每一个阶段都能获得信息最大效益的目的。
ILM是一种针对信息主动管理的策略,通过实施真正意义上的ILM,可让信息在正确的时间处于正确的位置,从而帮助客户在信息生命的各个阶段以最低的整体拥有成本获得最大的价值。ILM作为新兴的信息管理策略,其最早并不是用于图书馆领域,而是用于金融、通信和医院等行业中。近年来,作为社会知识、信息、文化的记忆装置和扩散装置的高校图书馆,各类资源特别是数字馆藏资源增长非常迅猛,大部分高校图书馆面临将内部庞大信息的利用价值充分发挥的难题。本文试图将ILM策略引入高校图书馆数字资源建设中,希望借此降低数字资源管理成本,提高数字资源利用率,并对此进行一定探讨。
2 高校图书馆数字资源建设现状
现代高校图书馆数字资源不仅包含本馆拥有物理实体的数字资源,还包括可通过互联网获取利用的馆外信息资源所构成的虚拟数字资源[2]。实体数字资源主要由保存在本地服务器或单机上的数字资源组成。虚拟数字资源则主要由提供异地存取服务的网络数据库和网络资源导航系统组成。虚拟数字资源极大地延伸了数字资源的范围,成为高校图书馆资源中重要的组成部分。
纸质文献载体形式单一,分类方式较简单。而数字资源特别是高校图书馆数字资源,无论是构成方式还是表现形式,都比较复杂,因此对数字资源进行分类是一个相当棘手的问题。为了简化研究,笔者暂且将高校图书馆数字资源,按照资源来源不同,划分为6种类型:图书馆管理系统数据库、特色数据库、自建学位论文数据库、学术型网络数据库、光盘数据库、试用数据库。
2.1 图书馆管理系统数据库不可或缺
除了上述的数字资源之外,高校图书馆普遍采用各种图书馆管理系统,如金盘、ILASⅡ与Interlib图书馆管理系统等对人员、读者以及传统馆藏资源等进行管理。这些管理系统经过多年运行积累起来的大量珍贵数据资源,在确保图书馆正常运转中发挥举足轻重的作用。这些数字资源如果丢失的话,图书馆无疑将迎来一场可怕的灾难。另外,由于计算机技术的迅猛发展,图书馆管理系统升级更新很快,淘汰后的老版本图书馆管理系统数据库因为保存了图书馆重要的历史信息,其存储也应纳入数字资源的管理范畴,以应不时之需。
2.2 特色数据库发展迅速
在高校图书馆中的数字资源中,特色数据库的建设是高校图书馆数字资源建设的重中之重。随着信息技术的发展,高校图书馆特色数据库的建设,实现了从书目数据库向内容数据库、从馆藏文献资源向网络资源链接、从各馆孤立建设转向多馆共享建设、从自给自足的资源服务方式拓展到网上专题资源共享服务的转变[3]。目前,国内比较典型的特色数据库有浙江中医药大学图书馆的浙江中医药古籍数据库、兰州大学图书馆的敦煌学数据库、厦门大学图书馆的东南亚研究与华侨华人研究题录数据库等。国内众多高校图书馆都意识到要提高图书馆的服务水平,必须建立具有本馆馆藏特色、本校学科特色和本地区特色相结合的数据库,目前这些特色数据库正在蓬勃发展中。
2.3 自建学位论文数据库建设踊跃
除了特色数据库外,国内高校图书馆还对本校资源进行整理挖掘,如高校中的硕博士学位论文因为探讨的问题专深,学术价值高,引起高校图书馆的高度重视,不少图书馆将本校的硕博士学位论文进行统一管理,建立高校学位论文数据库并加以利用,如北京大学、复旦大学、上海交通大学等都建立了各自的学位论文数据库。
2.4 学术型网络数据库比重大
科研工作作为高校的重要组成部分,各种类型的学术型网络数据库在高校图书馆中占有很大比重。如外文方面,部分高校购置了EBSCO、Springer、Elsevier等网络数据库;中文方面,大部分高校图书馆相继购置了中国学术期刊全文数据库、维普资讯数据库及万方数据资源系统等。这些学术型网络数据库在高校的教学和科研工作中受到广大师生的欢迎,得到较广泛的利用。
2.5 光盘数据库建设日益重视
随着光盘数据量的激增,传统的单光盘的检索方式已经不能适应人们对光盘数据库的使用需求。光盘库、磁盘阵列、光盘镜像硬盘塔和硬盘组合技术的出现基本上解决了这个难题。一些高校图书馆对这部分资源越来越重视,购买或自建了多种光盘数据库系统,如Medline光盘数据库、中国生物医学文献光盘数据库(CBMDisc)以及将一些随书光盘通过技术手段建立起来的随书光盘系统。
2.6 试用数据库种类多
知识经济社会中,各大小知识产品供应商都积极开发了不同类型、不同层次、不同面向对象的数据库产品。由于市场竞争激烈,这些数据库中正式列入高校图书馆的采购计划前,往往会为高校用户提供数据库产品的试用,试用周期长短不一。试用结束后提供使用统计报告,使资源的最终使用者能真正参与资源的评估和建设环节。这些数据库产品的试用在增加了高校图书馆的选择空间时,无疑也增加了数字资源管理的难度。
3 高校图书馆数字资源ILM策略实施
研究发现,各类传统文献都具有一定的使用寿命,如图书一般在10~20年,期刊3~5年,科技报告10年左右,产品样本3~5年,文献使用寿命一定程度上反映了信息生命周期规律。
数字资源和传统文献相比,尽管信息的载体发生了变化,但两者的生命周期整体大致相当。数字资源依靠先进的信息技术,信息更新的周期短,不受时间、地点限制,传递速度快,具有高度共享性。为便于对信息生命周期进行研究,不同专家和学者采用不同的标准如信息价值标准、信息作用标准,并且从多个角度如信息利用次数、使用频率等对信息生命周期的阶段进行了划分。全球知名的数据存储商EMC公司将数字资源的信息生命周期,分为创建、保护、访问、迁移、归档和销毁6个阶段[4]。
3.1 数字资源创建阶段
信息技术的飞速发展,使得作为高校教学科研信息资源主要提供者的高校图书馆的服务突破了时间和空间的限制,服务内容多样化,服务手段先进化,服务项目个性化。高校图书馆在保持传统服务的同时,更要实现由传统服务向网络服务的转变,不仅要积极地把馆藏传统资源转化为网络数字资源,在网上拓展图书馆的信息服务项目,而且要把网络中丰富的信息资源转化为图书馆信息资源的一部分,提供给广大读者,从而提高文献信息的生命周期。
3.2 数字资源保护阶段
高校图书馆集中了各种特色资源和丰富的学术资源,这些资源对高校教学科研工作非常重要。因此,高校图书馆应该不仅要重视数字资源的建设,更要重视资源的硬件基础建设,加强对数字资源的保护。不过,国内大部分高校图书馆存在经费短缺的问题,根据信息生命周期相关理论,我们可以根据数字资源的不同价值,对数字资源采取不同的措施和技术来进行保护,从而降低管理成本。
3.3 数字资源访问阶段
针对传统文献进行管理时,为了降低文献保存成本,解决图书馆空间与文献数量剧增矛盾,一些专家提出了一系列解决方案,比较著名的方案是“三线典藏制”,该方案是以美国图书馆专家R•W•Truesovel提出的“二八率”(2/8 rule)为理论依据制定的,即将传统文献按照利用率的高、中、低,分别将传统文献分配到一线馆藏区、二线馆藏区和三线馆藏区,从而方便读者找到利用率较高的文献,降低保存成本。这个方案和ILM的思想基本类似。
将ILM策略应用到高校图书馆数字资源管理中,就要依据数字资源在其信息生命周期中价值的变化规律,对不同类型的数字资源,在不同的时间、不同的阶段,进行分级存储、保护和服务,达到以最低的管理成本实现信息价值的最大化。和传统文献的“三线典藏制”类似,高校图书馆的数字资源按访问频率可分为在线数据、近线数据和离线数据三类(见表1)。
在线数据是高校图书馆数据库中最为活跃的部分,提供日常业务处理所需的数据和信息,如图书馆管理系统数据库,另外特色数据库和学位论文数据库专有性强,访问频率高,因此也列入在线数据范畴。在线数据存储时应达到高性能、大容量要求,保证系统的正常运转。
近线数据指访问频率一般的数字资源,这类数字资源可以保存在本地或网络服务器上,如学术型网络数据库、光盘数据库等。如果用户对某些数字资源访问量特别大,最好是将其保存在本地服务器上,加快访问速度。
离线数据指平时访问率非常低的数据,如过期数据库、老版本图书馆管理系统数据库等。对于这些数据,我们应将其存放在价格更低的存储介质或单机上,供单机查询。
3.4 数字资源迁移阶段
数字资源具有一定的生命周期,经过其利用高峰后,我们应将访问率降低的数字资源由主存储设备迁移到次级存储设备,迁移操作可以为访问频率高的数字资源腾出宝贵的主存储空间,提高资源访问和备份的速度[5]。目前,一些数据库系统公司开发出相应软件,可以方便地进行数据迁移操作,如CommVault系统公司开发的Simpana软件可以采用自动的、基于策略的方法,快捷高效地迁移数据,而且迁移过程对于最终用户而言是隐匿的,即可以在不影响系统正常运行情况下将数据从一个存储设备转移到另一个存储设备。
3.5 数字资源归档阶段
高校图书馆对一些非常重要的数字资源,应及时进行归档处理,万一在进行误操作的情况下,可以使原始数字资源完整恢复过来而不至于影响图书馆的正常运作。
3.6 数字资源销毁阶段
数字资源在经历创建、保护、访问、迁移、归档阶段后,资源被访问的频率逐渐降低,甚至丧失了保存的价值。这时,我们可以考虑将其进行销毁处理。在销毁前,可以根据高校图书馆的目标和数字资源的特点,构建一个合理的评价指标体系,依据一定方法对数字资源的价值进行评价[6]。由于数字资源一旦被销毁,恢复的难度很大,笔者认为这对数字资源进行销毁时要慎而又慎,以免造成难以预测的灾难性后果。
4 结 语
数字资源的信息生命周期管理是一个复杂的系统工程,其核心是针对不同数据的不同生命阶段,采取不同的存储策略和存储介质。高校图书馆采用ILM策略管理数字资源,可以从新的角度深入了解信息,以最低成本实现信息价值最大化,提高图书馆的管理和服务水平。在实施ILM策略过程中,还存在相当多需要研究的问题,期待更多专家对数字资源的信息生命周期管理这一课题进行关注和探讨。
参考文献
[1]翁佳.信息生命周期管理[J].情报科学,2005,23(6):880-884.
[2]马越.普通高校图书馆的数字馆藏建设[J].河南图书馆学刊,2002,22(3):47-50.
[3]魏静,宋秋水.中国高校图书馆特色数据库的发展[J].河南职工医学院学报,2007,19(5):510-512.
[4]吴锡刚,赵莉娜.图书馆数字信息生命周期管理[J].图书馆学研究,2005,(12):59-61.
[5]周杭霞,钟梅,刘砚秋.运用信息生命周期管理思想建设存储系统[J].计算机时代,2006,(4):40-41.
[6]索传军.基于信息生命周期的数字馆藏管理研究[J].大学图书馆学报,2005,(1):26-29.