黄维莉
(武汉大学 信息管理学院,武汉 430072)
基于河南省高校图书馆数字资源现状的存储策略研究
黄维莉
(武汉大学 信息管理学院,武汉 430072)
基于河南省高校图书馆数字资源存储现状,针对高校图书馆数字资源的特点和存在问题进行分析研究,对河南省高校图书馆数字资源的存储与共建、共享提供几点策略。
数字资源;存储策略;高校图书馆
高校图书馆作为信息资源的拥有者和提供者,在高校数字信息化建设中发挥了重要作用。随着现代计算机技术和网络技术的飞速发展,各种文献、电子图书和期刊、网页,特别是多媒体数据的大量涌现,使图书馆信息量呈几何级数增长,即使图书馆的存储能力不断增长,也远远不能满足现有资源的存储需求。面对越来越多、越来越庞大的数字资源,如何对其进行快速、高效的存储、使用和保护,已经成为影响图书馆发展的关键环节。
(1)高校图书馆数字资源概念。数字资源是文献信息的表现形式之一,是将计算机、通信及多媒体技术相互融合而形成的以数字形式发布、存取、利用的信息资源总和[1]。凡是图书馆引进或自建的,拥有磁、光介质或网络使用权的数字形态的文献资源,都可以称之为图书馆的数字资源。其资源可包括为文献、电子图书、学位论文、数据集、书目数据、视听资料、网页等。
(2)高校图书馆数字资源的特点[2-3]。与图书馆传统的馆藏资源相比,数字资源有其自身的特点:存储容量大;数字资源形式及结构复杂;资源存储具有动态性;对设备有依赖性;数字资源具有共享性;数字资源易损。
2005年,河南省高等教育文献保障系统管理中心和河南省高校图书情报工作委员会秘书处联合以红头文件的形式向河南省各高校图书馆下发了《电子资源建设基本情况调查》表,对河南省各高校图书馆的数字资源存储状况进行了调查[4]。此调查表中包括基本情况调查和电子资源建设情况调查两大项,计28个小项,涉及到的数字资源存储方面的有:数据安全状况;购买中外文数据库种类、数据量、采购方式;图书馆目前存储容量及存储系统模式;近期计划扩容量;自建特色文献数据库情况等。此次调查共回收调查表51份,表1列出了其中10所高校数字资源的存储现状。
表1 河南省10所高校数字资源存储现状[5]
通过调查可以得出:图书馆数字资源丰富,所需存储空间大,目前的存储容量普遍不能满足数据资源的存储需求;现有的服务器等硬件设备配置较低,性能不高,老化现象较为普遍,而且图书馆经费紧张,用于维护和购买设备的资金很少,大大增加了数字资源存储的安全风险;图书馆技术力量较弱,各图书馆技术人员较少,且人员流动性较大;大部分高校图书馆都没有采用先进的多层架构,无法实现统一管理和资源共享,资源利用率低,管理复杂,扩展性不强;各图书馆存储系统容灾抗灾能力不足。缺少必要的备份手段,数据备份能力不足;一旦出现严重故障,可能导致数据损失或丢失,进而导致系统瘫痪。
(1)数据库重复建设较为严重。自二十世纪九十年代以来,我国的中文数据库逐渐走上商业化和产业化,出现了许多规模不同、各有特色的数据库产品。数据库厂商为了发展产品,吸引用户,不断扩大其收录范围,造成部分资源的重复收录。通过对CNKI(中国学术期刊全文数据库)和VIP(中文科技期刊全文数据库)的比较可知, CNKI收录期刊9 100多种,主要收录的是社会科学方面的期刊,兼收部分科技类核心期刊;而VIP收录期刊有8 000多种,主要收录的是科技方面的期刊,兼收部分社科类核心期刊(统计时间为2010年3月)。据统计可知,这两大数据库的资源重复现象比较严重,重复比例基本都在50%以上,有些分类甚至可以达到80%[6]。虽然两个数据库收录的期刊大部分都是重复的,但各有侧重点,一些综合性院校图书馆如果要同时购买这两个数据库,势必造成部分资源的重复引进。
(2)数据库建设缺乏统一的标准和规范[7]。数据库建设的标准化和规范化有利于提高数据处理效率。保证数据处理质量,提高数据库产品的通用性,是实现文献信息自动化检索和数字资源共建共享的重要基础和必要前提。由于我国在信息资源建设方面缺乏一个权威的机构对信息资源建设与开发的标准和规范做出统一的规划,各数据库开发商或图书馆基于自己的利益自行发展,形成了数据库的标准化和规范化建设标准不一、格局混乱的局面。数据库数据著录的标准化和数据库管理软件和系统的标准化是数据库标准化建设中需要重点考虑的两个方面。
(3)数据库建设各自为政,资源共建共享有待进一步提高。公共图书馆系统、高校图书馆系统和科技信息系统这三大服务群体组成了我国主要的文献信息服务机构。各服务群体运行机制相对独立,且隶属于不同的管理部门。目前,没有一个权威性机构对各系统数据库的建设目标、建设模式进行统一规划,对数据库各参建方的利益进行协调。因此,在数据库建设上各自为政、彼此隔离,造成现有数据库往往规模较小、结构单一、专业面窄、标准各异, 且大多是自用数据库, 资源共享性差。我国图书馆数据库建设“单打独斗”的局面已经严重影响和阻碍了我国数据库产业的发展。
(4)知识产权保护相关法规亟待完善。随着现代信息技术的发展,文献信息资源的数字化和信息资源的飞速增长, 使数字资源的知识产权保护问题成为一个重要的课题,尤其是对非原创数据库的知识产权保护更是当今国际知识产权法律界所面临的最为棘手的难题之一。首先,数据库存储信息量大、检索快捷、使用方便、实用性强,具有很大的社会经济价值[8]。其次,数据库的开发与制作耗费了大量的人力、物力、财力,凝聚着开发者的辛勤劳动, 是具有创造性的智慧结晶, 理应受到法律保护, 享有完全的知识产权。第三,数据库很容易被复制,且复制成本很低,复制后极易进行传播,因此数据库随时随地都面临着被他人擅自复制、传播的危险。第四,数据库收录作品的原著作权人的合法权益也应得到保护。但由于现有的知识产权相关法律法规不健全,人们的知识产权保护意识不强,有关侵权事件或法律纠纷时有发生。
(5)高校图书馆自建的特色数据库较少,质量不高。高校图书馆自建特色数据库大多是对网络资源的搜集和对传统文献的扫描,对信息资源进行深层次加工的特色数据库不多;学科导航库较多,全文数据库较少。而且许多图书馆自建的特色数据库与商业性电子产品之间缺乏统一标准,严重影响了数据的交换和共享,成为网络环境下的“死资源”。河南省各高校图书馆自建的特色数据库中真正具有较高价值、形成特色的寥寥无几。
(6)大部分高校图书馆未实现数字资源整合、跨库检索。许多高校图书馆通过引进和自建都拥有大量的数据库资源,特别是综合性院校的图书馆更是拥有大量的数字资源,这些数字资源载体种类繁多、格式类型各异。尽管每个数据库的使用都很便捷,但当用户需要查询多个数据库时,必须重复登陆数据库、重复输入关键词,大大降低了查询效率。因此,对各个数字资源进行整合,提供统一搜索和跨库检索服务,就成为许多高校图书馆亟待解决的问题。我国图书馆在馆藏数字资源整合与检索方面已经进行了充分的研究,并取得了一定成效。但由于各馆技术、资金、人员等方面条件的限制,资源整合程度水平不一,部分图书馆已经实现了高层次的跨库检索,而还有一部分图书馆仅停留在简单的链接整合、导航整合上。
(1)加强政府宏观调控,制定全省数字资源建设发展目标、发展模式。从管理体制上来看,造成我国图书馆数字资源建设整体上条块分割、各自为政,数字资源难以共建、共享局面的主要原因是缺乏宏观管理,缺乏有力的控制机制和手段,即国家没有一个统一的管理机构对数字资源的发展目标、发展模式等做出全局性的指导与调控。地方政府更应承担起相应的职责,组织相关部门对全省数字资源发展制定统一的目标、规划、总体构想、存储策略、实施方案等, 打破各系统、各部门之间条块分割、各自为政的格局, 对信息资源建设与服务各系统之间进行宏观调控, 逐步建立起协调建库的管理机制,统一数字资源建设与存储的标准规范,保证知识产权问题的合理解决,促进全省数字资源的共建与共享。
(2)统一数字资源存储标准,建立唯一标识码。要从根本上解决图书馆数字资源共享问题,就必须做好图书馆数字资源建设的标准规范工作。这方面,世界图书馆学界已取得了共识,而且世界各国的学者已进行了大量的研究和实践,并取得了卓著的成果。
从目前的研究和实践进展来看,信息资源共享涉及两个方面的内容,一方面是数字资源建设中的加工与描述的标准规范问题,包括信息资源格式、内容标准规范、元数据标准、资源唯一标示符等。另一方面是图书馆网络信息系统建设中的互操作技术标准规范问题。
(3)加强图书馆的合作与联盟,促进数字资源共建共享。近年来,由于经费紧张,数字资源的价格逐年上涨,这使得高校图书馆数字资源的建设困难重重。加强各图书馆之间的联盟与合作,促进资源的共建共享是数字资源建设发展的必然趋势,也是解决图书馆经费紧张问题的一个重要举措。即信息资源建设与服务部门之间联合发展、统筹规划、资源共享、各尽所长,以最小的投入获得最多的信息资源,最大限度地满足科技、教育、文化、经济发展的需求。
资源共享的基础是共建[9],要真正实现资源的共建就必须在资源配置方式和管理体制上进行改革。首先,各图书馆和其他信息建设服务部门要转变思想,紧密协作。其次要统一规划,在互惠互利的基础上制定高校数字化资源合作建设的整体目标。再次,根据各个馆的特色和功能,合理分配数字资源建设规模,确定数字资源的订购范围,避免重复建设,形成一个数字资源分布式存储、集成化管理和一站式检索、利用的运行机制。
(4)建立河南省数字资源区域数据中心。数字图书馆从发展到现在,信息资源爆炸式增长,所需存储空间成倍增加,技术需求越来越高,而各图书馆设备更新、系统维护越来越困难,单靠图书馆自己的力量已远远不能满足数字资源的建设和利用需要,更不要说长远发展。因此,建立河南省数字资源区域数据中心是解决各图书馆资金短缺、设备落后、技术力量薄弱,提高数据资源系统的安全可靠性、灵活性、可扩展性的有效途径,从而实现数据资源和设备资源的“共建、共享”。
(5)完善知识产权保护。与数字资源相关的知识产权问题越来越引起各个国家政府和民众的重视。数字资源的一些自身特征,如易于被他人擅自取用,易于复制、传播等,使得数字资源的知识产权问题特别是著作权保护问题颇为复杂。在著作权上,一方面要保障著作权人的智慧结晶,使其权利获得应有的尊重及保护,防止他人任意侵害;另一方面,人类的文明进步是由知识与经验的累积而完成的,所以每个人也有必要将个人智慧贡献给社会。在数字资源的引进上,一方面,引进数字资源的高校希望用户可以充分利用这些资源;另一方面,数字资源提供商和数据资源服务的提供商则采取各种措施,希望尽量保护资源,保障其权益不受侵犯[10]。
著作权是一种独占行为,具有排他性,法律赋予著作权人绝对的支配权,但也要考虑避免过度保护,造成他人利用上的障碍。我国现行的法律所能提供的保障十分有限。要更好的解决我国在数字资源开发与建设过程中的版权保护问题,就必须借鉴国外经验,加强对数据库保护技术的研究,加强立法,加强著作权管理制度在我国的进一步实施,对数字资源的侵权行为。
(6)加强数字资源整合检索建设。将数字资源整合并提供跨库检索就是让用户在一个统一的界面或查询环境下对不同数据源的信息进行统一查询,并在统一的界面下显示不同数据源的信息,为用户节省时间的同时,提高查准率和查全率。
数字资源整合不能简单地理解为“数据库集合”和“数据库链接”[11]。数字资源整合是一种管理、组织数字资源的概念,是一种有效利用资源,优化、重构数字资源的过程。所谓整合是指依据一定的需要,采用一定的方式和手段,对异构数字资源进行类聚和重组,将其整合为一个新的有机整体,从而形成一个效率更高、效能更好的数字资源体系。
[1] 孟广均.国内外图书馆学与情报学最新理论与实践研究[M]. 北京:科学出版社,2009:68-70.
[2] 余智敏.数字图书馆的数据存储技术研究[D].武汉:武汉理工大学,2006:5-9.
[3] 余玲.基于网格的数字图书馆资源存储研究[D].武汉:华中师范大学,2007:5-6.
[4] 白广思.数字资源区域数据中心建设研究[J].情报杂志,2007(5):129-131.
[5] 李甦.文献资源数据中心建设研究[J].技术与创新管理,2007(4):47-50.
[6] 温芳芳.试论中文电子期刊数据库资源重复建设问题[J].新世纪图书馆,2008(2):69-71.
[7] 黄晓斌,蒲筱哥.我国图书馆特色数据库建设的现状、问题与对策[J].情报科学,2007(5):784-789.
[8] 陈美章,刘江彬. 数字化技术的知识产权保护 [M].北京:知识产权出版社,2000:174-176.
[9] 刘磊,李可风.网络环境下我国社科信息系统与科技信息系统之间的协调[J].图书馆杂志,2002(10):3-7.
[10] 李爱国. 学术数字资源引进与管理[M].南京:东南大学出版社,2005: 119-124.
[11] 习卫妮.我国高校图书馆数字资源建设的调查研究[D].武汉:华中师范大学,2008:28-35.
[责任编辑 王晓雪]
TheStudyonStorageStrategiesofDigitalResourcesBasedonStatusofDigitalResourcesStoredinHenanProvince
HuangWei-li
(SchoolofInformationManagement,WuhanUniversity,Wuhan430072,China)
This article analyses the characteristics and problems of digital resources stored based on the present situation of the university library’s digital resources in Henan province. Then puts forward a few of strategies for storage, building and share of the digital resources in Henan province.
digital resources ;storage strategies; the library of university
2010-04-12
河南省高等学校人文社会科学研究项目(2009-ZX-059)。
黄维莉(1977-),女,四川简阳人,硕士生,主要从事数字图书馆、数字资源开发与利用的研究。
E-mail:huangweili_126@126.com
G250.74
A
1673-9779(2010)04-0513-04