关于数字图书馆建设的综合分析

2014-03-19 22:42赵旭
网络安全与数据管理 2014年9期
关键词:数据库数字化数字

赵旭

(泉州理工学院,福建 晋江 363000)

1 数字图书馆的概念

数字图书馆(Digital Library)是虚拟的图书馆,是在互联网环境的支持下产生的资源共享库。只要是合法的已授权用户,就可以通过网络在任何地点、任何时间,最大程度的获取知识所需要的资源[1]。“数字图书馆”是用数字技术处理和存储各种图文并茂文献的图书馆,它是一种多媒体制作的分布式信息系统,把各种不同载体、不同地理位置的信息资源用数字技术存贮,以便跨越区域面向对象的网络查询和传播的一个大型信息系统。

数字图书馆就是将传统图书馆中的馆藏资料进行数字化后储存到计算机的存储设备中,再通过网络传递的手段,让人们可以通过各种终端查询、浏览所需要的知识资源[1],终端设备包括计算机,手机,平板电视等。

与传统图书馆相比,数字图书馆的优点是显而意见的。

(1)海量的数字化信息存储在无数个磁盘存储器中,占用的物理空间相对很小。

(2)数字图书馆可以存储多种类型的数字化资源,如语音、乐曲、图像、视频、资料等。

(3)所有的珍贵资料都可以经数字化处理后,将原件保存在更适宜的环境中,而数字化的资料由于实现原件的复制,并不影响一般意义上的查阅。

(4)利用数字化图书馆的用户可以在任何地方、以任何身份只通过网络进入图书馆浏览、查询、下载及打印有用的信息。

2 产生背景

信息时代,人们获取信息的又一重要手段便是互联网,而传统图书馆中的文献资料若要更加充分快捷地被获取和查阅,就必须要依托网络来实现资源共享,所以,网络数字图书馆应运而生,它的出现极大地提高了图书馆资源的利用效率。

我国自20世纪90年代末开始兴起数字图书馆建设,虽然起步较晚,但经过不断的学习和研究,我国的数字化图书馆工程在资源建设、服务渠道和服务手段等方面已逐渐走在世界前列。随着国家数字图书馆建设的全面展开,数字图书馆已经成为国民进行资源检索、阅览的重要渠道。

“十二五”期间,实施数字图书馆推广工程,搭建以国家图书馆为核心,以省、市、县各级图书馆为节点的虚拟网,帮助各级图书馆建立数字图书馆服务网络,从而全面提升各级图书馆的服务能力和服务水平,在此基础上形成覆盖全国的数字图书馆服务体系,使数字图书馆真正成为社会公众身边便捷、高效、不可或缺的信息获取平台。

3 数字图书馆的基本功能模块

数字图书馆是一个硬件和软件集成的系统平台[2]。通过数字化处理技术,把各种文献载体数字化,并将它们有组织地存储在网络服务器上,再通过Web访问技术为用户提供服务。从应用的角度来讲,数字图书馆由如下模块组成:为终端用户提供友好交互界面的应用程序模块、对多种资源进行数字化转换的功能模块、提供信息检索的程序模块、对后台数据库资源进行有效管理和维护的模块和支持信息可靠传输的网络架构模块。

3.1数字资源的收集

数字图书馆的资源收集包括多种渠道。采购中外文数据库;对自身馆藏资源的数字化及原创音频、视频资源的积累;利用网络爬虫对网页中有价值的信息进行获取;与其他各级数字图书馆进行资源交换或资源共建。

3.2数据库资源管理

数字图书馆的数字资源存储于后台数据库,这些庞大的信息量必须进行有效的有组织的分类存储。分类的方法可按学科分类,适用于规模较小且拥有众多特色资源的数字图书馆;也可按资源本身的出版或存在形式进行分类,如中国国家数字图书馆将资源分为:图书、期刊、报纸、论文、音视频等。

3.3信息检索

信息检索包含Web信息发布、全文检索、异构资源同意检索、关联检索、数字参考咨询、全文传送与信息推广。使系统不仅能统一检索图书馆常用的国内、国外商用数据库外,还提供对外部数据资源,对网络资源进行统一检索功能,方便用户获得全面的信息资源。

4 数字图书馆的建设

建立数字图书馆,需要从以下几个方面着手:网络环境的建设、数字图书馆硬件设备的建设、数字图书馆软件系统平台的建设、数据库资源的建设、图书馆自动化系统的建设和标准与法规的制定和实施。

4.1运行环境建设

现代数字图书馆本质上是基于网络环境下的海量数据库及其应用。一般的数字图书馆是在如Linux、Unix或WindowsServer环境下运行的,客户端都是基于Windows操作环境的。数字化资料的传输由各种Internet接入技术建立的互联网络来实现。如:ADSL(非对称数字用户线路)、光纤接入、无线接入等。另外,基于移动互联网的服务,开创了图书馆的移动互联时代;数字电视服务,也成为理想的传输环境。

4.2硬件设备建设

数字图书馆大多数采用客户端/服务器的模式。客户端浏览器、Web服务器和数据库服务器构成信息传递的核心结构。数字图书馆硬件设备主要包括数字图书馆专用服务器和存储设备。数字图书馆专用服务器用来存放和运行数字图书馆软件系统平台。对服务器性能的要求由于受读者数量、网络情况等因素的影响,会有很大差异。如果能将数字图书馆软件系统的Web系统、数据库系统和原版数据系统分开存放于不同的服务器,则既增加了系统的安全性,又增加了其易扩充性,而且扩充成本还比较低。

4.3软件系统平台建设

根据数字图书馆的架构设计方案,开展软件系统平台的建设。数字图书馆是一个功能强大的在线联机查询报系统,在进行软件开发的过程中对软件质量属性的要求是严格的。首先是性能,即系统的响应能力,要求系统对即便是复杂的查询也可以很快地返回结果;其次,是安全性,系统安全性是指只允许合法的用户才能访问图书馆系统,拒绝非授权用户的任何服务请求。除此之外,系统的可靠性、可用性和互操作性也是在软件系统平台建设过程中必须考虑的问题。

4.4数据库资源建设

数据库资源建设是数字图书馆建设的核心工作,主要采用数字化处理技术。不管是通过何种手段获得的数据库资源,都应该进行有效的整合和检测之后才可入库,更应该避免数据资源的重复引入。如何选择性价比最高的数据库资源对于数字图书馆建设的成败至关重要。

4.5自动化系统的建设

图书馆自动化系统是数字图书馆的一个重要组成部分。图书馆自动化系统由计算机硬件系统、软件系统、数据库和相应的人员组成。

(1)硬件系统包括计算机主机、外部设备、通信设备和其他设备等。

(2)软件系统包括系统软件和应用软件。系统软件要和硬件系统配套,以适应图书馆工作的需要,例如要有很强的数据处理能力,包括多种文字的处理能力等。

(3)数据库用以存储和组织图书馆工作需要的各种数据,如采购数据、编目数据、流通数据、连续出版物数据以及各种管理、统计数据等。它们是建立图书馆自动化系统的处理对象和基础。

(4)人员包括系统人员、软件人员、硬件人员和操作人员等,一般都应掌握有关计算机的理论知识和技能,并并熟悉有关的图书馆业务工作。

4.6标准规范体系建设

数字图书馆系统的资源来源广泛,主要有外购数据库、各馆自建特色资源、网络资源的采集等多个方面,并且格式和类型也是多种多样,为了对各类资源进行统一的加工、组织和管理,必须在数字资源建设的过程中建立一整套标准规范体系。

我国数字图书馆标准与规范建设(CDLS)项目于2002年10月启动,由中国科技信息研究所、中国科学院文献情报中心和国家图书馆联合发起,研究和制定了包括数字资源加工、元数据、唯一标识符等数字图书馆有关标准规范。国家数字图书馆工程在建设过程中,根据需要,先后制定了二十余项数字图书馆相关标准规范,内容涵盖数字资源的组织、加工、描述、服务、保存等多个环节,为接下来各省市级数字图书馆的资源建设提供了一定的依据,也为未来的资源整合、跨库检索提供了基本保障。

5 数字图书馆的主要技术

数字图书馆涉及的技术领域十分广泛[3]。除了作为支撑技术的计算机技术和网络技术外,还涉及数字化技术、信息存储技术、数据库管理技术、信息压缩与传送技术、分类索引及检索技术等。

5.1数字化技术

信息数字化技术是指利用计算机和相关输入输出设备将大量的文献资源转换为数字形式并进行存储的技术。文献资源包括书刊、古籍、图像等馆藏资源。使用的设备包括扫描仪、扫描笔,将文字材料扫描后存储为图形或文字,其中文字要通过OCR识别系统进行识别和校对。

5.2信息存储技术

近年来,随着存储技术的发展,硬件容量不断扩大同时,软件潜力的充分发挥,使存储的能力也越来越大。NAS(网络连接存储)和 SAN(存储区域网络)作为两种主流技术,从根本上改变了已有的存储结构和管理方式,为大量数据传输造成的网络拥塞,实现数据集中管理,提供了有效的解决方法。对数字图书馆而言,最重要的是拥有稳定、可扩展、性能比最好的方案,而存储领域任何新技术的发展,其最终目的也都是为了简化用户的从存储资源的利用和管理。

5.3超大规模数据库技术

数字图书馆的数字资源体系结构完备,资源总量丰富,数量庞大。如此海量的数字资源,需要采用超大规模数据技术,才能保证对大用户量的支持和并行的查询操作。Oracle数据库管理系统的超大规模数据库技术可以满足这一需要,所涉及的技术还有数据分区技术、并行处理技术、数据安全及资源计划管理等。

5.4信息传输与通信技术

实现数字图书馆的资源共享必须以网络畅通为前提,网络通信技术的种类包括互联网、移动通信网、广播电视网等,服务终端涵盖计算机、数字电视、手机、手持阅读器、触摸屏等多种新媒体终端。近年来,网络技术的发展和网络设备的不断改进,大大提升了网络的传输速率,使用户在访问数字图书馆过程中,不管是浏览图片信息还是观看视频资源,都能获得很好的体验。

5.5 数据挖掘技术[4]

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘技术可以从历史数据中计算出规律,预测趋势。这一技术应用在数字图书馆中,实现了系统动态跟踪用户需求,为用户的个性化服务提供依据。

5.6 数据仓库技术[4]

数据仓库通常是一个面向主题的、集成的、不可更新的、相对稳定的、反映历史变化的数据集合,用于支持经营管理中的决策制定过程。数据仓库可以实现将数字图书馆中的海量但类型却多种多样的数据进行有效集成和重组,为数字图书馆系统实现有效的知识获取做好准备。

6 主要问题

6.1资源浪费问题

与传统图书馆相比的巨大优势,让人们建设数字图书馆的心情极为迫切。各级省、市、县以及许多高校纷纷开启了建设数字图书馆的进程。然而各自为政的建设方式,必然导致硬件资源的重复建设;此外,传统馆藏资源的重复,也将造成图书资源数字化和录入的重复。这更加违背了建设数字图书馆的初衷。因此,在数字图书馆建设之前的统一的规划和建设过程中的及时协调,可以有效避免大量的财力、人力、物力资源浪费在低水平的重复建设上。

6.2信息版权问题

目前数字图书馆的资源库主要的信息来源是将图书进行数字化后得到的[5]。但是将作品进行数字化处理涉及到侵犯著作权人的复制权。因为,对数字化作品的复制、下载、盗版等更加容易。国家版权局国权(1999)45号文《关于制作数字化制品的著作权规定》第2条明确规定“将已有作品制成数字化作品,不论已有作品以何种形式表现和固定,都属于《中华人民共和国著作权法》所称的复制行为”。因此,在数字图书馆的馆藏信息资源建设过程中,要特别注意图书资源的版权保护问题。对于还处在著作权保护期限内的图书作品,要与作者协商在先,在取得许可之后方能进行数字化转换。

6.3建设资金问题

数字图书馆建设中包括:运行环境架设,硬件设备组建,软件系统开发以及馆藏资源建设,可见,数字图书馆建设是一个复杂和长期的工程,这也意味着,它需要庞大的资金支持。并且这笔不小的资金投入在很长一段时间内无法获得收益。而且,数字图书馆建设并投入使用以后,还需要专业人员对系统进行日常管理和定期维护。目前,省、市级数字图书馆以及各高校的数字图书主要依靠地区政府的专项拨款。所以,有限的资金来源和持续的资金投入是数字图书馆建设面临的又一难题。

数字图书馆是图书馆在信息网络时代的必然选择与必由之路,更是一个国家信息基础设施建设的重要方面,它在提供给人们丰富的知识资源和强大的服务机制的同时,也在逐渐改变着人们获取知识的习惯,相信日趋完善的数字图书馆将会成为人类文化与科技的进步的重要基石。

[1]郑巧英,杨宗英.数字图书馆的发展和研究[J].计算机工程,2000(1),731-736.

[2]李冠强.数字图书馆研究[M].北京:北京图书馆出版社,2002:20-21.

[3]邵锐.数字图书馆建设的关键技术[J].科技情报开发与经济,2006,16(6):36-37.

[4]陈燕.数据挖掘技术与应用[M].北京:清华大学出版社,2011.

[5]邵永初.数字图书馆中的著作权问题[J].江西教育学院学报,2011,32(5):14-15.

猜你喜欢
数据库数字化数字
家纺业亟待数字化赋能
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
答数字
数据库
数字化制胜
数字看G20
数据库
数据库
数据库