文/山东省禹城市图书馆 黄婷婷
图书馆数据存储中的问题及措施分析
文/山东省禹城市图书馆 黄婷婷
数字图书馆是采用数字技术构建的图书馆,具有储量丰富、查阅方便、不受环境影响等多种优点,但是数字化图书馆是传统图书馆的信息化,在储存以及运作过程中会遇到很多问题。本文对图书馆疏浚存储过程中的问题进行分析,并且就相对应的解决措施进行研究讨论。
图书馆;数字化;数据存储
在数据图书馆构建过程中,数据的存储以及数据的保存,对于图书馆而言是关键的过程。现在数字化图书馆越来越普遍,相对与传统图书馆,数字化图书馆表现出数据量庞大、存储周期长、数据类型多样、高度的可靠性和安全性的特点。不过规模的图书馆以及用户的特性,对于数据存储的具有重要的影响,因此在图书馆数据存储中,需要选用适宜的数据存储方法,并且采用多种数据存储技术,以保障数据的高效存储与管理。
目前数据图书馆的有多种存储方式,主要的有以服务器结构为主导的SAN方案和以专用服务器为主导的NAS方案:1.SAN可以使服务器与存储装置的带宽保持高效,而且这种方式数据备份以及恢复速度快,能够用于广泛的资源共享,但是安装相对复杂,而且成本较高;2. NAS防范通过SCSI与网络连接,可以提升文件服务器的速度,而且成本较低,一些厂商采用大容量硬盘以增加存储容量,这种方案节省空间,即插即用。两种方案各有优缺点,其中SAN主要用于存储量大的图书馆,而NAS用于中小型图书馆的建设,为了保障图书馆数据存储的效率以及成本,应该选择合适的额存储方案用于市局存储。
(一)存储容量不足
现代图书馆的功能齐全,而且借阅量大,图书资源丰富,随着图书馆的发展与使用频率增加以及组着对图书馆的要求不断加深,会导致图书馆的数据数据容量增加,导致现有的存储容量不足。为了解决存储容量不足,可以采用多种技术以提升图书馆数据存储效率。
1.利用压缩技术提高空间利用率。图书馆数据存储过程中,因为内部文件存在大量的相似性,通过对现有的数据进行对比分析,采用压缩技术删除冗余数据,并且对数据进行压缩。在相关的研究中,这种方式能够节约大量空间,使得总数据量只有原始数据的4%。这种压缩技术的基本原理是,通过对新文件与已经存在的文件进行Delta编码,并且将这种编码存储的系统中,从而实现数据的压缩。除了在数据存储过程中采取压缩数据之外,还能够对现有的资源进行ZIP压缩,节约传输空间,提升用户下载资源的速度,提升应用程序的远程使用效率。
2.利用消重技术提高空间利用率。在图书馆数据存储过程中,会因为备份操作导致大量的数据重复,虽然备份是图书馆的必要操作,但是大量的数据重复会使存储空间率降低,采用时间数据消重和空间数据消重技术,能够消除重复数据,从而提升空间利用率。目前的图书馆数据存储的特点是,数据相对稳定,需要长期保存,因此可以采用时间消重技术。消重技术通过将数据文献分割成数据块,并且根据数据块进行Hash查找,最终通过消重而达到节省空间的目的。
(二)数据备份问题域解决措施
为了保障图书馆数据的长期保存,使图书数据以及客户资料能够长期保存,因此对于存储系统的要求较高。为了保障图书馆数据存储的可靠性与恢复能力,需要采用数据备份功能,从而保证数据的恢复速度与能力。但是因为数字图书馆的数量庞大,因此在对数据空间的存储与备份中,会因为数据量大而导致备份时间长。
1.RAID阵列镜像技术。采用RAID阵列镜像技术是保障数据备份稳定性与速率的良好技术,这种技术能够保证当一个硬盘出现问题时,不会使整个系统陷入危机,任何足见都能够方便替换。其中冗余技术REID4是一种经济而且有效的方法,通过冗余盘的设置,使数据使用过程中能够及时找到故障盘,从而实现换盘。
2.停机备份。通过定时的停机备份,从而进行数据的冷备份,能够将系统中的所有数据进行有效的备份,而且传输的数据块,不会对系统以及数据造成损耗。通过新建同名实例,可以将所有的数据文件进行备份。
(三)存储空间利用率低的问题域解决措施
在对现有的高校的数字图书馆进行的调查中,许多的使用率不到50%,使图书馆的空间利用率能够进一步提升。为了保障图书馆的工作,高校图书馆管理员采用碎片整理来提升空间利用率,但是在针对图书馆的海量数据操作时,会耗费大量的时间,而且这种方法的效率较低。
1.自动精简配置。采用自动精简配置技术,能够有效的提升存储空间的利用效率。相对于传统配置方案,这种技术能够保证足够的使用效率。在相关的研究中,采用自动精简配置技术,能够提升100%的空间利用率,而且该方案不许手动扩展,采用虚拟化集成技术,就能够实现现有资源的超量配置。
数字图书馆是未来图书馆的主要趋势,无论数字图书馆的技术怎么变化,数据的存储与管理都是图书馆的关键技术,采用有效的存储技术,并且在存储中,采用合理的技术提升存储空间利用率、减少备份时间,是保障图书馆存储效率,方便用户使用的重要手段。对于图书馆进行集中存储与管理,是适应未来需求,提升我国图书馆竞争力的重要保证。
[1]李雷定,马铁华,尤文斌.常用数据无损压缩算法分析[J].电子设计工程,2009,17(1):49-50,53.
[2]朱立谷.重复数据删除技术解析[N].中国计算机报,2007-07-02(C07).
[3]王莉莉.基于DELTA压缩算法的大型数据库灾备关键技术研究[D].成都:电子科技大学, 2011.