图书馆:云时代数字图书馆的数据存储

2012-04-29 22:25龙文
教育教学论坛 2012年7期
关键词:数据存储数字图书馆云计算

摘要:信息时代,作为信息资源中心的图书馆面临着与日俱增的数据存储与管理问题,云计算的出现将图书馆的数据存储带来新的思路,图书馆可以借助云计算的分布式数据存储技术和相关的虚拟化技术来实现数据的存储与管理,从而实现更为智能、高效和可靠的数据存储。

关键词:数字图书馆;云计算;数据存储

中图分类号:G250.7 文献标识码:A 文章编号:1674-9324(2012)07-0194-03

一、云计算给数字图书馆数据存储带来的变革

云计算时代中,IT资源的应用前景将会变得象电力应用一样,通过互联网就能随时使用并按照使用量来计费。云计算是一种全新的计算方式,在这种方式中,通过互联网,将大规模且具有可擴展性的IT相关功能作为服务提供给多个外部用户,云计算将为数字图书馆的建设带来如下优势:第一,图书馆只需连接到互联网就能使用云计算的相关服务,减少了数字图书馆在IT建设方面的投入以及后期维护成本。第二,可以让数字图书馆更加专注于自己的核心业务建设,充分发挥信息技术应用于图书馆领域的效益,提供更加优质的服务。第三,相对于传统数字图书馆费时费力去购买和安装服务器搭建应用服务来说,云计算赋予数字图书馆更大的灵活性,以快速应对读者需求的变化。第四,根据云计算的性质,云服务提供商可为数字图书馆提供灾难恢复功能,因为很多图书馆并没有将灾难恢复构建到自己的数字图书馆建设中去。

二、认识云时代数字图书馆对数据存储的挑战

云计算是一项正在兴起中的技术,它的出现有可能完全改变用户现有的以桌面为核心的使用习惯,而转移到以Web为核心,使用Web上的存储与服务。数字图书馆的建设也可能因此迎来一个全新的云时代。首先,云计算和数据存储之间需要权衡的问题就是功能和开发成本,目前云计算提供的API比传统数据库系统的限制多很多,只提供了极小化的查询语言和有限的一致性保证。其次,易管理性在云计算中也极其重要,这也带来了新的挑战。和传统的系统相比,受负载变化幅度大以及多种多样的共享设备等因素的影响,在云计算中管理任务将更加复杂。然后,云计算和云数据存储的庞大规模也同样带来了新的挑战,现有的SQL数据库无法简单地处理放置在云中的成千上万的数据。最后,随着云计算的流行,预计会有越来越多的云应用场景出现,也将带来新的挑战。例如,未来可能会出现一些预载大量数据集(比如网络检索)的云服务,这样就需要从异构数据中提取有用的信息,也表明跨“云”服务可能出现。从上述可以看出,虽然云计算及其数据存储在适当应用中具有很大优势,但同时也面临很多技术难题需要解决。另外,数字图书馆进入云时代也需要考虑几个方面的问题:首先是其数据存储产品是否能够提供数据屏蔽,当数字图书馆采用云存储数据的时候,是否可以屏蔽敏感数据,需要数据取回时,可以解除屏蔽,这将确保关键数据只能由授权用户读取而免遭非法用户窃取。其次是否具备归档不活跃数据来改善网络延迟的功能,这将在一定程度上抵消网络延迟时间。

三、根据数字图书馆自身情况选择数据管理模式

从技术本质上讲,云计算是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物,云计算至今没有一个确切的定义,可以说每个人对云计算都有自己的认识。虽然云计算没有一个统一的定义,但云计算的分类还是比较标准的,根据服务模式把云计算分成:基础设施即服务(Iaas),平台即服务(Paas)和软件即服务(Saas);根据部署方式可以分成公有云、私有云以及混合云。公有云是指由专业的服务商建立IT基础设施直接向外部用户提供服务的有云,外部用户通过互联网访问服务,并不拥有云计算资源,目前典型的公有云有亚马逊的AWS、微软的Windows Azure平台等。对于使用者来说,公有云的最大优点是其所有的应用程序、服务及相关数据都存放在公有云上,使用者无需做相应的投资和建设。而最大的问题则是由于数据不存储在自己的数据中心,其安全性存在一定风险。同时,公有云的可用性不受使用者控制,这方面也存在一定的不确定性。私有云通常指为一个客户单独使用而构建的云,图书馆可以根据自己的需要搭建IT基础设施,面向读者提供云计算服务,图书馆拥有基础设施的自主权,并且可以基于自身的需要改进服务,进行自主创新。相对于公有云,私有云部署在图书馆内部,因此其数据安全性、系统可用性都完全由图书馆自身控制,私有云可以由图书馆自身的技术部门,也可以由云服务商进行构建。混合云,顾名思义是公有云、私有云的结合。公有云、私有云、混合云三者的关系有些类似互联网、内部网、外部网的关系。由于服务范围的不同,决定了公有云和私有云之间的区别和特点,数字图书馆建设过程中要从前期投入、部署的灵活性、数据安全、服务质量及稳定性、现有软硬件资源利用率等方面对采用公有云或者私有云作出一个评判和选择。

1.前期投入。在前期的投入上来看,公有云具有明显的优势。公有云最大的优点是,其所应有的程序,服务及相关数据都存放在公有云的提供者处,图书馆无需做最前期相应的投资和建设,也无需担心中后期的改进和升级,可以将有限的资金用在更好地为读者服务中去。

2.部署的灵活性。在部署的灵活性方面私有云比公有云更加具有优势,私有云的部署灵活性可以从两个方面来体现:首先是图书馆拥有基础设施,并可控制在此基础设施上部署应用程序的方式;其次则是私有云可以由图书馆自身的技术部门来构建,也可以由云提供商进行构建。

3.现有软硬件资源利用率。图书馆在数字图书馆的建设过程中,都会有很多旧有的服务器设备及信息资源应用。虽然公有云的技术很先进,但其对数字图书馆原有的信息资源应用的兼容性却不好,而私有云在这方面做得相对不错,而且私有云可以利用图书馆现有的硬件资源来构建,这样将会极大地降低数字图书馆的运行成本。

4.数据安全性。数字图书馆使用公有云目前最大的问题是,由于数据不存储在自身的数据中心内,其安全性存在一定风险。私有云则完全是图书馆单独构建并使用,因而可实现对数据、安全性和服务可靠性的最有效控制。对于数字图书馆来说,信息数据是其核心,是不能受到任何威胁的,这就决定了图书馆无法将其核心数据及应用放到公有云上运行。私有云可以部署在图书馆数据中心的机房内,也可以被部署在一个安全的主机托管场所。

5.服务质量和稳定性。就目前而言,公有云的服务质量还不确定,比如亚马逊公有云服务网络就曾经一个月斷网两次,公有云宕机对数字图书馆造成的影响不言而喻。私有云的部署一般在本地机房中,而不是在某一个遥远的数据中心,所以当图书馆读者访问那些基于私有云的信息资源应用时,其服务质量相对非常稳定,不会受到互联网不稳定的影响。

四、动态优化的数字图书馆数据存储

云计算、虚拟化等概念的出现极大地冲击了现有数字图书馆的数据存储体系,数据存储的需求开始添加新的元素,这导致传统的数据存储模式已经无法适应新条件下的数据存储的需求,对于简单的通过性能、容量的提升来满足数据存储需求的传统模式来说,越来越难以掌控全局。最终,摆在云时代数字图书馆面前的问题是:一方面,不得不面对现有数据存储问题朝纵深化发展,现有的存储系统和管理体系已经难以为继;另一方面,则是云存储、虚拟化、异构数据等概念又对数据存储提出了新的要求和挑战。

因此,当前所面临的情况要求云时代数字图书馆必须改变传统的数据存储体系,从机械、复杂的数据存储模式,摒弃改变具有明显弊端的传统存储系统和管理模式,走向动态优化的数据存储,这将是未来虚拟化、自动化的云数据存储发展趋势。首先需要明确的是,动态优化的数据存储不仅仅是软件和管理策略的制定,在新的数据存储理念和发展趋势下,数据存储开始融合软件、硬件、软件功能、管理策略、硬件平台的特性以及功能,才能成为一个完整的数据存储体系,无论是磁盘整列或者是整个存储网络,任何为了让数据更高效的存储、利用和保护的系统,都包括在新的数据存储体系之内。因此,从这个角度来说,动态优化的数据存储体系不仅仅是强大的软件和管理能力的体现,同时也是包括在一套智能的、消除了管理风险的体系下,实现了软件和硬件相结合,利用硬件特性和优势更好的、更智能的数据存储的过程。从另一个角度来说,动态优化的数据存储体系可以消除硬件投资成本与数据存储需求之间的矛盾。其目的是:以合理的成本,将正确的数据,放在最合适的存储位置上,这其中的含义包括创建一条高效的数据存储优化之路,提供业务敏捷性、服务水平管理以及经济节省,并向未来数字图书馆存储系统及云计算应用模式提供良好的扩展能力。总之,动态优化的数据存储目前已经成为趋势,动态优化的数据存储目前可以概括为五点:第一是通过智能存储管理方法来帮助使用者分析和优化数据管理;第二是动态优化的数据存储包括软件应用、管理策略和硬件平台;第三是自动化,与虚拟环境集成,按策略自动迁移并能轻松找到数据;第四是优化,抛弃传统存储架构,提供更好的SAN、可验证的数据保护;第五则是无缝扩展,按需购买,并为将来升级存储和云计算模式提供无缝扩展能力。有报告表明,目前大部分的存储预算,都将投入到增加虚拟化使用、信息安全计划、改善数据备份和恢复、升级网络基础设施等云计算技术下的动态优化数据存储上来,其目的是实现更为智能、高效和可靠的数据存储。

云计算将数字图书馆的数据存储带入一个新的时代,其存储技术是数字图书馆数据存储的变革性突破。云计算为数字图书馆的建设提供了一个更加简单、廉价的数据存储模式,随着计算技术的日趋成熟完善,不断解决云计算在应用过程中遇到的问题,才能使云计算技术在数字图书馆数据存储中发挥更大的价值。

参考文献:

[1]杜海宁.基于云计算的图书馆海量数据存储研究[J].图书与情报,2010,(3):99-101.

[2]陶蕾.“云”下的图书馆网络存储探讨[J].图书馆学研究,2010,(07):66-70.

[3]彭骏.基于云计算的图书馆数字资源保障连研究[J].大学图书情报学刊,2010,(8):49-52.

[4]楼宏青.高校数字图书馆信息管理和存储策略[J].图书馆论坛,2006,(12):132-136.

[5]张叶红.云中漫步:图书馆云计算应用[J].农业图书情报学刊,2010,(12):211-214.

[6]龙文.云时代数字图书馆的抉择——公有云、私有云与传统数据中心[J].中国教育信息化,2011,(19):9-10.

作者简介:龙文(1981-),男,2004年毕业于郑州轻工业学院,本科,就职于信阳师范学院图书馆,馆员,主要从事数字图书馆研究,已发表论文数篇。

猜你喜欢
数据存储数字图书馆云计算
开源数据库数据存储的实现路径分析
基于Android开发的APP数据存储研究
哈希算法在物联网数据存储中的应用
基于云计算的数字图书馆建设与服务模式研究
基于云计算的移动学习平台的设计
实验云:理论教学与实验教学深度融合的助推器
云计算中的存储虚拟化技术应用
刍议数字图书馆计算机网络的安全技术及其防护策略