云计算环境下图书馆IT服务向IaaS迁移探析

2012-07-14 08:26王世慧济南大学图书馆济南250022
图书馆理论与实践 2012年8期
关键词:供应商基础设施服务器

●王世慧 杜 伟(济南大学 图书馆,济南 250022)

1 基础设施即服务 (IaaS) [1]

目前现有的研究成果对云计算的定义并没有达成共识。美国国家标准技术研究院(NIST)认为云计算是一个模型,这个模型可以方便地按需访问一个可配置的计算资源(如网络、服务器、存储器、应用程序及服务)的公共集合。这些资源可被快速提供,并且可使管理成本最小化和服务供应商的干预最小化。这个云计算模型具有按需自助服务以及拥有广泛的网络存取平台和资源池,同时具备快速弹性、服务检测等五个基本特征。[2]

基础设施即服务(Infrastructure as a Service,简称IaaS) 是云计算的三种服务模型之一,它将硬件(服务器、存储器及网络)和相关软件(操作系统虚拟技术、文件系统)作为服务交付给用户使用。它是一个主机模式,包括网络存取、路由服务及存储。IaaS供应商通常为用户提供硬件和管理所需存储的应用程序和运行应用程序的平台服务,包括带宽、内存和存储的调整,具有基于动态服务的价格优势。IaaS供应商为用户提供服务器、存储空间和网络组件以满足他们的计算需求,用户负责部署、管理软件服务。在一个IaaS环境中,用户可以运行任何软件、控制操作系统、Web服务器、防火墙等。它具有快速供应、可扩展、量入为出、自动化管理等优点。Amazon弹性云(Elastic Compute Cloud,简称EC2) 和简单存储服务(SimpleStorageService,简称S3) 是IaaS产品的典型。

IaaS为用户创建虚拟机并提供运行所需的云计算环境。使用这一技术的前提是创建虚拟机,装载初始创建所需的软件和最终运行于云中的软件,包括用户定制软件和正版软件。创建虚拟机后,将它上传到IaaS供应商的托管环境,此时配置IaaS供应商提供的所需存储器。配置完成,虚拟机可以自动寻找并部署可运行于该虚拟机上的硬件,然后开始运行。一旦虚拟机开始运行,IaaS供应商要确保该虚拟机以一个整体健康的状态持续。运行所需的应用程序的原始存储归IaaS供应商所有、维护,监控所有的用户定制软件和正版软件以确保它们的正常运行是用户的责任。对于没有时间改写应用程序代码的用户,IaaS是一个将应用程序迁移到云的灵活的、最好的选择。由于实现IaaS的核心是实现IT设备尤其是服务器的虚拟化,而目前开展IaaS服务所需的虚拟化技术和运营技术相对成熟,因此IaaS被公认为是部署云计算服务的最佳切入点。

2 图书馆IaaS应用现状

图书馆为读者提供服务以及需要利用有限的资源寻找恰当的解决方案的使命,对他们要采用的云计算服务模型产生深远的影响。通常图书馆内部缺乏先进的IT管理人员,需要外部或者其他机构提供IT服务支持,以及可以使用基于云的政策、法规来管理图书馆。以上这两个因素使SaaS(Software as a Service) 和PaaS(Platformas a Service) 更加令人心动,而IaaS方式很难被接受。虽然IaaS对于图书馆来说不是第一选择,但是许多图书馆一直在研究使用IaaS的新方法,它拥有巨大的市场。Amazon EC2为图书馆IT提供基础设施,如提供按需使用的虚拟服务器、根据用户所使用的操作系统(包括Linux及Windows) 配置不同大小的服务器。EC2利用它们的S3服务为机构提供了基本无限的存储,兼顾数据和服务器的快照能力,在机构的专用网络中包含EC2服务器的能力。[3]这些措施可以从基础设施层面解决许多长期困扰图书馆网络信息管理和服务中存在的问题,如硬件和软件的更新总是赶不上技术的进步,高薪聘用的IT管理人员始终无法融入图书馆服务团队等。[4]

当然,目前关于IaaS的批评也有很多。包括政策法规及技术上的问题,比如如何备份及查找存储在云中的信息,如何保证数据安全和可靠性,如何在一个分散的环境中管理服务等。针对这些批评,云供应商提出相应的措施来解决其中一些问题。如Amazon EC2服务中增加了云服务器与机构网络之间的专有连接(虚拟私有云)、基于存储的提供位级快照及整个服务器实例的持续性的弹性块存储(ElasticBlock Store,简称EBS)及服务器监控机管理工具。Amazon还建立了可运行于它们的云平台,适用于所有服务的服务水平协议 (ServiceLevelAgreement,简称SLA)。[5]这些服务水平协议不仅规定了正常运行时间,而且解决了安全及法律问题。

无论批评还是赞扬,很多用户还是看好其前景,并给予肯定。许多图书馆将它们的数字馆藏、网站、备份图书馆集成系统等服务交付Amazon的EC2或者S3托管。例如哥伦比亚特区公共图书馆使用Amazon EC2服务托管网站、使用Amazon S3服务备份图书馆自动化管理系统等。美国俄亥俄州图书馆与信息合作网(OhioLINK) 使用Amazon’s WebServices托管一小部分它们的数字公共资源,如肯特州的百年收藏,并且正在测试在云中的服务器管理以及DSpace馆藏软件的局限。英国图书馆使用Amazon EC2提供Web全文检索服务,使用了900GB的磁盘空间。[6]维克森林大学Z.SmithReynolds图书馆自2008年起,一直专注于将图书馆的主要IT迁移到云或托管环境,并于2009年将本馆的ILS及其他的一些应用包括网站、发现服务及可以实施的数字图书馆服务迁移到Amazon’sEC2。[7]2009年7月美国国会图书馆与DuraSpace公司的DuraCloud项目的主要目的是检测云技术在维持数字内容永久访问上的性能,使一个机构在不需要本地构建IT基础设施的情况下,通过云计算机提供数据的存储和访问。[8]CALIS以基础实施服务IaaS/HaaS和基础平台服务PaaS为基础,创建了数字图书馆云服务平台,将分布在互联网中各个图书馆的资源和服务整合为一体,形成一个可控的自适应的新型服务体系。[9]

3 图书馆IT服务向IaaS迁移探析

图书馆将其主要IT服务移到云或者托管环境之前,需要考虑以下几个方面:

(1)服务水平协议。服务水平协议是指IT服务供应商和客户之间就服务提供中关键的服务目标及双方的责任等有关细节问题而签订的协议,它是一种衡量一个云供应商服务平台舒适度的方法。服务水平协议可以作为图书馆选择IaaS服务供应商的参考,比较各服务供应商的服务水平和服务能力,制定可以确保图书馆正常工作时间、符合图书馆业务特点的具有法律效力的保护条款。

(2) 成本及承受能力。虽然将图书馆IT主要服务迁移到IaaS,可以以极低的成本投入获得极高的运算能力,克服服务器访问限制的瓶颈,降低有关的维护费用等,[10]但在迁移之前要充分考虑所需要的人力、技术资源和费用,需要了解云供应商账单上的每一项服务要素以及其计费方式。如,供应商是基于流量、存储空间、服务CPU运行时间来计费,还是将这些因素综合考虑来收费,并且还要充分考虑随着时间的推移如何看待成本问题,以及图书馆的承受能力。图书馆应当认识到实施云计算不是要舍弃原有的IT基础设施资源,而是利用云计算系统高效地监控管理现有的和新增的IT基础设施资源。

(3)安全问题。目前尚未出现针对云计算架构的安全规范和标准。“云”是一个虚拟的系统,数据的物理存储位置可能分布在多个地方,缺乏相应的技术和法规作支撑,数据安全难以得到保障。此外,云服务供应商拥有比云用户大的权限,可能使用户的隐私信息难以保护。

(4)图书馆信息人员的知识和能力。图书馆IT服务迁移到IaaS平台,为图书馆的信息人员提供了便捷的管理功能,同时对他们的知识和能力提出了更高的要求。

图书馆将其主要IT服务向云或托管环境迁移的同时,还要注重将图书馆的关键系统向开源选项的迁移。当然这两个目标并不总是同步的,有一些应用程序肯定不是开源的,但可能在托管环境中工作良好,反之亦然。表1显示一些已被迁移或者正在向云环境迁移的图书馆服务。预计随着时间的推移那些未出现在云中的基于PaaS的服务(如图书馆网站、数字图书馆应用程序及机构库)都可迁移到I-aaS平台。

表1 当前基于云的解决方案列表

在将ILS和一些其他的应用如网站、发现服务以及可以实施的数字图书馆服务迁移到IaaS时,可采用Amazon EC2。Amazon具有可扩展的服务器解决方案及易用的管理控制台。例如,许多基于服务器的图像获取可以与开源或者专有平台合作。此外,他们的EBS服务为用户提供方便设置大容量磁盘空间的能力。最后,Amazon管理控制台使用户可以轻松地开始、结束及管理自己的服务器,创建基于卷的EBS的最新发展,使用户在不丢失实例的情况下停止它们。除此之外,EBS具有快照备份功能,通过此功能,数据可以被存储在Amazon的S3环境中。通过EBS,用户可以得到一个备份卷来存储实例,这样就不用依赖原始数据的活动。Amazon还有如在EC2服务层设置一个防火墙及弹性IP地址这些长期存在的功能。这些功能简化了用户的实施,并使用户轻松地在开发环境及生产环境之间切换。除了这些功能之外,Amazon提供许多其他功能,包括自动负载平衡、通过虚拟私有云与校园网连接等。[11]

4 图书馆IT服务向IaaS迁移的评估

4.1 服务质量及稳定性

许多IaaS供应商提供的合法的协议集及SLA,令人满意地解决了图书馆所关心的数据安全和正常工作时间。大多数图书馆早已熟练地使用SaaS模式提供服务,并越来越依赖互联网连接,因此图书馆将其核心应用基础设施移出校园网不再有障碍。此外,IaaS供应商提供的可靠、有效的服务使寻找一般问题如服务器配置、备份及记录的解决方案相对简单。

4.2 对图书馆服务的影响

图书馆的一些重要应用常常需要专门的软件或者全局、复杂的配置,通过使用一个基础设施层的服务,图书馆可以在线使用而无须寻找一个支持基础技术的正确版本的服务。此外,可以快速安装新的应用而无须将重心放在确定可用的磁盘空间上,意味着提供基于技术的图书馆服务远远快于使用本地硬件。将图像和数据从它们目前运行的硬件上分离,使图书馆在硬件出现故障时有能力将停机时间减到最少。

当然,将图书馆的关键基础设施移出校园网意味着在因特网出现连接问题时,图书馆将无法提供自己的关键服务(例如网站、ILS、发现层)。而解决这一意外的一个完整计划还没有制订,因此可在图书馆配置一个本地机器,提供一个简单版的图书馆网站及一个图书馆目录的快照,可运行在图书馆发现层的本地安装版上。

4.3 与本地技术解决方案的成本比较

计算技术的总拥有成本(TCO)可能是困难的,例如,Golden发现,当将电力和管理费用计算在内时,Amazon的定价与内部管理服务器成本相当。[12]但是图书馆经常面临更换服务器或者大的磁盘阵列的需要,更换硬件的成本与同一时期的EC2和EBS的数据量的成本对比,就有可比性。如Amazon EC2以每小时10美分的价格出售1.0GHz x86 ISA计算单元,增加新的计算单元或运行实例,只需2到5分钟。[13]通过维克森林大学Z.Smith Reynolds图书馆的实际使用,发现他们的大多数应用可以运行于两个Amazon EC2小服务器上 (1CPU,1.7GB Ram)。[6]

4.4 下一步要解决的问题

虽然图书馆向云计算的迁移可以称作成功,但仍存在一些问题需要解决。首先,虽然许多IaaS供应商提供了好的文档,工作人员仍需要进行一些额外的培训,以了解云环境中系统的体系结构及存在的安全问题。其次,虽然某一时期某个IaaS供应商是市场上服务最成熟的,但是市场快速变化,要求图书馆根据变化进行调整以确保使用最新的选项。例如,永久映像的建立是减轻图书馆向Amazon EC2转换的重要一步,随着技术的进步,Amazon EC2还使图书馆快速安装及配置新服务器成为可能,它可以与校园IT服务协调,为用户提供无缝方式,这要求图书馆及时调整工作策略以适应技术的更新。

5 结论

总之,IaaS服务降低了成本投入,因为与提供计算能力、存储及网络相关的基础设施并不需要用户购买和维护。IaaS供应商负责这些资源,客户只需要支付他们使用时所花费的费用。IaaS的总结见表2。[14]随着IaaS市场的成熟,我们可以寻找更加实惠和标准的服务,因此,随着图书馆越来越充分地使用基于I-aaS平台的应用,分享和配置不同应用目的的服务器变得可能。

表2 IaaS总结

[1] SushilBhardwaj,et al.Cloud Computing:AStudyof Infrastructure as a Service (IAAS)[J].International Journal of Engineering and Information Technology,2010,2(1):60-63.

[2] Peter Mell,TimGrance.The NISTDefinition ofCloud Computing[EB/OL].[2010-11-17].http://csrc.nist.gov/groups/SNS/cloud-computing/.

[3] Amazon Web services.Amazon ElasticComputeCloud(Amazon EC2)[EB/OL].[2010-09-17].http://aws.amazon.com/ec2/#details.

[4]范并思.云计算与图书馆:为云计算研究辩护[J].图书情报工作,2009,53 (21):5-9.

[5] Amazon Web services.Amazon EC2 Service Level A-greement[EB/OL].[2010-09-20].http://aws.amazon.com/ec2-sla/.

[6] Ellyssa Kroski.Libraries and the cloud [EB/OL].[2011-01-12].http://www.online-information.co.uk/online2010/files/conferencing/50/Kroski,%20Ellyssa.pdf.

[7] Erik Mitchell.Using Cloud Services for Library IT Infrastructure[EB/OL].[2010-08-20].code{4}lib Journal.2010(9):http://journal.code4lib.org/articles/2510.

[8] Libraryof Congress.DuraCloud[EB/OL].[2010-12-12].http://www.digitalpreservation.gov/partners/duracloud/duracloud.html.

[9]王文清,陈凌.CALIS数字图书馆云服务平台模型 [J].大学图书馆学报,2009(4):13-18,32.

[10]李永先,等.云计算技术在图书馆中的应用探讨[J].江西图书馆学刊,2009(1):105-106.

[11] Amazon Web services.Amazon Elastic Block Store(EBS)[EB/OL].[2010-09-17].http://aws.amazon.com/ebs/.

[12] Bernard Golden.The Case Against Cloud Computing,PartFour[EB/OL].[2010-11-17].http://www.cio.com/article/480595/The_Case_Against_Cloud_Com puting_Part_Four.

[13] MichaelArmbrust,et al.AbovetheClouds:ABerkeleyViewofCloudComputing[EB/OL].[2010-10-11].http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.pdf.

[14] Keith Pijanowski.Understanding public clouds:I-aaS,PaaS,SaaS[EB/OL].[2010-10-11].http://www.keithpij.com/Home/tabid/36/EntryID/27/Default.aspx.

猜你喜欢
供应商基础设施服务器
农业基础设施建设有望加速
公募基础设施REITs与股票的比较
通信控制服务器(CCS)维护终端的设计与实现
PowerTCP Server Tool
振动搅拌,基础设施耐久性的保障
得形忘意的服务器标准
充分挖掘基础设施建设发展潜力
计算机网络安全服务器入侵与防御
供应商汇总
供应商汇总