王政军 单承伟 俞小怡 董晓梅
(大连理工大学图书馆,辽宁大连116023)
高性价比图书馆虚拟化平台的建设与实践
王政军 单承伟 俞小怡 董晓梅
(大连理工大学图书馆,辽宁大连116023)
[目的/意义]利用虚拟化技术提高IT基础架构管理水平和资源利用率是图书馆数据中心发展的趋势,图书馆如何构建一套高性价比的虚拟化整合方案是迫切需要解决的问题。[方法/过程]文章介绍了虚拟化的相关技术,分析比较了虚拟化平台的技术指标。以大连理工大学城市学院图书馆的虚拟化实施方案为例,阐述了高性价比虚拟化方案的技术支撑原理、设计思路及具体实施方法。[结果/结论]通过具体实践证明,高性价比虚拟化平台的解决方案体现出高效稳定、便于管理等技术特点,有效解决了中小型图书馆因资金紧张而不能进行虚拟化改造的问题,对指导实践具有重要意义。
图书馆;虚拟化平台;虚拟化技术;性价比;vSphere
虚拟化能使信息技术易于整合到面向服务的体系结构中,可实现数据中心的本地管理自动化,为管理者提供高效、可靠、可预见的服务[1]。利用虚拟化技术,能够加速智能动态数据中心的发展,促进敏捷度,缩短停机时间,增强灾难恢复等。目前,虚拟化整合技术已经成为高校图书馆数据中心关注的热点。
较大的虚拟化平台采用了大量企业级高端硬件,以满足大量虚拟机对硬件资源的需求[3]。如大连理工大学网络中心虚拟化平台,运行500多个虚拟机,配置高档服务器构建虚拟集群组。使用企业级SAN光纤集中后台存储,采用企业级万兆核心网络交换机,采用VMware vSphere的最高级版本Enterprise Plus作为虚拟化管理平台。整体资金投入在800万以上。如果图书馆按照此种模式构建自己的虚拟化平台,资金问题会让很多图书馆望而却步,一些中小型图书馆更无法承受如此大的资金投入。因此,设计一套性能稳定且投入合适的小型虚拟化平台搭建方案,对于资金紧张的图书馆实现虚拟化整合具有十分重要的现实意义。
搭建虚拟化平台基础架构包括服务器、存储、网络交换机以及虚拟化管理软件[2]。在技术指标满足实际需要的情况下,降低整个虚拟化方案的成本,需要考虑以下几个方面。
1.1 服务器
服务器为虚拟化平台提供最基本的底层硬件资源,虚拟化平台之上的虚拟机所使用资源来自于服务器的处理器、内存、硬盘、网络等。虚拟主机的架构图如图1所示。
图1 虚拟主机的架构
采购大内存的服务器。虚拟化使不同操作系统的多个虚拟机在同一物理机上独立并行运行,所有虚拟机使用的硬件资源都被虚拟化服务层映射到实际的物理机资源上。独立的操作系统对内存的占用是绝对的,在相当长一段时间不会释放,而CPU的占用随操作系统中的应用运行情况实时地占用和释放。所以虚拟化平台资源消耗较多的是内存资源,对处理器的消耗并不大。减少处理器的数量,也降低了虚拟化管理软件的成本。
服务器本地存储应注重安全可靠。所有应用的数据均存储于后台的集中存储上,虚拟化主机本地硬盘只是存储虚拟化平台操作系统,不需要较大的存储空间。为保证虚拟化操作系统的数据安全性,物理主机只配置两块硬盘做RAID1进行镜像备份。
服务器采用基于双网卡的万兆网络。由于多台虚拟机对外提供服务,网络流量集中于物理主机的物理网卡上,虚拟化主机对网卡的性能要求比较高[5]。存储数据的传输也使用以太网络,服务器采用双万兆网卡,保证网络和存储性能,而且能够达到链路冗余备份的效果。
具体的虚拟化物理服务器技术指标如表1所示:
表1 小型虚拟化物理服务器技术指标
虚拟化集群组中所需服务器(物理主机)的数量,主要取决于实际要运行的虚拟服务器的数量。对于中小型图书馆,70~100个虚拟服务器便可满足其作为数据中心的需要。每台搭载64G内存的物理服务器通常可以虚拟出30~40台虚拟服务器[6],按照为每台虚拟服务器划分2G内存来计算,中小型图书馆使用2~3台物理服务器便可构建虚拟化的集群组。
随着业务的增长,可通过增加物理服务器数量来扩展虚拟化平台的容量。初期设计部署的物理服务器主机必须大于两台,这样才能达到互为冗余备份的效果,保证所有虚拟服务器通过主机迁移(VMotion)游离于多台物理服务器,提高整个虚拟化平台的持续性。
1.2 集中存储
目前流行的存储技术主要有SAN光纤存储、ISCSI网络存储、NAS存储。3种主流存储技术的具体情况比较如表2所示:
表2 主流存储比较
SAN光纤存储的存储性能好,高端的数据存储一般都采用SAN光纤的存储架构,但资金投入大,日后扩展比较复杂。NAS存储比较廉价,主要用于静态文件存储服务器,适应对IO性能要求不是很高的场合,不能满足虚拟化平台的需要[7]。ISCSI网络存储近几年得到很大的关注,得益于万兆网络的发展与普及,其管理形势与SAN存储比较接近。ISCSI存储性能越来越接近于SAN,由于其利用廉价网络作为传输介质,非常适合中小型数据中心使用。
1.3 万兆网络
高性价比的虚拟化架构必须使用万兆以太网络。万兆网络已经非常成熟,根据传输介质的不同,有光纤、铜轴电缆、双绞线3种形式。由权威组织测试报告得知,不考虑干扰因素,3种传输形式效率是一样的,但双绞线抗干扰性能稍微差些。在比较规范的机房环境中,采用质量较好的7类双绞线,可以排除干扰的影响。使用双绞线介质的万兆网卡、网线以及交换机等一系列设施都要比光纤和铜轴电缆便宜得多,建议中小型虚拟化的网络架构采用双绞线传输的万兆网络。
1.4 虚拟化管理软件
虚拟化管理软件主要有Citrix XenServer、微软Windows Server 2008 Hyper-V、VMware vSphere。VMware vSphere提供最领先的技术,占有大部分的市场份额。vSphere主要有Standard、Enterprise和Enterprise Plus 3个版本,虽然所有的vSphere的软件介质是一样的,但是根据版本的license不一样,可使用的功能不同,价格也有较大的区别。vShpere的Standard版本含有vMotion和HA的功能,vMotion可保证虚拟服务器不间断的迁移于物理服务器之上,HA可监控虚拟服务器操作系统状态,并根据错误状态自动更换物理主机运行。考虑性价比的因素,中小型图书馆的虚拟化方案采购Standard版本的License授权即可,既能保证虚拟化的实施,又可减少资金的投入,保证业务的持续性和高可用性的需求。
大连理工大学城市学院是大连理工大学下属的三本独立学院,属于中小型高校图书馆。该图书馆数据中心原有物理服务器50多台,主要用于关键业务、数字资源以及网络管理等方面。数据中心的核心网络为千兆以太网络,分散式存储方式(应用数据存储于物理服务器本地硬盘)。该馆已经多年调研,希望通过虚拟化整合方式实现本地管理的自动化和智能化,提高系统性能和稳定性,缩短停机时间、增强灾难恢复等。为能顺利进行该项工作,该馆先后邀请大连理工大学的网络中心、电信学院以及图书馆等专家进行论证,以大连理工大学网络中心和图书馆的虚拟化方案的实际经验为基础,提出了高性价比的小型虚拟化服务器整合方案。
2.1 方案设计
首先,建立一套集中共享的虚拟化后台存储,将图书馆业务数据集中存储于可靠的虚拟化存储系统中,在保证数据的完整性和可靠性的前提下降低存储成本。其次,利用虚拟化软件建立虚拟服务器集群环境,将安装有图书馆关键应用的服务器实现HA(高可用性)的连接,构建一个以共享存储为基础、以虚拟化为核心的服务器架构。
本方案采用IPSAN(基于ISCSI存储区域网络)的共享存储系统部署方式。将基于ISCSI存储阵列产品通过高性能的万兆网络交换机相连,并采用万兆以太网络协议通信,这些链接基于固有的网络通道和SCSI(通过SCSI到网络通道转换器和网关),多路的网络通道交换机在主服务器与存储设备之间提供相互连接,实现链路的负载均衡和冗余备份,确保连接的可靠和高效。
保证系统资源的负载均衡。充分利用虚拟环境中虚拟机可动态迁移的特性,将由虚拟管理软件生成的虚拟主机文件存放在IPSAN共享存储系统上。通过共享的IPSAN存储系统,最大化地发挥虚拟架构的优势,当某个关键应用的服务器出现问题时可将虚拟机动态迁移到别的服务器,保证关键业务的连续性。VMWare虚拟化软件采用VMotion技术将虚拟机动态迁移到另一个可用资源充足的主机,VMware的HA在监测到虚拟机的运行状态出现问题时,可将虚拟机重新注册到资源可用的物理主机并启动运行。
2.2 系统架构
通过以上技术细节的分析可知,低成本虚拟化方案是在保证虚拟化能为图书馆提供IT基础架构的稳定可靠、性能优越、便于管理的前提下,通过新的技术和方式来降低成本。本方案的系统架构考虑到虚拟化实施所必须考虑的技术环节,包括服务器、存储、网络、管理软件等方面的因素。系统架构图如图2所示:
图2 小型虚拟化架构图
采用两台DELL R620服务器。服务器的配置考虑CPU的单路多核、内存扩展性大、网络万兆传输等因素,服务器低端高配,既节省了费用,又不失服务器的性能。配置如表3所示:
表3 服务器配置信息
表3 (续)
万兆交换机为Extreme公司的Summit X650型号,该交换机能为虚拟化主机ESX提供高速的网络传输性能。物理服务器与交换机之间都使用双路万兆连接,利用虚拟化vSphere的多链路整合功能,实现服务器与存储之间的负载均衡和冗余备份,提高网络链路的性能和稳定性。由于担心旁杂的网络数据包干扰虚拟化网络存储的数据传输,该万兆交换机只是提供虚拟化架构的网络存储数据交换,不开启三层路由功能,只作为两层交换的高效交换设备。数据中心原有的网络核心交换机继续作为局域网内部路由交换的核心交换机,为虚拟化平台上的应用提供以太网网络的数据交换功能。
集中存储使用DELL MD3600i存储,该设备提供万兆ISCSI数据接口,保证虚拟化ESX主机与存储之间的高速数据传输。存储空间采用两种硬盘,分别为SAS盘4.5T和SATA盘15T,其中SAS盘用来存储对IO要求比较高的数据,如操作系统文件系统和数据库应用等,而SATA盘用来存放静态文件等数据。
虚拟化软件vSphere采用Standard版本,购买vCenter标准版license以及2个CPU的ESX授权即可。Standard版本提供了vMotion和HA的功能,以保持业务应用的持续有效性。
2.3 方案优势
实现了图书馆数据中心的虚拟化整合功能。通过VMware技术和ISCSI网络存储技术实现数据中心的完全虚拟化,提供完善的虚拟机管理功能,包括虚拟机的创建、删除、远程管理以及在线迁移(vMotion)、高可用性群集(HA)等。得益于虚拟化平台的可管理性、高效性和持续性,图书馆的实际服务取得了更好的效果。
提高了图书馆IT基础架构的可用性和可靠性。在本方案的具体实验中,高可用性群集(HA)能够实现计划内外的停机故障恢复,保证在可接受的停机时间范围内的故障恢复。通过vMotion技术实现不停机的虚拟机在线迁移,实现虚拟机系统的高可用性。
减少了虚拟化整合的资金投入。该虚拟化平台花费15万元人民币,实际运行50多台虚拟服务器。相比于传统的虚拟化方案百万乃至千万的投入,该方案大大降低了投入。在虚拟机数量不大的情况下,总体性能完全达到虚拟化整合的技术指标。该方案实施后,减少机房内的电力消耗,符合国家的节能减排和绿色数据中心的要求。
节约了人力成本。虚拟化整合后,依赖于成熟的虚拟化管理工具,大量减少系统维护员的工作量。
高性价比虚拟化方案是为解决中小型图书馆经费投入有限而设计的,通过技术理论和实践效果来看,该方案能够满足中小型图书馆对虚拟化整合的需求。虽然低成本是通过压缩硬件和软件成本来实现的,但整个方案基于切实可行的技术指标实现,所采购的软硬件必须满足本文所提出的技术指标才能达到高性价比的稳定可靠的虚拟化整合效果。如果盲目的追求成本压缩而采购不符合技术指标的软硬件产品,可能导致系统瓶颈而发挥不了虚拟化整体功效的不良效果。总之可以采购低端的软硬件产品,但必须是技术指标符合要求的品牌信的过产品。
虽然虚拟化整合技术已经很成熟,但是针对不同的应用需求构建不同的方案值得深入研究。本文构建的中小型图书馆高性价比虚拟化方案就是一种探索。在构建合理完整的高性价比虚拟化整合方案中,不仅要追求虚拟化的管理性、健壮性和可持续性,还注重系统的升级和扩展性,对实际应用具有很好借鉴意义。
[1]陈忠安.SWsoft虚拟化技术[J].软件世界,2007,(13):14-15.
[2]赵华茗.基于虚拟机的高可用信息服务平台[J].现代图书情报技术,2009,(12):18-24.
[3]Abramson D,J ackson J,et al.Intel Virtualization Technology for Directed I/O[J].IntelTechnologyJournal,2006,10(3):1792191.
[4]Nanda S,Chiueh T.A Ssurvey of Virtualization Technologies[R].Technical Report TR2179,Stony Brook University,2005.
[5]何晓龙,成凯.透视虚拟化技术[J],软件世界,2007,(11):17.
[6]周俐军,林泽东,刘伟科.基于VMware的高校数据中心虚拟化管理探究[J].中国管理信息化,2009,(8):65-66.
[7]鲁松.计算机虚拟化技术及应用[M].北京:机械工业出版社,2008.
(本文责任编辑:郭沫含)
The Research and Practice of High Cost-effective of Library Virtulization
Wang Zhengjun Shan Chengwei Yu Xiaoyi Dong Xiaomei
(Library,Dalian University of Technology,Dalian 116023,China)
At present,virtualization technology is getting mature,using virtualization technology to improve management level and resource utilization has become the main trend in data center.But traditional virtualization integration solution need for a costly investment.For library,which is short of funds,how to build a high cost preformance plan of virtualization integration,is the decision makers and technical staffs needed to solve.Through the related research,the paper compared and analyzed the technical indicators of virtulization technology platforms,then designed and deployed a highly cost-effective solution of virtulization integration.It is very valuable for the units who are short of money but urgent need virtulization reform.
library;virtualization platform;virtualization;cost-effective;vSphere
10.3969/j.issn.1008-0821.2016.02.018
TP393
A
1008-0821(2016)02-0096-04
2015-10-14
国家自然科学基金面上项目“支持社会化创新的在线社区知识活动动力学研究”(项目编号:71371040)和青年科学基金青年项目“时变在线社会网络中舆情传播与演化动力学研究”(项目编号:7140010353)的研究成果。
王政军(1980-),男,馆员,工程硕士,研究方向:数字图书馆。