张培宾
(郑州航空工业管理学院 图书馆,河南 郑州 450015)
某校图书馆信息中心虚拟化探讨
张培宾
(郑州航空工业管理学院 图书馆,河南 郑州 450015)
针对目前该校图书馆存在的服务器故障、数字资源安全性、服务保障水平和管理难度等问题,进行了详细分析,提出了机房改造解决方案,并总结了采用新方案后可达到的预期目标。
图书馆;服务器虚拟化;存储虚拟化;Vmware
图书馆作为学校的文献信息资源中心、学习交流中心和知识传播的重要基地,拥有丰富的图书文献资源和数字资源。该校图书馆的信息中心部门负责校园网的规划、建设、运行、管理和维护工作,利用现代化的教学手段为学校的教学和科研服务。
目前学校的新校区网络基础建设已经基本完成,当前主要任务是如何发挥机房服务器的最大作用,如何方便的管理配置服务器,如何处理图书馆海量的数字资源,以及如何安全合理高效的利用服务器资源。
目前图书馆信息中心存在的问题有:
(1)基础设施复杂,管理工作量大。目前有20余台服务器和大量的网络设备。
(2)单点故障多,服务保障水平较低。系统安全存在隐患,缺乏系统冗余和安全备份,如服务器宕机,当前服务马上终止,影响正常的教学和办公活动;部分服务器没有提供数据备份功能,一旦硬件损坏或是受到恶意攻击将会造成不可挽回的损失。
(3)软硬件资源分配不合理。如DNS和DHCP服务负荷较轻,但仍占用一台服务器;由于各院系部Web站点共用一台服务器,导致负荷过大。由于图书馆对资源存储容量要求很高,而目前只有一台磁盘阵列,考虑到以后的需求和数据的安全备份与共享,应依据实际情况增加存储设备。
(4)应用环境复杂,统一管理困难。目前的应用主要有流量控制、防火墙、身份认证、邮件服务、Web站点、SSL VPN等多种服务,这些服务分散在各个服务器上面。
(5)机房空间不足。当实验或测试新业务时,缺乏硬件支持,无法搭建实验环境用于教学实验。
服务器虚拟化(Server Virtualization)是指多个操作系统在同一时间一起运行在同一台主机上。通过这种技术,一台机器可以支持像Linux、Windows、Unix等操作系统一起运行,而不需要重启机器以切换操作系统。简单地讲,服务器虚拟化是将物理机器、操作系统及其应用程序“打包”成为一个文件,称之为Virtual Machine(VM)。虚拟化将提高服务器的利用率,减少系统管理的复杂度,促进服务器的可用性,减少服务器的需求数量,节省投资和维护成本[1]。
数据是数字图书馆的核心,它和各种应用接口一起运行在整个信息系统的底层,是图书馆各项业务正常运行的基石, 为此要为它提供一个保证数据安全的环境。由于目前内部存储存在一些限制,如计算机机箱大小、操作系统支持硬盘数量、扩充卡数量、无法适应集群环境等问题,需要采用存储虚拟化技术的来应对这一问题。
虚拟存储技术,是指把多个物理上独立存在的存储体通过软件或硬件的手段集中管理起来,形成一个逻辑上的虚拟存储单元供主机访问[2]。从用户角度看,使用存储空间而不是使用物理存储硬件,管理存储空间而不是管理物理存储部件。
2.2.1 三种主要的存储虚拟化方法
要存储海量的数字资源,需要结合实际情况,选择合适的存储方式。目前存储虚拟化有三种技术[3]:
方法1:基于主机的虚拟存储
基于主机的虚拟存储依赖于代理或管理软件,它们安装在一个或多个主机上,实现存储虚拟化的控制和管理。由于控制软件是运行在主机上,这就会占用主机的处理时间。因此,这种方法的可扩充性较差,实际运行的性能不是很好。基于主机的方法也有可能影响到系统的稳定性和安全性,因为有可能导致不经意间越权访问到受保护的数据。这种方法要求在主机上安装适当的控制软件,因此一个主机的故障可能影响整个SAN(Storage Area Network存储区域网络)系统中数据的完整性。软件控制的存储虚拟化还可能由于不同存储厂商软硬件的差异而带来不必要的互操作性开销,所以这种方法的灵活性也比较差。
但是,因为不需要任何附加硬件,基于主机的虚拟化方法最容易实现,其设备成本最低。使用这种方法的供应商趋向于成为存储管理领域的软件厂商,而且目前已经有成熟的软件产品。这些软件可以提供便于使用的图形接口,方便地用于SAN的管理和虚拟化,在主机和小型SAN结构中有着良好的负载平衡机制。从这个意义上看,基于主机的存储虚拟化是一种性价比不错的方法。
方法2:基于存储设备的虚拟化
基于存储设备的存储虚拟化方法依赖于提供相关功能的存储模块。如果没有第三方的虚拟软件,基于存储的虚拟化,只能提供一种不完全的存储虚拟化解决方案。对于包含多厂商存储设备的SAN存储系统,这种方法的运行效果并不是很好,利用这种方法意味着最终将锁定某一家单独的存储供应商。
方法3:基于网络的虚拟存储
基于网络的虚拟化方法是在网络设备之间实现存储虚拟化功能,是目前发展的方向。基于网络的虚拟化分为带内(in-band)虚拟和带外(out-of-band)虚拟。带内虚拟是在应用服务器和存储的数据通路内部实现虚拟存储,控制数据(Metadata)和需要存储的实际数据在同一个数据通路内传递。带内虚拟具有较高的安全性,黑客很难侵入存储系统。但是,在服务器层面看,带内存储会占用较多的数据网络带宽来传输控制数据,因而容易在服务器和存储设备之间产生性能瓶颈。带外虚拟是在数据通路外的服务器上实现的虚拟功能,也就是将控制数据和存储数据安排在不同的数据通路上传输。这种方式减少了存储数据网络中的流量,有助于提高系统性能,但是一般需要安装专用软件,也容易受到攻击。
2.3.1 服务器虚拟化软件VMware Infrastructure 3
VMWARE公司的VMware Infrastructure 3就是一款比较成熟的服务器虚拟化软件。VMware虚拟平台作为独立的一层系统软件直接运行在硬件平台上,作为计算机硬件系统和虚拟机操作系统的通信层,它完全独立地响应所有虚拟机操作系统对硬件资源的访问。在虚拟服务器上,可以安装不同的虚拟操作系统,独立运行,互不干涉,就像单独的物理服务器一样。
VMware Infrastructure 3主要用于服务器端虚拟化,通过在一台物理服务器上虚拟出多台虚拟机来起到服务器整合和资源优化等目的。VMware Infrastructure 3主要可被为两部分:其一是VMM(虚拟化管理器)部分,VMware ESX 4,其二是用于整合和管理VMM的VMware vCenter。
· ESX Server
ESX Server直接构建于硬件层之上,它将处理器、内存、存储器、网络和一些I/O设备资源抽象到多个虚拟机中,每个虚拟机再在这些抽象的资源上运行自己不同的操作系统和应用程序,这些虚拟机之间相对独立,各自拥有虚拟的CPU、内存、存储器、网卡等资源,互相不知道对方的存在,唯一的影响是硬件资源的分配上的争用与协调问题[4]。
· VMware vCenter
Virtual Center为IT环境提供了集中化管理、操作自动化、资源优化和高可靠性。这些功能使IT环境具有前所未有的可维护性和高可用性。VMware vCenter是用于VMware vSphere环境的管理程序,它作为管理节点来控制和整合属于其域的vSphere主机,其既可以安装物理机的操作系统上,也可以安装在虚拟机的操作系统。
2.3.2 存储虚拟化软件VMware vStorage
VMware vStorage 是一套技术和接口,它采用虚拟化技术创建有效而灵活的存储池,不仅可以简化虚拟机的存储操作,还可以直接利用存储基础架构的各项功能。vStorage 可降低为虚拟化应用程序部署存储资源的复杂性,并能简化常见的存储操作。
目前机房的服务器主要用途使用情况如下:提供网络服务如DNS、NAT、DHCP;锐捷SAM收费管理服务器;邮件服务器及邮件过滤系统;提供VOD点播和FTP文件下载的资源服务器;驱逐舰杀毒服务器、流量监控服务器和网络拓扑状态服务器;磁盘阵列;办公自动化系统等,共25台服务器。服务器基本采用曙光天阔620R和DELL 2950等型号的老式服务器。
这里采用服务器虚拟化软件,利用一台HP DL380服务器,可以整合目前7台老式服务器。
表2
在服务器HP DL380上创建虚拟机,在相应虚拟机上安装相应的应用软件。如果应用系统平台相同,可以使用虚拟机的克隆功能快速部署出一个新的系统平台。图1是服务器虚拟化的运行状态。
3.2.1 数据安全性
在图中考虑到了数据安全性,采用了双机热备,可以根据具体情况决定是否采用。如果一台HP DL380服务器出现故障,VMware VMotion可以使正在运行的整个虚拟机能够瞬间从一台服务器迁移到另一台服务器上。
图1
3.2.2 存储需要
因为目前图书馆对海量存储要求很高,特别是各种期刊电子图书数据库、光盘资源库、在线视频讲座等需要本地镜像,所以要采用大规模的IP SAN网络存储,同时虚拟机文件也可存放在磁盘阵列中。
3.2.3 安装虚拟机
在HP DL380服务器上安装7个虚拟机,提供相应的应用服务。
通过对图书馆服务器进行虚拟化,具体到本馆馆情可以实现如下目标:
(1)最大化服务器利用率并降低采购数量。利用虚拟化技术进行统一管理维护,通过集中管理控制台对多台服务器进行集中管理,极大降低管理工作量。
(2)由于虚拟构架可使虚拟机具有动态可迁移性,可以进行快速的维护和升级,不用担心某台服务器出现问题,会影响到整个应用平台。
(3)降低单点故障,提高服务保障水平。服务器合并后降低了所需要管理的物理服务器数目,减轻管理负担。
(4)提高了服务器资源利用率,为实验创建专用的服务器环境;可快速部署新的虚拟服务器,大量节约实验室成本和实验准备环节。物理服务器虚拟分割成多个虚拟环境,为学生和其他科研人员提供专用的服务器环境。利用虚拟机技术大量节约了服务器环境部署时间,简化了实验环境的准备过程,最大程度地满足科研及教学实践对专用服务器环境的需求。
(5)只有选用安全且大容量的数据存储与保护方式,才能为整个数据中心提供完整的集中数据备份。采用虚拟化存储后,用户可方便地划分、扩展、缩小虚拟存储空间,只需要简单地更改配置就可在线增加新的物理存储设备。用户将注意力集中在存储系统的容量和安全模式的需求上,而不必关心存储系统的硬件容量、类型或者其他物理磁盘的特性,提高存储资源的利用率,最大程度满足用户对存储资源的空间需求。
(6)降低能源消耗。采用虚拟化技术,可以减少5台服务器,每年仅电费就能节约数万元。同时发机房发热量减少,使空调负荷降低。
通过服务器初步整合,我们将9台服务器成功整合到6台服务器、1套IP SAN设备里,明显地提高了每个物理服务器及其CPU的资源利用率。同时采用双机备援规则,不但减少了物理服务器的扩充数量,大大地降低硬件成本,同时保证了图书馆业务的运行稳定。
虚拟化技术的应用使得服务器的利用率提高了30~50%,服务器的性能得到充分发挥,并减少了物理服务器的数量,节省了设备经费。利用虚拟机的快照功能对系统和数据进行备份,可以快速修复系统故障,使应用服务的稳定性和质量得到了保障。
[1] 汤小康.服务器虚拟化技术在校园网中的应用[J].计算机时代,2009,2.
[2] 李华子,等.数字图书馆中的数字存储技术[J].情报科学,2006,5.
[3] 数据存储虚拟化的三种方法完全对比[EB/OL].http://tech.watchstor.com/tech-29514.htm,2010-05-25.
[4] 张巍.企业虚拟化实战[M].机械工业出版社,2009.
G258
A
1008-7427(2011)04-0152-02
2011-03-01