基于VMware集群技术的信息系统整合设计与实施

2016-02-09 03:04高效松杨金刚
铁路计算机应用 2016年12期
关键词:虚拟化机房集群

高效松,杨金刚

(哈尔滨铁路局 信息技术所, 哈尔滨 150006)

基于VMware集群技术的信息系统整合设计与实施

高效松,杨金刚

(哈尔滨铁路局 信息技术所, 哈尔滨 150006)

大量铁路信息系统的实施,在带来工作便利的同时,也产生了旧服务器维护成本过高、新服务器资源使用率过低等现象。本文结合哈尔滨铁路局信息系统应用现状,通过采用VMware虚拟化集群技术,以现有服务器及信息系统的整合过程为例,从多个角度进行整合设计,对实施过程中的一些经验和需要注意的事项进行了总结。

虚拟化;虚拟集群;系统整合;机房整合

近年来,大量铁路信息系统的投产,在提升铁路运输生产效率及铁路运输质量的同时,也增加了信息系统维护部门的运营及维护成本。要想较好地解决这些问题,虚拟化技术是一个有效的手段。众所周知,利用虚拟化技术,可以整合应用负载,充分利用服务器性能并极大地降低维护与运营成本。本文从哈尔滨铁路局信息系统整合的背景、目标及整体架构、迁移方案等多个方面对整合的设计及实施进行总结与描述。

1 整合背景

哈尔滨铁路局信息系统存在着旧服务器多、新服务器利用率低等诸多问题。

(1)老旧服务器维护成本高,新服务器资源使用率偏低。

机房运行着大量老旧服务器,经常出现服务器的硬盘、电源模块故障,由于配件的停产、缺失,系统的维护成本升高。而相对较新的服务器资源利用率偏低,普遍存在单服务器跑单应用的现象,并且服务器未能建立有效的应用集群环境。

(2)硬件系统维护对业务影响大,新服务器部署时间长。

硬件故障维护、升级或扩容时,需要停机操作,常造成应用系统中断,影响正常业务;新应用服务器的上线,安装操作系统、更新系统补丁、部署杀毒软件等工作,常常造成应用部署时间久、周期长的情况发生。

(3)服务器维护量大,机房用电及空调压力大。

中心机房存在生产服务器型号繁杂、数量多,产生了维护工作量大、机房耗电量大及空调压力重等问题,急需对机房相应服务器进行整合。

2 整合目标

系统整合的总体目标是利用虚拟化技术,搭建VMware虚拟集群,解决铁路局现有数据中心中存在的一些问题。

(1)提高机房空间的利用率,降低服务器的维护量。

利用服务器虚拟化技术实现 X86 服务器硬件资源整合,服务器数量减少50%以上,整合后节约60%以上机房空间。在极大减少服务器维护量的同时,降低机房用电及空调压力。

(2)通过建立VMware集群,提高应用服务器的可靠性。

利用服务器虚拟化技术建立VMware集群,为所有虚拟服务器提供高可用性(HA) 保护,在不增加成本的情况下解决缺少 HA 保护的难题。在硬件维护的过程中,通过集群应用级的高可用,将业务的中断降至1 min以内。

(3)建立高效的运维管理,降低操作系统部署时间。

建立统一管理平台,对基础设施、IT设备等资源进行动态调度,简化管理,提高运营效率,降低运营成本。将操作系统部署的平均时间由5 h降至30 min以内。

3 整合架构及实施

基于哈尔滨铁路局数据中心的现状和未来业务的发展目标,充分利用虚拟化技术,构建适合铁路局业务发展的私有数据中心,实现铁路局信息系统基础架构“统一规划”、“统一部署”和“统一管理”,最终实现 IT“服务”转型。

3.1 服务器架构

为保证各应用的安全隔离,依据业务的不同重要程度,服务器架构包括:虚拟机管理集群、重要应用集群、备份机制。

(1)虚拟机管理集群

2 台 4 路刀片服务器部署在数据中心,用于支撑数据中心虚拟集群的管理,包括:vCenter Server、 vSphere Data Protection、虚拟机迁移等服务器,近而实现管理与业务的分离。

(2)应用生产集群

8 台 4 路刀片服务器和10 台 2 路刀片服务器,分布部署在两个集群中,用于支撑现有的老旧服务器以及未来新业务系统部署。逻辑上分为重要应用集群、一般应用集。重要应用集群采用 8 台4路刀片服务器,支撑生产系统高性能需求业务;一般应用集群采用 10 台2路服务器,支撑内网普通业务服务,集群依据业务负责情况自动均衡分配资源,初期按照整合比1:10进行实施,未来依据实际运行情况调整。

(3)备份机制

如条件准许,采用2台2路机架式带存储的服务器,通过部署VMware Data Protection (VDP)建立备份集群;或各自应用系统采用系统定时等方式进行数据备份。由于条件限制,我们暂采用第2种方式进行备份。

3.2 存储架构

为解决存储数据分散保存和缺少高可靠性保护等问题,本方案设计通过1台存储划分两个LAN的方式承载X86业务负载。重要应用集群、一般应用集群服务器部署在此存储中,存储硬盘要求采用RAID5及以上的划分模式。由于存储容量的限制,我们采用了兼顾安全及经济的RAID5方式存储数据。

3.3 网络架构

以太网络由管理集群、生产集群连接汇聚交换机,通过两路光纤网卡和VLAN 方式隔离不同业务流量,并通过 Qos 进行业务带宽分配;虚拟化平台网络功能分为管理网络、VMotion 网络和VM 网络等几种类型,针对现有网络,达到最佳应用效果。虚拟机VLAN网络图如图1所示。

3.4 应用系统迁移

3.4.1 应用系统迁移方式

应用系统由物理机迁移为虚拟机(P2V)通常包含3种方式, 每种方式适应不同的应用迁移场景,需要根据具体的实际情况选择适合的迁移方案。

(1)系统在线热迁移

系统在线热迁移也称为系统实时迁移,是指通过宿主操作系统安装迁移工具,对应用系统进行在线状态的迁移。热迁移主要适应的场景包括:一般由于业务原因,使得服务器无法关机或不可长时间关机的应用系统。此类应用可以选用免费的VMware Converter迁移工具,进行系统在线迁移。

图1 虚拟机VLAN网络图

此种迁移方式的主要优点是对运行的业务影响最小,即最大程度地实现了系统的在线迁移,而且目前VMware官方对此提供的支持也较好,其缺点是系统迁移之后,原有系统的未优化之处也一并被迁移。

基于热迁移所具有的这些优点及相应业务的需求,本次应用系统的整合,90%以上的服务器采用了热迁移的方式进行系统整合。

(2)系统离线冷迁移

系统离线冷迁移是指通过光盘引导迁移工具软件的方式,对应用系统进行系统离线状态的迁移,此时应用宿主系统处于关机状态。冷迁移主要适应的场景是对原应用系统一致性要求较高,并且应用可停机的情况。此类应用可以选用免费的VMware Converter光盘引导版迁移工具进行系统离线迁移。

此种迁移方式的主要优点是宿主机无需安装软件,并且实现了迁移前后的应用系统内容一致性最高。此种迁移方式的缺点也较突出,主要原因是此种方式需要加载网卡和Raid卡等驱动,经常造成系统的迁移成功率较低。此外,目前VMware官方网站在系统迁移工具栏也不提供此版本的软件链接,同时随着新的硬件不断地更新,缺少新版驱动的情况也影响了此种方式迁移的成功率。

由于此种迁移方式存在的弊端,本次系统整合仅对站段细信息系统等特例服务器进行冷迁移测试,测试中出现多次迁移失败的情况。所以在具体的生产整合过程中,我们未采用此种迁移方式。(3)系统重新部署,手工迁移手工迁移是指通过采用新建宿主操作系统,重新部署应用的方式实现迁移。此种迁移方式主要应用场景是需要对原有系统进行优化,解决原有系统应用及数据库等要素进行调整、优化的使用场景。

此类迁移方式的优点是可以对原有系统进行优化,使新系统可以获得更好的稳定性及可用性。缺点是人工参与较多,需要厂商或应用工程师配合,并且相对前两种方式此种迁移也最耗时。

在本次应用系统的整合过程中,存在着对多个系统进行优化、调整的需求。基于此种需求,我们采用手动迁移的方式对处室网站平台、信息流转信息系统等进行迁移整合。

3.4.2 应用系统具体迁移步骤

(1)应用系统硬件调查,特殊软件需求获取

针对原有应用进行调查,包括:是否运行于老旧设备、单机单服务器之上;运行的操作系统及硬盘和内存应用调查;应用数据库类型;是否需要特殊软、硬件。整合应用系统迁的移计划样例如图2所示。

(2)应用预迁移测试,制定迁移资源配置表

挑选代表性应用,进行迁移测试。包括:Windows2003、Windows2008以及冷、热两种迁移分别进行测试,根据测试及调查结果进行迁移资源配置。由于虚拟机资源可以后期动态调整,所以基于有效利用硬件资源的前提是迁移资源配置应按照中等资源需求进行配置。

图2 系统迁移计划样例图

(3)迁移后,进行资源配置与迁移验证

依据具体业务需求及资源配置表,分配资源迁移系统,各应用部门配合进行迁移验证。

3.5 虚拟化安全

可以采用专业的虚拟化安全软件,为虚拟环境提供全面的保护;或者采用Mcfaee杀毒软件进行安全防护。目前,我们主要采用Mcfaee进行病毒安全防护。

4 系统整合经验

4.1 以安全为第一注意事项,实施指导计划

由于整合的应用系统均为生产系统,所以方案的设计及实施均以安全为第一位。整合需要事前进行认真调研,制定实施方案与测试计划。根据测试结果进行项目实施并在投产后注意集群监管。

4.2 根据系统整合特点,注重实施细节

项目涉及的应用环境复杂,需注重前期准备调研,并针对特殊问题采取相对应的解决对策。

(1)系统内运行的特殊服务在迁移过程中易产生数据不一致的问题,此时可将服务退出或停止,待迁移完成之后再将各服务改为原有模式。

(2)各底层管理服务器的ESXi操作系统,应尽量采用相同的版本,方便虚拟机的HA及容错(FT)等技术的使用。如果ESXi需要升级,应执行先升级测试后投产的原则。

(3)Windows2008系统迁移后,需要联网激活。针对此类问题,可采用电话激活、外网激活等方式。

(4)尤其注重官方文档的使用并结合互联网资源,有效地完成项目的实施工作。

(5)通过管理软件,高效地对虚拟环境进行监控。虚拟机部署之后,也需要对虚拟集群、虚拟机、存储、网络等进行监控。通常此类监控可采用VMware vSphere自身的监控工具或专用的虚拟机管理监控工具vCenter Operations Manager(VCOPS)。VMware vSphere系统性能监控图如图3所示。

图3 系统性能监控图

5 结束语

通过采用虚拟机集群技术,整合旧系统、实施新系统,是搭建企业应用数据中心的一种重要手段。哈尔滨铁路局信息系统整合于2015年底完成,企业内部私有应用数据中心的优势显现,降低了信息系统维护及运营成本,提高了工作效率,较好地达到了系统整合的预期目标。

[1] Matt Liebowitz,Christopher Kusek. VMware vSphere 性能设计:性能密集场景下CPU、内存、存储及网络的最佳设计实践[M]. 姚海鹏,刘韵浩,译.北京:机械工业出版社,2015,8.

[2] 戴夫☒沙克尔福. 虚拟化安全解决方案[M]. 张小云,译.北京:机械工业出版社,2015.

[3] Christopher Wahl, Steve Pantol. Vmware网络技术原理与实践[M]. 姚 军,译.北京:机械工业出版社,2014.

[4] 王春海. VMware vSphere企业运维实战[M]. 北京:人民邮电出版社,2014.

责任编辑陈 蓉

Integration of Information System based on VMware cluster technology

GAO Xiaosong, YANG Jingang

( Institute of Information Technology, Harbin Railway Adminnistration, Harbin 150006, China )

The implementation of a large number of Railway Information Systems has brought convenience at work. However, it also created the problems of high maintaining cost of old servers and low utilization rate of new servers. This article combined with the present situation of Information System application in Harbin Railway Administration, took the integration process of the servers and Information System as an example, used the VMware virtual cluster technology to design the integration process from multiple perspectives, summarized some experiences and some matters needing attention in the implementation process. The author hoped that this article could provide some useful help for the colleagues.

virtualization; virtual cluster; system integration; server room integration

U29∶TP39

A

1005-8451(2016)12-0023-04

2016-05-25

高效松,高级工程师;杨金刚,高级工程师。

猜你喜欢
虚拟化机房集群
平疫结合的CT机房建设实践
基于VPN的机房局域网远程控制系统
海上小型无人机集群的反制装备需求与应对之策研究
基于OpenStack虚拟化网络管理平台的设计与实现
对基于Docker的虚拟化技术的几点探讨
一种无人机集群发射回收装置的控制系统设计
浅谈一体化机房系统
Python与Spark集群在收费数据分析中的应用
浅谈高速公路一体化机房
浅析虚拟化技术的安全保障