毕占岁++李洁++王学梅
摘要:虚拟化项目的实施是一个长期优化的过程,某医院在实施虚拟化项目的过程中也并不是一帆风顺,遇到了各种问题。该文将向读者介绍该医院在虚拟化项目的实施方案以及实施过程中遇到的问题以及解决方法。
关键词:虚拟化;群集设计;VMware基础架构平台管理中心
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)21-0050-03
Implementation Plan and Problem Solving of a Hospital Virtualization
BI Zhan-sui 1 , LI Jie2, WANG Xue-mei3
(1.Equipment Department, Wendeng Central Hospital of Weihai, Weihai 264400, China; 2.Information Department, Wendeng Central Hospital of Weihai, Weihai 264400, China; 3.Financial Department,Wendeng Central Hospital of Weihai, Weihai 264400, China)
Abstract: The implementation of the virtual project is a long-term optimization. A hospital in the implementation of the process of the virtual project is not smooth sailing, encountered a variety of problems. This article will introduce the reader to the hospital in the implementation of the project and the implementation of the program and the problems encountered in the implementation process and solutions.
Key words: virtualization; cluster design; VMware infrastructure platform management center
1 虚拟化项目实施背景
随着医院本身应用业务的不断增长,越来越多的应用系统依赖于数据中心的支撑[1],在医院数据中心的建设过程中,由于各种业务应用系统的建设和更新换代,每个业务应用系统都占用了大量的新旧服务器,其硬件利用率低下、管理复杂、运行成本居高不下等问题正逐渐显现,在IT服务基于虚拟化及云服务的趋势下[2],某医院开始着手构建虚拟化数据平台。
2 虚拟化项目设计目标
1)利用现有的服务器以及存储设备,建立一套新的服务器虚拟化架构,将现有环境中的应用业务平滑迁移到虚拟化环境中,以及为以后新增加的业务系统提供服务;
2)确保迁移前、后保持生产环境服务器数据一致。迁移切换过程中,最小化对业务系统的影响;
3)项目实施前做充分测试,确保系统迁移有序进行,具备完善的备份、回滚方案。
3 软件选型
本虚拟化项目的总体架构的设计原则是合理性、高可用性、高扩展性、平滑过渡、易于管理监控[4-5]。
通过对比,最终选择了VMware vSphere企业级云服务虚拟化平台承载此次服务器虚拟化基础架构软件。vSphere 是业界最完善的虚拟化平台,不但具有可将 IT 硬件转变为高性能共享计算平台的基础架构服务,而且还具有能帮助 IT 组织提供最高级别的可用性、安全性和可扩展性的应用程序服务。
整体的虚拟化架构图如图1所示。
4 虚拟化主机总体架构设计
4.1 方案整体拓扑
架构图简要说明:
1)VMware Infrastructure基础架构
基础架构环境中计划利用现有四台物理服务器安装VMware ESXi Server5.5操作系统,它是vSphere虚拟架构套件中基础组成部分,直接部署在物理服务器裸机上,将物理服务器的cpu、内存、存储、网络等资源逻辑化分配到虚拟机中进行使用。并且利用VMware 高可用性、动态资源调配等功能提高了虚拟机的服务级别。
2)VMware基础架构平台管理中心
通过部署VMware vCenter控管中心,集中控管虚拟化服务器。
4.2 服务器虚拟化配置
此次项目的主要基础架构是全新搭建四台ESXI Server和一台vCenter控管中心。
1)ESXI Server
在物理服务器中部署ESXI5.5版本,为了保证操作系统的安全性以及冗余性,在本地硬盘上安装,本地硬盘做RAID1。
2)vCenter server
可通过利用一台物理机或者虚拟机安装Windows2008R2 64,并部署Vmware vCenter5.5版本。
4.3 存储配置设计
在整个虚拟化平台架构当中,存储的配置至关重要,因为所有的虚拟机文件都存储在存储设备上,存储的I/O性能及链路,会直接影响虚拟化平台的运行。存储空间可根据实际情况进行扩容。
所以在规划存储区域网络时,充分考虑了I/O性能及链路冗余,建议每台物理服务器均采用两块HBA卡,分别连入两台光纤交换机。
并且共享存储配置双控制器,分别接入到两台光纤交换机,从而保证存储区域网络的整体链路冗余。
在存储设计中,除选型之外,RAID的划分和LUN的划分也至关重要。关于RAID的划分,根据最佳实践,在确定磁盘数量之后,按照实际的情况划分。关于LUN的划分,需要根据虚拟机实际情况设计,通常情况下一个LUN内不能超过8个虚拟机。一般情况下每个LUN的大小可以划分为2—3TB。
4.4 网络设计
每台物理机服务器配置一个集成千兆网卡以及增加两块双口千兆网卡。
为了保证虚拟网络的冗余性,按照以下方式部署:
1) 组成双网口绑定做虚拟化主机管理网络接口Management Console,VMkernel网络接口,建议两个网口分别接入到两台网络交换机。
2) 其余四个网口绑定做虚拟机网络使用。
3) 虚拟机有跨网段的需求,为了满足这一要求,实施时将每台ESXI Server用于虚拟机通讯的物理网卡,连接到物理交换机的Trunk口上。在虚拟交换机上创建不同的端口组,并标识上相应的VLan ID,这样,通过这一端口便可以实现不同虚拟机跨网段的需求。
4.5 群集设计
通过将四台虚拟化主机组建成同一个群集,使资源更加有效利用。
为了保障虚拟化平台上的虚拟机的正常运行,针对高可用性(HA)、分布式资源分配(DRS)做详细的规划。部署时,数据中心内的四台 ESXI Server主机都置于单个 VMware DRS/HA群集中。
1)DRS规划
首先在自动化级别上,选择了全自动化的管理方式。让vCenter结合ESXI Server的资源利用情况,自动化地迁移虚拟机,以达到充分利用资源的效果。
2)HA规划
在配置HA策略时,启用“主机监控”,这样,群集内的ESXI主机间会交换网络检测信号,当检测不到主机的网络信号后,会判断出主机故障,此时就会启用HA机制,将释放故障主机上运行虚拟机的控制权限,由其它的ESXI Server接管虚拟机的运行。
其次,为了保证启用HA机制时,不影响群集中的虚拟机运行,确保群集中的故障切换容量,我们也要启用“接入控制”。当违反HA策略时,不启动受限制的虚拟机。同时,设置HA虚拟机的重新启动优先级,默认为中等,然后根据虚拟机应用系统的重要级别,设置虚拟机重新启动的优先级别。
除了保护因为硬件故障导致HA机制生效外,也要保护虚拟机系统的运行是否正常,在这里启用了“虚拟机监控状态”。每个虚拟机系统,都会安装VMware Tools,启用虚拟机监控后,监控功能会检测虚拟机的VMware Tools信号,如果在给定的时间内没有收到监测信号,便重新启动虚拟机,以便防止虚拟机系统死机现象。
最后,是配置虚拟机的交换文件。在虚拟机的运行过程中,为产生一些交换文件。为了不影响虚拟机的VMotion性能,我们将虚拟机的交换文件同虚拟机的文件放在相同的目录中。
3)FT规划
VMware Fault Tolerance(FT)功能创建一个虚拟机设置可以提供连续性能力。FT建立在ESXI主机平台,创建一个与虚拟机主机一个完全相同的副本。虚拟机的主要副本,处于活动状态,接受请求,服务信息,并运行程序。次要副本,接收与主副本相同的输入。次要副本完成的所有任务都依照主副本的变动。主副本所有非决定性的活动都将被捕捉,发送到运行在其他host上的次要副本,次要副本在一秒内将活动进行重演。
FT启动后,VM Tools从每个虚机中发送心跳到VMM,此心跳与HA的心跳类似。VMM检查以确保主要和次要副本都在运行。如果主副本所在的host丢失,VMM将不再发送心跳。此时,次要副本立刻变为活动的,并成为主要副本,服务不会经历任何中断。
FT提供了比HA更高的商业连续性级别。FT发生时,次要立刻被激活,所有关于虚机状态的信息都会被完整的保留。存储在内存中的数据不需要被re-entered或reloaded。而HA则要将任何丢失的虚拟机进行重启。这会结束所有虚拟机进程和状态信息,程序和未保存的用户输入信息都会丢失。
5 实施过程中遇到的问题以及解决方案
在实施的过程中,遇到了各种难题,经过努力也逐一解决。遇到的问题以及解决办法主要有:
1)虚拟化后服务器性能低下,系统操作反应迟钝
经过测试,主要是因为内存分配值偏低,同时磁盘IO性能低下。后通过增加内存以及增加磁盘以降低磁盘IO的方式解决。
2)原业务系统种类繁多,迁移困难
虚拟化之前存在多个业务系统,且各业务系统服务器的操作系统、软件支撑环境都不尽相同。虚拟化项目需要对这些操作系统、软件环境进行抓取并进行配置,或者需要进行升级,这都给迁移带来了困难。
3)配置管理以及文件服务器多目录数据迁移不成功
在将原来配置管理以及文件服务器的物理服务器的数据文件迁移到盘阵的过程中,出现了某些目录或者文件无法迁移的错误,经检查,主要是因为文件被某些服务或者进程占用引起的,通过暂时停止相关的服务以及进程,终于迁移成功。
6 总结
在医院领导的支持以及信息科各位同事的努力下,某医院此次的虚拟化实施项目圆满成功。通过该项目的实施,减少了硬件的投入,使新业务部署周期由原来的2-3天减少为1小时以内;硬件错误时系统自动迁移,保证业务不中断,实现了高可用性;提高了运维人员的工作效率[4],启用系统故障及资源自动预警功能,及时邮件提醒,预防运维事件发生。
参考文献:
[1] 翁锦阳,何萍,朱铁兵. 大型医院信息系统的容灾设计和应用[J]. 医院数字化, 2011(26): 59-60.
[2] 杨晓红,李健,杨卫国. 信息系统容灾技术的分析与研究[J]. 计算机工程与设计, 2005(10): 2727-2729.
[3] 张钧,於煌,王相峰. 基于VMware虚拟化技术的医院信息化系统的实现[J]. 中华医院管理杂志, 2013,2:108-110.
[4] 赵志云,杨宏桥,刘震. 基于VMware的高可用集群在HIS中的应用研究[J]. 医院数字化, 2008,6: 37-38.
[5] 任昱,李青荣. 基于VMware+vSphere虚拟化资源管理平台研究[J]. 计算机应用与软件, 2012,5: 219-223.