韩贞辉,王斐斐,谢恒义,李晓阳,钟 敏
(河南省地震局,郑州 450016)
“十五”时期,依托“数字地震观测网络”项目建设了地震应急指挥技术系统,该系统包含Oracle 数据库、地震触发、企业总线、辅助决策等业务[1-2]。近年来依托该系统开发了地震应急专题图自动出图系统和地震应急服务产品推送与管理平台。目前这些业务均部署在地震应急信息机房内,经过近10 多年的运行,服务器老化、运行不稳定和软件无法更新等诸多问题逐步凸显,系统维护、更新成本也在不断增加。随着地震应急业务信息化的飞速发展,需要在原应急业务的基础上不断拓展新的业务,这对硬件资源和软件资源的要求更高,原有服务器尽管暂时能够满足使用需求,但也存在硬件老化、软件无法更新等诸多潜在的难题[3-4]。机房多台服务器只运行一个业务,直接导致硬件的利用率极低[5];系统运行连续性差、灵活性不够和业务系统部署复杂等问题导致系统维护困难。
针对运维过程中面临的现实问题,将物理服务器虚拟化成为有效的解决途径。基于此,本文着重研究如何合理运用虚拟化技术,将原来在多台服务器上的业务整合到虚拟机,在一台高性能服务器上部署运行,实现一机多用、一机多能,充分发挥服务器的性能,利用虚拟机系统快速恢复优势,有效保障了系统灾备安全,提高了业务的运行效率和稳定性,大大降低了计算机资源能耗和资金成本,有效提升了地震应急业务的信息化水平,对全国地震系统业务的信息化应用和推广具有重要的现实意义。
地震局地震应急业务主要部署在5 台地震服务器和2 台工作站,如图1 所示,其中5 台服务器在2010年配置,主要运行地震应急指挥技术系统;2 台工作站在2015 年配置,主要运行地震应急专题图自动出图系统和地震应急服务产品推送与管理,已工作近7 年。
图1 现有地震应急业务部署情况
据近几年运维记录显示,基本上每周都会出现1次以上的故障,每次修复都需要花费1~2 h,硬件更新更需要花费很大一笔经费;由于原有业务软件都是“十五”时期开发的,运行环境比较苛刻,新服务器搭载的操作系统无法满足软件的安装运行要求,随着地震应急业务量的不断增加和地震业务信息化的要求逐步提高,要满足地震应急业务的新需求和系统低成本高效运行,亟须通过搭建虚拟化平台来解决硬件升级和软件部署分散难以维护的问题。
虚拟化是指利用虚拟技术将物理机虚拟为逻辑机,每个逻辑计算机能同时兼容运行原物理机的操作系统和原有的工作业务[6]。这些逻辑计算机可通过虚拟化在一台高性能计算机上运行,且应用程序在相互独立的空间内运行而互不影响,极大提升系统运行效率[7]。
如图2 所示,一般在机房主机安装操作系统,并安装服务或应用程序,操作系统与硬件是绑定的;在虚拟机结构中,计算机硬件安装的是虚拟化平台,在虚拟化平台安装操作系统,在操作系统安装应用程序或服务,操作系统可不直接操作和依赖计算机硬件,能方便地拷贝到其他主机运行。一台主机的虚拟机也可共享该主机的CPU和内存资源,节省了硬件部署成本,提高了资源利用率。
图2 物理结构和虚拟机结构对比
虚拟化产品,也就是实现虚拟化的软件,目前主流虚拟化软件包括VMware WorkStation、Virtual Box 和Virtual PC等[8-9],通过对3 大软件进行性能分析、对比研究发现(见表1),VMware WorkStation在部署相同数量的物理机情况下,能支持虚拟机数量最多,且在虚拟技术领域处于领先地位,总体表现性能优秀[10],本文选择使用VMware Workstation 虚拟化平台。它能实现在单一的计算机上同时运行不同的操作系统[11-12],并提供开发、测试、部署新的应用程序的最佳解决方案,并可模拟完整的网络环境,实时快照,比物理机通过ghost软件备份系统分区或整个磁盘在系统灾备方面具有极大的优越性,并可拖曳共享文件夹,支持PXE等功能。
表1 3 大虚拟化软件产品特点
为提高服务器的利用率,本文对现有系统及业务进行梳理和优化整合(见表2),将专题图系统和灾情报告管理及推送系统整合到1 台虚拟主机,将5 台应用服务器的业务优化整合到4 台虚拟机,优化整合后的服务器数量减少30%,大大降低了运维难度。
表2 优化后业务部署
为满足现有地震应急业务的需求,本研究按照优化后的地震应急业务分布(见表2),将地震应急业务部署到5 台虚拟机,用1 台高性能服务器物理主机运行5 台虚拟机(见图3)。每台虚拟服务器配置双虚拟网卡,分别采用仅主机(Host-Only)网络模式和自动桥接(Bridge)网络模式。虚拟服务器之间通过Host-Only 模式,实现一台主机的内部网络通信连接,避免外部物理网络故障对整个系统带来影响;虚拟服务器通过Bridge 模式,实现与外部网络的互联互通[13-14]。
图3 虚拟化地震业务网络结构
系统运行过程中,经常会遇到宕机的情况,而故障恢复能力对于地震应急业务的安全稳定运行具有重要意义。通过VMware workstation提供的快照功能,能实现在虚拟机关机或运行状态瞬间保存当前状态,当系统出现故障时,通过快照功能,选择需要恢复系统快照的时间节点,实现系统的快速恢复[15],实现在每次更新完地震应急基础数据后或系统进行维护更新后快速及时备份,本文以server0 为例通过快照,选择要恢复的时间节点,快速修复故障。这种以时间命名的备份方式,更容易找到虚拟机要恢复到的时间节点,为系统的快速恢复提供有效的安全保障。
图4 快照管理
本研究将物理机系统与虚拟系统在一定运行时间内的运行情况进行统计分析(见表3、4)。
表3 两系统占用资源对比
由表3 可见,在系统进行虚拟化改造后,原本在7台服务器上部署的业务,通过新增1 台高性能服务器即可完全负载,更新成本也由14 万元降到了2 万元。虚拟化后的系统资源使用率也得到提高,节省了机房架设空间和耗电量。
由表4 可见,在同一时间、地点、震级等条件下,应急指挥技术系统及专题图出图系统的产出时间也大大缩短,系统故障恢复时间也从原来的1 h 缩短到了1 min,系统的稳定连续运行得到了有效保障。
表4 两系统运行效率对比
本文探索通过虚拟技术,将现有地震应急业务进行虚拟化改造,结果表明,相比于原有系统,虚拟系统可大大节约配置成本和能源消耗,还能实现故障的快速处理,显著提高了业务的连续性、可靠性和安全性,可为地震业务信息化升级改造提供参考,具有重要的现实意义。