基于PC服务器非共享磁盘高可用系统的实现

2010-07-19 13:13马锡坤杨国斌
中国医疗设备 2010年4期
关键词:管理软件镜像分区

马锡坤,杨国斌

南京军区南京总医院 a.信息科;b.医务部,江苏 南京 210002

基于PC服务器非共享磁盘高可用系统的实现

马锡坤a,杨国斌b

南京军区南京总医院 a.信息科;b.医务部,江苏 南京 210002

我院信息系统引入集群管理软件,集成镜像引擎,使服务器系统具有高可用性,实现无共享磁盘阵列的双机模式。当其中任何一台服务器出现故障时,另外的服务器便立即自动取代该故障机器的职责,保证网络不发生计划外停机现象,确保医院信息系统连续运行。

HIS;服务器;集群管理软件

目前我院HIS使用的是PC服务器,操作系统是Windows 2000 Advanced Server,数据库是 Oracle 8.1.7.4,数据存放在服务器本地,非共享磁盘阵列。Oracle数据库系统运行于x86平台的PC服务器上,不是很稳定,需要定期重启。为防止服务器出现故障及数据库重启失败,影响医院业务,我院引入了集群管理软件,使服务器系统具有高可用性,确保网络安全、平稳运行。

1 集群管理软件概述

在服务器发生故障时,虽可人工地进行数据恢复和后备服务器的切换启动,但整个过程所需时间的长短在很大程度上取决于当时的故障复杂程度和系统管理人员的技术水平。人为因素很多,难以保证很快恢复系统运行。

集群管理软件是将多台服务器联在一起,组成一个高度透明的大型系统,让最终用户能共享网络上的资源,如数据或应用软件等,实现服务器数据同步,使服务器具有高可用性[1]。当其中任何一台服务器出现故障时,另外的服务器便立即自动取代该故障机器的职责,继续为用户提供服务,保证网络不发生计划外停机现象。

EMC AutoStart集群管理软件,支持无共享磁盘阵列方式的双机热备、双机集群、多机集群。无共享磁盘阵列方式可实现对应用程序进行监视、修复、重新启动和故障排除,从而为业务系统提供前所未有的保护,保证系统上的应用程序、数据和网络资源不会受到任何外在因素影响而中断服务。AutoStart 所独有的恢复应用程序特性,能及时地切换故障应用程序到其他指定的服务器上[2]。

2 高可用系统的构建

2.1 高可用系统方案设计[3,4]

HIS、LIS等应用系统要求7×24h连续不间断的运行,结合我院实际情况,经过市场调研和测试论证,采用EMC AutoStart高可用软件来保护应用系统。EMC AutoStart软件,集成镜像引擎,实现无共享磁盘阵列的双机模式。两台服务器为一组,采用Active-StardBy方式,备机上没有运行应用系统,只是出于开机状态。正常情况下使用服务器1上的卷1作为正在使用的数据源卷,服务器2上的卷1作为进行镜像操作的目标卷,为了保证数据的一致性,目标卷不可读写。对于Oracle和MS SQL数据库保护方式相同[5,6]。

EMC AutoStart提供HIS系统和LIS系统的高可用性保护,无论是操作系统故障、数据库故障、网卡故障,还是服务器宕机、卷1故障,AutoStart都可将系统转移到另一台服务器上继续运行。此时系统使用的是转变为数据源卷的原目标卷上的数据镜像拷贝,整个过程全部由AutoStart自动完成,无须手工干预,从而保证应用系统的7×24h的自动连续运行。

2.2 系统切换过程

正常情况下系统工作模式如图1所示:

图 1 正常情况下系统工作模式图

异常情况下系统工作模式如图2所示:

图 2 异常情况下系统工作模式图

当服务器1发生了故障后,根据预定策略,EMC AutoStart会自动将系统切换到服务器2上运行,并且镜像关系也会变更为从服务器2的卷1镜像到服务器1的卷1。如果当前服务器1不可用,那么当服务器1启动后,EMC AutoStart自动将新增的数据同步到服务器1上的卷1中,期间对应用系统的运行无影响。

2.3 系统特点

AutoStart采用纯软件方式实现,没有单点故障:每套应用系统至少两个程序副本和数据副本,保证整体RTO;架构灵活:可以任意选择Active-Active模式或者Active-StandBy模式,两者互换简单;也可组合配置,部分采用Active-Active模式,另一部分采用Active-StandBy模式。AutoStart双机热备系统构建完成后,不管是因为硬件原因(如CPU损坏、硬盘损坏、服务器宕机等),还是软件故障(如操作系统宕机、Oracle数据库出错、SQL数据库出错等),AutoStart都会自动侦测到故障,并将相应系统在另一台服务器上重新启动,从而保证整个应用系统7×24h连续运行的能力。

AutoStart对硬盘没有特别的要求,一块或多块硬盘都能实现镜像,支持任何Raid类型,但要求镜像的数据分区不能与系统在同一个分区,必须将操作系统分区与数据分区分开,在数据分区不能有任何系统文件,包括系统的页面文件,并且也不能将AUTOSTART安装在数据分区。只有基本分区可以被保护,而动态分区与该软件不兼容,首次同步时从服务器的数据分区不能比主服务器数据分区小。

3 结束语

系统往往会因为服务器电源中断、数据库故障、系统出现超载运行、网络资源故障、关键性操作系统程序出现故障等造成中断。这些主机的故障性停机将对应用程序的正常运作造成很大影响,不能估计系统恢复时间,影响医院正常营运,医院形象可能会受到负面影响。因此尽量减少故障停机时间是十分必要的。高可用性系统能够保证系统上的数据、服务及应用的连续性及可靠性,减低系统故障带来的影响,减低客户机/服务器架构的维护成本,避免单点故障。经过一年的运行实践证明,因服务器故障导致系统不可用的现象明显减少,服务器故障均能在短时间内得到解决。定期重启服务器,定期进行服务器切换,以及服务器的平时维护工作均不影响医院业务正常运行,系统的高可用性有效地保障了我院HIS、LIS信息系统连续运行。

[1] 王婉菲,王欣,张志浩.数据库集群系统的研究与实施[J].微型电脑应用,2003,19(10):31-33.

[2] 王维江.网络应用方案与实例精讲[M].北京:人民邮电出版社,2003:173-232.

[3] 赵志云,李泰环,杨宏桥,等.高可用集群在医院信息系统中的设计与实现[J].中国医疗设备,2008,23(8):31-33.

[4] 闫斌,徐红兵,周小佳,等.高可用性集群数据库服务器研究与实现[J].计算机应用研究, 2005(12):255-257.

[5] 刘文娟,等.Oracle数据字符集问题及其解决方法[J].微型电脑应用,2005(6):48-49.

[6] 路川,胡欣杰,等.Oracle10gDBA宝典[M].北京:电子工业出版社,2007.

Realization of High Availability System Based on PC Server with Non-shared Disk

MA Xi-kuna, YANG Guo-binb

a.Information Department;b.Medical Service Department,Nanjing General Hospital of Nanjing Command, Nanjing Jiangsu 210002, China

With the introduction of cluster management software, a group of two servers, the non-shared disk array and the integrated mirror image engine, we can realize the server data synchronization, and enable the server system to have a high availability. When any one of the servers fails, another server will immediately automatically substitutes for the function of the breakdown machine, which can guarantee the network do not shutdown in an unplanned way, and ensure the hospital information system operating continuously.

HIS;server; cluster management software

TP368.5;TP393.03

A

10.3969/j.issn.1674-1633.2010.04.011

1674-1633(2010)04-0029-02

2009-08-25

本文作者:马锡坤,高级工程师,硕士研究生。

杨国斌,医务部主任。

作者邮箱:maxikun@163.com

猜你喜欢
管理软件镜像分区
仓储管理软件在物流自动化解决方案中的应用与发展
贵州省地质灾害易发分区图
上海实施“分区封控”
镜像
镜像
浪莎 分区而治
共享电单车的管理软件
大空间建筑防火分区设计的探讨
镜像
“2008年度中国管理软件行业评选”