王慧姮
摘 要:随着虚拟化、云计算等信息技术的高速发展,医疗信息系统也日趋完善。作为贯穿整个医疗就诊流程的信息系统,对于医疗服务和医院管理起着至关重要的作用。系统意外停机或数据丢失将直接影响患者就诊和治疗,造成的损失不可估量,因此加大对医疗信息系统的研究,对保障医院正常运行意义重大。
关键词:云计算;医疗信息系统;双活数据中心
中图分类号:TP368.5 文献标识码:A 文章编号:2096-4706(2019)02-0074-03
Abstract:With the rapid development of information technology such as virtualization and cloud computing,medical information system is becoming more and more perfect. As the information system running through the whole medical treatment process,it plays a vital role in medical service and hospital management. Accidental shutdown of the system or data loss will directly affect the patient’s visit and treatment,resulting in immeasurable losses. Therefore,increasing the research on medical information system is of great significance for ensuring the normal operation of hospitals.
Keywords:cloud computing;medical information system;Active-Active data center
1 系统发展回顾
从医疗信息系统的可用性角度来看,我院系统建设经历了以下两个阶段:
1.1 双机热备(HA)+数据备份
双机热备是我院最初采用也是行业最常见的高可用架构,其将关键的业务系统部署在两台服务器上,通过HA软件访问外接共享磁盘存储。服务器采用主-备工作方式,当服务器发生故障时,HA软件自动将应用切换到备份服务器,从而保障业务连续性。同时其也部署了周期性的数据备份,以防止数据丢失。但是随着应用逐渐增加,每部署一套应用,都要部署两台服务器,总体运行成本高,资源浪费明显。且存储的压力日渐增大、单点故障风险提高,一旦存储发生故障,整个系统都会受到影响。
1.2 主机虚拟化+容灾
为了提升服务器的资源利用率和管理性能,我院尝试采用服务器虚拟化技术,将HIS、EMR以外的系统均部署在虚拟化平台上,分别在两个机房(四楼/五楼)部署了刀片服务器集群和VNX5500存储,并通过SAN网络连通,实现了虚拟化应用可以在楼层机房间在线负载和迁移。同时利用存储的远程复制功能,对部分数据卷进行同步复制,初步建成了以跨机房的虚拟化集群和数据容灾为核心的系统架构。如图1所示。
2 系统存在的问题
虚拟化平台和容灾系统自建设以来,在IT管理、资源利用及可用性方面取得了显著成效,为我院信息系统的运行提供了良好的技術支撑。随着医疗应用的不断推广,医疗信息系统对自身业务的连续性和数据的安全性要求进一步提高。我院医疗信息系统主要存在以下几个方面的问题。
2.1 维护成本高、难度大
医疗信息系统的HIS、EMR关键系统目前还采用物理服务器方式,维护成本高、难度大,且该系统存储设备老旧,故障风险高。这就需要全面虚拟化来解决,以降低维护成本和难度,提升关键系统的可靠性和管理性能。
2.2 业务连续性有待提高
双机热备高可用架构的两台存储设备之间缺少有效的切换机制,存在单点故障。一旦存储损坏,运行的业务就会中断,这其间虽然数据不受影响,但是两台存储设备却需要半小时甚至数小时的时间来切换。新大楼机房对于系统的持续运行提出了更高的要求,因此需要建立更加可靠和高效的容灾系统来保障医疗信息系统的正常运行。
2.3 数据安全保障有待完善
医院数据信息安全对于医院正常运行意义重大,而这些数据安全主要依赖于医疗信息系统,我院医疗信息系统的备份方案采用周期性(每天)备份,这样一旦数据出现错误或丢失,就会面临较长时间的数据缺失,严重影响医院的医疗就诊服务。
3 “双活”数据中心+三站点容灾
基于对以上问题的分析可知,医院信息系统的正常运行离不开硬件平台和实时有效数据的支撑。本文结合我院现有的IT资源及环境、新大楼的机房建设,对三个机房进行了资源分配和角色梳理,以划分不同的故障域。
规划将系统部署在现有的四楼机房和新大楼机房,实现“双活”数据中心业务层面的跨机房高可用,即系统无单点故障。系统不会因为服务器、网络、存储、甚至是某一机房电源故障而无法正常提供服务。将现有的五楼机房作为三站点的容灾故障域,使其同时为两个机房提供数据和容灾服务。
3.1 “双活”数据中心特点
“双活”数据中心既是容灾技术的提升,也是系统高可用架构的延伸。两个数据中心同时为业务提供服务,当任何一个中心出现问题导致系统不可用时,另一中心将继续持续提供服务,期间不需要人为干预和决策。
“双活”数据中心相对于容灾系统有以下特点:
(1)资源利用充分。灾难是一个小概率事件,容灾系统只有灾难发生时才能起作用,“双活”数据中心可以避免容灾中心资源因长期处于闲置状态而产生的资源浪费;通过其资源整合,数据中心的服务能力可以得到成倍提升。
(2)“双活”数据中心如果中断一个数据中心,而另外一个数据中心还可持续运行,数据中心的运行对业务系统来说是透明的。而灾备模式下,如果生产数据中心瘫痪,则需要数小时甚至更长的时间才能启动灾备中心,在这段时间里,业务系统将面临长时间停机。
3.2 “双活”数据中心实现方式
3.2.1 网络双活
从网络层面来看,“双活”数据中心需要将同一个网络扩展到多个数据中心,在数据中心间需要大二层网络连接并且实现服务器和应用的虚拟化数据中心互联。在数据中心之间建设一张虚拟的大二层网络是实现网络双活的基础。通过大二层网络,可以实现跨数据中心的集群、资源共享和故障切换,它是保证从故障发生到故障切换的过程中不丢包的重要手段。
VMware虚拟化平台的NSX网络虚拟化功能提供了如下服务:物理三层网络的连接下,在虚拟大二层网络故障,数据中心网络互联故障或NSX组件故障时,两数据中心网络将按现有的网络转发状态转发数据,避免网络中断,保证业务客户端连接随故障转移。
3.2.2 存储双活
存储双活能够实现信息在数据中心内部以及数据中心之间共享、存取或移动,从而将各种不同的存储系统联合成为单一资源。它允许地理上分离的两个数据中心的存储系统同时进行数据存取,对业务系统透明,且保证了数据的可靠性和可用性。
利用存储虚拟化网关的数据镜像功能,结合上层应用集群,使两个数据中心都处于运行状态,并同时承担相同业务,可以提高数据中心的整体服务能力和系统资源利用率。存储双活是数据中心双活的重要基础,EMC VPLEX可创建分布式虚拟卷,可供多台存储设备同时访问,主机集群可同时访问同一个虚拟卷。任何数据中心的存储故障时,业务将自动通过另一数据中心的存储访问数据,实现RPO=0,RTO≈0,解决了传统灾备中心不能承载业务和业务无法自动切换的问题。如图2所示。
3.2.3 应用双活
应用双活是“双活”数据中心所追求的业务目标,只有在实现网络双活和存储双活的基础上才能真正实现应用双活,从而保证所有的业务系统跨数据中心的连续性。
应用双活可以由数据库层面实现,如Oracle RAC,也可通过虚拟化集群实现。在VMware的双活方案中对后端的双活存储厂商也做了认证。只有通过VMware的VMSC双活认证的存储方案,VMware VMotion、HA、DRS等特性才能得以保证,这些功能的实现基于VMware虚拟化应用双活。如图3所示。
3.3 三站点容灾
数据备份只支持恢复至上一个备份点,一般关键业务在每晚备份,也就是说当发生逻辑错误(如操作错误,误删表,病毒等)时,通过备份恢复的手段只能找到前一天晚上备份点的数据,而无法恢复从备份点至故障点期间丢失的数据,这对医疗信息系统的正常运行产生了重要影响。
我院通过第三站点,结合业界当前先进的持续数据保护技术,对“双活”数据中心提供持续的数据和系统容灾保护。在容灾站点建设较低配置的服务器和存储资源,利用EMC的虚机持续保护技术,对重要的应用系统以虚拟机为单位进行容灾。容灾资源可以用于日常开发和测试,在“双活”数据中心发生逻辑数据错误时,可对数据进行任意时间点的恢复,同时在事件突发的情况下,容灾系统也可临时顶替生产。
4 结 论
(1)“双活”数据中心架構是此次项目建设的重点,其核心组件是EMC VPLEX存储虚拟化引擎,也是EMC的一项独特技术。构建基于存储虚拟化技术的“双活”数据中心,当一个数据中心内的服务器、存储甚至是整个数据中心发生故障时,业务可以无缝地切换到另一个数据中心,业务始终保持在线,实现了数据中心最高级别的高可用。
(2)真正的双活,是在数据中心的各个层面,都实现双活。存储、服务器、网络、应用等,各层面都要有双活的设计,这样才能真正意义上实现数据中心层面的双活。
(3)“双活”数据中心虽然具备最高级别的高可用,但是数据在逻辑上只有一份,发生逻辑错误时,“双活”是无能为力的。因此需要对数据进行逻辑保护,CDP是目前业界最先进的数据保护技术,我院采用该技术且将数据保护到第三站点独立的故障域中。真正实现了从物理设备、站点到逻辑等层面为数据提供全面的保护。
系统实现效果:
(1)如果出现服务器故障,系统能够利用服务器虚拟化技术实现自动切换。恢复时间:5分钟以内,数据损失:0。
(2)系统为冗余设计,如果出现某台交换机、某块HBA卡、某条光纤链路故障,不会引起系统停止响应。恢复时间:0,数据损失:0。
(3)如果某台存储出现故障,另一机房的存储可以自动接管应用,不会造成系统停止响应。恢复时间:0,数据损失:0。
(4)如果主机房出现灾难故障,另一机房可以在不需要人为干预的情况下自动接管应用。恢复时间:5分钟以内,数据损失:0。
(5)如果出现逻辑数据错误,可利用持续数据保护技术回滚。恢复时间:数十分钟,数据损失:约为0(针对数据库应用)。
参考文献:
[1] 何昕,许剑,陈馨,等.云计算的体系架构与关键技术 [J].现代信息科技,2017,1(5):112-113.
[2] 杨敬巍,张立成,李佳记.基于SDN技术构建业务支撑互联网域的双活数据中心网络架构 [J].中国信息化,2018(9):57-59.
[3] 陈宁钰,杨树华.病案首页信息在医疗统计中的重要作用分析 [J].现代信息科技,2018,2(10):149-150.
作者简介:王慧(1976-),女,汉族,安徽芜湖人,本科,副主任,工程师,研究方向:信息管理。