李满堂
(徐州医科大学附属医院信息处,江苏 徐州 221000)
随着医院规模的逐渐扩大,业务系统的不断增多,单一的数据中心已无法满足大型医院信息化发展的需要。在全社会大数据、云计算的发展背景下,医疗数据的重要性不言而喻,双活数据中心的建设为医院信息化的发展提供了高可靠、高冗余、高效率的支撑[1]。徐州医科大学附属医院作为淮海经济区最大的医疗机构,拥有信息系统一百多个、电脑终端三千多台、网络节点一千余个。这么庞大的体量,催生了极具特色的“两地三中心”的双活数据中心建设体系,极大地提高了医院的运行效率,提升了医院的地区影响力。
为满足信息化发展规模的需要,徐州医科大学附属医院共建设了三个机房,包括本部两个和东院区一个。三个不同的地理位置,为做“两地三中心”的双活提供了便利的外在条件。两地主要指本部和东部院区,三中心包括本部两个地位相等的12号楼机房和4号楼机房,第三个中心则是东院的备份机房。其中12号楼和4号楼机房做到了完全双活,无论哪个机房出现类似于交换机宕机、服务器故障、存储损坏甚至火灾或者停电,另一个机房都可以接替其承担的任务,保障不断网、服务不间断、数据不丢失。东院机房通过裸纤连接本部机房,主要功能是备份HIS、EMR、PACS、LIS、平台等重要系统的数据库文件,保证极端环境下,重要数据不丢失。
核心网络区域共包含10台核心交换机,其中4台Cisco9508作为园区核心使用,12号楼和4号楼机房各放置两台。因该型号设备不支持堆叠,所以做冗余网关,优先级各不相同;4台Cisco9504作为数据中心核心使用,同样12号楼和4号楼各放两台,做冗余网关;2台Cisco7010放置在东院区,作为东院区核心使用,同时承担东院区备份机房网络传输任务。因东院区核心交换机通过裸纤和本部互联,网络结构较为简单,本节不做重点讨论。
如图1所示,ABCD 4台园区交换机呈口字型组网,B设备为Active,D设备为Standby,各设备之间双链路聚合链接,提升带宽,满足高业务量的需要。EFGH 4台数据中心交换机维持和园区二层环网相同拓扑,组成另一张大二层HSRP环网,角色相同。为了尽可能缩小2套环网之间的Layer2范围,在2套环网之间通过Layer3(红色连线)的方式进行路由互通,采用静态路由的方式。Layer3互联链路IP地址使用/32位精细地址划分,运维工程师合理记录并部署规划静态路由条目,避免流量绕行,其中9504去往Active设备的路由优先级最高,去往非Active设备路由优先级次优。
图1 核心网络拓扑
本小节着重分析解决了两种故障情况。
第一种:如图2所示,模拟Active 9508设备故障、9504与Active 9508之间链路故障。此时,9504去往Active 9508的流量会根据路由状态切换至9508’,由于HSRP的GW地址为虚拟地址,9508二层环网内会产生GW的ARP查询,通过二层网络自动转发至Standby设备,实现流量的自动路径切换。
图2 模拟故障场景一
第二种:如图3所示,Active 9508和9508’设备同时发生故障。由于数据中心9504设备与本地机房的所有9508网络链接中断,因此数据中心去往园区网的流量将会受到影响,将在9504设备上启用事先放置好的跨机房的容灾Layer 3link,路由优先级设置为最低,保障极端场景下的业务可靠。
图3 模拟故障场景二
如图4所示,VSAN存储分别部署在3个机房,即12号楼(DC1)、4号楼(DC2)和2号楼的仲裁机房(DC3)。一共有17台服务器组成,包括DC1和DC2中各有8台HPE 380 G10服务器,配置为:CPU Intel 5218R,RAM 512 GB,千兆网口4个,万兆光口4个,磁盘包括内置2×480 GB BOSS启动盘,2×800 GB (写入密集型)SSD盘,6×3.84 TB(混合型)SSD盘。DC3中包括1台HPE 380 G9服务器,配置为:CPU E5-2620 v3,RAM 32 GB,千兆网口4个,磁盘包括内置4×600 GB 15 K SAS盘。
图4 VSAN架构
DC1和DC2之间通过40 Gbps以上,RTT<5 ms的二层组播打开;DC3和DC1,DC3和DC2之间通过1 000 Mbps,RTT<200 ms的二层组播打开;均配置为不同vlan的私有网段。VSAN中一共16个vSphere Host使用了16个IP地址用于VSAN数据网络通信,VMotion中一共16个vSphere Host使用了16个IP地址用于VMotion数据网络通信,建立vCenter平台管理所有的超融合节点。服务器虚拟化采用vSphere Hypervisor (ESXi) 7.0U1c VMware-VMvisor-Installer-7.0U1c-17325551、vCenter Server 7.0U1d、VMware-VCSAall-7.0.1-17491101;存储虚拟化采用Virtual SAN 7 Update 1、VMware-VMvisor-Installer-7.0U1c-17325551(include vsan) 、Virtual SAN Witness Appliance 7.0U1c、VMware-VirtualSAN-Witness-7.0U1c-17325551。最终可以实现两个主机房的任意硬盘、节点损坏不会造成数据和服务丢失,并且切换时间极短,不影响正常业务的使用。
本小节着重从磁盘故障、主机故障、存储网络脑裂故障、业务网络脑裂故障4个方面进行双活测试,详见表1—4。
表1 磁盘故障双活测试
在12号楼机房内,一台Data Domain DD作为备份存储,存储所有应用的备份数据,可以模拟成磁带,提供非常高效的重复数据消除功能,配合备份软件Veeam使用(Veeam通过单个基于映像的备份,可提供广泛的功能,实现小于15分钟的恢复点目标,提供简化的内置灾难恢复功能,可实施自动恢复验证任务,始终确保每个文件、应用程序或虚拟服务器都可快速恢复)[2]。后期通过DD可设置自动复制功能,一旦备份数据写入本地DD设备中,系统会自动实时将消重后的备份数据传输到远端的DD设备中,达到备份数据容灾的目的。
东院区拥有一台四节存储设备,用来存储本部重要信息系统的数据库文件。因为医院数据库大多为oracle数据库,所以选用DSG备份软件,可支持ORACLE数据库在非归档日志模式下在线热备份。它具有智能完全备份技术,采用独创压缩版本文件系统,使日常备份任务变得非常简单,通过增量数据备份就能获得完整的备份版本,能够大幅度减少备份性能受带宽资源限制,降低磁盘存储容量75%以上,且可读取,无需对备份数据进行恢复即可从备份系统上抽取数据,并且这种数据抽取无需数据库系统支持,也不需要特殊的主机环境支持。当极端情况下,本部两个数据中心全部崩溃,也能保证医院重要数据不丢失[3]。
表2 主机故障双活测试
表3 存储网络脑裂故障双活测试
表4 业务网络脑裂故障双活测试
双活数据中心的建设合理地分配了计算、存储和网络等虚拟化资源,最大程度地提高服务器设备的利用率,使医院的IT基础架构成为一个动态、灵活、具有弹性的IT基础架构。它解决了系统及网络单点故障问题和性能瓶颈等问题,提高了医院数据中心的健壮性,在满足业务系统可用性的同时保证医院系统运行安全和数据安全[4]。
双活数据中心的建成带动了医院业务的发展,提高诊疗效率、提升医疗服务水平。同时,以业务发展进一步推动信息化建设,实现医院各项业务与信息化的良性循环,搭建了一个能够支撑医院未来三到五年业务发展的信息系统平台,进一步提升了医院的区域影响力,为淮海经济区乃至全国人民提供更好的健康服务。