双活数据中心环境下医院网络的改造与实现

2013-11-21 04:55周威
中国高新技术企业·综合版 2013年10期

摘要:文章针对德阳市人民医院将建成双活数据中心的现状,提出了网络改造的必要性。通过网络拓扑层次化改造和交换机虚拟化技术的使用,将德阳市人民医院网络改造成双核心、三层网络拓扑、高可用的网络。从德阳市人民医院网络改造的成效来看,文章所介绍的网络架构及方案是合理的,此方案能够满足国内大部分医院网络改造需求,能保证较高的可用性、稳定性和可扩展性。

关键词:网络改造;双核心;交换机虚拟化技术;双活数据中心

中图分类号:TN919 文献标识码:A 文章编号:1009-2374(2013)29-0044-02

1 医院网络的现状

我院新一轮的信息化建设始于2004年,随着信息化建设的规模不断扩大、应用不断深化,医院各种业务对可用性、稳定性的要求越来越高。我院双活数据中心已经进入实施阶段,目前从网络方面考虑,我们面临如下瓶颈需要突破:

1.1 服务器集群所用单心跳交换机威胁集群安全

我院核心业务系统所用的服务器集群有两种:Windows平台下的故障转移集群(PASC)、Linux平台下的Oracle RAC实时应用集群(HIS/LIS/EMR)。两种方式的集群都需要通过私有网络进行心跳交换。双节点故障转移集群的心跳网络不通,按照群集仲裁原则会直接判断群集失效;双节点实时应用集群的心跳网络不通,会导致其中一个节点不停重启直至心跳网络恢复。可见,心跳网络的容错能力直接威胁到服务器集群的可用性。

1.2 双活数据中心的环境下核心交换机成为高可用性的瓶颈

我院网络配备主/备核心交换机各一台,各大楼机房至主核心交换机只有一条光纤链路连接。维护难度大:品牌、接口数量、接口类型、配置命令集均不相同,需要定期进行配置文件的手工同步;切换耗时长:在主核心交换机出现故障的时候,需要将所有光纤/双绞线跳线手工插接到备核心交换机上,业务停止时间超过半小时,切换过程中还极易出现插接错误,导致业务无法正常恢复。双活数据中心实施完成后,能够将业务停止时间极大地缩短,目前核心交换的故障恢复速度大大落后。

1.3 汇聚层和接入层规划欠合理,链路稳定性无法保证

在业务密集的大楼,我们已经铺设了不同物理路径的备用光纤链路至核心交换机,在用链路出现故障的时候,需要手工切换到备用链路上,恢复速度慢;接入层交换机层层级联之后再连接到汇聚层交换机,同时,汇聚层交换机还接入了很多工作站,在功能的划分和接线方式都欠合理,一台接入层交换机的故障可能会导致整个机房大部分的网络端口不可用。

1.4 重点部门的业务应用需要进一步提高可用性

医院的门诊业务直接面对病人,其中挂号室、收费处、药房是业务流转快、病人集中的窗口部门,这些窗口部门的工作站需要较高的可用性,以免网络故障导致窗口业务的拥堵。

2 设计思路

针对本案例,我们主要考虑两个方向的措施:(1)拆分接入单元,减小接入&汇聚层的复杂度,让单个接入交换机故障所影响的面积更小;(2)在存在单点故障可能的地方增加冗余设备或链路,通过虚拟交换单元减少单点故障点。具体拓扑图如图2所示:

3 网络改造与实现

3.1 工作站至接入层

首先,为重点部门工作站铺设到不同物理位置接入机房的双绞线;其次,在这些工作站上安装两块相同型号的网卡,通过网卡聚合(Ether Channel)将两块绑定起来,一般来说,这些网卡应该连接到同一台支持端口聚合的交换机上,我们在本案中采用的汇聚层交换机支持VSU技术,即将两台交换机虚拟成一台交换机,从交换机、交换机端口、物理链路、网卡四个方面实现了冗余。通过测试,这种方式在正常状态下,可以实现带宽的加倍,当某一边的交换机、端口、物理链路、网卡出问题的时候,都能由健康的一路资源直接接管任务,接管时间在50~4000ms之内,完全可以满足我们业务不中断的要求。

3.2 接入层至汇聚层

改变接入层交换机层层级联的现状,将拓扑结构简化为接入-汇聚的多对一关系,同时对接入-汇聚的链路进行强化,增加接入交换机到异地机房汇聚交换机的链路,在汇聚交换机上应用虚拟化技术,在级联端口上进行端口聚合的处理,双链路上行、虚拟化端口聚合,从汇聚层交换机、物理链路、级联端口三个方面实现冗余,单个接入层交换机的故障,最多只会影响22个工作站(使用24口交换机,其中2端口用于上行)的接入,单个汇聚层交换机的故障,由于交换机虚拟化的实施,可以在200ms之内完成链路切换,保证汇聚层不出现单点故障。

3.3 汇聚层至核心层

本案中,我们把服务器看作重点工作站,把汇聚层交换机看作接入层交换机,顺理成章的,核心交换机应该进行虚拟化和端口聚合供汇聚交换机和服务器的接入,保证工作站到服务器集群网络的高可用性,与服务器集群及后端双活数据中心的可用性达到相同的水平。

3.4 心跳交换

对两个数据中心的心跳交换机进行虚拟化,正常状态下提供两倍于单心跳交换机的网络带宽,单个心跳网卡、链路、交换机端口、心跳交换机若出现故障,快速切换保证心跳数据的正常交换,保证服务器集群的高可用性。

3.5 优势

交换机的虚拟化改造完成之后,我们的网络与传统网络对比具有如下优势:

3.5.1 管理简化。两台交换机组成虚拟交换单元以后,管理员可以对两台交换机做统一管理,而不需要连接到两台交换机分别进行配置和管理。

3.5.2 故障恢复时间缩短到ms级。虚拟交换单元和外围设备通过聚合链路连接,如果其中一条成员链路出现故障,切换到另一条成员链路耗时是50~4000ms。

3.5.3 虚拟交换单元和外围设备通过聚合链路连接,既提供了冗余链路,又可以实现负载均衡,充分利用所有带宽。

我们将交换机虚拟化技术应用到心跳交换机、核心交换机和汇聚层交换机上,对网络拓扑层次进行改进的同时,考虑到物理链路的数量和改造的资金投入,我们将上述改造方案进行了总体规划,并将分步实施,最终为医院信息系统的运行提供一个健壮的网络环境。

作者简介:周威(1981—),男,四川德阳人,德阳市人民医院信息网络科工程师,研究方向:计算机网络。