陆明胜+钱朝阳
摘要:随着大数据时代的到来,医院每天都要产生海量的数据。如何保证数据不丢失,关键业务不中断?这一问题向我们IT管理人员提出了严峻挑战。在数据中心部署一套容灾备份硬件或软件可以有效解决这一问题,但现在市场上容灾备份的硬软件种类繁多,如何选择一套行之有效的容灾备份的方案至关重要。本文通过对国外的EMC和国内的浪擎的主流的容灾技术进行了对比分析,希望通过本文的分析医院可结合自身特点来选择一种适合自己的容灾方案。
关键词:容灾 备份 双活
中图分类号:TP393 文献标识码:A 文章编号:1007-9416(2016)10-0224-02
1 什么是容灾,以及容灾的重要性
提到数据安全,人们首先想到的是数据备份恢复,传统意义上备份恢复也是容灾的一种,当服务器宕机或存储损坏等故障而造成数据丢失,传统备份恢复时间过长,医院的HIS、EMR等业务将会受到严重的影响;更为有效的方法是异地建立一套双活容灾业务机制,一旦主机房发生灾难时,异地备份机房在秒级时间内接管相应的业务,客户端几乎感觉不到业务的中断,保证业务的连续性。
2 服务器、存储等硬件故障的容灾
服务器、存储是医院数据中心的关键设备,它的损坏会造成医院整个数据中心的瘫痪。对此,可以采用群集系统来减少因服务器、存储等硬件损坏带来的业务中断。大型三甲医院可以采用两台服务器加两台存储组成2+2群集;二甲医院可以采用两台服务器加一台存储组成2+1群集系统。
2.1 2+2群集系统(图1)
2+2群集系统需要2台服务器、2台存储、2台SAN光纤交换机,每台服务器配置2块HBA卡,通过symantec公司Storage Foundation群集软件做双机备份。此方案真正做到核心部件的冗余设计,具有较高的可靠性。另外如果条件允许,还可以将一台服务器、存储和SAN交换机放在主机房,另一台服务器、存储和光纤交换机放在备份机房,这样即使主机房的设备发生物理故障,另一个机房的设备仍可以保证医院业务的不间断运行。
2.2 2+1群集系统(图2)
2+1群集系统采用两台服务器加一台存储通过Rose等群集软件做双机备份,当任意一台服务器宕机时,另一台服务器自动接管宕机服务器上,但是当存储发生故障,数据中心不能对外提供服务。其可靠性要低于2+2群集系统。
3 数据容灾解决方案
上述无论是2+2群集系统或2+1群集系统仅能防范硬件的单点故障,但不能避免因数据库逻辑损坏等造成的业务中断。因此对于医院的信息数据可采用容灾备份服务器备份到远程机器上,需要时可对数据进行恢复,以减少医院因数据的丢失带来的损失。
3.1 数据备份的方式
数据备份的方式主要有两种:一,基于磁盘;二,基于基于快照和镜像技术(本地),基于磁盘的备份又分为网络备份、SAN备份和零停机备份。
3.2 实现远程容灾的四种主要方式
两种逻辑数据复制:一是利用中间软件实现数据的远程备份;二是利用数据库系统本身实现数据库的远程备份。两种物理数据复制:一是利用系统软件或虚拟存储设备,实现数据网络镜像;二是利用存储子系统实现硬件级数据远程复制。
3.3 典型应用的容灾模式
3.3.1 EMC双活数据中心+持续数据保护解决方案(图3)
EMC的VPLEX Metro可以实现在远距离的站点之间共享、访问和移置数据,同时也可以利用对远距离同步数据和应用程序,透明的在数据中心之间共享和平衡资源。它是连续高可用和连续数据相结合的方案,VPLEX Metro以同步的方式给予用户一个单一的容灾拷贝,当主业务生产中心发生灾难时,容灾数据中心能在数分钟内自动接管主数据中心业务,保证业务不中端。VPLEX Metro架构上任一站点出现故障还能保证连续数据继续前行,另外,旁路部署的EMC Recover point,不占用带宽,对于误操作等而删除的重要数据可以让数据恢复到任意时间点。Recover point其特点是:无数据丢失(RPO=0),所有写操作都由源同步到目标;可以基于FC网络实施部署,不占用服务器资源。
3.3.2 浪擎双活备份容災解决方案(图4)
浪擎A系镜像系统功能,通过连续捕获应用系统的变化,把生产数据实时复制到本地的容灾服务器和异地的容灾服务器,达到“零丢失”保护,实现“零窗口”备份;一旦生产服务器宕机,容灾服务器无需恢复等动作,直接手动或自动切换,容灾服务器在3分钟左右即可接替生产服务器继续提供服务;容灾端只读状态模式可以避免一些误操作而导致重要数据被删除;同时浪擎A系镜采用实时增量复制技术大大减少了资源的开销,对业务系统性能影响很小;对主备系统硬件规格和磁盘容量无一致性要求,降低系统投入成本;应用方式灵活:根据需要可配置一对一,多对一的容灾架构,降低系统投入成本。
4 二者的对比分析
以EMC为代表国外容灾产品技术成熟,以旁路部署的方式,通过I/O恢复,不占用网络带宽,但是recoverpiont专业性较强,一旦遇到问题,往往需要厂家的技术支持,且恢复需要一定的时间。而以浪擎、爱数、和力记忆为代表的国内容灾产品的技术日趋成熟,操作方便,它是以切换IP地址的方式来实现容灾,容灾中心接管主业务中心时间短,接近于0,但是以IP的方式备份占用一定网络带宽。
参考文献
[1]钱朝阳,吴伟,洪建.计算机网络操作技术[J].上海交通大学出版社,2005,1.
[2]陆伟,费家忠.医院HIS网络安全隐患与防范[J].合肥工业大学出版社,2011,9.
收稿日期:2016-08-23
作者简介:陆明胜(1965—),男,安徽六安人,本科,六安市中医院信息科,主要长期从事计算机网络的研究与应用;钱朝阳(1962—),男,安徽合
肥人,硕士,合肥工业大学计算机与信息学院,主要长期从事计算机网络的研究与应用。