张 艳
(湖南人文科技学院 计算机科学技术系,湖南 娄底 417000)
基于IP-SAN远程灾备系统结构研究
张 艳
(湖南人文科技学院 计算机科学技术系,湖南 娄底 417000)
数据已成为用户越来越重要的战略资源,分布式数据存储已成为对付各种数据灾难的一种有效手段。基于IP-SAN对远程灾备系统进行总体方案设计,根据所要实现的异地容灾系统的建设目标,我们可确定整个系统的容灾方案并制定容灾系统基本体系结构,设计整个系统的功能模块,通过实践模拟运行灾备系统中远程镜像备份子系统及数据一致性检测子系统,效果良好,基本实现预期目标。
]IP-SAN;容灾备份系统;远程镜像
计算机技术的迅速发展和广泛应用,使得越来越多信息以数据的形式保存在存储设备当中,计算机中的数据成为用户越来越重要的战略资源,是企业、部门的重要财富[1]。但各种意外事件会造成关键数据丢失或不可用,如不能及时恢复,将对用户造成巨大损失。传统的备份技术在日常使用的情况下基本上可以有效地保护数据资源,但在发生如战争、地震、火灾等大规模的人为或者自然灾难面前却无能为力。这主要是因为传统的备份技术没有实现异地容灾的能力。为了防止大规模灾难发生导致重要数据资源的丢失,用户往往需要将数据资源在数十公里以外甚至更远的地方保存副本。在大灾难发生后,企业、部门都能迅速恢复数据,具有异地容灾能力的容灾系统才是保证现代企业、部门正常运转的不可或缺的信息技术手段。现在,人们也越来越能清楚的认识到数据存取的可持续性和可恢复性是必需的,关键方法是建立异地容灾系统,它已经成为抵御大规模灾难的唯一方法。
容灾系统包含数据存储、备份和高可用技术,是各种技术的综合应用,并且因搭建系统的需求和环境的不同有不同的解决方案。容灾系统能为企业业务系统的高可用性和高可靠性提供有力保障[2]。它能及时恢复由于各种灾难或突发事件而造成的业务服务中断,防止数据丢失,保证企业业务的连续性运行。因此,容灾系统的建设得到了大多数企业的重视并被提上日程,如今越来越多的企业已经或正在建设他们的容灾系统。
IP-SAN系统是基于iSCSI存储技术的网络存储系统。iSCSI技术可以很好的克服光纤通道存在的成本高昂和可互操作性缺陷。它是将现有SCSI接口与以太网 (Ethernet)技术相结合,使服务器与使用IP网络的存储装置互相交换资料,是基于IP协议的技术标准,实现了SCSI和TCP/IP[3]协议的连接。相对网络接入存储来说,基于iSCSI技术的IP-SAN解决了容量、传输速度、开放性、兼容性、安全性等问题,其优越的性能受到了广大用户的青睐。
图1 异地容灾备份系统结构图
本系统首先着重考虑以下两点:1)容灾备份系统在实现其功能的基础上尽可能不降低现有本地主系统的性能;2)容灾系统除了作为生产系统的备份提供容灾功能外,还可以根据需要分担本地主系统的压力。当本地主系统出现问题、故障时,异地容灾备份系统能接管所有的工作,保证业务不被中断。在本地主系统业务非常繁忙时,可以启动备份系统分担工作,大大提高了容灾备份系统设备利用率;异地容灾备份系统与本地主系统的建造方式是相同的,因此它们有着最相近的应用数据环境,异地容灾备份系统可以用来作为生产系统的测试中心,在新业务开通前提供验证环境,即可大大降低新业务对本地生产系统带来的风险,又可最大程度保障每项新业务进入生产系统的可靠性。
根据以上考虑,本系统结构图如图1所示。容灾备份系统和本地主系统建立在不同的地理环境,它们之间距离相隔越远则遇到相同灾难的几率就越小。容灾备份系统和本地主系统使用完全相同的构造,所应用的相关软件也需注意保持一致。
如图1所示,当本地主系统和异地容灾系统正常使用时,客户访问本地数据中心,本地数据中心和备份数据中心实现数据同步,保持数据一致性。当本地主系统因灾难或故障无法使用时,所有业务自动切换到容灾备份系统继续进行处理,不被中断;当本地主系统修复并进行数据同步之后,再将本地系统应用层中间件访问路径切换回本地数据中心,则业务便又回到本地主系统中进行处理。系统之间的切换对用户来说也是透明的,业务是在本地系统进行处理还是在异地容灾系统进行处理不是客户所关心的问题。本系统很好的保障了客户业务的不间断运行。
当本地主系统发生故障时,需将业务自动切换到容灾系统进行处理以确保业务的不间断运行,这就需要将所有情况都考虑周全才能完全保证业务的不间断运行。经过分析,一般故障出现有如下三种情况:1)本地系统应用层相关部件出现故障无法使用; 2)本地系统数据中心出现故障,数据无法使用;3)整个本地主系统遭到破坏无法使用。本系统根据不同的故障给出了不同的解决方案,具体实现原理如下:
1.1本地系统应用层相关部件出现故障无法使用
若本地系统应用层中间件出现故障无法使用,则修改异地容灾备份系统相关配置直接启用容灾备份系统应用层中间件,并修改其访问路径,使其访问数据的路径指向本地系统数据中心,保证业务的不间断运行。如图2所示。
图 2 本地系统应用层中间件不可用解决方案
1.2本地系统数据中心出现故障,数据无法使用
若本地系统数据中心出现故障,数据无法使用,则修改本地系统应用层中间件相关配置,使其访问路径指向异地备份数据中心,保证业务的不间断运行。如图3所示。
1.3整个本地主系统遭到破坏无法使用
若是整个本地主系统遭到破坏无法使用,则直接启用容灾备份系统处理所有相关业务,保证业务的不间断运行。无论是出现哪种情况采取哪种方案解决,当本地主系统出现故障部分恢复后,首先进行数据一致性检测及数据同步操作,然后将所有业务再切换回本地主系统进行处理。本系统有很强的容灾抗毁能力,能很好的保障客户业务服务的不间断运行。如图4所示。
图 3本地系统数据中心不可用解决方案
图4 本地主系统不可用解决方案
本系统是基于IP-SAN的远程灾备系统,本地主系统和异地容灾系统相隔较远,这样能有效减小大灾难来临时本地系统和异地容灾系统同时被破坏的几率。异地容灾备份系统工作流程如图5所示。
本地系统正常运行时,客户直接与本地数据中心交互数据。本地数据发生改变之后及时将本地系统与异地容灾系统进行数据同步操作。在进行数据同步之前,对本地数据系统与异地备份数据系统进行数据一致性检测,若数据处于一致状态,则进入本地系统与异地备份系统数据同步操作;若数据处于不一致状态,先将源数据进行同步然后再将改变后的新数据同步至容灾备份系统。
图5 异地容灾备份系统工作流程图
本地系统出现故障时,系统检测到本地主系统无法使用,启动异地容灾备份系统,客户业务直接切换至容灾系统中完成。本地系统修复后,在对其进行数据恢复后,将客户业务切换回本地主系统。
为了实现以上功能,本系统设计由远程镜像备份子系统、数据一致性检测子系统、故障检测子系统、系统恢复子系统组成。
2.1远程镜像备份子系统
远程镜像备份子系统主要功能是实时的将本地主系统中新数据备份到异地容灾备份系统,实现数据同步。数据同步[4]是实现生产系统数据异地备份的基础,是对容灾系统的最基本要求,也是容灾系统其它组件正常工作的前提条件。只有将数据及时的进行备份,才能完成以后一系列的操作。
2.2数据一致性检测子系统
数据一致性检测子系统主要功能是实时的检测本地数据系统与异地容灾数据系统是否处于一致状态,若数据处于一致状态,则正常进入下一步操作;若数据处于不一致状态,则将本地系统和异地备份系统数据进行同步后才能进入下一步操作。数据一致性是衡量备份容灾系统的关键因素。
2.3故障检测子系统
故障检测子系统主要功能是及时准确发现本地系统运行过程中出现的故障和灾难。一旦发现本地系统出现问题无法继续服务时及时发出警报并将客户业务连接至异地容灾系统完成,以确保客户服务的不间断性。灾难检测技术可以说是应用容灾系统的技术基础。
2.4系统恢复子系统
系统恢复子系统主要功能是在本地系统出现故障或经历过灾难得以修复后,负责恢复本地系统的数据中心,数据得以完全恢复后将客户端再连接回本地主系统,实现客户服务在本地系统中的正常处理。系统恢复措施在整个容灾系统中占有相当重要的地位,它关系到系统、软件与数据在经历过大的灾难或故障后能否快速、准确地恢复。
为了证实本文所提方案的有效性,使用6台机器模拟一简单IP-SAN网络,3台机器组建一个小型的SAN作为源数据端A,另3台机器以与源数据端完全相同的方式组建镜像备份数据端B。A、B挂接在实验室100M局域网上,实现本文所设计的远程镜像容灾备份系统。实验系统构造如图6所示。
图6 实验系统结构图
具体工作过程分成如下两个部分来完成,第一部分是本地系统模块对备份数据块的封装以及传递,第二部分是镜像备份系统对备份数据块的接收、解析以及数据同步等操作,在本系统中为了保证数据传输的可靠性引入了数据缓冲区和日志机构,因此系统大大降低了对传输网络的要求,对本地服务器系统处理业务的性能影响较小。
同时在进行数据备份过程中为了确保本地端和备份端的数据随时保持一致,在网络和本地异地服务器都比较空闲时以及在数据备份前引入了数据一致性检测子系统,对本地端和备份端数据进行数据一致性检测。这样即使备份镜像系统遇到稍微复杂的网络环境,也能保障远程镜像系统数据的正确有效性。
本文对基于IP-SAN的远程灾备系统总体方案进行了设计。根据所要实现的异地容灾系统的建设目标,确定了整个系统的容灾方案并制定了容灾系统基本体系结构,设计了整个系统的功能模块。并实践模拟了灾备系统中远程镜像备份子系统及数据一致性检测子系统的运行,表现良好,基本实现预期目标,证明该系统是一个行之有效的技术解决方案。
[1]岳友宝,张艳,李舟军. 金融行业的灾难备份与恢复[J].计算机应用研究,2006,2(32):104-106.
[2]连一峰,庞南等译. 灾难恢复规划:第三版[M].北京:电子工业出版社, 2004:17-107.
[3]COHEN AMIT,COHEN REUVEN.A dynamic approach for efficient TCP buffer allocation[J].The 7th International Conference on Computer Communications and Networks,1998:31-56.
[4]胡旻. Orade分布式数据库应用设计及备份策略研究[D].广东华南理工大学, 1999:5-21.
(责任编校:光明)
ResearchonStructureofDisasterToleranceBackupSystemBasedonIP-SAN
ZHANGYan
(Department of Computer Science and Technology, Hunan Institute of Humanities, Science and Technology, Loudi 417000, China)
Data have been an important strategic resource for users. And distributed data storage is an efficiency measure to deal with various data disaster. This paper researches on the overall design of remote disaster-tolerant and backup system based on IP-SAN. According to the system’s target, the disaster-tolerant scheme of the whole system is determined and the system basic structure is formulated, a function module of system is designed, and the distant mirror backup subsystem and the data consistency subsystem are realized. Practice shows that the anticipation is realized.
IP-SAN; remote disaster-tolerant and backup system; remote mirror
2011-07-18.
湖南省娄底市科技局计划项目。
张艳(1980— ),女,湖南邵阳人,湖南人文科技学院计算机科学技术系讲师,硕士,研究方向:计算机体系结构。
TP393.08
A
1673-0712(2011)05-0138-04