容灾备份系统在四川电网的应用分析

2016-04-05 10:07余咏
科技视界 2016年8期
关键词:数据备份

余咏

【摘 要】备份与容灾实际上是两个概念,备份是为了应对灾难来临时造成的数据丢失问题;容灾是为了在遭遇灾害时能保证信息系统能正常运行,实现业务连续性的目标。执行备份与容灾的共同目的是应对误操作、软件错误、病毒入侵等“软”性灾害以及硬件故障、自然灾害等“硬”性灾害。在本案中主要为四川电网构建独立的备份系统,在有备份需求各个子系统中,部署备份管理软件,实现数据及操作系统的在线、自动化集中备份,保护生产数据、保护操作系统。在数据集中备份的基础上,将重要的备份数据自动复制到异地机房存储,当本地机房发生灾难时,重要数据及系统可以在异地恢复。实现了《信息系统灾难恢复规范》(GB/T20988-2007)中的第3级(电子传输和部分设备支持)容灾等级。

【关键词】数据备份;磁盘备份;异地容灾

1 本地数据备份

四川电网容灾备份系统的首要目标是实现生产数据的本地集中备份,构建一个全自动的、集中式的备份系统,覆盖本地所有生产主机的保护,将这些主机的操作系统、应用程序及配置、文件系统以及数据库进行在线、统一备份到本地的集中备份存储池。在大多数常见的灾难情形中,主机数据丢失或系统损毁时,快速恢复生产主机的各种数据,维持生产的持续性。

1.1 磁盘备份

在四川电网的容灾备份系统中,直接采用磁盘介质作为备份的备份存储池,与传统的虚拟磁带库不同,不需要将磁盘空间虚拟化成为磁带库设备然后再给予主机识别。磁盘池的可用空间直接显示,无需进行虚拟磁带库层的转化。该方式带来了空间管理的极大简便性,可以一目了然地监控其空间使用状态,及时对备份策略等进行优化管理。且避免了虚拟带库存在与物理磁带库一样的磁带过期问题,即如果在一盒磁带中有任意一份备份映像处于未过期状态,那么这一盒磁带也不会过期并不会释放该部份空间。

采用普通磁盘还能实现更高并发度的备份作业控制。对于传统的物理磁带库,其备份任务并发度取决于磁带机的数量,而虚拟磁带库则取决于其虚拟磁带机的数量,而基于普通磁盘的备份自身并无虚拟磁带机的限制,可以提供更高并发多任务备份的能力,相较于虚拟磁带库更能发挥磁盘设备的特性和性能优势。

磁盘备份替代磁带备份所带来的存储空间成本则被通过重复数据删除技术来降低。重复数据删除是指仅在存储介质上保留备份数据的一个唯一实例,而冗余数据则被替换为指向唯一数据副本的一个指针。重复数据删除可在文件级别和文件段级别进行;当两个或多个文件完全相同时,重复数据删除只会存储文件的一个副本。当两个或多个文件具有相同的内容时,重复数据删除会将文件分成多个段,仅存储每个唯一文件段的一个副本。

1.2 备份加速器

在四川电网的各个系统中,由于业务应用的特殊性,存在大量的小文件,在常规备份中需要耗费大量时间扫描数以千万计的文件来确定哪些文件发生过更改,大大的影响了备份的速率并增加操作系统的负载。针对海量小文件的备份采用备份加速器模式,能够将传统完全备份速度加快到了增量备份的速度级。加速器大幅减少了传统完全备份所需的资源量(客户端I/O、时间、网络和存储)。

备份加速器只识别和访问更改的数据,减少遍历大型文件系统招致的文件系统开销;在备份过程中对已减少的数据集进行重复数据删除,降低网络和存储资源需求;最后通过初次的全备份以及后续的更改数据备份创建优化的合成完全备份,并内嵌目录,以提供全面的恢复功能,缩短RTO。

使用备份加速器备份包含数百万文件的大型文件系统完全备份所需的时间只是增量备份的时间。原来备份时间内无法完成的系统备份,现在能够以更快的速度进行,从而使该备份能够在指定的时间内完成。

1.3 裸机备份与恢复

在本案的容灾备份系统中,使用的最主要的裸机还原功能,通过该功能,可以通过一个命令,系统就能在瞬间完成整个服务器恢复任务,不需要执行复杂的管理任务。利用这一个解决方案,能满足大量平台的需求,而且不需要为每台服务器定制恢复程序。

在执行每项预定备份任务之前,容灾备份系统将自动执行附加过程,即记录服务器配置的当前状态,其中包括磁盘配置和网络配置。如果服务器配置被修改,系统在执行备份时,将自动捕捉和记录这些修改,不需要用户进行干预。

而在恢复时,恢复过程已经实现自动化,只需要发出准备恢复命令,系统就开始执行恢复。些时,裸机恢复将立即检索客户机配置数据,并使用该数据创建一个定制化的客户恢复程序。然后,通过网络为客户机发送相应的引导数据和文件系统。如果不需要改变服务器配置,除初始引导外,将不需要进行人工干预(表1)。

由于服务器的持续运行出现过多次的服务器系统磁盘故障及操作系统故障,得益于裸机备份恢复功能,自动化的实现服务器恢复并简化恢复过程,避免了手动重新安装操作系统或配置硬件,加快服务器执行恢复的速度,将使停机时间减少到最低限度。

2 异地数据容灾

2.1 异地容灾必要性

远程数据备份保护不同于容灾中的数据复制,备份不是实时进行数据复制,但是备份通常具有多份数据副本,其可恢复性和抗灾难性非常强。

举例而言,当年911事件,很多银行生产中心遭遇到非可抗拒外力打击,而容灾站点总是由于某些原因无法进行切换,最终恢复都是通过远程的磁带;其实每年中国移动都进行容灾切换演练,而几乎很难一次性成功,据我看到的情况很多移动需要数月准备时间,3次以上的切换才有成功的可能性,这一切都归咎与业务的不断发展与建设,而容灾与生产完全一致的情况很难保证。

因此,我们可以得出结论,既然要考虑容灾,那么数据远程备份保护一定是基础中的基础,可以优先纳入考虑范畴。

在实现了生产数据的本地集中备份基础上,在目前有限的远程数据链路带宽的条件下,将重要的备份数据复制到异地机房的备份存储设备。在极端的灾难情形中,当生产中心机房的主机系统及集中备份存储介质全毁时,通过异地机房的备份介质,恢复重要生产主机的各种数据,维持生产的持续性。

2.2 自动映像复制

如图1所示,自动映像复制的原理如下。

备份数据采用从源备份域传输到目标备份域(两个独立备份域)传输之前先进行重复数据删除,减少带宽占用。传输到目标备份域的数据包含每笔作业的管理信息,管理信息自动会被导入目标备份域,目标备份域不需要单独恢复管理信息,已经具备对每个备份映像的管理能力,随时可以用于恢复,并且数据可以根据生命周期策略在目标备份域或者源备份域再次复制到磁带库。

在采用自动映像复制之后,目标备份域(容灾中心)是一个完全独立的备份域,该域具有备份存储资源,同时映像管理信息也处于就绪状态,可以随时恢复任意的业务和数据。

2.3 自动映像复制优势

在进行异地复制过程中,源端不发送已经存在于目标重复数据删除池中的数据段,因此可最大限度减少站点间的带宽使用量,并在不增加成本的情况下将加密用于复制。

由于备份映像可用于从任何域或全球位置立即进行恢复,因此该功能支持快速、可伸缩的数据恢复,并且存储空间占用率和带宽影响最低。在传统的复制解决方案中,源端和目标端使用远程镜像保留保持一致,而自动映像复制功能,可以在源端和目标端独立控制保留级别。

无论使用磁带搬运或者是基于虚拟带库的远程复制,在目标站点的备份系统中需要使用数据信息前,均需要手工将磁带的描述信息进行手工的导入,导入工作完成后,才可以识别出搬运到目标站点的磁带或者是其他复制的内容。

在使用简便性和自动化程度上,自动映像复制所提供数据远程复制能力更加的完善,不仅仅只是将数据复制至远端目标站点,而是一套完整的自动化方案,数据复制完成后即时成为可用状态,大大降低了操作的时间和难度。

3 结束语

容灾备份系统可以保障业务系统的持续运行,确保在任何情况下的数据完整性和安全性。容灾备份系统采用直接磁盘备份避免了传统磁带及虚拟磁带库所存在的问题,并通过重复数据删除技术来降低存储空间成本;备份加速器使得四川电网的海量小文件加速进行备份,缩短备份时间,裸机恢复功能现实服务器的快速恢复减少业务因服务器损坏的停止时间;最终通过自动映像复制实现备份映像自动化的复制到异地进行容灾,确保了在极端情况下的数据完整安全。

[责任编辑:王楠]

猜你喜欢
数据备份
泉州高速公路收费系统远程数据备份研究
海洋数据备份平台的设计和实现
No.4 IDC:2019年上半年数据备份与恢复市场同比增长10.0%
探索企业计算机网络管理运维的要点
服务器数据备份和恢复研究
数据备份与恢复技术在门户中的应用探讨