中国中钢集团公司 瞿秋杨 武 纬 刘晓明
浅谈灾难备份系统的技术选型
中国中钢集团公司 瞿秋杨 武 纬 刘晓明
很多大型企业或集团公司都应用了ERP系统等信息系统,企业的日常业务和信息系统的结合越来越紧密,传统的磁带备份技术所能达到的指标已经无法满足基于数据库的业务系统对可靠性和数据丢失容忍度的要求。通过灾难备份(以下简称“灾备”)系统的建设,企业一方面可以进一步提升信息系统的风险控制管理能力,提高灾难恢复水平,保障业务持续运作,另一方面也可以满足国家和行业主管部门的规范性要求,与此同时,还能对外树立良好的社会形象,以增加客户对企业的信心。
由于上线比较早且受到企业自身特点的限制,很多企业的信息系统未使用分布式存储或云架构,关系型数据库仍然是很多企业IT架构的组成部分。因此,我们接下来分析的灾难备份系统主要适用于基于关系型数据库的ERP系统,不包括分布式部署和云架构等架构。本文将以本企业视角来分析对比不同技术的特点和优劣,从而最终完成灾备技术选型,希望能给同类企业以参考和启发:
DataGuard是ORACLE 推出的一种高可用性(HIGH AVAILABLE)的数据库方案,在8i之前称之为standby database,从9i开始,正式更名为Dataguard,它是在主节点与备用节点间通过日志同步来保证数据的同步,可以实现快速切换与灾难性恢复。
DataGuard是一种单一针对数据库的灾备技术,如果要满足企业对ERP系统整体的备份需求,需要选取对数据库代码及应用服务的备份技术或单独开发shell脚本完成对应用层的灾难备份,所以基于DataGuard理念的纯数据库灾备解决方案不能满足完全满足信息系统对灾备系统的需求。
存储设备镜像复制技术的解决方案,主要依靠集成在存储设备上的控制软件管理,在存储逻辑卷上生成快照,在通过生产中心和灾备中心存储设备(光纤交换机)间建立光纤链路完成数据的复制。在灾备过程中数据流向示意如图1所示:
图1
基于存储设备镜像技术原理是生产环境数据的复制和保护通过存储完成,磁盘快照生成、拷贝和传输通过光纤存储的管理模块实现,再将生产环境生成的镜像通过光纤链路复制到灾备中心的存储设备,这个过程对生产中心和灾备中心的主机是透明的。
基于存储设备镜像技术的解决方案依赖于存储厂商的存储产品,其典型的代表有IBM、EMC、日立、HP等存储厂商,一般低端的存储产品不支持用于灾备的镜像拷贝相关技术,故在灾备中需要使用和生产中心同厂商的中端光纤存储产品;另外,基于存储镜像拷贝的技术需要光纤链路来进行数据的传输。此类解决方案的案例覆盖了很多电信企业、大型企业ERP系统,如山东联通、云南联通、中国铝业ERP系统等。
结合案例分析可以发现,基于存储设备镜像复制技术更多的应用于通信行业的企业中,这是由于其对数据传送带宽有较高的要求,甚至需要在生产中心和灾备中心间通过光纤链路来实现数据复制,而一般的企业难以承担建设或租用光纤链路的昂贵费用。在灾备方案的选型是要选取最适合企业现有灾备需求的方案,以避免投资的盲目性,同时也是从经济可行性的角度分析,基于存储设备镜像技术的容灾解决方案不适合大部分ERP系统的中小型企业用户。
持续数据保护,Continuous Data Protection(CDP),作为一种灾备的概念提出,是对传统数据备份技术的一次的重大突破。CDP技术通过在操作系统核心层中植入文件过滤驱动程序,来实时捕获所有文件访问操作。对于需要CDP连续备份保护的文件,当CDP管理模块经由文件过滤驱动拦截到其改写操作时,则预先将文件数据变化部分连同当前的系统时间戳(System Time Stamp)一起自动备份到UnaCDP存储体。从理论上说,任何一次的文件数据变化都会被自动记录,因而称之为持续数据保护。
CDP持续数据保护技术分为真CDP(True CDP)和准CDP(Near CDP)两类。CDP的分类是相对于数据保护时间点而言的。准CDP技术是按照一定的时间频率,持续的记录并备份数据变化,每次备份有一定时间窗口,需要数据恢复时,可以恢复到过去备份的时间点,并不能形成完全意义上的持续保护,因此称为准CDP技术。而真CDP技术是持续不间断的监控并备份数据变化,可以恢复到过去任意时间点,是真正的实时备份。
通过与技术厂商沟通交流后发现,按实现的原理区分,CDP的技术也可分为两种:一种是通过操作系统层面的镜像实现;另一种是通过光纤交换机的端口复制技术实现。
3.1 基于操作系统磁盘镜像的C D P解决方案
基于操作系统磁盘镜像的CDP技术,反映其原理的数据流示意图如图2所示:
图2
生产环境的数据通过操作系统的镜像保存为两份,一份在原有的生产存储上,另一份镜像数据通过CDP服务器再连接到存储设备,在操作系统上安装CDP设备的驱动,改写的驱动将生产环境数据传递到CDP主机,这样CDP服务器就可以获取生产数据的变化,以此建立映射和生成快照,并通过网络链路传输实现灾备。
基于操作系统磁盘镜像的CDP解决方案需要在生产中心和灾备中心添加CDP服务器,其在架构中的位置在光纤交换机到备份存储设备之间,对生产环境的镜像通过主机操作系统实现,CDP服务器主要用于数据分析、快照的管理和传输,并可使用窄带传输,其典型代表有美国公司的IPStor产品等。此类解决方案在国外有这广泛的应用,在国内也有一定的案例,如韩国电信、中国移动、华北电网、深圳市国家税务局等。
3.2 基于光纤交换机端口转发技术的C D P解决方案
基于光纤交换机端口转发的CDP技术,反映其原理的数据流示意图如图3所示:
图3
与基于操作系统镜像技术的CDP不同,基于光纤交换机端口复制的CDP技术,对生产环境主机透明,生产环境数据在经过光纤交换机时,使用类似网络交换机端口转发的技术,将光纤协议数据包同步复制到CDP主机的光纤端口,这样CDP主机获取到生产环境的数据并以此建立映射和生成快照,并通过网络链路传输实现灾备。
基于光纤交换机端口转发技术的CDP解决方案需添加光纤交换机、CDP服务器;其特点是对生产环境数据的镜像通过光纤交换机的端口转发技术实现,此技术是硬件实现技术,理论上会比基于操作系统镜像的技术更节省系统资源,同样可使用窄带传输,此类技术其典型代表有EMC的RecoverPoint和InMage CX产品等使用此类技术解决方案的案例大多在国外,如Citrix公司、Seagate公司等。
根据存储网络联合会(Storage Networking Industry Association,SNIA)官方对于存储虚拟化技术(Virtualization)的定义,如下:
①将存储(子)系统内部功能与具体应用、主机及通用网络资源分离、隐藏及抽象的行为。以期达到存储或数据管理的网络无关性。
②对于存储服务及设备的虚拟化应用,以期达到整合设备功能、隐藏复杂细节以及向已经存在的底层存储资源添加新的应用。
当前有许多的技术在不同层中对存储层中进行虚拟化,包括物理存储,RAID磁盘,LUN(Logical Unit Number),存储区域,LUN分区,LUN遮罩及影射,文件系统,数据库对象。相应地实现这些虚拟化技术的设施有磁盘阵列,阵列控制器,存储交换机,路由器,分布式虚拟设备,总线适配器,操作系统以及相应的应用层软件。这些不同的技术表明对于解决共有的存储问题,虚拟化是一个很关键的技术方向。
存储虚拟化技术由于类型众多,而它们所处于存储栈位置也不一样,因此其实现技术也相当的多,而且所关注的面也不一样。比如RAID技术其实就是基于存储设备的存储虚拟化技术实现之一,还有卷管理技术LVM逻辑镜像,包括 SoftRAID 也都是存储虚拟化的实现技术。作为与本文所讨论的存储分层存较为接近关系原因,这里重点介绍一下基于主机及存储设备的虚拟化技术的实现。而对于基于网络的虚拟化技术实现主要用于数据中心级的存储规划中。特别的,这三种实现技术可以同时结合起来,或者一个以另一个为基础来实现。
存储虚拟化技术是近年出现的新技术之一,其依靠智能光纤交换机实现存储虚拟化,也就是使存储对操作系统的透明,可以集中管理分配企业范围内所有异构的存储。而将这种技术用于灾备系统,反映其原理的数据流示意图如图4所示:
图4
基于存储虚拟化的解决方案,需要在生产中心和灾备中心部署智能交换机和灾备SVM主机。存储虚拟化技术可以实现存储设备对主机的透明,所有的生产数据都由主机→光纤交换机→智能交换机→光纤交换机→存储设备的路径传送,通过智能交换机生成数据快照,经SVM主机通过网络链路复制到灾备端SVM主机送达灾备中心的虚拟存储环境。
基于存储虚拟化的解决方案此解决方案需添加光纤智能交换机(用于虚拟化)、存储虚拟化服务器(SVM),对生产环境架构改动较大,其智能交换机光纤交换机和主机、存储之间,灾备中心也需要同样的架构部署,可使用窄带传输;此类技术典型代表有Stor-Age公司的SVM产品等,在国外有很多成熟案例,如以色列最大的银行Hapoalim、德国领先的BHF-BANK银行等,国内案例相对较少,有天津天狮集团等。
通过对上述主流灾备技术的分析,通过技术类型、建设费用、带宽需求等方面与本企业现有灾备需求进行比对,详见表1:
表1
通过对比,由于ERP系统备份除了关系型数据库外,还包括应用系统,单纯的虚拟带库和DataGuard都无法完全满足需求,而在辅助以文件系统复制或脚本等其它技术,会使得技术方案复杂性增加,因此从技术可行性方面排除了虚拟带库和DataGuard的技术方案;由于处于成本和扩展性的考虑,基于存储设备镜像的灾备技术,虽然能完全满足对ERP数据库和应用系统的灾备需求,但是基于该技术的解决方案会需要光纤链路来进行数据复制,将会带来较高的成本,同时存储设备的选择也会受到厂商和设备型号的限制,从经济可行性方面排除了基于存储设备镜像的灾备技术。最终,本企业的ERP系统灾备系统的选型初步确定为基于CDP技术的灾备技术。
在确定了基于CDP技术的灾备解决方案后,我们通过POC测试验证了基于快照的CDP技术和基于光纤交换机端口复制的CDP技术方案。两者对灾备复制链路的带宽需求不高,且适用RPO均为分钟级,前者属于准CDP技术,成本相对更低,方案更灵活,而后者属于TrueCDP技术,基于光纤交换机的硬件技术,对生产系统的性能影响更小,RPO指标更低,可实现恢复到任意时间点,但需要现有系统的光纤交换机支持“端口镜像”的复制技术,如不支持则需要级联一台支持该技术的光纤交换机。
最终,考虑到企业对ERP系统的RPO需求只需要在2小时内,同时考虑到现有的光纤交换机并不支持“端口镜像”的复制技术,如采用基于光纤交换机端口复制的CDP技术,需要额外采购光纤交换机与现有设备级联,成本和技术风险更高,因此我们选择了基于快照的CDP技术作为灾难备份的技术解决方案。