文|王一凡
虚拟化技术在容灾备份系统中的应用浅析
文|王一凡
近几年,一些政府职能部门、银行、电信、保险业都相继建设了容灾备份系统,以保证突发状况后政府数据的安全和各项工作的连续性。灾难备份系统建设是信息化建设的重要组成部分已成为业界共识,灾难备份与灾难恢复已经成为来自各行各业的组织机构的关注焦点。很多企业开始把业务连续性作为一项核心能力,投入巨资建设灾难恢复系统,以确保业务稳定、连续地发展。容灾方案已经成为信息数据中心建设的热门话题,但由于容灾方案的技术复杂性和多样性,在实施过程中要面对众多的困难和问题。基于对容灾项目系统复杂性的充分认知,应用虚拟化技术将是容灾备份系统建设的一个方向。
1. 容灾备份系统的基本要求
容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。当生产中心发生较大规模灾难时,如果在既定时间内无法在生产中心恢复业务,灾难备份中心将是确保业务可持续运行的最后一道防线。通过在灾难备份中心恢复业务系统,可以确保业务的持续运行(见图1)。
2. 容灾备份系统建设原则及思路
绿色容灾,减少对生产系统的影响。
对生产机CPU、内存占用较小,对网络资源占用较小。无需改造硬件和网络环境。实施过程中无需停机,不影响生产系统的正常运作。
保证容灾数据可靠性。
对于需要恢复的系统采用应用级捕获和分析引擎能找到数据库完整性点,恢复数据时只恢复到数据库完整的点。
可见的容灾,保证容灾效果可见可验证。
容灾可见性是指容灾系统的容灾效果是不是可见、可查询的。
高性价比
建设一个灾备数据中心,是一件成本很高的选择。在硬件、软件、网络带宽、数据同步与复制等各个方面的投入,都应该与容灾目标相对应,达到高性价比。
可管理性
一个灾备系统涉及的系统比较复杂,对于一个庞大和复杂的系统运行环境,灾备系统的可管理性直接影响到这个备份系统的效率和功能的灵活性。一个好的灾备系统,可以满足用户针对不同的容灾需要,针对不同的容灾对象,提供灵活的备份策略机制。
可扩展性
一个好的灾备系统,不仅能够满足目前的灾备需要,同时应该能够方便的添加灾备对象以满足将来的灾备需要。为了有效的保护这些软投资,在一开始选择灾备系统的阶段,考虑长远的灾备体系扩展能力,将有效的保护这些投资。
专业灾备运维服务
灾备不仅仅是技术,更多的是运维服务一个完备的灾备系统少不了持续的灾备运维,提供包括定期巡检、维护培训、软件版本升级、应急响应、灾难恢复演练、应急预案等在内的完备灾备服务。
3. 容灾备份系统建设的难点
整合用户需求和复杂的生产中心需要很高成本。构建一个传统容灾系统的高可用性体系架构需要根据实际应用情景和环境进行复杂的规划、设计,其第一步是确定高可用性架构金字塔中层次/组件的功能特征(见图2)。
这已经不仅是IT技术的问题,还要求有高级咨询技术顾问和系统工程师来进行整个系统设计和架构。做出一个真正可以达到实施要求和效果的容灾系统要付出很高的成本、时间和精力成本。
使用不同品牌的服务器、软件系统、存储和网络设备,各个应用差别很大。一般情况下,一个大型的数据中心包括不同品牌的主机、服务器,不同品牌的存储、网络设备,不同品牌的操作系统,数据库、中间件、应用软件,不同的数据备份,形成众多的业务系统。所以这也是导致容灾建设为什么如此困难,成本如此之高,需要那么高技术条件才能实现的根本原因。
图2
图3
新增业务不断,生产端系统不断在变化。建成一个真正的灾备系统,是为了当灾难发生时,把生产系统切换到灾备系统中。可生产系统不是一成不变的,随着业务的飞速发展,应用会不断变化扩展。一旦生产中心应用被改变了,灾备中心会自动随着生产中心改变吗?实际上这都是问题。我们现在的生产中心不再是固定不动的,而是一个动态的数据中心。
1. 虚拟化在容灾备份中的优势
虚拟化把传统的应用和整个硬件操作系统或者灾备架构变成一个横向的分层次化的系统。通过把硬件、应用和灾备架构层次化,变成一个非常灵活的架构,进而降低了灾难系统恢复设计的过程当中难度和成本。
第一,硬件可以实现完全独立
有了虚拟化以后,可以把应用系统变成一个虚拟机,这完全是以数据的方式存在,由于是数据,可以跟硬件完全脱离,因此生产和灾备中心的硬件可以是完全不一样的(见图2)。
第二,虚拟机最大的特点是封装
把服务器,主机硬件和上面装的操作系统、应用软件,上面的数据完全封装一个或多个数据文件。当一台主机变成一个文件的时候,移动性就变得非常强了,可以把机房服务器拷到硬盘里面随身带着走,也可以通过高速互联网从北京复制到香港去,如要对这台机器做一个备份,只需一个拷贝就行了,因为服务器当时状态,操作系统,应用状态都一次复制,全都解决。
第三,分区和整合
由于应用主机做成了虚拟机,可以大大降低生产中心或者灾备中心硬件数量。也就是说虚拟化可以根据你应用主机运行应用特点,以及硬件资源情况,可以动态的在少量的服务器主机上面运行很多个虚拟机,而且这个虚拟机根据对资源使用可以动态的移动运行位置,这样可以大大降低你数据中心需要的硬件数量。这几个方面如果应用在灾难恢复,也就是灾备解决方案当中提供了现在所有思路不具备的一些条件,解决传统容灾建设的一些技术难点。
2. 基于虚拟化的容灾解决方案的一些考虑
从基础架构开始考虑
灾备系统是一个非常复杂,难度很高的工程,而且花费很大,耗时很长。要想简化难度,降低成本,并在将来的运维工作中得到益处,就必须从基础架构的改变开始。因此,我们要把基础架构,从现在的物理环境转化成虚拟环境。当IT基础架构变成虚拟架构以后,从而进行数据和应用保护,业务连续性才能摆脱现有状态的束缚,使得应用部署更灵活,成本效益更高。
虚拟化后的管理冗余问题
传统灾备系统真正运转起来,使用难度非常之大。因此在管理层面的人员和设备资金也消耗较多。有了虚拟化架构以后,管理难度相比传统容灾系统减少很多,而且可以把管理工作自动化。有了虚拟化的灾难恢复计划,管理难度、操作难度也会大幅度降低。
灾备站点的利用效率问题
在传统的容灾系统架构中,想要实现高效切换,灾备中心的设备主机、存储、网络大部分都要闲置,以保证随时准备应对生产中心因灾难出现而切换过来。但是,如果采用了虚拟化架构,灾备站点的机器完全可以利用起来。因为这些站点机器设备都跟应用、虚拟主机无关,只是一个运算资源。可以把灾备生产系统充分的利用起来。一旦发生灾难,系统可以自动的把运行在灾备系统上的硬件平台上虚拟机的应用全部自动停下来,然后转成生产环节当中虚拟应用系统,以大大提升效率。
在灾备测试中,以及真正进行切换的过程中会面临非常多的问题和风险点,甚至完全失败都是有可能的。容灾系统之所以复杂,正是因为各个业务架构完全不同,有的可能是传统IT架构,但随着新业务的扩展,新系统采用了另外一种技术架构。只有找到一个统一的IT基础架构,屏蔽掉底层不同的硬件系统,把操作系统完全独立起来。这样,业务应用就像数据一样单纯,容灾系统面对的全是数据。众所周知,业务系统以数据的形式存在,而对数据进行拷贝、复制,进行所谓的快照与克隆就会变得简单而迅速,并且不依赖具体的硬件。这样容灾系统,不仅实施难度大大降低,建设成本也会大大节省。
如果做了虚拟化平台,整个机器本身就是一个文件,不是说备份多么简单,而是恢复起来非常容易,因为虚机文件本身对硬件没有依赖,在任意一台服务器装上以后,只要把虚机文件拷贝回来,虚拟机一上线马上可以应用,因为这些虚机文件在做快照和备份的时候保留下来了,用户没有必要对软件数据进行修补和改动,当时做快照状态可以实时恢复起来,这个时间和速度变得非常的快,比传统物理环境的恢复速度快一个数量级,也就是说相同规模机器出现问题进行恢复,在以前是花40个小时,现在花4个小时,这个效果是非常显著的。
当前,IT行业正在迈向第二代数据中心阶段,其特点就是以云计算为特征的数据中心,不管是备份还是灾备,都是在云计算平台上完成。而云计算的基础是什么呢?虚拟化!没有虚拟化就没有云计算,这是业界的共识。所以说从现在开始在基础架构层面做虚拟化的工作,不仅可以帮助我们较为容易的解决灾备系统建设所面临的问题,而且为未来第二代数据中心,基于云计算平台打下良好的基础。
(作者单位: 新华社技术局)