郭涛
信息安全已经上升为国家战略。作为信息安全的最后一道防线,灾备的重要性日益凸显。因为云计算的出现,灾备技术的应用也有了新的发展。基于云计算技术,灾难恢复系统的成本更低,恢复速度也更快。未来,云灾备解决方案将为用户提供线上线下多态多云的数据复制、备份、恢复和接管,而灾备也会成为一种标准化的服务,就像水电一样。
云灾备快马加鞭
由英方研究院、灾备技术国家工程实验室和灾备技术产业联盟联合发布的《2019中国灾备行业白皮书》中对云灾备有专门的介绍。云灾备是将灾备看做一种服务,由客户付费使用,灾备服务提供商提供产品的服务模式。采用这种模式,客户可以利用服务提供商的优势技术资源、丰富的灾备项目经验和成熟的运维管理流程,快速实现在云端的灾备目的,从而降低客户的运维成本和工作强度,同时也降低灾备系统的总体拥有成本。
云灾备与传统的企业单位实施的本地或异地灾备模式不一样,云灾备是一种全新的灾备服务模式,主要包括传统物理主机、虚拟机等IT系统向公有云或私有云等云端化灾备的趋势,以及在新业务形态下云与云之间的灾备等。在具体的实际场景应用中,云灾备包括传统的数据存储和定时复制,以及数据的实时传输、系统迁移、应用切换,还有灾备端应急接管业务应用等。
在白皮书给出的定义中,云灾备是指灾备业务的云端实现形式,主要包括云备份与云容灾,云备份与云容灾是一个有机的统一体。其中,云备份是指备份技术将生产存储数据直接备份到公有云上,进而实现数据备份与恢复功能;云容灾则是指通过数据/系统的云端迁移、高可用等方式实现业务的快速接管,保证业务连续性。
随着云计算的快速兴起,大约从2013年开始,国内开始讨论云灾备的概念。2014 年,云灾备开始以一种独立的业务形态出现。这之后,云灾备的实践逐渐增多。2016年,云灾备成为灾备行业最重要的关键词之一,用户本地到云端、云与云之间的数据迁移、备份与恢复、业务的高可用等需求批量出现。有专家指出,这主要得益于云计算的普及,以及数据作为组织重要资产的安全保护机制的逐渐建立。从2017年开始,云灾备的应用场景越来越丰富,云备份与恢复、业务云迁移、云高可用、云共享等出现在各大公有云市场,用户对云灾备的信任度也逐渐增强。
在云服务的接受程度逐步提升的同时,时常出现的云服务平台宕机事故也促使灾备服务商加快了云灾备解决方案的推出速度,并与云平台服务商深度合作,联合发布各种云端灾备解决方案。与此同时,逆向云灾备应用场景也开始冒头,即用户将生产放在云端,将本地作为灾备中心。
云灾备结合云平台的计算、存储和带宽等诸多优势,相比本地灾备,在基础设施上的投入更少,可以更好地降低IT成本,可以按需付费,具有灵活度高、恢复速度快等优势。在通往云计算理想王国的道路上,云灾备不可或缺。Gartner的统计数据显示,2018年,采用灾难恢复即服务(DRaaS)的组织机构数量超过了采用传统服务的数量。相对于可以恢复到本地的异地存储备份,DRaaS提供了基于云的计算能力,不仅可以实现数据的恢复,更可以在云中通过虚拟机启动整个业务系统。
云灾备的形式很多,可以是云平台服务商自身数据中心的容灾备份,也可以是第三方灾备服务商提供的灾备解决方案。还是那句话,不要将所有的鸡蛋放在同一个篮子里。用户在选择云灾备服务时,除了在云端做好数据保护和业务接管以外,还应该在本地保留独立的数据。
2019年5月,网络安全等级保护制度2.0(等保2.0)国家标准发布,这标志着国家网络安全等级保护步入新的时代。等保2.0也对灾备提出了新的要求,比如从异地定时备份变为异地实时备份,从系统冗余(冷热无要求)变成热冗余,并要保证业务的高可用切换等。灾备刻不容缓,灾备永无止境。
傳统企业上云 灾备要先行
阿里云的数据显示,目前已有约40万个数据库迁移到阿里云上。Gartner预测,到2023年,全球3/4的数据库都将运行在云上。传统企业上云已势不可挡。有数据显示,中国企业的上云意愿高达84%。曾经在很长一段时间内,企业上云最主要的障碍就是安全性。安全涉及的范围非常广泛,灾备就是其中重要的一环。
传统企业上云,灾备要先行。5月29日,阿里云发布了新一代企业级云灾备解决方案,旨在为制造、金融、医疗等企业用户提供一键容灾能力,更好地实现业务恢复、数据保护和网络自愈,最大限度地保护本地和云上业务的稳定运行。
相比传统灾备方案,阿里云企业级云灾备方案的优势体现在以下几方面:免设备维护、高可靠;整机备份、整机恢复;天级部署,云服务即开即用;整体成本节省50%;充分满足SLA要求,可定期进行灾备演练。
阿里云深入企业级云灾备领域,主要得益于阿里巴巴拥有超过20年的IT灾备经验、可靠的云基础设施(IDC、存储、数据库等)以及技术创新能力。此次发布的阿里云企业级云灾备解决方案采用磁盘级数据持续复制技术,同时支持混合云和跨云的多平台融合架构,为企业客户提供了五大能力:用户数据中心和公共云相互容灾;在业务不停机的情况下完成容灾演练;云原生,支持弹性容灾,只需部署最低负载;一键容灾快速恢复,RTO、RPO达秒级;建立了完善的数据加密体系,保证数据的极致安全。
为了让用户放心,阿里云企业级云灾备符合四个极限目标,即不在同一火山地震带,不在同一水系,不在同一电网,不在同一运营商网络出口,从而最大限度地保障业务和数据的稳定安全。
采用阿里云企业级云灾备,用户省去了灾备机房的建设规划,可大幅节约建设成本与软硬件运维成本。阿里云技术战略总监陈绪表示,云上拥有多层冗余设计、智能管理等,可为企业提供更好的数据保护策略。随着企业级云灾备解决方案的推出,阿里云还发布了“十万先行者计划”,将免费提供10万台智能接入网关设备,让使用者可以像使用互联网一样,便捷、低成本、安全使用其灾备服务。
Gartner预计,到2020年,90%的容灾操作将发生在云端。现在看来,灾备上云只是时间问题。
云灾备有“三驾马车”
英方CEO胡军擎认为,使用云作为备端再合适不过。本地搭载英方灾备一体机,并集合异地云平台,可以构建两地三中心的灾备环境,通过英方的系列产品可无缝融合云平台的资源。云灾备有“三驾马车”,即SaaS、生态、智能。正是在这三驾马车的带动下,英方才实现了业务的快速发展,拓展并加深了与客户、合作伙伴的关系。
2015年,英方云正式上线。经过快速更新迭代,同时很好地利用公有云的成本优势和便捷性,英方云不断扩充应用场景,打造出新的云产品矩阵。英方云的云迁移、云备份、云容灾、云一体机、云备享等产品和服务,在本地与云端、云端与云端之间建立快速连接的通道,为企业用户提供面向多个公有云平台的数据异地容灾、恢复、系统迁移、业务高可用和文件共享管理等服务,让数据和业务在私有云、公有云或者混合云上实现自由流动、保护、应用和分享。胡军擎表示,英方将业务连续性软件产品转变为英方云SaaS服务,提供线上线下组合的灾备解决方案,让客户的数据保护和数据管理顺利迈入云时代。
云时代就是一个生态的时代。英方也用更具生态的眼光看待原本点状分布的灾备业务,通过将高可用、持续数据保护、迁移等不同产品根据用户本地、虚拟化、数据库等不同场景而进行组合与迭代,建立一个统一的灾备平台,实现软件、硬件、云三位一体。通过合作生态,英方与越来越多的合作伙伴结盟,为用户提供更多选择,比如为Oracle的客户提供更多灾备方式的选择,英方i2Active全面支持Oracle数据库复制,英方i2Availability全面支持Oracle整库+Oracle应用复制等。
得益于基于操作系统的字节级数据增量捕获技术,英方从数据的捕获、传输到数据装载,将每个模块精雕细琢,提升系统效率,简化操作,增强扩展性。英方的解决方案不仅可在不同的虚拟化系统、硬件之间进行复制、迁移,在云端也更具亲和力。
如今,智能已经无处不在。胡军擎表示,灾备智能化是一个涵盖智能动态带宽调节、智能弹性计算、智能切换监测的统一灾备系统。基于英方智能灾备管理平台,用户可以实现整个IT系统的数据安全,以及业务连续性的智能化管理。
毫无疑问,未来的云平台将具有更高水平的智能自动化,而机器学习和人工智能技术等也能帮助用户实时预测停机时间,定位性能异常,识别安全风险等。不过当前还处于智能化应用的初级阶段,英方的想法很单纯,就是希望借助智能技术让业务变得更便捷,成本更低。比如,英方在iDR智能容灾高可用、iMove快速上云、iRecovery智能恢复、iData数据管理等方面进行了有益探索,更好地融合云计算技术、SDN和灾难识别与预判技术等,加速产品的自动化、智能化进程。
英方就从云灾备起家,始终坚守“连接器”的产品理念。英方要以一种模块化的接口、通道的方式建立自己的核心竞争力,通过在云与云之间、云与本地之间打造一个“集线器”的产品形态,进而成为数据的云端输送者。英方会不断深化并优化基于内核的数据捕获/传输/装载技术,持续提升用户的使用体验,服务企业业务的连续性管理。
对于灾备的持续进化,胡军擎也有自己的深刻洞察,灾备未来将成为重要的数据管理平台。随着数字化、信息化技术的不断发展及广泛应用,数据已经成为组织的核心资产,而大量分散、孤立的数据并没有得到有效利用,甚至成为企业的沉重负担。为解决数据管理的难题,英方推出了数据统一管理平台(i2UP),它包含针对物理机、虚拟化和云端环境的数据监控、灾备、迁移、同步、分发、共享、集成、治理、归档等多维度的大数据管理功能,可以帮助客户提升数据管理的效率和智能化水平,通过一个软件操作界面就可全面掌控企业信息生命线。i2UP通过一体化的管理软件,完成了数据收集、数据访问和云端数据管理。从灾备到数据管理,这已经是一个十分明确的趋势。
“真”云灾备服务
灾备从以前的“王谢堂前燕”到现在“飞入寻常百姓家”,要感谢云计算。云时代也的确是灾备发展的最好时代,因为云先天就具有异地灾备的属性,使用云来作为备端再合适不过。
进入云时代,灾备技术的创新也进入了一个新的阶段,在传统基础的灾备技术基础之上融入大数据、机器学习和人工智能技术等,让数据中心的灾备工作变得“简单易得、兼容性强、可视可见、简单快速”成了云灾备努力的方向。
云灾备领域后起之秀深圳市科力锐科技有限公司(以下简称科力锐)也把这16字方针作为自己的差异化竞争优势,不断打磨产品和解决方案,以云服务的方式提供灾备,真正实现了DRaaS。
科力锐专注于云环境下的应用灾备、灾难恢复和工作负载迁移技术的研发和创新,为用户提供云主机上的业务系统应用灾备、连续性保障、验证和演练、灾难快速整机重建和负载迁移等产品和服务,具体包括灾备一体机、科力锐桌面保障恢复一体机、灾备云DRaaS服务、灾备私有云方案等,为用户灾备赋能。
简单概括,科力锐现有两大业务:一是云灾备,二是云迁移。而这也正是企业上云迫切需要解决的两件事情。
科力锐对自己的云灾备方案和服务颇为自信,其特色主要体现在以下四个方面。
首先,可以实现多云统一灾备,以及自动化异构恢复。科力锐可为混合云(x86架构下的物理机、虚拟机和云主机)提供统一的灾备保护,无需多套方案,能够自动化地完成异构主机的驱动匹配,实现灾备业务管理的全流程,即备份-验证-演练-灾难恢复。
其次,简单易得,兼容性强。科力锐云灾备方案兼容Windows Server 2003及以上版本,以及Linux 2.6.18为内核的操作系统上所有的应用、文件系统和数据库,不挑业务逻辑、数据库和文件系统的类型、品牌和版本,能够提供整机应用级灾备保护,降低災备管理技术门槛。
再次,灾备系统有效性可视可见。说到灾备系统的建设,备份虽然是基础,但在备份基础之上实现灾备系统的验证、演练和应急恢复等灾备业务全流程才是重中之重,这也是等保2.0的要求。科力锐云灾备方案所具备的验证、演练和自主的应急恢复能力,使得灾备系统的效果可视可见。
最后,灾备系统运维敏捷快速,不仅备份快、验证快、演练快、灾难恢复快,而且节约时间、节约成本,无需预置环境,无需请软件开发商工程师、数据库工程师和灾备工程师到场。云灾备就是这样简单。
科力锐在云迁移方面也保持了像云灾备那样的快速、简单、有效。
首先是调研简单,无需了解源机和目标机的差异,也无需了解应用系统的业务逻辑和部署,更无需了解数据库的品牌和版本,就可实现整个应用环境+数据的打包迁移。
其次是迁移速度快,由于应用系统的服务连续性是企业的生命线,因此迁移时要尽量缩短停机时间,这一点在大数据场景下尤为重要。
最后,云迁移的过程中要尽量避免风险。比如,科力锐云迁移技术不在源机上进行操作,不需要关闭源机,便可通过迁移系统中的副本数据进行迁移,迁移验证成功直接切换即可,从而降低可以用户云间迁移的风险。
科力锐能够在云灾备、云迁移市场上闯出一条新路,与它在技术创新与技术融合上的努力密不可分。举例来说,在对被保护的源主机进行数据复制后,灾备系统面临的共性挑战包括异构主机间灾难恢复驱动适配难、恢复操作复杂技术难度高、恢复时间长业务恢复慢、灾备系统验证演练难等。
为此,科力锐开展了大量技术创新工作,在磁盘数据块复制技术的基础上,进一步融合了机器学习、大数据和人工智能技术,使得基于科力锐云灾备技术提供的灾备产品和系统更可靠、更快速、更简单。
正因为有了操作系统冷热数据学习分级技术、应用系统/文件系统的冷热数据学习分级技术和信息编译收集技术等,才使得科力锐云灾备技术能够实现在异构主机间自动化完成故障/灾难重建,且任意数据量的灾备源主机在无需预先配置目标主机环境和千兆网络条件下能够实现15分钟恢复应用系统。15分钟级整机灾难重建快速恢复应用服务技术是科力锐独有的技术,已经申请了相关技术专利。
在人工智能技术的运用上,像智能虚拟PCI技术、智能硬件虚拟化技术、智能驱动适配技术、智能虚拟数据重定向技术等,都是科力锐独有的创新技术实现方式。
这些技术的使用让科力锐云灾备技术在执行异构主机间灾难重建时,具有更好的兼容性和应对未知目标主机驱动不兼容问题的能力,轻松实现x86架构下物理机、虚拟机和云主机间的自动化灾难重建。
为了满足部分用户对更高的业务连续性的要求,科力锐创新地将HA技术理念和CDP持续数据保护技术理念进行融合,提供基于异构的源机和目标机异构的HA热备高可用,在提供实时数据保护的同时,将变化数据写入到目标机,时刻保持源机和目标机的数据一致。
若源机出现故障,系统可以自动或手动一键切换到目标机上,从而确保业务的连续性,并且通过历史回退点可以应对各种软件逻辑、误操作和病毒攻击等传统HA技术无法克服的挑战。
在x86环境中,科力锐可以实现包括物理机、虚拟机和云主机在内的统一灾备保护,极简的灾备系统验证和演练,以及灾备系统的应急接管和快速灾难重建等在内的灾备业务全流程管理。
这也让初出茅庐的科力锐能够在众多灾备项目中脱颖而出。比如,江苏联通与科力锐合作共建灾备云,为第三方政企用户提供灾备服务;科力锐协助中冶集团建设了一套灾备云,为整个中冶云和下属200余家单位不适合上云的各类应用系统提供统一的灾备服务;科力锐还承担了重庆安全云中数百个业务系统的上云迁移服务和灾备保障;此外科力锐还为成都市政务云灾备项目提供整机的实时CDP应用级灾备和整机定时应用级灾备,使用量达百TB级。
类似的行业成功案例还有很多。另外,科力锐还成为“2018~2019中央国家机关政府采购协议供货入围厂商”,中标备份一体机类产品。
在云灾备领域,人们感觉科力锐像是横空出世。虽然公司到现在为止成立才3年,但是科力锐在技术积累和创新上一点也不含糊,尤其是在数据备份、快速恢复、异构兼容、一致性、极简验证、演练/恢复、DRaaS实现、成本和效率、云间HA热备、真CDP服务等技术细节上有自己的独到之处。
“在数字化时代,应用系统是企业运转的生命线,而数据是核心资产,灾备服务则是IT必需品。”深圳市科力锐科技有限公司产品总监章程表示,“云灾备服务(DRaaS服务)的简单易得、兼容性强、敏捷快速和可视可见是其核心竞争力,也只有具备了上述特征,才能称之为‘真云灾备服务,才能为用户创造更多价值。”
让灾难恢复变成大众化的功能
《2019 Veeam云数据管理报告》显示,73%的受访企业和组织承认,因无法满足用户对不间断访问数据和服务的需求,将给企业造成每年约2000万美元的损失。这一调查结果反映出,停机对于企业收入、生产力和客户信心造成的影响是破坏性的。面对这种情况,企業应该如何应对?
Veeam公司的调查结果显示,72%的受访者希望利用混合云功能来实现云数据管理,以确保从数据中获取更多价值。当前,许多企业正利用云作为备份和恢复服务。调查显示,51%的企业使用了备份即服务(BaaS),44%的企业使用了灾难恢复即服务(DRaaS)。越来越多的企业管理者已经认识到多云和混合方法的优势,而成本、可靠性、灵活性和数据安全性是他们选择云的主要考量因素。
在全球范围内,AWS、Azure、IBM、Google等正受到越来越多企业级用户的青睐。通过这些云服务商,大型企业正在构建其私有云和混合云。Veeam预测,Microsoft Office 365将会成为继AWS和Azure之后的又一个大型平台。因此,Microsoft Office365、AWS和Azure都将是Veeam未来提供数据保护的重点新型平台。目前Veeam已为Microsoft Office 365的50万~100万账户提供数据保护服务。
Veeam的策略是通过像AWS、微软和IBM这样的云技术合作伙伴,为广大的云平台提供数据保护、灾备等功能和服务。一方面,Veeam将提供与多个虚拟机管理程序、物理服务器和端点的集成,以及基于公有云和SaaS的工作负载保护;另一方面,Veeam还与云、存储、服务器、超融合,以及应用程序供应商合作,联合提供强大的云数据管理平台。
2019年1月,Veeam推出了Veeam Availability Suite 9.5 Update 4,在增加新功能的基础上,可轻松实现云迁移、云移动、云原生备份、经济高效的数据保留,以及移动式云就绪许可,从而全面提升数据管理的水平和安全性。
Gartner的数据显示,过去两年中,大约80%的企业都遇到了需要制定业务连续性和灾难恢复计划来解决的问题。保证业务的连续性,这是企业生存和发展的前提条件,也是实现数字化转型所不能或缺的基础。虽然数据保护、容灾、可用性等问题天天都在讲,但真正落到实处并不像想象中那么容易。
“企业要问问自己,能否确保自身业务数据始终可用。如果不能确定,那就必须采取积极的行动。”Veeam联合创始人兼全球銷售和营销执行副总裁Ratmir Timashev介绍说,“我们的研究显示,很多企业或组织的行动还不够快。”
在不久前结束的VeeamON 2019大会上,Veeam公司发布了全新的Veeam Availability Orchestrator v2。这一新版本将强大的编排和自动化功能扩展到更广泛的应用和虚拟机,可以协助企业和组织应对各种运营恢复、灾难恢复,以及数据迁移。以前,只有大型企业或组织强调可用性这个问题,或者只要求关键应用具有灾难恢复能力。这是由客户需求和现有工具是否具备相关能力所决定的。现在,借助Veeam Availability Orchestrator v2的独特功能,Veeam可用性平台可以为使用经过验证的Veeam备份和复制功能的任何客户提供全面的灾难恢复、运营恢复和平台迁移功能,从而降低灾备应用的门槛。
Veeam Availability Orchestrator v2的新功能主要包括:利用增强的报告和合规功能,根据内部和外部的合规条例和审计要求,更轻松地检验服务水平协议(SLA)的实现程度,并在必要时主动修正;将备份和复制保护数据自动用于恢复验证之外的其他用例,例如开发运营、补丁和升级测试、分析等;通过高级授权和角色型访问控制(RBAC),让业务部门、应用所有者和运营团队获得专属权限,安全访问编排规划和测试资源。
无论是在本地还是在云环境中,企业最关心的永远是应用和数据恢复的SLA。企业执行关键型恢复任务并降低业务风险,就必须解决复杂的恢复编排问题。Veeam Availability Orchestrator v2在多个维度上实现了突破,例如自动化、报告、迁移功能,以及真正建立SLA驱动型多层恢复流程的能力等。一句话,Veeam Availability Orchestrator v2让灾难恢复成了大众化功能,任何规模的组织都可以为自己的所有应用和数据实现广泛而合规的灾难恢复功能。
Ratmir Timashev指出:“尽管备份依然非常重要,但是今天的客户正借助AWS、Azure、IBM和Google等平台搭建混合云环境,他们需要的不仅仅是备份解决方案,而是在不断变化的环境中如何获得商业成功。”
《2019 Veeam云数据管理报告》显示,几乎一半的受访者表示,技术的投资对于数据保护是必不可少的。然而令人担忧的是,只有37%的企业对其当前的备份解决方案是非常有信心的,而大多数企业(73%)承认,他们现有的解决方案无法满足用户的需求。不过,也有超过一半的受访者表示,希望部署智能数据管理和多云解决方案,以消除业务困境。
综合第三方市场调研公司和Veeam内部的预测,到2020年,全球云数据管理市场规模将超过150亿美元。从备份到灾难恢复再到云数据管理,用户的需求在变化,厂商的战略也要应需而动。
灾备之后
灾备只能是IT的成本中心?灾备只能做和灾难恢复有关的事?云灾备将数据备份到云上就万事大吉了吗?不,灾备的应用还有更多的可能性。
深圳市前海云端容灾信息技术有限公司(以下简称前海云端容灾)推出的“容灾云3.0”,第一步仍是通过备份、异地容灾、迁移等方式和手段对数据进行保护。但是接下来,当容灾中心积聚了大量生产、开发、测试的数据,形成一个数据池后,也就变成了一个大数据应用的载体,可以基于此建立数据模型,进行审计以及其他大数据的分析和挖掘工作。容灾中心不仅仅是成本中心,也可以变成业务和利润中心。
前海云端容灾的创新体现在以下两方面:一是提出“容灾大数据”的概念,将容灾基础设施与大数据应用相结合,这是技术和应用上的突破和延伸;二是在容灾的商业模式上进行有益尝试,让容灾成为一种跨区域,甚至跨国界的服务。
前海云端容灾的创始人,同时也是香港互联网专业协会常务理事、首选香港创新科技主席李德豪博士对于容灾与大数据的结合有深刻的理解。他将今天数据共享难的原因归纳为以下几点:因为数据就是“石油”,所以拥有数据的企业和组织不愿随便将数据交出来,一旦数据交出来,企业的资产就没有了;数据具有敏感性;数据私隐保护难。基于上述原因,数据的交易和共享存在比较大的障碍。
据了解,目前香港正在筹备成立“数据稳形交易中心”,以专利技术将源数据屏蔽,数据提供者在平台上将数据隐形后,不但可以完全放心地完成交易,还可以把数据无限次地出售,为企业创造更多收入,同时也为全球大数据科研提供了更大的空间。
“未来无论做什么都需要数据进行证明,政府、企业的每个决策都需要数据作为支撑。”李德豪表示,“未来十年,中国将成为全球数据源的主要供应国家。AI应用的突破也要依赖数据。在数据隐形交易中心推出后,大湾区的各行各业都可以在此平台上加速企业自身的技术创新,实现业务的增长。”
容灾首先要确保的就是业务的连续性和数据的安全性。但是,容灾的价值绝不仅仅在于此。在数据沉淀下来后,以数据为基础的应用创新和业务模式创新会自然而然地发生,数据变现也就成为了现实。