基于云原生重构高校灾备系统的探索与实践

2020-10-14 00:47王晓翠
网络安全技术与应用 2020年10期
关键词:灾备备份数据中心

◆王晓翠

基于云原生重构高校灾备系统的探索与实践

◆王晓翠

(北京第二外国语学院 北京 100024)

随着信息安全问题的日益突出,高校信息中心面临着各种威胁。建设一套完整的灾备系统以保证系统的稳定性、业务的连接性和数据可用性已成为高校信息化建设面临的重要问题。但建设灾备数据中心需要投入大量的资金和人力资源,目前多数高校不具备建设灾备中心的条件。本文通过对几种基于云的灾备方式进行比较研究,发现云原生方案备份速度快,可靠性高,费用较低且对技术人员要求不高,可作为高校信息系统异地容灾备份的一种新选择。

容灾备份;云灾备;云原生

随着信息化进程的推进,高校信息化建设的范围越来越广泛,涉及教学、科研、管理等多个方面,如学工系统、财务系统、选课系统、资产管理系统、图书馆自动化系统等。高度信息化为高校师生教、学、研、管等各方面带来了便利,但信息化程度越高所产生的数据量也呈爆发式增长,高校所有业务的核心就是信息数据,随着信息安全问题的日益突出,学校的各类核心数据都受到各种威胁,自然灾害、人为故障、系统自身缺陷、恶意窃取和攻击,这些都在无时无刻影响着我们的数据安全[1]。但鉴于对灾备系统的认识不足以及建设与管理成本的限制,高校对灾备体系都没有足够的重视。等保2.0时代的到来对高校灾备体系提出了新要求。《中华人民共和国网络安全法》第二十一条、三十四条明确规定关键信息基础设施的运营者应当履行对重要系统和数据库进行容灾备份的保护义务,并在其他条文中规定了相应的处罚细则。如何保证系统稳定性、业务连续性和数据可用性已经成为高校信息化建设必须考虑的重要问题。

传统灾备方案是由用户自行购买存储设备,在本地或异地建设灾备中心,由组织内部的技术人员进行维护。但往往企业自建的数据中心由于缺乏整体规划、技术人员水平有限、没有定制相应的恢复方案或不具备恢复演练的条件等原因没有达到预期的效果。随着云计算和大数据技术的发展,云平台以其独特的优势被越来越多的企业所接受和使用。云计算的使用,可以大幅度减少用户的 IT 资源与人力成本的投入,同时获得更加弹性和强大的计算能力,可快速便捷拓展业务[2]。由于云平台的灵活性,灾备也衍生了新的概念——云灾备。本文将通过对当前常用云灾备的几种方案进行比较,探索利用云原生方案重构高校信息中心灾备机制。

1 云灾备介绍

云灾备是指灾备业务的云端实现形式,与传统的组织在本地或异地灾备模式不同,云灾备是一种全新的灾备服务模式,它将灾备看作是一种服务,由客户付费使用,由灾备服务提供商提供产品的服务模式。采用这种模式,客户可以利用服务提供商的优势技术资源、丰富的灾备项目经验和成熟的运维管理流程,快速实现用户的灾备目标,降低客户的运维成本和工作强度,同时也降低灾备系统的总体拥有成本[2]。云灾备主要包括传统物理主机、虚拟机等 IT 系统往云端灾备,以及云与云之间的灾备等。云灾备包括了传统的数据存储和定时复制,以及数据的实时传输、系统迁移、应用切换,保证灾备端应急接管业务应用等范畴[2]。

云灾备结合云平台的计算、存储和带宽等诸多优势,相比本地灾备具备了多方面的优势:

(1)减少基础设施,降低IT成本

传统灾备系统需要用户购买大量存储设备,自建数据中心,通过RAID 方式来实现数据冗余和数据恢复。云存储系统则主要采用大量廉价的普通主机,基于网络利用分布式协同软件,将数据分散存储于若干通用存储服务器上,并通过副本或编码方法进行综合管理,向用户提供可靠的统一的逻辑存储空间。利用云存储系统,用户可直接借助云平台供应商提供的计算和存储平台,或者直接采用云灾备DRaaS(灾难恢复即服务)应用服务,可以免去购置大量存储设备自建数据中心所带来的硬件购买及维护成本。采用更为经济、更具弹性的云存储进行备份,实现了对资源的精细化管理,进而减少大部分的灾备支出,同时也可以节省更多人力资源,企业可以将解放出来的备份维护人员投入到其他的更重要的工作中去。

(2)按需扩容、按使用付费

传统的灾备方案需要建立与生产中心架构完全对应的灾备中心,而云灾备可以采用云基础设施,或者灾备即服务的模式,允许用户自由选定重要的系统和数据。因为底层架构被其他采用同样云计算解决方案的公司所共有,共同分担成本,所以用户只需为实际所使用的资源付费,从而大大减少了资源的开支与浪费,并提升了效率[2]。

(3)高度灵活性

云灾备具有高可用、高安全、易扩展、无限扩容等特点,使得业务需求更容易评估,用户可以更准确预估哪个系统、甚至哪个子系统确实需要维护。也可以更细粒度地选择关键的数据来优化自身的备份计划,而不是整个地完全备份,更精确地设置RPO,即能容忍的最大数据丢失量。云中建立的高可用、高容错架构可以提升恢复时间和恢复点目标,基于公有云平台或者开源的私有云技术也可以简便、快速、灵活地构建灾备节点并将数据迁移或者复制到云端,提升灾难恢复的速度。

(4)快速迭代的复制与恢复技术

云灾备使用户可以预先准确估计恢复的时间,确保停机时间在一个可接受的合理范围内,从而可以制定一个准确的、可交付的SLA 协议,并可以远程使用云计算和云存储资源[2]。

2 云灾备方案比较

在具体的实际场景应用中,按照不同的对云的利用方式,云灾备方案包括混合云方案、云托管及云原生方案。

2.1 传统本地部署方案

本地部署方案是将灾备方案中的服务器、灾备软件、备份存储设备等部署在本地数据中心,灾备系统全部由组织内部技术人员维护的数据保护方案,在很多企业得到广泛的应用。数据中心按两地三中心定义可划分为本地生产数据中心、同城双活数据中心、异地数据中心。考虑到建设成本和管理成本,目前高校多使用本地生产数据中心和同城双活数据中心两种灾备模式。多数不具备建立异地中心的条件。本地部署优点是整个系统部署在组织内部,可控性程度高;缺点是硬件软件成本高、维护工作量大、上线时间长、扩展性差。

2.2 混合云灾备方案

混合云方案与本地部署数据保护方案相比,服务器、灾备软件和备份存储都相同,只是长期归档数据保存到云上。混合云方案用云端存储替代了传统的磁带设备,相比传统本地部署方案投入有所降低。混合云方案的优点是相比本地部署,备份存储介质投入有所减少;缺点仍和本地部署方案相似,硬件软件成本高、维护工作量大、上线时间长、扩展性差。

2.3 云托管方案

云托管是从云计算提供商处采购计算资源以托管数据、服务的解决方案,是一种基础架构即服务(IaaS)云交付模型,是按需提供并托管在云计算基础设施之上。相对混合云,云上托管有更好的可靠性,但是云上托管方案并没有针对云环境进行丰富的优化,对云的经济性的价值利用有限,而且云上托管方案仍然需要IT团队花费较多的精力进行维护。

2.4 云原生方案

CNCF(云原生计算基金会)对云原生这样定义:云原生技术有利于各组织在公有云、私有云和混合云等新型动态环境中,构建和运行可弹性扩展的应用[3]。确切的说云原生其实是一套指导进行软件架构设计的思想。云原生最大的价值是认为未来的软件从诞生起就长在云上[4]。云原生方案是数据保护的SaaS服务。它充分利用了云的特性,在性能和可用性方面做了大量优化。它提供了备份和恢复流程的集中管理,扩展性好。相比混合云和云上托管有更好的投入产出。云原生方案无需客户部署任何软硬件,30分钟即可开始备份与恢复任务。

2.5 云原生灾备服务的优势

本文对四种灾备方案从可靠性、可用性等九个方面进行比较,如表1所示。

表1 灾备方案比较

云原生灾备系统相比其他部署方案有以下优势:

(1)较低的资源成本。利用云原生灾备方案,无须购买服务器、灾备软件、备份存储等设备,而改为按备份使用量计费,降低了灾备方案的投入成本。

(2)降低管理成本。传统的本地部署方案中管理人员需要接受培训、维护灾备方案中的硬件、软件,管理难度高,云原生方案只需管理人员设定备份计划即可,方案维护有云灾备服务商负责。

(3)异地分支机构统一管理。对于异地数据保护及灾难恢复的场景,一套方案、一个管理控制台,一套全局视图。

(4)减少企业业务中断时间。基于云端的弹性、资源编排服务等能力,可一键在云上自动化快速恢复企业业务,无须专业知识,无须干预。

无限扩展性。云端资源的无限扩展性,让企业无须提前规划购买多少资源,按需购买,随买随用。

利用云原生方案实施的灾备服务项目,核心信息系统数据安全和业务连续性得到了全面提升,实现了重要业务系统等本地高效的数据及应用的容灾容错。经测试,业务系统本地恢复RTO(恢复时间目标)<1 0分钟,RPO(恢复点目标)≈0;云端恢复RTO<30分钟,RPO<5分钟。可以明显看出云原生的优势,它具有高度可靠性和可用性,上线时间短,花费低且对带宽要求不高。

云原生的优点是灾备费用低、性能好、无限扩展、管理简单,但实际落地却非常复杂,涉及许多新技术,以及新的思维方式。目前的云原生应用并非完美无缺,很明显的三个问题在于第一、云原生没有统一标准可循,用户需根据自己的实际需求,找到最适合自己的云原生解决方案[5];第二、云原生刚刚起步,缺少相关标准与支持;第三、云原生的核心是应用生来在就云上,要想云原生应用快速落地,就需要大量专业的人才,特别是既懂业务又懂技术的专业人才。

3 结论与展望

随着信息化的不断推进,高校各个业务对信息系统的依赖性不断增强,信息系统的连续性和可靠性需求越发迫切。基于公有云的云灾备模式将容灾管理转变为一种服务,用户根据使用量按需付费,极大地节省了系统投资,降低了管理难度,同时便于业务的弹性扩展,是企业信息系统灾备建设的可靠选择。CNCF(云原生计算基金会)的调查数据显示云原生技术有三大优势,即更快的部署、更高的可扩展性和更好的可移植性。CNCF 2018年报数据显示,云原生技术在生产系统中的应用数量翻了一番,正评估和准备使用云原生技术的企业用户数量增长了3倍以上[3]。云原生应用已是大势所趋。尽管云原生还有很多技术需要专业人员进一步开拓,但无论如何,云原生时代已经到来,不管你用或是不用,云原生就在那里,谁受益谁举步维艰,一目了然;不管你现在用或是未来用,云原生在持续进化之中,只有适合自己的才是最好的[3]。

[1]孔琳俊. 高校信息化环境下灾备体系建设的研究与应用[J]. 软件,2013,34(3):94-97.

[2]英方研究院,灾备技术国家工程实验室,灾备技术产业联盟. 2019中国灾备行业白皮书[R].上海:上海英方软件股份有限公司,2019.

[3]人人都爱云原生[N].中国信息化周报,2019-07-15 (008).

[4]林琳. 为什么说2019年是云原生的关键节点[J]. 计算机与网络,2019,45(19):38-40.

[5]苏坚. 基于云原生计算的5G网络演进策略[J]. 电信科学,2018,34(6):147-152.

猜你喜欢
灾备备份数据中心
浅析数据中心空调节能发展趋势
如何只备份有用数据而不备份垃圾数据
创建vSphere 备份任务
Windows10应用信息备份与恢复
关于建立“格萨尔文献数据中心”的初步构想
2017第十届中国数据中心大会榜单
旧瓶装新酒天宫二号从备份变实验室
深蓝云海“云灾备”正式上线
共享灾备走向智能化
灾备建设的新思路