某特大型国有能源企业灾备及业务连续性体系浅析

2017-11-25 22:55刘虹
科技资讯 2017年28期
关键词:灾备体系

刘虹

摘 要:本文通过分析业务连续管理的技术和方法,结合某特大型国有能源企业自身信息系统的实际特点,提出符合特大型国有企业的灾备及业务连续性体系建设方案,并分析了实施方式和效果,为同类型企业灾备系统建设具有一定的借鉴意义。

关键词:业务连续性 灾备 体系

中图分类号:TP319 文献标识码:A 文章编号:1672-3791(2017)10(a)-0024-02

1 业务连续性的挑战

作為大型央企的某特大型国有能源企业,关键业务系统面临各种威胁和挑战,其中包括自然灾害和社会灾害的威胁,以及如何确保业务的持续可用、满足国家法律法规的要求、承担企业决策层对风险管理的责任等。

随着某特大型国有能源企业各重要应用系统的建设和部署、关键系统高度集中化、云计算系统和大数据系统的深入使用,数据中心的面临的风险更加集中。一旦数据中心发生灾难,则将导致总部、全国所有分支机构、企业的业务停顿,或造成重要数据的丢失,其后果不堪设想。同时国家标准《信息系统安全等级保护基本要求》相关条文规定,三级等保以上的应用系统必须建灾备。如何防范各类风险,确保数据安全和业务的连续性、满足国家相关法规的要求,成为当面急迫解决的难题。

同时,灾备中心及灾备系统建设成本高昂,灾备建成后的长期运维,链路租用,预案开发及演练等都是不小的费用。如何提高灾备系统的实际效果、提高灾备系统资源利用效率也是灾备建设面临的深层次问题。

近年来,国外的灾备及业务连续性建设获得迅速发展。灾备管理由单一的项目管理升级为全面管理,灾备建设从围绕数据存储向围绕应用服务转变,灾备系统的建设不仅仅是IT系统的建设,而是包括灾备管理体系建设在内的业务连续性整体建设;灾备管理体系建设包括组织、人员、制度、流程、预案、演练等多项内容,业务部门的深度参与是业务连续性建设是否完善的重要标志。

2 灾备及业务连续性定义

灾备技术主要指利用科学的技术手段和方法,提前建立系统化的数据应急方式,以应对灾难的发生。内容包括数据备份和系统备份,业务连续规划、人员架构、通信保障、危机公关,灾难恢复规划、灾难恢复预案、业务恢复预案、紧急事件响应、第三方合作机构和供应链危机管理等。灾备恢复指标最关键的有两个;一个是RTO,Recovery Time Objective,它是指灾难发生后,从IT系统宕机导致业务停顿之时开始,到IT系统恢复至可以支持各部门运作、恢复运营之时,此两点之间的时间段称为RTO,广道容灾备份系统RTO达到分钟级。另一个是RPO,Recovery Point Objective,是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度,这种更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据。RTO、RPO均无限接近于0是所有灾备产品的终极目标。

业务连续性管理(Business Continuity Management,简称BCM),是一项综合管理流程,它使企业认识到潜在的危机和相关影响,制订响应、业务和连续性的恢复计划,其总体目标是为了提高企业的风险防范能力,以有效地响应非计划的业务破坏并降低不良影响。业务连续性管理系统(BCMS)是经常进行的活动的集合,业务连续性管理支持企业业务连续性管理活动,也支持技术灾难恢复活动。这些可以包括项目规划和管理、人员配备、计划、预测、预算编制、研究和开发、资源管理、通信、会议、教育活动、宣传和促销活动、活动网站、绩效评估活动、按天进行处理查询等。

3 灾备及业务连续体系建设方案及效果分析

某特大型国有能源企业业务数量众多、种类繁杂,涵盖了油田、炼化、销售、科研、工程设计等各个业务方向,业务系统及相应数据已实现高度集中,部署方式已实现多样化,近年来,建成了云平台为各业务系统提供资源,实现了大数据HANA部署,提高了数据抽取及报表生成能力。但因其各个数据中心较为分散,对区域性的自然灾害和社会灾害应对能力明显不足。

结合业务系统的部署现状、面临的自然风险和社会风险,该公司按照统一规划、分布实施的策略,利用先进的理念和技术,逐步构建适合自身应用特点的灾备体系。

(1)两地三中心和应用分级模式的建立,确保业务连贯性的实现。

建设北京和南京两个数据中心,同时结合现状,在北京现有三个数据机房,通过先进技术形成同城备份模式。按照应用系统关键及重要程度的不同,采取应用级灾备和数据级灾备相结合的方式。根据应用特点采用多样化的数据同步技术,包括存储层同步、数据库层同步、应用层同步等,实现总部多类型重要应用系统业务数据的远程灾备复制。建成10个重要应用系统灾备,并开展了对云计算系统、大数据HANA系统的灾备实现。实现了“两地三中心”向“同城双活、异地备份”的架构过渡,并最终演进到多活数据中心、实现灾备云、数据云。

(2)统一共享的远程数据同步平台,实现所有业务数据同步。

通过主机、存储、网络、安全的虚拟化技术,实现灾备中心各类资源的资源池化、云计算化;通过主机虚拟化技术为应用级灾备系统在南京灾备中心部署专有计算资源,为数据级灾备系统部署共享计算资源,提高了各类资源的共享程度和利用效率;通过虚拟子网技术、分区分域技术构建共享的网络架构和安全体系;通过存储区域网络融合创建共享的数据复制平台,从多方面入手,努力提高灾备中心的资源利用效率,降低能耗,创建绿色中心;通过存储资源整合、通信链路复用、云资源平台构建等设计理念的贯彻和实施,直接节省了机房、机柜空间,节省了电力资源,提高了系统和数据的性能、安全和可维护性。

(3)体系化的灾备演练制度,提高风控意识。

随着灾备中心及灾备系统的初步建成,对关键业务系统进行了风险分析、业务连续性分析,并依据国家标准和规范建立了灾难恢复预案管理和更新机制等,确定了灾难应急管理组织、应急响应流程,开展灾备演练。同时实现演练常态化,通过业务连续性管理的方法和内容,完善灾难恢复体系。

在工作中,实现了重要应用系统的灾备演练,包括桌面演练、模拟演练与实战演练,由简入繁,由易到难,锻炼队伍,积累经验,再进行风险度较高的实战演练。其中桌面演练的频度以每年一次或按需进行,模拟演练1~2年一次,对于较大型的系统,实战演练3~5年一次。在灾备演练实践中,对重大系统进行了应用级灾备演练,各个业务部门均深度参与,共同完成复杂的交互业务。通过灾备演练,验证灾备系统的可用性,验证灾难恢复应急响应流程的可行性、业务逻辑的可操作性以及灾备端数据的可用性,检验组织、岗位、人员之间的配合程度,熟悉灾难恢复预案和业务连续性计划,提高了各部门的风险意识、安全意识。

4 结语

随着国家“两化融合”战略的深入,信息化促进工业化发展,起到了举足轻重的作用,构建完善的灾备体系成为了企业提供核心竞争能力的重要手段之一。某特大型国有能源企业的灾备及业务连贯性体系的运行,为集团公司经营管理、生产营运、客户服务、科研工程等各方面活动开展提供了条件,为信息化促进工业化发展提供了有力保障。

参考文献

[1] 张春林,陈小峰.商业银行业务连续性管理[M].机械工业出版社,2016.

[2](美)奥克丽塔,著.构建企业级业务连续性规划[M].于天,译.机械工业出版社,2015.endprint

猜你喜欢
灾备体系
构建六大责任体系守住粮食安全底线
物质体相(宇宙 世界 生命)形成,以及运行体系
仁爱至和 笃行达慧——至和教育的理念体系与实践体系构建
深蓝云海“云灾备”正式上线
“曲线运动”知识体系和方法指导
共享灾备走向智能化
灾备建设的新思路
“三位一体”建体系 长治久安防哮喘
GDS将建19个数据中心
让灾备不惧“遥远”