【探索绿色容灾模式 提升业务连续水平】

2016-02-17 12:13陈根军,郭振波
河北金融年鉴 2016年0期
关键词:容灾邢台机房

【探索绿色容灾模式 提升业务连续水平】

近年来,银行电子平台系统日趋复杂多样,且银行业务的支撑越来越依托于这些电子平台。由于信息系统的规模庞大、复杂,因此在面对未知灾难时,银行面临系统整体停止、瘫痪的可能性也大大增加。如何对所有的业务系统都分别建立一套可靠、安全、应变能力强的灾备体系,是目前银行内部极度迫切的需求。中国人民银行作为银行系统的管理机构,也要求国内银行必须建立有效的容灾机制。银监会发布的《商业银行信息科技风险管理指引》也着重指出,商业银行必须提供业务连续性保障。邢台银行虽成立较晚,但是IT建设始终处于行业较高水平,在这样的银行内部需求和监管部门的要求下,邢台银行于2010年启动了“两地三中心”容灾系统的建设。中国人民银行邢台市中心支行和中国银行业监督管理委员会邢台监管分局对此项目十分重视,对项目进行了长期的监控、指导,推动了邢台银行“两地三中心”建设顺利进行,该容灾系统于2015年建设成功并投入使用。

一、邢台银行容灾建设情况及成效

(一)制订了合理、先进的容灾建设目标

邢台银行在广泛调研其他银行容灾系统的情况后,总结出容灾系统建设容易出现的几个缺陷:一是切换复杂、系统可用性不易得到验证,往往出现故障时不敢或不能切换。二是存在故障切换决策风险,切换决策没有依据,往往需要靠领导“拍脑袋”来定夺。三是系统投资浪费,大量设备处于闲置状态而不能利用。四是业务恢复时间RTO指标较长,业务连续性支持不好。

针对这些缺陷,邢台银行提出了容灾项目建设的总体目标,即:在确保系统稳定安全的前提下,颠覆“切换时长、数据丢失,平时不用、浪费投资,决策困难、影响巨大,演练复杂、风险增加”的传统“灾备”模式,创建全新“容灾”理念,使新增投资平时发挥生产效力、实现容纳各种灾难、确保业务连续和数据安全。

(二)达到“同城应用级容灾均衡双活”的水平

邢台银行的同城应用级容灾机房运行能被客户直接感知的各类业务,平时与主机房同时运行,负载均衡使用,分担业务流量。当容灾机房或主机房任何一处出现灾难造成的非计划内停机,则另一个机房都能在保证不丢失数据的前提下,继续对外提供同样的服务,且不会对业务或对客户产生影响。现邢台银行经过对同城机房业务的双活测试,并于2015年成功投入使用。

(三)满足“异地数据灾备”的标准

异地容灾数据备份机房(托管给专业的第三方公司管理),存放一台存储设备和一台核心业务验证服务器,通过CDP技术异步存储数据,容许0~15分钟数据丢失。发生城市级灾难时仍可有效恢复数据。

(四)优化系统部署

邢台银行在容灾项目前期进行了现有业务系统分析。经分析,目前各服务器应用程序和数据库部署混乱,没有实现数据和程序的分离,且数据库分散在多台服务器中,缺点是不利于数据统一灾备处理,而且没有实现数据库均衡负载,如若数据库崩溃只能由另一台机器启动数据库接管,切换时间为15分钟左右,不能保障数据零停机效果。数据库和应用程序部署在一起,严重占用系统资源,影响应用程序。通过建设容灾系统,邢台银行重新部署应用系统的分布。通过对业务系统的重要程度、资源占用、业务种类分类,将业务重新规划、部署至相应的硬件服务器。并完成应用与数据库分离的优化,减少数据库与应用的互相干扰,容灾系统由原来的15分钟降低至5分钟,提高运行效率,每年还可节省异地专线扩容费用60余万元。

二、容灾建设经验

容灾系统建设是当前银行IT系统建设中重要且必要的一项工程。建设一个成功的容灾系统,不仅需要银行业监管部门的积极指引,也需要银行吸取其他同行在这方面的经验和教训。此次邢台银行容灾系统建设成效显著,因此我们分享经验如下:

(一)容灾建设要点介绍

在邢台银行设计容灾系统方案时,为确保项目建设能够满足《商业银行信息科技风险管理指引》的相关要求,中国人民银行邢台市中心支行和邢台银监分局领导多次来到现场,同邢台银行相关人员面对面交流、讨论,对容灾系统建设提出了几点指导和要求:

容灾方式:应用级容灾还是数据级容灾,是否实时切换。

可靠性:包括网络、存储、光纤网络、主机、操作系统、数据库、应用各个层面。

数据安全:不允许出现数据不一致的问题,防止出现两个机房“脑裂”的情况导致两个银行同时办理业务;不允许出现数据丢失的情况。

可实施、可验证:方案是可以在预想的时间、条件下可以完成的,也是可以通过技术手段进行验证的。

决策难度小:当出现灾难时不能靠领导主观拍脑袋决策,必须是有定量的数据作为依据,或者减少决策的范围,避免由一个问题导致另外一个更严重的问题。

演练简单:可以定期方便、有效地去做容灾演练,而不影响系统的安全生产。

(二)独特新型容灾方案

银行监管部门在容灾项目指导过程中,注重与邢台银行的沟通和互动,切实通过研讨论证方式来进行方案的设计,鼓励邢台银行在现有容灾方案上要大胆借鉴,勇于创新。

通过对业界现有的容灾方案的反复讨论、参考以及借鉴,邢台银行提出了独特的“均衡双活”的容灾方案,采取的技术有:LVM卷镜像技术、HA技术、CDP远程数据备份。

在数据库层面上,A机房和B机房部署数据库服务器形成集群,AB机房的交换机两两级联,使整个网络为一个SAN网络,两机房分别部署两台作为同步镜像的存储。C机房用于远程数据备份,通过CDP技术进行远程异步数据备份,C机房管理托管给专业的第三方公司。

由于邢台银行提出的容灾方案比较独特和新颖,国内同行业内都没有相关案例,各厂家和集成商也没有相关的经验,所以必须在前期做好该方案可行性的验证工作。邢台银行于2010年12月3日,召集IBM、SYMANTEC等十几家公司的专家齐聚邢台,举行了 “邢台银行容灾系统技术讨论会”,对此容灾方案进行了详细的对比、论证、研究。这次讨论会得出结论:“在线路稳定的条件下邢台银行均衡双活的容灾模式是可行的”。为保证线路稳定的条件,邢台银行建设的同城机房与原有主机房距离大约2千米,通过铺设高质量光缆来保证高质量、稳定、高带宽的线路。神州数码曾对新华保险项目实测表明10千米以内的线路长度对数据复制没有影响。

(三)遵循的标准和规范

主要包括:银监会《商业银行信息科技风险管理指引》(银监会2009年6月颁布执行);《中国人民银行关于加强银行数据集中安全工作的指导意见》(银发〔2002〕260号);《中国人民银行关于进一步加强银行业金融机构信息安全保障工作的指导意见》(银发〔2006〕123号);《银行业金融机构信息系统风险管理指引》(银监发〔2006〕63号) ;JR/T 0044-2008《银行业信息系统灾难恢复管理规范》国标GB/T 20988-2007《信息安全技术信息系统灾难恢复规范》;国标GB/T 20984-2007《信息安全技术 信息安全风险评估规范》 。

三、专家评价

项目启动后,原中国人民银行科技司司长陈静先生曾亲临现场考察,陈静先生目前担任中国银行业业务连续性委员会领导职务,是IT容灾方面的专家,他对项目的可行性和先进性做出了肯定,他表示:目前国内银行还没有该种先进容灾模式,这与国外银行刚刚兴起的先进的“并行耦合式容灾模式”异曲同工,邢台银行能深入探索和创新“绿色容灾”,并取得可喜成果,对推动中国银行业容灾模式转变具有极大推动和示范作用。

(邢台银行 陈根军 郭振波)

猜你喜欢
容灾邢台机房
中国农业发展银行邢台分行
中国农业发展银行邢台分行
游邢台动物园
高速公路收费中心容灾备份系统建设方案分析
关于建筑企业容灾备份系统方案的探讨
基于中兴软交换的电力通信网络容灾系统建设
基于数据容灾技术在企业信息系统中的应用研究
N通信公司机房节能技改实践
关于加快邢台地热资源的开发与利用
某IDC机房结构设计