95598核心业务系统双活模式建设的探索与实践

2018-03-06 21:36张才俊姚忠杰
科技创新导报 2017年33期

张才俊++姚忠杰

摘 要:95598核心业务应用系统的安全性、可靠性直接关系到国家电网公司的服务质量和社会形象,95598核心业务系统业务连续性和数据安全保障要求十分迫切。建设95598核心业务的双活应用系统,实现业务支持系统的稳定、安全、持续运行是供电服务持续、有效开展的重要支撑。

关键词:异地双活 数据复制 高稳定性

中图分类号:TN919 文献标识码:A 文章编号:1674-098X(2017)11(c)-0110-02

Abstract: The security and reliability of the 95598 core business application system is directly related to the service quality and social image of the State Grid Corporation, and the requirement of business continuity and data security of the 95598 core business system is very urgent. It is an important support for the sustainable and effective development of the power supply service to build the double live application system of the 95598 core business, and realize the stable, safe and continuous operation of the business support system.

Key Words:Active-Active Mode; Data replication; High stablility

国家电网95598供电服务面向千家万户,服务要求高、社会影响力大,95598核心业务系统的业务连续性保障体系建设尤为重要。信息系统面临各种各样的风险威胁,例如系统硬件、网络故障、机房断电、火灾、地震、战争、恐怖袭击、黑客入侵、内部破坏等风险[1],通过业务连续性保障体系的建设,可以提高客户服务中心核心业务系统抵御灾难和重大事故的能力,确保重要信息系统的数据安全和作业持续性。

1 双活的定义与特点

双活[2](Active-Active Mode)是一种节约资源的计算机灾备(Disaster Recovery)方案,其实现模式是让两个数据中心都同时承担用户的业务,主备两个数据中心互为实时备份。其中主数据中心的负载分担60%~70%的业务,备数据中心分担30%~40%的业务,保证其中一边发生故障时,不至于造成业务无法处理的情况[3-4]。双活容灾技术是指在灾备系统中使主生产端数据库和备机端数据库同时在线运行,处于可读可查询的状态的技术。当前高可用灾备系统常用的工作方式有3种:第一种为共享存储(磁盘阵列)的方式;第二种是双机存储;第三种是利用数据的同步方式,即镜像方式。95598核心业务系统的异地灾备中心(上海)距离生产中心超过1000km,经过对灾备系统常用工作方式进行分析对比,95598核心业务应用系统采用镜像技术方式。

2 95598核心业务系统双活方案

利用国网客服中心下辖南、北两个分中心,业务划分区域特征明显,采用分区域划分用户的方式进行业务和数据逻辑隔离,即一部分省市用户访问北数据中心,另外一部分省市用户访问南数据中心。在数据库层面采用分用户(schema)方式,南中心应用读写南中心业务数据,北中心应用读写北中心业务数据,南北中心数据库用户通过逻辑复制软件分别向对端完成数据复制。使核心业务系统在接入层、应用层和数据层实现双数据中心运行。

2.1 接入层

两个数据中心的核心业务系统域名地址注册,全局负载均衡策略设置,使对应的用户登录到所在数据中心的Web服务器。本地负载均衡策略设置,使用户请求自动分配到本地web服务集群中较闲的服务器。应用程序增加路由控制,实现灾难情况下通过路由调整,做到快速切换。

2.2 资源層

完成95598核心业务系统远距离双活灾备系统建设项目资源设计。主要包括:一是完成双活灾备建设现有生产中心服务器、存储、持续数据保护器及附属闪存阵列、数据库复制系统等规划。二是完成灾备中心95598核心业务系统全新建设的网络、服务器、存储、持续数据保护器及附属闪存阵列、中间件系统、备份软件等规划。

2.3 数据库双活(备端只读)

数据库双活是另外一种双活运行方式,可解决应用服务器双活运行方式下,备端应用服务器和主端数据库服务器之间数据交互量太大的问题。这种方式需设立备数据库,主备数据库之间进行数据复制,将备端应用服务器连接至备端数据库服务器。为保证主备数据库的一致性,禁止备端数据库进行写操作,主备数据库应进行同步复制。

2.4 数据复制

建设95598业务支持系统双活系统,最核心的任务就是要解决生产中心和灾备中心数据同步问题。对于结构化数据,两个数据中心的不同schema下的数据进行单向同步。对于文档、图片等非结构化数据,考虑灾备情况下单中心支撑双基地的情况,采用非结构文件同步工具进行复制,同时业务程序上通过针对性的配置项拆分,区别两个生产中心的文件服务器地址。

2.5 数据库分区分域拆分

双活系统必须在某个维度进行拆分成两部分,分别由两个中心承担。拆分的维度可以是模块、流量、用户等。从实现异地双活的角度出发,一方面需要使拆分后的两部分内容尽量减少业务交叉;另一方面需要使拆分易于实现数据的逻辑隔离。95598业务两个省市之间的工单流转具备无关性,因此,最佳的拆分策略是按南(北)区域拆分。同时对数据库序列调整,两个schema的同名sequence采用一奇一偶方式逻辑区分。

2.6 单元化

单元化是指双活的任意一个中心都可以成为一个独立运作的个体而不需依赖另一个单元独立提供业务服务。由于远距离异地的数据传输延时较高,因此复制的成本也高,应尽量减少完成复制所需要的交互次数。采用以省市为最小单位的划分可以基本实现单元化,采用单元化的策略后,单个中心独立完成业务服务,仅对于最终的数据结果进行交互。

3 结语

本文通过对灾备系统常用的工作方式和数据复制技术的深入分析和比对,构建了全方位的容灾体系,实现了95598核心业务系统的异地双活,能有效减少停机时间和数据损失。实现了95598业务系统应用层面和信息数据的透明接管与恢复,提高对应急事件处理和灾难快速恢复能力。

参考文献

[1] 刘信,朱凯进.国家电网公司数据灾备中心数据复制方式研究[J].硅谷,2012(14):94-95.

[2] 贾博,张吉生,杨飞,等.电力营销业务应用系统同城双活研究与设计[J].电力信息与通信技术,2017(2):66-70.

[3] 丁建立,王斌强,张超.异地双活数据中心服务区域划分优化[J].计算机应用与软件,2016(2):30-32.

[4] 李小庆.双活数据中心的构建及运维[J].金融科技时代, 2016(1):15-19.endprint