李钰婷
智慧水务是智慧地球、智慧城市的重要组成部分,主要通过使用科技手段,配合仪器仪表、采集终端等设备,对水务信息进行采集、传输、处理、存储、分析,在全面提升水务管理效率的同时,实现更全面的感知、更自动的控制、更及时的应对、更主动的服务和更科学的决策。
陕西省水务集团智慧水务项目是基于大数据、云计算、数据挖掘以及物联网等先进技术,整合供水、水电开发、污水处理等多个业务信息系统,部署范围覆盖全省的大型信息化建设项目。县级业务系统的数据均实时传送至集团总部数据中心统一处理、存储,因此数据中心存储了海量的业务数据,这些核心数据无疑是企业重要的数据资产。
由于无法完全避免硬件故障、人为误操作、系统程序错误,病毒入侵,以及自然灾害带来的系统停机或数据丢失,为了保护核心数据,在遭遇灾害时能保证信息系统的正常运行,那么智慧水务信息化建设中容灾备份方案的设计就必不可少。下面从容灾技术和备份技术两个方面来分析适用于该项目实际建设的技术方案。
容灾技术主要有数据级容灾和应用级容灾。数据级容灾是指在异地建立一个数据系统,其中保存一份与本地数据完全一致的可用数据。应用级容灾是指,在数据容灾的基础上,在异地建立一套完整的与本地业务系统功能完全一致的备份应用系统,在发生灾难的情况下,异地备份业务系统能够迅速地接管业务运行。考虑到集团总部的智慧水务大数据平台上同时运行着供水、污水、水电等各个业务系统,本地平台一旦发生灾难性事故,集团绝大部分业务系统的运营都将受到影响。因此本项目的容灾备份方案中应选择应用级容灾技术,涉及具体的实现技术主要有负载均衡、集群技术。
备份方式有本地备份和异地备份。本地备份的优点是速度快、维护方便,缺点是一旦发生重大灾难,无法保证本地备份系统中的数据和应用系统仍可用。而异地备份,是将备份系统部署在与本地同时发生重大灾难概率极低的异地,这样即使本地发生灾难,也可以顺利的从异地备份中恢复数据。结合集团的实际情况,可选择本地备份与异地备份相结合的方式。各县级业务系统在各县本地部署有数据库,作为各业务系统数据的本地备份。智慧水务大数据平台接收各业务系统数据,作为各业务系统数据的异地备份。同时可通过考察选择一合适地点,部署智慧水务大数据平台的异地备份系统,进一步保障平台数据的安全及业务系统的不间断运行。
远程镜像技术用于在本地数据中心和异地数据中心之间备份数据,包括同步复制和异步复制两种方式。同步复制技术,是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息。异步复制技术,则是保证在更新异地存储的数据前,完成本地存储系统的操作,由本地存储系统提供I/O操作完成确认信息。考虑到同步复制技术对应用系统I/O性能影响较大,且异地备份系统与本地数据中心需距离300 km以上,因此智慧水务的本地数据中心与异地备份数据中心之间采用异步复制技术是比较理想的方式,兼顾性能要求的同时,又满足了对数据可靠性的要求。
远程镜像技术还可与快照技术结合起来实现远程备份,即通过镜像把数据备份到异地存储系统中,再用快照技术把异地存储系统中的数据备份到异地的磁带库、光盘库中。在正常业务进行的同时,通过软件对要备份的磁盘子系统的数据快速扫描,同时快速拷贝,获得当前业务数据的完整备份。智慧水务的容灾备份建设,可通过在异地数据中心的磁盘阵列系统中配置快照的方式,实现数据的自动备份,以及在线数据的恢复,并可利用备份数据完成报表生成等功能。
结合陕西省水务集团的实际情况,制定 “一主一备一辅”,实现“双活”的应用级容灾备份方案,具体网络拓扑图见图1。
图1 异地容灾备份网络拓扑图
考虑到集团在延安设有分公司,延安距离西安超过了300 km,且不在同一地震带,也不在同一江河流域,符合异地容灾备份的地理条件,故在集团延安分公司机房设立异地备份数据系统。
在西安总部机房DMZ区和延安机房分别部署数据库系统,系统设置为集群模式。本地数据库系统与异地数据库系统均处于活动状态,本地数据库系统主要提供数据处理、查询及存储的功能,备份数据库启用自动生成日志、报表等功能,提高了备份数据库系统的使用率。一旦本地数据库系统出现宕机等故障,异地的备份数据系统仍能提供数据处理、查询及存储等完整功能,且可以通过备份数据系统恢复本地数据。经调研神州数码数据库一体机符合上述要求,可实现“双活”效果,因此实际项目中在本地和异地数据中心各部署了一台神州数码数据库一体机。
在西安总部机房DMZ区和延安机房分别部署软、硬件配置均相同的平台级业务支撑系统,本地业务支撑系统正常情况下处于主用状态,而异地业务支撑系统处于备用状态。一旦本地数据中心出现重大灾难,异地的备份数据中心可自动接管相关业务。
本地数据库系统与异地备份数据库系统之间,采用异步复制技术,将本地数据库系统接收到的数据,复制到异地数据库系统中。当本地数据库系统与异地备份数据库系统之间的链路出现故障,无法通信时,本地数据库将会对已传输的数据节点进行标记,然后一直保持对网络连通性的探测,一旦恢复通信,本地数据库将会从标记节点开始向异地备份数据库传输数据。为了解决本地数据系统与异地备份系统网络链路故障期间,本地数据库同时发生故障的特殊情形,尽可能地保证本地数据与异地备份数据的一致性,在本地DMZ区另行部署一台轻量级实时更新数据库,仅保存最近两天的更新数据。数据传输至本地数据系统时,将同时传输给本地更新数据库与异地备份数据库。这样,在网络出现故障时,即使本地数据库同时出现故障,随后也能通过本地实时更新数据库恢复完整的数据。
异地备份数据中心部署有磁盘阵列系统,配置快照功能。自动从备份数据库系统往磁盘阵列系统复制当天更新的数据。每隔一个月,对全部的数据做一个完整快照。当发生灾难,需要恢复本地数据库或备份数据库的数据时,可使用快照的在线恢复功能,快速恢复所需数据。快照技术极大地减轻了运维压力以及灾后恢复的效率。磁盘阵列采用RAID5模式,在所有磁盘上交叉地存取数据及奇偶校验信息,当一个磁盘发生损坏后,可从其他硬盘上存储的数据恢复出故障盘的内容,不会影响数据的完整性,从而进一步保证了数据的安全。
本地及异地的所有数据库服务器和业务支撑平台设备,均采用双链路冗余方式与交换机或防火墙进行连接。在服务器或平台设备的两个连接端口上做端口聚合,将两条链路虚拟为一条链路,配置一个IP地址,这样一条链路出现故障的情况下,通过另一条链路仍可进行访问。
通过采用RAID5磁盘阵列、“一主一备一辅”方案及异步复制技术,部署异地容灾备份数据系统和备份业务支撑系统,目前集团智慧水务业务系统已具备数据级、数据库级、应用级,共三个层级容灾备份,保证了数据的安全及核心业务的连续性,可提供7*24小时业务不间断运行,整个备份系统具有高容灾性和可扩展性。