基于双活的区域高速公路数据灾备中心建设探讨

2023-11-10 11:26高金勇
福建交通科技 2023年7期
关键词:灾备容灾备份

■高金勇

(福建省高速公路集团有限公司,福州 350001)

高速公路日常业务越来越依赖于数据处理,而高速公路业务系统的连续性依赖于数据中心的稳定运行。 数据灾备中心是交通信息化的产物,是一个专门用于备份和保护关键数据的设施,旨在在发生灾难性事件或系统故障时快速恢复业务运行并保证数据的完整性和可用性。 建设数据灾备中心有利于保障业务连续性、提高数据安全性、提升灾备能力,对高速公路智慧交通的建设具有重要意义。本文基于高速公路灾备中心建设现状和研究现状,进行了基于双活的区域高速公路数据灾备中心建设探讨。

1 高速公路数据灾备中心建设现状及需求

要保证高速公路业务的连续性和数据的高可靠性,需要在建设数据中心的同时,打造高可靠灾备数据中心, 但是传统的灾备中心因为技术等原因,存在诸多不足,这是本文探讨的需求起点。

1.1 高速公路传统灾备中心应用接管能力弱

传统的灾备中心以异地单活应用接管为主,即只有一个活动状态的应用,当主要数据中心发生故障或中断时,灾备中心才会接管运行。 而且传统的单活灾备中心在应用接管过程中存在较长的切换时间,这是因为在发生故障或中断时,需要手动或半自动地将应用从主要数据中心切换到灾备中心。这种切换过程需要耗费较长的时间,导致应用的停机时间增加,对业务造成较大的影响。

1.2 高速公路传统灾备中心数据备份与保护困难

数据备份是为了保障系统安全性和提升数据中心应急能力,由于单活灾备中心在存储层上的数据同步复制等高级数据保护功能,无法在不同型号产品间实现,导致业务数据备份困难。 同时,在传统灾备中心备份的过程中,由于不同存储器上的数据分配标准不同,不利于统一管理,同时存储容量扩展和服务器数据量扩展也受到一定的限制。 由于场地有限,所有数据保存在同一个中心机房,无异地数据中心和异地数据容灾中心,业务系统的连续性及备份数据的安全性受到自然条件的考验,无法防范场地性等不可抗力自然灾害。

1.3 高速公路传统灾备中心业务整合能力差

传统的单活灾备中心通常是将主数据中心的业务完全复制到备份数据中心,但两个数据中心之间的业务运行是相互独立的。 这种方式导致了业务的分离,主数据中心和备份数据中心之间的业务无法实现无缝切换和负载均衡。 当主数据中心发生故障时,需要手动切换业务到备份数据中心,导致业务中断和用户体验下降。 当主数据中心发生故障时,备份数据中心可能无法提供最新的数据,进而影响业务的连续性和可用性。

2 数据灾备中心建设研究

当前,关于数据灾备中心的研究主要集中在异地灾备中心等灾备模式上,应用场景分布在银行业、政府部门和大型企业。 近年,中国电信灾备中心在西安落成,运营商实现了首个集数据化资产保护、灾备服务于一体的全方位容灾服务体系的灾备中心[1]。在交通运输领域,刘新华[2]讨论了一种交通运输行政执法灾备服务建设的技术方案,旨在实现对应用系统重要数据的备份,确保系统在面临不可抗力灾难时能够有效保护重要数据并进行数据恢复。 在防震减灾领域,牛诗川[3]针对地震数据灾备中心网络安全和可靠性的基本要求,制定了全面的规划和设计方案,深入研究了灾备中心网络安全防护系统和后期维护策略。 在其他政府部门相关领域,吴瑞强[4]通过考察惠州市社会保险基金管理局龙门异地灾备中心的建设,从基础设施和网络通信基础架构的角度获取到一些有价值的建设思路,可用于指导其他数据灾备中心的建设。 在高速公路领域,付增辉[5]提出建设异地灾备系统的方案, 灾备系统建在异地,能够利用网络系统将异地存储的数据库数据回传至本地系统,保证本地系统可靠运行。 沈兰兰[6]通过分析某高速公路收费管理平台异地灾备中心灾备管理体系的建设需求,探讨了基于统一的技术标准,建设容灾备份系统,面向服务化提供灾备运维服务及运营管理的建设思路。 曹佳宝[7]研究“两地三中心”灾备架构,在此基础上进一步提出了基于云技术的数据灾备中心优化建设思路。

综合上述的研究现状,可以发现目前缺乏对高速公路业务场景的应用研究,且研究多集中于建设异地灾备中心,这就导致数据同步依旧是异步方式,备份数据中心只有在主数据中心发生故障或不可用时才接管应用,使用率较低,还伴随一定的数据延迟。 因此对高速公路数据灾备中心建设这一业务场景,本文提出了双活数据灾备中心方案,这种架构通常包括两个地理位置不同的数据中心,彼此之间实时同步数据,并能够相互备份和恢复。

3 基于双活的高速公路数据灾备中心技术方案

针对高速公路数据灾备中心的建设现状和研究现状,本文提出一种基于双活的区域高速公路数据灾备中心建设方案,并在泉州东秀凃站点进行了实施。

3.1 高速公路数据灾备中心总体方案

基于双活的高速公路数据灾备中心的建设方案结合了大数据云平台的使用,以实现更高效的数据处理和灾备能力。 通过在两个地理位置上建立数据中心,实现数据的双活备份,同时将数据中心与大数据云平台集成,可以利用云计算和大数据技术来实时分析和处理数据,提供实时的交通监控和管理。 同时,当一个数据中心发生故障或不可用时,系统可以自动切换到另一个数据中心,以确保业务的连续性和可用性。 这种方案不仅可以提高高速公路数据系统的可靠性和连续性,也能够根据实时数据提供智能化的决策支持,进一步优化交通运输效率和安全性。

3.2 高速公路数据灾备中心系统架构

基于双活的区域高速公路数据灾备中心软件采用混合云架构,总体包括两个数据中心、数据同步与复制、双活架构、负载均衡和故障转移等关键组件,实现实时同步、高可用性和灾备能力,确保高速公路数据安全、可靠和连续地运行。 双活灾备数据中心总体架构见图1。

图1 双活灾备数据中心总体架构图

首先,系统依赖于两个数据中心,分别位于主要高速公路区域的不同地点。 每个数据中心都是一个完备的设施,拥有强大的硬件设备和网络基础设施,包括服务器、存储设备、网络设备等。 这些设备用于存储和处理大量的高速公路数据,包括交通流量、车辆信息、路况数据等。 其次,为了实现数据的实时同步和复制,系统采用高速网络将两个数据中心连接起来。 数据中心之间的数据同步和复制是通过复制技术和算法实现的,确保数据在两个数据中心之间的一致性和完整性。 这样,无论发生何种情况, 数据都能够在两个数据中心之间实时同步,避免数据不一致或丢失。 此外,系统采用双活架构,即两个数据中心同时处于活动状态,能够实时处理和响应数据请求,这意味着无论哪个数据中心出现故障或需要维护,另一个数据中心都能够接管其功能。负载均衡和故障转移技术被应用于系统中,以实现高效的数据处理和负载均衡,保证用户请求能够被平均分配到两个数据中心,并在其中一个数据中心发生故障或出现灾害时,自动将数据和服务转移到另一个数据中心,确保数据和服务的可用性和连续性。 最后,系统对数据进行加密和备份,数据备份存储在另一个数据中心,以防止数据丢失或损坏;系统还采取了安全措施,如访问控制、加密传输等,以保护数据的机密性和完整性。

3.3 双活灾备中心建设

实现数据的双活是方案的核心,在明确了总体方案和系统架构的前提下,可以进行双活灾备中心的建设,具体步骤如下:(1)高速网络连接:建立主中心和备中心之间的高速网络连接,确保数据的快速传输和同步,选择专线、光纤等高带宽和低延迟的网络连接方式;(2)数据同步技术选择:根据具体需求选择合适的数据同步技术,常见的技术包括实时数据同步、异步数据同步和延迟冗余数据同步等;(3)实现数据的双活需要做到实时数据同步、异步数据同步和延迟冗余数据同步。 实时数据同步是指通过使用数据库复制技术、日志传输或文件同步等实现主中心和备中心之间的实时数据同步,确保数据在两个中心之间的一致性;异步数据同步是指将数据定期复制到灾备中心,通过批量传输或数据备份等方式,确保数据的最新性在一定的时间延迟下仍然能够满足容灾需求;延迟冗余数据同步是指在一定的时间延迟下,将主中心的数据复制到备中心,进一步提高容灾能力和数据可用性;(4)数据双写策略:确保在主中心和备中心之间的数据写入操作能够实时同步到另外一个中心,采用同步复制、写入队列或分布式事务等方式来实现数据的双写;(5)容灾切换操作:在主中心发生故障或计划维护时,通过切换操作将业务流量切换到备中心,确保业务的连续性, 可以利用负载均衡、DNS 解析等方式进行流量切换和请求转发;(6)容灾测试和演练:完成以上步骤之后还需要定期进行容灾测试和演练,验证主中心和备中心之间的数据同步和容灾切换的可用性和稳定性。

3.4 高速公路数据灾备中心云平台建设

高速公路数据灾备是基于云平台构建的,实现双活依赖于云平台的建设,故在此对云平台的建设进行说明。 高速公路数据云平台主要包含3 层架构:基础层、平台层和应用层。 (1)在高速公路数据灾备基础资源层,云平台建设搭建和管理一系列基础设施资源,如存储设备、网络设备和服务器等,还需要建立强大的数据中心和网络基础设施,这些资源需要具备高可用性、高安全性和可扩展性,以满足不同规模和需求的应用。 基础资源层还包括虚拟化技术和容器化技术,配置容灾备份系统,以及实施监控和管理系统,用于资源的隔离和管理,提供灵活的资源分配和利用方式。 (2)在高速公路数据灾备平台层,云平台建设提供了一系列中间件和服务,以支持应用的部署和运行。 这包括操作系统、数据库、消息队列、缓存等。 平台层的目标是提供统一的开发、部署和管理环境,简化应用的开发和维护工作。 平台层还可以提供自动化的监控和管理工具,以实现资源的动态管理和优化。 (3)在高速公路数据灾备应用层,云平台建设了提供各种应用服务和解决方案,以满足高速行业和用户的需求。 这包括高速公路在线办公、数据分析、人工智能、物联网等应用。 应用层的目标是通过云平台提供了各种服务和解决方案,帮助高速公路快速构建和部署高速业务的应用,提高效率和创新能力。

4 基于双活的区域高速公路数据灾备中心建设

4.1 双活灾备数据中心案例总体规划

福建省高速公路主数据中心建设在福州市城区祥谦,新型异地灾备数据中心建立在泉州东秀凃站点, 异地灾备为主数据中心提供了更大的保险,能更好防范场地性等不可抗力自然灾害的影响。 同时,建设双活异地灾备,可以在主数据中心发生故障或灾难时,快速切换到远距离异地备份数据中心,确保业务的持续运行。 这样可以大大减少业务中断时间,提高业务的连续性和可用性。 在福州另外增设数据中心节点,实现同城双活,异地灾备。 要进行灾备的系统在灾备数据中心进行部署,并把部分应用的生产系统调整到灾备数据中心。 正常工作时,两个中心都投入生产,根据信息系统的数量和应用特点,进行负荷分担或负载均衡。 两个中心互为灾备,通过动态资源调整技术,提高容灾设备利用率,实现数据备份与保护、应用接管、业务整合等功能,全面提升高速公路信息服务水平。

4.2 福建高速公路灾备数据中心定位

选择灾备数据中心的地理位置时,主要考虑其与福建数据中心的距离。 通常情况下,灾备数据中心应该位于主要数据中心的相对安全区域内,以减少单点故障的风险。 同时,地理位置应尽量选择地震、洪水等自然灾害风险较低的地区,以确保数据中心的物理安全。 保证福建高速公路灾备数据中心与主要数据中心之间的通信网络是至关重要的。 在选择位置时考虑到了通信网络的质量和可靠性,确保能够在主数据中心发生故障时,快速且可靠地传输数据和恢复服务。 除此之外,还需要确保稳定的电力供应。 在选择福建高速公路灾备数据中心时,本研究考虑了电力供应的可靠性和备用电源的储备情况,以应对主要数据中心或周围地区的电力中断,因此项目将新型异地灾备数据中心建立在泉州东秀凃站点。 异地灾备数据中心的建立,为福建高速公路祥谦主数据中心提供了一项可靠的保险机制。 这种建设方式能够有效保证业务的无中断运行,为福建省高速公路数据管理提供了强大的安全保障。

4.3 福建高速公路双活灾备数据中心网络建设

目前福建省高速公路共有收费网、 视频网、综合网和互联网,灾备数据中心的网络通信需求参照祥谦数据中心,同样应建设收费网、视频网、综合网和互联网。 另外,灾备数据中心与祥谦数据中心采用了主备双链路,建立起可靠的通信链路,同时下联各站点以及出口互联网。 灾备数据中心网络通信拓扑图见图2。

图2 双活灾备数据中心网络通信拓扑示意图

同时,福建高速公路双活灾备数据中心还考虑了网络的信息安全建设。 灾备数据中心的信息安全需求参照祥谦数据中心,以高速公路灾备数据中心网络(收费网、综合网、互联网)环境为保障对象,并且参考《网络安全等级保护基本要求》进行建设,收费网按照等保三级的要求进行规划设计,综合网按照等保三级的要求进行规划设计,互联网按照等保二级的要求进行规划设计。 灾备数据中心信息安全拓扑图见图3。

图3 双活灾备数据中心信息安全拓扑示意图

4.4 双活数据灾备中心功能实现及实际应用效果

福建高速公路双活数据灾备中心的应用系统是由数据备份系统、备用网络系统和备用数据处理系统等组成的信息系统。 高速公路应用系统容灾最基本的功能就是数据保护和发生灾难时的应用接管。 为了提高应用系统容灾利用率,结合高速公路的实际情况,应用系统容灾也可用于计划内的生产系统停机时的应用接管和业务整合。

4.4.1 福建高速双活灾备数据保护

数据保护是双活数据灾备中心实现的基本的功能之一,泉州东秀涂站数据灾备中心通过实时数据复制将主数据中心的数据同时复制到备用数据中心。 这种复制方式可以确保两个数据中心的数据保持同步,减少数据丢失的风险。 基于此,双活数据灾备中心可以提供更高级别的数据保护和灾难恢复能力。 主数据中心和备份数据中心之间的数据同步可以实现实时的数据备份和保护。 当主数据中心发生数据损坏、丢失或被攻击时,备份数据中心可以提供可靠的数据恢复和保护,保障高速公路公司的重要信息和资产安全。

4.4.2 福建高速双活灾备应用接管

双活数据灾备中心实现了应用接管功能,即当生产系统因突发性事件造成系统中断时间超过可容忍的时间后,启用容灾系统进行应用切换来保证业务的连续性。 当主数据中心不可用时,双活数据灾备中心会自动将应用流量切换到备份数据中心。这可以通过负载均衡设备或DNS 解析等方式实现,确保流量能够平均分配到备份数据中心的服务器上。 一旦流量切换到备份数据中心并且数据和状态同步完成,双活数据灾备中心会启动备份数据中心上的应用程序,并将应用接管。 这包括启动应用程序的各个组件、服务和功能,并确保它们能够正常运行。 在应用接管后,双活数据灾备中心会持续监控备份数据中心的运行状态和性能。 一旦主数据中心恢复可用,系统可以自动将流量切换回主数据中心,并将备份数据中心的数据和状态同步到主数据中心,以确保数据的一致性。 由此福建高速双活数据灾备中心实现应用的实时接管,当主数据中心发生故障或不可用时,备份数据中心可以立即接管应用,保证业务的连续性和可用性。 这对于对业务连续性要求较高的高速公路管理来说尤为重要。

4.4.3 福建高速双活灾备业务整合

福建高速双活数据灾备中心还能够实现业务整合,即通过将主数据中心和备份数据中心之间的业务和资源进行整合,实现高可用性和持续性的业务运行,从而实现容灾系统与生产系统的业务整合和优化。 (1)业务接管:在应用系统容灾的建设过程中,在容灾中心也建立了一套业务处理系统,和生产中心具有完全相同的业务处理逻辑,利用灾备环境对新的业务处理系统进行测试及完善,并在条件成熟时将容灾系统切换为生产系统,而原生产系统成为容灾系统。 (2)负荷分担:双活数据灾备中心可以通过负载均衡技术,将业务流量均匀地分配到主数据中心和备份数据中心的服务器上。 这样可以避免单一数据中心承担过大的负荷,提高系统的性能和可扩展性。 两个中心之间互为容灾系统,当其中的任何一套系统出现大的灾难事故时,则切换到另一套系统中去。 (3)资源复用:福建高速双活灾备数据中心在正常情况下作为主数据中心的备份,但在主数据中心不可用时,备份数据中心可以充分利用其资源来承担主数据中心的业务,这包括服务器、存储设备、网络带宽等。 通过资源复用,双活数据灾备中心能够最大程度地提高资源利用率, 降低成本,并保证业务的持续运行。

4.4.4 实际应用效果

建成后的福建高速双活数据灾备中心将主数据中心和备份数据中心之间的业务整合在了一起,主数据中心和备份数据中心可以同时运行应用程序,共享数据和资源,实现业务的无缝切换和负载均衡,并提供了更好的用户体验。 (1)零数据丢失:双活数据灾备中心运行至今保持实时数据同步,确保主数据中心和备份数据中心之间的数据完全一致。 (2)负载均衡和性能提升:双活数据灾备中心实现了负载均衡,将用户请求分散到主数据中心和备份数据中心,避免单一数据中心的过载情况,经测试,在实际应用中提高了系统的整体性能和响应速度。 (3)高可用性:双活数据灾备中心架构实现了系统的高可用性和业务连续性。 测试中,当主数据中心发生故障时,备份数据中心可以在极短的时间内接管业务,这意味着在实际故障发生时该灾备中心能保证业务的持续性和可靠性,避免业务中断和损失。 (4)灾难恢复能力增强:测试中,通过实时数据备份和同步,即使主数据中心发生数据丢失,备份数据中心仍然可以提供可靠的数据恢复,保护重要数据不受损失,双活灾备数据中心的存在增强了整个系统的灾难恢复能力。

5 结语

根据高速公路灾备中心建设的现状及研究现状,提出了基于双活的区域高速公路数据灾备中心建设方案,借助云平台,通过中心选址、网络建设、应用功能实现等步骤在福建省完成了双活数据灾备中心的方案建设,实现了数据保护、应用接管、业务整合等传统灾备中心所不具有的功能。 但在双活数据灾备中心的设计过程中,也要注意地理位置选择、设施安全、灾难恢复能力测试、成本与效益的平衡等问题。 基于双活的高速公路数据灾备中心的建立,可以全面胜任业务数据处理的新需求和信息量日益增长的挑战,满足各类业务对硬件平台在信息量大、高速率环境下具有强大稳定性的需求,并实现多机并行,提升管理的效能,对智慧交通建设具有重要意义。

猜你喜欢
灾备容灾备份
“备份”25年:邓清明圆梦
创建vSphere 备份任务
关于建筑企业容灾备份系统方案的探讨
基于中兴软交换的电力通信网络容灾系统建设
旧瓶装新酒天宫二号从备份变实验室
企业级信息系统应用级灾备建设与应用
轨道交通清分系统灾备升级方案研究
基于数据容灾技术在企业信息系统中的应用研究
深蓝云海“云灾备”正式上线
应用级灾备系统的研究与设计