舰载武器调度系统高可用数据存储方案

2024-06-01 12:59刘朝霞
现代信息科技 2024年4期
关键词:镜像数据库

收稿日期:2023-05-22

DOI:10.19850/j.cnki.2096-4706.2024.04.010

摘  要:文章介绍了某舰船武器调度系统高可用数据存储方案,其硬件设计和软件设计均采用热备方式。方案应用在军用船舱中,所设计的硬件既能节省空间又能在多个方面实现冗余,且出现故障时互相不影响。软件设计上采用容错软件将两块计算单元组成双机热备系统;采用同步镜像软件将数据库数据同步存储到两个磁盘阵列;采用连续备份软件将两块计算单元的操作系统和重要数据备份。这种高可用数据存储方案消除了舰船数据库系统中设备或软件单点故障的风险,具有良好的军事意义和社会效益。

关键词:数据库;双机热备;镜像;主备

中图分类号:U665.261  文献标识码:A  文章编号:2096-4706(2024)04-0046-04

High Availability Data Storage Scheme for Shipborne Weapon Scheduling System

LIU Zhaoxia1, 2, 3

(1.The 713 Research Institute of CSSC, Zhengzhou 450015, China; 2.The Key Laboratory for Smart Field Area Management and Scheduling Technology  in Zhengzhou City, Zhengzhou  450015, China; 3.The Key Laboratory for Intelligent Scheduling and Transportation Technology, Zhengzhou  450015, China)

Abstract: This paper introduces a high availability data storage scheme for a ship's weapon scheduling system. The hardware and software designs both adopt a hot standby method. The scheme is applied in military cabins, and the designed hardware can save space and achieve redundancy in multiple aspects, without affecting each other in case of failure. In terms of software design, fault-tolerant software is used to form a dual machine hot standby system with two computing units. It uses synchronous mirroring software to synchronize and store database data on two disk arrays, and uses continuous backup software to backup the operating systems and important data of two computing units. This highly availability data storage scheme eliminates the risk of single point failure of equipment or software in ship database systems, and has good military significance and social benefits.

Keywords: database; hot standby; mirror image; standby

0  引  言

關键数据的持续可用和安全问题关系到军用数据库系统的生存和发展。保证数据的持续可用和安全的需求也越来越多样化,单一的解决方案已经不能满足用户的实际需求。因此,采用高可用解决方案保证数据持续可用和安全,可彻底解决军用数据库系统中设备或软件单点故障的风险。

本方案提供一种某舰载武器调度系统高可用数据存储方案,在数据库服务器故障时,仅仅使用一次服务器的重新启动即可以修复故障服务器,能够解决现有技术中高可用系统设备或软件单点故障的问题,极大地降低服务器的维护次数,延长数据库系统的维修周期,节省数据库维护成本。

1  硬件软件组成

本方案应用在军用船舱里,要求硬件选型必须节省空间。在硬件设计和软件设计上都采用了热备方式,这种高可用解决方案能够保障数据不丢失和系统不停顿,解决了军用船舱数据库系统中单点故障的风险。本方案应用硬件如图1所示。

(a)计算单元  (b)磁盘阵列

图1  数据库服务器示意图

本方案所有硬件采用海军鉴定的标准机柜和组件,硬件的应用方案设计节省空间,并且在多个方面实现冗余,出现故障互相不影响,其硬件包括:

1)数据库服务器采用军用机柜内配置四块计算单元,两两计算单元组成主备数据库服务器,实现双冗余。

2)四个计算单元安装了两个数据库,正常数据库和训练数据库实现数据库软件双冗余。

每个计算单元采用双硬盘,实现双冗余:

3)每个计算单元采用多个网卡,实现双冗余。

4)数据库存储采用军用机柜内配置两个磁盘阵列,实现双冗余。

5)双网卡心跳检测,实现心跳检测双冗余。

6)服务器使用UPS提供断电保护,实现断电后数据不丢失。

本方案每个组件采用成熟技术确保硬件安全,包括:

1)每个计算单元的双硬盘采用Raid0或Raid1设置,提升讀写速度或避免单硬盘故障。

2)每个磁盘阵列采用Raid5实现硬盘容错。

3)网卡采用IPMP将双网卡绑定为一个网卡,避免单网卡故障。

本方案采用多种双机热备技术,包括:

1)采用容错软件,将两块计算单元组成双机热备系统,设置双心跳检测,对外提供一个虚拟IP供用户访问数据库。

2)采用同步镜像软件,将数据库数据同步存储在两个磁盘阵列。

3)采用连续备份软件,将两块计算单元的操作系统和重要数据备份。

2  具体实施方式

双机热备方案实现首先使用两个计算单元(第一计算单元test01、第二计算单元test02)和两个磁盘阵列(第一磁盘阵列Z1、第二磁盘阵列Z2),两个计算单元一主一备,两台磁盘阵列一主一备;两个计算单元安装操作系统为Windows Server 2008 R2,数据库为Oracle 11g。两个机柜内部采用交换设备互联,负责计算单元和磁盘阵列的网络通信,具体实施方式如图2所示。

实施步骤具体如下:

1)将两个磁盘阵列采用Raid5设置硬盘容错,一个磁盘发生损坏后,不会影响数据的完整性,从而提高磁盘阵列的安全性和可靠性。

2)计算单元采用双硬盘配置,可以采用三种方法处理:第一种可以采用Raid1避免单硬盘故障,两个硬盘里的数据完全一样,一旦其中一个硬盘坏了,依靠另一个硬盘,计算单元依然能正常运行;第二种可以采用Raid0提高存取速度;第三种可以采用操作系统镜像方式,将计算单元其中一个硬盘安装配置完成后镜像安装在另一个硬盘中备用,其中一个硬盘损坏后,计算单元操作系统启动时在BIOS中设置启动另一个硬盘实现硬盘切换。

图2  双机热备方案示意图

3)两个计算单元均安装同步镜像软件,利用同步镜像软件将数据库数据同步存储在两个磁盘阵列,保证两台磁盘阵列的数据保持一致,在服务器系统中两台磁盘阵列采用虚拟技术虚拟成一台存储设备提供给计算单元使用,用户向虚拟的存储设备中提交的数据,同步镜像软件同时将数据复制到两台真实磁盘阵列中。

4)第一磁盘阵列Z1、第二磁盘阵列Z2充当存储,用来存放数据,两个计算单元使用iSCSI连接两个磁盘阵列。采用同步镜像软件,将第一磁盘阵列Z1和第二磁盘阵列Z2虚拟成一个虚拟阵列,计算单元将数据写入虚拟阵列中,实际上是同时将数据写入到第一磁盘阵列Z1和第二磁盘阵列Z2。当第一磁盘阵列Z1损坏之后,第二磁盘阵列Z2即刻接管业务,继续提供数据,从数据层面确保了服务的连续性。当修复的磁盘阵列重新上线使用时,镜像软件会将第一磁盘阵列Z1和第二磁盘阵列Z2做数据增量同步,确保数据的一致性。

5)虚拟的磁盘阵列在主备计算单元需要指定相同的驱动器符号,如图3所示,设置虚拟磁盘阵列磁盘1为Z盘。

6)两个计算单元均安装容错软件,利用容错软件将主数据库计算单元与备用数据库计算单元组成一对双机热备系统,设置双心跳监测、对外虚拟IP、卷

锁、监控Oracle服务和监听。

图3  磁盘1为虚拟磁盘阵列示意图

7)计算单元test01包括至少5块网卡,将网卡1和网卡2采用双网绑定功能IPMP将两个独立的网卡绑定为一个对外使用IP为192.168.10.110。计算单元test02进行同样设置,将网卡1和网卡2采用双网绑定功能IPMP将两个独立的网卡绑定为一个对外使用IP为192.168.10.120。

8)首先使用容错软件创建心跳,心跳是两个计算单元的通信通道,只有建立了心跳才能监听到相互的状态,连接状态正常才能进行后续的配置,如图4所示。对外网络和心跳的IP设置在不同网段,计算单元其他网卡可使用不同网段连接磁盘阵列。

图4  心跳状态正常示意图

9)计算单元test01网卡3(IP为10.0.0.3)和网卡4(IP为10.0.0.1)做双心跳设置,计算单元test02网卡3(IP为10.0.0.4)和网卡4(IP为10.0.0.2)做双心跳设置。计算单元test01网卡3监听计算单元test02网卡3的状态,计算单元test01网卡4监听计算单元test02网卡4的状态,只要有一个心跳状态正常,容错软件就能实现双机热备应用。

10)使用容错软件创建虚拟IP,两个计算单元的对外的IP地址是容错软件虚拟出来的IP地址,为两个计算单元对外提供访问的IP地址,即用户客户端访问的IP地址,对外使用的绑定IP要和虚拟IP设置在同一个网段,本次设置的三个IP在同一个192.168.10网段。将两个计算单元双网卡绑定IP(192.168.10.110和192.168.10.120)虚拟成一个IP(192.168.10.100),其中一台为主,出现问题时另外一台接管这个IP,对外只需要提供192.168.10.100即可供用户访问数据库,如图5所示。

11)使用容错软件创建卷锁,对共享磁盘阵列文件系统的保护机制是设置卷锁,不允许两个计算单元同时操作共享虚拟磁盘阵列。设置卷锁后文件不能同时被来自两个计算单元的系统访问,避免了对文件系统造成损坏。创建完成卷锁以后,在主计算单元上可以正常读写共享磁盘阵列,在备计算单元是不显示共享磁盘阵列的,主计算单元故障切换至备用计算单元时才能在备用计算单元显示共享磁盘阵列,备用显示也是Z盘。

12)在主计算单元安装Oracle数据库,卷锁切换至主计算单元上,将数据文件存放在Z盘;在备用计算单元安装Oracle数据库,卷锁切换至备用计算单元上,删除Z盘已经存在的数据文件,将新产生的数据文件存放在Z盘。

13)在Oracle Net Manager中增加主机为192.168.

10.100数据库的监听和服务。

14)使用容错软件创建NT服务资源,为保障双机热备的正常使用,应该通过容错软件来完成启动和停止NT服务。将Oracle的“OracleServiceDatabaseName”和“OracleOraDb10g_home1TNSListener”两个服务依次添加成容错软件里的NT服务资源。

15)在操作系统的服务列表中停止Oracle的“OracleServiceDatabaseName”和“OracleOraDb10g_home1TNSListener”两个数据库的服务,并设置启动类型为“手动”,由容错软件启动和停止数据库的服务和监听。

16)双机热备配置完成后,为保障两个计算单元之间心跳线的正常工作,打开两个计算单元的防火墙,关闭防火墙或开启软件使用的所有相关端口。

17)杀毒软件的查杀、扫描和恶意检测行为会干扰双机热备软件,应该在杀毒软件的“文件白名单”和“目录白名单”两个选项卡将相关文件排除在外。

18)配置完成双机热备后进行测试,可采用网络故障切换测试、关机测试、关闭进程测试、客户端连接测试等方法,主机备机逐个资源启动停止,确保测试充分。图6为双机热备资源启动正常示意图。

图6  双机热备4资源启动正常示意图

19)按照相同步骤在另外两个计算单元上安装训练数据库,正常数据库存储真实数据,训练数据库存储训练数据,正常数据库故障可将数据导入到训练数据库中直接使用。

20)采用连续备份软件将两块计算单元的操作系统和重要数据备份,实时监控操作系统状态,操纵系统故障时自动还原故障系统,重要数据丢失时将数据还原到发生意外前一秒钟时状态。

对于本系统而言,对数据安全性要求较高,因此服务器机柜另外还配置了UPS供电,当外部供电中断时UPS报警,电池组能够维持至少10分钟,确保数据库服务器有充足时间保存数据和关机,避免数据丢失。

本方案应用在普通双机热备数据库系统中最简单配置为每台服务器至少要有两块网卡,其中一块网卡使用直连线连接两台服务器,专门用于配置心跳线;另外一块网卡用于配置外网访问,同時兼做心跳线。同一台服务器两块网卡的IP地址设置在不同网段即可实现双机热备。

3  效果分析

1)本方案利用容错软件将主数据库计算单元与备用数据库计算单元组成一对双机热备系统,设置双心跳监测,将数据库服务安装在两块计算单元上,对外提供一个虚拟IP供用户访问数据库。

2)利用同步镜像软件将数据库数据同步存储在两个磁盘阵列,确保两台磁盘阵列的数据在任何时候保持一致,在服务器系统中采用虚拟技术将两台磁盘阵列虚拟成一台存储设备提供给计算单元使用,对于用户向虚拟的存储设备中提交的数据,同步镜像软件同时将数据复制到两台真实磁盘阵列中。

3)采用连续备份软件将两块计算单元的操作系统和重要数据进行备份,实时监控操作系统状态。

4)数据库计算单元采用双硬盘备用,避免单硬盘故障;采用双网卡绑定IPMP将两个网卡绑定为一个网卡,防止单网卡故障;将两个磁盘阵列采用Raid5硬盘容错设置,提高磁盘阵列安全性;UPS机柜提供断电保护,避免数据丢失。

最后,在服务器故障时,仅仅使用一次服务器的重启动即可以修复故障服务器,能够解决现有技术中高可用系统磁盘阵列出现单点故障的风险,降低服务器的维护次数,延长数据库系统的维修周期,节省数据库服务器维护成本。

4  结  论

此高可用数据存储方案满足了空间占用少、恢复时间短、故障后自动切换以及数据的高可用性等要求,经在舰船某武器系统的若干条船上的应用实践,证明已达到了预期的数据应用效果,具有良好的实用性和可推广性。

参考文献:

[1] 邓秀辉,李民,方惠.基于分布式集群高可用管理信息系统设计 [J].制造业自动化,2022,44(7):43-45+122.

[2] 唐成,潘雷,刘可昌,等.一种双机热备切换系统的实现方案 [J].电子世界,2021(22):198-199.

[3] 高博,刘羽,唐莹,等.一种基于硬件特征和动态许可证的分布式高可用软件授权认证模型 [J].重庆理工大学学报:自然科学,2021,35(7):146-153.

[4] 李冬洋,严勇.一种基于组播机制的双机热备软件系统设计 [J].现代雷达,2021,43(1):16-20.

[5] 孙友凯,贾立辉,董涛.基于虚拟IP的双机热备系统设计与实现 [J].信息技术与信息化,2020(10):147-149.

[6] 王东方,李峥.中小企业服务器双机热备系统升级方案 [J].数字通信世界,2020(10):281-282.

[7] 王小娟.网络类设备双机热备环境测试方法研究 [J].数字技术与应用,2020,38(8):45-47.

[8] 张浙东,田霞,夏晓云,等.基于集群架构的地海杂波数据存储系统 [J].现代雷达,2019,41(5):52-57+85.

[9] 苗云龙,陆彦辉,左明阳,等.基于链路非对称网闸的双机热备系统研究及实现 [J].现代电子技术,2019,42(3):73-77.

[10] 何青松.煤矿安全监控系统双机热备的优化实现 [J].煤矿安全,2018,49(7):109-111.

作者简介:刘朝霞(1980.10—),女,汉族,河南郑

州人,高级工程师,硕士研究生,研究方向:数据库和物资管理调度。

猜你喜欢
镜像数据库
镜像
镜像
镜像
数据库
《天水之镜像》
数据库
数据库
数据库
数据库
镜像