数据库容灾技术在装配MES系统中的应用研究

2018-07-06 08:51王鹏
现代计算机 2018年16期
关键词:联机灾备容灾

王鹏

(洛阳光电技术发展中心,洛阳 471000)

0 引言

随着“大数据”时代的到来,数据已成为企业最为重要的资产之一,信息系统的容灾建设则成为保护企业数据的重要手段。某企业装配MES系统使用人数众多,生产过程中形成的重要数据文件存储于该系统上,作为核心组件的数据库一旦出现故障,将引起数据丢失,给该企业的科研生产造成严重的影响。本文通过研究和应用Oracle高可用技术Data Guard,在该企业灾备中心建立装配MES容灾数据库,实现主备数据库同步,提升了装配MES系统的容灾能力,其数据的完整性指标和故障恢复能力均得到了显著提高。

1 现状分析

某企业装配MES系统运行架构如图1所示,该系统目前所采用的数据保护方式是利用NetWorker虚拟磁带库技术将数据复制到备份存储上,每天备份1次,虽然采取了一定的备份手段,但装配MES系统的高可用性建设还存在以下问题:

图1 装配MES运行架构图

(1)数据库发生故障时,只能恢复到备份时间点以前的数据,将丢失最近备份点到灾难发生时的业务数据(RPO大约为8小时);系统崩溃需要较长的故障恢复时间(RTO大约为3个小时),严重影响用户的正常使用和业务系统的连续性;

(2)数据库自身的容灾能力较弱,其管理和维护对系统管理员的依赖程度很高,人为的误操作会造成数据丢失或逻辑错误,影响数据的完整性,同时也加大了系统管理员的压力。

2 关键技术研究及实现

2.1 总体思路

本文基于Oracle提供的数据保护技术——Data Guard,在某企业灾备中心建立装配MES灾备数据库,实现主备数据库同步(图2中双箭头实线)。正常情况下,用户通过装配MES应用访问主数据库(图2中单箭头实线),当主数据库发生故障不能正常访问时,用户能够通过应用访问灾备中心的容灾数据库(图2中单箭头虚线);当主数据库恢复正常时,用户通过装配MES应用继续访问原主数据库。其运行架构如图2所示:

图2 装配MES数据库容灾架构图

2.2 功能模块设计及实现

为满足某企业装配MES数据库的容灾需求,本文完成了重做日志传输、重做日志应用及主备库切换等主要功能模块的设计与程序实现,并进行了相关试验验证与性能分析,其设计原理图如图3所示:

图3 装配MES数据库容灾原理图

(1)重做日志传输功能

本文中主数据库联机重做日志由6组联机重做日志文件构成(REDO1-REDO6),每组大小为1GB,为保证主备数据库端重做条目的一致性,且重做条目能被及时应用至灾备数据库的数据文件中,组成灾备数据库的备重做日志的备重做日志文件设计为7组(SLOG1-SLOG7),每组大小与联机日志文件一样,均为1GB。联机重做日志文件和备重做日志文件均能够实现自动切换和自动归档(写满一组切换至下一组,自动对写满的联机重做或备重做日志文件进行归档),且归档日志能够实现自动回收,释放磁盘空间。

(2)归档日志自动回收功能

数据库服务器和灾备服务器本地磁盘空间均为500GB,装配MES数据库每天产生的归档日志为50GB,归档日志写满磁盘空间时,就会导致主备数据库均不能正常访问。本文在主备数据库端建立快速恢复区实现归档日志自动回收功能,即重做条目成功传送至灾备数据库后,主数据库中快速恢复区内相应的归档数据就可以被自动覆盖;备重做日志文件中的重做条目成功应用至灾备数据库后,备数据库快速恢复区内相应的归档条目也可以被自动覆盖;自动回收功能最大限度地保证了主备库归档日志的保留时间(归档日志可用来对数据库进行恢复),本文中主备库归档日志的保留时间大约为5天。

(3)重做日志应用功能

该功能主要实现将传送至备重做日志中的重做条目实时地应用到灾备数据库的数据文件中,实现主备数据库的数据同步。

如图3所示,主数据库端产生的重做条目传送到备重做日志文件后,介质恢复进程(MRP)应用该重做条目,立刻修改灾备数据库中对应的数据块,更新灾备数据库中相应的记录信息。

(4)主备库切换功能

该功能实现装配MES主数据库的正常切换和故障切换。

如图3所示,正常切换功能用于系统升级测试,通过手动切换将Primary角色的主数据库切换至Standby角色,将Standby角色的灾备数据库切换至Primary角色;故障切换功能实现当装配MES主数据库出现故障时,可以将灾备数据库切换成Primary角色接替主数据库正常工作,保证用户可以正常访问装配MES系统。

3 系统测试及实施效果

3.1 系统测试

本文的研究将装配MES主数据库部署在Red hat Linux 6.6(64位)操作系统平台上,数据库采用Oracle 11g R2(64位)企业版,生产数据存放在共享存储EMC VNX5500上;装配MES灾备数据库部署在Red hat Linux 6.6(64位)操作系统平台上,数据库采用Oracle 11g R2(64位)企业版,灾备数据存放在共享存储EMC CX240上,容灾拓扑图如图4所示。

图4 装配MES系统容灾拓扑示意图

(1)重做传输功能测试

本试验利用联机重做日志和备重做日志自动切换和自动归档的特性,查询当前联机重做日志文件序列号和当前备重做日志文件的序列号,如图5、图6所示,序列号相同且均为155780,对主数据库进行增、删、改、更新产生的操作日志同步到了灾备数据库端。

图5 当前联机重做日志文件序列号

图6 当前备重做日志文件序列号

(2)归档日志自动回收功能测试

本试验建立主备数据库的快速恢复区,快速恢复区大小均设置为300GB,将归档日志存放在快速恢复区内,查询主备库快速恢复区归档日志的空间使用率和可回收率,如图7所示,主数据库快速恢复区归档日志占用的空间为99.17%,这99.17%的归档日志均可被自动覆盖进行空间释放,如图8所示,灾备数据库快速恢复区归档日志占用的空间为99.17%,其中97.3%的归档日志可被自动覆盖进行空间释放,主备库归档日志均可实现自动回收。

图7 主数据库快速恢复区

图8 灾备数据库快速恢复区状态

(3)重做应用功能测试

本试验在装配MES主数据中建立测试表,对表中数据进行添加、修改、删除、更新等操作,然后分别提交这些操作,经查询灾备数据库中存在相同的测试表,如图9所示,且表中字段、数据与主数据库中相同,从主数据库传输至灾备数据库的重做条目成功应用至灾备数据库中。

图9 主备数据库中的测试表

(4)主备库切换测试

本试验模拟装配MES主数据库发生故障,如图10、11所示,系统不能正常访问;将灾备数据库切换成Primary角色,切换后装配MES系统能够正常访问,故障切换功能正常。

图10 出现故障时系统

灾备数据库切换:

SQL>ALTER DATABASE COMMIT TO SWITCHO⁃VER TO PRIMARY WITH SESSION SHUTDOWN

3.2 实施效果

通过本文的研究和应用,当主数据库发生故障时,灾备数据库能够快速接替主数据库进行工作;故障发生时,装配MES系统数据的完整性指标RPO(即业务数据的丢失量)由8小时降低为1小时,数据库故障恢复时间RTO由3小时降低为0.5小时。

图11 故障切换后系统

4 结语

本文研究和应用的容灾技术处于国际领先水平,该企业的同城异地容灾机房已经投入使用,后续可利用本项目研究的数据库高可用技术,针对该企业的关键业务系统如 ERP、CAPP、PDM、TDM、门户、RAC 集群,在异地容灾机房建立灾备数据库,提高关键业务系统的容灾能力。

[1]王树鹏,云晓春,余翔湛.容灾的理论与关键技术分析[J].计算机工程与应用,2004(28):54-58.

[2]宋锡宁.面向海量数据灾难恢复的数据摘要技术的研究与实现[D].国防科学技术大学,2014.

[3]Oracle.Data Guard Concepts and Administration 11g Release 2(11.2)[EB/OL].(2014).http://www.oracle.com/goto/maa.

[4]Wayne R.High Availability Becoming Highly Necessary[J].AS/400 Systems Management,1997,25(11):24.

[5]Ahluwalia K S,Jain A.High Availability Design Pattern[C].Proceedings of the 2006 Conference on Pattern Language of Programs,2006.

[6]翟永.国家基础地理信息中心LAN FREE的SAN备份解决方案[J].计算机应用研究,2001,18(5):87-89.

[7]韩德志,耿红琴,李怀阳.高可用存储性能网络技术探析[J].计算机应用研究,2004 21(8):22-26.

[8]Noh Sichoon,Kim Jeomgoo.A High Availability Clustering and Local Balancing Mechanism for Information Security Infrastructure System[C].Proceedings of the 2009 International Conference on Hybrid Information Technology,2009.

[9]Gaja Krishna Vaidyanatha.Implementing RAID on Oracle[EB/OL].http://www.quest.com/whitepapers/Raid1.pdf,2002/2003-05.

[10]黄国平.增强型多维产品 Oracle 7[J].航空兵器,1996(02).

猜你喜欢
联机灾备容灾
多联机焓差实验室制冷量测试不确定度分析
海尔发布全球首个物联多联机云服务平台
再立标杆,天加GHP燃气多联机 助力神木市LNG站建设
局部UV上光工艺探究
Oracle MAA在汽车行业电子政务平台中的应用
校园一卡通服务端高可用性改造实施方案
深蓝云海“云灾备”正式上线
共享灾备走向智能化
降低容灾门槛
灾备建设的新思路