赵春元++丁松峰
摘 要:随着计算机网络技术的不断发展,工业控制系统计算机技术、网络技术、数据库技术得到广泛应用。工业制造、控制系统对信息的依赖性越来越高,但基于工业控制系统的数据防灾系统应用不多。本文针对烟草工业企业制丝生产线集控系统特点,对制丝集控系统数据防灾备份进行了探索和尝试,实现了工业控制系统服务器、数据库的容灾备份和快速恢复机制。
关键词:制丝集控;数据容灾;自动备份;SQL;Oracle
0 引言
目前生产制造企业数据向着集中存储、集中管理的方向发展,随着工业企业自动控制系统的不断完善,工业制造控制系统对信息技术的依赖性也就越来越强,控制系统数据集中的同时也意味着数据风险的集中,进而引出一个重要的问题——数据灾难备份。
目前烟草制丝线集控系统现场设备电控系统触摸屏操作终端机均采用工控机,安装windows7操作系统,控制系统无UPS不间断电源,设备异常断电或跳闸已出现多次系统文件损坏或监控画面文件损坏,修复时间较长。同时,制丝线工控机、服务器上都安装、部署有集控系统专用监控软件、数据库软件。一旦工控机或服务器系统故障,除造成数据丢失外,对一台服务器操作系统、应用软件的安装不少于10小时,同时还要对应用软件、数据库软件进行配置。如生产过程中出现系统崩溃的问题,必然造成制丝长时间停机,影响制丝生产运行。
针对以上问题,烟草制丝线集控系统需一套完整的数据备份恢复系统。统一通过网络对制丝集控系统数据进行备份恢复和集中管理,从而实现自动化的备份、文件归档、数据分级存储及数据灾难性问题的恢复等。
1 制丝集控系统需求分析
1.1 制丝集控系统现状分析
黄金叶生产制造中心制丝集控系统网络基础工业以太网及西门子profiNET网络平台,现在已经拥有9台服务器,包括生产过程监控系统、生产管理系统、数据存储系统,为烟草制丝生产线过程管理与控制提供强有力的信息化支持。主要数据库包括了Microsoft SQLS、Oracle、INSQL等。
1.2 制丝集控系统备份需求分析
黄金叶生产制造中心制丝集控系统数据中心的数据超过300GB,且大量为过程控制实时数据,根据制丝集控系统配置,需要一套数据容灾备份管理系统,对数据进行集中、快速和自动化的数据备份与管理;并且支持基于Windows平台的SQL数据库、Oracle数据库的网络逻辑备份及整盘数据备份,同时能够支持频繁的数据库日志备份,保障制丝集控系统的可靠运行。
2 制丝集控容灾备份系统设计
2.1 容灾备份系统构成
搭建制丝集控系统容灾备份恢复系统既要做到满足集控系统数据量不断增加的要求,又需要备份恢复软件能够支持当前制丝集控系统操作平台要求。基于此目标,充分利用当前制丝集控系统工业以太网网络,使用基于网络的数据备份存储管理系统,在分布式的制丝集控网络下通过专业的数据存储管理软件,对网络上各应用服务器及数据库进行集中备份与管理,从而实现自动化的数据备份、文件数据归档、数据库数据的分级存储及灾难恢复管理。
2.1.1 容灾备份存储方案
容灾备份的数据存储硬件的可靠性与稳定性是整个备份过程中重要的指标,是容灾系统能否实现高质量、高可靠性备份的关键。黄金叶生产制造中心制丝集控系统选用磁盘阵列作为备份存储设备。
2.1.2 容灾备份软件方案
当前容灾备份系统通常能够满足数据备份的基本功能,但是为了更好的支持和满足制丝集控系统容灾备份需求,减少备份过程对各应用服务器工作的影响,容灾备份软件系统应可实现加速数据备份、自动备份操作、灾难恢复操作快捷等特殊功能需求。本方案选用Symantec(赛门铁克)数据备份系统软件(Backup Exec)。
Backup Exec是赛门铁克专为中小企业打造的基于Windows的数据保护金牌标准,具有丰富的扩展性能,能够从一台服务器扩展到多服务器的数据存储区域网络系统。并能够使用较少的投入、在短时间内完成更多的备份,并能对数据备份进行集中管理。
2.1.3 备份策略
备份策略是指确定需要备份数据的内容、备份的时间以及其备份方式。制丝集控系统数据容灾备份根据制丝集控系统现状,将完全备份、增量备份、差异备份三种类型混合应用。在每个应用系统保证一个完全备份的基础上,进行基于周期的增量备份和基于数据的差异备份,能够实现7*24的数据备份,并能够保证毫秒级的数据备份,确保制丝集控系统关键数据万无一失。
2.1.4 灾难恢复计划
数据备份是数据恢复的基础和前提,数据备份的目的是防止数据丢失,没有备份就无从恢复,数据灾难恢复是在数据备份基础上的具体应用。数据灾难恢复策略就是要在数据灾难发生时,确保将数据损失控制在最小范围内,即如何使各应用系统出现数据灾难时快速将数据恢复并重新启动各应用系统。
2.2 备份系统网络架构
以制丝线控制骨干网络为平台,将备份服务器添加到骨干网络中,打通备份服务器网络。
为了尽可能减少数据灾难系统对制丝集控现有系统及网络的影响,制丝集控数据容灾备份系统在尽量不改变现有集控系统网络架构及应用的前提下,对制丝集控系统各应用服务器采用网络备份工作方式,通过集控系统工业以太网对应用服务器的数据进行备份,同时将数据通过容灾备份服务器写入到磁盘阵列中。制丝集控专用容灾备份服务器部署Symantec Backup Exec,采用该模式可以将数据容灾备份服务器与制丝集控各业务主机和英语服务器分离开来,方便管理,且提高了数据备份的安全性。再次,在基于制丝集控网络备份的基础上,服务器配置双网卡。一个网络用于数据备份,另一个网络连接到制丝线集控管理网络中,实现对数据容灾备份系统的远程管理。既减轻了制丝集控系统各应用平台的网络压力,也有利于提高网络备份速度。
3 数据备份配置
3.1 服务器系统备份
通过部署Backup Exec 2012 for Windows Servers,为Windows服务器系统提供可靠、迅速而且高效的持续数据保护。该备份数据由一个基准备份(全备份)和增量备份、差异备份而组合成完整的全备份数据。同时,该备份方法可以将组合后的备份数据快速恢复于各应用服务器及客户端。由于所有文件、数据只需备份一次,所以整个备份过程只会消耗较少的网络带宽,并能有效降低备份过程对各应用服务影响。
3.2 SQL数据库备份
在需要备份的SQL数据库服务器上部署Symantec Backup Exec SQL Agent,通过备份管理服务器Backup Exec把所有SQL资源整合在一个备份作业里,提高备份管理的灵活性,简化SQL数据的恢复。在提交 SQL数据库备份作业计划时, Backup Exec通过其独有的MicrosoftSQL API获取数据库的备份。同时将SQL数据库日志事务自动保护在备份文件中,并存储在SQL数据库备份集内作为一个单独的备份存在。
3.3 Oracle数据库备份
在制丝集控系统,大量的归档周期较短的数据存储在Oracle数据库中,因此在制丝集控数据容灾备份中必须进行Oracle数据库的备份,目前很多企业仍采用脚本或手工的方式进行Oracle数据备份,脚本或手工方式备份Oracle数据库无法避免的存在着数据丢失和恢复延误。
通过在Oracle数据库服务器上部署Backup Exec Oracle Agent,制丝集控数据容灾备份系统能够对网络上的任何Oracle数据库进行数据备份和恢复操作。基于Backup Exec Oracle Agen的Oracle数据库备份能够与网络备份集成,当Oracle数据库发生故障或服务器被关闭,仍可将备份的数据库联机。甚至原应用服务器宕机,用户也能够继续访问数据库数据。
4 灾难恢复配置
当制丝集控系统应用程序出现故障、配置被改变、应用程序遭受病毒攻击、应用平台硬件故障都能够使制丝集控系统服务器瘫痪。如何在制丝集控各应用系统受到影响之前有多少时间来恢复过程数据及各应用系统。传统的数据恢复通常需要几个小时甚至几天。以恢复一台制丝集控系统监控操作站为例,最快需要20分钟(常规Ghost备份恢复),最长需要4小时(安装操作系统、安装集控应用软件、配置监控软件)。恢复一台服务器需要更长的时间。该过程还是假设恢复过程没有其它异常发生,因此非常有必要进一步优化这种高度复杂的数据恢复过程。
制丝集控数据容灾备份系统选用Symantec Backup Exec System Recovery作为灾难恢复方案,能够在极短的时间内执行应用服务器系统裸机恢复(Bare Metal Restore),快速的将崩溃的各应用系统恢复到指定时间点。甚至还可以将备份的系统数据迅速恢复至不同的硬件平台上。
5 结论
将Symantec Backup Exec System数据灾难备份系统应用于烟草制丝线集控系统,充分考虑了当前烟草行业制丝线控制系统现状,既能保证制丝集控系统数据备份和灾难恢复的基本需求,又能满足制丝集控系统功能扩展后数据量激增的情况。并且基于ymantec Backup Exec System数据灾难备份系统应用于Windows 操作系统平台,与制丝集控系统各应用服务器操作系统相同,有效降低了容灾备份系统管理和操作的复杂程度。避免了人工备份的数据遗漏及效率低下的问题,确保备份数据按照备份策略有效执行。实现了7*24的数据库备份和快速恢复机制,将系统恢复时间缩短到数分钟,使业务的连续性得到最大保障。