基于CommVault的备份软件系统建设和应用

2010-05-29 03:47
浙江电力 2010年11期
关键词:磁带磁盘日志

王 伟

(浙能镇海发电有限责任公司,浙江 镇海 315208)

浙江浙能镇海发电有限责任公司现有企业资产管理系统(EAM)、财务管理系统(FMIS)和厂级实时监控系统(SIS)。原有1套备份系统软件,由于投入运行时间较长,且需要编写脚本备份策略,维护也不方便。

随着EAM和FMIS系统的上线,采用Oracle逻辑备份的方式需人工干预,操作更不便。EAM报表及附件的拷贝、SQL Server数据库备份都是人工操作,备份的方式多,工作量大,因此有必要对现有的各个备份方式进行整合。通过市场调研,最终选择了CommVault备份软件。

1 备份系统的选择

建立备份系统应从实际情况出发,长远规划。备份方式的选择与现有的硬件环境有关,备份介质的选择与备份恢复时间快慢要求等因素有关,而备份策略选择的合理性直接与备份系统运行可靠性和维护性有关,因此备份方式、备份介质选择和备份策略的制定是非常重要的。

1.1 备份方式的选择

CommVault备份软件支持2种备份方式:Lan(局域网)备份方式和Lan-Free(非局域网)备份方式。

Lan备份方式是通过网络传输到介质服务器连接的备份设备上实现备份。优点是节省投资、磁带库共享、集中备份管理;缺点是网络传输压力大。

Lan-Free备份方式是建立在存储区域网(SAN)的基础上的。它采用一种全新的体系结构,将磁带库和磁盘阵列各自作为独立的光纤结点,多台主机共享磁带库备份时,数据流不经过网络而直接从磁盘阵列传到磁带库内,不占用网络带宽。优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是投资高。

Lan-Free备份系统的建设需要具有SAN存储环境,目前该公司现有小型SAN环境,但是并不是所有的应用系统、数据库存储都在SAN环境中。结合实际情况选择了Lan备份方式,为减轻网络压力,夜间进行备份,可有效降低备份对系统应用的影响。

1.2 备份介质的选择

CommVault备份系统支持磁盘备份、磁带备份和先备份到磁盘再到磁带等多种方式。

磁带备份的优点是保留时间长、存储容量大、价格低廉;缺点是磨损快,与磁盘和光盘相比容易出错,且需要定期清洗驱动器。

磁盘备份的优点是备份和还原速度快,易于配置和维护;缺点是价格相对较高。

结合磁盘和磁带的特点,把数据备份分为2类,对于重要的数据如EAM、FMIS等应用数据采取先备份到磁盘,再做计划任务备份到磁带的方式;对于数据量很大的系统,采用直接备份到磁带的方式。

1.3 备份策略

备份策略的制定是备份系统建设的重要部分,直接关系到备份系统建设的有效性、合理性、易维护性,结合实践总结了以下备份策略制定的原则:

(1)根据业务需要确认备份介质保存周期。

(2)备份的最终目的是为了进行数据恢复,在选择备份方式时,要在业务系统性能需求许可的情况下,最大程度地降低数据恢复时的复杂程度。

(3)对于相关业务系统的数据,为保证数据一致性,尽量安排在同一天进行备份。

(4)对于数据量较小的备份任务,或较为关键的业务,则建议每天进行一次全备份,以降低恢复时的复杂程度。

(5)根据各业务系统对备份的需求,以及系统的忙闲程度,为每个备份任务划定可以进行数据备份的时段。尽量使备份数量在一周内的每天平均分布,可以采用大小数据量相搭配,或关键业务与非关键业务相搭配等方式进行。

(6)在每次业务数据做大调整后应立即做一次全备份。

2 备份系统实现

2.1 硬件和系统软件

整个备份系统相关硬件由服务器、磁盘阵列和磁带库各1台组成。服务器安装2块磁盘做Raid 1,磁盘阵列做Raid 5+Hot Spare,磁带库采用双驱动器。服务器采用微软Windows 2003操作系统。网络拓扑结构如图1所示。

图1 网络拓扑结构图

2.2 备份软件安装与备份

在执行备份软件安装前,管理员必须对所有数据做1次手工备份,Oracle已经设置成归档模式(Archive Mode)。

在做了备份后,在备份服务器上安装Commvault的服务器端。然后分别安装Windows Oracle模块、Windows SQL模块、Windows Notes模块、Aix Oracle等模块。

对于EAM,FMIS,OA系统等关键的系统,周日做1次全备份,周一到周六做增量备份,在磁盘上保留14天,另外辅助拷贝1份到磁带上,保留周期30天。其他系统的备份数据周六做1次全备份,周日到周五做增量备份,在磁盘上保留7天,另外辅助拷贝1份到磁带上,保留30天。对于EAM、FMIS等核心系统,备份数据每个月做出库管理,出库的磁带打上标签送档案归档保存。

2.3 恢复测试

备份系统安装完成,对所有的备份数据都做1次全备份。选取Windows Oracle模块做恢复测试,准备1台备用的Windows机器,安装Oracle和CommVault备份模块,把数据恢复到该备用机上,客户端连接到该机器访问Oracle数据,测试成功。

3 常见问题及解决

3.1 Oracle数据库备份失败

发生这种情况时,可以在CommVault控制台的作业控制器里找到失败的任务,通过属性找出相关的失败信息和建议,查看RMAN日志,根据RMAN日志的报错信息处理。另外也可以根据失败任务的百分比来大致判断问题所在:

(1)备份到0%时失败,表示问题发生在备份之前,这时应该考虑数据库是否运行,在Comm-Vault控制台上查看数据库实例的属性,确认数据库状态是 Mounted、Open或者是Unknown状态。

(2)备份到5%时失败,表示客户端已和Comm-Serve控制台连接上,RMAN的脚本已生成但是可能RMAN在备份数据库时已发生错误,此时应检查RMAN脚本是否正确生成,并检查RMAN错误信息,或在客户端上检查RMAN日志。

(3)备份到85%时失败,表示数据库备份已经完成,问题可能出在备份归档日志阶段,常见的问题是归档日志不是由RMAN自动删除,而是手动删除,这样可以用以下方法解决:

$rman nocatalog

$rman>connect target/

$rman>change archivelog all crosscheck;

3.2 无法连接客户端机器

备份任务在0%的时候提示网络错误,无法连接到客户端机器,但是备份服务器和客户端之间通过IP地址能正常Ping通。因为CommVault备份是通过机器名解析来通信的,出现这种情况的原因,有可能是通过机器名解析时出错而无法获得对应的IP地址,另外也有可能是客户端CommVault进程服务出错造成。解决办法是在备份服务器和客户端服务器的HOST文件里加入机器名和IP地址的解析,重启客户端CommVault服务。

3.3 大量Windows文件备份失败

Windows文件备份的时候,提示有大量文件备份失败。这种情况有可能是待备份的文件是Windows系统已经打开的文件,而Windows系统已经打开的文件是无法直接备份的,需要使用Windows系统VSS(卷影复制服务)快照功能进行备份。解决办法是选择客户端File System模块下的Default属性,在常规选项里,确认使用VSS选项是否选中。确认系统的Volume Shadow Copy服务处于手动或自动启用状态。

4 结论

备份系统建设不能只顾眼前的需求,应该为以后可能的系统和应用增加一些硬件和软件上的余量。备份系统建设要尽量体现适用性、稳定性、易维护等特点。

建立备份系统后,更多的工作是检查系统运行是否正常、备份日志是否有异常现象等。备份系统有效运行一定要有相关的规则制度来保证,要建立介质管理制度,把备份系统的检查内容加入到日常巡检制度中。要重视备份系统的培训工作,首先要安排专人对备份系统进行全面的学习,有条件的话要增设恢复服务器,以便能进行恢复测试和临时逻辑错误的恢复。

[1]韩德志,谢长生,李怀阳.存储备份技术探析[J].计算机应用研究,2004,21(6)∶1-4.

[2]顾启超,刘晓洁,李涛,等.一种多点容灾系统的设计与实现[J].计算机应用研究,2008,25(8)∶2427-2429.

[3]李付亮.电力二次系统存储备份方案分析[J].继电器,2006,34(19)∶42-45.

[4]单德华,杨红艳,孙鸿雁.大型数据存储与管理系统设计与实现[J].制造业自动化,2010,32(2)∶40-42.

[5]李毅明,侯开虎,余开朝.浅谈企业信息系统的数据备份和恢复[J].中国管理信息化,2008,11(8)∶83-86.

猜你喜欢
磁带磁盘日志
叶腊石聚合成型及其旋转磁盘的制作方法
一名老党员的工作日志
它的好 它的坏 详解动态磁盘
扶贫日志
考虑问题要全面
解决Windows磁盘签名冲突
老磁带真的值钱吗
雅皮的心情日志
雅皮的心情日志
Windows系统下动态磁盘卷的分析与研究