林伟胜,许卓伟
(广东电网有限责任公司汕头供电局,广东汕头 515000)
在现今的大数据时代,数据是一个企业最宝贵的资源。但是数据安全问题却难以得到保证,软件自身缺陷、人为操作失误、电脑病毒破坏、硬件损毁、黑客攻击、自然灾难等诸多不确定因素都有可能造成计算机中数据的丢失的原因。因此,各个行业领域对数据的保护尤为关心[1-6]。
汕头供电局经过多年的建设形成多套主营业务系统、有几十台套的服务器主机、需要备份的数据有操作系统、数据库、中间件、邮件数据、虚拟机等各类数据,数据分布在不同类型的设备上,有小型机、微机服务器。随着系统的建设复杂化和数据量增多,数据的安全对于企业的运转也越来越显得重要,对数据备份系统的架构设计和管理提出了复杂的要求。
汕头供电局随着信息系统逐步完善,业务数据量成倍增加,应用数据的存储变得越来越重要,整个企业信息化建设对存储系统有更高的建设需求,对数据中心可靠性要求也日渐提高,备份需求随之突显出来,需要应对数据丢失、误操作、存储损坏、自然灾害等造成重要数据损坏时的恢复问题。
备份系统需要解决的难题主要有以下几点[7]。
(1)备份节点多,要连接备份的服务器节点数量众多,涉及的有几十台套的多类型服务器主机。
(2)备份数据量大,类型多。例如主营业务系统要保留多个用于追溯恢复的版本,频率高。类型覆盖了IBM小型机操作系统备份、数据库、中间件、虚拟化服务器数据等。
(3)要求备份任务管理自动化并合理地安排调度策略,设备高效利用,要求快速备份,必要时能够短时间恢复到指定设备;需要对核心系统的数据提供远程保护数据,提供系统容灾数据备份、异地灾备恢复环境[8]。
解决这些问题急需要设计软件兼容性好、硬件扩展性强的备份系统解决方案,合理的备份方式与策略等等,将零散的备份资源集中,节约资源,提高管理效率。
备份系统的建设从软件建设方面、硬件方面,还有备份管理配置方面进行考虑。
软件平台方面由于供电局已建设的应用系统有多品牌的基础环境,备份软件在客户端要兼容已有的Windows、Linux、AIX、HP-UX,OS/400等操作系统,在数据库方面考虑兼容Oracle、SQLserver等数据库系统。核心备份系统选用了IBM的TSM备份软件,它具有高性能,灵活高效的解决方案。
硬件方面的设计,使用的设备兼容已建设的IP网络与存储网络环境,数据备份尽量不影响业务系统,重要系统使用了LANfree的备份方式。在数据备份存储这块使用高效率硬件,VTL虚拟磁带库作为数据备份的一级存储池,而慢速的磁带库设备作为二级存储池,在有限资源条件下发挥前者速度快、后者容量大、经济的优点。
备份的策略方面,统一进行策略规划和调度规划,根据不同业务系统的使用高峰期、数据备份量和时长,错开各策略的启动时间,尽量将业务分散在全天各系统空闲的时候。比如营销系统晚上的实时访问量不大,备份策略即安排在该时间段执行,而计量系统前置数据库在白天有空闲时间段,则在该时间段安排日志备份,另外也要考虑一二级数据备份池的迁移调度,设置合理的磁带回收水位线,及时回收资源。
部署后的系统拓朴结构如图1所示。
IDC机房内的服务器通过备份系统管理,业务系统服务器使用LANfree方式实现快速备份与恢复,备份数据存储使用了VTL虚拟磁带库技术,另外核心系统还直接通过存储复制技术在远程数据备份机房实现容灾备份。
IBM TSM(Tivoli Storage Manager)数据备份系统,是企业级跨平台网络备份、恢复及存储管理软件。TSM客户端软件负责向TSM服务器提供需要备份的数据,或向TSM服务器索取已备份数据及归档数据以便恢复数据。TSM服务器负责管理备份数据、备份策略及管理连接在其上的存储系统。
小型机操作系统备份,IBM小型机操作系统备份和恢复可以通过网络来进行,由于主营业务系统基本都是安装AIX系统的IBM小型机,即可以通过其NIM功能进行操作系统的备份,由一台IBM工作站定期将各小型机的操作系统做mksysb镜象集中存放,再使用备份客户端进行压缩备份。实现操作系统的定期备份,系统的恢复也实现集中管理。
VTL(Virtual Tape Library),虚拟磁带库技术仿真物理磁带库的驱动器并且在磁盘上存储备份映像。VTL支持使用现有的磁带备份软件识别为磁带库类型并进行连接操作,管理方便。虚拟磁带库使用物理磁盘驱动器,它的读写速度比磁带库快得多,同时还具有数据压缩功能。虚拟磁带库上的数据可以快速恢复到系统中,因此选用其作为备份系统的一级存储池,超过一定水位数据再迁移到二级池,即磁带库中。
图1 数据备份架构拓朴
LANfree备份是指通过光纤通道备份,通常的备份可以通过IP网络进行备份数据传送,这样在业务高峰的时候有可能会影响系统性能,而TSM备份系统允许使用SAN网络进行调度备份,即客户端通过其本机的存储光纤接口直接向备份设备复制数据,由于光纤存储接口速度高,而且备份数据不再经由备份系统主机转存到带库,所以LANfree备份效率更高,供电局各主营业务系统备份采用光纤存储网络备份,部分没有光纤存储接口的系统采取LAN网络备份方式。
其他备份设置方面,核心业务系统的Oracle数据库均开启日志归档模式,即对数据库的每笔变更都在存储在日志中,通过执行RMAN工具经由数据库客户端转存,且多套数据库的备份与恢复管理集中使用同一个备份管理Catalog数据库。另外,还通过虚拟化服务器平台的TSM备份组件,实现了服务器虚拟机的整机备份。对于营销系统,还使用了存储级别的数据镜像,如在IBM DS5100存储系统启用了远程异步数据复制ERM(Enhanced Remote Mirror)功能,将多个主营业务系统数据远程实时地复制到20 km外的数据备份机房,一旦发生灾害事件,企业的核心数据将得以保全。
汕头供电局备份系统每天要应对近40个客户端节点,发起近30个大数据量的备份任务,每天接近1.5 T的数据备份,备份存储的数据总量近45 T。由于使用了LANfree技术,性能较在LAN环境下速度提高多倍,比如电力营销系统的异机恢复,从IBMp570小型机数据库备份出来的数据全库恢复到另外的p570小型机上,近1.2 T整数据库数据网络恢复需要近20个小时,而LANfree的恢复只需要5个小时。而使用ERM的数据远程复制,也解决了数据容灾备份的问题,异地灾备系统的快速启用3个小时内就可以完成。
数据备份系统的建设不仅仅需只是软硬件设备的构建,对数据系统的管理也十分重要。因此制定科学、系统和合理的管理方法以及备份策略对备份系统实现备份功能,恢复数据有着重要的意义。
(1)统一策略规划与日常检查
系统管理人员应从数据量的大小,数据的重要性和恢复的角度考虑,结合实际资源使用状况,制订数据分组备份策略和存储介质池对应策略,任务应错开业务高峰,并定期开展策略清理和资源调整,定期开展运行状态检查,保证备份系统高效稳定运行。
(2)定期开展数据恢复与系统灾备演练
数据备份都是为发生系统灾难做准备的,备份系统架构的优劣不仅在于它的备份速度,更重要的是通过数据恢复测试备份系统里面的数据的有效性。汕头局定期开展主营业务系统数据恢复和启用备用应用系统进行测试,检验数据备份是否安全可靠,另外也定期开展远程灾备数据的恢复演练,模拟核心业务系统硬件整体损坏情况下的灾备数据的启用,通过实践验证灾备数据的有效性。
汕头供电局数据备份架构基于统一的存储区域网络,采用当前流行的备份软硬件平台,集成多品牌存储产品,覆盖从操作系统到数据库的各类型数据备份,利用存储设备镜像技术实现了远程的数据备份,实现了高效且安全的数据备份系统架构,简化管理。同时通过加强维护管理,定期开展数据恢复以验证系统有障性,从而保障了企业信息系统的数据安全。
[1]于洋.计算机数据存储备份探讨[J].制造业自动化,2011(16):134-136.
[2]李伟.基于SAN架构的数据存储和备份系统[J].电脑知识与技术,2010,6(20):5406-5407.
[3]吕广平.计算机磁盘阵列及异地容灾备份系统分析[J].科技传播,2012(7):161-162.
[4]王帆飞.国土资源空间数据存储备份系统的设计与实现[J].计算机与现代化,2012(3):190-193.
[5]吕小婷,施艳,张振芳.存储局域网(SAN)在地质调查数据存储中的应用[J].地质通报,2012(9):1531-1536.
[6]申新鹏,曾雷杰,赵晓.磁盘阵列上虚拟磁盘的管理[J].现代电子技术,2010,33(20):144-146.
[7]孙晓南,余婕.网络存储与数据备份[M].北京:清华大学出版社,2010.
[8]刘洪发,唐宏,贾卓生.网络存储与灾难恢复技术[M].北京:电子工业出版社,2008.