杨红兵
摘要: 从计算机灾备系统的由来入手,对其工作原理和作用进行详细介绍,阐述其重要性,由此引入建设该系统的必要性。最终如何让其发挥更大更多的作用、提升信息化的功效,以此来减少总体投资,降低成本是本文重点描述的方面。并以实际所建系统为例,从系统构架体系、网络链路、灾备机房选址、系统应用拓展等方面进行分析与介绍。
关键词计算:机灾备系统 重要性 体系架构 拓展应用
中图分类号:TP309.3 文献标识码:A 文章编号:1007-9416(2016)05-0000-00
相信计算机灾备系统对很多人来讲并不陌生,我们偶尔会听到某个地方因为机房火灾导致业务停顿、或在运维过程中因误操作导致数据丢失等现象的发生,这时候就是计算机灾备系统发挥其功效的时候了,可以说是救命的。目前基本上涉及财务、研发等核心信息的金融及企业均部署了计算机灾备系统,除主数据中心外,在另外的城市再建一个灾备中心,通过专用网络或借助互联网,搭建容灾系统甚至双活中心,以实现业务的连续性和数据的备份,防止当灾难发生时的业务坍塌。
伴随着一个企业信息化的不断发展,数据大量集中,我们在享受计算机系统带来的高效率、高服务的优势的同时,其业务运作也更加依赖于计算机系统的稳定运行,一旦发生系统故障,那么我们的业务系统必将受到严重影响。
然而,小至一般性的硬件故障,大到区域性的自然灾害,从物理的设备不可用,到逻辑的人为失误和破坏,都可能造成整个计算机系统的瘫痪,导致业务运营的停顿。灾难的定义也从过去的大面积自然灾害,延伸为可造成计算机系统应用不可用,产生的任何故障和灾害。如何才能保证尽量减少企业数据的丢失、将危险与灾难的损失降低到最小程度呢?这就是计算机灾备系统的作用,包括数据备份以及应用容灾。计算机灾备系统的核心就在于使用各种技术和管理手段将灾难化解,主要表现为两个方面:一是保证企业数据的安全;二是保证业务的连续性。通过在工作站点和灾难恢复站点之间建立通道,对包括操作系统、数据、应用软件等方面通过技术手段进行复制和快照。假如工作站点发生灾难,不能再继续工作,这时灾备中心会将系统和数据及时恢复到备用设备上,并自动将业务切换到备用服务器,然后实现业务的远程切换,恢复系统不间断的运行,在容灾中心实现应用级容灾,这个过程只需要很短的时间;在此基础上,在灾难过后,再将业务系统切换回正常的生产系统,实现业务的灾难恢复。
因此,计算机灾备系统建设的目标是:为关键业务系统提供风险预防机制和灾难恢复措施,在确保数据安全的基础上提高业务连续运行能力,降低企业运营风险,将业务损失降低到可接受的程度,提升管理和服务质量,增强企业竞争力。
建立计算机灾备系统犹如买保险,虽然重要性是不言而喻的,但毕竟投资是巨大的,而日常的使用率却非常低,由于看不到直接的效益,导致很多企业高层决策时产生犹豫,尤其是在资金紧张的时候。我们做为数据中心的管理和运维者,一方面肯定希望通过计算机灾备系统能够为生产业务系统的运行保驾护航,另一方面也必须充分考虑资金的占用情况,因此,如何让闲置的硬件资源和数据在日常充分发挥其作用,是否可以借助计算机灾备系统,拓展其功能呢?
由此,我们在制定计算机灾备系统设计方案时,就揉进再利用的元素,希望在具备冗灾功能的前提下,该系统也能服务于日常的开发测试环境,下面就让我们一起来看看我公司的计算机灾备系统是怎么样的吧。
首先,考虑到网络线路租用和带宽问题,灾备机房我们选择在同城不同地方,光纤线路直达,保证千兆带宽,数据传输没问题,这样也可以确保RTO(Recovery Point Objective,数据恢复点目标)和RPO(Recovery Time Objective,恢复时间目标)足够短,同时可以有效防止水灾、火灾等问题。至于如何防止地震,放在未来的2期,既可以考虑跨省异地部署,也可以探索公有云模式。
同时,在主数据中心机房,针对小型机上面的核心业务部署为高可用,存储双控双活、数据完全镜像,确保数据的安全性;服务器设置为彼此可替代模式,而不是传统的HA方式,可以最大化硬件的资源使用,但如果发生服务器硬件故障,业务会有暂时的停顿和切换时间,数据不会丢,这种方案必须是在和业务及应用方充分沟通和评估后制定。
在这种架构下,我们利用存储级别的容灾备份方案,除将生产数据在本地保留多份快照外,还将本地数据再复制到灾备机房。
而在服务器虚拟化方面,通过vmware SRM软件实现虚机的容灾,以及存储本身所带的快照功能实现整体的备份。
在灾备机房,服务器利旧,并利用一套存储虚拟化控制器,将不同品牌的存储加以利旧整合。
在简单描述完计算机灾备体系后,下面就说说如何将这些备份数据让它们在平时也“活”起来吧:
(1)针对部署在小型机上的业务,我们在灾备机房部署一台低配置的小型机,将近期的备份数据克隆出来,制造出一套和生产环境一模一样的的环境,供项目的开发者进行测试,既减少测试环境硬件的投资,又更够充分保证测试环境与生产环境的足够接近。
(2)针对服务器虚拟化环境,SRM过来的虚机,除了可以动态地复制生产环境下的变化外,在恢复方面,还可以选择部署成测试环境,即在灾备中心侧恢复并部署为不同计算机名和IP的新虚机,实现对生产环境虚机的衍生。
(3)而部署在NAS环境下的文件系统更是直接面向用户,他们可以直接查找到自己丢失的文件并轻松恢复回来,有不同时间点的多份备份可供选择,只要我们的存储空间足够大、设置的备份策略可以从几分钟到几年的数据都会为你保存。
这样,一个经济实用性的计算机灾备系统就搭建好了。