文/李红灵 张月芬
依托先进的网络支撑环境,云南大学校园网除提供Web、 E-mail、 DNS和 FTP等网络基本服务外,还先后在不同时期、不同技术平台上建设了网络辅助教学、质量工程项目管理平台、网站(群)、办公、本科教务管理、研究生教务管理、资产管理、人事管理等系统,这些系统解决了各职能部门的一些实际问题,支撑着学校教学、科研和管理等工作。
随着应用的深入,各系统都积累了大量的业务数据,但是一旦数据丢失将给学校带来极大的损失,为保护这些可贵的数据资源,必须考虑对这些校园应用实施统一备份和数据容灾。
云南大学于2005年购买1台EMC CX500磁盘存储阵列,用于支撑学校邮件、网络教学、网站(群)、办公等系统,以及为高性能计算提供存储服务,构建一个支持多主机和应用的整合SAN /NAS/IP的存储架构,详见图1。随着学校新的网络教学系统、质量工程项目管理、即时通信和社区互动平台等应用的上线,同时邮件用户数、网站数量的增加,5TB的裸存储容量无法满足学校应用及发展要求,为既能解决好存储容量,又能解决数据存储的安全性问题,结合前期的投入提出了新的设计方案。
图1 原存储系统拓扑图
1.总体思路
在考虑既保护前期投资,又满足未来发展需要的前提下,根据不同业务系统的情况,采用对原来CX500扩容,同时增加一台新一代的CX4-480或其他型号的存储系统。CX500仍然存放在学校东陆园,扩容后主要支撑邮件、流媒体、高性能计算等实时性要求不高的应用。新增加的存储放置在呈贡校区,将网络教学、网站(群)、教学、办公、共享数据库、统一身份认证、教学质量工程等关键数据全部存放在新建的存储系统上。
在此基础上,建立统一的备份系统,对关键数据进行备份,备份的介质为CX500新扩容的存储空间。
可采用Legato Networker备份软件,利用该软件与硬件产品的兼容性和快速磁盘恢复能力,实现校园应用核心业务数据的备份和恢复。同时,可以通过MirrorView/S容灾软件,有选择地对关键应用实现东陆园与呈贡校区之间的远程容灾。
2.拓扑结构
新的存储系统整合SAN存储网络+iSCSI的集成解决方案,这样实现结合了FC-SAN和iSCSI两种技术共同的优点,在同一个存储系统中同时提供了高性能的FC-SAN和低成本的IP-SAN存储的存储解决方案。
3.磁盘规划
新的存储系统配置300GB裸容量的闪存盘、7.8TB裸容量的光纤硬盘、45TB裸容量的SATA硬盘。对性能要求比较高的共享数据库采用性能很高的闪存驱动器;各应用数据库等关键数据放置到光纤硬盘上;其他数据放置到容量比较大的SATA硬盘上。
通过磁盘的分层方式和整合SAN存储网络+iSCSI的集成解决方案,既可以保证关键应用的性能,同时有效的降低整体成本。
建立完善的自动化数据备份系统,包括数据库、文件、操作系统等方面的数据自动备份,当发生数据丢失甚至服务器系统发生灾难时,能够通过备份软件快速恢复操作系统和业务数据。结合学校应用的情况,备份系统必须满足以下功能:
集中化的备份管理;支持多种操作系统、文件系统和数据库;支持多种备份设备如磁盘、磁带、光盘等;对各种操作系统与存储结构具有一致的管理和使用格式;策略化的备份与恢复机制,多种备份策略提供使用的灵活性;智能化的备份设备管理,全面的设备共享能力;全面的灾难恢复支持;开放的系统便于升级和扩展;支持多种数据库的数据备份及恢复功能;操作简单明了,使用灵活方便,容易维护;备份系统与硬件无关,硬件改造和升级时,备份系统可不受影响,保护前期的投资。
1.备份服务器
备份服务器是一套备份系统的核心管理服务器。由于所有备份任务都必须通过以太网传输到备份服务器,再写入后台的备份存储介质,因此,备份服务器除了需要负责处理整套备份系统的管理工作,以及设备的控制操作之外,还需要负责处理大量的备份数据流的传输工作,这就要求该主机需花费较多的系统资源处理备份作业的数据流。
2.备份介质
考虑将呈贡校区的核心数据远程备份到东陆校区的CX500上,实现同校异地备份。
3.备份软件
可以考虑配置1套Networker备份软件,包含备份软件主模块、备份软件客户端、数据库代理、备份到硬盘支持等模块,实现对各服务器的文件和数据库数据的自动备份和恢复功能。
图2 新存储系统拓扑图
当应用系统的一个完整环境因灾难性事件(如火灾、地震等)遭到破坏时,为了迅速恢复应用系统的数据、环境,立即恢复应用系统的运行,保证系统的可用性,这就需要异地灾难备份系统(也称容灾系统)。建立异地容灾系统,即指建立远程的数据中心,通过配置远程容灾系统将本地数据实时进行远程复制,同时实现本地系统故障时应用系统的远程启动,确保系统的不中断运行。
随着数据安全技术的发展,Cluster(HA)的技术越来越成熟,Cluster 的部署越来越普及,Cluster 技术确实解决了应用系统的高可用性问题,为业务的良性发展提供了稳定的基石。一个本地Cluster 系统理论上可以达到99.99%以上的系统高可用性,但一旦发生火灾、自然灾害、人为破坏等意外事件,我们将如何应对呢?如果没有必要的准备和应对手段,这样的一次意外将是灾难性的。对于IT 部门来讲,要提高自己的抗灾能力,其必要的技术就是建立起一个容灾系统。
容灾可划分为:数据级、应用级以及业务级。
1.数据级容灾
数据级容灾的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。数据级容灾较为基础,利用磁带库和管理软件就能实现数据异地备份,达到较低级别的数据容灾目的;而较高级的数据容灾则要依靠数据复制工具,例如卷复制软件,或者存储系统的硬件控制器,实现数据的远程复制。
数据级别容灾是保障数据可用的最后底线,当数据丢失时能够保证应用系统可以重新得到所有数据。从这种意义上讲,数据备份属于该级别容灾,用户把重要的数据存放在磁带上,如果考虑到高级别的安全性还可以把磁带运送到远距离的地方保存,当灾难发生后,从磁带中获取数据。该级别灾难恢复时间较长,仍然存在风险,尽管用户原有数据没有丢失,但是应用会被中断,用户业务也被迫停止。
2.应用级容灾
应用级容灾是在数据级容灾的基础上,再把执行应用处理能力复制一份,也就是说,在备份站点同样构建一套应用系统。应用级容灾系统能提供不间断的应用服务,让用户应用的服务请求能够透明地继续运行,而感受不到灾难的发生,保证信息系统提供的服务完整、可靠、安全。一般来说,应用级容灾系统需要通过更多软件来实现,它可以使企业的多种应用在灾难发生时进行快速切换,确保业务的连续性。
3.业务级容灾
数据级容灾和应用级容灾都是在IT范畴之内,然而对于正常业务而言,仅IT系统的保障还是不够的。有些用户需要构建最高级别的业务级容灾。业务级容灾的大部分内容是非IT系统,比如电话、办公地点等。当一场大的灾难发生时,用户原有的办公场所都会受到破坏,用户除了需要原有的数据、原有的应用系统,更需要工作人员在一个备份的工作场所能够正常地开展业务。
4.容灾设计
在以上规划基础上,可以通过MirrorView /S容灾镜像软件,实现两套存储设备之间的数据镜像和容灾,实现校内异地容灾。MirrorView软件支持同步、异步等多种远程磁盘镜像工作方式。EMC CX系列存储能够支持存储对存储的数据复制技术,该技术被广泛用来构建企业关键信息数据平台的灾难保护系统。
CX系列的“同步”数据复制技术是利用CX存储的MirrorView功能模快,其工作原理如图3所示。
图3 CX系列的“同步”数据复制技术
MirrorView/S 提供基于磁盘的副本,用于无数据丢失的重新启动点。写入主阵列的所有数据会同步写入到辅助站点。此EMC 软件要求高带宽、低延迟网络(如暗光纤),而且只能在有限距离内使用(通常小于200KM)。
由于是基于阵列的产品,MirrorView/S不依赖于服务器操作系统、应用程序、文件系统等,并且可在 LUN 级别工作。它具有内置的保护机制,可以在链路故障后以增量方式进行重新同步。
从性能方面分析,除了已建议的高性能存储平台和MirrorView容灾软件外,我们还需要考虑到主机端的I/O负载均衡问题,因此,在服务器端配置EMC的PowerPath负载均衡软件,实现多个I/O通道和路径之间的负载均衡与容错保护,使整个容灾存储平台的性能达到最优。