陈曲
西南交通大学(以下简称西南交大)创建于1896年,是我国近代建校最早的高等学府之一,也是首批进入”211工程”建设和设有研究生院的全国重点高校。西南交大图书馆由成都九里校区馆、犀浦校区馆、峨眉校区馆和各分馆及院系资料室组成。图书馆总面积为62065平方米,纸质藏书总量为253.3万册。近年来,在保证纸质文献增长的同时,西南交大图书馆逐步调整馆藏资源结构,大幅度增加电子文献,购进了多种数据库,同时还自建了西南交大文库、CALIS重点学科导航数据库等6大特色数据库。
建数字图书馆遇难题
作为知识经济的重要载体,图书馆是高校信息基础设施的重要组成部分,目前已成为评价一个学校信息基础水平的重要标志。2009年西南交大启动了数字图书馆综合建设项目,该项目是西南交大 “211”三期公共服务体系建设项目的一个子项目,旨在将西南交大图书馆建设成为特色鲜明、资源丰富、技术先进、功能完善、面向学校、服务社会的文献信息资源与服务集成中心。西南交大计划在犀浦校区投入建设一个全新的数字图书馆,同时在犀浦和九里校区建立完整的数据和部分应用远程容灾系统,当犀浦或者九里校区部分应用系统因意外情况或者计划内软、硬件升级而需要停机时,可由另一个校区的系统接管暂停服务校区的此类应用,并在系统维护完毕之后,切换回原校区系统继续就近提供服务。
西南交大图书馆目前共有大约40个应用系统在运行,如果在犀浦校区新馆建设时按照传统的1:1方式进行应用部署,不仅硬件采购、运维成本(包括数据中心空间、机柜、网线,耗电量,冷气空调和人力成本)高,而且如此数量的服务器,还将造成:
服务器可用性低。因为每个服务器都是单机,如果都配置为双机模式成本更高。系统维护和升级或者扩容时候需要停机进行,造成应用中断。
服务器可管理差。服务器数量太多难以管理,新服务器和应用的部署时间长,大大降低服务器重建和应用加载时间。硬件维护需要数天/周的变更管理准备和数小时的维护窗口。
服务器兼容性差。系统和应用迁移到新的硬件需要和旧系统兼容的系统。西南交大图书馆决定在新馆建设上采用业界成熟的服务器虚拟化技术,用虚拟化技术打破“一台服务器一个应用程序”的传统体制,降低服务器采购成本和IT运维成本,提升服务器的利用率,实现应用的快速的部署和备份的快速恢复。
虚拟化推动信息化
西南交大在九里馆两台高性能PC服务器和犀浦馆一台高性能PC服务器上安装配置了虚拟化平台的vSphere4企业版软件,在这个虚拟化平台上,虚拟机从功能、性能和操作方式上,等同于传统的单台物理服务器,从而大大提高资源利用率,降低成本,增强了系统和应用的可用性,IT人员可以创建虚拟机和安装应用系统,提高了系统的灵活性和快速响应。
为了集中管理和监控虚拟机、实现自动化以及简化资源调配,西南交大还在九里馆和犀浦馆又单独配置一套服务器作为vCenter server服务器,集中监控虚拟架构,并利用vCenter server提供的HA、VMotion、DRS等功能,为图书馆业务系统搭建一个与操作系统、应用无关的高可用性服务器环境,保证各业务连续运行。
SRM实现应用级容灾
西南交大图书馆目前已经建成图书自动化管理系统、集中存储系统等核心IT系统,还根据应用的需要,建成了Portal门户、数字版权保护、馆际互借和全文传递系统、统一身份认证和管理系统、虚拟参考咨询系统、统一检索系统、CALIS资源调度系统、日志系统、校外用户访问系统、计费系统等多个应用系统。这些系统支撑着数字图书馆的日常运作,一旦系统宕机,将造成严重后果。
对数字图书馆IT系统的容灾保护刻不容缓。结合数字图书馆综合建设项目,西南交大计划在九里、犀浦两馆建设应用级异地容灾环境下的虚拟化服务器系统、智能存储备份系统。为提高投资回报率和系统服务能力,容灾系统并非运行在全主备模式下:在正常情况下,九里馆系统负责全部核心业务和大部分非核心业务的支持,犀浦馆系统负责部分非核心业务和开发测试业务的支持,容灾系统须自动实现两馆一、二级数据在两地间的同步/异步交叉复制与备份,减少RPO。在灾难情况下,当其中一馆的系统发生严重灾难导致服务无法提供时,可以快速地切换到另一个馆的系统上来对外提供服务,实现应用业务通过IP网络向异地容灾系统中恢复的快速化、自动化,减少RTO。
按照建设目标,西南交大在犀浦、九里校区图书馆配置了5台4路六核服务器万全R630 G7和7台2路四核服务器万全R525以搭建vSphere 4.0虚拟化平台,同时配备3台企业级磁盘阵列及相应远程功能性数据容灾软件,配置3台光纤存储交换机实现存储路径冗余,配置2台光纤与以太网协议转换器,实现磁盘阵列间的基于FC协议的数据传输转换为基于远程以太网数据传输的数据远程复制功能。
西南交大在九里馆搭建双服务器的Oracle RAC环境,在犀浦馆设立Oracle Data Guard容灾服务器,实现数据库系统的远程应用级容灾保护。西南交大还将现有的运行在物理服务器上的业务全面转移到虚拟化平台上,通过安装部署VMware Sites Recovery Management,实现两地虚拟化服务器平台站点间应用级的容灾保护。VMware Site Recovery Manager是为VMware Infrastructure 提供的一款灾难恢复管理和自动化解决方案,提供了灾难恢复管理、无中断测试、自动执行故障切换等功能,可自动执行并简化灾难恢复计划的管理和执行工作。由于Site Recovery Manager 省去了复杂的手动恢复步骤,能够对恢复计划执行无中断测试,并且可以自动执行恢复过程,因此能够在整个数据中心高效地进行灾难恢复。
利用Site Recovery Manager,西南交大不仅可以管理从生产中心到容灾中心的故障切换,还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。同时,VMware Site Recovery Manager还可以自动执行及简化故障切换至新数据中心的过程,从而让所计划的数据中心故障切换变得更加顺畅。
缩短停机时间。采用SRM,减少了非计划停机时间,同时减少计划内停机时间,最大限度降低总的停机时间。
降低容灾系统成本。SRM让西南交大实现以低成本打造高可用、高可靠的容灾系统的目标,不需要额外购买专有硬件或软件,最大限度地降低总体成本。
简化操作流程。基于VMware虚拟化的容灾系统,不需要维护主/备中心完全一样的物理硬件,降低了硬件维护的复杂性。
扩展容灾系统的保护范围。由于虚拟化降低了业务连续性的成本,西南交大可以将业务连续性保护扩展到更广的的范围。