谭海兵
摘要:图书馆联盟实现资源共享是图书馆界长期追求的目标,区域数字图书馆是随着计算机网络技术的发展而形成和成长起来的。而伴随着云计算的出现,尤其是云操作系统的技术成熟,更好的支撑了区域数字图书馆的发展。该文以湖南省高等学校数字图书馆虚拟化云平台建设为实例,进行了详细的具体过程的描述。通过对虚拟化云平台的实际应用极大的简化了现有服务器管理,提高了服务器的利用效率,为今后向成员馆提供IaaS服务打下了坚实的物质基础和技术保障。
关键词:虚拟化;vmwaresphere;云计算;区域数字图书馆
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2012)34-8256-03
1区域数字图书馆的发展现状
建立图书馆联盟实现资源共享是图书馆界长期追求的目标,传统图书馆联盟发展于上个世纪60年代,数字图书馆联盟则发端于20个世纪90年代,它是随着计算机与网络技术的发展,为了适应数字环境下图书馆生存的需要,伴随着数字图书馆的规模化建设而产生的。数字图书馆联盟突破了不同图书馆在数据库结构、工具平台方面存在的局限,借助各种方式对本馆内外的数字资源和数字化参考咨询服务进行整合建设,实现优势互补。可以这样描述,数字图书馆联盟就是通过一定的组织形式和规章制度,由信息技术与网络来联合不同地域、不同结构的数字图书馆,促进各成员馆对数字化信息资源的联合建设、存取与利用的数字图书馆组织协调机构[1]。湖南省高等学校数字化图书馆是一个省级区域数字图书馆。它成立于2004年,在湖南省教育厅领导下,由湖南师范大学图书馆承建。有效地支持全省各高校教学、科研的正常运行,尽量改变各高校文献信息资源分布不均且又重复浪费的现象,促进全省高校图书馆在数字化资源上的共建共享服务机制的形成,创造良好的数字化资源利用、调配、推送环境。目前中心大量的团购数据库和试用数据将来必然会购置更多的数据库,以及其他应用服务软件等。越来越多的电子资源势必需要越来越多的服务器来支持。采用传统服务器架构的管理模式有诸多不利因素。一方面,多种电子资源需要多个服务器进行部署,不仅硬件成本高、资金需求量大,而且机房布局更加复杂化,灵活性降低;另一方面,要进行这些种类纷杂的电子资源的管理,图书馆的技术人员维护时需要进行频繁的机器切换及其他复杂的操作效率低下。数字图书馆迫切需要一种可以简化管理、节约经费的服务器高效管理途径。虚拟机技术为此创造了可能与便利。
2技术路线介绍介绍
虚拟化是一个广义的术语,是指计算元件在虚拟的基础上而不是真实的基础上运行,是一个为了简化管理,优化资源的解决方案[2]。这种把有限的固定的资源根据不同需求进行重新规划以达到最大利用率的思路,在IT领域就叫做虚拟化技术。而IBM的解释是:虚拟化是资源的逻辑表示,它不受物理限制的约束。作为一种创新的软件技术,虚拟化试图从根本上改变电脑的传统运算方式,在同一台物理机上运行多个虚拟机,以便在多个操作体统环境之间共享这一台计算机的物理资源,从而扩大硬件“容量”,简化软件的重新配置过程。IBM这样定义云计算:“云计算是一种革新的IT运用模式。这种运用模式的主体是所有连接着的互联网的实体,可以是人、设备和程序。这种运用方式的核心原则是:硬件和软件都是资源并被封装为服务,用户可以通过互联网按需求访问和使用。
该文的实现基于vmwaresphere5.0云操作系统进行服务器虚拟化、存储虚拟化、网络虚拟化、操作系统虚拟化,并且利用了多台普通PC机进行辅助服务器处理、迁移和备份虚拟机,实现简单的私有云服务。实现虚拟化云服务平台结构如图1。
通过在每台主机上面安装esxi5.0虚拟化云操作系统,搭建了云平台,然后把存储挂接到主机上面,搭建一个vmcenter中心配置服务器,通过vclient客户端登陆vmcenter进行配置管理,最终形成一个数据中心。通过不断的测试和更改合适的配置,一个安全可靠的区域数字图书馆私有云平台就可以实现了。
3具体实现过程
笔者以湖南省高等学校数字化图书馆云平台搭建实际为例说明云平台的搭建过程与实现效果。
3.1基础设施搭建
为了搭建湖南高等学校数字化图书馆云平台,中心在购置方面进行了深入的考虑。由于此前有一系列的中档配置的服务器,所以本中心购置了三台高性能服务器和100T的sata盘的存储。额外还购置了2T的sas盘的存储。考虑到虚拟机操作系统对于用户的应用响应要快,而数据的读取可以相对有一些延迟。故而把操纵系统统一分配到2T的sas盘上,而三台高性能服务器的本地硬盘相对容量较小。因为只需要安装云操作系统即可。在存储的购置方面也是采用了FAS存储方式,主要是考虑到数据访问的速度。
对于完成硬件配置后,就是安装虚拟化云操作系统esxi5.0系统。该系统的安装比较简单,主要要提及到的是,安装完成了操作系统后,还要安装HBA驱动的问题。如果没有驱动,对于挂接后的存储将无法发现。驱动的安装过程如下:
1)解压下载的BCD-bfa-3.0.0.0-00000-465342.zip包;
2)验证存在BCD-bfa-3.0.0.0-00000-offline_bundle-465342.zip,并将此文件解压;
3)登陆ESXi5.0通过vSphereclient通过root用户登陆;
4)通过浏览数据存储将BCD-bfa-3.0.0.0-00000-offline_bundle-465342.zip文件上传到ESXi数据存储中;
5)将ESXi主机进入到维护模式;
6)通过SSH或ESXi控制台;
7)运行如下命令安装offline驱动包:
esxclisoftwarevibinstall–d/path/offline-bundle.zip
如下例:
esxclisoftwarevibinstall–d /vmfs/volumes/datastore/offline-bundle.zip
这边要说明的是一定要在根目录下进行。
8)重新启动ESXi。
9)退出维护模式。[3]
安装了HBA卡驱动以后,就可以把存储挂接到对应的云平台上了。这里笔者建议把上面提到的2T存储对所有的服务器都进行挂接。Esxi5.0云操作系统支持一个存储挂多个服务器的功能。云平台的基础平台就基本搭建完成。
3.2构建集中安全智能化的管理平台。
1)建立一个数据中心。之所以要建立一个数据中心是方便管理,但是他们在物理上其实是相互独立的主机。保障了数据的安全性,也简化了系统来回切换管理的复杂性。它的过程分成下面几步:
建立群集。所谓群集就是一组主机,向群集添加主机时,主机的资源会成为群集资源的一部分,群集管理其中所有主机的资源。
添加主机。对于上面安装好的虚拟云操作系统主机进行了分配IP后,在这里进行主机的添加。
建立虚拟分布式交换机。虚拟分布式交换机可用作所有关联主机的单个虚拟交换机,这就使虚拟机在个主机之间进行迁移时能够保持一致的网络配置。
建立资源池[3]。资源池可用于按层次结构对独立主机或群集的可用CPU和内存资源进行划分。创建多个资源池可以让您多考虑总计算容量,少考虑单独的主机。可以对一个人管理的服务器进行建立一个资源池方便工作人员管理自己的虚拟机。
建立虚拟机。所谓虚拟机,就是与物理机一样,虚拟机是运行操作系统和应用程序的软件计算机。虚拟机上安装的操作系统称为客户机操作系统。这里具体运行着应用服务程序,对外提供服务。
2)建立不同用户的管理权限。
对于不同的用户建立不同的管理权限。使得每个系统管理员都能够很好的集中管理属于自己的机器。建立用户的过程如下:
在VMcenter服务器上面建立一个独立的单元组命名为vmuser。
添加新用户,设置好密码和属性,并添加到vmuser组下面。
在vmcenter客户端管理平台上根据管理员的用途建立不同的角色。
选择对应的操作对象按照vmcenter上建立的用户名根据不同的角色赋予不同的系统操作权限。
用户使用vsphereclient客户端登陆到vmcenter服务器进行所属服务器的管理。
3)开启平台自能化管理功能。这里所说的智能化管理,就是打开vsphereHA和vsphereDRS功能。vsphereHA功能用于检测故障,对群集中运行的虚拟机提供快速恢复功能。核心功能包括主机监控和虚拟机监控功能,用户在检测不到检测信号时最大程度的缩短停机时间。vsphereDRS的功能主要是使vcenterserver能够将主机作为资源的聚合池进行管理。群集资源可以根据用户、组和虚拟机划分为更小的资源池。
3.3云平台系统备份
本平台的数据备份之前采用的是vmware公司提供的VDR进行备份,通过运行,发现确实可以进行实时备份。但是对于VDR服务器也宕机的情况恢复效果就不太好了。另外我们的数字资源数据在存储上已经做了备份。而现在主要做的备份是服务器操作系统的备份。这些操作系统对实时性没有太多要求,所以,我们购置了一个2T的移动硬盘进行异地备份用。对于有操作系统变化的服务器进行一个异地备份即可。我们采用的是VMExplorer这款软件行异地备份。但是我们同时还是对服务器进行了实时备份。也就是做了两套备份。保证了数据平台的安全性。
3.4USB设备的全面支持
在esxi5.0之前的云操作系统,对于USB设备的支持力度不够。但是在esxi5.0版本以后进行大量的改进,可以实现USB设备的自由接入,这就给原来由于加密狗问题不能迁移到虚拟化云平台服务上的应用彻底解决了问题。这就包括我们湖南省三所高校共建的随书光盘系统。
4虚拟化云平台应用后的效果
在系统搭建完成以后,极大的方便了工作人员服务器管理,极大的降低了服务器宕机的时间,对于新的试用数据库的安装有了更加快捷便利的服务器的提供。服务器的利用率显著提高。主要体现在下面这几个方面。
1)服务运行的速度显著加快。以前ilasII在老机器上面重组要4个小时,迁移到虚拟平台上面以后,只用了20分钟就可以完成,极大的提高系统运行的效率。
2)内存的使用率显著提高。原来的服务器8G的内存可能最多也就是3G,37%。现在内存的使用率可以达到70%-90%
3)提供了更大的网络带宽。原来是一个网卡进行服务,现在多块网卡进行负载均衡的提供服务。
虚拟化云平台,不仅仅是在管理方面提供了便捷的方式,极大的提高了设备的利用率,同时也提供多种不同的虚拟硬件设备。对于一些应用服务需要特殊硬件设备的应用部署提供了一个很好的解决方案。同时,应用了虚拟化云平台以后,对于服务器的部署时间大大缩短。我们在之前准备好了模板之后,布置一台安装好操作系统的虚拟机,只要经过5分钟的时间就可以完成,极大的缩短了工作人员的安装和配置系统时间。
5云平台应用展望
目前,有关云计算服务类型的认定还没有达成统一共识。有学者认为,云计算服务可划分为:云计算信息发布平台、云计算基础技术服务、云计算平台服务、云计算API服务、云计算互动平台服务[4]。另有学者认为,云计算服务包括软件作为一种服务(SoftasaService,简称SaaS)、平台作为一种服务(PlatformasaService,简称PaaS)、基础设施作为一种服务(InfrastructureasaService,简称IaaS)[5]。简言之,云计算服务的种类即Saas、PaaS和IaaS。目前本数字区域图书馆所能提供的云服务目前还只是处于应用服务之中,也就是Saas类型,今后对成员馆更改层次的服务可能会面向Iaas类型,但是这其中可能还有很多工作要做。今后对对成员馆由现在的提供应用服务到提供基础设施服务的的功能可能是数字区域图书馆的另外一个服务。
6结论
通过vmwaresphere虚拟化技术实现区域数字图书馆云平台可以很好的解决多服务器管理复杂,操作繁琐,提高服务器利用效率,降低能源消耗等方面的问题。同时也提供了一种可靠、安全、响应及时的云端数据处理和解决方式。为今后对成员馆提供Iaas服务打下了良好的基础。VMware公司开发的云操作系统给虚拟机市场注入了新的活力。数字区域图书馆有了更加广阔的发展空间。随着VMware公司产品的不断更新,在服务器机群和数据中心智能化管理更近一步,尤其是在高吞吐服务器应用方面有着极大的优势。为支持我省学生和教师的科研学习和工作提供了有力的基础设施保障。
参考文献:
[1]李富玲,卢振波.数字图书馆联盟研究[J].大学图书馆学报,2005(2):11-15.
[2]崔滨.浅谈虚拟化技术在图书馆中的应用[J].科技资讯,2009(9).
[3]vSphere安装和设置esxi5.1和vmcenter[2011-06-23]http://www.vmware.com/support/pubs/vsphere-esxi-vcenter-server-pubs.html
[4]云计算.服务的种类.[2010-04-22].http://www.cloudcomputing-china.cn/Article/jh/200806/117.html.
[5]刘鹏.云计算的分类.[2010-04-22].http://www.chinacloud.cn/show.aspx?id=1928&cid=17.