刘家英
云平台使企业能够利用外部专业知识和资源来提供复杂的服务,消除企业对服务器基础设施的投资需求,并降低企业寻求弹性计算资源的成本。图书馆一直在为不同的服务采用基于云的解决方案,包括电子期刊访问管理、统计数据跟踪、数字图书馆托管,甚至集成图书馆系统(ILS)托管。这使得图书馆能够在资源分配方面做出战略选择,并提供比依靠内部解决方案可能提供的更好的服务。
虽然图书馆对云计算的关注大多集中在订阅服务或平台(如ils托管)上,但也有图书馆需要计算资源来满足服务或平台提供商未提供的需求的情况。本文详细介绍了一个云端在将其it基础设施迁移到基于云的环境中的经验。
云计算可分为三类:软件即服务(saas)、平台即服务(paas)和基础设施即服务(iaas)。在saas环境中,组织通过托管服务使用应用程序。他们不能访问底层基础设施(即网络或服务器元素),也不负责管理底层软件,比如图书馆电子期刊订阅管理系统。paas解决方案的重点是提供一个托管平台,在这个平台上可以部署特定的应用程序。这个平台通常是由运行一组预先配置的工具的宿主公司提供的一些空间和计算资源,组织可以在平台上部署本地开发或管理的应用程序,但不管理底层服务器基础结构。平台管理通常使用诸如cpanel或plesk之类的应用程序来完成,iaas环境允许用户提供服务器、存储空间和网络组件以满足其计算需求。在iaas環境中,组织负责启动和调整服务器的大小,管理其网络访问,并确保核心服务器组件(如操作系统、web服务器、防火墙)配置正确。
考虑到图书馆面向服务的任务,并且需要使用有限的资源找到合适的解决方案,因此图书馆在试验云计算方面处于独特的地位。福克斯观察到,组织的目标对他们使用云解决方案有影响(2009年),将图书馆推向云解决方案并被证明是迁移障碍的关键压力之一是it支持服务的可用性。云端通常由外部或组织级别的it服务提供支持,并且没有高级it管理方面的内部专业知识。此外云端可能受一些政策和法规的约束,这些政策和法规规定了云端如何使用基于云的解决方案。这两个因素使得SaaS和PaaS变得有吸引力,使IAAS方法难以考虑。尽管如此,许多图书馆一直在积极调查云计算的创新用途(Kroski,2009),包括使用基础设施服务的新方法,Kroski的文章提到了DC公共图书馆系统和Ohiolink使用Amazon EC2服务来使用IaaS技术提供图书馆IT服务。
有关云计算的文献和云平台的扩展使用表明,云计算仍然是一个不断增长的领域,Gartner关于云计算的炒作报告(2009)和Educause Horizon报告(2009)都指出了未来几年云服务的扩张。图书馆,特别是学术组织也纷纷效仿,已经迁移了一些关键服务,如openurl提供者、联邦和预索引搜索引擎。例如,Fox(2009)讨论了托管ILSE的增长趋势。但是,使用平台或基础设施方法采用这种方法的库在这样做时会有一些风险,因为paas和iaas解决方案往往对这些类型的应用程序提供较少的支持。
在过去的两年里,部分图书馆一直致力于将关键的it服务迁移到基于云或托管的环境中。作为迁移的一部分,重点放在关键系统迁移到开源选项上。经过研究发现,这两个目标并不总是同步的,有些应用程序显然不是开源的,但在托管环境中运行良好,反之亦然。下表显示了哪些应用程序已经迁移或正在迁移到云环境。随着时间的推移,我们希望将基于paas的服务迁移到iaas平台。尚未在云中的服务包括图书馆网站、数字图书馆应用程序和机构存储库。
初步需求分析表明,虽然各个图书馆拥有良好的基础设施,但启动和管理特定应用程序变得越来越困难。因此,将云计算作为交付的核心图书馆应用程序(包括ils、网站和数字图书馆系统)的一种方式。如亚马逊,他们的可扩展服务器解决方案和易于使用的管理控制台,有许多基本服务器映像可供使用,包括开放源码和专有平台。此外,通过ebs服务轻松地装载大量磁盘空间的能力使图书馆能够实现数据丰富的服务。除此之外,还可以使用ebs快照工具创建服务器映像,这使简化映像成为可能。亚马逊还拥有一些长期以来的特性,比如能够在ec2服务层设置防火墙,以及能够方便地交换服务器上的ip地址。这些特性是使操作简化,使开发环境和生产环境之间的切换变得容易。
为了评估最初迁移服务的成功,我们评估了三个中心区域:服务质量和稳定性、对提供图书馆服务的能力的影响和与本地技术解决方案的成本比较。
服务质量。服务质量方面的初步经验是非常有必要的,法律协议和sla充分解决了人们对数据安全和正常运行时间的担忧。与许多图书馆一样,人们已经习惯于将SaaS风格的服务用于其他解决方案,并且越来越依赖于Internet连接,因此将我们的核心应用程序基础设施迁移到校园网之外已证明是一个不成问题的问题。此外,公司和社区文档的质量使得查找常见问题(如服务器配置、备份和存档)的解决方案相当容易。
对图书馆服务的影响。saas和paas解决方案很难在库中实现的一个原因是,核心应用程序通常需要专门的软件或配置,这些软件或配置要么是本地化的,要么只是特定于应用程序。通过使用基础设施级别的服务,可以使库应用程序联机,而无需找到支持底层技术正确版本的服务。此外,能够快速安装新的应用程序,而不必专注于确定可用的服务器空间,这意味着我们可以比使用基于本地的硬件更快地提供基于技术的库服务。这种将机器映像和数据从它们当前运行的硬件中分离出来的做法,使我们能够在硬件出现故障时将停机时间降到最低。
诚然,将关键应用基础设施移出校园网意味着在互联网连接问题期间,将没有任何关键服务(如网站、ILS、发现层)。虽然尚未制定处理此意外事件的完整计划,但库当前正在配置一台本地计算机,该计算机将能够向上提供缩小版本的库网站和运行在本地安装版本的发现上的库目录快照层(vufind)。
成本比较。计算技术的总拥有成本(tco)可能很困难,而且似乎有更多的研究质疑这些措施的有效性,而不是对比云和传统解决方案的研究。例如,golden(2009)发现,当包含电力和管理成本时,定价与内部管理服务器的成本相当。然而,其他研究表明,简单地将内部服务器换成虚拟服务器并不会降低TCO(Leong,2009)。此外,成本比较对云计算的影响表明,最低成本节约可能不足以诱使变革。Gartner最近的一篇研究文章指出,安全和运营问题等更大的问题是关键因素(Harris&Smith,2009)。
成本效益分析表明,ec2具有类似的成本,但提供了运营效益。一般图书馆面临着更换两台服务器和大型磁盘阵列的需要,在将五年内预计的硬件成本与同期的EC2和EBS数据量成本进行比较时,发现成本是可比的。最初在单个小实例服务器上运行发现層的经验表明,实际成本约为每月6000元,包括CPU时间、数据存储和I/O费用。在分析了服务器的实际使用容量之后,我们发现大多数应用程序都可以运行在两个Amazon EC2小型服务器(1个CPU,1.7 GB RAM)上。当我们将数字对象添加到系统中时,我们将看到数据存储和备份费用的增加。
虽然最初向云计算的转变是成功的,但还必须克服几个挑战。首先,使用ec2需要员工进行额外的培训。虽然amazon提供了很好的文档,但是理解云环境中的系统架构并解决安全问题需要仔细关注。其次是我们开始时市场上最成熟的服务,但市场正在迅速变化,需要继续关注变化,以确保利用新的选择。例如,建立持久图像是向ec2过渡的一个重要步骤。最后,虽然EC2能够快速安装和配置新服务器,但它需要与校园IT服务部门协调,以使这些服务器以一种对我们的用户无缝的方式联机。
图书馆的定位是对未来几年的新发展作出更大的反应,随着iaas市场的成熟,正在寻找更实惠和标准化的服务。此外,随着越来越多的库能够适应在iaas平台上使用应用程序,可以共享和装载服务于不同目的的设备样式服务器。
参考文献
[1]任思琪等. 图书馆关联机构或组织提供云服务现状研究[J].图书馆,2019(02)
[2]金志敏. 基于云计算的图书馆信息资源共享模式重构与创新服务举措[J].办公自动化,2015(23)
(作者单位:重庆城市职业学院)