云计算在图书馆中的应用

2010-09-05 06:58:26陶新权孙青王亚栾毅于捷
大学图书馆学报 2010年2期
关键词:数字图书馆资源

□陶新权 孙青 王亚 栾毅 于捷

云计算在图书馆中的应用

□陶新权 孙青 王亚 栾毅 于捷

从技术应用的角度分析了云计算在图书馆实际推进的制约因素,初步提出了云计算在图书馆的应用方法和策略,以及图书馆应对云时代的来临,在信息组织加工、数字资源存储及服务整合等方面的可作为之处。

云计算 图书馆

近两年,云计算逐渐成为人们关注的技术话题,从Google Apps到Microsoft Azure,云计算渐渐走近我们的生活。从图书馆的发展历程来看,技术的进步往往能够帮助图书馆更好地发挥其应有的社会职能,关于云计算及其应用的讨论成了图书馆界新的研究热点。

1 引言

1.1 什么是“云”和“云计算”

“云”一词用来比喻互联网,是对隐藏在其中的复杂的基础设施的抽象比喻。这个概念通常由以下概念组合来描述:IaaS(基础设施即服务)、PaaS((平台即服务)、SaaS(软件即服务)以及其他依赖互联网来满足用户计算需要的最新技术[1]。

云计算是一种计算模式,也是一种新的利用计算机和互联网的方式。这种模式把动态可扩展的、虚拟化的资源连接起来,作为互联网服务来提供随时的访问、分享,对某—相关功能或资源的管理和使用可以部署在全球任何地方的服务器和数据中心。传统的IT设施应用复杂,需要购买一大批设备,建立机房,配备IT人员成立技术部门,甚至还要有一支开发维护队伍,才能保证企业的信息基础设施运转起来,而“云”的出现简化了IT架构的实施,给人们提供了一种理想的方式,即IT应用可以像水电煤气等公用设施一样,实时定制,随时取用,按需付费[2]。作为绝大多数的云用户,根本无须了解、关注或控制支持该服务的技术基础设施和底层架构。

1.2 云计算对图书馆的影响

云计算无疑会给图书馆IT业务的工作模式带来变革,可能从以下几个方面影响着图书馆的建设和服务:

(1)降低IT维护的费用,提高IT业务效率。

经费问题一直是图书馆在每年的工作规划中考虑的重点。在图书馆日常工作中,为确保图书馆采访编目、流通借还、资源检索等各种业务平台的正常运行,需要经常对图书馆的计算机、服务器等终端进行维护、升级和更新。而云计算模式中,服务器的日常维护由更加专业的云服务提供商来提供,用户的工作强度和维护成本会大大降低。另外,由专业IT人员进行系统维护,能够减少系统故障,减少故障恢复时间,提高IT服务水平。

(2)确保数据安全。

在云计算模式中,数据集中存储,因而更容易实现安全监测。“云”中有百万台服务器,多个数据备份分布不同的区域,因此即使“云”中的某台服务器出现故障,“云”中的服务器也可以在极短时间内,快速将某台服务器中的数据完全拷贝到别的服务器上,并启动新的服务器来提供服务,从而使图书馆真正实现无间断的安全服务。

(3)提供更充分的信息资源共享。

通过云计算模式,有关的图书馆可以共同构筑信息共享空间,这样众多的图书馆就可以分享由大量系统连接在一起而形成的基础设施,而不必更新相关硬件,图书馆的运行成本在大大降低的同时,效率却大幅度地提高。对于参加合作的图书馆来说,在“图书馆云”中,通过云计算技术,他们可以实时地获得其他图书馆的资料,使用户的信息需求获得极大满足[3]。

(4)为中小型图书馆提供建设新模式

目前,国内部分中小型图书馆面临经费紧张和缺少计算机专业人员的情况。采用云计算,由专业的云服务商对图书馆自动化系统进行托管,用户端不需要安装任何软件,不需要独立的服务器,通过IE浏览器就可进行图书馆业务自动化管理。系统完全免于维护,大大节省了图书馆的人力资源和硬件资源,无疑是一种便捷而有效的方式[4]。

2 图书馆推进云计算应用的限制

毫无疑问,通过应用云计算,能够大大提高图书馆IT工作的效率,节约IT业务的成本,而且更容易发挥图书馆的资源优势。但是笔者认为,图书馆完全把业务托付给“云”是不现实的,在技术、道德、法律层面均存在一些没有解决的问题。

2.1 技术层面尚有瓶颈

云计算技术本身还存在诸如带宽与延迟、标准和移动性缺乏、安全问题及自主控制较弱、工具不成熟等问题。随着“云”概念的深入,将有越来越多的虚拟式计算资源和软件服务放在“云”中,有可能带来一些负面影响。例如对网络带宽的需求明显增加,而且要求所有站点的中心基础设施必须提供可预测的快速响应。因此,网络基础设施,尤其是广域网,是“云计算”发展和实现过程中的关键之一,如何满足这方面的要求成为要解决的首要难题[5]。

2.2 商业模式能否被图书馆所认同

云计算服务采用商业模式来运作,最终用户根据使用了多少服务来付费。孙卫分析了六种主要的云服务商类型,总结出三种商业模式:①以商业销售硬件、软件帮助别人建立云计算环境的商业产品的模式。以IBM、SUN、微软为典型代表。②以互联网运营商提供免费服务获得更多广告的云的支撑模式。以谷歌、亚马逊、微软为代表。③为有商业价值的传统行业专门服务并收费的云的支撑模式[6]。而一直以来,图书馆都是一个非营利性的服务机构,如何在享受云服务商提供服务的同时,避免受到云服务在价格方面的制约,是图书馆要思考的一个问题。

2.3 托管的内容存在争议

保存和收藏文献是图书馆从古到今承担的社会责任。传统的藏书楼承载着文字载体、文化遗产收藏的责任,如今的数字图书馆承担着数字形式的资源和数字化资源长期保存的重任。随着云计算带来的IT行业的重新洗牌,图书馆必定会开始考虑到底应该把怎样的信息或者信息处理托付给云服务商。对于这一点,有专家提出,保存信息是图书馆的责任,如果把保存的信息外包出去实际上就是放弃了这个责任[7]。另外,一些如读者信息等涉及隐私权和敏感问题的信息的托管需要权衡。

2.4 云计算的相关法律及信息政策不完备

在云计算模式中,各个加入云模式的图书馆可以通过有关的协议共享彼此的信息资源,也就是说“云”中的用户可以像使用本馆的电子资源一样使用他馆的电子资源。如果一味采取“外包”的方式,将有可能引起版权纠纷。

此外,云计算还引发了一系列重要的与信息政策相关的问题,包括隐私、安全、匿名访问、电信运营能力、政府的监控、可靠性和责任等等。作为用户,希望“云”至少能够提供可靠性和赔偿责任、安全隐私和匿名、访问和使用限制等方面的明确的条款。图书馆对这些条款的要求体现在馆际互借、电子资源服务、远程学习与资源获取等多个环节。而目前的现状是:与云计算有关的信息安全等方面的合同条款,基本上都是由云服务提供商提出的[8]。亚马逊的EC2服务就是一个很好的例子。2008年1月,亚马逊的网络服务是存储140亿数据单元,规模大小从几个字节到50亿字节,处理数据库请求达到3万个每秒。产生这些可观的数字的主要原因是亚马逊的服务为用户节约了巨大的成本。但是,它所提供的客户协定只侧重服务的商业交易要素,保护亚马逊公司的利益,并在隐私、安全、可靠性等一些方面为亚马逊公司免责。而用户的资料私隐问题,唯一的保障是一份标准的隐私权声明,这份声明适用于所有与该公司的合作,而并没有将云计算的独特之处考虑在内。

提供云计算服务的业务往往建立在保护供应商的立场,而许多用户对潜在的法律法规、信息政策的影响并不了解。未来自由市场的竞争可能会促使云服务商在个人隐私、安全性和可靠性方面有进一步的举措,但是,不排除会产生更多的费用来增强这种保障性。这样,云用户们所享受的计算服务虽然受益于成本节约,但可能产生一些其他方面的费用,势必影响云计算应用的推进。

3 图书馆可在云时代关注和开展的工作

任何技术都是在不断地研究和进步中克服其缺点和不足,任何技术的价值都需要在应用中体现。云计算在图书馆的应用,要在图书馆读者服务功能方面来体现并发挥其作用。一方面,图书馆作为云计算和云服务商的用户,是云的使用者,应该考虑利用云计算的优势来提升图书馆服务的方式、方法及工作效率;另一方面,图书馆拥有大量的数字资源,也是云服务的参与者,有可能通过图书馆联盟等形式融入“信息服务云”。所以,笔者认为,图书馆应该从云环境下的信息组织、数字内容保存、服务整合等三个方面来研究和开展相应的工作。

3.1 云计算应用在信息组织和加工环节

云计算在图书馆业务中的一个重要应用是全国性的联合编目云计算环境的建立。

美国OCLC公司的“OCLC Web级协作型管理服务”联合编目系统就是一个典型的云计算模式。该系统也是WorldCat Local的强化版,于2009年7月上线。OCLC的目标是所有图书馆使用同样的、共享的硬件、服务和数据,而不是仅仅为单个的图书馆托管硬件和软件的替代模型,实际上它的非营利联盟的性质,也给开展这项工作提供了便利。各成员图书馆可订阅包括模块化管理功能在内的网络规模管理服务,且受益于网络级别的众多服务,这些服务包括知识库集成、WorldCat的收集分析、World-Cat的选择等。总的来说,OCLC认为图书馆使用“OCLC Web级协作型管理服务”可能获得的收益包括以下几个方面[9]:

●提高知名度和方便图书馆的馆藏获取;

●网络技术服务和收藏管理,以减少重复劳动;

●简化工作流程,重新调整和优化,充分受益于网络的参与;

●启用大规模使用数据的聚合提升合作和服务水平。

OCLC认为,要真正实现网络级的服务,而不只是提供简单的互联网托管解决方案,必须设计新的系统架构和工作流程,以支持全球交易和协作。作为系统的使用方,图书馆可以利用其提供的平台,进行联合编目、检索、文献定位。各馆的管理服务与OCLC编目和OCLC资源共享平台合作将为图书馆带来更大的收益。

3.2 云环境下的数字资源存储

云计算有巨大的潜力,图书馆可以应用“云计算”技术对数字化资源进行存贮、管理,并提供网络化利用。云计算为我们描绘出了分布式保存数字资源的基础设施架构,这是至关重要的,因为作为非专业IT组织的图书馆或其他文化单位,没有任何一个机构能独自处理这项工作。大多数文化机构缺乏资源以及长期保存数字资源的能力,而与此同时,值得保存的数字内容和数据量却与日俱增。

数字保存是必要的但难以实施,因为这一活动面临着工具和程序得不到充分的验证、IT支持有限、工作量(包括复制,数据迁移,仿真等)非常大等问题。而各个机构独立地开展数字资源的保存研究和平台建设,又往往面临系统间互操作性差、异构应用的平台、缺乏共同的标准、非弹性计算能力等问题[10]。如果每个图书馆都作为合作网络的一部分,共同协作努力,那么数字资源的保存就能形成必要的、节约型的数字管理经济规模。云计算这样的服务恰恰符合这一合作理念。

数字内容的在线存储服务,或者说是云存储,是一种已经成熟的趋势。用户的数据应该以大范围的地理分布和备份作为后盾,在此基础上开展云计算。从目前高校图书馆数字内容管理与存储平台建设的情况来看,开源软件由于具备开放代码、灵活性、可定制等特点而成为大多数图书馆的选择。利用开源的云计算平台制定数字资源存储策略是图书馆应思考的问题之一。

DSpace是目前数字内容管理存储的主流开源平台之一,由美国麻省理工学院(MIT)和美国惠普公司(Hewlett Packard)合作开发[11]。目前全世界有几百所大学都已经采用DSpace开源系统,国内不少高校图书馆也利用其开发定制了本馆的机构仓储系统。2009年5月,DSpace与另一个机构库开源软件Fedora合并为DuraSpace,推出了新产品Dura-Cloud,这项托管服务兼顾了云存储和云计算的成本效益优势,同时能确保数字内容的长期保存和重用。

它的目标用户是那些负责数字资源保存和创造数字内容获取和重用共享空间的组织。DuraCloud可直接通过 Web访问,还可通过包括 Fedora和DSpace的数据库插件访问。它能够提供在线备份文本、图像、数据集、视频、音频等服务,通过启用多个副本,分布式(包括多个存储供应商、多个地理区域)地保存资源,方便用户根据项目或工作的需要弹性地选择临时或永久性的存储供应。

图1 DuraCloud架构图[12]

该平台的服务将作为开源软件提供,服务和存储采用“支付使用的方式”[13]。DuraCloud于2009年秋季选定了纽约公共图书馆和生物多样性历史文献图书馆(Biodiversity Heritage Library)为试点合作伙伴,新成员的吸收仍在继续。这一试验的成果值得从事数字图书馆研究和开发的馆员们关注。

3.3 基于云的图书馆服务整合

3.3.1 图书馆日常业务和管理环节融入云计算可以提高IT业务的效率

图书馆可以采取部分业务托管的方式,在日常业务和管理环节中局部地应用一些专业的云服务商提供的服务[14]。例如,图书馆联盟OhioLINK正在使用Amazon's Web Services托管一小部分它们的数字公共资源,比如说肯特州的百年收藏,并且正在测试在云中的服务器管理以及DSpace馆藏软件的局限。哥伦比亚区公共图书馆正在使用Amazon的EC2服务托管它们的网站,而且据信息技术部的主任Chris Tonjes说:“这让我们能快速地调整服务,并且有充足的资源,如果一个Amazon的数据中心发生了故障,我们网站的镜像就能出现在另一个中心,并且在半个小时内恢复工作。”东肯塔基大学图书馆正在使用Google Docs收集网站表格的回复,它们把Google Calendar当作培训和会议的日历,它们还用Google Analytics来收集网站、图书馆目录以及博客的数据。

3.3.2 利用云计算的契机,寻求图书馆信息服务新的定位

云计算在很大程度上,使图书馆的传统的IT功能弱化,未来图书馆应该利用云计算在信息、知识资源的组织、检索与共享等方面所具有的强大优势,考虑增强新业务功能,寻求新的定位。特别是在数字资源的选择、评价、分析、整合上,利用数据挖掘及知识发现工具,为用户在“云海”中利用信息资源提供指导。

4 结束语

云计算具有“看不见的”服务、超强的计算能力、按需支付、经济实惠、易于提供用户定制的服务的特点,它将是IT技术部署模式的下一个发展阶段。对于图书馆来说,图书馆应用云技术,发挥它的优势,将其应用于服务功能的创新方面,能够提升图书馆服务的方式、方法和效果,云计算在图书馆中的具体应用需要我们更多的研究和关注。

1 Cloud_computing.[2009-07-01].http://en.wikipedia.org/wiki/Cloud_computing.

2 刘炜.图书馆需要一朵怎样的“云”.大学图书馆学报,2009(4):2-6

3 李永先,栾旭伦,李森森.图书馆迎来“云”时代.高校图书情报论坛,2009(3):59-62

4 胡小菁,范并思.云计算给图书馆管理带来挑战.大学图书馆学报,2009(4):7-12

5 Riverbed提升广域网性能,突破云计算发展瓶颈.[2009-07-21].http://www.saaschn.com/show/2574.html

6 孙卫.图书馆在云时代的思考.数字图书馆论坛,2009(6):35-41

7 图书馆云地图:云计算和存储指南.[2009-07-22].http://www.yeeyan.com/articles/view/100748/58660

8 Paul T.Jaeger,Jimmy Lin,Justin M.Grimes.Cloud Computing and Information Policy:Computing in a Policy Cloud?Journal of Info rmation Technology and Politics:5(3):269–283.

9 “Web scale” discovery and delivery of library resources.[2009-07-22].http://www.oclc.org/asiapacific/zhcn/default.htm

10 Ina Smith.A Digital Preservation Strategy for the University of Pretoria using DSpace Open Source Software.African Digital Scholarship&Curation Conference,CSIR.13 May 2009

11 DSpace.[2007-02-01].http://dspace.org/

12 Sandy Payette,Michele Kimpton.DuraCloud:A service provided by DuraSpace.OR09,Atlanta,GA,May 2009

13 DuraCloud Description.[2009-09-22].http://duraspace.org/duracloud.php

14 同7

The Application of Cloud Computing in the Library

Tao Xinquan Sun Qing Wang Ya Luan Yi Yu Jie

Based on analysis of the concept of Cloud Computing,the paper makes a conclusion on the impact of Cloud Computing for the library.From the technology application point of view,it also analyzes the current constraints to promote Cloud Computing in the library,initially puts forward the application solutions and strategies of cloud computing in the library as well as what the library should prepare for the cloud era,such as in the process of information organization,digital resources storage and service integration,etc.

Cloud Computing;Libraries;Application

北京航空航天大学图书馆,北京,100191

2009年10月23日

猜你喜欢
数字图书馆资源
基础教育资源展示
一样的资源,不一样的收获
资源回收
图书馆
小太阳画报(2018年1期)2018-05-14 17:19:25
答数字
资源再生 欢迎订阅
资源再生(2017年3期)2017-06-01 12:20:59
飞跃图书馆
数字看G20
南风窗(2016年19期)2016-09-21 16:56:12
去图书馆
成双成对