陈 飞
(燕山大学图书馆,河北 秦皇岛 066004)
“云计算”的概念自提出之日起,就备受人们的关注,其作为一种IT基础设施与服务的交互和使用模式,也为数字图书馆的发展提供了新的思路和方法。其实,“云计算”正是各种IT技术发展到一定程度产生的必然结果。与其说“云计算”是一种技术,倒不如说它是一种概念更为贴切,它利用了分布式处理、并行处理、网格计算、Internet等多种技术和资源,综合IaaS(基础设施即服务)、SaaS(软件即服务)、PaaS(平台即服务)等服务手段,以用户透明的方式,为最终用户提供服务[1]。
云计算是一种新兴的共享基础架构的方法,它将巨大的系统池连接在一起提供各种服务,从而使有关用户可以很方便地将资源切换到具体的应用上,根据自己的需要访问计算机的存储体系。与以往的技术相比较有许多新的特点。
云计算模式利用高速的网络连接和位于“云端”的大量可用计算机资源,共同为提交的请求(查询、计算等)进行服务,其利用的是计算机集群的计算能力,这必然是单个计算机或者服务器所无法比拟的。
在云计算中,终端用户只需要花少量的费用来租用云计算所提供的服务,而省去了用户自己购置服务器、软件以及建立数据机房等环境,减少了电子产品的消耗,降低热排放,为环境保护做出贡献。
在云计算模式中,所有相关数据均存储在“云端”,用户只需要利用简单的终端接入设备(计算机、手机、PDA等),就可以随时随地获取云计算服务,用户不需要知道自己使用哪一个云计算,也不需要知道是如何进行计算分配的。进行任何查询、计算服务的用户所接入的都是统一界面,只要能连接互联网,就如使用本地计算机一样,所以云计算对普通用户来说是完全透明的。
云计算模式中,会有专门的IT机构对云端的计算机及存储设备进行维护,数据集中存储,并具有充分的冗余备份。云计算中心的管理者对数据进行统一的管理,分配资源、部署软件、均衡负载、病毒监测,从而使用户的数据得到最大限度的保障。
数字图书馆(Digital Library)一词最早由美国学者于1991年提出[2],在全世界引起很大轰动,美国也随之开始了数字图书馆的建设。1995年秋,美国国会图书馆正式启动国家数字图书馆项目[3]。美国OCLC公司的“OCLC Web级协作型管理服务”联合编目系统是目前一个典型的云计算模式,于2009年7月开始使用。
1997年,国家计委批准立项的国家重点科技项目——中国试验型数字式图书馆项目开始实施,以国家图书馆为主,上海图书馆等7家省市级图书馆开始了联合攻关。
2000年4月,由文化部等21部委参加的“中国数字图书馆工程”启动,其主要内容是组织全国数字图书馆的建设和技术的研发、集成和运行,对全国数字图书馆的研究和建设发挥统领和带动作用。CALIS已于2010年5月启动三期建设,云服务平台的基本框架已完成,现有的SaaS系统的改进也初步完成。全国各省均在建立各自的数字图书馆项目。
21世纪的数字图书馆,已经超越了将纸质资料数字化,上网供读者查阅的阶段,如今的数字图书馆应该是一个数字文化的平台,它既可能是网上图书馆,有可能是网上书店、音像店、文物店,还可能是网上文化中心等。数字图书馆应该是一个国家的数字教育平台、科研平台,为大量的科研工作者提供优质的网络数字文献资源、多媒体资源,数字图书馆应该成为网上业余教育中心、在职教育中心甚至是趣味教育中心等等。数字图书馆更应该是一个国家数字资源中心,现在面对的数据越来越多,涉及社会发展、人类活动的方方面面,从全局统一规划考虑,国家一定要有一个数字资料集中管理的地方,把与我们国家发展、社会进步有关的数字资源全部保存起来[4]。云计算模式的种种便利,正顺应了数字图书馆的进一步发展,改变了传统图书馆的馆藏方式、服务理念,虽然不能完全取代传统的图书馆,但已经成为人们不可或缺的知识获取途径。
云计算提供者将网络中各种不同类型的计算机系统集成到云计算平台,利用云平台的协调功能,提供强大的计算能力,而将网络中大量不同类型的存储设备通用应用软件集合起来协同工作,形成巨大的虚拟存储空间,这时就转变成云存储系统,为数字图书馆的发展提供了无限的、低成本的扩充余地,当数据量达到PB级的情况下,它可以突破常用的SAN架构和标准的关系数据库在数据处理、搜索和挖掘上的瓶颈[5]。同时,云计算的提供者为数字图书馆提供了专业的IT维护方案,使得数字图书馆的建设不再为数据中心硬件的维护而付出经费和人员的开销。这样就实现了云计算所包含的IaaS(基础设施即服务)理念或是HaaS(硬件即服务)。
数字图书馆的首要条件是集成大量的信息资源,集成就是充分利用一切可用的资源与服务,构建内容丰富、服务明确的数字图书馆。云计算可以提供的PaaS(平台即服务),为数字图书馆的资源建设提供良好的平台,如提供开放的API,让机构使用者能开发更多的互联网应用。PaaS把开发环境、应用程序环境、数据库环境等作为一种服务来提供给数字图书馆,由后者开发应用系统,进行资源的集成[6]。
云计算平台的强大计算与存储功能,为数字图书馆的资源整合、集成、共享提供了良好的平台。数字图书馆的最终目的是为广大读者服务,云计算平台提供了面对用户透明的、统一的、方便的、接入方式多样的Web方式,用户不必关心它访问的是单个服务器,还是云计算中心,只要其拥有一种接入互联网的方式(电脑、手机、PDA等),就能随时随地访问数字图书馆的资源,查询自己想要的信息。
网络技术发展到现在,硬件设备的性能已不再是制约服务水平的瓶颈,高校数字图书馆作为广大读者获取文献信息的主要途径,更应该利用好云计算这一利器,充分利用已有的海量资源,建立起与自身信息服务相适应的云计算平台。
图书馆的服务与当前互联网上的服务相比,更具有专业性,其所需的资源在互联网上往往也是找不到的,这些服务和资源难以从现有的云计算服务商处得到,因此,图书馆需要构筑自己相应的云计算平台,并辅以公共的云计算平台作为补充。针对当前数字图书馆的建设水平和读者的实际需求,笔者认为,建立分级的云计算平台是当前数字图书馆建设的必经之路。数字图书馆模型如图1所示。
4.4.1 将全国的数字图书馆分为3个级别:“初级云”、“中级云”、“高级云”。初级云,也可以称为“本地云”,即以高校为单位,集成本馆资源,利用高级云所提供的SaaS、PaaS、HaaS服务,为本校基本的统一查询、虚拟咨询、馆际互借等服务,形成对本地资源的一站式获取,对于高校图书馆,也是上一级云的一个用户,同样利用上一级云的服务,如图2所示。中级云以省或者地区划分,集成大量的虚拟计算机资源,构建区域级数字图书馆,提供本区域内各初级云的信息集成,面对高级云是服务的接收者,面向初级云是服务的提供者。中级云作为初级云和高级云之间的桥梁或者缓冲,并为区域级的用户提供服务。
4.4.2 由高级云,也是国家级的图书馆机构,如中国国家图书馆、CALIS(中国高等学校文献保障中心)构建应用服务,建立云计算超级中心,建立数字图书馆协调各初、中级云计算中心的存储和相关服务并向中级云和初级云提供服务支持,建立全国统一的基础信息,包括用户信息、知识库信息、应用/资源/服务/仓储注册信息、数据信息、订阅信息、计费信息等。
4.4.3 用户可以有选择地访问自己所需资源范围的云计算中心,当然用户也可以不选择,直接访问高级云的信息平台,由上至下查找所需的资源。
4.4.4 对于普通的高校图书馆,不需或只需少量建设自己的数据中心,本馆读者所需的服务一概可以从中级云或者高级云租用(收费或者免费)获取,对于数据则存储在云计算中心,这样就减少了大多数图书馆在硬件以及软件上的投入。
图1 云环境下的数字图书馆模型
图2 云服务方式
云计算平台虽然为用户和数字图书馆提供了最大限度的信息共享和服务,但平台上的数据安全却是一个不容忽视的问题。数字图书馆在建设过程中,也要考虑云计算平台失效的时候如何继续为用户提供服务的问题,也就要求数字图书馆在本地必须有一定的资源备份能力。
在云计算平台上,各数字图书馆利用云模式为用户服务,在方便用户、提高信息资源共享能力的同时,也带来版权纠纷的问题。在资源的使用过程中,数字图书馆的建设者们,还需要自己研究法律法规,制定出切实可行的资源共享方案,在版权保护和资源共享之间架起桥梁。
数字图书馆正在从资源整合型向服务研究型转变,未来的数字图书馆不应该是单纯的电子资源的集合,而是应该利用大量的资源,开发信息增值服务并提供给读者。云计算模式并不完全推翻图书馆现有的数据部署模式,而是在保留原有模式的基础上,使现有的部署模式与云计算模式融合,作为现有部署模式的有效补充,更大限度地进行图书馆资源的集成和共建共享工作。虽然云计算的应用目前还处于探索阶段,但数字图书馆技术与云计算的结合必将是未来数字图书馆的发展趋势。笔者给出了数字图书馆在云计算模式下的构建模式,希望能给广大数字图书馆技术的研究人员带来一些参考。
[1]孙坦.基于云服务的图书馆建设与服务策略.图书馆建设,2009(9):2-3.
[2]陈文翠.数字图书馆建设中面临的技术挑战及解决方略.情报科学,2004(1):34-36.
[3]李更良.我国数字图书馆研究现状综述.图书情报工作,2003(5):41-48.
[4]高文等.数字图书馆——原理与技术实现.北京:清华大学出版社,2000:2-3.
[5]贾西兰,王琼,吴英梅.高校数字图书馆建设新思考.大学图书馆学报,2010(2):59-61.
[6]王文清,陈凌.CALIS数字图书馆云服务平台模型.大学图书馆学报,2009(4):13-15.