文 / 徐延华
云计算作为一种基于互联网的基础服务共享架构新方法,可以实现资源共享和海量存储。近年来,这一技术在多个行业得到广泛应用。随着人们对于数字信息资源需求的不断增加,开展数字图书馆资源整合、满足用户的信息需求已经成为数字图书馆发展的必然要求。因此,如何充分利用云计算在信息资源整合方面的优势进一步提升图书馆信息服务能力,是数字图书馆开展信息资源建设的关键。
随着信息技术的快速发展,以传统图书和文献资料为主要载体的图书馆信息资源已经难以满足用户的个性化需求,数字化图书馆逐步成为信息时代文献资源建设和服务的发展方向。但是数字资源体量大、种类多、内容参差不齐,给用户的检索带来了诸多不便。因此,从用户需求出发,以数字资源的集中管理、快捷检索为目标,将分散、无序的信息资源整合起来,组建一个统一、有机的集成化系统,实现不同资源之间的无缝链接和用户的透明访问,实现数字资源整合,是数字图书馆建设的关键。
但是随着信息资源量剧增以及人们对于知识获取需求的日益增加,数字图书馆面临的海量信息资源整合的难题,已经成为制约数字图书馆资源建设的瓶颈。云计算作为一种新的IT资源服务模式,可以将分布式计算、并行计算、互联网技术有效地结合起来[1-2],通过网络技术将成本较低的计算实体集成为具有强大计算功能的系统,通过SaaS、PaaS、IaaS等模式对外提供服务,为终端用户减少处理负担。与传统计算相比,云计算将计算功能和存储功能抽象化,以服务的形式分布到终端用户中,可以便捷地实现用户间的资源共享和计算效率的提升。
数字图书馆资源整合中应用云计算技术,可以大幅度提升检索速度,满足用户的多元化、个性化检索需求,实现数字资源一体化建设[3-4]。云计算环境下,各个数字图书馆借助网络服务整合为分布式的网络图书馆,通过动态适应性的信息资源整合,为用户提供优质的信息服务,既可以在一定程度上消除信息孤岛,促进信息资源共享,避免资源重复建设,节约建设成本;又可以重构信息资源体系,加强信息资源之间的内在联系,提高信息关联度和完整性,实现不同资源之间的链接和沟通。云计算作为一种资源的有效汇聚和全新管理机制,有助于数字图书馆提升信息服务水平和能力[5-6]。在硬件设施方面,云服务的硬件服务体系可以为虚拟数据提供良好的硬件支撑,进而节约硬件设备和人力投入,方便数字图书馆日常管理;在软件服务方面,云计算可以按需制定软件服务行为,打破图书馆单一的集成管理系统,帮助经济实力不强的中小图书馆实现信息化建设;在存储方面,云计算基于互联网和集群应用技术,将数据存储在服务提供商的服务器中,既能为用户提供快捷的数据存储支持,又能有效降低图书馆数据存储、维护等成本投入。
信息资源整合的核心在于实现不用类型、不同格式信息资源之间的无缝连接和全面共享,形成跨平台、跨数据库、跨内容的新型信息资源体系结构。云环境下的信息资源整合涵盖数据库、系统、检索方式、技术、协议标准等多方面内容。其中数据库的整合是对分散异构数据进行无缝链接、整合分析,摒除多个数据库中的重复信息,建立新的虚拟数字资源体系;系统整合是通过分解和重组等方式对应用系统、数字资源进行整合,使其在组织结构和表达方式等方面趋于共性并形成统一的管理平台;检索方式整合是以组合检索等方式为用户提供全方位的检索服务,方便用户准确定位具体信息;技术整合是将多种资源整合技术合并以解决信息孤岛难题;协议标准整合则是采用合适的技术手段,实现基于不同访问协议和数据库标准的数据库在同一界面的统一检索。
数字资源作为图书馆领域研究的热点和难点,在整合机制的选择上需要综合考虑整合内容和云计算的特征。目前数字资源整合的实现机制包括数据仓库整合机制、中介器封装器整合机制、代理整合机制等。其中数据仓库整合机制是一种物理集成方式,可以满足不同服务器之间资源一致性存储的需求,为用户提供复杂的信息检索服务,使信息资源的类型与范围更加广泛,数字图书馆可以在此基础上整合多种资源,建立全方位的OPAC资源管理系统;中介器封装器整合机制作为一种虚拟的整合方式,应用中介器解决用户提问和检索结果的整合,应用封装器解决信息源的连接和具体查询,不需要在本地存储大量的数字资源,能适应云计算环境下信息资源数量多、更新快等特点,是目前数字资源整合的主流方式;代理整合机制作为近年来新兴的一种整合机制,通过合理利用用户Agent、资源Agent、代理方Agent来提高系统的整合效率,能够主动适应网络环境的变化,增强了系统的灵活性。
1.云计算服务模式。根据服务类型,云计算可以为数字图书馆提供三种服务模式:SaaS(Software as a Service,软件即服务)、PaaS(Platform as a Service,平台即服务)、IaaS(Infrastructure as a Service,基础设施即服务)。
SaaS是21世纪发展起来的基于互联网的软件应用模式,代表软件科技发展的最新趋势,是目前应用最广泛的一种云计算模式。在数字图书馆建设的过程中,提供商负责搭建基础网络设施和运作平台,并负责系统的升级维护,数字图书馆只需购买相应的软件即可为用户提供服务。以SaaS为基础的资源整合是一站式的资源整合,云端资源基于SaaS技术可以将不同数字图书馆的异构资源集成到统一的Web站点,并为用户提供统一的检索接口,能够有效提高资源利用率和馆间资源互补能力。其中比较有代表性的是谷歌公司在“云”概念的范畴下,将世界范围内的图书馆学术资源进行整合,推出了谷歌学术搜索(Google Scholar),具有便捷、全面、功能强大的特点,大大缩短了读者检索文献的过程。
PaaS模式将服务器平台作为一种可以提供的服务。基于PaaS的资源整合是通过构建云服务平台的方式,实现数字资源的最大集约化,进而最大程度地消除信息孤岛。数字图书馆通过PaaS的中间平台建立资源索引库,对图书馆资源进行描述,将分散的数字图书馆馆资源融合在一起,构建一个统一可控的云资源整合中心。通过该平台,云图书管理员可以快速整合多个数字图书馆的资源,并及时向云端用户提供相应的检索查询服务。
IaaS模式下,用户可以从完备的计算机基础设施中获取服务,服务内容包括处理、存储、网络等基本的计算资源以及操作系统、应用程序等任意软件的部署和运行。在服务运行的过程中,图书馆无需管理云计算基础设施,但是可以控制相关程序的应用。当前信息资源量激增,如何降低设备购置成本、提高资源保障水平,是数字图书馆亟待解决的问题。因此,数字图书馆基于IaaS的基础设施共建共享模式构建数字图书馆虚拟环境,可以实现基础设施资源优化整合并满足用户全方位的需求。
图1 基于云计算的图书馆资源整合架构
2.云计算服务架构。在云计算服务模式的基础上,构建了如图1所示的图书馆资源整合体系架构。(1)SaaS读者服务层主要为PC登录、移动终端登录等用户登录界面,用户通过注册账号进入云桌面选择所需要的服务;(2)PaaS后台管理层主要包括主服务控制机群和云监控模块等。主服务控制机群接收到用户的信息请求后,通过对用户身份进行合法性验证和应用请求类型的实时分析,动态分配合适的服务资源,在这个过程中,云监控模块对服务的执行过程进行全程实时监控,并对服务器进行管理操作;(3)IaaS基础设施层中,存储节点机群具有海量的存储功能,可以满足数字资源的存取需求。应用节点机群是具有不同业务处理能力的应用系统,可以处理各种复杂的应用请求。计算节点机群由多组云计算机群组成,可以满足超大运算量的计算需求。云计算架构的优劣程度直接影响着数字图书馆信息资源服务的高效性和一致性,因此,以云计算图书馆架构为基础,设计标准的管理流程,优化管理模式,开展统一管理,可以最大化地提高资源利用效率。
云计算将众多的计算机联合起来,为图书馆提供强大的计算能力,可以完成单一计算机无法完成的计算任务。因此,云计算模式可以满足用户大规模同时在线检索的服务需求,大幅提升图书馆的检索效率。在本地云构建的过程中,应用数据库技术、数据挖掘技术,可以在实现资源整合的基础上实现信息的智能化搜索,系统通过自动搜索并对搜索的信息进行权衡评价,帮助用户获取所需的信息。此外,用户可以使用电脑、手机等设备的信息检索平台,通过统一的认证和检索操作,随时随地获取所需的信息资源,保证了用户登录检索的便捷性,实现了用户信息检索服务的智能化、一体化。
基于大量系统连接而成的基础设施,不同图书馆之间可以共享馆际信息资源,而不必更新相关硬件设备,在降低投入、节约能耗、加快绿色数据计算的同时,大大提高了数字资源的利用率。因此,云计算的应用会推动数字图书馆信息资源的整合共享,有利于促进图书馆之间的合作尤其是图书馆联盟的构建。
动态分配资源是云计算的重要特征之一。当出现大量用户同时检索、访问量过大的情况时,云计算会采取“按需索取”的服务方式进行动态分配,保证数字图书馆获取最优的运算能力和服务器等设备的正常运转,最大化地满足用户需求;在计算需求较少时会归还多余的运算能力,保证资源的优化配置,减少资源的浪费。此外,传统图书馆服务器常面临黑客攻击的风险,数据容易被破坏,云计算凭借先进的技术,可以提供安全可靠的数据存储保障,为数字图书馆提供持续的安全服务。
数字图书馆只需要花费少量费用租用云服务商的相关服务,就可以依托云计算供应商的平台、存储和较强的计算能力来处理业务,大大降低数字图书馆资源建设方面的投入成本,节约设备维护、管理等方面的开销。在此基础上,数字图书馆可以合理规划开支,将有限的资金应用于核心业务的发展中。
云计算的发展为数字图书馆资源整合带来了新的机遇。云计算在服务模式、环境建设等方面的进步,有助于传统图书馆突破信息传递、信息存储等方面的限制,为用户提供优质的信息资源服务。但是机遇与挑战并存,云计算在数字图书馆资源整合方面也面临着标准化、稳定性、安全性、版权等方面的问题,需要云计算服务商与数字图书馆积极合作,采取相关措施,充分发挥云计算的最大功效,不断提升数字图书馆的服务能力。