单伟 陈淑平
[摘要]通过文献分析法和内容分析法对国内图书馆联盟的云计算服务研究与建设现状进行分析,从发文时间及数量分布、期刊作者分析、主题分布等方面展开调查和深入的内容分析,认为图书馆联盟云计算的研究已经形成从基础理论、到实证分析的研究体系,但缺少对理论与实践的评估分析;在对应用研究的案例分析中发现,目前大多数图书馆联盟是通过本地云平台(私有云)构建自己的联盟云平台的,公有云的数据安全问题是导致这一现象的主要原因;另外缺少利用云计算对图书馆联盟内数字资源进行数据挖掘的研究。共享及标准问题、信息资源的安全问题以及数字资源版权问题仍然有待在未来建设中深入研究。
[关键词]图书馆联盟;云计算;云服务;信息共享
[中图分类号]G251.5 [文献标识码]A [文章编号]1008-0821(2014)11-0079-05
2006年,“云计算”概念首次被GooSe提出,就受到社会各界的广泛关注,开始成为IT领域新的研究热点,Google、Amazon、IBM、微软等IT业巨头以前所未有的速度和规模推动云计算技术和产品的普及。虽然至今学术界对云计算还没有统一的概念,但一致肯定“云计算”在存储、数据应用与共享、资源整合等方面的优越性能,国内学术界较为一致的定义认为:云计算是网格计算、分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡等概念混合演进并在传统计算机和网络技术的基础上相互融合发展起来的共享信息资源的计算方式,能够把动态、异构的信息资源进行有效整合,通过互联网的业务——动态可扩展的和虚拟的资源作为服务提供给读者。
图书馆界历来是信息技术应用的领跑者,2009年4月23日,OCLC高调宣布即将推出基于WorldCat书目数据的Web级协作型图书馆管理服务,这被公认为是一项云计算服务。由于OCLC在图书馆界的深远影响,此举预示着云计算在图书馆领域广泛应用的开始。图书馆联盟是图书馆界为适应网络环境的需要,实现文献信息资源共享而采取的新措施。图书馆联盟使资源共享在现代科技信息技术的支持下成为可能,它是基于实现图书馆运作的全方位优化这一理念推出的新型组织运行模式。“云计算”的出现,为图书馆联盟的建设提供了新的思路和技术路线,让以资源共建共享为目标的图书馆联盟找到了进一步发展的基点,尤其是图书馆联盟在当前存在的问题,为引入云计算提供了很好的契机,基于云计算的图书馆联盟建设研究纷纷开始。
本文尝试通过文献调查法和内容分析法分析国内当前图书馆联盟云计算的研究现状,梳理该主题相关研究的脉络,总结经验、发现问题,以期在这一主题的研究中起到承前启后的作用,为推动图书馆联盟云计算服务的发展献计献策。
1、国内图书馆联盟云计算服务的研究现状
笔者以“图书馆联盟”、“区域图书馆”、“云计算”、“云服务”、“云平台”“云环境”、“云仓储”、“云存储”、“云联盟”等为检索词进行组合,在中国知网(cNKI)、万方数据库中进行检索,得到83篇相关文献,其中期刊论文72篇、会议论文5篇、学位论文6篇,下面,将分别从发文时间分布、发文数量、期刊分布、作者分析、基金支持、内容分类几个方面进行具体分析。
1.1 发文时间及数量分布
通过分析,我们看到,对“图书馆联盟云计算服务”这一主题的研究始于2010年,从2010-2013年,该主题相关文献数量分别为8、17、20、23篇,相对于“图书馆联盟”研究领域大量的论文相比,虽然发文数量不多,但由图1可以看出,从2010年开始,该主题的研究热度呈一般递增趋势。可见,有关“图书馆联盟云计算服务”的研究是一项较新的研究,还处于一个逐渐上升的起步过程,以2010年为起始点,图书馆界的学者相继关注该方面的研究,并且这种关注度正逐年深入,也说明了该领域是值得关注研究的领域,预测今后几年对该领域的研究会呈现递增趋势,研究热度会增加。
1.2 发文期刊分布及作者、基金分析
从期刊学科分布来看,检索出的72篇期刊文章共分布在约31种期刊上,其中,图书情报类期刊21种,共发文51篇,计算机类期刊占9篇,新闻出版类占12篇,其比例分布如图2所示,说明该主题的研究主要分布在图书情报领域。从期刊质量看,检索出的72篇期刊文献,有29篇分布在CSSCI图书情报类核心期刊上,根据2013年公开的CSSCI核心期刊目录及SCD来源期刊目录,其中包括情报科学、图书馆学研究、图书馆工作与研究、图书情报工作、图书情报知识、国家图书馆学刊、图书馆、图书馆建设、图书馆杂志、现代情报10种期刊,说明该主题的研究论文具有一定的含金量。
从发文作者看,检索出的83篇文献中,以合作及独作形式发文在2篇以上的作者有7位,其中,叶素萍、王启云、刘万国与其合作者形成了研究团队。6篇学位论文分别来自东北师范大学、安徽中国科学技术信息研究所、黑龙江大学、辽宁师范大学,能够作为一个培养硕士及博士研究生的学位研究方向,说明该主题在实践及理论方面具有持续研究价值。
从发文基金分布看,检索出的83篇文献中,有4篇文献分别获得湖南省社会科学基金、江苏省教育厅人文社会科学研究基金、国家自然科学基金、湖南省教委科研基金的支持,说明该领域的研究受到了科研管理部门的重视,进一步说明了相关主题的研究具有创新性和较大的研究价值。
综合看,有关“图书馆联盟云计算服务”的研究论文具有一定的含金量,但还未形成核心期刊群和稳定的研究群体。随着图书馆界学者和科研人员关注度的增加,尤其是作为高校科研的一个方向,该主题的研究热度和深度将持续增长。
1.3 发文内容分类
在对检索出的83篇文献进行具体分析后,笔者将发文内容分为四大类,分别为:基础理论研究、服务模式研究、服务平台建设研究、应用研究,对应篇数分别为19、23、17、24,笔者又对这四大类内容做具体分析如下:endprint
1.3.1 基础理论研究
基础理论研究是一切问题研究的基础,每一项新技术、新方法、新理论与某一领域的结合都要以基础理论研究开始,通过对概念、可行性、必要性、优势、问题、前景的深入探讨,为后续的实践应用提供坚实的支持,这一部分的研究必然占有较大的比重。从检索到的文献看,图书馆联盟云计算的相关基础理论研究所占比重无明显优势,导致这一结果的主要原因是图书馆界围绕关于云计算应用于图书馆信息服务的必要性、可行性、对数字图书馆的影响、服务模式、管理方式等问题的研究已进行过热烈而深入的讨论,虽然尚未就云安全问题找到确定元虞的办法,但认为云计算与图书馆信息服务结合已不可阻挡,这一结论进一步推广到图书馆联盟与云计算的结合。
魏晓萍、杨丽分别指出,目前区域信息资源共享存在着信息资源分布不均衡、资源重复建设、共享范围有限、管理不规范、权益不明确等问题,而应用云计算将实现降低区域图书馆共享基础设施投入,降低服务器的出错概率,提高信息安全性、信息资源丰富与存取能力快速,整合资源、实现跨系统、跨地区信息资源共享,扩大信息资源共享空间。
在具体实施策略方面,魏晓萍指出,要建立云职能管理机构、建立区域内私有云、明确哪些图书资源放到“云”中、建立信息资源共建共享的法律保障体系,保护知识产权、建立统一的接口。杨丽提出区域图书馆联盟工作中心应放在资源建设方面:构建区域内公有云、私有云,信息资源统一采购、区域共享,注重本地资源、特色资源的建设,重视机构知识库的建设。梁爱东、李华等认为要密切关注云计算的发展及应用、确立云计算图书馆架构体系和服务,搭建图书馆云计算平台,制定统一标准,注意信息资源的安全问题、数字资源版权问题以及协议和接口的问题。
李硕提出了图书馆联盟应用云计算应遵循自上而下的模式:国家级图书馆联盟建立公用云、成员馆建立专用云、区域级图书馆联盟建立混合云。与此观点一致,潘天骄等依据创新扩散理论,提出了“一化三性”的推广应用对策,呼吁图书馆联盟自上而下地积极推广云计算。熊莉君指出图书馆云在发展过程中,还存在着云计算平台建设水平与云安全等两个重要瓶颈。魏晓萍指出数据位置问题、经费问题、知识产权问题、有关接口问题、数据安全问题是图书馆联盟云计算建设中的难点。
1.3.2 服务模式
云计算环境下,图书馆角色将发生重大转变,图书馆联盟的服务模式也必将有新的变革。梁爱东指出,云计算对图书馆的影响则表现在:对图书馆职能及角色定位的影响、对图书馆组织结构与管理的影响、对图书馆资源存贮的影响、对图书馆信息服务的影响。高洁指出我国高校图书馆联盟有集中式、分布式、混合式3种运行模式,无论在何种模式下运行,都存在着信息系统各异与专业人员缺乏等问题,云计算可以运用其特性很好地解决以上问题。耿丽丽等从机会、威胁、优势和劣势4个方面分析了云计算环境下图书馆的发展态势,从服务战略、技术战略、管理战略和图书馆联盟战略4个方面讨论了图书馆在云环境下的发展战略,从政府、图书馆、云计算服务商3个角度分析了战略的实施。叶素萍提出在以下几方面构建区域图书馆联盟云模式,区域性云服务平台建设、云环境下的地方文献资源联合编目、数字资源存储、社区图书馆联盟、移动图书馆服务。
张建芬提出云解决方案包含两个层面:云平台是指基于硬件的服务,提供计算、网络和存储能力。云服务包含3种服务类型:基础架构即服务IaaS、平台即服务PaaS、软件即服务SaaS。基础架构即服务是以服务的形式提供虚拟硬件资源,如虚拟主机、存储、网络、数据库管理等资源。平台即服务是提供应用服务引擎,如应用编程接口、运行平台等;软件即服务是直接面向图书馆提供最终的应用服务:包括馆际互借、数据库检索服务、参考咨询服务、特色库加工服务、教参管理服务、学位论文服务等,各个馆可以按需租用部分或全部服务。而熊莉君则提出4层服务模式:(1)基于软件即服务SaaS的图书馆自动化集成管理系统、图书馆统一检索平台;(2)基于平台即服务PaaS的图书馆数据库服务平台、图书馆开发应用环境服务平台;(3)基于基础设施即服务IasS的图书馆存储及数据中心平台;(4)基于数据即服务DaaS的图书馆文献数据库资源整合平台,运用数据库虚拟化技术将不同馆的书目数据、用户信息、流通阅览数据、特色馆藏数据库、学位论文数据库、机构知识库数据、导航资源等整合到数据管理平台上,进行统一管理和调度。通过对数据库的管理和部署,提供大规模原始数据、半结构化数据和经过处理的结构化数据,并把这些经过处理的数据进行存储、分享、管理、挖掘、搜索和分析,提供智能化的服务。
1.3.3 服务平台建设
云计算平台建设是构建图书馆云联盟的关键环节,倪煜佳指出基于云计算的图书馆联盟服务平台对各成员馆馆藏资源和软硬件资源的整合,通过云服务平台面向用户进行服务,对于图书馆联盟的长远发展有着巨大的意义。范艳芬等认为以云计算基础设施理论为基础构建数字图书馆联合平台是实现数字图书馆联盟目标和任务的技术保障,它能有效集成联盟成员馆的各类资源和应用,为用户提供个性化信息服务。吴志强等指出在云服务平台上搭建的图书馆联盟系统将会给不同层次的用户提供不同的基础设施服务和软件平台服务。
于秀静结合OCLC、CALIS在图书馆云服务方面的主要研究成果,以安徽高校数字图书馆建设为例,利用云计算IaaS、PaaS、SaaS等主要服务方式,构建安徽省数字图书馆云服务平台。谢原等以吉林省图书馆联盟云服务平台建设为例,进行了图书馆联盟云计算服务平台的架构设计,并详细论述了云计算服务平台中的各子平台的服务功能和技术实现。谭海兵以湖南省高等学校数字图书馆虚拟化云平台建设为实例,进行了详细的具体过程的描述。杨芳等指出湖北省高等学校数字图书馆(HBDLIB)构建了CALIS省级数字图书馆云服务中心,通过IaaS、SaaS等形式为全省用户提供基于云计算的数字图书馆服务,HB-DLIB云服务平台初步实现了区域性数字图书馆联盟建设。马小军等设计基于B/S和C/S混合架构的云计算资源监控平台,同时结合第三方插件和类库,从目标主机采集数据并进行分析,以图和列表的形式展现资源的使用情况,实现对联盟系统及其资源的监控管理,从而保证图书馆联盟系统的运转安全。endprint
1.3.4 应用研究
在应用方面,国内图书馆联盟已经应用云计算进行了文献信息资源共建共享的实践研究,主要涉及图书馆应用云计算技术对文献信息资源进行整合、存储、共建共享等内容。
刘瑞从民族高校的特色学科建设人手,提出在CALLS三期工程云计算理念下,建设民族高校图书馆联盟,实现资源共建共享的建议。李明鑫等提出构建云中心荐购知识库,对高校图书馆云中心荐购知识库的实施方案进行了探讨。温明章通过分析云计算在广州高校图书馆联盟非书资源建设中的应用实践,论述了云技术如何有效解决非书资源在图书馆应用中的主要矛盾。饶志华等L23J利用云计算能够搭建联合参考咨询服务平台,扩展信息检索的服务能力,促进联合参考咨询的多层次化发展。李雪萍等结合云计算在江西昌北高校图书馆联盟运行过程中的成功实践,探讨了图书馆联盟建设过程中所应注意的事项,如服务理念、服务体系、成员馆协调和交流合作、激励机制等。高海鹰以吉林省图书馆联盟各成员馆间信息资源共享为例,探讨了云计算为改善区域性图书馆联盟信息资源共享能力带来的变革和美好前景。刘万国L26]介绍到吉林省图书馆联盟目前成员馆34家,联盟云服务平台向读者提供国内外多馆文献资源的发现与一站式服务,提供云存储服务、云软件服务、移动图书馆服务、个人数字图书馆订制等服务,同时,向联盟成员馆提供书刊管理、数字资产管理、云平台等多项服务。范艳芬介绍道,辽宁省数字图书馆联盟建设以政府主导与财政投入为前提;以云计算基础设施理论为思路,选择先进的数字图书馆联合平台作为数字图书馆联盟的技术保障平台;采用自购、集团购买和买断3种形式建设文献资源。
2、国内图书馆联盟云计算服务研究的结论
虽然我国图书馆界对云服务的研究晚于国外,在图书馆联盟与云计算结合方面的实践也晚于国外,但近几年我国图书馆界也开始密切关注云服务,并开展了一些有价值的理论研究和实践尝试,由于云计算还处于应用的初级阶段,故对基于云计算的图书馆知识服务研究也处于起步阶段,研究还存在一些不足,通过上述文献分析,我们可以看到,国内图书馆联盟云计算的研究具有以下几方面特点:
(1)相对于图书馆与云计算结合的大量文献,图书馆联盟云计算研究的论文数量不算多,虽然在持续增长,但增长的趋势不算显著,这并不能说明该领域的研究不具有持续研究的价值,而是在前期图书馆与云计算研究的基础上,图书馆联盟云计算的研究更加务实,注重关键问题的探讨,对服务模式、服务平台构建进行较深入的研究,这是构建图书馆联盟云服务不可逾越的关键问题,也是未来尤其需要深入研究的问题。
(2)图书馆联盟云计算的研究已经形成初步的研究体系,从基础理论,包括必要性、优势、存在问题、发展前景,到应用研究,包括平台构建、模式,再到实证分析,包括Calls、湖北省、吉林省、辽宁省等几个图书馆联盟云计算的实际案例分析,云计算在图书馆联盟建设中的价值已经在实践中得到了印证,只有理论与实践相结合,才能真正体现研究的意义。然而,还缺少对理论与实践的评估体系的研究。
(3)对图书馆联盟云计算的案例分析,包括湖北省、吉林省、辽宁省、江西省、安徽省等几个图书馆联盟云计算的实际案例,我们发现,目前大多数图书馆联盟是通过本地云平台(私有云)构建自己的图书馆联盟云平台的,这保障了联盟内部信息资源的安全性,但私有云在实践上还面临大量的技术难题和工程问题,不利于以后联盟之间的信息合作,相对于公有云也需要投入较大的资金和人力去进行云系统的使用和维护,公有云的数据安全问题是导致这一情况的主要原因。
(4)缺少对利用云计算对图书馆联盟内数字资源进行数据挖掘的研究,目前图书馆联盟的云服务大多数只是显性知识的整合共享,缺乏对隐性知识和网络灰色文献进行整合和深度挖掘并转化成显性知识的研究,在提倡个性化服务的数字图书馆建设中,基于云计算的数据挖掘应该成为图书馆联盟云服务建设的创新点。
3、促进图书馆联盟云服务跨越发展的几个重要问题
从前面文献分析,我们能够看出,从理论研究到实践应用,图书馆联盟云计算服务已经迈出了坚实的起步,取得了不错的成绩,虽然云计算在信息资源共享中具有切实的可行性,但要进一步发展,仍然存在着几方面不可逾越的问题,也是未来图书馆联盟云计算服务研究有待深入研究的重点问题:
3.1 共享及标准问题
云计算虽然在商界有了一些成功的案例,但云计算领域仍然一直没有统一的标准,也没有合适的云计算网络协议与规范的规章制度。俗话说“没有规矩,不成方圆”,图书馆间要协调并有效地形成图书馆云计算联盟,进而组成统一、开放的云服务环境,必须在云计算图书馆联盟的架构中在协议和标准的选择上达成共识,然而,目前各种类型的图书馆发展水平参差不一,在实行信息共享联盟的区域内,每个图书馆的服务器的配置与所使用的服务器的操作系统都不尽相同,这就在现实上决定了它们对未来面临的问题及需要会完全地不同。构建云计算下的图书馆联盟,从技术的角度来看,是一个协议与标准的问题,在信息社会大的云计算环境下,云计算图书馆间也许只需一个端口就将可以快捷、方便地获取和共享联盟中的任何资源或服务。
3.2 信息资源的安全问题
云计算作为一门新技术,本身也存在一些问题,数字图书馆将数字资源转移到云端,一个最大的挑战是数据安全问题。关于云计算的安全问题,主要有3个方面:(1)突发性的安全问题。即自然灾害、电力中断、系统崩溃以及病毒、黑客入侵等可能造成的系统、资源安全问题。(2)资源、系统本身的管理安全问题。云存储服务的提供者大多属于商业性质的机构,其本身的信用就让人怀疑,图书馆的数据、程序都不在本馆的服务器上,怎么保证今后这个“云”还存在?虽然云本身的超大存储容量和高扩展性保证了数字资源的存储和备份,但是,由于云是虚拟的,用户本身不知道数据存储的具体位置,同时也不知道数据有多少个副本,这样容易造成数据泄密问题。目前大多数图书馆是通过本地云平台(私有云)构建自己的数字图书馆云平台的。(3)技术锁定的风险。相互竞争的服务提供商会为竞争或垄断而采用互不兼容的标准与格式。当图书馆要把资源或服务从一个云转移到另一个云,放弃原服务提供商时,就将遭遇到技术锁定的风险。数据或服务的转移,在此时将真正成为一件并非能轻而易举而完成的事情。
3.3 数字资源版权问题
云计算是一个自由与开放的数字服务空间环境,加入云计算联盟的图书馆可以共享或共用彼此间的各种资源或服务,各图书馆可以像使用本馆资源或服务一样使用它馆的资源或服务,彻底实现真正意义上的共建、共享,而这将极大地提高资源或服务的使用效率,但也可能带来更为复杂的数字资源版权问题。图书馆购买使用云计算服务后,将其资源放在云端,由云计算服务商托管这些数据,云计算服务商采取任何方式对这些数据进行的整合、挖掘等利用行为,将不可避免地产生知识产权纠纷,这些产品知识产权的界定将成为新的问题。因此,图书馆界在发展与创建云联盟的过程中,要特别重视对云计算下的知识产权保护问题的研究与探讨,积极寻找切实可行、多方共赢的问题解决方案。endprint