吴玉灵
(1.江西省图书馆,江西 南昌 330046;2.武汉大学信息管理学院,湖北 武汉 430072)
2016年11月,北京航空航天大学图书馆馆长姚仰平教授在第十六届国防科技院校图书馆学术年会中首次提出了“中国云图书馆”构想,他建议图书馆界应当借助行政力量的推动,联合全国图书馆的力量,形成一个统一的强有力的联盟机构,采用云计算技术标准,开发构建一种高效率、低成本的信息资源管理和服务模式,通过统一的数字服务平台,进行全方位的资源和服务整合,创建中国图书馆云生态。
2017年3月,全国人大代表张涛呼吁:拥抱分享经济,构建国家云图书馆[1]。他强调:图书馆之间的合作与资源共享一直是图书馆界共同追求的目标。采用云计算技术,开发构建一种高效率、低成本的国家级信息资源管理和服务体系,把分散的数据资源整合起来,通过统一的云端平台提供服务,建成中国规模最大、馆藏最丰富的网络化数据资源集成平台。
显而易见,图书馆云计算服务的发展得到了业界的广泛关注。为进一步掌握图书馆云服务平台的使用状况和发展特点,提升图书馆云服务质量,强化云计算平台架构的稳定性、云服务项目内容的多样性,本文对国内外提供云服务的图书馆进行调查研究,笔者采用电话访谈、问卷调查等方式对国内部分图书馆云平台的部署、云服务的应用类型,以及读者满意度等内容进行了调查,共收回有效问卷调查20份,采用文献搜集的方式对国外图书馆云平台部署、云服务的应用类型进行了调查。根据调查结果进行数据分析,试图从读者的角度出发,构建一个能够满足读者需求,提升用户体验的云服务平台机制体系。
调查对象的选取原则为:图书馆所在地大数据或云服务应用比较早或图书馆云平台与大数据服务建设方面有一定基础的相对较大的图书馆。参与调查的国内图书馆包括公共图书馆和地方高校图书馆。其中公共图书馆包含国家图书馆、省级图书馆以及直辖市图书馆。参与调查的17家数字图书馆见表1。
表1 参与调查的国内图书馆列表
本文主要采用在线问卷、电话访谈和现场走访等多种途径相结合的方式与各图书馆相关技术人员以及管理人员就国内图书馆云平台服务现状进行了交流与沟通,完成了调查。
2.2.1 图书馆云服务平台基础架构
图书馆云服务平台基础架构的选择至关重要,它是图书馆云服务应用成功与否最关键的因素,它关系到图书馆云平台服务的服务效果、技术实施风险、资金的节省以及更长远的规划。
图书馆云服务项目按照平台部署模式的不同可以划分为:图书馆公有云、图书馆私有云和图书馆混合云。
2.2.2 图书馆云服务项目类别
图书馆云服务项目按照云服务的交付模式可以划分为SaaS服务模式、PaaS服务模式以及IaaS服务模式。
SaaS(Software as a Service)把软件当作服务。顾名思义,图书馆将特定的应用软件部署到本馆服务器上,馆员或读者只需接入互联网终端,便可随时随地直接通过浏览器获取并使用该软件。
PaaS(Platform as a Service)把平台当作服务。图书馆把服务器平台或者开发环境作为一种服务进行提供。常见的平台主要有应用服务器、操作系统、数据库、中间件等。
IaaS(Infrastructure as a Service)把基础设施当作服务。图书馆将数台高配服务器组成“云端”基础设施,并将处理器、内存、输入输出设备、存储能力整合成虚拟资源池,为图书馆用户提供虚拟化服务器和存储服务。
2.2.3 用户满意度分析
图书馆依据用户的直接评价来判断云服务的实施效果。通过在问卷调查表中设置图书馆云服务读者满意度的题目进行挖掘分析。
2.3.1 图书馆云部署模式及软件架构
综合分析调查反馈的数据信息后,发现13家公共图书馆和7家高校图书馆各自建立了本单位的图书馆云平台,并为用户提供图书馆云服务。当被问及图书馆云服务应当部署在私有云还是公有云上时,结果75%的图书馆选择了私有云,他们认为采用私有云模式进行图书馆云平台的部署,在数据安全与数据管理方面的管控上具有主导地位;15%的图书馆认为可以部署在公有云,利用公有云的托管服务,有效减少图书馆对基础设施的人力运维成本;剩下10%的图书馆认为可以采用公有云与私有云并存的混合云模式进行部署。
云计算是虚拟化、分布式计算、分布式数据库和分布式存储相互融合的产物。问卷调查结果显示,各图书馆采用的云平台架构软件系统不尽相同。例如:国家图书馆采用的基于SOA系统架构模型实现的国家数字图书馆云平台,高校图书馆基于Nebula的Calis云服务平台,省级公共图书馆大多采用Xen、VMware虚拟资源池来架构云服务,还有部分图书馆采用基于KVM的CloudStack、OpenStack等软件框架搭建图书馆云服务平台。
2.3.2 图书馆云平台服务项目类型
经过调查分析,图书馆云平台服务项目类型主要有以下几种:
(1)图书馆联合编目、统一检索、信息资源共建共享。利用云计算技术构建共享云服务平台,实现图书馆采访、联合编目、统一检索、信息资源共建共享。例如:陕西省高校图书馆通过建立CALIS云平台实现了书目数据的统一编目、信息的一站式检索和信息资源共建共享等服务功能[2]。
(2)结合大数据关键技术提供基于云计算的图书馆大数据统计分析服务。利用各类云计算服务平台,结合Hadoop、Spark、Hive等大数据存储和处理框架实现图书馆大数据服务。具体服务内容有:本馆电子图书、数据库、资源统计、读者访问统计分析。
(3)提供诸如虚拟服务器硬件基础设施的IaaS服务。图书馆还能为本馆馆员或科研人员提供虚拟服务器设备或中间件资源。例如,西安邮电大学图书馆的云计算应用平台将分布在高性能服务器上的内存、存储和计算能力集中起来形成一个虚拟资源池,通过虚拟化技术可虚拟出若干高性能的虚拟服务器或个人主机。
虚拟服务器与物理服务器的功能完全一样,并且在设备、网络和存储等方面具有冗余功能,能够提供稳定可靠的运行环境,为不同需求的教学科研活动提供24小时不间断服务。目前西安邮电大学图书馆已经为本馆教研职工按照硬件配置需求提供虚拟化设备资源服务[3]。
(4)多媒体电子阅览室服务。在虚拟化技术与云计算技术的基础支撑下,建立私有云主机,构建电子阅览室虚拟云桌面。大幅降低了图书馆传统PC机硬件成本经费与维护工作量,实现了电子阅览室终端设备的统一管理。例如江西省图书馆采用深信服aDesk云桌面方案,只需桌面云一体机和云终端两种设备,即可实现图书馆电子阅览室云平台服务的快速交付,为用户提供更安全、更高效的电子阅览室云桌面服务[4]。
(5)基于云计算的读者云桌面个性化服务。许多图书馆通过相关API接口专门为本馆读者定制了个性化云桌面服务,为读者提供诸如图书借阅服务、在线阅读、学习题库、音视频资源、读者荐购、云盘存储等服务,读者可以根据需要勾选自己需要的服务模块,未勾选的服务模块不会出现在个性桌面上。例如,某高校图书馆的读者云桌面个性化服务中,读者只需要一个连接网络的终端设备便可以通过浏览器访问图书馆个人个性化桌面,使用图书馆提供的基于SaaS的各种服务,如图1所示。
问卷调查反馈的数据显示,被调查的20家我国内地图书馆提供的云服务内容存在明显差异。其中个性化虚拟云桌面服务项目和云存储服务项目最少,分别只有10%与15%,虚拟服务器资源池服务占40%,大多存在于高校图书馆中,其余服务项目趋于中上水平。参见图2图书馆云服务项目。
图1 图书馆读者个性化桌面
图2 图书馆云服务项目
2.3.3 图书馆云服务读者满意度分析
笔者通过在线问卷的形式就图书馆云服务现状对读者进行满意度分析调查。随机抽取公共图书馆、高校图书馆的读者200人进行问卷调查,回收有效问卷186份,有效回收率93%。为了体现调查数据的真实性,在线问卷采取匿名制,只录入所在图书馆名称,不录入个人姓名。调查评价的内容是读者对图书馆云服务满意程度分析。此外,还有部分热心的读者对图书馆云服务的工作提出了相关建议,他们希望图书馆云服务平台解决好数据存储的安全性问题,并在今后的服务项目中添加互动元素。调查分析结果如表2所示。
表2 图书馆云服务读者满意度评价
参与调查的国外图书馆包括5家公共图书馆和7家大学图书馆。其中,公共图书馆有美国国会图书馆、美国纽约公共图书馆、美国华盛顿哥伦比亚特区公共图书馆、美国俄亥俄州图书馆、澳大利亚国家图书馆,高校图书馆有美国加州理工学院图书馆、美国匹兹堡大学图书馆、美国肯塔基大学图书馆、美国麻省理工学院图书馆、美国哥伦比亚大学图书馆、美国莱斯大学图书馆、英国兰卡斯特大学图书馆等。
本文主要采用文献搜集的方式对国外图书馆云服务进行调查。通过有目的、有计划、有重点地搜集被调查对象的文献资料,从而了解国外图书馆云平台服务的基本情况。
表3 国外图书馆云平台部署及服务模式
3.2.1 云服务平台部署模式
国外图书馆在服务平台的发展和演变中,大致经过了从本地服务器机房建设服务到核心机房集中服务,再到云托管服务三个阶段。国外图书馆云平台部署及服务模式见表3所示。
3.2.2 云服务应用
(1)OCLC资源检索云服务。美国著名的OCLC(Online Computer Library Center,联机计算机图书馆中心)的WorldCat联机联合目录数据库提供多途径资源检索云服务[5]。
(2)数字资源存储和访问服务。用于研究云计算技术并探索数据资源的永久访问的Duracloud项目早在2009年就启动了,它为各个机构提供的数据存储与访问这一服务解决了各机构用于基础设施建设所需的经费问题,它还为用户提供了数据在线备份与同步的功能,包括网络资源的上传和下载、多媒体资源格式在线转换等服务内容。
(3)个性化服务模块。OCLC云平台提供了丰富的个性化服务功能,例如用户个人档包含了列表、标签、评论、喜爱的图书馆、个人兴趣等功能板块,其使用完全依据用户个人喜好,满足个性化需求。个人档还具有一定社会化特征,例如用户对资源进行标注后就使标签、资源和用户产生了一定的联系,具有相同特征的资源和用户就很容易通过聚类分析算法进行聚类,形成一定的社会化关系网络。
(4)新媒体资源访问服务。国外图书馆云服务在多媒体资源的访问服务应用上实现了低时高效的服务体验。例如:Duracloud将图像和音视频存在“云”端,通过嵌入式开放资源浏览器向用户提供资源,用户服务器无须做任何负担性工作,省去了将网页内容下载到本地硬盘进行查看的过程,实现了访问速度快、获取资源效率高的特点。音视频服务支持MP3、MP4、FLV和其他格式流媒体文件的传输,它利用亚马逊的CloudFront服务将网页内容缓存在就近的CDN缓存器上,用户从这里直接读取,速度更快,不占电脑内存。图片服务使用Dojakota开源应用程序,直接从“云”端将图片转化成JPEG2000格式进行传递,用户可使用Duracloud浏览器查看图片[6]。
(5)邮件云服务。美国国会图书馆近来提出了“软件即服务(SaaS)云计算电子邮件解决方案”的信息请求,致力于将其电子邮件服务转移到云端[7]。
4.1.1 国内外图书馆云服务的共同特性
(1)政府的大力支持。国内与国外图书馆云服务项目的推进离不开政府的大力支持。政府的政策推动与资金资助极大地促进了图书馆云计算服务的发展。
2015年是我国云计算政策集中出台的一年,国务院先后出台了三项与云计算密切相关的政策文件,分别是:《国务院关于促进云计算创新发展培育信息产业新业态的意见》《国务院关于积极推进“互联网+”行动的指导意见》和《促进大数据发展行动纲要》。中央网信办也发布了关于党政部门云计算安全管理的文件《关于加强党政部门云计算服务网络安全管理的意见》。云计算产业发展、行业推广、应用基础、安全管理等重要环节的宏观政策环境已经基本形成。
(2)共建共享机制。国外图书馆与国内图书馆的云计算平台均采用了共建共享的机制,各成员图书馆在获取资源和服务的同时,也必须向组织贡献自己的部分资源。
4.1.2 国内外图书馆云服务的差异性
(1)云平台部署模式的差异。国外大部分图书馆云服务的转型更倾向于公有云部署模式,他们认为公有云的性价比很高,通过公有云快速交付的IT软硬件基础设施,可以大大降低成本,提升服务效率,发展更多强大和可扩展的在线服务。国内图书馆大多在本单位内部建设私有云为广大读者提供服务。
(2)服务项目内容的差异性。国外高校图书馆除了传统的学科类型服务外,还提供了面向科研数据管理的服务,通过组织开放数据研讨会来促进数据研究在高校的应用和普及。
图书馆应当结合本单位实际需求,综合考虑多方面因素,因地制宜地选择图书馆云计算服务基础架构。例如:与本馆现有基础架构的兼容性问题;服务中存在的技术实施风险问题;资金投入保障问题;云服务未来长远规划的问题。当图书馆对数据的安全以及数据的掌控十分看重时,可以考虑采用私有云部署模式;当经费不足或是缺乏云计算专业运维和管理人才时,可以考虑采用公有云部署模式;当图书馆在服务读者过程中存在公用与私用并存的服务特征时,可以考虑采用混合云部署模式。
在云计算服务的内容上,云平台服务类型需走创新路线。图书馆一方面要面向公众读者提供信息资源检索、资源库获取、读者荐购、虚拟云桌面等其他个性化云计算服务,另一方面要结合大数据关键技术为本馆自动化管理提供数据的统计与分析服务,并为本馆分支机构或本馆内部职工提供基础设施软硬件资源服务,这在高校图书馆中体现得尤为重要。
除此以外,图书馆还可以尝试在个性化服务中添加“读者DIY小程序”开发者权限服务,使读者能够自由添加需要的小程序到个性化云桌面中(例如:经常需要访问的网页链接等),从而增强服务的创新性。
通过对国内外图书馆云服务平台基础架构、服务项目、读者满意度情况的调查与分析,我们不难发现在云计算新型技术环境下,图书馆应当以本馆现有软硬件基础设施环境作为云服务基础架构的选择因素,利用海量图书馆数字资源,建成统一管理、伸缩调度、服务项目多样和操作易用的图书馆云服务平台,这将有效解决图书馆海量资源冗余重复、服务效率低下的问题,从而提高读者的满意度,提升公共文化服务体系的建设、传播、服务和管理水平,推动图书馆更好更快的发展。