国际云计算研究的知识图谱分析

2013-08-08 05:48:58
关键词:分布式计算虚拟化网格

(浙江工业大学图书馆,浙江杭州310023)

云计算是以互联网和计算机技术为基础发展形成的新计算模式,实现了对共享可配置计算资源(网络、服务器、存储、应用和服务等)的方便、按需访问;这些资源可以通过极小的管理代价或者与服务提供者的交互被快速地准备和释放[1]。自2007年谷歌提出云计算的理念以来,谷歌、IBM、微软等IT巨头纷纷把云计算作为自己未来发展的战略核心,引发了新一轮IT技术的重大变革;而学术界也纷纷对云计算的技术、平台、应用、管理、安全等问题进行了深入研究[2]。本文选取ISI Web of Science数据库所收录的云计算研究文献数据,借助CiteSpace II分析软件绘制国际云计算研究的科学知识图谱,分析有关云计算研究的国家分布情况、研究前沿、研究热点及跨学科属性问题,并探讨云计算给高校带来的机遇和挑战。

一、云计算研究的国家分布

在CiteSpaceII软件界面内,网路节点选择国家(Countuy),主题词来源(Term Source)选择文献标题(title)、摘要(abstract)、关键词(descriptor)和标识符(identifiers),算法选择路径搜索(pathfinder)算法,数据抽取对象为 top30,设置“Time Scaling”的值为1,即将2007-2013年分成7个时段进行处理,阀值引文数量(C)、共被引频次(CC)、共被引系数(CCC)分别设定为(2,2,20),(4,3,20),(3,3,20),运行 CiteSpaceII,绘制国际云计算研究的国家分布知识图谱。如图1所示,其中圆形节点代表国家,发文量越多,节点越大[3]。

图1 云计算研究的国家分布图谱

表1 云计算研究的国家分布

由图1和表1可以看出,按发文频次排在前5位的国家分别为美国、中国、澳大利亚、英国和日本。这些国家在云计算发展中纷纷开展了一系列的战略部署:美国联邦政府于2011年2月正式发布了首份关于云计算的战略报告——《联邦政府云计划战略》,明确提出美国政府信息技术应用向云迁移;中国国家发展和改革委员会于2010年5月发布的《关于当前推进高技术服务业发展有关工作的通知》中强调要发展面向市场的高性能计算和云计算服务;澳大利亚政府于2011年出台云计算战略;英国政府在2011年11月宣布启动政府云服务G-Cloud,并投入6000万英镑建立公共云服务网络;日本于2010年8月发布了《云计算与日本竞争力研究》报告等[4]。中国的云计算发展非常迅猛,2007年3月中国移动启动了“大云”计划;2008年6月IBM与无锡市共同建立了中国第一个云计算中心;2008年7月瑞星公司推出了基于互联网的全新安全模式“云安全”计划;同时用友推出了新一代在线营销服务“客盈门”云计算平台;2009年10月中国第一个自主产权的“云计算”平台在广东电子工业研究院投入使用;2010年1月北京市计算中心建成的20万亿次公共云计算平台投入使用,等[5]。此外,从图谱中可以看出,国家节点的连线非常少,或处于网络的边缘区域,且网络密度仅为0.0151,说明目前还没有形成广泛的国际合作规模,各国关于云计算的学术交流和科研合作有待加强。

二、云计算研究的前沿

利用CiteSpace软件中提供的突现词探测(burstdetection)技术和算法,通过考察词频从大量的主题词中探测出来,依据词频的变动趋势,而不仅仅是频次的高低,来揭示云计算研究的前沿领域和发展趋势[6]。选择突现词(burst terms),其他策略不变,运行CiteSpaceII后,检测到云计算研究的5个突现词,grid computing(网格计算)、distributed computing(分布式计算)、system(体系)、design(设计)、measurement(评估)。因此,可以判断云计算研究的前沿趋势为:云计算的相关计算形式(分布式计算和网格计算)、云计算的体系结构设计及评估等。

云计算是分布式计算、网格计算和并行计算的最新发展,或者说是这些计算机科学概念的商业实现。分布式计算是一门计算机科学,它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。网格计算强调的是一个由多机构组成的虚拟组织,多个机构的不同服务器构成一个虚拟组织为用户提供一个强大的计算资源。很显然,云计算属于分布式计算的范畴,是以提供对外服务为导向的分布式计算形式。云计算把应用和系统建立在大规模廉价服务器集群之上,通过基础设施与上层应用程序的协同构建以达到最大效率地利用硬件资源的目的,以及通过软件的方法容忍多个节点的错误,达到了分布式计算系统可扩展性和可靠性两个方面的目标[7]。

云计算的体系结构是由5个主要部分构成,分别为应用层、平台层、资源层、用户访问层、管理层。云计算的本质是通过网络提供服务,因而其体系结构的构成以服务为核心。应用层、平台层、资源层这三层是云计算提供的不同层次的服务。资源层是指基础架构层面的云计算服务,它把基础架构的各种功能提供给用户,使得用户可以基于这些服务搭建自己的应用。这种服务可以提供虚拟化的资源,从而隐藏物理资源的复杂性;平台层为用户提供对资源层服务的封装,使得用户可以使用更高级的服务构建自己的应用;应用层为用户提供软件服务;用户访问层是方便用户使用云计算服务所需的各种支撑服务,针对每个层次的云计算服务都需要提供相应的访问接口;管理层是提供对所有层次云计算服务的管理功能[8]。

三、云计算研究的热点

文献的关键词是文章的核心与精髓,是作者对文章主题的高度概括和凝练,有着很强的代表性。因此,对文章的关键词进行分析,频次高的关键词常被用来确定一个研究领域的热点问题。另外,从文章中提取的名词短语也可以在一定程度上代表某个学科领域的研究热点[9]。在CiteSpaceII软件界面,网络节点选择“Keyword”,并选定名词短语(nonm phrase)作为节点类型,其他策略不变,运行CiteSpaceII软件,得到由关键词和名词短语组成的云计算研究热点知识图谱,如图2所示,并提取相关高频热点词汇。如表2。

由图2和表2可以看出,出现频次最高的关键词是云计算(cloud computing),出现频次高达491次。云计算这一关键词表征云计算的理论研究,理论研究作为一个学科的基石,一直以来都是一个学科的研究核心,云计算也不例外。除cloud computing外,主要热点词汇还有管理(management)、虚拟化技术(virtualization)、系统(systems)、性能(performance)、网格计算(grid computing)、安全(security)、编程模型 MapReduce、设计(design)、建模(model)等。综合起来可以判断,国际云计算研究热点问题主要有以下方面:云计算的管理、云计算的虚拟化技术、云计算与网格计算、云计算的安全、云计算的编程模型MapReduce和云计算的性能等。(1)云计算的管理:云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用,如何有效地管理这些服务器,保证整个系统提供不间断的服务是巨大的挑战。(2)云计算的虚拟化技术:虚拟化技术是实现云计算的最重要的技术基础,虚拟化技术实现了物理资源的逻辑抽象和统一表示。通过虚拟化技术可以提高资源的利用率,并能够根据用户业务需求的变化,快速、灵活地进行资源部署。云计算实现包括服务器、存储、网络、应用等在内的全系统虚拟化,对所有资源进行统一管理、调配和监控,进而提高系统整体的灵活性并使之产生最大化的效益。(3)云计算与网格计算:网格计算是HPC发展到高级阶段的一种技术,云计算是HPC和网格计算技术在商业应用领域的最新发展,可以说云计算是网格计算的扩展和延伸,从云计算所必须具备的三个要素(瘦客户端、网格计算、效用计算)可以看出网格计算在云计算中起到的关键作用。(4)云计算的安全:在云计算时代,信息安全面临着更多的挑战和机会。云计算一方面面临着更多的安全威胁,需要云计算服务提供者和用户根据自身情况建立相应程度的信任并达成适宜的方案;另一方面云计算也可以集中安全相关资源,为用户提供更优质、更廉价、更全面的云安全服务。MapReduce是Google开发的Java、Python、C++编程模型,它是一种简化的分布式编程模型和高效的任务调度模型,用于大规模数据集(大于1TB)的并行运算,严格的编程模型使云计算环境下的编程十分简单。

图2 云计算研究热点知识谱图

表2 云计算研究高频热点词汇

四、云计算研究的跨学科属性

在CiteSpaceII软件界面内,网路节点选择Category(学科主题),其它策略不变,重新运行CiteSpaceII,绘制国际云计算研究领域的学科主题共现知识图谱(如图3),图中的圆圈代表节点,节点的出现频次代表所对应学科的发文数量,频次越高,节点越大,并提取相关高频学科信息。如表3。

图3 国际云计算研究的学科主题共现图谱

表3 云计算研究所属学科按被引频次≥20由高到低排序

结合图3和表3可以看出,云计算研究的主要学科领域按被引频次排序为:计算机科学、工程学、通信技术、图书馆情报学、生物技术和应用微生物学、生化研究方法学、管理学、运筹学与管理科学等。计算机科学、工程学和通信技术中的云计算研究主要集中在相关技术问题,比如虚拟化技术、网格计算、模型、管理和安全等。图书馆情报学中的云计算研究主要探讨云计算给图书馆带来的一些机遇和挑战,以及云计算技术结合数字图书馆的应用等;而生物技术和应用微生物学的云计算主要探讨有关云计算的高速计算能力、高存储量以及使用方便等特性在生物技术和应用微生物学领域的应用等。除此之外,我们可以看出云计算研究已经深入到物理学、数学、医疗信息学、自动化与控制系统等各个学科领域,是一门应用性和综合性非常强的学科。因此,加强学科之间的交流合作,充分利用各学科的学科优势,是未来云计算研究的发展方向。

五、云计算对高校的机遇与挑战

(一)云计算给高校带来的机遇

云计算将大大减少高校在软硬件等基础设施方面的一次性资金投入:云计算可以有效整合高校现有的数据与计算资源,或者选择性地将部分服务外包给专业云计算服务提供商,特别是对于一些常用办公软件、杀毒软件等,可选择云计算的服务模式以减少需要许可证的购买量。云计算能够促进高校教育信息资源共享,真正实现资源整合:云计算可将繁重的高校教育信息的存储与管理等工作外包出去,这样现有分散孤立的、本地化的网络信息平台将转变成为一个与具体IT基础设施无关的强大的统一的通用信息平台。云计算促进高等教育远程化,提供全天侯且高质量的教育服务:利用云计算技术,高校可以提供经济灵活的、定制可扩展的租用式教育服务,有利于提高高校信息化资源的利用率,为远程教育机构以及终端学生提供多种形式的、全天候的、高质量的服务。云计算能以较低的投入保证高校师生数据信息的可靠与安全:利用云计算技术,可通过购买服务(即云杀毒服务),而不是购买软件许可证的方式来实现校园内部的计算机病毒防控工作。

(二)云计算在高校应用中的挑战

云计算的应用能够很好地促进高校信息化建设的经济性、有效性、便捷性、安全性等,但仍然面临一定的挑战。

从云计算的技术层面来看,云计算的许多相关技术如资源虚拟化技术、针对海量数据的有效管理、密集计算的有效调度、数据及计算资源的安全保证等目前仍处于发展中。具体可以包括:以云计算模式提供的计算服务和数据存储服务的可用性;针对云存储数据的丢失、破坏等的安全防范技术;海量数据的传输瓶颈问题等。从云计算周边环境来看,高校对于云计算的认识还存在一定的局限,对于租用式服务以及托管业务数据等云使用方式还存在误区,特别是针对数据的安全性、服务的可靠性和收费的延续性等方面还有着很多疑虑。另外,云计算面临的最大挑战还包括相关立法的滞后性,云计算模式中软件的功用将通过大规模的计算能力和存储能力加以放大,软件不再是最主要的因素。传统针对软件类产品的版权保护模式已经不再适用,针对云计算模式的软件许可证等制度亟待出台。

[1]雷万云.云计算技术、平台及应用案例[M].北京:清华大学出版社,2011.7-8.

[2]李乔,郑啸.云计算研究现状综述[J].计算机科学,2011,(4):32-37.

[3]Chen C.CiteSpace II:Detecting and visualizing emerging trends and transiend patterns in scientific literature[J].Journal of the American Society for Information Science and Technology,2006,(3):359-377.

[4]邱刚,李军.主要国家云计算战略及启示[J].物联网技术,2012,(2):1-3.

[5]郎为民,等.中国云计算发展现状研究[J].电信快报,2011,(10):3-6.

[6]栾春娟,等,国际科技政策研究热点与前沿的可视化分析[J].科学学研究,2009,(2):240-243.

[7]雷保华.云计算解码技术架构和产业运营[M].北京:电子工业出版社,2010.231-232.

[8]雷万云,等.云计算企业信息化建设策略与实践[M].北京:清华大学出版社,2010.24-26.

[9]侯海燕,等.当代国际科学学研究热点演进趋势知识图谱[J].科研管理,2006,(3):90-96.

猜你喜欢
分布式计算虚拟化网格
用全等三角形破解网格题
反射的椭圆随机偏微分方程的网格逼近
基于OpenStack虚拟化网络管理平台的设计与实现
电子制作(2019年10期)2019-06-17 11:45:10
对基于Docker的虚拟化技术的几点探讨
电子制作(2018年14期)2018-08-21 01:38:20
虚拟化技术在计算机技术创造中的应用
电子测试(2017年11期)2017-12-15 08:57:56
重叠网格装配中的一种改进ADT搜索方法
基于云计算的移动学习平台设计与实现
软件导刊(2016年11期)2016-12-22 21:47:07
云计算中MapReduce分布式并行处理框架的研究与搭建
基于曲面展开的自由曲面网格划分
面向异构分布式计算环境的并行任务调度优化方法