基于共词聚类的能源互联网研究热点及发展脉络分析

2015-07-12 12:31刘春年
现代情报 2015年11期
关键词:能源矩阵文献

刘春年 陈 通

能源互联网是互联网和新能源技术相融合的全新的能源生态系统。能源互联网是一种在现有配电网基础上通过先进的电力电子技术和信息技术,将分布式可再生能源发电装置和分布式储能装置融合一起的一种新型高效的电网,它实现了能量和信息的双向流动,可以促进能源结构向生态方向转变,提高资源配置效率的一种能源生态系统[1]。在新能源科技迅猛发展的今天,各国都在积极探索发展经济和新产业的全新途径。互联网和能源网络的结合提供了一条高效便捷之路,作为互联网与新能源技术融合的产物,能源互联网已经受到学术各界的广泛关注,众多研究者在能源互联网方面做出了相关研究。为了探索出能源互联网的发展脉络及最新的发展动态,本文通过共词分析、聚类分析,引文编年分析等方式探索国内外能源互联网领域研究结构、研究方向及研究路线。

1 数据来源与研究方法

1.1 数据来源与预处理

本文数据主要来源于Web of Science(WOS) 数据库中的SCI-E、SSCI及CPIC-S 3个子库,其中检索策略为“主题=(energy) AND主题=(internet) ”,检索过程中设置时间为默认所有年份,共检索到文献记录2 635条。将记录导入查重软件NoteExpress中作预处理,通过剔除重复文献记录,最终得到有效文献2 427篇,关键词9 371个。接着进行关键词标准化操作,即将9 371个关键词中重复的词剔除 (包括同义词和相近词) ,由于都是外文文献,需要将英文大小写字母统一,例如将Energy替换为energy,将Cloud Computing替换为cloud computing等。前期规范化工作可以使分析准确率增加,数据处理工作效率得到提升。

1.2 研究方法与工具

本文主要的研究方法是共词分析、聚类分析及引文编年史分析。共词分析是一种比较新的文献计量方法,通过统计一组词同时出现在一篇文献中的次数,就可以看出这组词之间的亲疏关系[2]。聚类分析可以得到两个个体间的紧密联系的程度,是描述两个个案间对应程度的有效方法。引文编年史分析可以直观得到引文之间引与被引的关系,从而反映出文献之间的关联。本文主要用到的研究工具主要 有 NoteExpress、 BICOMB2、 SPSS19.0、 Histcite、 Excel等。通过NoteExpress进行文献查重处理、用BICOMB2生成词频统计和共现矩阵,将矩阵导出进行后续聚类分析及多维尺度分析。SPSS19.0用来做数据处理,实现聚类分析、多维尺度分析。EXCEL用于共词矩阵的转换,将共词矩阵转化为相似度矩阵,可以更准确的显示出关键词之间的关联关系。

2 数据处理

数据处理的步骤可分为以下两步:

(1) 词频统计。2 427篇文献中共统计得到6 725个关键词,不同关键词有不同词频,按照词频高低进行排序并编号,按照40%阈值确定高频关键词[3];

(2) 构建共现矩阵。两个关键词同时出现在同一篇文献中叫共词,统计这种情况的频次,可得到一个高频共词矩阵;矩阵中的数字仅仅代表着共词出现次数的绝对数字,因此用EXCEL宏工具箱,做相关系数转换,进而形成相似度矩阵,可以更好地揭示相互间关联程度。

2.1 高频词统计

在BICOMB2中进行词频统计,得到6 725个不重复的关键词,并给出每个关键词的词频及所占总频次的百分比,结合文献总数、关键词总数等条件,将阈值定为10,于是我们得到30个关键词及其频次 (如表1) 。

表1 高频关键词列表

2.2 共词矩阵

BICOMB2的共现矩阵功能可以直接统计出高频关键词共同出现在同一篇文献中的频次,词频阈值确定10,统计得出30×30矩阵,用EXCEL宏工具箱结合余弦指数,做相关系数转换,利用余弦指数可以计算出各高频词之间相互的关联度[4]。余弦指数计算公式为:

其中,Cij表示的是2个关键词共现频次,Ci表示关键词i词频,Cj表示关键词j词频,结合余弦指数计算公式和Excel宏工具箱把共现矩阵转化为相似度矩阵,结果如表2 所示。

表2 高频关键词相似度矩阵

3 数据分析

3.1 聚类分析

聚类分析是对研究样本或指标进行分类的一种多元统计方法。按照一批数据的个案情况或者按照变量的不同特征,可以对关系的远近程度做出分类[29]。本文主要采用Q型聚类,类与类之间距离的计算采用组内平均链锁法(Within-groups linkage) 。将高频关键词的相似度矩阵作为数据源输入,运用SPSS 19.0软件进行聚类分析,得到结果如图1。

图1 聚类树状图

3.1.1 聚类图结构分析

首先从宏观上观察聚类树图的结构。聚类树图中的最左边的一列标号 (Label) 和数字 (Number) 代表着高频关键词及其编号,本文采用凝聚聚类算法计算每两个关键词之间的相似程度,发现12号和22号关键词的相似性在所有主题词词对之间是最小的,因此,它们首先聚集成为一个类。随着后续关键词之间的距离拉大,最终所有词构成一个大类。通过树图的结构可以看出,所有的关键词从整体上可以分为5个部分:由12、22号词组成类别A,由20、29、2、30、27、24号主题词组成类别 B,由6、17、1、14、21、25号词组成类别C,由4、11、3、19、28、5、9、18号词组成类别D,由13、26、8、10、16、23、15、7号词组成类别E。

3.1.2 聚类图内容分析

主要是通过各个类别关键词之间语义关系的分析。首先要理解各个小类的含义,各个小类的语义不同,将这些不同语义的小类进行叠加可得到上一级大类的语义。具体而言,就是从小类中关系最近的两个关键词开始分析二者之间的语义关系,得到一组“元”概念,在“元”概念基础上,根据这个小类中其他关键词与该概念的距离,逐步添加关键词,这样一个类别的内容就得到了丰富[6]。

在类A中,Performance和Design组合在一起表明的是能源互联网的性能和设计体系;类B中Education、renewable energy、internet、monitoring、physical activity、obesity组合在一起主要表明能源互联网的一些研究领域包括能源互联网教育、可再生能源、能源互联网的监视控制、物理活动等;类 C中 cloud computing、date center、energy efficiency、green networking、QOS、future internet组合在一起主要表明能源互联网的一些研究方向包括云计算、能源效率、绿色网络、能源互联网服务质量、未来能源等;类D中 wireless sensor network、6LoWPAN、internet of things、RFID、energy harvesting、smart grid、security、sensors networks组合在一起主要表明能源互联网的关键技术体系和技术标准规范,包括无线传感网络、6LoWPAN、物联网、射频技术、能源获取智能电网、能源安全、传感等;类E中WSN、ZigBee、energy、loT、internet of things(IoT) 、energy saving、power consumption、energy consumption组合在一起主要表明能源互联网的研究目标,通过智能电网、分布式能源、云计算等技术,能源互联网为现实意义下能源可持续发展提供切实可行的道路。

3.2 多维尺度分析

为进一步探索能源互联网的研究方向,后续进行MDS分析。MDS(Multidimensional Scaling) 即多维尺度法,是一种多元统计方法,它通过样本在低维空间中的坐标分布来反映多个研究样本的特性与它们之间的相似程度[7]。每一个样本在空间分布图中都是一个点,两个点之间可以通过的距离远近来判断两个点之间的相似程度。以相似度矩阵作为SPSS多维尺度分析的输入,选择数据结构为Square symmetric,选择数据测度水平为Ordinal,选择尺度模型为欧几里德模型 (Eu-clidean Distance) ,对高频关键词进行多维尺度分析,得到结果如图2所示。

图2 多维尺度分析结果

从多维尺度分析图,再结合聚类分析的结果,把图中所有所列举高频关键词分成3块区域比较合理,每一块区域的关键词都表示出能源互联网研究的不同的领域的。

3.3 引文编年分析

能源互联网研究文献的引文编年,如图3所示,设置LCSCount为30。通过图中各节点的大小和箭头指向可以得出能源互联网研究中具有较高影响力的30篇文献受关注的程度及其相互之间的引用关系等信息。同时根据图左侧文献的发表时间可以得到重要文献发表的年份。图中的信息可以有效帮助后续研究者找出能源互联网研究领域的重要文献、研究热点和演进轨迹等,从而预测该研究未来的研究趋势[8]。

图3 能源互联网研究文献引文编年图

由图3可以看出,有关能源互联网研究,文献168具有开创性的地位,由Munir S等人发表在2002年《IEEEASME TRANSACTIONSON MECHATRONICS》期刊上,文献名为《Internet-based teleoperation using wave variables with prediction》,该文提出使用修改后的史密斯预测器,卡尔曼滤波器和一个能源监管工具来提高遥控机器人的性能,结果表明这种系统是稳定可行的[9]。文献224由Christensen KJ等人发表在2003年《PERFORMANCE AND CONTROL OF NEXT GENERATION COMMUNICATION NETWORKS》期刊上,文章通过对电脑电源管理的绩效评价,发现现存互联网消耗的弊端,指出新的电能管理方案会带来大规模的成本效益[10]。从图中可以看出清晰地看出有关能源互联网的研究文献有多个分支,映射出该研究主题涉及科学研究领域的广泛性。

对LSC值较大的研究文献排序得到以下序列:1198、905、255、908、915、330、1646、1614、556。编号 1198文献针对绿色网络提出两点方向,首先为下一代网络探索有关能源消耗的新视角,其次在新兴技术工程和在制品标准方面做详细的调查,为设计新一代技术机制和能源利用网络提供支撑[11]。编号905文献提出绿化互联网可以有效地减少网络的运营成本,减少温室气体排放区域。基于传统virtual-topology模型和交通梳理设计,从混合整数线性规划 (MILP) 模型出发,探索出一条可以有效减少IP在WDM网络的能源消耗的道路。仿真研究表明,该energy minimized设计可以显著降低IP在WDM网络的能量消耗、平衡每个网络节点的能耗[12]。编号255文献通过对网络接口、路由器、开关组件对网络协议的影响的讨论,提出需要对互联网协议进行更深层次的改变以实现节能的目标,避免能源短缺成为影响互联网全面发展的阻碍[13]。编号908文献提出一个基于网络的功耗模型,并使用这个模型来估计网络的能源消耗[14]。编号915文献发现电价的波动存在一定程度的变化,可以利用现有的分布式系统来利用这些变动,获取更好的效益[15]。编号330文献指出电源管理可以有效减少大型互联网不断增长的能源消耗,并举例子说明大学宿舍的电脑有大量的空间可以使用电源管理[16]。1646号文献引入一个有节能意识的分类设计空间,关注现有技术设备数据平面,为影响能源利用技术的网络设备提供一个新的分析框架[17]。1614号文献研究基于给定一个电信基础设施,如何在关掉网络节点和链接的同时保证完整的连通性和最大链路利用率[18]。556号文献通过建模框架评估潜在的电源管理方案,探讨如何降低峰值功率和能量使用,结果发现在更大的集群服务器中,电力和能源节约显得更为重要[19]。

结合研究文献具体内容,可以绘制出研究文献知识节点图谱分别如图4所示:

图4 知识节点图谱

以电源管理为中心的研究分支情况如下:1198号文献参考330文献从绿色网络的角度探索有关能源消耗的问题,为设计新一代能源技术机制和能源利用网络提供帮助。908号文献参考330文献提出一个基于网络的功耗模型,并使用这个模型来估计网络的能源消耗。1646号文献参考908号文献提出一个分析框架,能够对现有的能够影到响能源利用技术的网络设备提供分析。

以电力市场环境和建模框架为中心的研究分支情况如下:1308号文献参考915号文献,研究了在管制放松的电力市场环境下如何使得数据中心的风险最小化[20]。被1308号文献引用的556号文献通过建模框架评估潜在的电源管理方案,如何降低峰值功率和能量使用成为大集群服务器的关键问题所在。

根据以上分析可以看出,能源互联网研究的历年文献主要从功能结构、关键技术、效率评估、发展方向等方面展开研究,且从2002年之后,各重要节点文献逐渐出现。能源互联网研究的趋势是:从将互联网技术与能源体系相结合的思想开始,研究具体的信息技术 (云计算、大数据等) 在各层次能源互联网上的构建和应用,通过各种功耗模型对能源互联网效率和服务质量的评估,对能源互联网的发展方向提出预测和判断。随着研究层次的逐渐深入形成了诸如1646→908→330→224、1261←1646→1614→654、915←1308→824→556、1579→905→330等多条主要演进路线。

4 结果与讨论

从本文的计量分析结果我们可以看出目前关于能源互联网研究的经典文献很少。当前能源互联网的研究主要涉及能源互联网结构、关键技术、效率评估、未来方向等方面。能源互联网是一个多学科交叉的领域,其涉及材料科学、电子控制科学、计算机科学、经济管理科学等众多学科。

能源互联网研究的发展离不开信息技术、网络技术、电子技术的支撑,同时能源互联网的研究还涉及经济社会发展与大自然环境的协调,有利于社会的可持续发展。发展至今能源互联网研究进程主要发展如下:

(1) 萌芽阶段:该阶段主要对能源互联网所在能源领域展开了研究,如引文编年分析中的330号文献主要研究能源消耗的问题,虽然没有完全摆脱传统能源的范畴,但却开创了能源与互联网相结合的新时代。

(2) 起步及快速发展阶段:现在能源互联网也正处于起步阶段。在2015年1月召开的第五届智慧能源国际峰会,其副主题为“开启能源互联网新时代”,意味着2015年将作为能源互联网元年。能源互联网的关键技术、发展方向都有待于专家学者们的进一步研究。结合现有成果能源互联网研究主要包括以下几个方面:能源网络主体职能演进研究、能源互联网技术体系研究、能源的生产调度及传输控制研究、能源互联网信息获取和处理方面等。

能源互联网主体职能演进主要涉及生产模式的转变、传输模式的发展、智能能源消费方面等方面。文献1646指出可再生分布能源将逐渐扩散,大量虚拟电站将打破生产或消费单一的模式。文献1584提出生产模式将逐渐以可再生能源为主导的模式转变。文献1614指出能源互联网中可再生能源对生产的供应所占比例将逐渐增加,最终会形成全新的能源产销生态环境。该方面的研究涉及信息科学、环境科学、能源科学等多个学科,为能源互联网的理论创新及应用以及能源互联网的发展方向奠定了一定的基础,但在地理科学、气象科学的约束下,目前研究还不能满足大规模供电的需求,传统能源向新兴互联网能源过渡的格局还未最终形成。

能源互联网技术体系研究方面,为了满足能源互联网的需求,能源互联网构建起一套完整的由技术节点支撑的技术体系包括:系统规划技术、计算机通信网络技术、新能源技术、电子技术与控制科学以及管理调度技术。每一类技术又派生出一系列相应的技术特征。文献1638提出能源互联网是复杂的结构体系,要用系统思维去设计主要包括架构设计、接口设计、协议标准等。文献556指出现有能源技术例如分布式可再生能源为降低功耗、稳定供应和能源的合理使用提供了极具保障的技术支撑。文献1579指出信息通信技术在整个技术体系中处于中枢地位,一系列智能分布式、高性能的计算为能源合理调配提供了信息保障。文献1254研究了电子控制技术,该技术实现了真个系统传输过程的安全,基于生产的工业控制直接决定着系统的功能发挥。管理调度技术则涉及优化、机器学习、博弈论等方法是对整个系统网络管理、优化的重要工作。这一套完整的优化、纯属、调配、融合技术共同构成了能源互联网关键技术体系。但是在某些关键领域的技术研究还处于探索阶段、没有很多成熟的技术体系可以直接应用于生产之中。

能源的生产调度及传输控制研究方面主要是针对分布式能源的供应体系。文献1599提出了微网模式,指出微网可以兼顾能源生产单元及能源存储能源,灵活的实现能源互联。文献824指出应该从生产装备部署、存储装备设置及调度策略选择3个方面来研究多类型能源的利用问题。文献1600指出能源传输控制的目标是高效的应急响应能力,要从保障传输的可靠性及提高智能化控制水平方面作为突破口。现有研究存在一些瓶颈,不能满足业务需求,不能满足用户的能源需求,还有较大改进上升空间。

能源互联网信息获取和处理方面,主要涉及支撑能源互联网运行的重要信息及其获取效率。文献906提出借用物联网技术可以很好地提高信息采集及信息传输的效率。文献1262提出可以借用互联网P2P思维将电力系统中的能量调动过程实现网络化传输。文献654指出云计算可以更加高效的整合全网资源,并提供强大的计算能力,运用云计算来进行信息处理是可行的方式。除此之外,大数据技术所结合的数据挖掘也为挖掘有用信息提供了很好的技术支撑。目前相关的文献很少,缺乏系统的针对能源互联网领域应用的理论和方法。

从相关研究文献可以看出,能源互联网是一项异常庞杂的系统工程,杰里米·里夫金把它定义为人类的第三次工业革命,它的推进一定是需要所有参与方的共同努力和智慧奉献。对现有研究文献的分析我们可以看出,能源互联网的高速发展出了要在上述领域做出突破之外还需要一系列必备条件,至少包括以下几点:第一,政策引导支持。目前正在推广的分布式能源都还仅仅停留在单一的天然气分布式或光伏分布式电站层,政策引导上没有将二者很好的组织,导致目前市场各参与主体的没有积极性。第二,行业企业分工协作。能源互联网不只是天然气分布式和光伏分布式电站的结合,更是新兴能源与传统能源的循环发展。能源的多样性使得企业呈现出多样化的分布特征。庞大的能源互联网工程也必定会使得多样性的企业参与其中,而其中作为中通枢纽的就该是各层级电网公司,做好电网公司与其他行业企业的分工协作过程是能源互联网发展的基础环境因素。第三,互联网技术支持。能源互联网受到多种诸如大数据、云计算在内的信息技术的影响。从根本上来说,能源互联网就是能源和互联网如何完美地实现线下和线上的融合。第四,金融媒体支持与倡导。金融机构的支持将会为新产业的启动和高速发展提供强力的资金基石保障。媒体的正能量宣传对能源互联网概念的普及、亿万民众对未来时空的环保责任感和主动参与度的提升都会产生巨大的推动力。

[1]于慎航,孙莹.基于分布式可再生能源发电的能源互联网系统[J].电力自动化设备,2010,30(5) :104-108.

[2]崔雷,郑华川.关于从MEDLINE数据库中进行知识抽取和挖掘的研究进展[J].情报学报,2003,22(4) :425-433.

[3]钟伟金,李佳,杨兴菊.共词分析法研究 (三) ——共词聚类分析法的原理与特点[J].情报杂志,2008,(7) :118-120.

[4]邱均平,王曰芬.文献计量内容分析法[M].北京:国家图书馆出版社,2008:343.

[5]杨丹.SPSS宝典 (第3版) [M].北京:电子工业出版社,2013:316-332.

[6]崔雷,刘伟.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008,(8) :70-75.

[7]Borg I,Groenen P.Modern Multidimensional Scaling[M].New York:Springer,1997.

[8]刘春年,张曼.危机管理研究进程中信息管理发展脉络及基本特征[J].图书馆学研究,2014,(17) :7-15.

[9]Munir S,Book WJ.Internet- based teleoperation using wave variables with prediction[J].IEEE-Asme Transactions on Mechatronics,2002,7(2) :124 -133.

[10]Christensen KJ.The next frontier for communications networks:Power management[J].Performance and Control of Next Generation Communication Networks,2003,5244:1 -4.

[11]Bolla R,Bruschi R.Energy Efficiency in the Future Internet:A Survey of Existing Approaches and Trends in Energy-Aware Fixed Network Infrastructures[J].IEEE Communications Surveys and Tutorials,2011,13(2) :223 -244.

[12]Shen GX,Tucker RS.Energy- Minimized Design for IP Over WDM Networks[J].Journal of Optical Communications and Networking,2009,1(1) :176-186.

[13]Gupta M,Singh S.Greening of the Internet[J].Acm Sigcomm Computer Communication Review,2003,33(4) :19-26.

[14]Baliga J,Ayre R.Energy Consumption in Optical IP Networks[J].Journal of Lightwave Technology,2009,27(13) :2391 -2403.

[15]Qureshi A,Weber R.Cutting the Electric Bill for Internet-Scale Systems[J].Acm Sigcomm Computer Communication Review,2009,39(4) :123-134.

[16]Christensen KJ,Gunaratne C.The next frontier for communications networks:power management[J].Computer Communications,2004,27(18) :1758 -1770.

[17]Bolla R,Bruschi R.Cutting the energy bills of Internet Service Providers and telecoms through power management:An impact analysis[J].Computer Networks,2012,56(10) :2320 -2342.

[18]Chiaraviglio L,Mellia M.Minimizing ISP Network Energy Cost:Formulation and Solutions[J].IEEE -Acm Transactions on Networking,2012,20(2) :463 -476.

[19]Fan XB,Weber WD.Power Provisioning for a Warehouse-sized Computer,34th Annual International Symposium on Computer Architecture,Conference Proceedings,2007:13 -23.

[20]Rao L,Liu X.Hedging Against Uncertainty:A Tale of Internet Data Center Operations Under SmartGrid Environment[J].IEEE Transactions on Smart Grid,2011,2(3) :555-563.

猜你喜欢
能源矩阵文献
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
用完就没有的能源
————不可再生能源
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
福能源 缓慢直销路
The Role and Significant of Professional Ethics in Accounting and Auditing
初等行变换与初等列变换并用求逆矩阵
矩阵
矩阵
矩阵