杜凤青 程 凡 李 永
(1.国网上海市电力公司电力科学研究院,上海 200092;2.上海久隆企业管理咨询有限公司,上海 200072)
放眼全球科技创新的发展,科研工作呈现出从单项技术创新向以产品和产业为中心的技术集群创新转变的趋势,不同技术紧密连接、学科领域交叉渗透。在能源电力领域,随着全球能源互联网理念的提出及发展,电力企业的业务活动和经营模式呈现出前所未有的跨界特征,传统电力产业链发-输-配-售电的相关技术与大数据、云计算、信息通信、物联网等新兴技术不断融合,并在广度和深度上呈现出进一步增强的态势。展望未来,电力企业科技创新所面向的技术范围和类别将发生根本性变化,有效识别新兴技术门类、形成适应能源互联网的技术体系,是科技创新工作的基础和前提。
目前,现有的能源电力技术体系框架存在技术领域覆盖不全面、新兴技术方向缺失等问题,已经无法全面、科学展示能源互联网的技术脉络,不能满足科技创新布局及项目管理的需要。
本文通过对学科演化及技术预见等先进理论和实践的研究,基于当前能源互联网技术领域识别及分类现状,提出基于文献计量法的能源互联网技术领域分类方法,揭示能源互联网技术结构,研究热点和发展趋势。
文献计量法是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,通过对科学技术活动的代表文献情报进行计量分析,研究其分布结构、数量关系、变化规律和定量管理,遴选前沿研究领域、研究项目和技术目标,进而探讨科学技术结构、特征和规律的一门学科。本文采用文献计量法中最为常用的作者共被引分析和共词分析对文献进行计量分析,以此来探讨能源互联网领域结构分布情况。
共被引分析由于高被引文献的形成需要较长时间,而新兴学科的研究往往人数众多、作品比较分散、被引用情况不稳定,因此,往往不能反映新文献所代表的研究主题,从而更适合研究成熟学科的研究范式。共词分析的研究对象是词或词组,通过分析词与词之间的亲疏关系,推断学科的研究热点或研究范式,由于高频词往往反映的是热点,所以更适合研究新学科的研究范式或成熟学科的研究热点。
本研究所用数据来源于国网上海市电力公司科技创新智慧平台,即中国知网(CNKI)中国学术期刊全文数据库中与电力技术有关期刊,时间跨度为1912 年至2020 年。
作者共被引分析以文献作者为基本单元,众多学者按照被引证关系聚集成学科学术群体网络,呈现出学科专业研究人员之间的联系与结构特点,反映学科专业之间的联系及其发展变化趋势与规律。由于高被引文献的形成需要较长的时间,因此,本文通过共被引分析研究的是能源互联网相对成熟的技术领域[1]。
2.1.1 作者共被引频次分析
首先,用BibExcel 软件对数据进行被引频次统计分析,筛选出电力技术领域被引频次排名前100 位的学者,作为能源互联网技术研究领域的代表人物。其次,对100位学者构建学者共被引频次矩阵,用数字编号代替学者姓名,以方便数据获取、分析。最后,将作者共被引频次矩阵转化为皮尔逊相关系数矩阵,并对其进行标准化处理,消除由学者被引频次数量差距和文献引用特性不同而造成的影响,使后续多元统计分析结果得到合理解释。
2.1.2 因子分析
对皮尔逊相关系数矩阵进行主成分分析,原有的100 个变量,在第30 个主成分时累计贡献率达到90.05%,即这30 个主成分能解释原有变量90%的信息,具有一定的群体代表性,可以把这30 个主成分所代表的30 个学术群体作为能源互联网技术研究历程中最有影响力的主流学术群体。
2.1.3 聚类分析
上述分析是基于高被引频次的计量分析,可能存在主成分划分过细的问题,需要通过聚类分析进一步对学术群体进行分析和验证。对皮尔逊相关系数矩阵进行系统自下而上的层次聚类分析,参照主成分分析得出的综合因子数目进行聚类,使用Average-Linkage 聚类法获得电力技术领域高被引频次前100 位学者聚类树状图。
2.1.4 结果分析
通过探究聚类树状图1,可以将能源互联网成熟的技术领域结构划分为8 个研究领域,分别对应八大学术群体。
图1 能源互联网成熟技术八大研究领域及对应学术群体
由于能源互联网技术领域学者的学术视野比较宽阔、研究领域比较宽泛,所以通过因子分析和聚类分析所划分的学术群体会出现技术领域交叉的情况,因此,由此划分的学术群体仅体现某领域学者间学术联系密切程度,并不代表学者的研究仅限于此领域。
通过作者共被引分析研究了能源互联网成熟技术领域结构,构建了能源互联网技术领域基础架构。下面利用共词分析开展期刊高频关键词的共现分析,以此对共被引分析得出的技术领域分类进行验证和补充,同时揭示能源互联网技术的交叉领域、新兴技术,追踪研究热点和趋势[2]。
2.2.1 高频关键词选定
作为一篇文章核心内容的缩影,关键词是作者学术思想与学术观点的凝练体现,可以代表该文章或作者的研究重点。本部分选择2015—2020 年CNKI 数据库SCI 和EI 期刊中与电力相关的文献作为数据来源。经过两轮去除、合并、简化处理,共得到13542 个关键词。
受文章研究广度限制,无法对全部样本进行分析,需要选取一定范围的高频词作为代表。为确保关键词能代表研究热点和趋势,综合考虑样本大小、关键词频数总体变化情况及实际研究状况,位于前166 位的关键词(频次≥10)词频数累计达到42%,可以认为其基本能够表征能源互联网技术领域的主要研究问题和研究热点。
2.2.2 共词聚类分析
应用BibExcel 软件构建166 个高频关键词的共词矩阵。对其进行系统自下而上的层次聚类分析,使用Average-Linkage 聚类法生成166 个关键词的聚类树状图,可以将近5 年能源互联网技术领域结构划分为40 个研究领域分支。剖析树状图发现,每个聚类中都包含了传统统计学算法和现代人工智能算法,说明近5 年能源互联网各个技术领域的研究都交叉融合了各类模型算法,如遗传算法、有限元法、聚类分析、粒子群算法、潮流计算等,表明这是当前能源互联网技术的研究热点和趋势。
为了更加清晰地透视能源互联网核心技术的研究热点和趋势,将诸如主成分分析、神经网络、聚类分析、差分进化等算法剔除后,得到111 个高频关键词,再次构建共现矩阵、进行聚类分析。
2.2.3 结果分析
在能源互联网技术领域,通过共词分析得到4 个新技术领域及其研究热点和趋势,如图2 所示。
图2 能源互联网新技术领域及其研究热点和趋势(基于共词分析)
同时,对作者共被引分析得到的能源互联网技术基本框架进行补充,丰富各个技术领域的子技术方向、研究热点和趋势如图3 所示。
图3 能源互联网新技术领域及其研究热点和趋势(基于作者共被引分析)
本文提出了基于文献计量法的能源互联网技术领域分类方法,设计了能源互联网技术分类模型。运用作者共被引分析、共词分析构建了能源互联网技术体系,梳理了能源互联网技术12 大技术领域和若干技术方向,揭示了能源电力领域新兴技术,追踪了热点技术方向和趋势。
由于数据运算能力的限制,本文对能源互联网技术领域的分类和能源互联网前沿细分技术的挖掘仍存在不足,部分最前沿技术、新兴研究领域可能未被发现。后续,可针对未来技术的可能性、可行性、技术合作与竞争对手、未来技术优先发展领域等进行全面判断,为能源互联网技术领域布局提供科学依据和参考。