任曦骏,潘 东,张 理,宋竹萌,聂元弘,张 龙,马美玲,韩 冬
(1.国网安徽省电力有限公司经济技术研究院,安徽 合肥 230022;2.上海理工大学电气工程系,上海 200093)
颠覆性技术指对现有技术具有颠覆性、非对称性,对经济社会发展产生重大影响的新技术,是新产业发展的重要推动力量[1]。随着“碳达峰”“碳中和”目标的提出,若能源电力系统要实现低碳转型[2],通信系统作为其重要的技术支撑,应不断增强设备可靠性,以确保电力通信高质量接入。同时,合理利用电力通信新技术可以提高供电稳定性,促进电力系统可持续发展[3]。目前,颠覆性技术识别方法众多。VOJAK B A基于历史研究案例,提出了利用技术路线图识别潜在颠覆性技术的方法[4]。TELLIS G J通过组织相关技术领域专家和市场管理者,确定目标技术的创新点和特性,分析其市场价值并与目前的市场技术进行比较,进而判断其成为颠覆性技术的可能性[5]。SUN J等运用创新问题解决理论构建模型,从技术成熟度、技术成套化等方面对技术进行前景预测,判断其成为颠覆性技术的可能性[6]。CARLSEN H采用跨学科专家组评价制度,通过情景分析法组织趋同研讨会,以进行颠覆性技术的识别研究[7]。白光祖采用核心专利、核心论文及其引文,进行颠覆性技术预见方法验证[8]。但是上述方法在应用于具体专业领域的技术识别时,通常存在主观性及局限性。
电力通信作为电力系统的重要组成部分,在新形势下更要积极实现有效的创新与变革。通过引入先进的网络技术,可促进电力通信质量的不断提升,为电力系统的安全运行提供有效支撑。为了评估先进技术带来的显著影响,本文提出了基于专利演化分析的颠覆性技术识别方法。该方法不仅对比了专利新技术与当前已有技术的差异,还考虑了专利新技术未来的研究方向和受关注的趋势变化,实现了对目标技术专利发展的度量分析。本文结合专利新技术的特征,构建颠覆性技术识别指标体系,从而完成对电力通信领域颠覆性技术的有效判别,进而更好地把握关键技术和高效地完成产业升级转型。
本文基于专利演化分析的颠覆性技术识别流程主要包括:专利数据获取及预处理、计算专利数据的演化矩阵及相关指标值和颠覆性技术判别。具体识别流程包含:①从专利数据库中获取相关技术领域的专利文本数据集,并对专利文本数据进行预处理,得到基于时间序列和基于被引频次排序的原始专利文本数据集;②构建颠覆性技术识别指标体系;③采用余弦相似度[9]计算两两专利间的摘要文本相似度,构建专利相似度矩阵,并根据新颖度与相似度的关系得到专利新颖性矩阵,以专利公开时间为断点逐个计算各时间区域内的专利新颖性,构建专利演化矩阵;④根据建立的颠覆性技术识别指标体系,确定每条专利的指标值;⑤对识别出的技术进行颠覆性判别与未来发展分析。
为了获取科学有效的目标领域专利数据集,本文从中国知网专利数据库中选取了与电力系统有关的专利作为目标领域数据源。中国知网专利库包括中国专利和海外专利。其从1970年至今共收录1.4余亿项专利。专利检索需提取专利名称、专利摘要、专利号、专利权利要求、专利说明书、发明人、专利权人、专利申请日期、专利公开日期等标准化检索信息。本文的专利检索日期截至2022年11月1日。本文对获取的专利按照公开年份进行排序。整理得到的电力系统领域授权发明专利年度分布如图1所示。
图1 电力系统领域授权发明专利年度分布
专利检索结果包含55 241条电力系统领域的专利记录。由图1可知:电力系统领域专利自1986年被授权发表,随后到2001年处于发展潜伏期。这个阶段相关领域的专利技术很少甚至在有些年份并没有相关技术的产出。从2001年开始,电力系统领域进入萌芽期,年度授权专利数稳步上升,该领域技术得到了研究人员的关注。近几年,电力系统领域年度授权专利数正处于快速增长的状态,并且呈现出不断上升的发展趋势。这说明电力系统领域的技术研发与应用非常活跃,处于上升成长期且具有良好的发展潜能。
1.2.1 专利相似度矩阵
在进行新颖性矩阵计算之前,需要通过相似性计算来判断目前是否已有相似的技术出现在相关的专利中,而余弦相似度在不同的语料库中具有很好的性能。因此,本文采用余弦相似度来进行专利相似度计算。专利相似度矩阵的构建包括相似度计算和矩阵建立。具体流程如下。
(1)专利相似度计算。
①采用Python对专利数据进行预处理,以专利公开时间为排序,得到基于时间序列的专利数据集。
②采用调频-逆文档频率(term frequency-inverse document frequency,TF-IDF)[10]算法找出每篇专利的关键词,以构建专利的关键词矩阵集。
③分别构建每篇专利各自的词频向量,以计算文字向量间的相似度。专利相似度的值处于0~1之间。值越大,表明两两专利的相似性越高。
假设一个n维空间中的两个数据点分别为X=(x1,x2,…,xn)和Y=(y1,y2,…,yn),则X和Y的余弦相似度计算式为:
(1)
式中:S(X,Y)为X和Y这两个数据点的相似度;xi和yi分别为这两个数据点内的关键词,i为专利编号。
(2)处理后得到的专利文本数据集与TF-IDF模型和余弦相似度相结合,可以建立专利文本的相似度矩阵。专利相似度矩阵构建的主要过程如下。
①使用TF-IDF算法对经过预处理的专利文本数据集进行关键词计算,提取每条专利文本数据的关键词列表P={w1,w2,…,wn}。通过专利文档中各关键词的TF-IDF值,可以构建一个行为专利文档数并将其列为关键词共现矩阵Dp={P1,P2,…,Pn}。
②采用词向量模型,对每条专利文本P={w1,w2,…,wn}进行处理,并根据处理后的词序构建每条专利文本的词向量Vp={v1,v2,…,vn}。所有专利文本向量构成专利文本向量集Dv={v′1,v′2,…,v′n}。
③根据余弦相似度计算式,计算专利文本向量集中两两向量之间的相似度S(Vi,Vj)。
④根据余弦相似度的计算结果建立n×n维的专利文本相似度矩阵Ds=(dij)i,j=1,2,…,n。相似度矩阵中的每个元素d(i,j)为两两矩阵的相似度计算值。
(2)
构建的n×n维专利文本相似度矩阵形式为:
(3)
1.2.2 专利新颖度矩阵
通过对两个专利集合中的发明技术的相似度计算,可间接获得专利新颖度矩阵[11]。一项专利与先前专利的最大相似性可看作是“旧”。新颖性指一项专利在最大相似性方面与之前专利不相似的特有部分。
本文在计算专利文本相似度后,通过从一个专利中减去该专利与其他已公开专利之间的最大相似性,来计算该专利在出版时与先前出版专利不相似的特有部分的比例,即专利文本公开时的新颖性。因此,专利新颖性在公开时的计算式为:
Npub=1-M
(4)
式中:Npub为专利在公开时的新颖性;M为Pn在Pi之前公开的专利相似度的最大值,n
将n个专利文本间的新颖性系数按时间序列排列,则所构建的n×n维专利文本新颖性矩阵DNOV为:
(5)
1.2.3 专利演化矩阵
本小节计算专利新颖性随时间的演化过程。由于专利新颖性是随着时间演变的,因此本小节在专利相似度矩阵(3)和专利新颖性矩阵(5)的基础上,以专利公开年份为时间切片,对专利技术的新颖性演化情况进行分析。专利Pi在年份y的新颖性N(i,y)为:
(6)
若专利Pi在y时并未公开发表,则N(i,y)计算结果为空值。
对每个专利N(i,y)以公开年份为时间序列进行排序整合,可构建专利文本新颖性演化矩阵DNOV(pi,yn):
(7)
颠覆性技术判别指标体系的建立是本文研究颠覆性技术的重要任务。合理、有效的指标体系不仅有利于获得高效的评价结果,也对探究颠覆性技术发展的本质有着重要影响。本文从专利演化角度和颠覆性技术的特征对颠覆性技术进行识别和度量。相对于其他技术,颠覆性技术具有新颖性高、发展势头强劲且影响力大的特点。因此,根据颠覆性技术的特征,本文以激进的新颖性、相对快速的增长性和突出的影响性[12]为识别指标,实现对相关技术的有效识别与判断。本文建立的颠覆性技术判别指标体系如表1所示。
表1 颠覆性技术判别指标体系
表1中,对识别体系内激进的新颖性、相对快速的增长性和突出的影响性所提出的针对性的判别标准如下。
①颠覆性技术激进的新颖性。从时间维度上看,一项技术出现的早期阶段应该是新颖的。在颠覆性过程中,新颖性和增长性在前期表现突出,随时间的增长而减弱。本文采用专利在公开时具有高新颖性,并且在发展过程中发生新颖性演化来表征颠覆性技术激进的新颖性。因此,本文将描述专利的新颖性定义为:若Npub小于0.5,则新颖性弱;若Npub处于0.5~0.8,则新颖性适中;若Npub大于0.8,则新颖性强。
②颠覆性技术相对快速的增长性。相对快速的增长性由相似技术年均增长来表征。相对快速的增长性是与相同领域中其他技术相比时,颠覆性技术的发展速度往往更快。本文通过构建的专利相似度矩阵,识别出专利自公开后每年的相似技术专利数,以相似技术的年均增长来表示颠覆性技术的增长性。年均增长越大,说明颠覆性技术相对于其他技术发展速度越快。
③颠覆性技术突出的影响性。突出的影响性由专利被引频次来表征。专利的被引频次越高,表示受其影响的后续技术越多,则专利涵盖的技术就越重要。本文采用专利占公开年份内所有专利被引频次的前10%来表征颠覆性技术突出的影响性。
电力通信领域授权发明专利的年度分布如图2所示。
图2 电力通信领域授权发明专利的年度分布
本文从中国知网专利数据库与电力系统有关的专利中提取电力通信领域的相关专利。本文检索截至2022年11月1日的相关发明专利和实用新型专利,并对获取的数据按照公开年份进行排序。
经过预处理后得到的电力通信领域的专利文本数据集,首先利用TF-IDF算法提取专利文档中的关键词,构建一个行为文档数,并将其列为关键字数的专利关键词共现矩阵,以生成专利文本的词频向量;接着结合余弦相似度,计算出两两专利的相似度;最后得到专利文本相似度对称矩阵(381×381)。专利相似度矩阵结果示例(部分)如表2所示。
表2 专利相似度矩阵结果示例(部分)
表2中的计算结果表示每个专利间的相似度值。专利相似度处于0~1之间。值越大,表明两两专利相似度越高。
在本文中,专利新颖性由专利相似性转化而来,如式(4)所示。在计算专利文本相似度后,通过从一个专利中减去该专利与其他已出版专利之间的最大相似性,来计算该专利在出版时与先前出版专利不相似的特有部分的比例,即专利文本公开时的新颖性。为了研究专利在公开发表后的新颖性变化过程,可以将专利数据集中每个专利的公开日期看作一个时间点,并通过新颖性计算式得到电力通信领域专利文本的新颖性矩阵。专利新颖性矩阵结果示例(部分)如表3所示。
表3 专利新颖性矩阵结果示例(部分)
表3中的计算结果表示每个专利间的新颖值。
为了客观呈现颠覆性技术领域专利新颖性的演化,本文利用基于时间切片的专利相似矩阵,以专利公开年份为时间切片,计算从公开年开始专利逐年的新颖性变化,以构建专利演化矩阵。专利演化矩阵结果示例(部分)如表4所示。
表4 专利演化矩阵结果示例(部分)
表4中,计算结果表示每个专利间的新颖值。通过计算可得Npub={1,1,0.806,0.84,1,0.164,…,1}。Npub表示专利在公开时的新颖性。Npub中的元素与专利号相对应。从表4中可以看到每项专利自公开年的新颖性演变趋势。大部分专利在公开时具有高新颖性。例如专利1在2002年新颖值为1,随着时间演变,该专利在2022年新颖值降为0.897。其主要原因在于,随着时间的发展,相关热点研究领域会出现相同或相似的发明专利,使原有专利的新颖性降低。
根据第1节、第2节基于颠覆性技术特征与属性构建的颠覆性技术识别指标体系以及相关专利的被引频次排序,可以得到电力通信技术领域的相关专利指标。电力通信领域专利相关指标值(部分)如表5所示。
表5 电力通信领域专利相关指标值(部分)
根据表5可以得出以下结论。
①从激进的新颖性角度来看,电力通信领域367号(CN115314270A)专利技术发表于2022年,在公开发表时具有高新颖性(新颖值为0.973)。这项技术在公开发表时属于高新颖性专利技术,并且在发展过程中技术新颖性呈降低趋势。其具有良好的发展潜力,与电力通信领域其他技术相比具有激进的新颖性。
②从相对快速的增长性来看,电力通信领域367号(CN115314270A)专利技术的相似技术年均增长为14,且在刚发布后较短的时间内便有较多相似的专利。这说明该专利所涉及的技术处于快速增长的状态。这项技术与其他技术相比增长速度更快、发展势头更强劲,与电力通信领域其他技术相比更具相对快速的增长性。
③从突出的影响性来看,电力通信领域367号(CN115314270A)专利技术的被引频次在电力通信领域排前10%。在发表后短时间里,这项技术得到了该领域技术专利的高度引用,可以看出这项技术具有突出的影响性。
根据本文构建的颠覆性技术的识别指标体系,电力通信领域367号(CN115314270A)专利技术与其他技术相比,在颠覆性技术的新颖性、增长性以及影响性这三个判别指标都表现十分良好,呈现出明显的颠覆性技术特征。因此,根据本文构建的识别指标体系,判定这项专利技术为电力通信领域的颠覆性技术,并通过专利号检索出这项专利技术为基于量子密钥的电力业务分级加密方法及通信方法。此专利主要将量子技术应用于电力通信领域,在保障数据安全的前提下提高加密效率和量子密钥的使用效率,从而提高电力业务通信效率、确保电力业务可以安全顺畅地执行,并降低电力业务通信成本。
3.1节通过专利演化分析方法,识别出量子技术为电力通信领域的颠覆性技术之一。量子技术在保障数据安全的前提下,不仅可以提高电力业务通信效率、确保电力业务可以安全、顺畅地执行,而且大幅降低了电力业务通信成本。随着量子科学在量子计算、量子通信、量子网络、量子仿真等领域不断实现新突破,量子技术革命受到越来越多的关注。量子技术催生的技术变革和装备发展不断改变世界面貌,逐步成为经济社会跨越发展的基石和动力,为信息化社会的发展提供基础的安全服务和可靠的安全保障。
本文提出基于专利演化分析的颠覆性技术识别方法,并以电力通信领域为例进行研究分析。结合颠覆性技术的判别指标体系,本文完成了以下工作:①实现了对电力通信领域中颠覆性技术的有效识别;②对上述颠覆性技术的未来发展进行分析,从而实现对关键技术的重点把握,进而更快完成产业转型升级。但本文还存在一些不足之处。后续工作将会对专利相似度计算过程进行优化,从而构建更加全面、多维度的识别指标,以进一步完善颠覆性技术识别体系。