徐敏锐,李 云,卢树峰,窦晓波,陈 刚,郭家豪
(1. 国网江苏省电力有限公司 营销服务中心,江苏 南京 210096;2. 东南大学 网络空间安全学院,江苏 南京 211189;3. 东南大学 电气工程学院,江苏 南京 210096)
电力设备(如气体绝缘金属封闭开关设备、电力电缆等)在长期运行过程中,其绝缘性能会逐步弱化,该过程中会发生不同模式的局部放电PD(Partial Discharge)[1],通过检测电力设备的局部放电模式可以判断电力设备的运行状态,这对于电力设备的运行维护具有重要的作用。
目前,已有方法通常是基于相位信息的局部放电PRPD(Phase Resolved Partial Discharge)谱图进行局部放电模式的识别。PRPD 谱图是局部放电数据的放电相位、放电幅值、放电次数的二维图像体现,可以直观反映局部放电情况。通过脉冲特征法、矩特征法、小波分析法等提取反映局部放电模式的数据特征[2],采用机器学习方法建立局部放电模式识别模型。比较常用机器学习方法有反向传播BP(Back Propagation)算法、支持向量机SVM(Support Vector Machine)、极限学习机、概率神经网络等。文献[3]首先提取PRPD 谱图中的统计特征,然后利用概率神经网络对统计特征进行分析;文献[4]基于PRPD谱图的统计特征组成不同的特征子集,通过概率神经网络算法剔除冗余特征,这2 种方法对局部放电类型的识别准确率约为90%。文献[5]利用计算得到的PRPD 谱图的相关参数(如灰度重心、矩特征参数等)识别局部放电模式。文献[6]通过提取的尖锐度、信息熵、稀疏度等特征识别局部放电模式。由于PRPD 谱图直观上以图像的形式呈现,文献[7]提取局部放电的时频分布图像特征,将其输入SVM中进行分类,但这种提取图像特征的方法需要人为进行各类变换,严重影响了局部放电模式识别的效率。近年来,图像识别技术越来越成熟,因此在图像分析领域中有显著效果的卷积神经网络(CNN)也被应用于局部放电模式的识别中。文献[8]采用CNN自动提取PRPD 谱图中的图像特征,并通过分类器进行分类,实现了对PRPD 谱图的图像识别。但是,单一PRPD 谱图的数据统计特征或图像特征都存在缺陷:相似图像的外形轮廓接近,将严重影响局部放电模式识别的准确率,此时利用数据统计特征可以修正单一利用相似图像进行局部放电模式识别的结果;对于非常接近的数据统计特征参数值,单一的分析很难准确识别出局部放电模式,引入图像分析可以很好地解决这个问题。因此,对PRPD 谱图的数据统计特征和图像特征进行融合分析,可以更好地识别局部放电模式。
D-S 证据组合规则是一种无需先验知识的不确定推理方法,常被用于数据融合领域。文献[9]将深度置信网络与D-S 证据组合规则结合,通过深度信念网络训练得到2 级变压器故障诊断模型,并采用D-S 证据组合规则融合2 级的诊断结果得到最终的诊断结果。文献[10]中通过D-S 证据组合规则将局部放电的灰度纹理特征、统计特征和油气特征进行两两融合后输入SVM 中进行训练,从而得到油纸绝缘老化评估模型。因此,D-S 证据组合规则适用于PRPD谱图的数据统计特征和图像特征的融合分析。但是D-S 证据组合规则在处理高度冲突或完全冲突的证据时,会产生与常理相悖的结果。
综上所述,本文提出了一种基于D-S 证据组合规则的双模型融合局部放电模式识别方法:提取典型的PRPD 谱图数据统计特征,采用BP 神经网络进行建模,剔除冗余特征,建立局部放电模式的BP 识别模型;按照放电次数将PRPD 谱图数据映射为灰度图,采用CNN 提取PRPD 谱图数据的图像特征,建立局部放电模型的CNN 识别模型;为综合PRPD 谱图的数据统计特征和图像特征分析的优势,采用基于信息熵改进的D-S 证据组合规则对2 个识别模型的输出结果进行融合,避免了常见的悖论问题,且该规则与贝叶斯概率论相比,需满足的条件更弱。
本文方法的整体流程如图1 所示。本文针对PRPD 谱图的统计数据分析和图像数据分析分别建立了BP 识别模型和CNN 识别模型,2 个模型的冲突性并不高,因此本文采用基于信息熵改进的D-S 证据组合规则对2 个模型的结果进行融合,最终得到局部放电模式判定模型(简称判定模型)。每个模型的输出为4 种局部放电模式,而每个模型针对每种放电模式的识别准确率各不相同,对2 个识别模型的输出结果进行融合可以修正单一模型的识别结果。
图1 基于D-S证据组合规则的双模型融合局部放电模式识别整体流程图Fig.1 Overall flowchart of PD pattern recognition based on double models fusion with D-S evidence combination rule
PRPD 谱图是基于放电脉冲的相位、幅值、次数建立的二维图像,其可以直观地反映局部放电情况。根据超宽带高频脉冲电流传感器HFCT(High Frequency Pulse Current Sensor)实测交联聚乙烯电缆局部放电数据[11],4 种局部放电模式的相位-幅值图见附录A 图A1。根据PRPD 谱图提取以下典型的统计特征参数。
1)偏斜度Sk:反映谱图正、负半周期(本文中将相位0°~180°作为正半周期,相位180°~360°作为负半周期)的放电次数和放电量的分布相对于正态分布的偏斜程度[12]。
式中:xi为二维谱图第i个相位小区间的相位中值;σ为半个周期内相位分布的标准差;μ为半个周期内放电相位的均值;N为相位正、负半周期内相位小区间的个数。
2)陡峭度Ku:反映谱图形状相对于正态分布的陡峭程度。
将上述统计特征依次存入数组中构成统计特征集{Sk,Ku,Qc}。
统计特征中存在的冗余信息会降低机器学习模型的局部放电模式识别准确率[13],剔除这些冗余信息尤为必要。由于本文提取的统计特征较少,因此首先将数组中的所有统计特征数据集作为输入进行机器学习训练,例如第1 次输入的统计特征集为{F1,F2,F3},然后再剔除其中一个统计特征进行机器学习训练(即选择的特征集为{F1,F2}、{F1,F3}或{F2,F3},下一次训练再剔除1 个统计特征,如果局部放电模式识别准确率不再变化,则选择识别准确率最高的统计特征组合作为机器学习的输入特征。BP 神经网络是机器学习中常用的一种结构简单的神经网络,其由输入层、隐藏层、输出层组成,采用全连接方式[14],具有较强的非线性能力、泛化能力、自学习能力和自适应能力,以及一定的容错能力,常用于解决分类问题和线性回归问题。本文利用BP 神经网络(隐藏层数为1,隐藏层含有10 个节点)建立BP 识别模型,通过不断地反馈更替权值矩阵和偏置矩阵来调整网络参数,当损失函数达到一定阈值时退出训练,完成模型建立。
PRPD谱图直观上也是一种图像,因此图像分析的方法同样适用于PRPD 谱图的图像数据分析。CNN 可以共享卷积核,适用于高维数据处理,同时,CNN 对数据具有位移、缩放、扭曲不变性,更有利于对图像数据的处理,因此在图像领域得到了广泛的应用。CNN 结构包括输入层、卷积层、池化层、全连接层、输出层[15],其中,卷积层、池化层通过不断地卷积与池化,得到最终的特征输入;全连接层连接着CNN 提取的特征输入与输出。本文建立的CNN 模型包含2 个卷积层、2 个池化层、1 个全连接层,全连接层采用的神经网络算法同BP神经网络,输出层采用式(4)所示的Sf函数输出最终结果。
式中:zj为第j个神经元的输出;K为神经元总数。
基于PRPD 谱图,以相位ψ为横轴数据、放电幅值q为纵轴数据、放电次数nd为像素点,构建二维图形输入。由于单个相位可能存在多个放电次数,因此取平均放电次数-nd作为像素点,根据最大放电次数ndmax将像素点的值映射到0~255 范围内,以便输入CNN 进行计算[16]。利用式(5)将PRPD 谱图图像数据映射为灰度图,结果如附录A图A2所示。
式中:G为灰度值。
识别框架θ可表示为包含n个元素的集合θ={A1,A2,…,An},在该识别框架下,如果存在一个函数m满足:
则m为该识别框架下的基本概率分配函数(也称为mass 函数),该函数反映在识别框架θ下对集合中的元素的支持程度。由mass 函数引出信任函数Bl和以及似然函数Pl分别如式(7)和式(8)所示。
本文中的θ有2 个子集,即2 个局部放电模式识别模型,其基本概率分配函数分别为m1、m2,其元素为各识别模型下对4 种局部放电模式(电晕放电、悬浮放电、内部放电、沿面放电)的识别准确率,分别为A1—A4和B1—B4,则融合后的结果如式(9)所示。
式中:m(A)为融合后的基本概率分配函数;k为冲突系数[17-18]。采用D-S 证据组合规则融合2 个识别模型得到的结果,可以更加准确地识别局部放电模式。
D-S 证据组合规则在处理高度冲突或完全冲突的证据时,会产生与常理相悖的结果,例如2 个识别模型在局部模式识别结果上的差别可能会引起误判。因此,需要对D-S 证据组合规则进行改进。目前针对D-S 证据组合规则的改进方法主要分为修改证据理论合成规则和修改证据源2 类。本文根据信息熵的大小赋给证据体相应的权重,以此来修改证据源,从而避免在融合高度冲突的数据时出现悖论问题。
信息熵反映了信息量的多少,证据体的信息熵越小,其所携带的有用信息越少,稳定性越高,在融合时所占的权重也就越大。信息熵H(X)的定义为:
式中:X为信息源;p(xi)为第i个信息xi出现的概率。
2 个识别模型对每种局部放电模式的识别准确率反映了测试集中该局部放电模式被正确识别的概率,即可看作是所携带的有用信息的概率。因此,可将2 个识别模型对每种局部放电模式的识别准确率作为信息概率值,计算出各个模型中证据体的信息熵。各模型中的证据体即为局部放电模式,依据证据体的信息熵占比设置证据体的权重wi,如式(12)所示。
式中:H(xi)为证据体的信息熵;n为证据体数量。根据证据体的权重修正证据源,得到修正后的结果如式(14)所示。
根据修正证据源后的结果,按照D-S 证据组合规则,对2 个识别模型的结果进行融合,从而得到判定模型。
根据BP、CNN 识别模型的局部放电模式识别结果,按照未改进和基于信息熵的改进D-S 证据组合规则得到的概率分配函数分别如式(15)和式(16)所示。
由式(16)可见,当某个识别模型能够更加准确地识别某种局部放电模式时,该局部放电模式的信息熵更小,其mass 函数的权重更大,则式(16)的分子增大、分母减小,所以式(16)的值增大。因此基于信息熵改进后的D-S 证据组合规则进行模型融合时,将更加信赖识别准确率高的模型。
本文采集了电晕放电、悬浮放电、内部放电、沿面放电这4种局部放电模式的数据,每种模式有100组样本数据,共400 组样本数据。为模拟实际情况并提高模型的泛化性能,在采集的数据中加入均值为0、标准差为5[19]的高斯噪声,以电晕放电数据为例,加入高斯噪声后的数据见附录B 图B1。在每种局部放电模式的每组样本数据中分别加入4 次高斯噪声,则可将4 种局部放电模式的数据样本数据扩充至6 400 组。对数据的分配见附录B 表B1。在训练模型时采用五折交叉验证法。
为便于叙述,下文的图表中将电晕放电、悬浮放电、内部放电、沿面放电分别记为模式1—4。根据2.2节中的统计特征筛选方法,为消除统计特征之间的冗余度,需提取易于分类的特征组合,具体流程为:将偏斜度Sk、陡峭度Ku,放电量因数Qc分别记为特征F1、F2、F3,4 种局部放电模式的特征参数如图2所 示;分 别 以 多 个 特 征 组 合{F1,F2,F3}、{F1,F2}、{F1,F3}、{F2,F3}以及单个特征F1、F2、F3建立BP 识别模型并进行训练,根据各特征组合作为输入时的损失函数值择优选择特征组合。传统的BP 神经网络收敛速度慢,容易陷入局部最小值。因此,本文采用小批量梯度下降法训练BP神经网络,同时加入自适应学习率。BP 识别模型采用归一化指数函数作为激活函数,采用均方误差函数作为损失函数,采用梯度下降算法作为优化策略,每批次设置输入量为10。BP识别模型训练过程如图3所示。根据训练结果可知,选择特征组合{F1,F3}作为输入可以消除{F1,F2,F3}中的统计特征间的冗余度。按照前文的参数设置,建立以{F1,F3}为特征输入的BP 识别模型并进行训练。
图2 4种局部放电模式的统计特征参数Fig.2 Statistical characteristic parameters of four PD modes
图3 不同统计特征组合下的BP识别模型训练过程Fig.3 Training process of BP recognition model under different statistical characteristic combinations
CNN识别模型采用归一化指数函数作为激活函数,采用交叉熵作为损失函数,采用自适应梯度算法作为优化策略,每批次设置输入量为10。根据6400组样本数据以及附录B 表B1 所示的分配方式训练CNN 识别模型。CNN 识别模型在训练过程中的损失函数值如图4所示。当CNN 识别模型保持稳定且损失函数值达到阈值时即完成训练。
图4 CNN识别模型在训练过程中的损失函数值Fig.4 Loss function value of CNN recognition model during training process
利用BP 识别模型和CNN 识别模型检测测试样本,结果如表1所示。
表1 BP和CNN识别模型的测试准确率Table 1 Test accuracy of BP and CNN recognition models
根据4.2 节中的方法计算BP、CNN 识别模型中各类局部放电模式的权重。以BP识别模型为例,根据BP识别模型的局部放电模式识别准确率,可获得BP 模型下电晕放电、悬浮放电、内部放电、沿面放电模式的信息熵分别为0.162、0.175、0.143、0.153,从而计算得到各局部放电模式的权重见附录B 表B2。得到各局部放电模式的权重后,对BP、CNN 识别模型输出的结果进行融合,得到最终的判定模型。
局部放电测试样本识别流程为:对每种局部放电模式测试样本分别采用BP、CNN 识别模型进行模式识别,按照(BP 识别模型识别结果,CNN 识别模型识别结果)的方式记录模型输出结果,例如(1,3)表示BP、CNN 识别模型输出的结果分别为电晕放电、内部放电模式。2 个识别模型对各类局部放电测试样本的识别结果如表2所示。
表2 BP和CNN识别模型对各类局部放电测试样本的识别结果Table 2 Recognition results of various PD test samples by BP and CNN recognition models
利用未改进的D-S 证据组合规则融合BP、CNN识别模型的识别结果时,计算得到的基本概率分配函数值如表3所示。D-S证据组合规则中,基本概率分配函数值越大的证据,其可靠性越大。例如在对电晕放电和内部放电测试样本进行识别时,均输出了结果(1,3)(如表3 中下划线所示),但是电晕放电模式对应的基本概率分配函数值更大,因此最终判定结果为电晕放电模式。
表3 基于未改进的D-S证据组合规则进行模型融合后的mass函数值Table 3 Values of mass function after model fusion with original D-S evidence combination
根据基于信息熵改进的D-S 证据组合规则融合BP和CNN识别模型的输出结果后,计算得到的基本概率分配函数值如表4 所示,双模型融合后的判定模型输出的结果如表5 所示。可见,经过信息熵改进的D-S 证据组合规则在进行模型融合时,将输出(1,3)对应的识别结果判定为内部放电模式,从而解决了未改进的D-S 证据组合规则在模型融合时存在的悖论问题。利用该判定模型对测试样本进行检测,结果如表6所示。
表4 基于改进的D-S证据组合规则进行模型融合后的mass函数值Table 4 Values of mass function after model fusion with improved D-S evidence combination
表5 基于改进的D-S证据组合规则进行模型融合后的判定结果Table 5 Decision results after model fusion with improved D-S evidence combination
表6 基于改进的D-S证据组合规则进行模型融合后的模型测试结果Table 6 Test results after model fusion with improved D-S evidence combination
利用式(17)所示的召回率Rrecall反映识别模型的稳定性,结果如图5 所示。召回率越大,模型越稳定。由图5可知,采用基于信息熵改进的D-S证据组合规则进行双模型融合后,可以修正单一模型识别的结果,对局部放电模型的识别更加稳定、准确。
图5 各模型的召回率Fig.5 Recall rate of each model
式中:TP、FN分别为某种放电模式被预测正确、错误的个数。
本文提取了2 种不同类别的PRPD 谱图数据特征,分别采用BP 神经网络和CNN 建立局部放电模式识别模型,通过基于信息熵改进的D-S 证据组合规则对2种识别模型进行融合,解决了D-S证据组合规则常见的悖论问题,能够更加全面地包含PRPD谱图数据反映的局部放电类型的特征。实验结果表明,本文方法的识别结果更加稳定、准确。本文工作为局部放电模式识别提供了可借鉴的方法,今后将在电力设备运行状态评估及设备运维等方面做进一步研究。
附录见本刊网络版(http://www.epae.cn)。