基于KELM-VPMCD方法的未知局部放电类型的模式识别

2018-05-16 10:27高佳程曹雁庆朱永利贾亚飞
电力自动化设备 2018年5期
关键词:模式识别训练样本特征值

高佳程,曹雁庆,朱永利,贾亚飞

(1. 华北电力大学 新能源电力系统国家重点实验室,河北 保定 071003;2. 国电电力发展股份有限公司,北京 100101)

0 引言

电网中电气一次设备绝缘性能的优劣直接影响到整个电网的安全运行。局部放电PD(Partial Discharge)是电气一次设备内部绝缘劣化的重要征兆和主要表现形式[1]。电力设备内部绝缘劣化的机理不同,引起的局部放电类型也不同,而不同的局部放电类型对设备绝缘造成的损害程度不同。因此,进行局部放电类型的模式识别已经成为了一次设备状态评估方面的重要组成部分[2]。

分类器的设计是模式识别工作中的重要环节。在局部放电的模式识别中,常用的分类方法主要有[3-6]:神经网络ANN(Artificial Neural Network)、支持向量机SVM(Support Vector Machine)、模糊聚类FC(Fuzzy Cluster)和贝叶斯分类BC(Bayesian Classifier)等,这些方法在工程中都取得了良好的分类效果,但并不能识别出未包含在已有的局部放电类型训练样本库中的局部放电类型。即对于那些不属于局部放电类型训练样本库中任何一种已知放电类型的局部放电,现有分类方法无法进行正确归类。而在实际的工程应用中,由于电力设备复杂、故障多样,已有的局部放电类型训练样本库中不可能包含所有局部放电类型,必然存在一定的疏漏,而构建绝对完备的样本库工作量巨大,并不可行。因此,如何识别这些未知类型的局部放电样本是局部放电模式识别中的一项重要内容,而有关这一方面的研究非常少。

目前在故障诊断中,单分类方法可用于识别未知类型样本。单分类方法主要可以划分为密度估计方法和边界方法2类。密度估计方法依据一定的概率密度分布,根据经验风险设置相应的密度阈值,将所有概率密度低于该阈值的样本判定为未知类型样本。当样本规模足够大时,密度估计的效果较好[7]。但当样本数目有限,或分布模型不适合数据时将会出现较大偏差,从而无法对目标样本做出正确的判定。边界方法主要包括单分类支持向量机[8]OCSVM(One-Class Support Vector Machine)和支持向量数据描述[9]SVDD(Support Vector Data Description),这2种方法存在一定程度的等效,它们利用有限的样本数据,通过优化目标函数获取样本集合的封闭边界。边界方法避免了密度估计法对于样本数量的苛求,但在很大程度上依赖于训练样本性能的优劣和参数的选择,并且计算效率很低。另外,一些聚类算法也可以用于未知样本的识别,但这些算法大多计算速度偏低,而且对于类型已知的样本仍需进行后续识别以确定其类别。

基于变量预测模型的模式识别VPMCD(Variable Predictive Model based Class Discriminate)是由Rahuraj等人提出的一种模式识别方法[10]。VPMCD方法依据各特征值之间相互内在的联系,针对不同的类别,对各个特征值建立反映这种特征值之间相互内在关系的变量预测模型(VPM)。利用建立好的VPM对测试样本的特征向量进行回归预测,利用预测误差平方和构建判别函数,从而实现模式识别[11]。

然而,VPMCD方法使用多项式响应面法建立VPM,高阶计算量很大,无法随着样本容量的增大而有效提高其近似精度,这严重限制了方法的使用[12]。极限学习机ELM(Extreme Learning Machine)法是由Huang等人提出的一种单层前馈神经网络算法,该方法利用核极限学习机(KELM)将核函数引入ELM中,构成具有最小平方最优解的ELM,具有可调参数少、收敛速度快、泛化性能较好等优点[13]。

本文提出了一种基于KELM的改进VPMCD(KELM-VPMCD)方法,用于识别未知的局部放电类型。首先,利用不同的局部放电模型采集局部放电样本,提取相应的放电特征向量;然后,将KELM回归与VPMCD方法结合,用KELM回归模型替代原VPMCD方法中的多项式响应面模型,训练已知类型的局部放电样本,获得相应的VPM;然后,利用训练好的各VPM对测试样本进行预测;最后,依据Otsu算法对样本回归得到的期望方差划分阈值,判定样本的局部放电类型是已知还是未知。

1 KELM-VPMCD方法的基本原理

1.1 VPMCD方法的基本原理

设某一样本x可由p个特征值描述,其特征向量形式可表示为x=[X1,X2,…,Xp]。x中的某一特征值Xi与其他的1个或多个特征值之间存在着一定的线性或非线性函数关系。当样本类型不同时,各特征值之间的相互关联也不同。为了识别不同的样本类型,需要建立能够表征特征值X1—Xp间关系的VPM,以便对测试样本的特征值进行回归预测,进一步实现对样本类型的正确划分。为特征值Xi建立对应的变量预测模型VPMi,可选择的模型主要包括线性模型(L)、线性交互模型(LI)、二次交互模型(QI)和二次模型(Q)[11]。

对特征值Xi进行预测,其对应的变量预测模型VPMi可表示为:

Xi=f(Xj,…,Xl,bq,…,bo,r)+ε

(1)

其中,1≤j≤l≤p且j、q≠i;bq、…、bo为模型参数;r为模型阶数且r≤p-1;ε为预测误差。

对于某一样本类型,若预测模型的类型、阶数以及对Xi的预测变量确定,则参数bq—bo可通过多项式响应面法求解获得:

Y=D·B

(2)

其中,Y为模型响应值,即Xi的预测值;D为输入变量的多项式基函数;B为模型参数矩阵。

minJk(B)=min‖D·B-Xi‖2

(3)

(4)

1.2 KELM的基本原理

ELM是一种新型的单层前向型神经网络。相较于传统的人工神经网络,ELM仅通过一步计算即可解析出网络的输出权值,极大地提高了网络的泛化能力和学习速度,具有较强的非线性拟合能力,其计算量和搜索空间也得到了大幅的降低[14-15]。ELM的网络结构如图1所示。

图1 ELM的网络结构Fig.1 Network structure of ELM

(5)

其中,yi∈Rm为网络的输出值;βj为连接隐含层与输出层的输出权值;gj(xi;ωj,bj)为第j个隐含层节点的激活函数;ωj为连接第j个隐含层节点和输入节点之间的权重;bj为网络第j个隐含层节点的偏置。

(6)

输出权值β的求解等价于求取线性方程组H=βT的最小二乘解β*。根据广义逆理论,其解如式(7)所示。

β*=H+T=HT(HHT)-1

(7)

其中,H为ELM的隐含层输出矩阵;H+为隐含层输出矩阵H的广义逆;T为期望输出向量。

在隐含层特征映射h(x)未知的情况下,将核函数引入ELM中[15],利用核矩阵ΩELM替代随机矩阵HHT:

(8)

其中,h(·)为隐含层节点输出函数;K(·)为核函数,通常设定为径向基函数(RBF)核,如式(9)所示。

(9)

其中,σ为核参数。

KELM模型的输出为:

y(x)=h(x)HT(I/C+HHT)-1T=

(10)

其中,I为对角矩阵;C为惩罚参数。

相较于ELM,KELM算法不需单独设定网络隐含层节点的特征映射函数h(x)的具体形式以及节点个数,也不需要设定隐含层的初始权重和偏置,而只需确定核函数K(·)的具体形式即可求出KELM模型的输出值。

1.3 基于KELM-VPMCD的模式识别方法

KELM-VPMCD方法的实现过程如下[13]。

(1) 训练过程。

a. 步骤1:对于g分类问题,共收集N个训练样本,且N=n1+…+nk+…+ng。提取样本特征值xj=[Xj1,Xj2,…,Xjp](j=1,2,…,N)。

b. 步骤2:令k=1、i=1。

c. 步骤3:优化惩罚参数Ck和核参数σk。

e. 步骤5:i←i+1,循环步骤4,直至i=p时结束循环。

f. 步骤6:k←k+1,循环步骤3—5,直至k=g时结束循环。至此,训练共获得g×p个VPM。

(2) 测试过程。

a. 步骤1:对于n个测试样本,提取特征值xj=[Xj1,Xj2,…,Xjp](j=1,2,…,n)。

b. 步骤2:令j=1、k=1。

e. 步骤5:k←k+1,循环步骤3、4,直至k=g时结束循环。以预测误差平方和最小为判别函数,样本xj的类别标签L*(xj)可由式(11)确定。

(11)

f. 步骤6:j←j+1,循环步骤3—5,直至j=n时结束,至此,完成了对所有测试样本类型的识别。

1.4 标准数据仿真分析

选择UCI数据库中的Iris和Seeds数据集进行仿真分析,验证KELM-VPMCD方法的可行性。Iris数据集包含3类数据,每组数据包含4个属性,每类数据随机抽取50组,其中30组作为训练样本,20组作为测试样本。Seeds数据集包含3类数据,每组数据包含7个属性,每类数据随机抽取70组,其中40组作为训练样本,30组作为测试样本。将本文方法与VPMCD方法、BP神经网络和SVM方法进行对比。BP神经网络选择3层,激活函数选择sigmoid函数;SVM方法选用RBF为核函数。2类数据集的识别结果如附录中的表A1所示。由表中结果可知,对于Iris和Seeds数据集,相较于其他方法,KELM-VPMCD方法均具有很高的正确识别率,即能有效地对待测样本进行分类。

2 基于KELM-VPMCD方法的未知局部放电类型的识别

利用KELM-VPMCD方法对待测样本进行放电类型的识别时,利用训练后的某种放电类型的VPM对各测试样本的特征值进行预测,计算预测误差平方和。以预测误差平方和误差是否小于规定阈值为判别函数,判断测试样本是否属于该类局部放电。若样本不属于任何已知的局部放电类型,则判定该样本的局部放电类型为未知。

利用VPM对n个局部放电样本的各个特征变量进行预测,并求取预测误差平方和向量SSE j(j=1,2,…,n)。若第j个局部放电样本属于第g类局部放电类型,则利用相应的VPM进行预测所得到的SSEj应该在其阈值区间内。若SSEj超过了相应的阈值,则说明该局部放电样本不属于此类局部放电。各种局部放电类型的误差平方和阈值可由Otsu算法获得[16]。基于KELM-VPMCD的样本放电类型的识别流程如图2所示。

图2 基于KELM-VPMCD方法的局部放电类型识别流程Fig.2 Flowchart of recognition of PD types based on KELM-VPMCD method

基于KELM-VPMCD的样本放电类型识别具体步骤如下。

c. 将所有SSEkj依据大小划分为1—m个等级,其中max{SSEkj}对应等级m,min{SSEkj}对应等级1。

d. 利用Otsu算法对所有SSEkj划分阈值T,并求得T对应的阈值SSEkT。

e. 根据阈值SSEkT判别测试样本是否属于第k类局部放电类型。若第j个样本属于第k类放电,则该测试样本完成放电类型的判别;若不属于,则对继续该样本进行第k+1类放电类型的判别。

f. 令k=k+1,重复步骤b—e直至k=g结束。至此,测试样本集合中所有属于已知局部放电类型的样本已经完成判别并进行了分类。

g. 当k=g时,测试样本集合中的剩余样本判别为未知局部放电类型的样本。

3 局部放电样本识别及结果分析

3.1 局部放电样本的采集与特征提取

据电气设备局部放电的形式和特点,在实验室中构造悬浮放电、板对板放电、针板放电和电晕放电这4种局部放电模型,如图3所示。

本文采用传统的脉冲电流法监测局部放电信号,采用的测量标准为IEC60270—2000。实验中使用TWPD-2F局部放电综合分析仪采集放电信号,采样频率为40MHz,带宽为40~300kHz。高压实验平台型号为TWI 5133-10/100 am[17],实验接线图如图4所示。本文以每个工频周期记录得到的数据作为一个局部放电样本。

图3 4种局部放电模型Fig.3 Four types of PD model

图4 实验接线示意图Fig.4 Experimental wiring diagram

本文采用文献[17]提出的基于变分模态分解VMD(Variational Mode Decomposition)算法和样本熵的特征提取方法:首先利用VMD算法对采集到的1个周期内的放电波形进行分解,得到各个不同中心频率的固有模态函数;然后,对每个模态分量提取样本熵;最后,将每个样本的不同模态函数的样本熵共同构成该样本的特征向量。

3.2 识别结果及分析

为了充分验证本文所提方法的有效性,本文依次选取4种局部放电模型中的一种作为已知局部放电类型,其他3种局部放电模型作为已知样本以外的未知局部放电类型。从3类已知类型的局部放电样本中随机抽取一部分信号和假定的未知类型的局部放电样本共同组成测试样本。采用已知类型的局部放电样本对KELM-VPMCD分类器进行训练以确定相应的VPM,然后对测试样本进行判断。

每种局部放电模型有50个采集样本,则共有200个样本。3种已知类型的放电各随机选取30个,构成训练样本集合。随机抽取20个未知类型的局部放电样本与剩余所有已知类型的样本,共同构成测试样本集合。这样,对于每次试验,训练样本中包含90个样本,测试样本中包含80个样本。

当选定未知放电类型后,利用KELM-VPMCD方法对训练样本进行训练,然后对测试样本进行回归预测,得到所有样本的误差平方和。利用粒子群优化(PSO)算法优化参数(C,σ),然后对样本的平方误差划分等级,并利用Otsu算法求解每种已知局部放电类型的阈值T及对应误差平方和。本文选定最大等级m=50。依次轮流设定不同局部放电类型作为未知局部放电类型,在所有可能的情况下,优化后的参数以及各已知局部放电类型样本在Otsu算法下的判别阈值如表1所示。

表1 参数(C,σ)及误差平方和的Otsu阈值Table 1 Parameters(C,σ) and Qtsu thresholds of MSE

利用KELM-VPMCD方法对局部放电样本进行训练和识别,同时与OCSVM、 SVDD和密度估计方法以及传统VPMCD方法对样本集合的识别结果进行对比。其中,OCSVM与SVDD方法均采用高斯核函数,密度估计方法的密度估计模型选择高斯密度估计模型。各方法的相关参数见附录中的表A2。

依次设定不同的局部放电类型作为未知的局部放电类型,利用不同识别方法对局部放电样本进行识别。在不同的未知局部放电类型的条件下,各识别方法对已知与未知局部放电类型的识别结果见附录中的表A3。各种识别方法对4种不同的局部放电类型的正确识别率见附录中的表A4。

图5 局部放电样本特征量分布Fig.5 Distribution of features of PD samples

由表A3、A4中的数据分析可得,KELM-VPMCD方法对局部放电样本的识别率最高,识别效果最佳。尤其针对未知局部放电类型的样本,KELM-VPMCD方法的识别效果明显优于其他方法。这是因为KELM-VPMCD方法着重考虑了各特征量间的内在联系,并且避免了传统VPMCD方法中回归模型确定和阶数选择困难的问题,稳定性更强。表A3中结果显示,当选定不同类型的局部放电样本作为未知局部放电类型样本进行识别时,单分类的OCSVM方法与SVDD方法所得到的结果差异明显,这是由于OCSVM与SVDD方法受样本空间中特征量的分布影响较大造成的。样本分布集中程度高,类内、类间差异小,识别效果好;反之,识别效果差。图5为4种类型的局部放电样本特征量的空间分布,图中,X1、X2和X3为特征空间的三维特征量。

结合图5,当选定的训练样本类间差异很大,如选择悬浮放电、板对板放电和电晕放电为已知局部放电类型时,OCSVM方法与SVDD方法对未知样本的识别效果很差。而KELM-VPMCD方法突出考量了特征值间的内在联系,因此在样本特征向量的表示上存在足够的裕度,在样本数量较少或样本质量较差时仍能具备良好的识别效果。

同时,针对4种不同的放电类型,结合表A3、表A4和图5结果分析可得:电晕放电的识别效果较为理想,板对板放电的识别效果较差。这是由于电晕放电的放电脉冲具有明显的极性效应,局部放电样本的空间分布集中放电特征明显,而板对板放电的局部放电样本空间分布分散,类内差异较大,所以识别率低。

4 结论

在电力设备局部放电模式识别中,存在对未知类型的局部放电样本识别困难的问题。本文提出了一种基于KELM-VPMCD的局部放电模式识别方法,并将其应用于电力设备局部放电类型的识别中,实现了对未知局部放电类型的正确识别。

a. KELM-VPMCD方法充分利用特征变量之间的相互内在关系,以已知局部放电类型的VPM对未知类型的局部放电样本进行回归预测,其预测误差较为明显。因此,利用Otsu算法确立误差阈值后,KELM-VPMCD方法可以有效地识别未知类型的局部放电样本。

b. KELM-VPMCD方法采用KELM回归模型替代了原多项式响应面模型,避免了模型选择和阶数确定困难的问题。相较于BP神经网络和SVM分类方法,KELM-VPMCD方法设置参数少,避免了出现局部最优的可能。

c. 与传统的单分类方法相比,KELM-VPMCD方法适应性强,对训练样本要求低,在训练样本数量较少及样本类间、类内差异较大时仍能取得较高的正确识别率。

d. 本文只是采用实验数据对所提出的方法进行了验证,而实际工程中,可能存在更多种已知和未知类型的局部放电。因此,在实际应用中,需将已经确定的样本作为训练样本,据此判断待测样本是否都属于已知类。

致 谢

本文得到了中国国电集团公司的资助,特表感谢!

附录见本刊网络版(http:∥www.epae.cn)。

参考文献:

[1] 段伟润,张宇辉,李天云. 抑制局部放电信号中周期性窄带干扰的子空间重构方法[J]. 电力自动化设备,2017,37(7):178-183.

DUAN Weirun,ZHANG YUhui,LI Tianyun. Subspace reconstruction to suppress periodic narrowband noises of partial discharge signals[J]. Electric Power Automation Equipment,2017,37(7):178-183.

[2] 刘凡,张昀,姚晓,等. 基于K近邻算法的换流变压器局部放电模式识别[J]. 电力自动化设备,2013,33(5):89-93.

LIU Fan,ZHANG Yun,YAO Xiao,et al. Recognition of PD mode based on KNN algorithm for converter transformer[J]. Electric Power Automation Equipment,2013,33(5):89-93.

[3] 田质广,张慧芬,郎立国. 基于遗传算法的神经网络在发电机定子超高频局部放电模式识别中的应用[J]. 电力自动化设备,2005,25(8):43-47.

TIAN Zhiguang,ZHANG Huifen,LANG Liguo. Application of genetic algorithm based on neural network in UHF PD recognition of gene-rator stator[J]. Electric Power Automation Equipment,2005,25(8):43-47.

[4] 弓艳朋,刘有为,吴立远. 采用分形和支持向量机的气体绝缘组合电器局部放电类型识别[J]. 电网技术,2011,35(3):135-139.

GONG Yanpeng,LIU Youwei,WU Liyuan. Identification of partial discharge in gas insulated switchgears with fractal theory and support vector machine[J]. Power System Technology,2011,35(3):135-139.

[5] 杨志超,范立新,杨成顺,等. 基于GK模糊聚类和LS-SVC的GIS局部放电类型识别[J]. 电力系统保护与控制,2014,42(20):38-45.

YANG Zhichao,FAN Lixin,YANG Chengshun,et al. Identification of partial discharge in gas insulated switchgears based on GK fuzzy clustering & LS-SVM[J]. Power System Protection and Control,2014,42(20):38-45.

[6] 陈新美,潘笑颜,路光辉,等. 基于朴素贝叶斯的局部放电诊断模型[J]. 计算机应用与软件,2016,33(9):51-55.

CHEN Xinmei,PAN Xiaoyan,LU Guanghui,et al. A partial discharge diagnosis model based on naive Bayes[J]. Computer Applications and Software,2016,33(9):51-55.

[7] TARASSENKO L,HAYTON P,CERNEAZ N,et al. Novelty detection for the identification of masses in mammograms[C]∥International Conference on Artificial Neural Networks. Cambridge,UK:IET,1995:442-447.

[8] XIAO Y,WANG H,XU W. Parameter selection of Gaussian kernel for one-class SVM[J]. IEEE Transactions on Cybernetics,2015,45(5):941-953.

[9] DAVID M J T. Support vector data description[J]. Journal of Machine Learning Research,2004,54(1):45-66.

[10] RAO R,LAKSHMINARAYANAN S. VPMCD:variable interaction modeling approach for class discrimination in biological systems[J]. Febs Letters,2007,581(5):826-830.

[11] 罗颂荣. 基于变量预测模型模式识别的旋转机械故障诊断研究[D]. 长沙:湖南大学,2015.

LUO Songrong. Research on fault diagnosis method for rotating machinery using variable predictive model based class discriminate[D]. Changsha:Hunan University,2015.

[12] 杨宇,潘海洋,李杰,等. 基于改进多项式响应面的VPMCD方法及其在滚动轴承故障诊断中的应用[J]. 振动与冲击,2014,33(19):157-163.

YANG Yu,PAN Haiyang,LI Jie,et al. VPMCD approach based on improved polynomial response surface and its application rolling bearing fault diagnosis[J]. Journal of Vibration and Shock,2014,33(19):157-163.

[13] 刘念,张清鑫,刘海涛. 基于核函数极限学习机的微电网短期负荷预测方法[J]. 电工技术学报,2015,30(8):218-224.

LIU Nian,ZHANG Qingxin,LIU Haitao. Online short-term load forecasting based on ELM with kernel algorithm in micro-grid environment[J]. Transactions of China Electrotechnical Society,2015,30(8):218-224.

[14] 王守相,王亚旻,刘岩,等. 基于经验模态分解和ELM神经网络的逐时太阳能辐照量预测[J]. 电力自动化设备,2014,34(8):7-12.

WANG Shouxiang,WANG Yawen,LIU Yan,et al. Hourly solar radiation forecasting based on EMD and ELM neural network[J]. Electric Power Automation Equipment,2014,34(8):7-12.

[15] 杨锡运,关文渊,刘玉奇,等. 基于粒子群优化的核极限学习机模型的风电功率区间预测方法[J]. 中国电机工程学报,2015,35(增刊):146-153.

YANG Xiyun,GUAN Wenyuan,LIU Yuqi,et al. Prediction intervals forecasts of wind power based on PSO-KELM[J]. Proceedings of the CSEE,2015,35(Supplement):146-153.

[16] 门洪,于加学,秦蕾. 基于CA和OTSU的电气设备红外图像分割方法[J]. 电力自动化设备,2011,31(9):92-95.

MEN Hong,YU Jiaxue,QIN Leil. Segmentation of electric equipment infrared image based on CA and OTSU[J]. Electric Power Automation Equipment,2011,31(9):92-95.

[17] 贾亚飞,朱永利,王刘旺,等. 基于VMD和多尺度熵的变压器内绝缘局部放电信号特征提取及分类[J]. 电工技术学报,2016,31(19):208-217.

JIA Yafei,ZHU Yongli,WANG Liuwang,et al. Feature extraction and classification on partial discharge signals of power transformers based on VMD and multiscale entropy[J]. Transactions of China Electrotechnical Society,2016,31(19):208-217.

猜你喜欢
模式识别训练样本特征值
一类带强制位势的p-Laplace特征值问题
单圈图关联矩阵的特征值
人工智能
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
基于商奇异值分解的一类二次特征值反问题
第3届亚洲模式识别会议