基于主成分分析和多分类相关向量机的GIS 局部放电模式识别

2015-11-25 09:33律方成王子建
电工技术学报 2015年6期
关键词:模式识别特征参数类别

律方成 金 虎 王子建 张 波

(华北电力大学河北省输变电设备安全防御重点实验室 保定 071003)

1 引言

局部放电(Partial Discharge,PD)是SF6气体绝缘组合电器(Gas Insulated Switchgear,GIS)绝缘劣化的主要表现形式,不同放电类型所反映的绝缘劣化机理不同,而且不同放电类型对GIS 绝缘造成的损害程度不同[1,2],因此,对GIS 局部放电进行模式识别已经成为GIS 状态评估方面的重要部分[3-5]。

在局部放电模式识别领域,主要是从原始特征中选出对分类有利的特征子集,常见的方法有统计特征参数法[6,7]、波形特征参数法[8]和图像矩特征参数法等[9]。但是,在局部放电特征参数提取的过程中,得到的特征变量往往数量较多,造成特征空间维数较高,不仅给分类器带来负担,甚至造成识别率下降,所以对特征空间进行降维是必要的,而主成分分析法作为一种统计特征参数法[10],其最大的优点就是有效将高维特征空间降到低维空间,已经在很多领域取得了较好的效果,本文采用该方法对GIS 局部放电特征空间算子进行分析。

局部放电模式识别不仅需要提取有利的特征量,选择合适的分类器也是至关重要的。GIS 局部放电模式识别是一个多分类问题,而Damoulasy 等人提出了多分类相关向量机(Milticlass Relevance Vector Machine,M-RVM),该方法基函数权值少数非零,诊断速度快,另外可有效解决小样本、高维、非线性分类问题,更重要的是该方法通过引入多项概率似然函数,可以直接实现多分类[11,12]。因此,本文选择M-RVM 作为GIS 局部放电模式识别分类器。

在GIS 局部放电检测中,超高频(Ultra High Frequency,UHF)法检测的是超高频波段(300~3 000MHz),抗干扰能力强,灵敏度高[13],基于此,本文在实验室模拟了4 种典型的局部放电模型,采用UHF 法获取了相应的局部放电信号,通过主成分分析法对UHF 信号统计参量进行降维处理,提取了新的特征量,然后用多分类相关向量机对GIS 局部放电进行模式识别。

2 局部放电试验

2.1 试验平台

采用自行设计的 252kVGIS 局部放电仿真平台,整个平台长5m,高4.15m,为了方便试验和节约SF6气体,该平台采用盆式绝缘子将腔体隔开成为多个单独的小气室;超高频探头的检测频段为300~1 500MHz,试验电路接线示意图和GIS 局部放电仿真平台结构图分别如图1 和图2 所示:

图1 试验电路接线示意图Fig.1 The experimental circuit wiring diagram

图2 GIS 局部放电仿真平台结构图Fig.2 The structure of GIS partial discharge simulation platform

针对GIS 局部放电的特点,设计了4 种典型的放电模型:尖端放电、内部放电、悬浮放电和沿面放电,相关结构如图3 所示。

图3 局部放电模型结构示意图1、3、8、12—高压电极 2、6、11、14—低压电极4、5、7、10、13—环氧树脂 9—铜柱Fig.3 The structure of PD models

模型参数如下:尖端放电模型,高压针电极曲率半径为0.5mm,锥角30°,尖长15mm,电极间距离为10mm;内部放电模型,放电模型上下2 层均采用厚3mm 的环氧树脂板,中间采用1mm 厚的环氧树脂板作绝缘介质,绝缘板上有直径为10mm 的圆孔,绝缘板之间用环氧树脂胶粘结;悬浮放电模型,接地电极上放直径100mm,厚5mm 的环氧树脂板,环氧树脂板上面靠近边缘处放置直径 10mm,高10mm 的铜柱;沿面放电模型,两个板电极之间纵向放置一个直径10mm,长10mm 的环氧树脂棒。为了减小表面毛刺的影响,电极表面和边缘均打磨光滑,为了消除电极引线处的放电,设计并加工了光滑的球形螺帽。

2.2 超高频信号特征参量

根据2.1 节实验获取的UHF 信号,得到了局部放电次数N、总放电量QT、最大放电量Qmax等统计参数,针对局部放电模式识别的需求,最终选择局部放电UHF 信号最大放电幅值相位分布Qmax(Φ)、放电重复率相位分布N(Φ)及局部放电幅值分布Q三个不同二维图谱,分别提取出包括局部峰个数P、偏斜度S、放电量因数R、陡峭度K、相位中值M、相位不对称度B、互相关系数C 共26 个统计算子,这些统计参数从不同角度描述谱图特性,同时为了消除量纲的影响,各个参数均采用了标准化处理。各特征参数对应关系如表1 所示。获取的典型UHF 图谱如图4 所示。

表1 统计参数表Tab.1 Statistical parameters table

图4 UHF 信号统计图谱Fig.4 The statistical graph of UHF signals

3 参数主成分及因子分析

2.2节中得到的特征参数共有26 个,构成的特征空间维数很高,参数之间的相关性较大,可能存在信息冗余,直接送入分类器进行模式识别不但会给分类器带来较大的负担,而且也可能产生比较大的误差。主成分及因子分析方法使得提取出的特征量既可以全面表征放电谱图特征,同时又降低了特征空间维数,减小了分类器的负担。

3.1 因子相关性分析

大量的特征参量,可能造成信息重叠,通过因子相关性分析,可以找出反映变量之间共同特性的少数公共因子变量,从而可以判断数据是否适合进行主成分分析。以特征量K1~K5为例进行相关性分析。常用的检验方法有KMO 检验和Bartlett 球形检验,KMO 是用于检验因子分析是否适用的指标,若它在0.5~1 之间,表示适合;小于0.5 表示不适合。Bartlett 球形检验是通过x2 检验来完成对变量之间是否相互独立的检验。若统计量取值较大,且对应的显著性水平较小,则因子分析是适用的。运用SPSS 软件对统计出的K1~K5变量进行分析,输出检验结果下:KMO 的值0.713,变量之间存在较强的偏相关性;Bartlett 球形检验为127.13,显著性水平为0,拒绝零假设,变量之间适合进行因子分析,可以进行主成分分析。

3.2 协方差矩阵的主成分分析

针对陡峭度5 个特征参数,通过求解协方差矩阵的特征值和与之对应的特征向量,将原来的相关向量进行线性变换。对得到的特征值进行分析,选择值大于1 的特征根作为主成分进行分析,从而达到降维的目的。表2 列出了协方差矩阵的特征值及方差贡献率,图5为贡献率随主成分变化趋势图。

表2 特征值及其贡献率Tab.2 Characteristic values and its contribution rate

图5 贡献率随主成分变化趋势图Fig.5 The trend chart of contribution rate with the principal components changing

由图5 分析得到,从第3 个主成分开始,贡献率变化趋势已趋于平稳,且贡献率逐渐减小,其贡献可忽略不计。因此,取前2 个主成分是比较合适的,可以很好地反映绝大部分变量信息。这样由原来的5 个指标转化为2 个新指标,起到了降维作用。SPSS 分析软件得到主成分系数如表3 所示。

表3 主成分系数表Tab.3 Principal components coefficient table

从上表可知,2 个主成分的线性组合为

根据上面的线性组合可以得到主成分的值,同样的方法可以计算出局部峰个数P、偏斜度S、放电量因数R、相位中值M、相位不对称度B、互相关系数C 的主成分,提取出的成分如表4 所示。通过主成分分析,提取出26 个特征变量的10 个主成分因子,各参数的信息表征率均在76%以上。

表4 提取的主成分Tab.4 Extracted principal components

4 基于M-RVM 的局部放电模式识别

根据2.1 节可知,本文GIS 局部放电模型共分为4 类,是一个多分类问题,而多分类相关向量机(Milticlass Relevance Vector Machine,M-RVM)是Damoulasy 等人在二分类核函数学习、高斯过程组合协方差函数方法以及高斯先验处理多项概率似然函数方法的基础上,提出的一种可以直接实现多分类的方法,只要采用一个M-RVM 分类器即可实现GIS 的多种状态类别的识别。

M-RVM 通常采用0-1 的向量形式来表示类别,设需要识别的GIS 状态类别为L 种,则可以采用L维的0-1 列向量的形式来表示该L 种状态的类别标签。本文中,GIS 局部放电由尖端放电、内部放电、悬浮放电和沿面放电4 种放电模型构成,分别采用4 维列向量(0,0,0,1)T、(0,0,1,0)T、(0,1,0,0)T、(1,0,0,0)T作为GIS 上述4 种状态的类别标签。

4.1 M-RVM 算法简介

M-RVM 采用分层贝叶斯模型结构,通过引入多项概率似然函数(Multinomial Probit Likelihood),实现了多分类和输出类别成员概率。

式中 ynl——Y 的第n 行l 列的元素;

wl——W 的第l 列;

Nx(m, v)——代表x 服从均值为m,方差为v 的正态分布。

引入多项概率联系函数如式(3),将回归目标转化为类别标签。

图6 分层贝叶斯模型Fig.6 Hierarchical Bayesian Model

由最大后验概率估计的方法可得

因此给定类别时,基于最大后验概率(MAP)的权重更新方法如式(5)。

根据式(5),可以推导出辅助变量的E-step 形式。若∀.c≠i,如式(6)[15]

Gamma 分布的均值为

4.2 特征量选择

由于基于 M-RVM 的模式分类方法采用一个M-RVM 分类器识别GIS 的多种局部放电模式类别,因此要求选取的输入特征变量能够同时表征所要甄别的多种状态类别,而根据第2 和第3 节已经获取了表征GIS 局部放电模式的26 个原始特征量以及采用主成分分析法降维后的10 个特征量,为了对比分析,分别输入这两种特征参数,输入参数均采用了标准归一化。

4.3 选取核函数

M-RVM 通常采用的核函数有:线性核函数,多项式核函数和径向基核函数(RBF)等。该文选择模式识别中通常采用的RBF 核函数。

4.4 诊断输出

M-RVM 诊断方法的诊断输出是GIS 隶属于各种状态类别的概率值,对于把GIS 状态划分为L 种状态类别的情况,输出可以采用L 维行向量的形式,该L 维行向量中的元素分别代表GIS 隶属于L 种状态类别的概率,其对应关系与M-RVM 分类器学习时状态类别采用的表示方法有关。

本文把GIS 绝缘故障状态设置为4 类,对应于GIS 局部放电状态类别的上述表达形式。M-RVM 分类器的诊断输出向量模式为:[PZ,PN,PX,PY],其中PZ,PN,PX,PY分别代表GIS 的状态为尖端放电、内部放电、悬浮放电和沿面放电的概率值,记输出向量的索引集为I={Z,N,X,Y }。诊断结果为最大概率值对应的GIS 状态,即

4.5 基于M-RVM 的GIS 局部放电模式识别过程

基于M-RVM 的GIS 局部放电模式识别具体分类过程如下,流程如图7 所示。

图7 基于M-RVM 的GIS 局部放电模式识别流程图Fig.7 Flow chart of GIS partial discharge pattern recognition based on M-RVM

(1)依据研究问题的特点,划分GIS 的局部放电模式状态,并确定各种状态相应的表示方法。

(2)依据获取的 GIS 局部放电参数,选取M-RVM 分类器的输入特征变量,确定M-RVM 分类器的诊断输出表示方式。

(3)选取样本数据[ X,t]。

(4)选取核函数并确定核函数参数。

(5)将样本数据分为训练集[Xtr,ttr]和测试集[ Xte,tte],进行M-RVM 模型学习和测试。

表5 和表6 给出采用BN、SVM 和M-RVM 方法的GIS 模式识别的结果。其中,SVM 核函数选用RBF,采用“一对一”的分类方法;BN 采用贝叶斯分类器。BN、SVM 和M-RVM 方法均按4.2 节确定输入向量,得到的3 个分类器错分率曲线如图8所示。

通过上面的曲线可以看出M-RVM 分类器的错分率明显低于另外两种算法,最终得到的识别结果如表5 和表6 所示。

图8 错分率曲线Fig.8 Wrong classification rate curves

表5 降维前BN、SVM 和M-RVM 方法的GIS 模式识别正确率Tab.5 Comparison of pattern recognition accuracy among BN,SVM and M-RVM method before dimension reduction

表6 降维后BN、SVM 和M-RVM 方法的GIS 模式识别正确率Tab.6 Comparison of pattern recognition accuracy among BN,SVM and M-RVM method after dimension reduction

5 结论

文章设计了252kVGIS 局部放电超高频检测仿真平台,模拟了4 种典型的GIS 局部放电模型,获取了相应的超高频信号统计特征量,采用主成分分析法对原始特征空间进行了降维处理,结合多分类相关向量机对GIS 局部放电进行了模式识别,取得了如下结论:

(1)根据4 种典型的放电模型,获取了UHF信号中最大放电幅值相位分布Qmax(Φ)、放电重复率相位分布N(Φ)及局部放电幅值分布Q 三个不同二维图谱,并且从统计数据中提取了26 个原始特征量。

(2)采用主成分分析法可以有效的实现特征空间的降维处理,将原始的26 个特征量降为10 个新的特征量,并且以新的特征量作为输入量进行GIS局部放电模式识别,其识别率大于85%。

(3)采用多分类相关向量机作为模式分类器,无论是采用原始的26 个特征参量还是降维后的10个特征参量,其识别率都要高于BN、SVM 分类器。

[1]司文荣,李军浩,袁鹏,等.基于波形非线性映射的多局部放电脉冲群快速分类[J].电工技术学报,2009,24(3):217-228.Si Wenrong,Li Junhao,Yuan Peng,et al.The fast grouping technique of PD sequence based on the nonlinear mapping of pulse shapes[J].Transactions of China Electrotechnical Society,2009,24(3):217-228.

[2]李信,李成榕,丁立健,等.基于特高频信号检测GIS 局放模式识别[J].高电压技术,2003,14(3):16-20.Li Xin,Li Chengrong,Ding Lijian,et al.Identification of PD patterns in gas insulated swichgear(GIS)based on UHF signals[J].High Voltage Engineering,2003,14(3):16-20.

[3]唐炬,周倩,许中荣,等.GIS 特高频局放信号的数学建模[J].中国电机工程学报,2005,25(19):106-110.Tang Ju,Zhou Qian,Xu Zhongrong,et al.Establishment of mathematical model for partial discharge in GIS using UHF method[J].Proceedings of the CSEE,2005,25(19):106-110.

[4]Judd M D,Cleary G P,Bennoch C J.Applying UHF partialdischarge detection to power transformers[J].IEEE Power Engineering Review,2002,22(8):57-59.

[5]司文荣,李军浩,袁鹏,等.气体绝缘组合电器多局部放电源的检测与识别[J].中国电机工程学报,2009,29(16):119-125.Si Wenrong,Li Junhao,Yuan Peng,et al.Detection and identification techniques for multi-PD sources in GIS[J].Proceedings of the CSEE,2009,29(16):119-125.

[6]胡文堂,高胜友,余绍峰,等.统计参数在变压器局部放电模式识别中的应用[J].高电压技术,2009,35(2):277-281.Hu Wentang,Gao Shengyou,Yu Shaofeng,et al.Application of statistic parameters in recognition of partial discharge in transformers[J].High Voltage Engineering,2009,35(2):277-281.

[7]Gulski E,Kreuger F H.Computer-aided recognition of discharge sources[J].IEEE Transactions on Electrical Insulation,1992,27(1):82-92.

[8]Mazroua A A.Discrimination between PD pulse shapes using different neural network paradigms[J].IEEE Transactions on Dielectrics and Electrical Insulation,1994,1(6):1119-1131.

[9]张晓虹,张亮,乐波,等.基于局部放电的矩特征分析大电机主绝缘的老化[J].中国电机工程学报,2002,22(5):94-98.Zhang Xiaohong,Zhang Liang,Le Bo,et al.Analysis onaging condition of stator winding insulation of generator basedon the moment characteristics of partial discharge[J].Proceedings of the CSEE,2002,22(5):94-98.

[10]廖瑞金,杨丽君,孙才新,等.基于局部放电主成分因子向量的油纸绝缘老化状态统计分析[J].中国电机工程学报,2006,26(14):114-119.Liao Ruijin,Yang Lijun,Sun Caixin,et al.Aging conditionassessment of oil-paper based on principal component and fac-tor analysis of partial discharge[J].Proceedings of the CSEE,2006,26(14):114-119.

[11]Damoulas T,Girolami M A.Probabilistic multi-class multi-kernel learning:on protein fold recognition and remote homology detection[J].Bioinformatics,2008,24(10):1264-1270.

[12]Girolami M,Rogers S.Hierarchic Bayesian models for kernel learning[C].In Proceedings of the 22nd International Conference on Machine Learning,Bonn,Germany,2005,241-248.

[13]李信,李成榕,丁立健,等.基于特高频信号检测GIS 局放模式识别[J].高电压技术,2003,14(3):16-20.Li Xin,Li Chengrong,Ding Lijian,et al.Identification of PD patterns in gas insulated swichgear(GIS)based on UHF signals[J].High Voltage Engineering,2003,14(3):16-20.

[14]Psorakis I,Damoulas T,Girolami M A.Multiclass relevance vector machines:sparsity and accuracy[J].IEEE Transactions on Neural Networks,2010,21(10):1588-1598.

[15]Damoulas T,Girolami M A.Combining feature spaces for classification[J].Pattern Recognition,2009,42(11):2671-2683.

猜你喜欢
模式识别特征参数类别
冕洞特征参数与地磁暴强度及发生时间统计
壮字喃字同形字的三种类别及简要分析
基于PSO-VMD的齿轮特征参数提取方法研究
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
基于视频的车辆特征参数算法研究
第四届亚洲模式识别会议
服务类别
可拓模式识别算法中经典域的确定方法
统计特征参数及多分类SVM的局部放电类型识别
多类别复合资源的空间匹配