邱鹏锋 郑连清, 魏成伟
一种GIS局部放电模式识别新方法及应用
邱鹏锋1郑连清1,2魏成伟2
(1. 重庆大学电气工程学院,重庆 400044;2. 新疆工程学院,乌鲁木齐 830091)
本文通过GIS实验装置平台设置的4种缺陷类型的放电情况,用特高频(UHF)检测法获取的PD信号,分别以时域、频域等17组统计参数作为PD类型的特征量,通过局部线性嵌入(locally linear embedding,LLE)方法将17组特征量进行降维处理,得到9组有效特征参数。并用多分类相关向量机(M-RVM)作为识别方法,在110kV电压下获取的实验检测数据作为训练和预测样本,结果取得86%的理想识别率,验证了LLE与M-RVM结合的识别系统的有效性。
局部放电检测;特征提取;局部线性嵌入;多分类相关向量机;模式识别
封闭式气体绝缘组合电器(gas insulated switchgear,GIS)以其结构紧凑、免维护和对环境影响小等突出的优点,在电力系统中得到越来越广泛的应用。GIS设备在生产、制造、安装和运行过程中不可避免地会出现各种绝缘缺陷,这些缺陷会导致不同程度的局部电场畸变,从而诱发局部放电(partial discharge,PD)[1-2]。PD是GIS设备绝缘劣化的主要表现形式,是GIS设备出现缺陷故障的先兆。局部放电检测能够有效检测GIS设备在设计、制造、运输和运行中出现的缺陷所导致的局部放电现象,提前诊断设备潜在的绝缘问题。
目前,检测GIS设备局部放电(PD)的方法主要包括脉冲电流法、超高频法、超声波法、光学法、化学法等[3]。特高频(ultra-high frequency,UHF)法以其抗干扰能力强、灵敏度高、现场使用方便等优点被广泛应用在GIS局放检测系统中。在GIS局部放电现象中,不同放电类型所反映的绝缘劣化机理不同,而且不同放电类型对GIS设备绝缘造成的损害程度不同,因此,研究GIS局部放电的模式识别对于评估其运行状态及确定检修策略具有重要意义[4-5]。
提取特征量是模式识别系统中的关键步骤,其选取的合适与否直接关系到系统识别结果的准确性,PD信号的特征提取方法主要分为两类:①统计谱图法;②波形分析法[6-7]。文献[2]提出一种基于Hankel矩阵的复小波-奇异值分解法提取局部放电特征信息的方法,该方法提取了Hankel矩阵的最大奇异值和奇异熵作为PD辨识的特征参量,取得良好效果,但计算过程略显繁琐。文献[6]提出一种提取特高频PD特征信息的谐波小波包变换(HWPT)方法,该方法一定程度上解决了用实小波包分解时子带间存在的频谱混叠和能量泄漏的问题。文献[8]提出一种基于经验模式(EMD)分解的超高频信号分形特征提取方法,该方法通过经验模式(EMD)分解得到的多个固有模态,再计算固有模态的关联维数作为特征量进行聚类分析,也取得不错效果。文献[9]提出用主分量稀疏化的思想将高维数的特征空间进行降维,以方便分类。文献[10]采用等效时频熵算法提取表征局部放电脉冲波形特征的多维特征量,并构建了等效时频熵分类谱图,然后通过改进模糊C均值聚类完成分类工作。考虑到统计谱图法,其数据量大,采样率要求高,处理速度慢,构造统计谱图又需要PD相位信息,而现场检测难以获得,综合考虑,本文采用波形分析法作为特征提取方法。
局部放电模式识别不仅需要提取有效的特征量,选择合适的分类器也是至关重要的[11]。文献[12]采用D-S证据理论进行3类特征信息融合PD模式识别技术,具有较高的辨识率和可靠性。文献[13]利用4种典型GIS局部放电模型,并通过降维后得到的10个新特征信息作为输入量,采用多分类相关向量机(M-RVM)分类器进行分类,结果取得大于85%的识别率。文献[14]用BP_Adaboost分类器通过反复训练弱分类器最终达到满足要求的强分类器,对GIS设备的3种故障类型进行分类和识别。文献[15]采用最小二乘支持向量机分类算法(LS-SVC),用4种GIS局部放电样本数据构造放电灰色图像,用GK模糊聚类算法对灰度图像的特性进行分析处理和优化,最终达到分类和识别的目的。
综上所述,在GIS局部放电检测中,还未见将局部线性嵌入(LLE)进行降维和多分类相关向量机(M-RVM)进行有机搭配,用于特高频检测的GIS局部放电模式识别中。因此,本文将LLE特征向量处理方法与M-RVM分类器结合,完成对4种典型的GIS局部放电缺陷类型的分类和识别。
本实验采用杭州西湖电子研究所生产的型号为XD5936的GIS局部放电带电检测实验装置作为实验平台,该GIS装置可准确模拟110~500kV GIS多种性质的放电现场。
本文设计了尖端、爬电、气泡和悬浮4种典型的GIS局部放电类型,并通过XD5936 GIS局部放电带电检测实验装置的试验平台,在电压110kV下采集了模拟的4种缺陷类型的局部放电特高频(UHF)检测数据。试验时特高频传感器采用外置方式,通过10GHz/s的高速示波器采样并存储每种缺陷类型的局部放电波形,每种放电类型采集100组波形数据,四种类型总共采集400组波形数据,每组检测数据包含8000个数据点,这样通过320万个实验数据点将4种缺陷类型的放电信息予以全面采集和存储。现场试验接线图如图1所示。
图1 110kV GIS局部放电检测接线图
如图2(a)所示,由于GIS金属腔体对特高频电磁波有屏蔽作用,所以XD5936 GIS实验平台设置了用于特高频检测的盆式绝缘子内嵌检测点。同时充分考虑现场的干扰因素,GIS设备接地端通过专业接地线连到设置好的接地排线端。
(a) (b)
2.1 特征提取
局部放电(PD)模式识别的效果主要取决于选取的特征参数,为了尽可能全面获取UHF传感器所检测的不同缺陷类型的PD信号,分别以时域信息、频域信息和统计信息3类特征信息为主导,以检测的放电波形数据相关性分析为辅助,将PD信号的特征信息进行最大程度的提取和分析。
考虑到时域波形的随机性干扰较大,本文采用了时域波形的一次及二次包络线如图3所示。多重包络线的采用不仅成功避开随机干扰的影响,同时也取得更多关于时域的宏观指标,并使得时间指标的提取变得直观和具体。图4为频域特征参数的提取依据。
图3 放电波形的时域及其包络线
图4 放电波形频域图及其包络线
根据时域和频域以及对其多重包络线特征的分析,提取了均值、方差、峰峰值、平均幅值、偏度、峰度、波形指标、峰值指标、频域方差等总共17组特征参数,具体参数见表1。
表1 特征量统计参数表
为了取消不同特征参数间数量级差别和有无量纲区别,需要对所有的特征参数数据进行归一化处理。本文选择离差标准化,其原理是将原始数据进行线性变换,使结果值映射到[0-1]之间。其标准公式为
式中,max为样本数据的最大值;min为样本数据的最小值。
2.2 LLE数据降维
局部线性嵌入(locally linear embedding,LLE)算法是针对非线性数据的一种降维技术,可以克服一般非线性算法需调整参数过多、收敛太慢和容易陷入局部极小的缺点,能够实现高维输入数据点映射到一个全局低维坐标系,并且能够使降维后的数据保持原有的拓扑结构[16]。目前LLE也是流行学习方法最经典的工作之一。LLE算法可以被归结为以下3步。
1)计算出每个样本点的个近邻点。实际算法中一般采用欧氏距离求取样本距离最近的个样本点,并且规定为所求样本点的个近邻点,是设定值。
2)求取样本数据点的局部重建矩阵。需要先定义重构误差:
(3)
求取矩阵需要构造局部协方差矩阵。局部协方差矩阵为
将式(4)与式(3)结合,并采用拉格朗日法,可求出局部最优化重建权值矩阵,即
(5)
3)将全部的样本点通过式(6)映射到低维空间中,即
通过LLE降维后,原来的17组特征变量降到9组,提供了更加有效、可靠的特征参数,同时计算速度得到提高,计算时间几乎为原来的一半。
2.3 多分类相关向量机(M-RVM)模式识别
相关向量机(relevance vector machine,RVM),又称“关联向量机”,是Tipping在2001年提出的一种机器学习算法[17]。Tipping指出RVM是一种用于回归和分类的贝叶斯稀疏核算法,虽与SVM相似,但具有更稀疏的解、更自由的核函数选择、更强的泛化能力、更好的鲁棒性等优点。但RVM本质上是一个二分类器,故多分类问题需要对RVM进行多分类扩展,通常采用多个RVM分类器通过组合学习的方法实现二分类器的多分类扩展,这就是多分类相关向量机(multiclass relevance vector machine,M-RVM)。
RVM回归和分类具有相同的基本模型,其思想为尝试通过最大化后验概率(MAP)求解相关向量的权重。对于给定的训练样本集,(,,类别标量),其模型有如下:
(8)
为避免过学习,RVM定义了高斯先验概率分布来约束每个权值:
对于分类问题,RVM无法直接计算出权值的后验概率,故需要再通过拉普拉斯理论进一步进行近似等效,最终达到理想收敛效果,得出最优权重分布。以下是M-RVM在LLE降维前后聚类图。
通过LLE降维后,M-RVM分类器的模型训练和分类预测的时间都缩短为原来的1/2,如图5所示,通过LLE降维前后聚类图对比显示,局部线性嵌入LLE的流形学习方法确实可以在众多特征量中针对性选择有效,可靠的少数特征量,帮助识别系统快速完成聚类前的准备工作。
(a)LLE降维后聚类图
(b)LLE降维后聚类图
图5 LLE降维处理前后聚类图
多分类相关向量机M-RVM在进行分类之前,需要进行模型训练,原则上,训练数据越多,分类和预测效果越好,但基于现场检测数据有限的客观条件下,分别都选取70组4种类型检测数据进行分类器模型的训练工作,再取余下的各30组数据样本测试分类器模型的识别率。表2显示了分类器识别的准确率,以及LLE降维前后识别度的对比。
表2 LLE降维前后M-RVM识别率对比
通过表2,可得M-RVM分类器在未做降维前的识别率平均在75%,通过LLE降维后,4种类型的识别率保持在86%以上,取得理想效果。
本文通过GIS实验装置内设置的气泡、尖端、悬浮和爬电4种缺陷类型,在110kV电压等级下分别获取了4种缺陷类型的局部放电检测信号。
1)尽可能利用特高频(UHF)传感器获取的GIS内绝缘状态信息,对检测信号波形进行时域,频域等17组特征量的信息提取。
2)运用流形学习LLE降维技术对17组特征量进行降维处理,得到9组有效特征参数,提高了运算速度和识别率。
3)采用多分类相关向量机M-RVM进行4种缺陷类型的分类和预测,取得了不低于86%的PD模式识别率,达到了理想效果。
[1] 郑闻文, 李功新, 舒胜文. GIS局部放电UHF检测系统性能检验方法研究进展[J]. 电气技术, 2016, 17(10): 1-7.
[2] 唐炬, 董玉林, 樊雷, 等. 基于Hankel矩阵的复小 波-奇异值分解法提取局部放电特征信息[J]. 中国电机工程学报, 2015, 35(7): 1808-1817.
[3] 钱勇, 黄成军, 江秀臣, 等. 基于超高频法的GIS局部放电在线监测研究现状及展望[J]. 电网技术, 2005, 29(1): 40-43, 55.
[4] 李信, 李成榕, 丁立健, 等. 基于特高频信号检测GIS局放模式识别[J]. 高电压技术, 2003, 14(3): 16-20.
[5] 张凯, 孙亚明, 胡春江, 等. GIS设备局部放电检测技术研究[J]. 电气技术, 2014, 15(9): 66-69.
[6] 唐炬, 樊雷, 张晓星, 等. 用谐波小波包变换法提取GIS局部放电信号多尺度特征参数[J]. 电工技术学报, 2015, 30(3): 250-257.
[7] 王彩雄. 基于特高频法的GIS局部放电故障诊断研究[D]. 华北电力大学, 2013.
[8] 李化, 程昌奎, 陈娇, 等. 基于EMD的GIS典型局部放电超高频信号的分形特征提取方法[J]. 高压电器, 2014(6): 104-110.
[9] 律方成, 金虎, 王子建, 等. 主分量稀疏化在GIS局部放电特征提取中的应用[J]. 电工技术学报, 2015, 30(8): 282-288.
[10] 鲍永胜, 郝峰杰, 徐建忠, 等. GIS局部放电脉冲分类特征提取算法[J]. 电工技术学报, 2016(9): 181-188.
[11] 律方成, 张波. 基于S_Kohonen网络的GIS局部放电类型识别[J]. 电测与仪表, 2014, 51(20): 21-24.
[12] 黄亮, 唐炬, 凌超, 等. 基于多特征信息融合技术的局部放电模式识别研究[J]. 高电压技术, 2015(3): 947-955.
[13] 律方成, 金虎, 王子建. 等. 基于主成分分析和多分类相关向量机的GIS局部放电模式识别[J]. 电工技术学报, 2015(6): 225-231.
[14] 律方成, 张波. 基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别[J]. 电测与仪表, 2014(15): 37-41.
[15] 杨志超, 范立新, 杨成顺, 等. 基于GK模糊聚类和LS-SVC的GIS局部放电类型识别[J]. 电力系统保护与控制, 2014(20): 38-45.
[16] 阎少宏, 彭亚绵, 杨爱民, 等. LLE算法及其在手写文字识别中应用[J]. 河北联合大学学报: 自然科学版, 2012, 34(2): 52-55.
[17] Tipping M E. Sparse bayesian learning and the relevance vector machine[J]. Journal of Machine Learning Research, 2001, 1(3): 211-244.
The New Method of GIS Partial Discharge Pattern Recognition and Application
Qiu Pengfeng1Zheng Lianqing1,2Wei Chengwei2
(1. College of Electrical Engineering, Chongqing University, Chongqing 400044; 2. Xinjiang Institute of Engineering, Urumqi 830091)
In this paper, the PD signal obtained by UHF detection method is used as the characteristic quantity of PD defect types, through the four kinds of defect types arranged by the GIS experiment platform, 17 groups of feature quantities are selected by time domain and frequency domain, etc. Then, useingLocally linear embedding (LLE) method to reduce the dimensionality of 17 sets of feature groups, and nine effective characteristic parameters are obtained. (M-RVM) was used as the recognition method. The experimental data obtained at 110kV voltage were used as training and prediction samples, The results show that above 86% recognition rate is achieved, the validity of the identification system combined with LLE and M-RVM was verified.
partial discharge (PD) detection; feature extraction; locally linear embedding (LLE); multiclass relevance vector machine (M-RVM); pattern recognition
邱鹏锋(1990-),男,云南迪庆人,硕士研究生,从事带电检测技术研究工作。
国家自然科学基金(51577019)和国家“111计划”(B08036)资助的课题
高校集中供热智能控制系统开发(201512109)资助课题