基于SVM算法的变压器DGA和故障诊断

2020-10-21 03:57陆敏安任堂正肖远兵陈敬德崔明飞
机电信息 2020年21期
关键词:支持向量机故障诊断变压器

陆敏安 任堂正 肖远兵 陈敬德 崔明飞

摘要:油中溶解气体分析(DGA)是评估变压器运行状态和故障诊断的重要指标。现将支持向量机算法(SVM)应用于DGA和故障诊断中,并对比了SVM算法和其他传统算法在故障诊断中的正确率。研究结果表明,传统算法的故障诊断正确率在43%~54%,而优化后的SVM算法正确率为76.77%。超过23%的正确率提升充分证明了SVM算法在故障数据特征识别中的先进性,对变压器运维提供了强力的技术支持。

关键词:变压器;支持向量机;油中溶解气体分析;故障诊断

0    引言

准确评估变压器运行状态对提升电网可靠性、制定運维检修策略及消除事故隐患具有重要意义。油中溶解气体分析(DGA)是反映变压器运行状态的重要指标[1]。

传统的DGA方法主要使用IEC 60599提出的三比值法[2],国内的科研人员也提出了《变压器油中溶解气体分析和判断导则》(DL/T 722—2014)用以正确评估变压器油的质量和设备运行状况[3]。传统分析方法虽然有国内外电工委员会的支持,但固定的阈值边界无法保证正确率[4-5]。

近年来,专家系统、模糊理论和灰色关联性理论等方法逐渐被应用于DGA[6-7]。相比于传统的DGA方法,这些评估理论体系的确提升了故障识别的正确率,但是这些有限的提高依托于丰富的机理知识储备,推理过程中的逻辑也不够缜密,从而导致应用门槛较高。更先进的智能算法也被尝试用于DGA,例如BP神经网络,但是网络收敛速度慢,容易过拟合,并且在数据量较少时无法保证正确率的缺点也阻碍了它的进一步应用与推广[8]。

基于对过往发表论文的研究,为了显著提升基于DGA的故障诊断的正确率,需要使用有坚实理论基础并且适用于小样本的机器学习算法。本文将介绍支持向量机算法(SVM)在DGA中的应用。第一节首先介绍SVM算法的原理;第二节则验证SVM在DGA故障诊断中的正确率,并将其与传统算法进行对比;第三节对文章成果进行了总结。

1    SVM算法原理

支持向量机(SVM)[9-10]的理论依据是统计学习,通过数据挖掘的方法,解决模式识别、时间序列分析等问题,最小化了经验风险和模型复杂度的同时,在数据样本有限的条件下,能够确保输出函数的平滑性以及模型的推广性[11]。

以二分类问题举例[10],如图1(a)所示,要将灰、黑两种类别分类,图1(b)中提供了一个分割线A,可以被称为分类线。但是,推广到高维空间,当要被分割的数据不只是一维或二维的数据,那么分割这些数据的点和线则会变为面,即被称作“决策面”,而虚线所连接的点即被称为“支持向量”。

图1(c)中提供了决策面B和其对应的支持向量。虽然A和B都达到了将灰、黑两类数据分类的效果,但SVM算法会认为A在性能上优于B,其依据是决策面A的分类间隔大于B,分类间隔为“决策面”移动到“支持向量”所形成的平面的极限距离。所以,SVM的学习策略就是间隔最大化,其机理为寻找一个不仅能以一定的精度完成问题分类,并且还能保证决策面到两侧支持向量间隔最大的最优分类面[10,12]。

图1中的数据点可以看作x,它们的颜色可以看作类别y,训练集可以写为(xi,yi),x∈RRn,y∈{±1},由于图1中的灰、黑数据线性可分,分类面可以写作xw+b=0,w为权值向量,b为偏置。为了满足所有样本可以被分类面进行正确分类,并且具有一定的分类间隔的条件,则需:

2    基于SVM的变压器DGA和故障诊断

2.1    变压器DGA和故障诊断原理

油浸式变压器的绝缘油主要有两种元素:碳和氢。当变压器内部发生过热和放电反应时,绝缘油和绝缘材料则发生化学分解,产生氢气、烃类气体和碳氧化物[1]。油中溶解的气体包括7种:氢气(H2)、甲烷(CH4)、乙炔(C2H2)、乙烯(C2H4)、乙烷(C2H6)、一氧化碳(CO)、二氧化碳(CO2)[2-3]。

上述7种气体可以作为故障特征气体,它们的种类、含量、气体之间的比例关系也直接反应了变压器的故障类别,例如低温过热产生大量H2,严重过热产生少量C2H4,故障涉及绝缘材料时则产生大量CO和CO2。基于DGA的变压器故障类别可分为6种:过热300 ℃以下(T1)、过热300~700 ℃(T2)、过热700 ℃以上(T3)、低能量放电(D1)、高能量放电(D2)和局部放电(PD)[2]。

2.2    算例分析

2.2.1    数据描述

本文基于TPC&KHB变压器故障案例数据[13],对SVM算法在溶解气体故障特征分析中的应用结果进行验证。案例中的DGA故障数据数量为215,按照7:3的比例分为训练集和测试集。由于CO2的数据缺失比例达到60%,本文中只考虑其他6种气体为特征气体。将烃类气体浓度也作为特征气体,即CH4、C2H2、C2H4和C2H6这四种气体浓度之和。最后一个特征量为所有特征气体的浓度总量。

2.2.2    SVM模型调参

对低维空间内线性不可分的问题,SVM算法可以将其映射到高维空间,从而变成线性可分[14]。然而,如果将所有线性不可分的样例都映射到高维空间中,那么维度的大小和计算复杂度会急剧上升。核函数的存在,可以先在低维上进行计算,将实质的分类效果表现在高维上,从而避免了直接在高维空间中进行复杂的运算。本文中,在应用SVM算法进行DGA故障特征分析时,考虑了4种核函数,分别为线性核函数(Linear)、多项式核函数(Poly)、径向基核函数(Rbf)以及Sigmoid核函数[14-15]。

此外,SVM模型还有两个重要参量:C和γ[14-15]。C为惩罚系数,即为对误差的容忍度。提高C的数值意味着对误差容忍度的降低,但容易造成过拟合,但C的数值太小也会造成欠拟合,影响结果精度。γ为径向基核函数的一个参量,决定了低维数据映射到高维特征空间的分布。γ的数值大小和支持向量的个数成反比,而支持向量的个数会影响机器学习训练的速度。因此,对C和γ的调参,是优化SVM算法分类结果的重要步骤。

通过GridSearchCV函数对SVM算法的核函数、C和γ进行优化调参,即对几种参数在其被设定的取值范围内做依次循环,选取获得最优结果时所对应的参数取值。C的取值范围在28~29,γ的取值范围在2-20~2-10,模型的正确率计算公式如式(7)所示,不同核函数的分类结果如表1所示。

如表1所示,Linear核函数的分类正确率最高,其所对应的C和γ值为422.32和0.000 9。虽然正确率高达93.84%,但这仅仅是针对其中一组数据的分类结果。为了更好地评估模型的优劣,需要进行K折交叉验证,即防止因训练样数量少或复杂度高而造成过拟合现象。将数据分割成K个子样本,一个单独的子样本作为验证数据,其他K-1个样本用来训练。交叉验证重复K次,每个子样本验证一次,本文采用20折交叉验证识别故障特征的种类,平均正确率为76.77%。虽然正确率大幅下降,但是通过增加测试集的随机性,更准确和客观地体现了模型的泛化能力。

2.3    SVM算法和传统算法的比较

为了验证上述观点和体现SVM算法的优势,将IEC三比值法和无编码比值法设定的缺省参数应用于案例数据中,故障分类的正确率对比如表2所示。

由表2可知,传统的三比值法正确率最低,仅为43.99%。无编码比值法为54.72%,正确率提高了约10%。然而SVM算法的整体正确率高达76.77%,相比于传统的三比值法,其正确率提高了约33%。这一结果充分证明了SVM算法在DGA故障诊断应用中的先进性。

3    结语

本文介绍了SVM算法,并将其应用于变压器的DGA和故障诊断中。在对SVM算法进行调参优化后,通过算例分析得出SVM算法的故障诊断准确率为76.77%,对比传统算法提高了10%~33%。

本文的结果体现了机器学习算法在DGA和故障诊断中的优势,但是将先进算法应用于电力设备运维中还处于初步尝试阶段。受限于数据质量,算法模型的正确率还有较大的上升空间,更先进的算法也等待着被逐一尝试与应用,从而形成专业和完善的电力设备运行状态评估体系。

[参考文献]

[1] 操敦奎.变压器油中气体分析诊断与故障检查[M].北京:中国电力出版社,2005.

[2] Mineral oil-filled electrical equipment in service-Guidance on the interpretation of dissolved and free gases analysis:IEC 60599—2015[S].

[3] 變压器油中溶解气体分析和判断导则:DL/T 722—2014[S].

[4] 苏郑予希,唐小峰.基于三比值特征量与改进鸡群算法优化支持向量机的变压器故障模型[J].科技创新导报,2018,15(29):5-7.

[5] 齐波,张鹏,徐茹枝,等.基于分布模型的变压器差异化预警值计算方法[J].高电压技术,2016,42(7):2290-2298.

[6] 王永强,律方成,李和明.基于粗糙集理论和贝叶斯网络的电力变压器故障诊断方法[J].中国电机工程学报,2006,26(8):137-140.

[7] 张俊.基于灰色理论的变压器故障预测与评估[D].成都:西华大学,2012.

[8] 李江浩.基于改进神经网络的变压器故障诊断方法的研究[D].北京:华北电力大学,2015.

[9] 丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):1-10.

[10] CRISTIANINI N,TAYLOR J S.支持向量机导论[M].李国正,王猛,曾华军,译.北京:电子工业出版社,2004.

[11] 刘晓津.基于支持向量机和油中溶解气体分析的变压器故障诊断[D].天津:天津大学,2007.

[12] 张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.

[13] 王锦融.利用GSM资料收集模组与多层支持向量机分类器建构电力变压器故障诊断系统[D].高雄:国立高雄应用科技大学,2005.

[14] 周启超,刘剑,刘丽,等.基于SVM的通风系统故障诊断惩罚系数与核函数系数优化研究[J].中国安全生产科学技术,2019,15(4):45-51.

收稿日期:2020-06-04

作者简介:陆敏安(1983—),男,上海人,高级工程师,研究方向:变电运行。

任堂正(1990—),男,山东人,硕士,工程师,研究方向:变电设备检修及电气试验。

肖远兵(1991—),男,江西人,硕士,工程师,研究方向:继电保护。

猜你喜欢
支持向量机故障诊断变压器
风力发电机组齿轮箱轴承故障诊断分析
7SJ62在变压器保护上的应用
基于EMD和SSAE的滚动轴承故障诊断方法
变压器经济运行分析与应用
变压器经济运行分析与应用
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
理想变压器的理解和应用