党珑,王琪,董佳宁,李一然,周宇洁
(1.江苏理工学院电气信息工程学院,江苏常州 213001;2.苏文电能科技股份有限公司,江苏常州 213149)
电力变压器是电力系统中重要的电气设备之一,若变压器发生故障将对电力系统及用户产生重大影响[1]。为了使变压器能够长期稳定可靠地运行,避免因计划检修所带来的超前故障和潜在故障,利用智能控制技术和大数据技术对设备进行状态监测与分析势在必行[2]。通过实时检测变压器的运行情况,结合相关历史数据以及人工智能算法,可得到设备当前运行情况,并预测未来短时间内可能存在的状态[3]。如果设备指标无异常,可以不安排检修工作;反之,应及时确定故障情况,并安排检修[4]。可见,快速、准确地诊断并预测电力变压器故障类型具有十分重要的现实意义。
针对电力变压器故障诊断问题,国内外学者进行了深入的研究。通常,故障诊断方法有传统诊断和智能诊断两种类型。其中,传统故障诊断方法主要包含特征气体判别法、IEC三比值判别法和无编码比值法。特征气体判别法是根据不同故障类型对应的特征气体及含量对变压器故障类型进行判别,该方法具有原理简单、易实现等优点[5]。然而,在工程实际中,无论变压器是否故障都会产生特定的气体,如果单纯根据特征气体类型及其对应含量来判断故障类型容易产生误判,影响诊断结果。IEC 三比值判别法是由国际电工委员会(International Electrotechnical Commission,IEC)对变压器运行过程中所产生气体含量进行归纳整理,并将这些气体两两对比,得到了一组气体比值数据[6];在此基础上,结合变压器故障类型进行分析、对比与整合,进而构成变压器故障类型判断方法。IEC 三比值法在实际工程应用中具有较高的准确率,但仍存在一些缺陷,如:编码赋值有条件、故障类型有限、存在编码空缺等。无编码比值法又称为二比值法,这是我国变压器故障诊断专家通过对大量的故障数据进行分析而研究得出的一种简单易行的故障诊断方法[7]。该方法只需计算出C2H2/C2H4、C2H4/C2H6和CH4/H2中的两个比值就可以快速地进行诊断,而无需通过编码查找故障类型。由此可见,无编码比值法不存在找不到编码以及编码过少找不到对应故障类型的问题[8]。该方法判断简单,正确率较高,其不足之处在于无法区分变压器是处在正常状态还是故障状态[9]。
智能故障诊断方法涵盖了如专家系统[10]、人工神经网络[11]、支持向量机[12]等由智能控制算法构成的变压器故障判别方法。其中,专家系统方法是将专家推理经验引入到故障分析的计算机模型中,从而处理现实中需要专家做出判断的复杂故障诊断问题,并得出与专家相同的结论[13]。该方法不依赖于大量数据,可解释性强,但大量规则的设计使得模型过于复杂,且可移植性和自学习能力差。人工神经网络和支持向量机方法则是通过对故障样本数据进行分析与挖掘[14],利用机器学习技术来模拟或实现人类的学习行为,以获得样本输入与输出之间潜在的非线性关系,从而进行故障诊断。这类方法对于变压器故障诊断的多分类、小样本问题处理较好,且精度较高;但也有一些缺点,如可能会陷入局部极值或者出现收敛速度过慢等情况[15]。
本文以智能故障诊断方法为研究对象,利用遗传和粒子群优化算法分别对人工神经网络和支持向量机方法进行优化与比较研究,从而建立了四种故障诊断模型并对其进行测试与分析。
电力变压器的故障诊断属于典型的分类回归问题,对于这类问题,BP 神经网络和最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)等基于智能控制学理论的机器学习方法提供了很好的解决方案。
BP 神经网络是一种基于误差向传播算法训练的多层前馈神经网络,目前在求解各类回归问题中应用较为广泛[16]。BP神经网络通过改变网络结构,增加隐层层数或者调整层与层之间的权值大小来解决故障诊断非线性分类的复杂工程实际问题。
支持向量机(Support Vector Machine,SVM)的本质是一个二分类器,LSSVM 作为标准SVM 的改进,用等式约束代替了SVM 的不等式约束[17],从而将求解SVM 的凸二次规划问题转化为线性方程组的求解问题[18],降低了算法复杂度。其在处理样本数据较少的分类回归问题时有着独特的优势,因此,被引入到故障诊断的研究中。
本文以BP 神经网络和LSSVM 两种算法为立足点,尝试找出最适合变压器故障诊断的有效模型。如图1 所示,为基于BP 神经网络和LSSVM 的故障诊断原理。BP 神经网络或LSSVM 算法类似于一个“黑箱”,利用“黑箱”原理[19],能够找出训练样本输入与输出之间潜在的非线性关系,再通过测试样本对“黑箱”中的潜在非线性关系进行验证,得到误差精度,从而判断是否满足性能指标。
图1 故障诊断原理
此外,为了克服BP神经网络和LSSVM算法的缺陷,本文还利用遗传(Genetic Algorithms,GA)和粒子群(Particle Swarm Optimization,PSO)两种算法来优化BP神经网络的权值、阈值以及LSSVM的核参数、惩戒参数,从而改善精度,通过比较研究得到最优诊断模型。
电力变压器发生故障时会产生油中溶解气体即特征气体,气体种类可达20多种,但真正应用于故障诊断的气体主要为氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)和二氧化碳(CO2)。其中,因CO和CO2气体含量值变化范围大,在BP神经网络和LSSVM故障诊断方法的归一化过程中会极大地影响其他气体参数归一化后的值,且这两种气体主要用来分析固体绝缘材料情况;因此,在不影响诊断正确率且分析对象特征尽可能少的情况下,本文选用H2、CH4、C2H6、C2H4、C2H2五种气体作为特征气体,并以其含量作为输入。
通过与江苏省常州市某油侵式电力变压器生产厂商开展科研项目合作,形成了油中溶解气体分析(Dissolved Gas Analysis,DGA)数据库。在有明确结论的100 个样本中,选择70 个样本作为BP 神经网络和LSSVM 的训练集,并将其余30 个样本作为测试集,这样,保证了每个故障类型有14 个训练样本和6 个测试样本。如图2 所示,为具体样本数据。
图2 故障样本数据
变压器的故障类型通常以故障性质进行划分:按照变压器过热程度,划分为中低温过热和高温过热;按照放电能量大小,电性故障分为低能放电和高能放电。若无故障,则为正常运行状态。如表1所示,为本文诊断模型故障编码,0、1、2、3、4分别表示正常状态、中低温过热、高温过热、低能放电和高能放电。
表1 诊断模型故障编码
在对电力变压器故障诊断模型进行测试之前,需要明确本文的测试环境:Windows 10 家庭版64位操作系统;Intel酷睿10代i5处理器,2.90 GHz,内存8 GB,固态硬盘512 G;MATLAB 2016软件平台。
如图3 所示,为GA-BP 适应度曲线。从图3可以看出:随着迭代次数的增大,最佳适应度曲线逐渐上升,且在第18次时达到收敛,此时适应度为97.15%;GA-BP的平均适应度在92%上下波动,最低为89.14%,最高为93.82%。
图3 GA-BP适应度曲线
如图4 所示,为GA-BP 训练样本诊断情况。由图4 可知,不符合预期结果的有10 组样本,其中:第9组、第12组和第55组样本被误诊为低能放电;第25 组、第27 组、第50 组和第69 组样本被误诊为高温热故障;第16 组、第32 组和第53 组样本被误诊为正常状态。符合结果的样本约占总训练样本的85.71%,其中:正常状态和高温热故障诊断正确率为92.86%;高能放电诊断正确率为85.71%;低能放电和中低温热故障诊断正确率为78.57%。训练样本诊断效果差。
图4 GA-BP训练样本诊断情况
如图5所示,为GA-BP测试样本诊断情况。由图5可知,不符合预期结果的有8组样本,其中:有5组样本被误诊为正常,分别为第14组、第16组、第19组、第23组和第24组样本;有2组样本被误诊为高能放电,分别为第18 组和第20 组样本;第10 组样本被误诊为高温热故障。符合结果的样本占总测试样本的73.33%,其中:高能放电故障和正常状态诊断正确率均为100%;低能放电诊断正确率为83.33%;高温热故障诊断正确率为50%;中低温热故障诊断正确率为33.33%。整体诊断效果差。
图5 GA-BP测试样本诊断情况
如图6所示,为GA-BP运行时间。由图6可知,GA-BP整体的运行时间约为159 s,运行时间较长。
图6 GA-BP运行时间
如图7 所示,为PSO-BP 的适应度曲线。由图7 可知:随着迭代次数的增加,最佳适应度曲线逐渐变大,在第7次时就达到了收敛,略快于GA-BP模型,最优适应度同样为97.15%;平均适应度曲线集中在90%上下,最高为92.50%,但有3次平均适应度达到最低,约为76.00%,整体诊断模型的稳定性略差于GA-BP模型。
图7 PSO-BP适应度曲线
如图8 所示,为PSO-BP 的训练样本诊断情况。由图8可知,不符合结果的有6组样本,其中:有3组样本被误诊为低能放电,分别为第1组、第9组和第12 组样本;有3 组样本被误诊为高温热故障,分别为第13 组、第27 组和第69 组样本。符合结果的样本约占总训练样本的91.43%,优于GABP 模型,其中:高能放电故障诊断正确率约为71.43%;低能放电和正常状态诊断正确率约为92.96%;其余诊断正确率为100%。训练样本诊断效果好。
图8 PSO-BP训练样本诊断情况
如图9 所示,为PSO-BP 的测试样本诊断情况。由图9可知,不符合结果的有7组样本,其中:有2组样本被误诊为低能放电,分别为第2组和第6 组样本;有2 组样本被误诊为中低温热故障,分别为第16 组和第17 组样本;有2 组样本被误诊为正常状态,分别为第19 组和第23 组样本;第10 组样本被误诊为高温热故障。符合结果的样本占总测试样本的80.00%,同样优于GA-BP模型,其中:正常状态诊断正确率为100%;低能放电故障和高能放电故障诊断正确率为83.33%;高温热故障和中低温热故障状态诊断正确率为66.66%。整体诊断效果依然有待提高。
图9 PSO-BP测试样本诊断情况
如图10 所示,为PSO-BP 诊断模型的运行时间。由图10 可知,整个工程的运行时长约为156 s,快于GA-BP 模型3 s,运行速度改善不明显。
图10 PSO-BP运行时间
如图11 所示,为基于GA 优化的LSSVM 适应度曲线。从图11可以看出:随着迭代次数增加,适应度逐渐变大,在迭代至92次时达到收敛,最佳适应度达到100%;平均适应度随着迭代次数的增加有明显增长,但是始终未收敛。
图11 GA-LSSVM适应度曲线
此时,利用求得的全局最优染色体解码所得的C 和g 构建故障诊断模型。如图12 所示,为GA-LSSVM 训练样本诊断情况。不难发现,GALSSVM诊断模型总体正确率为100%,无误诊及未识别情况出现,每个诊断结果都符合预期目标,训练结果较好。
图12 GA-LSSVM训练样本诊断情况
如图13 所示,将测试样本导入已建立的故障诊断模型,得到GA-LSSVM 测试样本诊断情况。从图13 可知,诊断模型总体正确率达到93.33%,整体效果优于基于BP 神经网络的两种模型,其中:高温热故障和中低温热故障的诊断正确率为83.33%;其他故障诊断正确率均为100%。两处诊断错误情况为:第16组样本,应该为高温热故障,被误诊为低能放电;第19组样本,应该为中低温热故障,被误诊为高温热故障。
图13 GA-LSSVM测试样本诊断情况
如图14 所示,为GA-LSSVM 诊断模型运行时间。整个工程的运行时长约为63 s,比基于BP 神经网络的两种模型快了近100 s。
图14 GA-LSSVM运行时间
如图15 所示,为PSO-LSSVM 训练适应度曲线。从图15可以看出:最佳适应度在第2次迭代时就达到了收敛,最佳适应度值为100%,训练效果明显优于基于GA-LSSVM的诊断模型;随着迭代次数的增加,平均适应度稳步上升,到第7 次迭代时平均适应度收敛,此时适应度值达到了100%。
图15 PSO-LSSVM训练适应度曲线
综上,在4 种模型中基于PSO-LSSVM 的故障诊断模型存在3 个明显优势:(1)最佳适应度迭代速度快;(2)平均适应度曲线收敛;(3)平均适应度最大值为100%。
如图16所示,为PSO-LSSVM训练样本诊断情况。从图16可以看到70组训练样本的训练情况,其训练结果正确率达到了100%,无漏诊、误诊,训练结果优秀。
图16 PSO-LSSVM训练样本诊断情况
如图17所示,为PSO-LSSVM测试样本诊断情况。从图17可以看到30组测试样本的诊断情况,其中:第19组样本被误诊,将中低温热故障误诊为高温热故障;其余29组数据均符合预测要求,正确率达到了96.67%。样本诊断效果好于GA 优化的LS-SVM诊断模型。
图17 PSO-LSSVM测试样本诊断情况
如图18所示,为PSO-LSSVM诊断模型运行时间。从图18 可以看出,整个工程的运行时长约为49 s,速度非常快,比GA-LSSVM超前了约13 s,比基于BP神经网络的两种模型快了近110 s。
图18 PSO-LSSVM运行时间
本文针对电力变压器故障诊断问题,引入了基于PSO-BP、GA-BP、PSO-LSSVM 和GA-LSSVM的4 种诊断方法,并进行了比较研究。如表2 所示,为4种诊断模型性能的比较结果。
表2 4种诊断模型的性能比较
根据以上结果,得到如下结论:(1)基于PSO优化的LSSVM故障诊断模型相比其他3种模型有着更优异的性能,能够满足变压器的故障诊断需求;(2)基于LSSVM 的故障诊断模型在正确率和运行时间两方面均优于基于BP神经网络的故障诊断模型;(3)在变压器故障诊断中,无论是BP神经网络还是LSSVM,PSO算法的优化效果均好于GA算法。