基于LSSVM概率输出与证据理论融合的变压器故障诊断

2014-04-01 07:20朱克东郑建勇梅军梅
关键词:故障诊断概率证据

朱克东郑建勇梅 军梅 飞

(东南大学电气工程学院,江苏南京 210096)

基于LSSVM概率输出与证据理论融合的变压器故障诊断

朱克东,郑建勇,梅 军,梅 飞

(东南大学电气工程学院,江苏南京 210096)

为了利用相对较少的故障数据样本对变压器主要故障类型进行较准确的判断,基于智能互补和数据融合的思想,提出基于最小二乘支持向量机LSSVM(least square support vector machine)概率输出与证据理论融合的故障诊断方法。该诊断方法具有以下特点:可融合蕴含变压器运行状态的多种特征信息,输出变压器各种故障的概率,为变压器检修提供更多的可用信息;充分发挥了LSSVM在小样本情况下具有较强泛化能力的优势。算例结果表明,该诊断方法的故障诊断准确率达到91.1%,优于传统的IEC三比值法(故障诊断准确率75.6%)及LSSVM分类法(故障诊断准确率82.2%),有效降低了诊断误判的风险。

变压器故障诊断;证据理论;最小二乘支持向量机;概率输出;油中溶解气体分析

油浸式电力变压器是电网中重要的一次设备,其运行状态直接影响电网的安全。在长期运行过程中,由于热、电等影响因子会引发变压器绝缘性能下降,产生各种故障。因此,需采取措施对其进行故障诊断,以保证变压器可靠运行。

近年来,利用油中溶解气体进行变压器故障诊断的研究[1-3]取得了一定效果,但这些方法主要依据溶解气体的单项特征信息,很难对故障做出准确判断,并且部分故障诊断方法需要大样本数据。然而,具有小样本特性的故障诊断更满足工程需求。证据理论作为不确定性推理方法,近期也被引入到故障诊断领域。证据理论的特点是以概率的形式输出结果,便于分析问题的不确定性,实现多特征信息的数据融合。文献[4]利用专家系统和模糊推理等技术完成基于多特征向量组合的故障诊断,但其证据体数量众多,使其不确定性问题分析的能力下降,同时也增加基本概率分配函数(basic probability assignment function,BPA)确定的困难。文献[5-7]在神经网络与证据理论结合的基础上进行探索,但是无论神经网络模型是否改进,不能避免其自身泛化能力较弱、结构构建复杂等缺陷。倘若证据体通过训练机器处理得到,可以有效减少证据体的数量,有利于诊断方法对不确定性问题的分析;其次可以针对其他智能算法进行研究,探索一种全新的BPA赋值方式,通过其他智能算法的优点来保证BPA的客观化、准确性。

LSSVM是支持向量机(support vector machine,SVM)[8]的扩展,它保留SVM泛化能力强、小样本特性、全局最优等优点,而且训练时间短,结果更具确定性,目前在电气工程中[9-12]得到广泛应用。而LSSVM概率输出把LSSVM的确定性分类转化为非确定性分类,在保留原有LSSVM优势的基础上为证据体提供BPA。基于上述考虑,笔者提出基于LSSVM概率输出与证据理论融合的故障诊断方法,通过构建多个LSSVM概率输出模块,结合数据融合原理进行识别,期望达到更加准确并全面地反映变压器的运行状态、提高其故障诊断精确度与可靠性的目的。

1 算法介绍及改进说明

1.1 LSSVM

LSSVM优化指标采用平方项,并用等式约束代替SVM的不等式约束,将二次规划问题转化为线性方程求解,降低了计算的复杂性,加快了求解速度。LSSVM的分类决策函数为

式中:y——目标输出;SV——支持向量机集合;αi——拉格朗日乘子;xi、xj——输入;Φ(*)——非线性变换;b——偏置常数。

定义K(xi,xj)=ΦT(xi)Φ(xj)为核函数,LSSVM算法选择径向基函数(radial basis function,RBF)为核函数,即K(xi,xj)=exp(-‖xi-xj‖/2σ2),其中σ为RBF的参数。

1.2 LSSVM改进

LSSVM是一种强有力的机器学习方法。但对于某些问题,样本不能明确地归为某类,只能以一定概率或隶属度属于某类。因此,用yi∈{-1,1}不能恰当地表示类别信息。为了让LSSVM表达样本的不确定性,就需要LSSVM具有软输出性能。

参数A、B根据训练机通过解式(3)所示的最大似然问题来解决。

式中:l——训练集样本数;pi——样本xi的概率估计值;N+、N-——正类和负类样本数。

1.3 Dempster/Shafer证据理论

Dempster/Shafer证据理论(以下简称DS证据理论)的本质是在同一识别框架下将不同的证据体通过其证据组合规则合成一个新的证据体的过程。给定一个识别框架Θ,Θ的幂集2Θ上的一个映射m:2Θ→[0, 1],满足m(φ)=0且m(A)=1,称m(A)为框架Θ上的BPA函数,它表示了对A的直接支持程度。在本文中A代表变压器状态类型,m(*)代表LSSVM训练模型。证据合成规则的一般形式是:设论域U上存在t个独立证据体,其相应的BPA函数分别为m1,m2,…,mt,相应的焦元分别为A1,A2,…,An,则融合后的可信度分配为

2 诊断系统的构建

2.1 故障类型的确定

设Ω(Θ)={f1,f2,…,fn}为变压器故障类型的集合,实践表明:变压器内部故障按性质可分为过热故障和放电故障。文献[15]对充油电气设备故障类型的统计结果如表1所示。由此,本文对变压器故障的定义为Ω(Θ)={f0,f1,f2,f3,f4,f5,f6,f7,f8,f9}。f0为无故障模式,f1为低温过热(<300℃),f2为中温过热(300~700℃),f3为高温过热(>700℃),f4为局部放电,f5为低能放电,f6为低能放电兼过热,f7为电弧放电,f8为电弧放电兼过热,f9为其他类型故障(如受潮等)。

2.2 诊断模型

诊断模型结构如图1所示。

模型诊断流程如下:由数据预处理模块对测试样本数据进行预处理,并将预处理后的数据根据参数集定义分别输入各个参数集;各个LSSVM诊断模块联立参数集中数据样本进行诊断,并将诊断结果输入各个故障集;3个故障集的诊断结果通过DS证据理论融合模块进行数据融合,最终得出诊断结论。

2.3 数据样本选择

研究证明,在热电作用下变压器油和绝缘材料将逐渐老化分解,产生少量的各种低分子烃类及二氧化碳、一氧化碳等气体;当存在潜伏性的热或放电性故障时,气体产生的速度加快。随着故障发生,大量气体溶解于油中。由于这些气体组分含量与故障类型及故障严重程度密切相关,笔者选用总烃(C2H2、H2、CH4、C2H6、C2H4)以及CO、CO2进行测试。

2.4 数据预处理

测试样本数据的量值通常存在较大的差别。若将原始数据直接输入,训练机器对较小的量值不敏感,会忽视一些重要特征信息。为充分挖掘原始数据中的信息,需对总烃样本数据进行预处理,CO、CO2数据在后文以其他方式进行处理。处理过程如下:φ(C2H2)=C2H2/(C1+C2),φ(H2)=H2/(C1+C2+H2),φ(C2H4)=C2H4/(C1+C2),φ(CH4)=CH4/(C1+C2),φ(C2H6)=C2H6/(C1+C2)。其中C1+C2代表总烃含量(体积比,下同)、,C1+C2+H2代表氢烃含量(C2H2、H2、C2H6、CH4、C2H4含量之和),φ(*)代表各种气体的体积比。

总烃的相对大小采用模糊隶属度进行处理。隶属函数选择常见而重要的岭形分布来描述,参考总烃数据,隶属函数构造如下:

式中:u0——总烃的相对体积;z——总烃的实际体积。

2.5 参数集定义

在变压器故障诊断领域中,一些基于油中气体溶解分析(dissolved gas analysis,DGA)的诊断方法往往各有其优点和不足,若能综合多种方法取长补短,无疑将有助于诊断准确率的提高。参数集1选取特征气体的体积比φ(CH4)、φ(H2)、φ(C2H6)、φ(C2H4)、φ(C2H2);参数集2采用劳杰士(Roger)四比值法选取φ(CH4)/φ(H2)、φ(C2H2)/φ(C2H4)、φ(C2H4)/φ(C2H6)、φ(C2H6)/φ(CH4);参数集3选取CO2/CO以及u0。

2.6 基于LSSVM概率输出的初步诊断

在LSSVM概率估计中,本文采用1.2节内容完成两两配对概率到多类概率的转化,输出各证据体(亦即故障集)的各类故障的BPA,保证BPA赋值的客观化。本文中,共有10类故障由3个LSSVM证据体进行诊断融合,其识别框架为Θ={f0,f1,…,f9}。该模块诊断流程如下:(a)第i类和第j类数据样本经过数据预处理后输入相应的参数集;(b)各参数集联立式(2)和式(3)求出相应的LSSVM概率输出,亦即二分类LSSVM概率输出; (c)通过所有的二分类概率输出迭代求解多分类下的概率输出矢量,亦即该证据体下各类故障的BPA。

2.7 基于数据融合的故障诊断

根据证据融合理论,结合3个基于LSSVM概率输出的证据体下各类故障的BPA,联立式(4),计算多证据体联合作用下对各类故障的融合结果,最后根据决策规则进行判断并得出结论。本文采用以下决策规则:目标的信任度是所有信任度中的最大值;目标的信任度与其他状态的信任度之差应大于某一阈值(经大量调试后设为0.15)。前者说明所有状态类型中只有信任度最大的状态类型符合目标,后者说明唯有目标与其他状态类型的信任度之差足够大时才能确认目标类型的合理性。倘若以上规则不满足,原因可能是证据选择不合理,需要重新选择并进行融合计算。

3 算例分析

在大量110 kV变压器油色谱检测记录和相应的实际故障结果基础上,对每类故障选出10组典型的样本,共有100台次样本作为训练样本(数据来源于江苏省电力公司相关检修部门)。对常见的变压器故障现场数据进行分析,结果表明本方法与三比值法诊断结果基本相符。下面重点针对改良三比值法误判的2次故障,采用本方法进行诊断,诊断过程中单个LSSVM概率输出模块的诊断结果也遵循2.7节的决策规则。

实例太湖变110 kV#2主变额定容量为31 500 kV·A,额定电压为110 kV/38 kV/11 kV,型号为SFSLZB-31500/110,1997年12月投入运行,2009年2月26日对其进行周期性油样采集工作。通过油色谱分析,发现主变本体油样化验数据异常,乙炔含量有较大增长,其他气体含量也有不同程度的增加。油中气体的体积比如下:φ(H2)=308 μL/L,φ(CO)=326 μL/L,φ(CO2)=1 401 μL/L,φ(CH4)=159 μL/L,φ(C2H6)=326.2 μL/L,φ(C2H4)=23.2 μL/L,φ(C2H2)=592.2 μL/L。

三比值编码为022,初步诊断为高温过热(>700℃)。采用本文方法进行诊断,结果见表2。最后融合结果为高能放电兼过热类型。通过该变压器的历史数据分析及现场的停电检查,表明该变压器因为铁芯多点接地,在运行中处于强电场中的铁芯在接地点形成闭合回路、产生环流,该电流引起铁芯局部发热,而且长期发热使变压器铁芯的某一点被烧坏,产生电弧,从而导致绝缘油分析中多种气体含量不断增加。诊断结果与现场勘查结果一致。表2结果表明:故障类型属于复合性故障,LSSVM1、LSSVM2、LSSVM3独立证据体由规则所限无法确定故障类型;当2个证据体融合作用时,3个诊断仅有LSSVM1-3诊断结果给出正确结论f7;当3个证据体融合作用时才彻底确定f7。由此可见,当进行复合性故障诊断时,基于单项特征量的证据体对故障进行诊断的不确定性较高、可信度很低,有时无法准确判断状态类型。多特征量的数据融合可以改善上述情况,有助于准确识别故障。

为评估模型的精度和可靠性,按本文方法对其他45台具有明确结论的变压器故障数据进行诊断,并将诊断结果与改良三比值法和LSSVM分类法的诊断结果进行比较,结果如下:基于改良三比值诊断的正判数为34,总识别率为75.6%;基于LSSVM分类诊断的正判数为38,总识别率为82.2%;基于本文诊断系统的正判数为41,总识别率达到91.1%,识别率明显提高。通过比较可以看出,基于LSSVM概率性输出的诊断方法,其诊断结果比基于LSSVM确定性输出的诊断方法及改良三比值法强,说明本文诊断模型在保留LSSVM的优点上有了进一步的提高,同样也体现了该模型的有效性。

4 结 论

a.笔者提出的LSSVM概率输出不但保留了LSSVM小样本、泛化能力强的特点,保证在有限的故障样本情况下也能建立较强推广能力的模型,克服了LSSVM硬判决的缺点,能提供故障类型的概率输出,保证了后续BPA赋值的客观性。

b.在提供证据体需要的BPA时采用LSSVM概率输出模块提供的近似真值概率输出,满足证据理论中不确定性信息输入的特点,使LSSVM与证据理论之间形成优势互补。

c.3个LSSVM训练模型的概率输出通过证据理论进行融合,更加准确、全面地反映设备的状态。通过实例分析,验证了该模型的精确度、可靠性和有效性,为变压器故障诊断提供新的思路。

[1]蔡金锭,王少芳.粗糙集理论在IEC-60599三比值故障诊断决策规则中的应用[J].中国电机工程学报,2005,25(11): 134-139.(CAI Jinding,WANG Shaofang.Application of decision rules for IEC-60599 three-ratio fault diagnosis based on rough set theory[J].Proceeding of the CSEE,2005,25(11):134-139.(in Chinese))

[2]莫娟,王雪,董明,等.基于粗糙集理论的电力变压器故障诊断方法[J].中国电机工程学报,2004,24(7):162-167.(MO Juan,WANG Xue,DONG Ming,et al.Diagnostic model of insulation faults in power equipment based on rough set theory[J].Proceeding of the CSEE,2004,24(7):162-167.(in Chinese))

[3]吕干云,程浩忠,翟海保,等.基于改进灰色关联分析的变压器故障识别[J].中国电机工程学报,2004,24(10):121-126.(LYU Ganyun,CHENG Haozhong,ZHAI Haibao,et al.Fault diagnosis of power transformer based on improved grey relation analysis[J].Proceeding of the CSEE,2004,24(10):121-126.(in Chinese))

[4]彭剑,罗安,周柯,等.变压器故障诊断中信息融合技术的应用[J].高电压技术,2007,33(3):144-146.(PENG Jian,LUO An,ZHOU Ke,et al.Application of information fusion technique to transformer fault diagnosis[J].High Voltage Engineering, 2007,33(3):144-146.(in Chinese))

[5]尚勇,闫春江,严璋,等.基于信息融合的大型油浸电力变压器故障诊断[J].中国电机工程学报,2002,22(7):115-118.(SHANG Yong,YAN Chunjiang,YAN Zhang,et al.Synthetic insulation fault diagnostic model of oil-immersed power transformers utilizing information fusion[J].Proceeding of the CSEE,2002,22(7):115-118.(in Chinese))

[6]廖瑞金,廖玉祥,杨丽君,等.多神经网络与证据理论融合的变压器故障综合诊断方法研究[J].中国电机工程学报, 2006,26(3):119-124.(LIAO Ruijin,LIAO Yuxiang,YANG Lijun,et al.Study on synthetic diagnosis method of transformer fault using multi-neural network and evidence theory[J].Proceeding of the CSEE,2006,26(3):119-124.(in Chinese))

[7]魏星,舒乃秋,崔鹏程,等.基于改进PSO-BP神经网络和D-S证据理论的大型变压器故障综合诊断[J].电力系统自动化,2006,30(7):46-50.(WEI Xing,SHU Naiqiu,CUI Pengcheng,et al.Power transformer fault integrated diagnosis based on improved PSO-BP neural networks and DS evidential reasoning[J].Automation of electric power systems,2006,30(7):46-50.(in Chinese))

[8]VAPNIK V N.The nature of statistical learning theory[M].New York,USA:Springer-Veerlag,1999:138-145.

[9]顾燕萍,赵文杰,吴占松.基于最小二乘支持向量机的电站锅炉燃烧优化[J].中国电机工程学报,2010,30(17):91-97.(GU Yanping,ZHAO Wenjie,WU Zhansong.Combustion optimization for utility boiler based on least square-support vector machine[J].Proceeding of the CSEE,2010,30(17):91-97.(in Chinese))

[10]秦业,袁海文,袁海斌,等.基于优化最小二乘支持向量机的电能质量扰动分类[J].电工技术学报,2012,27(8):209-214.(Qin Ye,Yuan Haiwen,Yuan Haibin,et al.Classification of power quality disturbances based on optimized least squares support vector machine[J].Transaction of China Electrotechnical Society,2012,27(8):209-214.(in Chinese))

[11]刘剑,刘开培,周仕杰,等.基于LSSVM的变压器最优维护周期研究[J].中国电机工程学报,2012,32(22):94-103.(LIU Jian,LIU Kaipei,ZHOU Shijie,et al.Research on optimal transformer maintenance scheme based on LS-SVM[J].Proceeding of the CSEE,2012,32(22):94-103.(in Chinese))

[12]曾鸣,吕春泉,田廓,等.基于细菌群落趋药性优化的最小二乘支持向量机短期负荷预测方法[J].中国电机工程学报, 2011,31(34):93-99.(ZENG Ming,LYU Chunquan,TIAN Kou,et al.Least squares-support vector machine load forecasting approach optimized by bacterial colony chemotaxis method[J].Proceeding of the CSEE,2011,31(34):93-99.(in Chinese))

[13]HSUAN-TIEN L,CHIH-JEN L,RUBY C W.A note on platt's probabilistic outputs for support vector machines[J].Machine Learning,2007,68(3):267-276.

[14]WU Tingfan,LIN Chijen,RUBY C W.Probability Estimates for multi-class classification by pairwise coupling[J].Journal of Machine Learning Research,2004,5(4):975-l005.

[15]孙才新.电气设备油中气体在线监测与故障诊断技术[M].北京:科学出版社,2003:1-89.

Transformer fault diagnosis based on probability output of LSSVM and DS evidence theory

ZHU Kedong,ZHENG Jianyong,MEI Jun,MEI Fei
(College of Electrical Engineering,Southeast University,Nanjing 210096,China)

For accurate estimation of the main types of transformer faults with relatively fewer fault information samples,this paper presents an approach to transformer fault diagnosis based on the probability output of the least squares support vector machine(LSSVM) and DS evidence theory according to the ideas of intelligence complementarity and information fusion.This diagnosis method has the following features:it integrates multiple feature information of the operating state of the power transformer,outputs the probabilities of various transformer faults,and provides more available information for the maintenance and repair of the power transformer.This gives full play to the strong generalization ability of the LSSVM in the case of small samples.In case studies,the diagnosis accuracy of the proposed method reached 91.1%,which was higher than that of the three-ratio method (with an accuracy of 75.6%)and that of the LSSVM method(with an accuracy of 82.2%).The proposed method effectively reduces the risk of misdiagnosis of transformer faults.

transformer fault diagnosis;DS evidence theory;LSSVM;probability output;dissolved gas analysis

TM41

:A

:1000-1980(2014)05-0465-06

10.3876/j.issn.1000-1980.2014.05.017

2014-05 09

江苏省工业支撑项目(BE2013833)

朱克东(1989—),男,江苏建湖人,博士研究生,主要从事电气设备的故障诊断研究。E-mail:hhuzkd@sina.com

猜你喜欢
故障诊断概率证据
第6讲 “统计与概率”复习精讲
基于包络解调原理的低转速滚动轴承故障诊断
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
数控机床电气系统的故障诊断与维修
对于家庭暴力应当如何搜集证据
手上的证据
因果图定性分析法及其在故障诊断中的应用
手上的证据