基于选择性贝叶斯分类器的变压器故障诊断

2011-06-27 02:15华北电力大学控制与计算机工程学院赵文清
电气技术与经济 2011年5期
关键词:贝叶斯分类器故障诊断

■ 华北电力大学控制与计算机工程学院 赵文清

0 引言

针对传统的变压器故障诊断方法的不足.各种智能技术被引入变压器故障诊断中.并取得了比较好的效果[1-5]。变压器检修试验所获取的数据包括离线试验数据和连续监测的在线数据.在实际应用中。由于受到环境和条件的限制。大部分情况下得到的数据样本或者包含不完整数据或者变压器故障样本数很少,如何充分利用有限的变压器数据样本和不完整数据样本中包含的信息。始终是变压器诊断领域研究的热点问题。

贝叶斯网络用概率测度的权重来描述数据间的相关性.从而解决了数据间的不一致性问题和信息不完备问题[6-8]。针对变压器故障诊断中原始试验数据的属性缺失问题。文献[9]使用粗糙集进行属性的约简,然后再利用贝叶斯网络分类器进行故障甄别,取得了较好的效果:但即使是经过属性约简之后的试验数据,可能还有部分数据不完整。本文将使用选择性贝叶斯分类器解决该问题,直接从不完整数据计算贝叶斯网络结构的测度值来学习一般的贝叶斯网络。选择性分类器通过删除数据集中的无关属性和冗余属性可有效地提高分类精度和效率。

在不完整数据条件下,一般贝叶斯网络的学习是一个难点问题。虽然在这方面取得了一定的成果,如近似边缘分布方法[10]、AutoClass方法[11]、SEM(Structural EM)算法[12]等。但这些方法的共同策略是对不完整数据进行修补,采用循环迭代、逐步求精的学习过程.这需多次迭代才能收敛,并且每向前迭代一步都要进行一次数据修补。变压器故障诊断中。即使经过粗糙集约简,不完整数据仍有可能比较多,若采用以上方法学习贝叶斯网络。将是很耗时甚至是不可行的:同时,这些方法都基于缺值数据满足MAR(Missing At Random)假设[13]。当不满足这个假设时,其数据修补方法的精度会显著下降,由此构造的分类器的精度也会下降[14]。为避免MAR假设,文献[15]提出了一种RBC(Robust Bayes Classifier),该方法在不要求缺值数据满足MAR假设的前提下,可以直接从不完整数据构造贝叶斯分类器。文献[16]提出了用于不完整数据的选择性贝叶斯分类器SRBC(Selective Robust Bayes Classifiers),SRBC是在RBC基础上利用包装法构建的用于不完整数据的选择性贝叶斯分类器;并证明该方法在大幅度减少属性数目的同时,能显著提高分类准确率和稳定性,分类效果优于朴素贝叶斯和其他选择性分类器。

1 基于SRBC的变压器故障诊断模型

1.1 属性变量、故障类、训练样本集的确定

变压器故障属性集、故障类、训练样本集分别如表1、表2、表3所示[9]。表3中x2=0、x2=l、x2=2、x5=0、x5=1、x5=2分别表示油中溶解气体分析(DGA)结果为无过热、低温过热、高温过热、无放电、低能量放电、高能量放电;x1、x3、x4、x7、x8、x9、x10、x11、x13、x14、的值为 0、l、2分别表示属性值和趋势值均不超标、属性值或趋势值超标、属性值和趋势值均超标;*表示因试验未做而不能确定的值。

1.2 模型的建立

本文利用文献[16]提出的用于不完整数据的SRBC直接从不完整数据计算贝叶斯网络结构的测度值来学习一般的贝叶斯网络.从而构建针对变压器故障属性缺失之下的故障诊断模型。文献[16]在利用包装法构建SRBC的过程中,采用了搜索效果好而复杂度相对较低的最好优先前向搜索方法对属性空间进行搜索。

表1 属性集

表2 故障类

设X={x1、x2…xN}为整个变压器故障属性的集合。N为X中属性的个数,本文取N=14:Q为一个队列。用来存放曾是最优的变压器故障属性子集及其对应的故障诊断正确率;Sb为当前最优变压器故障属性子集,d(S)表示RBC在变压器故障属性子集S上的故障诊断正确率;阈值T为用来控制搜索过程是否停止的参数,即如果连续T次对Q的头结点进行扩展都没有使当前最高故障诊断正确率改善,则搜索过程结束。

表3 训练样本集

SRBC算法可描述如下:

a.初始化,设置参数T,令整数t=0,令变压器故障属性xS=arg max{d({xi})},当前最高分类精度dmax=d({xS}),将变压器故障属性子集{xS}作为一个结点加入到队列Q中;

b.当t<T时执行步骤c,d和e,否则执行步骤f;

c.取出Q的头结点Sh(为一属性子集),令added=false(added用来标志在对Q的头结点的扩展中,是否向Q中加入新的结点),对每一属性x∈X-Sh,如果Sh∪{x}没有被评价过,且d(Sh∪{x})>dmax,则令added=true,Sb= Sh∪{x},dmax=d(Sh∪{x}),以及t=0,并且将Sb作为一个新结点加入到队列Q中;

d.如果added=false,那么t←t+l;

e.转到步骤b继续执行;

f.在最终的变压器故障属性子集Sb上构建RBC。

2 实验对比与实例分析

2.1 实验对比

为了与文献[9]的方法进行对比,本文利用文献[9]整理搜集的变压器测试数据,同样地,取200个样本中的150个实例作为训练集,50个实例作为检测集,构建了SRBC变压器故障诊断模型。

a.属性信息缺失时选择性贝叶斯分类器与各种分类器诊断效果的比较。

工程实际中样本的属性信息经常是残缺的,为了模拟属性残缺情况,文献[9]将上述50个待检测样本(多数存在属性缺失现象)作为检测样本集的基础,随机去掉2~10个属性值的测试样本各500个。本文利用相同的数据集,建立SRBC模型对测试样本进行诊断,同时与文献[9]所建立的NB、TAN、BAN模型和粗糙集决策表匹配方法进行比较,比较结果见表4。结果表明SRBC具有较强的处理不完备信息的能力,其诊断效果优于TAN、NB、BAN及粗糙集决策表匹配方法。

表4 属性不完备的测试样本的诊断结果

b.与文献[9]所建立的NB、TAN、BAN粗集分类器模型诊断效果的比较。

为了与各种诊断模型在诊断效果方面进行比较,与文献[9]一样,本文在50个待检测样本的基础上形成了30个缺失一个关键属性的样本(关键属性个数为3~5个),诊断结果对比见表5。

表5 缺失一个关键属性的诊断结果

2.2 实例分析

某主变(SFSZ7-40000/110),所用有载开关为ZYI系列国产开关,1995年5月18日安装投运.由于供电用户对电压合格率要求高,调压频率比较频繁,变压器DGA数据如表6所示。

表6 实例的DGA数据 μL/L

由于气体组分中C2H2占主要成分,且超出注意值,IEC三比值码为100,初步怀疑变压器内部存在高能量的放电故障。由表6和试验规程可知x2=0,x5=2,x9=0。油中微水含量为11.5μL/L,x4=0。另外,现场停电对变压器进行全面电气检查试验,变压器绕组直流电阻、空载损耗、绕组及铁心绝缘、变压比、绕组泄漏电流等试验项目均无异常,所以x1=0,x7=2,x13=0。

使用SRBC模型和文献[9]中的模型分别进行故障诊断,结果如图1所示(图中,i=0,1,…,12)。很明显,在已知数据E的前提下SRBC模型、NB粗集、TAN粗集和BAN粗集模型计算所得的类C12的后验概率最大,分别为1.00、0.71、O.82、0.79;类C0的后验概率分别为0、0.002l、0.035、0.21。所以可判断该变压器故障为C12,即有载分接开关油渗漏。与当时该变压器吊芯检查的结果相符。

图l 各种模型对实例的诊断结果

3 结论

针对已有变压器故障诊断方法在信息缺失多、有偏差的情况下误判率高的问题,提出了用于变压器故障诊断的选择性贝叶斯分类器模型.该模型直接从不完整的变压器试验数据估算变量的概率分布.进而完成故障诊断。另外,该模型的结构和参数能够随着样本集的扩大而完善,因而具有学习功能。实验表明,该方法具有处理不完备信息的能力和容错特性,其性能明显优于其他贝叶斯网络分类器方法。

[1]WEI Shouzhi,JIN Ningle.Fault diagnosis system based on information fusion and embedded internet[C]//2007 IEEE International Conference on Integration Technology.Shenzhen,China:IEEE Computer Society,2007:203-207.

[2]WANG Chenhao,HUANG Huixian,XIAO Yewei,et a1.Fault diagnosis of power transformers based on BP network with colonial selection algorithm[C]//Third International Conference on Natural Computation.Haikou,China:IEEE Computer Society,2007:13-16.

[3]JIA Honghong,DAI Wenzhan.Fault diagnosis against oil-im-mersed transformer based on PNN and GM(1,1)[C]//2007 IEEE International Conference On Integration Technology.Shenzhen,China:IEEE Computer Society,2007:394-397.

[4]BABU P,KALAVATHI S.Use of wavelet and neural network(BPFN)for transformer fault diagnosis[C]//2006 IEEE Conference on Electrical Insulation and Dielectric Phenomena.Kansas City,Missouri,USA:IEEE Electrical Insulation Magazine,2006:93-96.

[5]董明,屈彦明,周孟戈,等.基于组合决策树的油浸式电力变压器故障诊断[J].中国电机工程学报,2005,25(16):36-41.

[6]NILSSON N.Artificial intelligence,a new synthesis[M].San Francisco,USA:Morgan Kaufmann Publishers,1998:196-240.

[7]王华伟,周经伦,何祖玉.等.基于贝叶斯网络的复杂系统故障诊断[J].计算机集成制造系统,2004,10(2):230-234.

[8]李俭川,胡茑庆,秦国军,等.贝叶斯网络理论及其在设备故障诊断中的应用[J].中国机械工程,2003,14(10):896-900.

[9]吴立增.变压器状态评估方法的研究[D].保定:华北电力大学电气工程学院.2005.

[10]CHICKERING D M,HECKERMAN D,MEEK C.Large sample learning of Bayesian networks is NP-hard[J].Journal of Machine Learning Research,2004,39(5):1287-1330.

[11]CHEESEMAN P,STUTZ J.Bayesian classification(autoclass):theory and results[M]∥FAYYAD U M,PIATETSKY-SHAPIRO G.SMYTH P.et a1.Advances in knowledge discovery and datamining.Menlo Park,California.USA:AAAI Press,1996:153-180.

[12]FRIEDMAN N.The Bayesian structural EM algorithm[c]∥Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence.San Francisco,USA:Morgan Kaufmann Publishers,1998:129-138.

[13]LITTLE R J A,RUBIN D B.Statistical analysis with missing data[M].New York,USA:Wiley.1987:120-149.

[14]SPIEGELHALTER D J,COWELL R G.Learning in probabilistic expert systems[C]//Proceedings of the Fourth Valencia International Meeting on Bayesian Statistics.Oxford,England:Oxford University Press.1992:447-466.

[15]RAMONI M,SEBASTIANI P.Robust Bayes classifiers[J].Artificial Intelligence.2001.125(1-2):209-226.

[16]陈景年,黄厚宽,田凤占,等.用于不完整数据的选择性贝叶斯分类器[J].计算机研究与发展,2007,44(8):1324.1329.

猜你喜欢
贝叶斯分类器故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
数控机床电气系统的故障诊断与维修
基于实例的强分类器快速集成方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习
一种基于贝叶斯压缩感知的说话人识别方法
因果图定性分析法及其在故障诊断中的应用
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别