相晨萌闫 鹏赵海涛高树国刘宏亮
(1.国网河北省电力有限公司电力科学研究院,河北 石家庄 050021;2.河北西柏坡发电有限责任公司,河北 石家庄 050400)
变压器在运行过程中受到热、电和机械应力的作用,导致变压器发生热故障或电故障,变压器中的绝缘油以及绝缘纸等材料发生分解,产生H2、CH4、C2H4、C2H6、C2H2、CO 和CO2等气体溶解于油中,形成油中溶解气体。通过采用油中溶解气体分析(Dissolved Gas-in-oil Analysis,DGA)方法,可以对变压器故障进行判断和分类。目前基于矿物绝缘油DGA 技术,已形成了特征气体法[1]、IEC三比值法[2]、改良三比值法[12]、Rogers法[3-4]、Dornenburg法[5]、杜威(Duval)三角形法[6-7]和Duval五边形法[8]等传统变压器诊断方法以及基于人工智能的智能诊断方法,并在长期工程实践应用中不断完善,对于保障矿物绝缘油变压器安全运行发挥着巨大作用。
天然酯绝缘油是一种燃点高、绝缘性能良好且环保无污染[9]的新型液体绝缘电介质材料,在油浸变压器中得到越来越广泛的应用。但天然酯与矿物油主要成分不同,因此其油中溶解气体特性与矿物油存在差异,适用于矿物绝缘油变压器的DGA 诊断方法不再适用于天然酯绝缘油变压器。近年来,一些学者基于天然酯绝缘油中溶解气体数据,在矿物绝缘油诊断方法上进行改进,使之适用于植物绝缘油。文献[10]根据天然酯绝缘油在热故障下产生大量C2H6,而产生CH4很少的特性,将C2H6的上限值提高,把CH4的上限值相应降低,但该方法只能定性判断热故障和电故障,无法对热故障和电故障中的故障类型进行细分。文献[11]根据实验模拟FR3 天然酯绝缘油变压器故障的油中溶解气体数据,对Duval三角形1的边界条件进行调整,提出了用来诊断FR3天然酯绝缘油变压器故障的Duval三角形3,但该方法没有针对天然酯绝缘油在各种故障下的特征气体和油中溶解气体特性进行分析,不能很好的诊断热故障和局部放电情况。
因此,本文提出了一种基于无编码比值法的天然酯绝缘油变压器故障诊断方法。
无编码比值诊断法是一种比值诊断法,是根据热故障和电故障下油中溶解气体特性和变化规律,通过各种特征气体含量之间的比例关系进行逐层故障判断的一种方法。该方法以气体含量的比例作为特征量,采用的特征量维度高,反映故障信息全面,诊断层次性强。
天然酯绝缘油中溶解气体特性与矿物绝缘油不同。以山茶籽绝缘油为例,在热故障下,C2H6和H2是除CO和CO2外的主要特征气体产物,H2的百分含量随温度的升高呈降低趋势,而CH4、C2H4、C2H6的百分含量随温度升高呈上升趋势。在电故障下,当发生局部放电时,H2是除CO 和CO2外的主要特征气体产物,其次是CH4和C2H6;当发生击穿放电(低能放电)时,C2H2是除CO 和CO2外的主要特征气体产物,其次是H2和C2H4;当发生电弧放电(高能放电)时,C2H2仍是除CO 和CO2外的主要特征气体产物,其次是C2H4。
根据山茶籽绝缘油在各种故障类型下的油中溶解气体特性可知,由于热故障和局部放电故障的部分特征气体产物信息相似,不方便首先对热故障和电故障进行区分,因此首先选择1个或多个特征量作为判据Q1将故障分为热故障/局部放电以及低能放电/高能放电两部分。然后,一方面通过判据Q2区分低能放电故障和高能放电故障;另一方面通过判据Q3区分热故障和局部放电,进而再通过判据Q4区分低温热故障、中温热故障和高温热故障。因此,基于无编码比值法的山茶籽绝缘油变压器故障诊断结构框图如图1所示。
图1 无编码比值法的山茶籽绝缘油变压器故障诊断法结构框图
本文采用H2、CH4、C2H4、C2H6和C2H2五种特征气体构成C35=10组特征气体含量的比例关系,分 别 是C2H2/H2、C2H2/CH4、C2H2/C2H4、C2H2/C2H6、H2/CH4、H2/C2H4、H2/C2H6、CH4/C2H4、CH4/C2H6、C2H4/C2H6。这10组比例特征量可以反映山茶籽绝缘油电故障和热故障的关键信息,但其维数较高,且存在冗余特征量,影响诊断效果,因此为了提高诊断效率和准确率,需要根据故障类型提取最有效的特征量进行故障诊断。
采用相关系数矩阵分析方法对构成的10组比例特征量进行降维优化处理,通过计算各特征量间的皮尔森(Pearson)相关系数,可以发现特征量中彼此相关的变量,剔除相关性较高的变量,从而达到特征量降维优化的目的。具体步骤如下:
(1)构造特征量矩阵X,X=(X1,X2,…,Xn),如式(1)所示
式中:Xi为m×1的矩阵;m为样本数目;n为特征量数目。
(2)计算特征量间的相关性,通过求解pearson相关系数得到,如式(2)所示
式中:rXi,Xj为向量Xi、Xj的相关系数,其范围是[-1,1],rXi,Xj是描述2个特征变量间相关性强弱程度的物理量,其绝对值越大则相关性越强,当其值为0时则2个特征变量不相关;Cov(Xi,Xj)为向量Xi、Xj的协方差;σXi、σXj为向量Xi、Xj的标准差;μXi、μXj为向量Xi、Xj的样本均值;E为数学期望值。
(3)根据式(2)可以计算得到特征向量矩阵X各列间的Pearson相关系数,从而得到特征向量矩阵X的相关系数矩阵P,如式(3)所示:
式中:n为特征量数目;相关系数矩阵P为对称矩阵,对角线元素为1,由于该矩阵具有对称性,因此分析特征量间相关性只需分析P的上三角矩阵或下三角矩阵。
(4)设定阈值t,判断相关系数矩阵P中的元素值与t的大小,若rij>t,表示特征向量Xi、Xj具有较强相关性,可删掉一列,将Xi、Xj合并为一类特征量。通常认为相关系数大于0.50时为显著相关[12],小于0.50时为低度相关,因此设定阈值t=0.50对10种比例特征量间的相关性进行判断。
本文随机抽取64组山茶籽绝缘油中溶解气体数据[13]求其比值作为样本数据构成特征量矩阵X=(X1,X2,…,X10)∈R64×10,X1~X10分别代表C2H2/H2、C2H2/CH4、C2H2/C2H4、C2H2/C2H6、H2/CH4、H2/C2H4、H2/C2H6、CH4/C2H4、CH4/C2H6、C2H4/C2H6。对10 组特征量进行相关性分析,通过计算得到各特征量间的Pearson 相关系数,其中P(X1,X10)=0.86、P(X3,X4)=0.92、P(X3,X7)=0.89、P(X4,X7)=0.95、P(X5,X6)=0.79、P(X6,X8)=0.59,这几组特征量P>0.5,可认为这几组特征量显著相关,去除显著相关的特征量后,特征量的维数降低至5维。5个特征量分别是X1,X2,X3,X6和X9,这5组特征量的相关系数均小于0.50,相似程度不高,可以作为反映山茶籽绝缘油的故障特征量进行下一步分析并提取最优特征量。
在经过降维后选择的5组特征量中,各特征量反映的故障信息不同,因此需要进一步筛选特征量,选择性能最好的特征量分别诊断不同类型的故障。本文采用模糊C 均值聚类分析(FCM)算法,分别以这5组特征量作为输入,按照图1所示故障诊断结构框图逐层进行聚类分析,通过对比各特征量聚类正确率,为各类故障的诊断提取出最优特征量。
2.2.1 FCM 算法原理
FCM 算法是基于硬C 均值聚类(HCM)算法的改进,HCM 算法是对数据进行硬性划分,是将一个待识别对象严格划分到某一类中,但实际中经常存在不方便进行硬性判断的数据点,因此引入FCM 是对数据进行模糊划分,用隶属度确定每个数据点属于某一类的程度。
FCM 的基本原理为:把n个样本向量yi(i=1,2,…,n)分为c个模糊组,并求出每组的聚类中心vj(j=1,2,…,c),使得非相似指标的目标函数达到最小值。当选择欧氏距离作为非相似性指标时,模糊聚类的目标函数可表示为
式中:U为隶属度矩阵;V为聚类中心矩阵;uij为第i个样本xi隶属于第j类的隶属度,uij∈[0,1]且(uij)=1;m表示加权指数,m∈[1,+∞);dij为样本yi距离和聚类中心vj的欧氏距离,可以表示为
使目标函数达到最小值的最优条件是J(U,V)偏导为0,即
则求解公式(7)可以得到最佳隶属度uij和模糊聚类中心vj
2.2.2 特征量提取步骤
采用FCM 算法对故障数据进行聚类分析并提取最优特征量的步骤如下。
(1)首先进行热故障/局部放电和低能放电/高能放电故障间的聚类,随机选择64组故障数据进行分析,令C2H2/H2、C2H2/CH4、C2H2/C2H4、H2/C2H4、CH4/C2H6为特征量,采用其中一组比例特征量中的64组山茶籽绝缘油中溶解气体数据作为样本集。
(2)设定分类数c=2,加权系数m=2,dij采用欧式距离,并选择[0,1]之间的随机数初始化隶属度矩阵U,使其满足=1的约束条件。
(3)根据式(9)计算c个聚类中心vj。
(4)根据式(8)计算新的隶属度矩阵U。
(5)若相邻两次迭代的隶属度矩阵之间的距离,则停止运算,否则返回步骤(3)。
(6)统计各特征量对热故障/局部放电和低能放电/高能放电故障聚类结果,并结合样本数据类别计算聚类结果的正确率,筛选出正确率最高的特征量作为故障诊断特征量。
(7)重复步骤(1)-(6),分别提取出区分热故障和局部放电,低能放电和高能放电,以及低温、中温、高温热故障的特征量。
2.2.3 特征量提取结果
根据FCM 算法进行聚类分析结果及特征量的选择如表1所示,其中T 表示热故障,T1、T2、T3分别为低温、中温、高温热故障;PD 表示局部放电故障;D1表示低能放电故障;D2表示高能放电故障。
表1 各特征量聚类结果及特征量选取
从表中可以看出,C2H2/CH4对于热故障/局部放电及低能放电/高能放电两类故障聚类效果最佳;CH4/C2H6对于热故障及局部放电故障两类故障聚类效果最佳;C2H2/C2H4对于低能放电故障及高能放电故障两类故障聚类效果最佳;H2/C2H4对于低温、中温、高温热故障三类故障聚类效果最佳。
将用于判断山茶籽绝缘油故障类型的比例特征量C2H2/CH4、C2H2/C2H4、CH4/C2H6和H2/C2H4分别定义为判据Q1、Q2、Q3和Q4。根据山茶籽绝缘油中溶解气体数据及其变化规律,对其电故障和热故障进行分类,判据的边界值设定及无编码比值法的山茶籽绝缘油故障诊断流程,如图2所示。
图2 无编码比值法诊断山茶籽绝缘油故障流程
随机选取区别于训练数据的山茶籽绝缘油中溶解气体数据,采用无编码比值法对其电故障和热故障进行诊断,诊断结果准确率如表3所示。综合来看,无编码比值法在各种类型故障区分效果比较好,诊断准确率比较高,均超过80%,综合诊断准确率为88%,主要是由于无编码比值法的判据是根据油中溶解气体数据进行相关性分析和聚类分析获得的最有效特征量,将5种气体之间的比例关系综合考虑,因此准确率较高。
表3 无编码比值法诊断结果
针对天然酯绝缘油中溶解气体特性与矿物绝缘油不同的特点,基于DGA 的矿物绝缘油变压器故障诊断方法不再适用于天然酯绝缘油变压器。本文以山茶籽绝缘油中溶解气体数据为例,提出基于DGA 的适用于天然酯绝缘油变压器的无编码比值故障诊断方法,具体结论如下。
(1)通过采用相关系数矩阵分析和FCM 算法,提出C2H2/CH4、CH4/C2H6、C2H2/C2H4和H2/C2H4作为区分天然酯绝缘油变压器各种类型故障的特征量。
(2)C2H2/CH4可作为区分热故障/局部放电和低能放电/高能放电故障的特征量,当比值在[0,1]时,判定为热故障/局部放电,否则判定为低能放电/高能放电故障;C2H2/C2H4可作为判定低能放电故障和高能放电故障的特征量,当比值在(3.8,+∞)时,判定为低能放电故障,否则判定为高能放电故障;CH4/C2H6可作为区分热故障和局部放电的特征量,当比值在(0,0.8]时,判定为热故障,否则判定为局部放电;H2/C2H4可作为区分低温、中温、高温热故障的特征量,当比值在(6,+∞)时,判定为低温热故障,当比值在[1.7,6]时,判定为中温热故障,否则判定为高温热故障。
(3)本文提出的无编码比值法诊断局部放电和高能放电故障准确率最高,准确率为93%;诊断中温热故障准确率最低,准确率为80%,综合诊断准确率为88%,能够较为准确的区分和诊断天然酯绝缘油变压器故障。