杨廷方,张 航 ,黄立滨,曾祥君
(1.长沙理工大学 电气与信息工程学院,湖南 长沙 410077;2.南方电网科学研究院,广东 广州 510080)
电力变压器是电力系统的重要设备,其自身的可靠性已经成为电网稳定运行的基础。及时、准确地诊断出变压器故障尤其是危险事故发生之前的潜伏性故障,不仅直接关系到电能输送的可靠性以及电力系统运行的安全性,还可以避免其因事故扩大,造成停机以及对系统冲击、烧坏设备而产生的巨大经济损失[1-2]。因此,提高变压器潜伏性故障诊断的准确率,具有非常重要的研究意义。
目前变压器油中溶解气体分析(DGA)法已成为电力系统判断变压器内部故障性质的主要方法[1-3]。在DGA法中最为常用的是三比值判断法则。三比值判断法则形式简单、清晰,使用方便,但在现场应用中经常发现有缺编码、编码边界过于绝对等缺点,甚至有些比值还找不到对应的故障类型,因此其故障诊断的准确率还有待提高。随着人工智能技术的发展,采用神经网络[4]、模糊聚类[5]、灰色理论[6]和证据推理[7]以及其他智能方法[8-11]进行变压器故障诊断的研究成为比较热门的主题。然而,神经网络法虽然具备自学习能力,但对样本的依赖性较大;模糊理论较容易忽略样本空间的相关性;灰色理论也容易受人为主观因素影响;证据推理算法太复杂,且在评价过程中会具有一定程度的不确定性和主观性。所以,目前这些人工智能方法在变压器故障诊断应用中的成熟性还有待提高。
变压器内部潜伏性故障包含各种复杂的因素,且这些因素很多时候包含着重复的信息[12]。这些信息越冗长,就越不容易对故障的发展规律进行正确判断。然而在大部分故障研究过程中,故障的特征信息总是有一定的相关性。因此,如何消除特征信息变量之间的相关性以使故障判断更加精确,成为一个颇受关注的问题。1933年,霍特林提出的主成分分析 PCA(Principal Component Analysis)法便是实现这一目的的有效途径之一[13-14]。本文基于变压器DGA理论,提出采用改进型的主成分分析法直接对变压器内部故障进行诊断。通过主成分的累计贡献率阈值,选取主成分个数以及相应的特征向量,建立原始样本数据的主成分模型,使得包含信息不重叠且互不相关的主成分,具有能最大综合原始样本变量信息的能力[15-16]。这样更容易抓住事物的主要矛盾,使问题得到简化,尤其对于运行环境恶劣、故障类型和故障状态特征量之间存在着很大模糊性的变压器故障分析而言,理清这些故障性质关系具有明显的优势。
主成分分析主要是将高维数据投影到一个新的特征向量彼此正交的投影空间,实现对复杂过程数据的特征抽取,以便消除变量间的关联特性[17],从而使得原始过程特性分析的复杂程度得到大幅的简化。主成分模型舍弃了部分残差,同时保留体现数据特征的主要基因,从而达到抽取系统信息、清除系统干扰的目的。这对于处理和分析信息冗余、特征信号混叠的变压器内部故障非常有效。
设有n个样本,每个样本有p项指标(变量)X1、X2、…、Xp,得到样本初始矩阵 X:
对其采取主成分分析的步骤如下。
a.对样本初始矩阵进行标准化处理。为了消除量纲的影响以及各指标在数量级上的差别,需要对X进行标准化处理。常规标准化过程一般是通过样本与样本均值之差除以样本标准差而得到。然而本文算法的样本初始矩阵由于含有不同类型、不同数量级、不同含义的数据,所以在标准化处理过程中,两者要分开来,单独进行。为了更大程度地保留初始矩阵中各指标数值的特征信息,本文不采用传统主成分分析法的标准化方法,而是采用式(1)进行标准化处理,既消除了各指标数值在数量级上的差异,又保持了各个变量间的信息差异特征。
b.建立相关系数矩阵R,即:
其中,rij(i,j=1,2,…,p)为样本标准化数据矩阵的相关系数中元素的均值。
c.计算特征值与特征向量。运用Jacobi法求解特征方程=0,计算 R 的特征值:λ1≥λ2≥…≥λp≥0,并使其按大小顺序排列。同时还可求得与特征值相对应的特征向量 a1、a2、…、ai、…、ap。
d.求出样本xi主成分Fi:
e.计算主成分贡献率Ti及前C个主成分的累计贡献率MC。
变压器DGA是目前分析变压器内部故障最有效的方法。本文算法以DGA数据为基础,选择H2、CH4、C2H4、C2H6和 C2H2这 5 种气体的含量作为特征量,诊断变压器潜伏性绝缘故障。大量的研究证明,充油电气设备的故障诊断不能只依赖于油中溶解气体的组分含量,还应取决于气体的相对含量。基于热动力学基础上的三比值法,可以反映气体的相对含量,且在现实中被广泛接受。所以本文采用三比值法的编码组合作为输入量,来提取样本的状态特征。
根据IEC60599规程以及我国现行颁布的GB/T7252—2001《变压器油中溶解气体分析和判断导则》,将变压器潜伏性故障状态分为8种状态(其中包含正常状态),各状态序号依次为 1、2、…、8,见表1。
表1 变压器故障类型Table 1 Types of power transformer fault
故基于主成分聚类分析的变压器内部潜伏性故障诊断步骤如下。
a.根据变压器运行状态的DGA数据(即待测样本)、状态特征样本的DGA数据,以及各自的三比值编码,形成样本初始矩阵。每个样本有8项指标(p=8,共8维,其中包括5个气体含量加上3个三比值编码)。
b.采用式(1)对样本初始矩阵进行标准化处理。
c.建立相关系数矩阵,计算特征值与特征向量。
d.计算主成分贡献率及累计贡献率,根据主成分累计贡献率以及阈值ε,选取样本主成分。选择主成分主要是为了区分样本所包含的主要特征信息和次要特征信息。主要特征信息由主成分子空间反映,可用主成分累计贡献率MC表示,而次要特征信息主要包含噪声,可用1-MC来表示。当满足式(6)时,可以确定前C个主成分,即可以反映样本矩阵X的主要特征信息。
其中,0
图1为确定主成分个数m的流程框图。
e.计算待测样本和状态特征样本主成分之间的距离,判断待测样本的状态归属。由式(4)及图1可求出样本空间中,待测样本和状态特征样本的主成分分别为(f为变压器故障类别的序号)。由于欧氏距离是最常见的距离度量,衡量的是多维空间中各个点之间的距离,而其在距离测度中的作用又被各个领域广泛应用,所以本文利用式(7)计算主成分间的欧氏距离df,作为待测样本和状态特征样本之间的总体相似度。距离越小,两者越相似。
图1 主成分选择流程Fig.1 Flowchart of principal component selection
找出最小的距离,就可判断待测样本属于哪一类故障状态(包括正常无故障状态)。
本文选取8组经吊芯检查具有明确结论,且故障状态类型单一、未发生多重性故障、发生严重故障前已被诊断出的变压器DGA数据作为状态特征样本,如表2所示,其中,包含正常无故障状态的样本;第8组数据同时含有放电和过热故障,但其每种故障点(源)都只有1处;气体含量是指压力为101.3 kPa、温度为20℃时,每升油中所含各气体组分的微升数,后同。
表2 变压器状态特征样本Table 2 State characteristic samples of power transformer
(1)一变压器发生了低能量放电故障,其检修后的 DGA 数据为:H2含量为 1330.0 μL/L,CH4含量为10.0 μL/L,C2H4含量为 66.0 μL/L,C2H6含量为 20.0 μL/L,C2H2含量为 182.0 μL/L;其三比值编码为 112。
a.根据表2形成样本初始矩阵X,见式(8)。在矩阵 X 中,x9为待测样本,而 x1、x2、…、x8为状态特征样本。
b.根据式(1),分别对X的DGA数据和三比值编码进行标准化处理,再按照式(2)建立相关系数矩阵R。然后运用Jacobi法计算R的特征值λ与特征向量矩阵a。
c.按照式(5)计算主成分累计贡献率矩阵M。在实际应用中,一般当MC>0.995时,选择的主成分已经能保证足够的精度。本文取阈值ε=0.005。当MC≥0.995时,根据累计贡献率矩阵M以及式(6),可确定其主成分的个数为6(因为M6=0.995)。
d.由于其主成分的个数为6,故只选取特征向量a1—a6。再按照式(4),得到样本主成分表达式F如式(9)所示。
e.根据式(7)计算待测样本的主成分FM与其他样本主成分的距离 d:
由式(10)可知,d3=0.7883最小,即待测样本x9属于第3类故障状态,由表1可知是低能量放电故障,诊断结果与实际现象一致。而笔者采用大卫三角形法和IEC60599三比值法分别诊断为高能量放电和局部放电故障,存在误判。
(2)某220 kV变电站的某台主变正常运行2 a时间后,出现异常。变压器内部有“唰、唰、唰……”的响声,并伴随着异常震动。后来取油样进行色谱分析,得到 DGA 数据为:H2含量为 124.00 μL/L,CH4含量为 17.50 μL/L,C2H4含量为 33.10 μL/L,C2H6含量为 3.60 μL/L,C2H2含量为 117.10 μL/L;其三比值编码为202。
按照本文方法的故障诊断步骤,同理可得待测样本的主成分F9与其他样本主成分F1、F2、…、F8的距离d:
由式(11)可知,d4=0.5686最小,即待测样本属于第4类故障状态,由表1可知是高能量放电。后来对该变压器进行放油,在本体内发现有载分接开关油箱漏油,致使本体油箱的油与有载分接开关油箱中的油混合,且在A相转换开关处有电弧放电故障发生,即高能量放电故障,诊断结果与实际一致。而笔者采用大卫三角形法和IEC60599三比值法都诊断为低能量放电故障。
(3)某110 kV变电站的某台主变(型号为SF7-31500/110)投运前油色谱完全正常。运行5个月后,气体继电器“轻瓦斯”信号频繁动作。进行色谱分析,得到 DGA 数据为:H2含量为 1582.00 μL/L,CH4含量为 95.50 μL/L,C2H4含量为 48.00 μL/L,C2H6含量为 35.0 μL/L,C2H2含量为 0 μL/L,其三比值编码为011。用IEC60599三比值法判断,存在无对应故障类型的编码组合(缺编码组合)的问题。用改良三比值法判断,也找不到对应故障类型。但是用本文方法能诊断出该变压器故障类型为第2类故障状态,即局部放电故障。后经过吊芯检查未发现异常,低压绕组A相有2根铝线脱焊松动,焊口处有放电痕迹。这也证实了本文方法的诊断结果与实际相一致。
为了进一步检验本文方法的准确性和有效性,笔者从中华电力(香港电力公司,CLP)、南方电网、福建省电力公司以及香港理工大学搜集到30组经吊芯检查、具有明确状态结论的变压器DGA数据作为测试样本,进行故障诊断,结果见表3。表中的状态序号与表1一致,指示每个样本的故障类型。
笔者采用本文方法对这30例DGA数据样本进行诊断分析。另外,为了进行诊断效果对比,笔者还分别采用大卫三角形法、IEC60599三比值法、改良三比值法、模糊C均值(FCM)法对表3中30组变压器故障样本进行诊断,诊断结果如表4所示。在表4中,样本序号和状态序号与表3是一致的。当每种诊断方法诊断出的状态序号与表4中第2列的状态序号一致时,说明该诊断方法诊断准确,否则诊断错误。表4最后2行分别是每种诊断方法准确诊断的样本总数以及诊断的准确率。
从表4可以看出:大卫三角形法、IEC60599三比值法、改良三比值法、FCM法以及本文方法,准确诊断的样本总数分别是 22、21、10、21、26,其对应的诊断准确率分别是73.33%、70.00%、33.30%、70.00%、86.67%。由此可以看出,本文方法诊断的准确率最高,大卫三角形法、IEC60599三比值法次之,改良三比值法最低。这说明本文方法能够较为准确地反映变压器的运行状态,具有一定的有效性,且一定程度上对样本中的噪音具有较强的去噪和免疫能力,其通过计算出样本的主成分,实现对复杂信息的特征抽取,消除变量间的相关特性,从而提高了聚类的精度。
表4 5种方法的诊断结果Table 4 Results of five diagnosis methods
另外,通过选取不同的特征样本进行诊断,发现使用本文方法,不同的特征样本对待测的样本评判结果影响不大。当然,样本数据的准确以及精确,更会对诊断产生影响。
a.采用变量绝对值之和对变量进行标准化处理,既消除了各指标数值在数量级上的差异,又保持了各个变量间的信息差异特征。
b.样本空间的变量包含了DGA的5种特征气体和三比值编码,计算主成分的累计贡献率阈值,选取主元个数,形成主成分模型,简化了变压器繁冗的信息特征;分析样本主成分之间的距离,判断变压器潜伏性故障状态归属。该方法对于理清变压器复杂的潜伏性故障性质关系具有明显的优势。
c.比较分析了本文方法、大卫三角形法、IEC60599三比值法、改良三比值法、FCM法对30组变压器DGA样本数据的诊断结果,结果表明本文方法能有效地提高变压器潜伏性故障诊断的准确率。