史强,刘鹍,李金嵩,李福超
(国网四川省电力公司 营销服务中心,四川 成都 610041)
电容式电压互感器(capacitor voltage transformer,CVT)是电力系统中不可或缺的重要电气设备,其通过串联电容分压原理,对一次侧高压电信号进行测量,并由电磁单元降压隔离,将低幅值电压信号传递至计量、继保及自动控制等二次设备,实现电力系统的一、二次侧电气隔离及信号测量。由于长期运行在强电场环境下,CVT内部绝缘结构可能因老化而产生局部放电(partial discharge, PD),长期的局部放电也会导致绝缘进一步的劣化[1-3]。不同类型缺陷所引发的局部放电具有不同特征,通过对局部放电信号进行检测分析可有效评估电力设备绝缘状态,为CVT设备绝缘诊断提供可靠的评判依据[4]。
传统的局部放电信号分析方法主要包含2 种:基于相位分布模式(phase resolved partial discharge,PRPD)统计谱图的分析方法[5];基于单一脉冲信号的分析方法[6-7]。前者通常利用放电相位φ、放电量q及放电次数n的统计参数绘制指纹谱图并进行特征量提取,而后者则是对局部放电单一脉冲的时频特性[8]进行特征提取,通过提取不同的特征量可对不同类型局部放电信号进行识别[9]。但在实际应用中,基于单一脉冲信号的分析方法所检测到的脉冲波形与放电源、传播路径以及检测系统的带宽和采样频率均有关,直接对单一脉冲信号进行分析的方法应用在不同的放电源与检测系统时缺乏一定的适用性[4]。相比之下,基于PRPD统计谱图的分析方法对采集系统的要求较少,但如果被测对象存在多种不同缺陷,多种局部放电源共同放电会导致PRPD图谱出现重叠[10-11],从而无法对局部放电类型进行有效识别。而实际情况是长期运行的电力设备大多包含不止一种放电类型,如长期运行的电力电缆受到温度的影响会导致绝缘界面压力变化,这个过程中形成的绝缘表面空腔会在一定场强下回激发出局部放电,从而使得放电类型增加,放电类型就可能不止一种[12-13]。因此,需要进行针对多源放电情形下放电类型识别的研究。
目前针对多源局部放电的放电类型识别多基于先对放电脉冲进行特征提取,再利用聚类算法将不同放电脉冲进行分类,继而通过识别分离后的子放电类型来判断放电类型。比较具有代表性的方法是等效时频分析(equivalent time-frequency analysis, ETFA)方法[14-16],该方法先通过计算局部放电脉冲的等效时宽与等效频宽2个参数,映射到T-F平面上,再通过聚类方法将其自动区分。另外,文献[17]利用累积能量函数作为特征表征脉冲时域波形与频域分量;文献[18]利用基于S变换时频分布的脉冲相似度作为特征;文献[19]通过计算各半波脉冲的能量来描述局部放电过程。以上各种研究中所提的特征参数在其对应的实验对象上均取得良好的应用效果,但上述部分特征参量会受到各种测试因素的影响,在某些条件下可能会出现特征重叠的情况,从而无法进行有效的分离;且根据以上研究结果,可用于对局部脉冲进行表征的特征有很多种,在使用时需对这些特征进行定义与选择,过程也较为繁琐[20]。
为避免因部分所选特征重叠而造成的多源局部放电脉冲无法有效分离的问题,本文提出一种基于t分布随机领域嵌入(t-distributed stochastic neighbor embedding, t-SNE)算法与快速搜索密度峰值聚类算法 (clustering by fast search and find of density peaks, CFSFDP)的局部放电脉冲分类技术[21]。该技术首先借助一种相位同步装置[22]同时采集放电脉冲信号与其对应的相位信息,对采集到的脉冲信号进行去噪处理与绘制其对应的小波时频谱图,再以时频谱图为对象通过t-SNE算法进行降维处理已得到不同放电脉冲的低维特征分布,然后利用CFSFDP算法对低维特征进行自动分类,并通过聚类决策图中的离群点去除数据中的噪声数据,最后借助相位同步装置采集到的相位信息与已分类的脉冲信号进行PRPD图谱的重构,进而实现多源局部放电脉冲的有效分离。
t-SNE 算法是一种用于降维与数据可视化的机器学习算法,其基本思想是将点间的距离转化为条件概率来表述数据的相似性。相较其他的降维方法,t-SNE算法更倾向于保留数据自身的局部特征[23],其原理大致如下。
假设高维空间中存在点集X={x1,x2,x3,···,xi,···,xN},其中点xi与xj为邻近点的概率pij为
式中:σi是以xi为中心的高斯函数的方差,该值通过人为设定复杂度因子得到,复杂度因子定义为
其中,
t-SNE 算法通过二分搜寻法来确定σi与复杂度因子对应关系。
另假设Y={y1,y2,y3,···,yi,···,yN}为点集X对应映射到低维空间中的点集,其中点yi与yj为邻近点的概率qij为
为了使降维后低维空间中点的分布尽可能与对应高维空间中的保持一致,t-SNE算法采用Kullback-Leibler散度(K-L散度)来表述2个空间中点集分布的相似情况,并以K-L散度作为目标函数,通过让其最小化来使得2个空间中点集的分布一致。目标函数表达式为
通过随机梯度下降法来使目标函数最小化,目标函数的梯度计算式为
进而得到低维空间中点集的迭代公式为
式中:t为迭代次数;η为学习率;α为动能因子。
CFSFDP算法是一种基于密度的聚类算法,通过计算样本点的局部密度与距离来确定聚类的类别数与中心点位置[24-26],其原理大致如下。
假设聚类数据集为D={x1,x2,x3,···,xi,···,xN},dij=dist(xi,xj)表示数据点xi与数据点xj的距离,对于数据集中任意点xi,将其局部密度ρi定义为
距离δi定义为
式中:参数dc为截断距离,按经验通常取dij按升序排列的前1%~2%位置处的距离值。另外对于局部密度最大的点,有δi=max(dij)。
在计算出所有数据的ρi与δi后,以ρi为横坐标,δi为纵坐标绘制其对应的聚类决策图,样本簇密度中心的点所对应的局部密度ρ与距离δ值较大,因此可以通过聚类决策图来确定样本簇中心及种类数。文献[21]的方法可实现聚类中心的自动确认。在确定了聚类中心点后,对每个聚类中心点分配类别标签 {c lass1,class2,class3,···,classN},N等于确定的聚类中心点个数,将其他的样本点分配到与其距离最近且拥有高密度值样本点所在的簇中,并且通过平均局部密度指标来剔除部分疑似噪声的离群点,最终获得聚类结果。
本文通过在实验室环境下搭建如图1所示的实验平台对算法进行验证。
图1 工频局部放电测试平台Fig. 1 Power frequency PD testing platform
为保证实验过程不受实验设备自身的干扰,本实验采用工频无局部放电实验装置进行加压测试。图1中红色虚线框部分为本次实验针对电容式电压互感器中常见的油纸绝缘与膜纸复合绝缘2种绝缘结构[27-28]所制作的多局部放电源电极模型。该模型主要由3块直径1 m厚度60 mm的饼状铝电极组成,其中上方两块连接高压端,最下方一块接地。实验前可在下方2块电极之间任意挂载如图2所示的4种典型缺陷模型,以满足单个或多个局部放电源的需求。
图2 典型缺陷模型Fig. 2 Typical defect models
其中,气隙放电模型采用3片厚度为1 mm的绝缘片重叠放置,中间1片中心位置处有一个直径2 mm的圆孔,实验时将3片绝缘片浸没在变压器油中,并将四周的固定螺母旋紧,以防沿面放电的发生及变压器油渗入中间圆孔中;沿面放电与电晕放电模型的电极间置有1片圆形绝缘片;悬浮放电模型在球型电极上端置有1个块球形绝缘块。
本次实验使用的示波器采样率设置500 MSa/s,为了在采集单个局部放电脉冲信号的同时获取其相位信息,本次实验采用文献[22]中的方法,通过一个相位同步装置,将工频的正弦波信号转化为与频率相同的锯齿波信号,该锯齿波信号在每个周期内固定输出0.0~3.6 V的电压。为了能完整采集到脉冲信号的波形,通过设置2倍于背景噪声的阈值上升沿触发采集2.8 μs内的局部放电单个脉冲信号与同时刻的锯齿波信号,最后使用搭载有局部放电采集软件的计算机同时保存局部放电信号与锯齿波信号,实现单个局部放电脉冲信号与其相位信息的同时采集。图3为使用相位同步 装置进行局部放电采集时示波器采集到的波形。
图3 相位同步装置波形Fig. 3 Waveform of the phase synchronization device
图3 a)中,黄色曲线为实验所加的工频信号,蓝色为相位同步装置生成的锯齿波信号,粉色为由高频电流传感器 (high frequency current transformer, HFCT)采集到的局部放电信号,图3 b)为实际采集的波形,通过获取此时锯齿波信号的幅值的平均值即可得到脉冲发生的相位。该方法相较于常规局部放电采集方法省去了脉冲提取的步骤,且在高采样率下有效减少了局部放电数据的存储空间,对于超高频的局部放电检测有着更高应用价值。
在单局部放电源的条件下分别对4种典型缺陷模型进行实验,每种放电类型的放电起始电压(partial discharge inception voltage, PDIV)分别如表1所示。对每一种放电类型均采集400组实验数据,得到如图4所示的各种放电类型的脉冲波形,以及如图5所示的小波时频谱图。
表1 典型缺陷模型PDIVTable 1 PDIV of typical discharge models
图4 典型放电脉冲波形Fig. 4 Typical discharge pulse waveform
图5 典型放电脉冲时频谱Fig. 5 Typical discharge pulse T-F spectrums
等效时宽与等效频宽是对局部放电脉冲进行分析时常用的一对特征[14],对每种典型缺陷放电脉冲数据各取400组进行小波去噪与归一化处理,并计算每个脉冲对应的等效时宽与等效频宽,得到如图6所示的4种典型缺陷放电的等效时频特征分布图。
由图6可以看出,部分沿面放电与电晕放电的局部放电脉冲出现了重叠的现象,这种情况下聚类算法无法将其有效地分开,需要选择新的特征来观察其特征的分布情况,但局部放电存在十几种常见的时频特征,从中选择最有效的2种,且 又涉及特征的提取与选择,其他过程较为繁琐。
图6 典型缺陷等效时频分布Fig. 6 Equivalent time-frequency distributions of typical defects
为解决因脉冲时频特征叠加而导致的多源放电脉冲无法有效分类的问题,本文提出一种基于t-SNE与CFSFDP算法的局部放电脉冲分类技术,其具体流程如图7所示。
图7 基于t-SNE与CFSFDP算法的局部放电脉冲分类流程Fig. 7 Flow chart of partial discharge pulse classification based on t-SNE and CFSFDP algorithms
为验证t-SNE算法的有效性,本文对单局部放电源实验下采集到的各400组脉冲时频谱图进行t-SNE降维特征提取,目标维度为2维。根据多次实验得出,复杂度因子设置为样本总数的1/4~1/2时具有较好的降维结果;另外迭代次数为1 000,学习率为300,图8所示为降维结果。
图8 t-SNE降维结果Fig. 8 Dimension reduction results of t-SNE
图8中,X1与X2分别表示经t-SNE算法降维特征提取后得到降维特征1与降维特征2,其数值并无具体的物理意义,但可适用于对具有同类特征的局部放电脉冲进行区分。由图8可以看出,相较于图6中以等效时宽与等效频宽作为特征量的分布情况,经t-SNE降维后的数据除了个别错分点外,4种放电脉冲均能单一成簇,且没有明显离群点,各类别间没有重叠且相距较远,有利于聚类算法的进行。
为进一步体现t-SNE算法的优越性,本文采用主成分分析(principal component analysis, PCA)与 截 断 奇 异 值 分 解 ( truncated singular value decompsition, T-SVD)这2种常见降维方法在同组数据下进行降维处理,并对比降维效果。图9所示为PCA与T-SVD的降维效果。
图9a)与图9b)中,X1与X2分别表示经PCA与T-SVD算法降维特征提取后得到降维特征1与降维特征2,从降维结果可以看出,相较于t-SNE方法,传统的降维方法存在较多明显的离群点,且各放电类型分布形状不规则,簇间数据相对较近,其中T-SVD方法的沿面放电与电晕放电还出现部分重叠,不利于聚类。
图9 不同方法对比Fig. 9 Comparison of different methods
为验证本文方法在多局部放电源情况下的脉冲分类效果,本文在如图1所示的实验平台上挂载有沿面放电与气隙放电2种电极模型进行实验,采集1 000次放电脉冲波形并绘制对应的时频谱图,对经t-SNE降维后的数据进行聚类处理,图10为CFSFDP算法的聚类决策图与聚类结果。
通过图10 a)可以看出,该实验采集到的1 000组放电脉冲的降维特征中存在2个点具有较大的局部密度与距离,以这2个点作为聚类中心对其余各数据进行自动分类得到明显两类数据。利用各类数据点索引对应的原始脉冲波形与锯齿波信号波形进行该类放电PRPD谱图的重构,得到如图11所示的重构PRPD谱图。
图10 基于CFSFDP的脉冲聚类Fig. 10 Pulse clustering based on CFSFDP
图11 重构后的PRPD谱Fig. 11 PRPD spectrum after reconstruction
由图11可明显看出,类别1放电在第一、三象限的分布较为对称,且部分放电脉冲相位接近于0°;类别2则称不对称分布,第一象限的放电幅值明显大于第三象限,第三象限内的放电次数较多,这与文献[22]中气隙放电和沿面放电的PRPD谱图特征相符,说明采用基于t-SNE与CFSFDP算法的局部放电脉冲分类技术能有效地将不同类型的放电脉冲进行分类,且能够较准确重构出该类放电对应的PRPD谱图。
为解决在进行多源局部放电脉冲分类时因等效时频特征分布重叠而导致的脉冲无法有效分离的问题,本文提出一种基于t-SNE与CFSFDP算法对放电脉冲进行分类的方法,并通过一种相位同步装置对PRPD谱图进行重构,主要的成果与结论如下。
(1)通过t-SNE算法对放电脉冲的灰度时频谱图进行降维处理,低维后的数据没有出现混叠现象,各种类型的放电脉冲单独成簇,不同放电脉冲能被有效区分。
(2)采用CFSFDP算法在对降维后的数据进行聚类处理可实现不同类型脉冲的自动分类,且根据聚类决策图的离群点判别可对部分零散噪声点进行去除。
(3)相位同步装置可采集到的放电脉冲相位信息且相较于传统方法所需存储空间较小,结合CFSFDP算法的分类结果实现对PRPD谱图的重构。