王 锋
(广州致新电力科技有限公司,广东 广州 510540)
从1980年开始,局放缺陷识别逐步由人工识别转向机器识别。目前,局放识别正朝着智能化方向不断发展。但是,在真实环境中,绝大多数局放样本是无标签的,且对局放类型的判断很大程度上取决于经验的积累,缺乏足够的标签样本,导致分类分析的结果没有足够的可信度。因此,本文提出一种无标签数据标记的方法,并在此基础上实现局放样本的分类。
局部放电是高压电气设备绝缘材料局部区域的放电,不单单发生在导体附近,也可能发生在其他地方。
绝缘内部空穴或沿面放电主要包括电力设备内部绝缘表面的孔洞、裂痕以及污染引起的设备内部不穿透性局部放电,与工频电场有明显的相关性。当缺陷引起的场强达到一定数值时,就会发生局部放电,是引起设备绝缘破坏的主要因素。
悬浮放电一般存在于高压电气设备。处于低电位的部件(如硅钢片磁屏蔽)与地的连接松动脱落,会引起悬浮电位的放电现象。悬浮电位由于电压高且场强较集中,往往造成绝缘油分解而产生多种气体,致使绝缘性能严重下降。
电晕放电主要发生在设备内部导体倒刺和外角倒刺等地方,是气体中极不均衡电场特有的放电现象。例如,主导电回路表面存在缺陷、凹凸不平等,若场强过高都会造成局放现象。由于导体被气体包围,表现为电晕放电。
电力设备的安装或开关闭合过程中产生的细小金属颗粒往往会造成金属颗粒放电。这种颗粒往往存在于GIS的设计构造、安装、运输以及运行过程中。颗粒受高场强的影响随机浮动和跳动,形成了局部放电[1]。
当电力设备产生局放现象时,脉冲电流会形成不同频率的电磁波,因此需要不同频率的传感器采集不同的局放信号。一般采用的主要检测技术包括特高频(Ultra High Frequency,UHF)、高频(High Frequency,HF)、超声波(Acoustic Emission,AE)以及暂态地电压(Transient Earth Voltage,TEV)等。
UHF检测频段高,几百到几千兆赫兹不等。在GIS中,绝缘子等微小间断处对电磁波具有反射作用。在GIS室中,局部放电会造成谐振,使得局放的振荡时间加长,有利于测量。由于特高频检测方法能有效降低频率的电磁波等干扰,如电晕放电,因此它具有过滤低频干扰信号的能力[2]。
高频电流互感器(High Frequency Current Transformer,HFCT)是高频局部放电检测中最常用的一种传感器。它是一种电磁感应式传感器,具有便携性强、安装方便以及现场干扰能力强等优点。HFCT常安装于电气设备的接地线或末屏引下线位置。但是,对于无引下线,如高压套管和CT等设备,则不能采用高频局部放电检测技术进行检测。
AE局放检测是收集、处理以及分析电力设备局部放电时产生的超声波信号以获取设备工作状态的检测技术,也称为发射法[3]。超声波的振动频率大于20 kHz,主要测量电力设备的外围部分。电力设备在运行中存在强的电磁场,而超声波是非电检测,能有效避免电磁干扰,因此具有抗电磁干扰的优点。AE检测方法常用于测量各种一次装置的局放信号,但对设备内部缺陷不敏感,且受机械振动干扰大,难以判别放电信号,因此检测范围较小。
暂态地电压局放检测以带电检测为主,常用于环网柜、电缆箱以及开关柜等相关设备。但是,因为柜内的放电信号只能经由金属壳体间隙的内表面传播到外表面方可检测成功,所以TEV检测方法并不适用于GIS等设备。究其原因,在于GIS是完全密封的电力设备,没有金属壳体间隙[4]。
半监督学习(Semi-Supervised Learning,SSL)是机器学习中的重点研究问题,兼顾了有监督学习和无监督学习的思想。根据已有的少量带标签的数据,利用相关距离算法,对大量的无标签数据进行标记。它主要利用平滑、聚类以及流行等假设方法,对未知数据进行对应的标记,最后将有标签数据和无标签数据合并到一起,构成模型训练和测试用的数据集[5]。
半监督学习的核心思想是给出一个分布未知的但带有样本标签的数据集L和一个无标签的数据集U:
期望学得函数f:x→y可以准确推断数据x的标签y,|L|和|U|分别表示已有标签和未有标签的样本数量。在半监督学习中,有3个常用的假设来建立样本和目标之间的关系。
3.1.1 平滑假设(Smoothness Assumption)
位于稠密数据区域的两个距离很近的样本类标签相似,即当两个样本被稠密数据区域中的边连接时,有很大的概率具有相同的类标签。相反,当两个样例被稀疏数据区域分开时,它们的类标签很大概率不相同。
3.1.2 聚类假设(Cluster Assumption)
当两个样本位于同一类时,有很大的概率具有相同的类标签。这个假设的等价定义为低密度分离假设(Low Sensity Separation Assumption),即分类决策边界应该穿过稀疏数据区域,而避免将稠密数据区域的样例分到决策边界两侧。当样本数据之间的距离接近时,判定它们属于同一类,这种假设被称为聚类假设。根据该假设,分类边界需要尽可能保证稠密样本数据点不被分割到不同的类中。在本假设的前提下,半监督学习算法可以利用大量未标记的样本数据推断未标注的数据在样本空间中的分布情况,进而指导算法不断调整分类界限,从而保证不同类的样本尽可能分开。
3.1.3 流形假设(Manifold Assumption)
将高维数据嵌入到低维流形中,当两个样例位于低维流形中的一个小局部邻域内时,它们具有相似的类标签。流形假设的核心理念是同一局部邻域中的样本数据具有相似的性质,因此它们的标签应该相似。这个假设反映了决策函数的局部光滑性。相比于聚类假设,流形假设主要考虑的是局部特征,而前者主要关注全局特征。
标签传播主要依赖图的节点传播,计算已标记样本的节点与未标记样本的节点的距离(即相似度),然后根据距离的大小(即相似度的高低)自动更新调整标签。相似度越高,影响权重就越大,标签越趋于一致的概率就越大,标签更加容易蔓延。在标签传播过程中,初始带标记的数据标签不变,只是将已知的标签根据相似度的高低传给未标注的数据集。当算法执行完毕时,相似节点的概率分布是相近的,可以归为一类;反之,归为其他类,最终完成样本标记[6]。
相位分辨的脉冲序列(Phase Resolved Partial Sequence,PRPS)是将采集的原始局放信号按照相位、周期以及振幅3个维度进行划分与统计,生成周期-相位-幅值的三维图谱。图1为局放信号的PRPS图,x轴表示相位,y轴表示周期,z轴表示放电幅值。
图1 局放信号的PRPS(实验数据)
带有相位信息分辨的局部放电(Phase Resolved Partial Discharge,PRPD)是把具有相位信息的PRPS按照相位维度进行统计,最终只有放电幅值和在对应相位下的累计放电次数是二维平面图。图2为局放信号的PRPD图,相位是横坐标,放电幅值是纵坐标。点的颜色越深,表示在当前幅值和当前相位下放电次数越多。
图2 局放信号的PRPD(实验数据)
对已采集的不同类型的局放样本数据选取一小部分进行类别标注,然后利用标签传播算法对其余的无标签数据集进行标注,最后将前后两部分数据进行融合构成总的样本集。对所有的样本集绘制PRPS图谱,生成对应的数据集。一般将数据集分为训练集、验证集以及测试集3类。
利用Inception V3网络模型进行训练和迭代优化。相比于Inception V1和Inception V2,Inception V3网络模型的特点主要体现如下。第一,沿用Inception V2的结构,使用2个3×3的卷积层代替1个5×5的卷积层,减少参数数量的同时,不会导致图像特征的缺失,如图3所示。第二,应用池化和卷积并行的结构来减少计算复杂度[7]。第三,将空间卷积分解为不对称卷积,卷积的非对称分解可以将3×3卷积分解为1×3和3×1卷积。在输入输出filter数目一定的时候,卷积的非对称分解可以减少33%的计算量。然而,如果将3×3卷积分解为2个2×2卷积,只能减少11%的计算量。第四,用1×n和n×1卷积的串联来代替n×n卷积,计算量可以降低为1/n,如图4所示。采用深度学习的方法对局放样本进行分类,绝缘内部空穴或沿面放电分类准确率可达81%,悬浮电极放电可达85%,电晕放电可达82%,自由金属微粒可达81%,整体均在80%以上。
图3 2个3×3替换1个5×5卷积示意图
图4 1×n及n×1替换n×n卷积示意图(Inception V3)
本文提出了一种局部放电缺陷识别方法,在绝缘筒试验变压器装置上安装UHF和HF传感器采集不同类型的局部放电信号。试验装置可以模拟尖端、气隙、悬浮及颗粒等4种放电类型,每类放电现象先标注部分小样本数据,再利用标签传播算法对后续大量无标签的样本数据进行标记,生成数据样本。根据采集的原始信号数据绘制PRPS图谱,构成待训练和测试的图像数据集,然后结合深度神经网络的算法思想,采用Inception V3网络模型,对数据样本进行训练和迭代优化,最终完成局部放电缺陷的识别,旨在提供一种局放标签数据样本扩充和局放缺陷识别的方法。