王坚俊,孙林涛,刘昌标,刘江明,周国伟,郭创新
(1.国网浙江省电力有限公司,杭州 310007;2.浙江大学 电气工程学院,杭州 310027)
变压器在电力系统中发挥着电压转换和电力输送的重要作用,是电力系统安全稳定运行的基石。变压器绝缘套管是变压器箱外的主要绝缘装置,保证变压器绕组引出线与电网的安全连接。一台变压器包含数个套管,套管的任何故障都会直接导致变压器发生故障。CIGRE(国际大电网会议)工作组于2015年通过统计指出,在变压器的起火或爆炸事故中,由套管所引起的故障超30%[1]。因此准确的变压器绝缘套管故障诊断对保障变压器安全稳定运行具有重要意义。
变压器绝缘套管的故障诊断方法包括超高频法、介质损耗法、频域光谱技术等。文献[2]使用超高频法对绝缘套管中局部放电时产生的超高频电磁波信号进行检测,从而获得局部放电信息,实现局部放电监测,但这种方法不易实现故障定位。文献[3]提出了利用介质损耗测量法来判断绝缘套管的绝缘性能,但是这种方法需要离线实验,会影响变压器的正常运行。文献[4]提出了基于频域光谱技术的绝缘套管潮湿故障诊断,这种方法的缺点是只对影响绝缘套管阻尼的故障敏感。上述方法难以实现在线故障定位或仅能诊断特定类型故障。由于不同类型的绝缘套管故障会导致不同的绝缘套管发热特性,因此利用红外图像可以准确地实现绝缘套管故障在线诊断。同时随着智能电站和巡检机器人的发展和普及,变压器产生了大量的红外图像数据集,为利用深度学习算法实现绝缘套管故障诊断提供了数据支持。
近年来,国内外学者也展开了一系列基于红外图像的缺陷智能诊断方法研究。在早期阶段,研究人员主要通过利用阈值分割[5]、区域分割[6]、边缘检测[7]等算法实现红外图像中目标与背景的分割,这些方法一般只适用于背景简单的图像,在处理复杂背景的图像时,有鲁棒性差、分离度低等问题。得益于人工智能方法的快速发展,越来越多的智能算法被运用到这一领域,例如文献[8]基于YOLO 网络实现了电力设备红外诊断,YOLO 是典型的一阶段算法,具有检测速度快但精度有所欠缺的特点。文献[9]利用Faster RCNN(更快速区域卷积神经网络)算法和温度阈值法实现了变电设备红外图像缺陷识别,但电压过热型故障设备本身温升较小,使用温度阈值法不易实现电压过热型故障的准确诊断。文献[10]利用Gentle Adaboost 分类器实现了支柱绝缘子红外图像识别,但是这种算法在处理不同角度拍摄的支柱绝缘子红外图像时有一定局限性。文献[11]基于R3Det 模型实现了变电设备电压过热型缺陷诊断,适用于不同角度的变电设备检测,减小了干扰区域的影响,实现了较高的诊断精度。
利用红外图像实现绝缘套管故障的在线准确诊断有3个关键点:一是提高红外图像中绝缘套管的目标检测准确率;二是均衡正常样本和故障样本的影响;三是提高模型诊断速度以实现在线诊断。为此本文基于Mask R-CNN(改进掩膜区域卷积神经网络)算法,通过数据增广和改进损失函数实现样本均衡和提高目标检测准确率,并改进了其主干网络以提高检测速度,实现在线诊断。
变压器运行时,绝缘套管、避雷器、电流互感器、电压互感器以及环境温度有明显的差异,这种差异也体现在变压器红外图像中。为了避免图像中其他区域的干扰,有效提取绝缘套管温度特征信息,必须从红外图像中准确分割出绝缘套管,检测的精度直接决定了变压器缺陷诊断的准确度。
常见的目标检测算法为图像中每个目标输出一个类别标签和矩形边界框坐标,而Mask RCNN[12]作为一种实例分割算法,在训练时使用的是像素级别的标注,可以获得更大信息量,不但给出检测目标的类别、矩形边界框坐标,而且给出每个目标像素级别的掩膜,实现了待检测目标的像素级别分割,非常适合本文提出的任务场景。
Mask R-CNN 是在Faster R-CNN 的基础上改进得到的,属于两阶段目标检测网络,如图1所示,主要由主干网络、特征金字塔网络、区域生成网络、3个输出分支构成。
图1 Mask R-CNN网络模型
主干网络是用于提取原始图像特征的多层神经网络,基于迁移学习的思想,主干网络可以使用预训练的参数,而不需要从随机初始参数中训练主干网络,从而提高训练速度、减少过拟合。因此骨干网络一般采用固定的网络结构,Mask R-CNN常用的主干网络为VGG(超分辨率测试序列)、ResNet(残差网络)、DenseNet(稠密卷积网络)等。
提出特征金字塔网络的目的是充分提取多尺度特征图。原始红外图像经过主干网络提取特征后分别得到不同尺度大小的特征图,将不同大小的特征图经过特征金字塔网络处理后得到多尺度特征图信息。如果仅利用单个深层特征,会导致图像中小物体的像素信息在下一个采样的流程中丢失[13]。
因此利用特征金字塔网络融合浅层与深层特征图信息可增强网络特征提取能力。
每个特征金字塔网络连接一个区域生成网络,所有区域生成网络共享参数,通过ROI Align将不同尺度的候选区域归一化到相同的尺寸大小。ROI Align使用双线性差值,而不是ROI Pool采用的池化运算,因此降低了因舍入产生的误差[14]。
基于ROI Align 算法提炼出的候选区域,有3个功能分支的输出,分别是分类、检测和分割。分类分支由全连接层和Softmax层组成,检测分支将回归拟合检测框的左下、右上坐标,分割分支将连接全卷积网络,每个分类会生成一个二进制掩码。
本文所使用的变压器绝缘套管红外图像由某省电力公司提供,一共有1 342张样本图像,其中1 256张正常绝缘套管红外图像,86张故障绝缘套管红外图像。使用Labelme 软件对绝缘套管红外图像进行标注,在图中框出绝缘套管,并标记相应的正常/故障标签,保存为XML文件。
从上文可以明显看出,绝缘套管红外图像的正负样本数量很不均衡,正样本数量远大于负样本数量。通过在损失函数中为负样本配置更大权重可以在一定程度上改善这个问题,但如果要从本质上解决这个问题,可以利用数据增广技术来扩增负样本的数量,以平衡正负样本的数量。常见的图像增广技术为水平垂直翻转、旋转缩放、裁剪平移等,完成扩增的数据集如图2所示。
图2 数据扩增
Mask R-CNN 是典型两阶段目标检测网络,包括第一阶段的候选区域生成和第二阶段的检测框坐标回归、类别分类、掩码生成[16]。因此Mask R-CNN的算法具有检测精度高,但推理速度慢的问题。尤其以VGG、ResNet、Densenet 为代表的主干网络,网络层数达到几十层甚至上百层,模型权重大小达到上百兆,带来了极大的计算压力。为了解决这一问题并满足运维检修过程中实时性的要求,本文利用MobileNetv3[17]作为Mask RCNN 的主干网络,它是经典的轻量级高效模型,可利用可分离卷积结构降低卷积计算成本。
可分离卷积是由逐深度卷积和逐点卷积构成,逐深度卷积将卷积核拆分成单通道形式,在不改变输入特征图像深度的情况下,对某一特定输入通道进行卷积操作。逐深度卷积虽然大幅减小了卷积计算量,但其输出的特征图仅有输入层所有特征图的一部分信息,为了保证输出的特征图包含所有特征图信息,提出了逐点卷积。逐点卷积使用1×1 的卷积核,将逐深度卷积每层的输出结合起来,这样能让每个新的特征图都包含上一层各个特征图的信息。
假设卷积的输入特征图尺寸为W×H×Cin,输出的特征图尺寸为W×H×Cout,如果使用标准卷积计算,此时的理论计算量F0为:
式中:kw和kh分别为卷积核的宽和高。
利用逐深度卷积,把输入特征图拆分为m组,同样将输出特征图也拆分为m组,按顺序对每组内的特征图做普通卷积计算,则计算量F1为:
然后对逐深度卷积的输出结果用1×1 的卷积核进行逐点卷积,此时的理论计算量为:
将逐深度卷积和逐点卷积的计算合并在一起,可以得到可分离卷积和常规卷积之间计算量之比:
可以看出可分离卷积能极大地减少计算量。对于一个3×3 大小的卷积核来说,可分离卷积大概可以减少8~9倍的计算量。
Mask R-CNN 的损失函数L由3 个输出分支的损失函数构成,分别为分类损失Lc、定位损失Lb和分割损失Lm,即:
式中:a、b、c分别为分类损失、定位损失、分割损失的权重。
本文提出绝缘套管故障诊断任务可以看作一个二分类任务,其分类损失函数LCE可以写作:
由于正负样本数量和不同样本分类的难度都存在一定差异,需要尽可能减小这种差异对神经网络带来的影响,常见的方法为引入FocalLoss[18]作为损失函数,在交叉熵损失函数的基础上引入了两个系数α和γ,FocalLoss 的函数计算如式(7)所示:
式中:α用来平衡正负样本数量不平衡的问题,正样本的权重为α,负样本的权重为1-α,如果负样本数量较少,可使α取小于0.5的值,让负样本损失函数的权重更大,让模型更关注负样本;γ用来解决难分类样本的问题,如对于正样本中易分类样本,其置信度p远大于难分类样本,因此赋予其损失函数(1-p)γ的权重参数,使得易分类样本的损失函数大小远小于难分类样本的损失函数大小,让模型更多的关注难分类样本。
但是FocalLoss 也存在两个问题:一是α和γ的取值完全由实验得到,只能根据实验结果的好坏不断调整(α、γ),为模型训练增添了难度;二是如果数据集中存在离群点,如图3被圈出的样本所示,这些离群点将被划分为难分类样本,采用FocalLoss 的模型会过度关注这些离群点,干扰模型的正常训练。
图3 离群点的干扰示意图
为了解决这一问题,本文引入GHMLoss[19],与FocalLoss 不同,GHMLoss 不再仅从单个样本的置信度p来调整Loss,而是按一定置信度范围的样本数量来调整Loss。
首先定义梯度模长g为:
梯度模长与分类的难易程度成正相关,g越大则该样本越难分类。
传统蔬菜育种多是以农艺性状调查结果为依据,以抗逆性、丰产性、品质为目标进行品种选育[4],而关于加工专用型品种的筛选和评价研究较少[5]。但加工前原料品种的外观、营养和加工特性直接影响了加工产品的质量[6,7],针对加工要求对品种进行评价,选择适宜的品种材料进行加工非常必要。本文以参试品比试验的18个华南型黄瓜优良新组合和对照(燕白黄瓜)作为研究对象,统一种植,测定了12项基础指标,采用相关性分析确定加工适宜性评价因子,应用层次分析确定评价因子权重,应用灰色关联度分析对 19个黄瓜育种材料鲜切加工适应性进行排名和筛选,以期为鲜切加工型黄瓜的育种筛选及加工提供科学依据。
对一个数据集来说,易分类样本的数量最多,但是难分类样本的数量也不少,因此少关注易分类样本的思路是正确的,但不能过多地关注难分类样本(数据集中的离群点),否则会导致模型的整体准确度下降。
为了更好地平衡易分类样本和难分类样本的影响,本文引入了梯度密度这一概念来衡量一定梯度范围内的样本数量:
对于梯度密度越高的样本,其损失函数应越小;梯度密度越小的样本,其损失函数应越大。因此GHMLoss写作:
式中:N表示梯度模长被划分为N个区域;下标i为样本编号。
GHMLoss 与FocalLoss 不同,不再过度关注难分类样本,而是按照样本的梯度密度调整Loss,能够更好地解决正负样本不均衡的问题。
本文实验采用Nvidia 1080Ti 图形加速器进行训练与验证,实验环境为Ubuntu 17.04,利用CUDA 和Cudnn 加速训练,计算机语言为Python 3.8,深度学习框架为Pytorch。实验数据集为1 342张包含绝缘套管的红外图像,经过数据增广后,共有1 863张绝缘套管红外图像,按8:1:1的比例划分训练集、验证集、测试集。
表1 给出了实验过程训练主要的超参数设置,训练采用Adam优化器优化网络参数,每次按一个Batch中的红外图像数据优化网络参数,达到设定的最大Epoch 后停止训练。同时采用weight decay和early stop机制[21],一开始使用较大的学习率,随着训练轮次的加深,学习率逐渐减小,当网络损失连续5个Epoch变化率小于0.01%,即提前终止训练,以此来加快训练速度,提高模型鲁棒性。
表1 模型训练超参数设置
本文使用故障诊断率、误报率、推理时间3个评价指标来验证模型的性能。模型的故障诊断率表示模型将故障绝缘套管正确识别为故障的数量占故障绝缘套管的比率;误报率代表模型将正常绝缘套管错误识别为故障的数量占正常绝缘套管的比率;推理时间代表模型在输入红外图像后给出诊断结果需要的时间。诊断率和误报率的具体计算方式为:
式中:ηFDR和ηFAR分别为故障诊断率和故障误报率;nTP和nTN分别为正常样本中被诊断为正常样本、故障样本的数量;nFP和nFN分别为故障样本中被诊断为正常样本、故障样本的数量。
使用训练集数据集训练模型,验证集数据集验证模型性能,取验证集准确率最高的模型用于后续的测试。
4.3.1 不同主干网络结构的性能对比
将主干网络为Resnet50的Faster R-CNN、主干网络为Resnet50 的Mask R-CNN、主干网络为Mobile Netv3 的Mask R-CNN 进行对比实验,验证不同模型进行绝缘套管故障的性能。每个模型采用的数据集相同,表2为实验结果。
表2 不同主干网络性能对比
从表2 可以看出,Mask R-CNN 网络相比Faster R-CNN 准确度更高,主要原因是Mask RCNN 能够获得更多的标注信息,能够对绝缘套管和背景做更精细的分类。但是Mask R-CNN 网络的检测时间较长,不能满足绝缘套管实时故障诊断的要求。而使用MobileNetv3作为主干网络诊断准确率略差于使用ResNet50 作为主干网络的模型,检测速度却有很大的提升,能够很好地满足实际需要。
4.3.2 不同损失函数的性能比较
使用MobileNetv3 作为Mask R-CNN 的主干网络,将损失函数为交叉熵的Mask R-CNN、损失函数为FocalLoss的Mask R-CNN、损失函数为GHMLoss 的Mask R-CNN 进行对比实验,实验结果如表3所示。
表3 不同损失函数性能比较
可以看出GHMLoss相比交叉熵损失函数可以明显的提升故障诊断准确率,和FocalLoss也有一定的优势,验证了GHMLoss在平衡正负样本、难易样本问题上的作用。
从测试集中抽取的不同样本的变压器绝缘套管故障诊断效果如图4 所示。图4(a)和图4(b)分别展示了含故障绝缘套管红外图像及其对应的诊断结果,图4(c)和图4(d)分别展示了无故障绝缘套管红外图像及其对应的诊断结果。从红外图像可以看出,图4(a)中间的绝缘套管顶部出现了明显的发热,模型也成功地以97.8%的置信度将其诊断为故障绝缘套管,其他红外图像无异常的绝缘套管,模型也未发生误判,验证了模型故障诊断的准确性。
图4 改进Mask R-CNN诊断效果
本文提出了一种基于改进Mask R-CNN 的变压器绝缘套管故障诊断方法,并将其应用到变压器绝缘套管故障诊断中。首先收集并标注含变压器绝缘套管的红外图像,使用数据增广技术扩大数据集中故障绝缘套管的数量,缓解正负样本不均衡的问题。然后针对Mask R-CNN 检测精度高,但检测时间慢的问题,提出利用轻量级网络Mobile Netv3 替代Mask R-CNN 的主干网络。同时使用GHMLoss 损失函数替代了交叉熵损失函数,进一步解决了正负样本、难易样本之间的不平衡问题。最后通过实验对比,分析了数据扩增、主干网络、损失函数对模型性能的影响,改进后的模型在检测准确度、检测时间等方面都有了一定的提升,故障诊断率达到89.72%、误报率为6.78%,检测时间为每帧216 ms,能够满足绝缘套管智能故障诊断的需求。不过目前受限于收集到的数据集标签仅有正常和故障两类,模型仅实现了绝缘套管正常与故障的诊断,可以依据导则进一步确定套管故障类别。未来将考虑收集故障信息更具体的绝缘套管红外图像数据集,直接实现绝缘套管具体故障类别的准确诊断。