基于深度学习的间隔棒故障识别方法

2021-06-16 02:40陈万培杨钦榕陈舒涵
无线电工程 2021年6期
关键词:池化网络结构注意力

张 涛,高 绅,陈万培,杨钦榕,韩 恒,陈舒涵

(扬州大学 信息工程学院,江苏 扬州 225009)

0 引言

伴随着国家经济发展水平和人民生活水平的提高,电网规模也在不断扩大,如何保障电网安全可靠地运行开始被广泛地关注。输电线路是连接国家电力网络的部件[1],而输电线间隔棒作为输电线路的重要金具,能够保持多分类子导线间距,保证线路的电力运输能力,防止导线间的鞭击、抑制微风振动和次档距振荡等。因此,对输电线间隔棒的检测是电力网络运检维护、保障电力安全的必要程序之一。

目前,电力设备的维护检查一般通过人工巡检的方式完成,由于架空线路和输电隧道架设的特殊性,线路巡查通常会对巡检人员的生命安全造成一定威胁[2]。借助无人机和监控摄像头的图像识别技术,代替人工进行安全检查已经成为目前较为有效的巡查方案[3]。现有的检测方式存在很多问题,在无人机拍摄电力部件的过程中,由于距离因素,这些电力部件距离无人机较远[4],在图像上显示的尺寸较小;监控摄像头只有录像和视频监控功能,无法对所需要的检测目标进行智能化识别分析。这些方式都需要进一步借助人工完成最后的故障检测分析,降低了自动化程度的同时,也延长了故障的修复时间。

卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积且具有深度结构的前馈神经网络,是深度学习(Deep Learning)的代表算法之一[5-6]。深度学习算法的发展和硬件运算水平的提高,使CNN逐渐应用在计算机视觉和自然语言处理等领域。作为计算机视觉重要的研究分支,基于CNN的目标检测算法在许多层面上都超越了传统图像处理算法[2]。文献[7]中使用自建的ImageNet输电线路多目标图像数据集,通过优化Fater-RCNN神经网络的Loss函数对图像进行识别定位,但对小目标的识别准确率不高,实时性得不到保证;文献[8]调整Faster-RCNN网络结构卷积核大小和图像的旋转变换等数据增强方法扩充数据集,取得了93.72%的平均准确率;文献[9]利用实际采集的绝缘子图像构建数据集,使用改进的Fater-RCNN网络模型在Dropout=0.6取得82.80%的准确率。以SSD[10],yolo[11]为代表的one-stage目标检测算法在保持较高识别准确率的前提下,其检测速度明显快于Fater-RCNN[12]等基于感兴趣区域(Region of Interest,RoI)的two-stage目标检测算法,可以满足实时性要求,因此更适合在工业现场和机器人系统中进行应用。

基于Fater-RCNN神经网络的目标检测模型虽取得不俗的识别准确率,但存在检测速度过慢问题,不能满足检测结果实时响应的要求。因此,在SSD算法的基础上,使用全卷积神经网络DarkNet代替原先的VGG-16网络,避免池化造成关键位置信息的丢弃,同时引入注意力机制,增强特征图的语义信息,进一步提高网络特征提取能力和算法检测精度。

1 相关技术理论和算法

1.1 SSD

SSD[10]在2015年由Liu Wei等人提出,引入多参考和多分辨率检测技术,提取网络不同尺度的特征,然后组合进行回归和分类。对比R-CNN[13-14]系列,显著提高了one-stage检测器的检测精度,特别是对一些小目标;采用了全连接的VGG-16作为特征提取网络,将全连接层FC6和FC7转换成卷积层Conv6和Conv7,实现了端到端,且易和多种主流的backbone融合;借鉴Fater-RCNN的anchor机制,针对不同尺寸的特征图,分别生成4~6个不同大小和不同长宽比的anchor框作为边框回归的预选框,实现多尺度检测。SSD网络结构如图1所示。

图1 SSD网络结构Fig.1 SSD network structure

1.2 池化

经典的CNN如LeNet5[15],Alexnet[16],VGG[17],类似于降采样的方式,在卷积层输出后引入池化层,以减少参数矩阵的尺寸,降低信息冗余,从而减少最后全连接层的参数量,提升模型尺度不变性和旋转不变性,防止过拟合。SSD融合使用VGG-16神经网络,采用最大池化方式进行降维压缩,加快运算速度。池化过程中会损失一部分关键的位置信息,某种程度上虽然实现了一定的平移不变性,但丢失了图像之间精确的空间相对关系。最大池化过程示意如图2所示。

图2 最大池化Fig.2 Maximum pooling

1.3 注意力机制

与人类选择性视觉注意力机制类似,深度学习中的注意力机制模仿人类观察事物,是一种将内部经验和外部感觉对齐从而增加部分区域的观察精细度的过程,能够忽略无关信息而关注重点信息,捕捉数据或特征的内部相关性,减少对外部信息的依赖,降低信息冗余。2014年Google DeepMind团队,在循环神经网络(RNN)中加入注意力机制[16],在图像分类实验中取得良好的效果。Spatial Transformer Networks模型[17]利用注意力机制,变换图片的空间信息,在压缩保留关键信息的同时,减少运算量,提升识别准确率。SEnet[18]引入通道注意力机制,得到不同信道的注意力权重,增强对关键通道域的注意力。

(一)国外研究进展。美国按诊断相关分类预付制或按病种预付制,病种的轻重程度及有无并发症等。支付标准以全国医院对该类疾病治疗的平均成本为依据。它总括了入院管理费用、检查费用和给药费用。日本全国统一价,两年调整一次,医疗服务总量不变,确定医疗费用总体调整幅度,日本的医疗总费用中有四分之一来自政府拨款。英国的RPI-X模型,(RPI代表通货彭胀率,X为监管者规定的一段时间内生产效率增长百分比。)美国采取的最高限价模型与英国略有不同,公式为Pi+1=P1×(1+RPI-X),(P为公共事业价格指数,其余与上同)〔1〕

2 本文算法

本文提出的输电线间隔棒目标检测算法在标准SSD算法基础上结合DenseNet-s-32全卷积网络,为了保证检测精度,最大程度保留图片的原始信息,使用步长为2的卷积代替Max pooling,引入注意力机制,增强输出特征层的语义信息。完整算法结构如图3所示。

图3 注意力机制算法流程Fig.3 Attention mechanism algorithm flow

2.1 基于DenseNet的特征提取网络

与ResNet[15]模型思路一致,DenseNet[16]建立前面所有层与后面层的密集连接(Dense Connection),每个层都会接受前面所有层作为额外的输入,实现特征复用,提升运算效率。网络采用常见的分层模块化结构模型,主干网络由一个Stem Block和一个四阶段特征提取模块组成。阶段一和阶段二使用卷积核大小为:2×2,步长为2的最大池化方式进行下采样;阶段三和阶段四使用w/o池化方式,使用卷积核为:1×1,步长为1的卷积进行下采样。考虑到最大池化过程中会损失一部分关键的位置信息,丢失了图像之间精确的空间相对关系,这里使用卷积核为1×1的卷积代替阶段一和阶段二的最大池化,完整的网络结构由表1所示。

表1 DenseNet网络结构Tab.1 DenseNet network structure

2.2 注意力(Attention)机制

引入注意力机制结构模型借以捕获通道维度中的特征相关性。具体来说,对于某一通道的特征,通过对所有通道进行加权求和来更新权重,其中权重由相应2个通道之间的特征相似性来决定。注意力网络很容易添加到CNN中,增强输出检测特征图的感受野和语义信息,提高与检测目标相关特征通道的权重,抑制或是忽略无关的通道信息。在注意力网络结构中,首先,对输入结构的特征图X(C×H×W)使用1×1×1卷积进行特征映射,降低信息冗余,映射之后得到3个相同特征尺度(C×H×W)的特征图α,β和γ,再对α,β和γ进行降维,三者降维后的向量尺度分别为α′=(C×HW),β′=(HW×C),γ′=(C×HW),对α′,β′使用向量点乘得到Catt=C×C,经过Softmax计算通道的权重系数后与γ′做点乘运算,最后得到新的特征图Y。图3为注意力机制算法流程。X表示输入的特征图,Y表示通道更新后输出的特征图。本文分别在SSD网络的block(3),Conv7、Conv8_2、Conv9_2、Conv10_2五种尺度的输出特征层引入注意力机制网络结构,更新这5个层的特征图,详细如图4所示。

图4 基于改进SSD的间隔棒目标检测算法结构Fig.4 Structure of the spacer bar object detection algorithm based on improved SSD

3 实验分析

本文实验使用Pytorch1.3.1深度学习框架,搭配NVIDIA GeForce GTX 2080Ti显卡进行训练。

3.1 数据集

目前暂无公开的数据集用于输电线路间隔棒的目标检测,借助网络、无人机和监控设备等途径,搜集间隔棒故障图片,通过数据增强方式,按照VOC2007数据集格式处理取得了750张间隔棒(Spacer)数据集,包含正常(Normal),歪斜(Skew)2类目标,以11∶4划分训练集和测试集。考虑到数据集样本不足够大,直接训练会导致网络不易收敛,导致检测效果不够好,因此结合VOC2012通用数据集组合成包含23类17 875张图片的大数据集对网络进行训练。

3.2 实验过程

针对Faster RCNN、SSD和mSSD,以及本文提出的SSD改进算法模型在同一测试集进行对比试验,使用平均准确率(mAP)和识别速率作为网络性能衡量指标,得到如表2所示的识别结果,部分实验结果如图5、图6和图7所示。

表2 不同算法平均识别准确率和识别速率Tab.2 Average recognition accuracy and recognition rate of different algorithms

图5 检测前Fig.5 Before detection

图6 检测中Fig.6 During detection

图7 检测后Fig.7 After detection

由表2可见,Faster RCNN的平均准确率为82.5%,识别速率为16帧/秒;SSD算法的平均准确率为83.4%,识别速率为47帧/秒;文献[4]提出的mSSD算法的平均准确率为89.6%,识别速率为38帧/秒;本文提出的算法平均准确率为91.2%,识别速率为40帧/秒。其中Faster RCNN的平均准确率和识别速率最低,本文算法的平均识别准确率最高,识别速率略逊与SSD,下降了7帧/秒,这是因为在模型中加入了注意力机制网络,导致了计算量的增加,但仍可以满足间隔棒故障实时检测要求。

4 结束语

以SSD目标检测算法为基础,提出了针对输电线路间隔棒故障的目标检测算法。原backbone网络VGG-16池化层会造成部分关键信息的丢失,提出使用改进的DenseNet-32卷积神经网络替换VGG-16,降低池化带来的精度损失,提升网络深度,引入注意力机制网络结构进一步增强输出检测特征图的语义信息。本文提出的算法在平均准确率为91.2%情况下,检测速率达到40帧/秒,可以满足间隔棒故障实时检测的现实要求。未来进一步工作是将该算法部署到终端设备上,做到输电线路的实时现场检测。

猜你喜欢
池化网络结构注意力
基于高斯函数的池化算法
让注意力“飞”回来
卷积神经网络中的自适应加权池化
基于卷积神经网络和池化算法的表情识别研究
用于手写汉字识别的文本分割方法
“扬眼”APP:让注意力“变现”
A Beautiful Way Of Looking At Things
基于广义混合图的弱节点对等覆盖网络结构
体系作战信息流转超网络结构优化
基于互信息的贝叶斯网络结构学习