基于深度学习的破损绝缘子检测研究

2022-07-07 06:46:12王迎吴建胜

现代信息科技 2022年4期

王迎吴建胜

摘要：文章提出了一种基于Scaled-YOLOv4目标检测方法的破损绝缘子智能检测模型。针对Scaled-YOLOv4网络在训练过程中难以分辨有效信息的问题，分析Scaled-YOLOv4网络Neck部分的降采样操作会导致信息丢失，提出将改进的注意力机制加入网络模型中，设计了DC-Scaled-YOLOv4模型。将网络上得到的破损绝缘子数据集分配成训练集和测试集，并对故障识别模型进行训练。采用该模型对破损绝缘子进行识别测试，Scaled-YOLOv4在破损绝缘子数据集上的检测精度为80%，而文章算法在破损绝缘子数据集上的检测精度为94.8%，检测效果提升明显。

关键词：目标检测;Scaled-YOLOv4;注意力机制;绝缘子

中图分类号：TP393 文献标识码：A文章编号：2096-4706（2022）04-0123-04

Research on Damaged Insulator Detection Based on Deep Learning

WANG Ying， WU Jiansheng

（School of Computer Science and Software Engineering， University of Science and Technology Liaoning， Anshan 114051， China）

Abstract： This paper proposes an intelligent detection model of damaged insulator based on Scaled-YOLOv4 target detection method. Aiming at the problem that it is difficult for Scaled-YOLOv4 network to distinguish effective information in the training process， it is analyzed that the down sampling operation of Neck part of Scaled-YOLOv4 network will lead to information loss. Adding an improved attention mechanism to the network model is proposed， and a DC-Scaled-YOLOv4 model is designed. The damaged insulator data set obtained from network is allocated into training set and test set， and the fault identification model is trained. The model is used to identify and test the damaged insulator. The detection accuracy of Scaled-YOLOv4 on the damaged insulator data set is 80%， while the detection accuracy of algorithm proposed in this paper on the damaged insulator data set is 94.8%， and the detection effect is significantly improved.

Keywords： target detection; Scaled-YOLOv4; attention mechanism; insulator

0 引言

隨着深度学习技术的不断发展，越来越多的研究人员将深度学习引入到绝缘子检测当中，可有效改善传统方法的不足。近年来提出的基于深度学习的目标检测算法Scaled-YOLOv4平衡了检测精度和检测速度的关系，能够很好地代替传统算法。

Scaled-YOLOv4对Neck部分进行了CSP化，这样做的好处是CSP模块中的bottleneck结构能带来更深的卷积层，但仅仅只是加深网络时通常会带来更多的参数量，当参数量过多时也容易产生过拟合现象，且网络Scaled-YOLOv4中的下采样操作和1×1卷积虽然可以降维但也会丢失信息，导致Scaled-YOLOv4在训练过程中可能会学习不到有效信息。基于Scaled-YOLOv4算法的特点，本文采用深度学习的方法，对绝缘子图片进行检测，提出了基于Scaled-YOLOv4的改进模型。采用DS-CBAM与Scaled-YOLOv4算法Neck部分中的CSP模块相结合来检测绝缘子。

1 卷积注意力模块

卷积注意力模块[1]（CBAM，Convolutional Block Attention Module）用于前馈卷积神经网络，可以在通道维度和空间维度上执行注意力。CBAM中的通道注意力模块（Channel Attention Module，CAM）和空间注意力模块（Spartial Attention Module，SAM）互相独立。在卷积时，将一个中间特征图输入到CBAM模块，特征图沿着先通道后空间的顺序推导。然后将注意力图乘以输入特征图进行自适应特征优化，这样做节省了参数和计算力。由于CBAM轻量化的优点，使其可以以较小的代价随意嵌入到任何CNN架构中，并与该CNN进行端到端的训练。由于卷积注意力模块结合了空间（spatial）和通道（channel）的注意力，相比于只关注通道的注意力机制能产生更好的结果。实验表明，如果通道注意力模块和空间注意力模块采用串联的方式且先通道后空间，则实验效果更好。CBAM结构图如图1所示。

利用特征的空间相互关系可以生成一个空间注意力图。与通道注意力不同，空间注意力模块用于提取内部的关系，计算哪一部分是信息丰富的部分，这里输入的是经过通道注意力处理的数据。为计算空间注意力，同样经过两种池化操作，沿着通道轴进行平均池化和最大池化，分别将多个通道的值压缩到单个通道，再经过spatial层中7×7的二维卷积，使特征图降为一通道，计算得到对空间的加权。

2 深度可分离卷积

深度可分离卷积[2]包含逐通道卷积（Depthwise Convolution）和逐点卷积（Pointwise Convolution）两个步骤，用来提取特征图。首先，输入多通道特征图，将其按照通道划分为多个单通道特征图，然后对它们进行单通道卷积，这一步骤被称之为逐通道卷积（由于是按照通道卷积，所以逐通道卷积完全在二维平面内完成）。这种将多通道拆分的行为非常重要，它只调整了上一层的特征图大小，而产生的特征图通道数与输入完全相同。每个逐通道卷积的一个卷积核只卷积一个通道，一个通道只由一个卷积核进行卷积。

逐点卷积（Pointwise Convolution）的卷积核的宽和高都是1，而卷积核的通道数与上一层的通道数相同。逐点卷积会将逐通道卷积产生的几张特征图在深度维度上进行加权合并，生成新的特征图。逐点卷积的操作与普通卷积极为相似。

3 DS-CBAM

CBAM注意力机制的空间注意力模块中，采用了一个7×7大感受野的卷积核来聚合更广泛的空间上下文特征，这相比于3×3的卷积核更能增大感受野，但是同时，更大的卷积核也会带来更大的参数量。因此，在一个深度网络中大量加入CBAM模块无疑会带来一些运算开销，这就限制了CBAM的作用。在空间注意力中，空间注意力的使用性能由卷积操作的感受野大小决定，大的感受野能对上下文信息进行更好的聚合作用，同时增强空间注意力的表征能力。针对空间注意力中采用大卷积核会带来更多参数的问题，本文提出使用参数量较普通卷积更少的深度可分离卷积代替空间注意力模块中的传统卷积用于聚合空间注意力的空间特征，使得在卷积层感受野大小不发生改变的情况下减少参数量，同时由于深度可分离卷积能够在卷积过程中实现每个通道间信息的互相交换，即在空间注意力模块中加强了对通道信息的互联，所以可以使注意力模块更能注意到特征图中哪一部分是信息丰富且重要的，使整体运行效率高并且能够获得较好的精度。本文将改进后的模块叫作DS-CBAM。改进后的结构如图2所示。

4 改进后网络模型

4.1 Scaled-YOLOv4的Neck部分

Scaled-YOLOv4中提出了三种模型分别是YOLOv4-CSP、YOLOv4-tiny、YOLOv4-large。本实验所用的是Scaled-YOLOv4-large模型，该模型含有三种网络结构，分别为p5、p6、p7，本实验采用p5模型。

Scaled-YOLOv4将YOLOv4的Neck部分全部CSP化，Neck部分又叫FPN网络，其中包含有两种CSP结构，rCSP和rCSP（without SPP），如图3所示，其中rCSP存在于图3中粉色区域，rCSP（without SPP）存在于图3中蓝色和黄色区域。rCSP和rCSP（without SPP）结构如图4所示。

由图3可以看出，Scaled-YOLOv4的Neck部分结构组成十分简单，分别从堆叠系数为15、15、7的CSPDarknet模块输出尺寸为（52，52，128）（26，26，256）（13、13、512）的特征图，然后分别输入到图3中的CSPUp和CSPSPP模块中，经过Neck模块后从③、②、①号模块输出尺寸为（52，52，255）（26，26，255）（13、13、255）的特征图用于Detection-P3、Detection-P4、Detection-P5层进行预测。

4.2 DC-Scaled-YOLOv4

Scaled-YOLOv4的Neck部分CSP化的好处是CSP模块中的bottleneck结构能带来更深的卷积层，但仅仅只是加深网络时通常会带来更多的参数量，当参数量过多时也容易产生过拟合现象，且网络Scaled-YOLOv4中的下采样操作和1×1卷积虽然可以降维但也会丢失信息，导致Scaled-YOLOv4在训练过程中可能会学习不到有效信息。本文提出的DS-CBAM能够很好地注意到特征图中哪一部分是信息丰富且重要的，且能无缝插入到任何卷积神经网络中。为了能较好地提升检测精度，更好的学习有效信息，所以，本实验将DS-CBAM结构插入到rCSP（without SPP）结构中，改进后的结构如图5所示。

本文提出的DC-Scaled-YOLOv4算法是将DS-CBAM模块插入到Scaled-YOLOv4模型Neck部分的CSPUp模块和CSPDown模块中的rCSP（without SPP）结构中，本文将DS-CBAM模块插入到一个1×1卷积和一个3×3卷积中。DS-CBAM模块可以使经过卷积操作的特征图通过通道、空间注意力时着重关注到有用的信息，抑制无用的信息，突出表现特征矩阵中有效的信息区域，实现增强网络特征表达能力的目的。

如图6所示，在DC-Scaled-YOLOv4的Neck 结构中，对输入到⑤号模块中的特征图上面的特征进行下采样操作，然后将经过②号模块的特征图中和经过③号模块的特征图输入到⑤号模块中执行加法操作（对应元素相加），将获得的结果经过⑤号模块后输入到④号模块中去。这样做的目的是在特征图中获得有效的语义信息从而提高网络性能。在网络中利用较深的层来构建自底向上和自顶向下的特征融合，这样的结构称为特征金字塔。这种特征金字塔的结构可以使网络获得更加鲁棒的信息。此外，将底层特征图的特征和高层特征图的特征相累加的原因是，低层特征能够给出较为准确的位置信息，而这种位置信息经过多次的下采样和上采样操作后会产生一定的偏差。因此，应当构建更深的特征金字塔将高层特征和底层特征融合，最后将多个层次的特征信息在不同層进行输出。

5 实验与结果分析

5.1 数据标注

本实验数据来自网络，数据集中共包含绝缘子图像248张，将每张图片进行水平、上下翻转、亮度调整、随机角度旋转等八种数据扩充方式得到共2 232张。与另一绝缘子数据集合并构成共含5 531张图片的数据集。图像尺寸皆为416×416。

5.2 CBAM-Scaled-YOLOv4网络结构

本章中设置的CBAM-Scaled-YOLOv4模型用于验证本章提出的DS-CBAM算法检测效果优于CBAM算法。

与DC-Scaled-YOLOv4模型相同，CBAM-Scaled-YOLOv4模型是将CBAM模块插入到Scaled-YOLOv4模型Neck部分的CSPUP模块和CSPDOWN模块中的rCSP结构中。改进后如图7所示。

5.3 实验结果分析

本文用于衡量算法性能的指标为mAP（mean Average Precision），它是各类AP的平均值。平均精度AP（Average Precision）是指P-R曲线下方的区域面积，P-R曲线可以理解为在不同Recall下所有精度的平均值。AP是针对某一类的平均精度，mAP是一个数据集中所有类的AP平均值。因此，AP代表一类样本的平均精度，mAP是数据集的平均精度均值。

如表1所示，是Scaled-YOLOv4、CBAM-Scaled-YOLOv4与DC-Scaled-YOLOv4在绝缘子数据集上实验结果对比，由数据可以看出，Scaled-YOLOv4在绝缘子数据集上的检测精度为80%，CBAM-Scaled-YOLOv4在绝缘子数据集上的检测精度为84.8%，而DC-Scaled-YOLOv4的精度为94.8%，检测效果提升明显。

6 结论

为提升对绝缘子数据集的检测精度，本文对Scaled-YOLOv4算法进行了改进，将CBAM注意力机制进行改进并与Scaled-YOLOv4网络的Neck部分进行结合以提升网络获得特征的能力。实验结果显示，本文提出的DC-Scaled-YOLOv4算法能有效提升算法精度，与原算法相比精度提升了14.8个百分点，与CBAM-Scaled-YOLOv4算法相比精度提升了10个百分点，提升效果明显。本文下一步的工作将考虑缩减网络模型，进一步提升网络检测目标的速度。

参考文献：

[1] WOO S，PARK J，LEE J Y，et al.CBAM： Convolutional Block Attention Module [J/OL].arXiv：1807.06521[cs.CV].[2022-01-03].https：//arxiv.org/abs/1807.06521.

[2] CHOLLET F.Xception：Deep Learning with Depthwise Separable Convolutions [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition（CVPR）.Hawaii：IEEE，2017：1800-1807.

[3] REN S，HE K，GIRSHICK R，et al.Faster R-CNN：Towards Real-Time Object Detection with Region Proposal Networks [J].IEEE Transactions on Pattern Analysis and Machine Intelligence，2017，39（6）：1137-1149.

[4] WANG C Y，BOCHKOVSKIY A，LIAO H Y M.Scaled-YOLOv4：Scaling Cross Stage Partial Network [J/OL].arXiv：2011.08036[cs.CV].[2022-01-02].https：//arxiv.org/abs/2011.08036.

[5] LIN T Y，DOLLAR P，GIRSHICK R， et al. Feature Pyramid Networks for Object Detection [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition （CVPR）.Honolulu：IEEE，2017：936-944.

作者簡介：王迎（1997.11—），女，汉族，辽宁锦州人，硕士研究生，研究方向：计算机视觉。