尚福瑞 范云飞 郝强 甄志伟
摘 要:为了改善输变电工程作业人工检测效率低、人员财产安全风险频发问题,提出了一种基于神经网络模型压缩目标检测技术,结合改进的卡兹曼滤波进行目标跟踪,实现无人机对输变电工程的智能监控。通过深度可分离卷积模型,降低参数数量、提高推理速度,引入注意力机制和剪枝算法,降低神经模型复杂度和非必要参数,减少信息处理数量。同时采用欧氏距离改进的卡尔曼滤波进行目标跟踪,提升目标跟踪的实时性和准确性。实验结果表明,提出的组合模型算法与传统算法对比,可以充分提取文本的高频特征信息,对于不同颗粒度的数据集的准确率提升8%,召回率降低4%,性能更优,具有一定的科研及应用价值。
关键词:输变电工程作业;智能监控;深度学习;模型压缩;剪枝算法;卡尔曼滤波
中图分类号:TP391.1;TM743
文献标志码:A文章编号:1001-5922(2023)04-0182-05
Model optimization test of intellegent monitoring technology for engineering operation
SHANG Furui1,FAN Yunfei2 ,HAO Qiang3 ,ZHEN Zhiwei4
(1.Ministry of Construction of State Grid Qinghai Electric Power Company,Xining 810000,China;
2.State Grid Construction Department Xining Power Supply Company,Xining 810000,China;
3.State Grid Qinghai Electric Power Company Haidong Power Supply Company Construction Department,Haidong 810700,Qinghai China;
4.Tianjin Bohai Xinneng Technology Co.,Ltd.,Tianjin 300392,China)
Abstract:In order to improve the low efficiency of manual detection and frequent risks of personnel and property safety in power transmission and transformation projects,a compressed target detection technology based on neural network model wasproposed inthis paper.The technology was combined with improved kazman filter for target tracking,to achieve intelligent monitoring of power transmission and transformation projects by UAVs.Firstly,the deep separable convolution model was used to reduce the number of parameters and improve the reasoning speed,and the attention mechanism and pruning algorithm were introduced to reduce the complexity and unnecessary parameters of the neural model and reduce the amount of information processing.At the same time,the improved Kalman filter using Euclidean distance was used for target tracking to improve the real-time and accuracy of target tracking.The results showed that,compared with the traditional algorithm,the proposed combinatorial model algorithm fully extracted the high-frequency feature information of the text,and the accuracy of data sets with different granularity was increased by 8%,the recall rate was reduced by 4%,and the performance was better.In conclusion,theproposed combinatorial model algorithm has certain scientific research and application value.
Key words:power transmission and transformation works;Intelligent monitoring;deep learning;model compression;pruning algorithm; Kalman filtering
近年來,无人机技术以其低成本、高效率迅速抢占市场,与机器视觉、人工智能结合后,已逐步应用于电力巡检领域[1]。目前常见的无人机电力工程巡检主要应用超声、激光以及雷达等传感器,优点在于投入较低,但是检测精度和效率不高。而具有良好的拉伸性、柔韧性和精度高等能力的水凝胶材料是无人机传感器潜在的候选材料,且水凝胶材料具有较好的耐久性能和力学性能,可广泛应用于输变站工程作业智能监控中,同时传感器中的聚苯胺有两种形式,薄膜和水凝胶材料。与薄膜相比,水凝胶材料因其优异的性能,包括优秀的电化学性能和物理化学性能,吸引了更多的关注。因此,将水凝胶材料与传感器相结合是一个可行的方案。且国外学者Lee提出了计算检测目标间的匹配度和固化2个目标的度量方式相结合的方式进行目标检测,算法稳定性较高,检测精度有一定提升[2]。马尔斯提出了将卡尔曼滤波算法与支持向量机算法结合进行目标跟踪,有效的解决了目标在复杂环境中检测成功率低的问题[3]。还有提出增加YOLOV3算法的检测深度,基于此建立了一种目标检测监控系统[4]。
基于此,针对输电线工程作业特点提出了一种基于神经网络模型压缩目标检测技术,结合改进的卡兹曼滤波进行目标跟踪,实现无人机对输变电工程的智能监控。首先通过深度可分离卷积模型,降低参数数量、提高推理速度,引入注意力机制和剪枝算法,降低神经模型复杂度和非必要参数,减少信息处理数量。同时采用使用欧氏距离改进的卡尔曼滤波进行目标跟踪,提升目标跟踪的实时性和准确性。
1 基于特征贡献度的句向量构建模型
1.1 YOLOv4网络结构
YOLO系列模型具有速度好、检测精度高、灵活性强等特点,YOLOv4模型对比其他模型其对复杂背景下的小目标检测效果更好,结构如图1所示,其包括多个由1×1卷积、3×3卷积、残差结构形成的CR块构成。 YOLOv4对比YOLOv3网络,通过优化输入端、特征提取骨干网络、特征融合颈部、检测头提升处理性能。通过引入数据增强、自对抗训练模块,对目标图片进行预处理。引入卷积核、MISH激活函数、Leaky-ReLUctant激活函数,结合批归一化处理构成的特征提取骨干模块,提高模型的融合性、检测精度。增加目标检测的自学习能力,降低计算的成本,减少运算瓶颈。将金字塔池化层和基于路径聚合的网络结构(PANet)引入到特征提取层和结果输入层中间,对比YOLOv3网络结构特征传递的效率更高,检测精度和特征提取效果理想。
1.2 基于的注意力机制的改进YOLOv4目标检测算法
由于输变电工程作业过程中,无人机水凝胶传感器经常出现在目标较为简单但周围环境特别复杂的情况,因此本文引入了注意力机制用于降低复杂背景环境产生的干扰。结合注意力机制具有效果与性能无法兼顾的情况,本文对通道注意力机制进行改进,引入轻量级高通道金字塔分割注意力模块(PSA),并YOLOv4网络结构中的3×3卷积更换为PSA模块,形成新的骨干网络,并使用该模块计算特征图的通道权重,通过权重区分目标和复杂背景。同时可以自主学习持续更新特征通道的权重值,进一步区分目标特征信息、剔除低价值背景信息[6]。
模块与YOLOv4网络模型结合通过对特征通道执行全局范围的平均池化操作,获得一维卷积计算通道权重,前提是要须确保注意力的通道维度保持不变,卷积核的值使用内核值与通道维度进行除运算,即为卷积核的交互覆盖面,计算方法如式(1)所示。
k=ψ(C)=log(C)a+baodd(1)
式中:k代表注意力模块的通道维度C通过自动适应计算卷积核的大小;|·|odd代表相邻的奇数;a、b为线性函数相关系数,实验确定a、b分别取值2和1。引入注意力机制的特征骨干网络如图1所示。
本文引入了深度可分离卷积进行替换处理,减少成本的同时可减少参数数量。与传统卷积相同的深度卷积和卷积核是1×1一维卷积2部分组合构成了深度可分离卷积。
使用传统卷积时,对于一张(5×5)像素、三通道大小为5×5×33的输入图片,经过4个输出通道和具有3×3的卷积核的卷积曾卷积后,最终输出具有4个典型特征图,卷积层需要设置的参数大小为108,即为3×3×3×4。
同样的图片使用深度可分离卷积处理,第1步进行深度卷积处理时,采取逐级通道卷积的方式,在二维平面内,卷积核与通道数量一一对应,一个卷积核处理一个通道。因此,该图片经过处理后可生成3个特征图,卷积深度参数值为27,即为3×3×3。经过深度卷积后的特征映射数量与输入层通道值一致,由于每个通道独立卷积,没有充分利用其他通道的特征信息,因此使用第2步一维卷积(逐点卷积)进行特征组合产生新的特征映射。一维卷积的卷积核大小为 1×1×3上层通道数量值,通过特征映射深度加权运算后,获得新的特征映射。卷積核参数数量为12,即为1×1×3×4,新的特征映射图数量也为12。
采用深度分离卷积模型的参数数量约为传统卷积的三分之一,将深度可分离卷积代替CBL块连续卷积“×5”中的传统卷积后的,结构如图2所示。
将原YOLOv4网络中PANT模块的5层传统卷积核替换为深度可分离卷积,即为使用3×3、1×1、1×1、3×3 、1×1卷积核。
1.3 模型压缩
深度卷积神经网络表达能力随着网络层数的加深而提升,模型增大,运行效率降低,研究显示,网络结构中超过三分之二的权值可以不参与训练即可达到原有性能。因此研究引入稀疏训练、剪枝技术相结合进行模型压缩,保持检测精度的同时,提升运算速度。具体压缩模型主要采取余弦率衰减法、多尺寸训练等技术提高训练有效性,在此基础上进行稀疏训练、CR模块层剪枝以及通道剪枝等方式,进行模型压缩,流程如图3所示。
CR模块剪枝主要是剪枝权重底的层和通道,其前提为权重判定,由于批量归一化层可以体现特征图0到1之间的正态分布,本文将批量归一化层(BN)的缩放和平移参数作为权重评价参数,BN层的参数变化如式(2)所示:
y=λ×x-μδ2+φ+β(2)
式中:使用μ代表批归一化的均值;σ2代表批归一化的方差;γ代表模型缩放训练的阈值参数;β代表模型平移变化训练阈值参数,其中缩放参数可以保留归一化前的特征参数。因此主要以此系数作为权重评价值。权重的系数程度将影响模型剪枝的最终效果,本文使用L1正则化约束的方法对权重分布进行强制稀疏。通过对损失函数进行正则化处理完成强制稀疏,损失函数如式(3)所示:
Lsparsity=Lloss(b,b^,c,c^,o,o^)+∑γ∈Γg(γ)g(γ)=|γ|(3)
式中:使用代表正则化约束稀疏,用以平衡损失项。另外,本文采用近端梯度下降法对L1的正则化进行优化,解决到LI正则化约束在0点的导数会出现不存在的情况。
模型压缩的第2步为层剪枝操作,从神经神经网络模型的结构的完整性角度考虑,将每个CR块作为一个整体进行剪枝[8],共计38个CR块,通过对CR块的权重均值γ作为CR块是否被精简的标志物,按照CR块的γ的由底到高额顺序剪枝,由于该方法相对粗糙,既有可能出现精度损失较大的情况。因此,结合γ值的变化趋势,在一次剪枝过程中会采用相对保守的方式,每次按照CR模块二分之一的比率进行剪枝,具体的剪枝参数参见3.2实验环节。结合模型压缩的微调进行补偿,并持续开展循环迭代,通过此种方式减少迭代损失。
模型压缩的第3步为通道剪枝:即为根据层剪枝后得到的相对精简和稳定的网络结构后,根据全局剪枝参数值λ,对一定阈值下的通道进行剪枝操作。同时,设置保护阈值,避免某一层级的通道被过度剪枝,根据剪枝参数与CR块的缩放稀疏,换算全局减值率对应的通道剪枝阈值π1,根据通道保护阈值参数β,换算每个神经网络层的保护阈值π2,当既大于剪枝阈值和小于通道保护阈值同时成立时,对该通道进行剪枝操作。为了降低直接剪枝造成的精度损失,经过分析训练后的,选择0.3的比率设置剪枝率,即可以实现剪枝操作,又可以避免精度的过度损失,并结合迭代稀疏、微调对精度进行补偿,最终实现模型压缩的同时,减少了精度损失[9]。
2 基于卡尔曼滤波目标跟踪算法
输变电工程智能监控主要使用无人机水凝胶传感器进行监测,包括目标检测和目标跟踪两部分,目标跟踪部分本文结合卡尔曼滤波可准确预测视频监控目标运动轨迹,可稳定跟踪监测目标的优势。同时兼顾卡尔曼滤波对于运动特征变化较快的目标跟踪效果不佳,无法体现跟踪目标的典型特征等问题进行了优化。基于卡尔曼滤波的输变电工程目标跟踪算法如图4所示。
目标检测部分采用改进的YOVLO4网络模型,对视频输入图像的处理序列进行目标检测,获得检测目标,采用余弦相似度算法、欧式空间值距离计算法以及优化后的马氏距离的权重组合算法[10-13]对卡尔曼滤波算法中的目标检测位置和目标移动位置间的距离填充,提高对运动目标的轨迹预测的准确性[14]。其中,将检测目标、跟踪目标的外观特征点使用包含10层网络结构的深度学习的进行特征提取,计算二者的余弦空间距离,通过此值衡量外观特征的匹配度[15-17]。
3 实验结果分析
3.1 数据集
实验数据集选择上本文采用了无人机采集的输变电工程施工现场的9 782张不同高度、不同时间的现场人、车、树木、电力设施等物体在内的图片组成数据集合[18]。设置其中7 362张图片为训练集合、2 620中图片为测试集[19]。
3.2 实验结果
算法评价部分本文采用文献[20]使用的方法,针对数据集统一设置的分辨率大小为800×800像素的图片。算法性能评价指标主要从模型压缩效果和目标跟踪效果2个角度评价,目标检测算法的模型压缩效果评价指标为参数的数量、计算量以及参数压缩数量、计量量压缩比、F1值、平均精度均值。将YOLOV4原始算法,添加了注意力机制的改进算法作为基准模型,与引入注意力机制与模型压缩后的算法进行测试比较,结果如表1所示。
由表1可知,YOLOv4模型加入注意力机制后,并未改变模型体积和浮点的计算数据量。在平均精度方面,引入注意力机制并进行模型压缩后,平均精度值持续提升,整体提升了4.4%,F1分值同样提升较大,F1值提升了4。同时对比本文提出的算法,模型体积压缩到了原始体积的12%,预测时间减少6 ms。由此可见,经过压缩后的模型无论运算精度、运算速度上,性能均有较大提升,而且参数量和模型体积压缩效果明显。
实验中,重点测试了不同剪枝率下的YOLOv4模型的压缩效果,压缩模型采用的稀疏矩阵的反复迭代实现,不同剪枝率下模型压缩效果不同,具体结果如表2所示。
由表2可知,本文同样选择了剪枝率分别在60%、70%和80%的模型性能对比,在不同算法的计算量达到同样剪枝率的效果下,本文提出的算法对参数的压缩量达到了最佳,精度最佳,误差最小。剪枝率在70%时,对于参数的压缩率达到98%,参数量仅为1.58 MB,对比实验算法,提升了2.5个百分点。由此可见,本文提出算法性能提升明显。图5为应用本文后的目标检测效果图。
4 结语
本文结合优化后的神经网络模型进行目标检测,与改进后的卡兹曼滤波目标跟踪算法结合,实现无人机对输变电工程的智能监控。采用深度可分离卷积模型用于降低神经网络模型的参数数量,进一步提高推理速度,引入注意力机制和剪枝算法,降低神经模型复杂度和非必要参数,减少信息处理数量。实验证明,本文提出的组合模型算法与传统算法对比,识别准确率提升8%,召回率降低4%,具有一定的科研及应用价值;后续将对目标跟踪算法进一步优化,改善多目标情况下的追踪效果。
【参考文献】
[1]LEE I.BIG DATA:Dimensions,evolution,impacts,and challenges[J].Business Horizons 2017,60(3):293-303.
[2] MADAWALAGAMA S,MUNASINGHE N,DAMPEGAMAS,et al.Low cost aerial mapping with consumer grade drones [J].Coordinates,2016,8(4)13-18.
[3] HE KAIMING,GKIOXARI G,DOLLA R P,et al.Mask RGCNN [C]Proc of the IEEE Int Conf on Computer Vision.Piscataway,NJ:IEEE,2017.
[4] 冯帅,张龙,贺小慧.基于Jetson TK1和深度卷积神经网络的行人检测[J].信息技术,2017,41(10):62-64.
[5] 李慧霞,李临生,闰庆森.基于Mean Shift算法的目标跟踪综述[J].信息技术,2017,20(1):43-46.
[6] 李庆军,李培明,赵国仲,等.特高压输电线路环保水保智能监控平台研究应用[J].电网与清洁能源,2020,36(11):82-89.
[7] 罗琪.以深度学习方法为载体的医学影像实时变化检测算法分析[J].粘接,2020,44(12):132-135.
[8] 蔡必壮,葛展展,都海波.基于数字孪生的角钢塔攀爬机器人系统研究[J].控制工程,2022,29(3):509-514.
[9] 林艺华.基于深度学习的高速公路交通流数据监控方法研究[J].粘接,2021,46(5):182-186.
[10] 高西.深度学习技术在皮肤影像自动分类中的应用[J].粘接,2021,48(11):98-101.
[11] 林艺华.基于深度学习的高速公路交通流数据监控方法研究[J].粘接,2021,46(5):182-186.
[12] 崔艳军,陶刚,丁伟翠.基于BIM技术的特高压数字化管控系统在变电站工程中的应用[J].电力勘测设计,2023(1):49-55.
[13] 袁敬中,谢景海,许颖,等.基于全息数据的变电智慧设计方法研究及应用[J].电气应用,2022,41(9):38-48.
[14] 王鑫.输变电工程造价大数据平台构建与智能分析管控应用研究[J].电力大数据,2018,21(11):8-14.
[15] 张志坚.基于深度学习的肌电信号预测的研究[J].粘接,2021,45(2):134-137.
[16] 孙再征,樊志琴,茅东升,等.多重相互作用协同增强水下胶粘剂的研究[J].中国胶粘剂,2023,32(1):8-17.
[17] 王迪,張益明,张繁昌,等.利用先验信息约束的深度学习方法定量预测致密砂岩“甜点”[J].石油地球物理勘探,2023,58(1):65-74.
[18] 卢经纬,程相,王飞跃.求解微分方程的人工智能与深度学习方法:现状及展望[J].智能科学与技术学报,2022,4(4):461-476.