基于改进卷积神经网络的智能物料识别技术研究

2024-04-19 13:57杨亚萍王洪亮
电子设计工程 2024年8期
关键词:锚框卷积尺寸

杨亚萍,刘 军,王洪亮

(1.国网陇南供电公司,甘肃武都 746000;2.国网甘肃省电力公司,甘肃兰州 730070)

随着新型电力系统建设的推进,配电网建设投资日益增加,这给相关电网工程的审计工作带来巨大的困难和挑战。由于配电网项目具有点多面广、跨度大等特点,传统审计工作通常由工作人员采用测距仪、滚轮、望远镜等常规设备进行现场检查,不但耗时长而且精度难以保证[1-4]。同时,部分配电网项目分布于复杂的地形环境中,审计人员进入现场核查极不便利,容易遇到紧急情况,存在较大地安全风险。

随着无人机技术的发展,其越来越多地被应用于电力工程项目的审计工作中[5-8]。但在数据采集过程中,受飞行高度、拍摄角度、光照强度以及背景环境等的影响,对于绝缘子、金具等电力线路物料元件的成像效果差、分辨率低,导致这些小目标物料识别检测效果不理想,严重影响审计的准确性。针对该问题,文中引入了改进的卷积神经网络算法以提高电力线路小目标物料识别的准确率,进而辅助配电网工程审计工作的开展。

1 SSD算法原理

单次多框检测算法(Single Shot MultiBox Detector,SSD)[9-12]是目标检测领域应用最为广泛的算法之一,具有检测精度高、计算速度快及支持多目标等诸多优点。原始SSD 的网络结构如图1 所示,其由基本网络和协助网络两部分构成。其中,基本网络采用了去除最后一层分类器的VGG-16 网络模型,而协助网络则由5 层卷积层构成。SSD 算法利用VGG-16网络模型和5 层卷积层进行输入图像特征提取,共形成6 个不同尺度的特征图像,从而实现大目标与小目标的多尺度目标检测。每个输出特征图像上均有预测锚框,并与真实锚框进行对比,计算偏移值和预测分类。最后,采用非极大值抑制算法(Non-Maximum Suppression,NMS)获得最终预测分类及预测锚框。

图1 SSD算法结构

假设特征图像尺寸为a×b×c,每个特征图像有s个预测锚框,分类结果有k种,则具有k×s个卷积核用于分类。由于预测锚框相对于实际锚框存在偏移值,所以有4×s个卷积核用于回归。因此经过回归和分类过程,共获得(4+k)×s×a×b个预测值。锚框的参数如下:

式中,cs为预测锚框的尺寸;ws、hs为预测锚框的宽度和高度;r为预测锚框的宽高比;cmax及cmin为预测锚框尺寸的最大值与最小值,通常取为0.9、0.2。

通过上述操作,每个特征图生成具有s个不同尺寸的同心预测锚框,预测锚框的中心坐标为:

式中,|fs|为特征图的尺寸。

SSD 网络的训练过程就是实现预测锚框与真实锚框之间的匹配过程。SSD 算法通过Jaccard 系数[13]计算预测锚框与真实锚框之间的相似度,相似度大于阈值的可标记为正样本,相似度小于阈值则标记为负样本。该相似度计算方法如下:

2 物料审计识别算法设计

由于原始SSD 算法采用VGG-16 作为基本网络,网络参数较多,训练计算过程较长,因此难以满足工程应用实时性的需求。同时,优化SSD 网络特征提取方法对模型精度的提升效果也较为有限。针对上述SSD 网络存在的问题,文中提出轻量化的基本网络以及基于k-means 算法[14]的预测锚框方法,从而提升SSD 算法的性能。

将无人机获取的电力线路图像作为输入,利用图像去噪和图像增强等技术进行图像预处理,然后将其作为改进SSD 网络的输入,并利用该网络实现目标特征提取与物料识别。文中所提算法框架如图2 所示。

图2 智能物料审计识别算法框架

2.1 图像预处理

1)图像去噪。采用改进导向滤波算法[15]进行输电线路的图像去噪,从而实现在复杂环境下最大程度地保留检测目标的边缘信息,且抑制背景噪声。去噪函数如下:

式中,αm和βm分别为导向窗口的一次项因子和常数项因子,K为导向窗口图像,o为输出图像,ωm为导向窗口内像素点数量。αm与βm的计算公式为:

式中,I为输入图像,为输入图像均值;ξ为惩罚因子;μm和为导向窗口图像的均值和方差。

根据式(5)、式(6),在取平均值的情况下,输出图像为:

2)图像增强。文中采用直方图均衡化方法[16]来增强图像的对比度,该方法的表达式如下:

式中,u和v分别为增强处理前后输入图像的灰度值,u的取值范围为[0,L-1];T(·)为直方图均衡化的转换函数。

进一步采用概率函数描述图像的灰度值分布,则输出图像灰度分布的概率密度为:

式中,pv(v)和pu(u)分别为输出图像与原始图像的概率密度。

假设转换函数为:

联立式(9)和式(10),可以得到:

2.2 改进SSD算法

1)轻量化卷积网络结构。假设输入特征图像尺寸为DI×DI×P,输出图像尺寸为DO×DO×Q,P、Q分别为图像的通道数。改进的轻量化卷积网络首先使用P个DZ×DZ×1 的卷积核实现各通道特征提取,然后堆叠成尺寸为DO×DO×P的特征图,再利用Q个1×1×P的卷积核映射成Q维。因此,改进的轻量化卷积网络参数的总数为DZ×DZ×P+P×Q,计算量为DZ×DZ×P×DI×DI+P×Q×DI×DI,与原始VGG-16 的计算量之比为:

由上式可见,文中所提轻量化卷积网络能够在保障计算精度的基础上,大幅减少计算量,并提升模型的训练速度。

2)基于k-means 的预测锚框设置。SSD 网络的预测锚框需要提前设置,原始SSD 网络部分特征提取层的预测锚框的宽高比适用于具有不同形状尺寸的目标识别场景。而文中待识别的电力线路物料外观尺寸均具有固定的标准,因此可以选用更加适合的预测锚框宽高比,以提高目标识别效果。基于此,文中提出以k-means 算法为基础的预测锚框宽高比设置方法,算法流程如图3 所示。其中,k-means 算法采用误差平方和作为聚类效果的评估指标,该指标计算方式如下:

图3 预测锚框宽高比设置

式中,S为误差平方和指标;Yi为第i个聚类中心,且共有Y个聚类中心;μi为属于第i个聚类中心的所有样本平均值。

2.3 SSD网络训练损失函数设置

SSD 网络训练需要完成分类和回归两个任务,输出结果则包括目标预测分类及预测锚框位置两部分。因此,SSD 网络训练的损失函数为:

式中,l和g分别为预测框与真实框;λ为分类置信度;Lfl和Lhg分别为分类损失及回归损失;T为正样本预测框数量;α为权重因子。

分类损失Lfl的计算方式如下:

式中,xij,p为数据样本i第j个预测框预测为p类别的标签,当预测为正样本时,其值为1,否则为0;λi,p为数据样本i预测为类别p的置信概率。

回归损失Lhg的计算方式如下:

式中,gj,m为默认锚框与真实框之间的偏差量;li,m为正样本预测锚框;SL(·)为函数,其表达式如下:

3 算例分析

为了验证所提识别算法的准确性和有效性,采用某电网公司采集的真实电力线路物料图像集作为训练数据,共包括横担2 875 张、绝缘子3 264 张和金具3 028 张,部分图像集的标准框如图4 所示。

图4 部分图像集的标准框

3.1 算法性能分析

测试结果表明,原始SSD 算法的训练时间为6 238 s,而文中所提算法仅需4 287 s,训练时间缩短了约30%。这是因为文中所提算法采用轻量化卷积网络替换原始SSD 网络中基本的VGG-16网络模型,从而大幅提升了计算速度,缩短了训练时间。

由表1 可知,对于不同的检测目标,原始SSD算法的准确率和召回率均低于80%,而文中所提算法的准确率及召回率则均高于82.5%。由此可见,所提算法能够减少电力线路物料识别的漏检、误检。

表1 不同算法目标识别结果对比

3.2 实际物料审计效果分析

进一步将文中所提算法应用于实际电力线路物料的审计统计工作,结果如图5 所示。其中,横担、绝缘子和金具数量分别为449 张、374 张和177 张,整体识别准确率约为90%。由此可见,所提算法在实际应用中具有良好的效果,能够提升电力线路物料审计的智能化水平。

图5 电力线路物料审计统计结果

4 结束语

文中针对配电网审计工作耗费时间长、准确度有限的问题,利用无人机采集图像数据,并结合改进卷积神经网络技术,实现电力线路小目标物料的智能识别审计。通过仿真算例表明,文中所提方法的训练速度相比于原始SSD 算法提升约30%,且算法的精确率和召回率均显著提高。在实际电力线路物料审计中,能够实现横担、绝缘子和金具等不同类型物料的准确统计。但文中所提算法未能实现电力线路物料缺陷的诊断,这将在下一步研究中开展。

猜你喜欢
锚框卷积尺寸
基于YOLOv3锚框优化的侧扫声呐图像目标检测
尺寸
锚框策略匹配的SSD飞机遥感图像目标检测
基于SSD算法的轻量化仪器表盘检测算法*
基于GA-RoI Transformer的遥感图像任意方向目标检测
CIIE Shows Positive Energy of Chinese Economy
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
D90:全尺寸硬派SUV