高分辨率遥感影像输电杆塔智能检测方法

2022-09-12 09:25:22宋成根张正鹏赵瑞山卜丽静
遥感信息 2022年3期
关键词:高分辨率杆塔特征提取

宋成根,张正鹏,赵瑞山,卜丽静

(1.辽宁工程技术大学 测绘与地理科学学院,辽宁 阜新 123000;2.湘潭大学 自动化与电子信息学院,湖南 湘潭 411105)

0 引言

随着科学技术的飞速发展,工业生产水平和人民生活水平的提高,各种电器设备在人民的生活中被使用,巨大的电能消耗导致旧的电网已经不能满足人们越来越高的生活需要。2020年数据显示,配电网覆盖率达到90%,输电杆塔是承载电网重要的基础设施,然而每年输电杆塔都会新建、拆除以及遭受自然、人为破坏。输电杆塔信息得不到及时的更新,将会影响电网的安全高效运行。国家电网的智能化是电网行业的共同发展目标,高压输电杆塔的自动检测在国家电网的智能化中极其重要。另一方面,遥感技术快速发展,遥感影像分辨率越来越高,为遥感图像的目标检测开辟了更好的前景[1],同时,利用遥感影像进行大面积的输电杆塔目标检测可加快电网行业的智能化。但是,目前基于遥感影像的电塔检测方法一般采用人工解译或者是机器检测,人工解译需花费大量的人力物力,并且受人的主观影响,机器检测的方法泛化能力差,无法适应输电杆塔的多样性。常用的杆塔目标检测可以分为传统方法和深度学习方法。传统方法采用滑动窗口进行图片中的颜色、纹理、形状等特征的提取,分类器根据特征对其进行分类和识别。邹栋[2]采用直线段检测算法(a line segment detector,LSD)和角点检测(Harris),实现电塔的初定位,最后通过方向梯度直方图特征(histogram of oriented gradient,HOG)进行支持向量机(support vector machine,SVM)分类器的训练,采用训练好的分类器去除伪目标,实现杆塔的最终定位,具有较好的识别效果。刘操等[3]通过改进的HOG特征提取方法将多通道特征进行融合,最后采用SVM对融合后的特征进行分类器训练和车辆目标检测。柳长安等[4]通过融合飞行机器人的GPS信息和电力杆塔的GIS信息,得到电力杆塔在飞行机器人拍摄得到的图像中的位置,再采用可变形的组件模型(deformable part model,DPM)进行特征提取和SVM进行目标检测识别。

近些年来,深度学习的快速发展得到广泛关注,它能够从海量影像数据中学习目标特征[5],为自动提取目标特征提供了一个有效的框架。自R-CNN[6]的横空出世,之后的目标检测逐渐进入深度学习的时代。杨知等[7]基于SAR影像对输电杆塔的检测,采用YOLOv2和VGG模型联级的目标检测算法,首先使用YOLOv2对整景的输电杆塔进行识别,再使用VGG对识别结果进行假阳性消除,虽然提高了检测精度,但是检测速度大幅度下降。梁怿清[8]基于YOLOv3的高分辨率SAR影像的输电杆塔目标检测,将原始网络的输入改为适应目标尺寸大小的960×960,结合focal loss[9]思想改进损失函数,改善了YOLOv3的误检、漏检现象,但存在迭代时间长的问题。韦汶妍等[10]采用Faster R-CNN算法对输电杆塔检测,利用VGG16作为特征提取网络,进行迁移学习,提高了检测精度,缩短训练时间但是检测时间并没有改善。

综上,传统的目标检测算法由于其约束条件较多,在特定的场景下有较好的效果,环境发生变化时存在误检和漏检的问题,并且存在特征构建复杂、检测精度不高、检测速率较低等问题,处理过程较为复杂。虽然目前深度学习目标检测算法有一些改进,但并没有针对密集目标的检测进行改进,并且目前算法主要是针对SAR影像、地面拍摄影像的输电杆塔检测,对于高分辨率遥感影像的输电杆塔检测研究较少。

在数据集制作过程中发现,同一类别的输电杆塔大目标与小目标的特征差异较大,不同拍摄角度导致输电杆塔呈现不同形状,背景复杂且存在同一类目标相互遮挡的情况,最终导致电塔检测不准确。因此,本文对YOLOv3算法进行改进,解决上述问题,提出了高分辨率遥感影像的输电杆塔智能检测方法。而且,目前公开的大型数据集如DOTA[11]、VEDAI[12]等主要包含汽车、轮船、飞机、球场等常见目标,但没有公开的高分辨率遥感影像输电杆塔的数据集,因此,本文制作的输电杆塔目标数据集对后续输电杆塔的检测研究和发展具有重要实际应用价值。

1 输电杆塔数据集制作

1.1 数据来源

收集了中俄边境、江苏省、广州省等地区输电杆塔的航空遥感影像共1 110景,分辨率为0.5 m,详细参数见表1。影像数据集包含不同背景、形状的输电杆塔复杂情况,如图1所示。

表1 航空遥感影像数据参数

原始影像大小为30 000像素×20 000像素,通过Python程序进行图像裁剪,人工筛选获取不同背景、不同成像形状的输电杆塔数据集。针对原始影像中输电杆塔的尺寸特点,为了能够更好保证输电杆塔样本的完整性,本文数据集图片裁剪尺寸大小为640像素×640像素。

1.2 数据集制作

为了满足目标检测的通用标准格式,本文采用PASCAL VOC[13]格式标准制作输电杆塔数据集,数据集的详细制作过程如下。

1)利用LableImg软件进行图片中输电杆塔目标的手动标注。LableImg是由Python编写的,QT作为图形界面,用于深度学习数据集制作的图片标注工具。人工进行输电杆塔的识别,使用输电杆塔的最小外接矩形将目标选中,设置目标类别名称为“tower”,该软件生成与图片对应的可扩展标记语言xml格式文件。xml文件保存了图片中目标的类别名称和相对应的位置信息,其中标注的矩形框如图2(b)所示。xml文件中的(xmin,ymin)为图2(b)标注数据示例图中绿色矩形框的左上角坐标,(xmax,ymax)为矩形框的右下角坐标。

2)利用xml文件保存输电杆塔在图中的位置信息如图2(c)所示。根据YOLOv3的训练要求,将xml文件进行格式转换,主要包含训练图片的路径、目标坐标和目标类别信息。

1.3 数据集扩充

不同于汽车、轮船目标,输电杆塔属于塔状建筑物,在影像中随着拍摄角度的不同,输电杆塔呈现出的形状差异较大,其结构属于空间桁架结构,背景更为复杂。由于输电杆塔目标检测只有一类、影像数据有限,为提高模型的泛化能力,防止训练模型过拟合,需要对数据集进行数据扩充操作,主要采用平移、旋转、颜色变化等方式,如图3所示。

1.4 迁移学习

为解决数据少的问题,本文采用迁移学习进行模型的训练。基于此,本文使用COCO[14](common objects in context)数据集作为源域,本文的输电杆塔数据集作为目标域,使用COCO数据集学习到的模型参数来训练YOLOv3输电杆塔检测模型。

首先修改网络结构。因为COCO数据集包括80个类别,YOLOv3层输出为255,本文的输电杆塔检测只有一个类别,所以将YOLOv3层输出改为18。使用预训练权重文件,冻结主干网络的提取层参数不参与训练。因为主干网络已经使用大量的图片训练过具有良好的特征提取能力,所以直接将主干网络的特征提取迁移到输电杆塔的特征提取中。训练其余层进行参数微调,训练过程中损失趋于平稳时进行解冻,全部层参与训练,使得提取到的特征更适合输电杆塔的目标检测,从而实现源域到输电杆塔目标域的迁移学习。与从零开始训练相比,使用迁移学习能够很大程度上缩短训练时间,并且得到更好的特征提取效果,完成目标检测任务[15]。

2 输电杆塔目标检测算法改进

2.1 YOLOv3算法介绍

深度学习目标检测主要分为双阶段(two-stage)和单阶段(one-stage)算法,其中two-stage目标检测算法主要包括Fast R-CNN[16]、Faster R-CNN[17]等,one-stage目标检测算法主要包括YOLOv1[18]、SSD[19]、YOLOv2[20]、YOLOv3[21]算法等。YOLOv3是在YOLOv1、YOLOv2基础上进行改进,使用Darknet-53网络,并且采用多个尺度融合的方式做检测,对小目标的检测精度有很大改善。其中YOLOv3是目前为止速度和精度最为均衡的目标检测网络,并且在目标检测任务中性能表现尤为突出。

YOLOv3的特征提取网络主要由1×1和3×3的卷积层组成,由于引入残差结构[22]、锚点机制(anchor)和特征金字塔模块,使得YOLOv3算法有更强的特征提取能力、更高的检测精度以及更好的小目标检测效果。在对416像素×416像素图像进行特征提取过程中,借鉴特征金字塔网络思想,分别在13×13、26×26和52×52 3个特征尺度分配3个不同大小的预选框进行预测,从而实现端到端的目标检测。YOLOv3算法的损失函数由位置误差损失(中心坐标、长宽损失)、置信度损失、类别损失[23]共3个部分组成。

2.2 先验框选择

YOLOv3算法的先验框是通过COCO数据集采用K-means聚类算法得到,YOLOv3算法中的3个预测尺度分别对应3组先验框,如(10,13)、(16,30)、(33,23)、(30,61)、(62,45)、(59,119)、(116,90)、(156,198)、(373,326)分别对应52×52、26×26、13×13 3种尺度的特征图。由于COCO数据集包含20个类别并且目标尺寸差异较大,并不适用于输电杆塔检测,因此采用K-means聚类算法对输电杆塔数据集进行多次聚类求得平均聚类,结果为:(69,89)、(82,79)、(81,85)、(86,91)、(85,105)、(96,93)、(105,103)、(116,119)、(116,130)。

2.3 YOLOv3损失函数改进

YOLOv3的损失函数采用均方差作为目标框位置回归损失,对目标尺度敏感。研究表明,IoU不仅能反映预测框与真实框的重叠程度,同时还具有尺度不变性。但是当预测框真实框没有交集时,梯度消失不能够进行损失优化。当预测框与真实框重叠率相同时,IoU相同不能够反映出重叠效果,如图4所示,其中绿色框为真实框,黑色为预测框。

基于IoU存在的问题,Rezatofighi等[24]提出GIoU损失函数。虽然GIoU可以缓解非重叠情况下的梯度消失的问题,但是出现如图5所示的情况时,3种情况下GIoU相同并且等于IoU,GIoU退化为IoU导致失效。

为此,Zheng等[25]提出DIoU损失函数,使用距离优化方式来解决GIoU的失效问题。为了加快模型训练,本文采用CIoU进行损失优化,CIoU考虑了目标框回归的3个重要因素,即重叠面积、距离、长宽比。CIoU是在IoU的基础上引入了最小外接矩形、欧氏距离、最小外接矩形的对角线、界框横纵比。

2.4 非极大值抑制改进

在原始的非极大值抑制中使用IoU作为判断条件来抑制多余的目标框,但由于IoU仅仅考虑重叠区域,经常会造成错误的抑制,特别是在预测框互相包含的情况下。因此将YOLOv3中的非极大值抑制算法中的判断条件替换DIoU。DIoU同时考虑了重叠区域和两个中心点距离,能够改善目标重叠情况下的漏检问题,从而提高目标的检测精度,DIoU-NMS的公式参见文献[25]。

3 实验与结果分析

3.1 实验设置

本实验基于Pytorch1.2深度学习框架,编程语言Python3.6。

数据集划分为训练集、验证集,比例为0.9、0.1,分别在输电杆塔数据集中的训练集和验证集上进行训练和验证,数据集均为随机分配。为了保证实验的准确性,从与数据集无关的影像上重新制作测试数据集,数据集参数如表2所示。训练参数设置:最大迭代世代100,选用Adam优化器,前50世代批次大小设为8张影像(根据计算机性能来设),初始学习率为1E-4,后50世代批次大小设为4,学习率为1E-5。在调整为合适的参数之后,损失平稳收敛。本文使用表2数据集参数进行训练、验证以及测试,改进后算法的Loss曲线和P-R曲线如图6、图7所示。

表2 数据集参数 张

图6 Loss曲线的横轴为epoch,纵轴为损失值。由图6可知,改进后算法的损失值下降快速且平稳收敛。图7 P-R曲线的横轴为召回率,纵轴为精确率。由图7可知,改进后的算法在本文输电杆塔测试集上的精确率和召回率均接近1,说明改进后算法的误检率和漏检率都很低。本文将原始YOLOv3算法与SSD、Faster R-CNN算法进行了对比实验,并且将改进后的算法在本文遥感影像输电杆塔验证集进行算法评估,其中验证集的输电杆塔数量为458个,各算法结果如表3所示。

表3 各算法结果表

3.2 实验与结果分析

由表3可知,YOLOv3算法与SSD、Faster R-CNN相比,在检测时间相近的情况下,YOLOv3算法在各方面表现均优于其他两种算法。其中模型A是在原始YOLOv3算法上重新设置先验框,相比原始算法,其精确度和召回率略有提升。模型B为本文改进后的算法,其精确度和召回率有小幅度提升。改进之后的算法在对输电杆塔的检测中提供更加精确的最小外接矩形框,对杆塔的定位提供了更准确的数据,部分实验结果如图8所示。

由图8(a)可知,改进的YOLOv3算法改善了输电杆塔的误检。由图8(c)可知,改进后的算法为输电杆塔的目标检测提供了更为精准的目标框。由图8(b)与图8(d)可知,改进后的算法提高了对于输电杆塔密集目标的检测准确度。改进后的算法对复杂背景、密集目标的高分辨率遥感影像中的输电杆塔检测效果有一定的提升。

4 结束语

本文提出了高分辨率遥感影像输电杆塔智能检测方法,在YOLOv3目标检测算法基础上进行改进。首先,使用平移、旋转、颜色变化等方式进行数据扩充操作;然后,基于COCO数据集的迁移学习对YOLOv3的网络进行参数调整;最后,通过对输电杆塔数据集特点的分析,对先验框进行重新聚类,对YOLOv3算法的损失函数进行了改进,并使用DIoU改进的非极大值抑制算法,在检测过程中有效降低了目标误检、漏检问题以及为输电杆塔提供更精准的矩形框。改进后的算法在本文数据集上进行了实验验证。相比原始算法,改进的YOLOv3算法分别在检测精确度和召回率上提高了0.48%、1.53%,对于变电站附近的密集输电杆塔目标,山地、耕地的稀疏输电杆塔目标的检测有一定的改善,改进后的YOLOv3算法能够更好地适应高分辨率遥感影像的输电杆塔检测。

总之,高分辨率遥感影像的输电杆塔目标检测取得了98%以上准确率的良好效果,表明深度学习算法在高分辨率遥感影像输电杆塔检测中的可行性,并且本文数据集的制作对后续遥感影像输电杆塔检测的深入研究具有一定的借鉴意义。

猜你喜欢
高分辨率杆塔特征提取
基于北斗的高压输电杆塔智能实时监测技术与应用
卫星应用(2022年1期)2022-03-09 06:22:30
高分辨率合成孔径雷达图像解译系统
雷达学报(2020年3期)2020-07-13 02:27:16
基于ZigBee与GPRS的输电杆塔倾斜监测预警系统
电子制作(2019年11期)2019-07-04 00:34:36
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
Bagging RCSP脑电特征提取算法
基于粗糙模糊集的输电杆塔塔材实际强度精确计算
高分辨率对地观测系统
太空探索(2015年8期)2015-07-18 11:04:44
基于Curvelet-Wavelet变换高分辨率遥感图像降噪
基于MED和循环域解调的多故障特征提取
高分辨率遥感相机CCD器件精密热控制