基于深度学习的遥感影像目标检测研究

2021-02-11 06:24李仕佳
科技创新导报 2021年24期
关键词:边框卷积样本

李仕佳

摘要:遥感影像目标检测与识别是近些年来国内外研究的难点,利用深度学习的目标识别技术,直接从遥感图像中学习符合数据分布的模型,能够满足对高维、海量大数据的处理需求。该文用SSD作为目标识别的模型,首先根据要识别的目标物体和其对应的环境特征,利用Google Earth影像等构建多尺度、多类别的样本数据库;其次结合Tensorflow深度学习环境,在VOC2012预训练的权重文件基础上,用SSD模型对样本库进行优化训练,获取可供用于目标识别的检测模型;最后基于FLASK搭建目标识别处理页面,可根据需求输入影像,通过按钮进行目标识别处理,最终保存目标检测的后影像。利用深度学习进行遥感影像的目标识别,可主动学习目标的特征,具有较好的检测效果,同时基于FLASK将目标识别过程可视化,有助于方法的拓展应用。

关键字:遥感影像 深度学习SSD 目标识别 FLASK

Research on Remote Sensing Image Target Detection Based on Deep Learning

LI Shijia

(Stargis (Tianjin) Technology Development Co., Ltd., Tianjin, 300384 China)

Abstract: Remote sensing image target detection and recognition is a research difficulty at home and abroad in recent years.It uses the target recognition technology of deep learning to directly learn the model in line with the data distribution from remote sensing images, which can meet the processing needs of high-dimensional and massive big data. In this paper, SSD is used as the model of target recognition. Firstly, according to the target detection and its corresponding environmental characteristics to be identified, using Google Earth images constructs multi-scale and multi-class sample database. Then, based on the Tensorflow deep-learning environment, using SSD optimizes sample database with the weight files of VOC2012 pre-training to obtain the detection model for target recognition. Finally, the target recognition processing page is built based on FLASK, and the image can be input according to demand with button for target recognition processing to save the final image of the target detection. Using deep-learn for target recognition of remote sensing images can learn the features of the target actively and effectively. At the same time, it is useful for expanding the application with visualization of target recognition process based on FLASK.

Key Words: Remote sensing image; Deep learning; SSD;Target detection; FLASK

精准识别遥感影像中的目标物体,定位目标的空间位置,长期以来受到国内外学者的广泛关注。随着高分辨率卫星的迅猛发展,高分辨率遥感影像数据急剧增加,分辨率亦可达亚米级,从而为利用遥感数据精确分析地物目标提供了可能。通过人工解译的手段识别遥感影像中的目标,工作量大、效率低,难以满足日常工作的需求,因此研究基于大数据遥感影像的目标识别算法已成为当前的迫切需求。目前,目标检测主要分为基于特征的机器学习的传统检测算法以及基于深度学习的检测算法[1]。

基于回归方法的目标检测算法,最为著名的是YOLO和SSD,与基于候选区域的目标检测算法不同,这类算法直接从图像中回归出目标的位置和类别,检测速度较前者显著提升,其中YOLO(Redmon等,2016)网络结构简单,但存在网络检测易遗漏、定位不准确的问题,SSD(Liu等,2016)结合Faster R-CNN和YOLO的优点,检测速度较Faster R-CNN快,定位准确度较YOLO有所提升[2]。本文在分析现有的主流目标检测框架的基础上,综合考虑遥感影像中目标物体的特征,最终选取SSD作为遥感影像的目标检测框架,对遥感影像进行目标识别,并利用FLASK编写目标检测可视化页面,便于算法的拓展应用。

1方法原理

基于深度学习进行遥感影像目标识别,关键在于检测模型的确定,需在确定训練模型框架的基础上利用大量样本数据进行迁移训练获取最终可用于检测的模型。

1.1  样本制作

利用Google Earth影像、国产高分影像等数据渠道可收集大量图像,各类影像分辨率从亚米级到米级不等,成像质量等级不一,采集时段不同,天气状况多样,为了提高训练样本的质量,需进行一系列预处理操作,从而更好地获取各类复杂情况下的目标特征。在此基础上即可制作样本数据集。

由于遥感影像中的目标对象的尺度多样,占有的像素点个数较少,因此,选取不同空间尺度的目标对象制作样本数据集。之后,为缓解人工收集样本个数有限、效率低等问题,本文对样本进行了镜像翻转、和 旋转等操作。通过上述操作,扩充了样本数据集,增加了样本的多样性,有助于学习到目标对象更多的特征。样本参考VOC标准格式,大小统一,方便后期图像放缩操作和图像放缩过程中对应的目标边框放缩运算[3]。VOC标准样本格式中的XML文件记录了样本影像的基本信息和目标对象名称和目标对象在应样本中的具体位置。之后,用Python编写脚本,按照设定的训练样本占总样本的比例,将制作好的样本分为训练样本和测试样本。

1.2 SSD目标检测网络

SSD通过回归的方法直接从图像中回归出目标的位置和类别,本质上一个前向传播的卷积神经网络,SSD结合Faster-RCNN算法中的anchor机制和YOLO算法中使用回归方法进行目标类别和位置预测的机制,检测速度较Faster-RCNN快,定位准确度较YOLO有所提升[4]。

图1为SSD的网络结构图,SSD在前向传播过程中,生成一系列固定大小边框及边框内是否含有物体的可能性概率,之后,利用非极大值抑制获取最终的预测结果。由SSD模型结构知,SSD可分为基础网络和辅助结构组成,基础网络采用VGG-16网络(Simonyan and Zisserman,2015)。在基础网络结构后,添加了额外的卷积层作为辅助结构,这些辅助的卷积层大小逐层递减,可以生成多种尺度的特征图。辅助结构中前两层为VGG-16网络中的两个全连接层转换后的卷积层conv4-3、conv-7,后四层为递减的卷积层con6-2、con7-2、con8-2、conv9-2。在这些不同尺度的特征图上同时进行分类和位置回归保证了预测的准确度。辅助结构中每一个特征层,需使用一系列卷积滤波器产生相应的固定大小的预测结果,假设特征层的大小为 ,通道数为 ,物体种类个数为 ,特征层上每个特征点对应k个默认边框,那么对于一个 的特征层,则可得到 个输出值。每一个边框与其对应的特征图中特征点的位置是固定的。对于特征图上每一个特征点,需预测得到的边框和真实边框直接的偏差,以及每一个边框中包含物体的概率。SSD框架中预测的是边框相对于真实边框的相对位置,因此SSD在不同尺度的特征层上进行预测的精度较高[5]。

在卷积神经网络中越是靠前的特征层包含的图像细节信息就越多,因此不能只使用尺寸较小的特征层做检测,否则会丢失图像中的大量细节信息。

1.3 模型训练与预测

SSD通过回归的方法直接从图像中回归出目标的位置和类别,是一种端到端的训练方法。首先将训练图像中的真实边框通过匹配策略对应到固定的输出边框上,这些边框是事先定义好的一系列固定大小的输出边框。将训练图像中的真实边框与固定输出的边框对应之后,就可以端对端的进行损失函数的计算及反向传播的计算更新了,这种端到端的训练模式更易于调整网络[6]。

本文采用SSD作为目标检测训练网络,完整的训练流程如图2所示。对原始样本图像进行预处理后,手工标注训练样本对象,并对样本图像进行镜像、旋转处理以扩充样本数据制作多尺度样本数据集;基于SSD模型进行迁移学习,训练样本数据集,根据需求设置训练次数和存储训练过程权重的步长。结合训练结果,修改参数,判断是否还需继续训练样本,结束训练,输出最终的用于识别目标的模型。

通過训练可获取用于目标识别的检测模型,在此基础上,利用FLASK开发便于普通用户使用的可视化平台。可根据需求选择输入影像,利用训练获取的目标检测模型对输入影像进行目标识别,并将检测后的结果输出保存,利用可视化界面,用户无需查看源码结构即可轻松操作,提高用户使用效率。

2 实验结果及评估

本文在获取VOC数据集权重的基础上,利用SSD进行迁移学习,训练此处的目标检测网络,将测试样本集输入训练好的网络,当模型预测的目标对象边界框与前期人工标注的边界框的IOU(交并比=交集/并集)不小于0.7时,认为检测正确,否则检测错误,进一步计算模型的准确率、召回率等作为模型评价准则。图3为对不同场所飞机、船只检测的效果图,可以看出该方法对飞机、船舶小目标检测准确度较高。

3 结语

本文主要研究了深度学习技术在遥感图像目标检测中的应用。采用镜像、旋转等手段构建多尺度样本,能够扩充样本数据集,增强多尺度目标预测的鲁棒性;基于SSD训练目标检测模型,以遥感影像飞机、船只目标识别为例,制作目标样本库,训练模型并进行目标检测实验,目标检测召回率为91.35%,目标检测准确率为93.95%,具有较高的准确率和召回率,能够应用于遥感图像目标检测工作中。用FLASK将目标检测过程进行可视化显示,便于算法推广应用。

参考文献

[1]叶秀芬,于淼,郭书祥,梁洪.遥感图像中细弱目标分割方法[J].哈尔滨工程大学学报,2020,41(11):1689-1694.

[2]杨戬峰.单景多光谱影像云检测技术研究[D].郑州:战略支援部队信息工程大学,2020.

[3]魏玮,杨茹,朱叶.改进CenterNet的遥感图像目标检测[J].计算机工程与应用,2021,57(6):191-199.

[4]赵伟伟.基于遥感图像的变化检测方法与应用研究[D].西安:西京学院,2020.

[5]柯青青,李润生,胡庆,等.基于YOLOv3深度卷积神经网络的遥感图像飞机目标识别[J].信息工程大学学报,2020,21(5):526-533.

[6]安冉.基于卷积神经网络的遥感图像变化检测[D].石家庄:河北地质大学,2020.

猜你喜欢
边框卷积样本
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
推动医改的“直销样本”
基于傅里叶域卷积表示的目标跟踪算法
用Lightroom添加宝丽来边框
给照片制作专业级的边框
摆脱边框的束缚优派
村企共赢的样本
手机无边框:挑战屏幕极限
一种基于卷积神经网络的性别识别方法