基于UNet网络的高分辨率遥感影像建筑物提取

2023-07-10 13:45屠冉
计算机应用文摘·触控 2023年11期
关键词:深度学习

关键词:高分辨率遥感影像;深度学习;建筑物提取;UNet网络

中图法分类号:P237 文献标识码:A

高分辨率遥感影像覆盖范围大、信息量大、更新速度快,对于地面信息的获取十分重要。目前对高分辨率遥感影像建筑物的有效提取是城市遥感影像的主要研究方向,一方面,对建筑物的精确提取有利于城市变化监测、三维建模、智慧城市建设等领域的深入应用和扩展,以及在城市空间数据库的建设方面都具有重要价值;另一方面,对高分辨率遥感影像建筑物的提取可以为其他图像的语义分割和目标检测方面提供借鉴,具有重要意义和价值。

利用遥感影像进行建筑物提取根据自动化程度分为人工提取、半自动化提取和自动化提取3个阶段。文献[5]针对高分辨率遥感影像自动化解译技术难度大、适用性差等问题,提出人工目视解译为遥感影像解译的主要方法,但目视解译需耗费大量时间和精力,且精度难以达到要求。此后引入半自动化提取方法,如SVM算法、K-means聚类算法等。如今,深度学习成为图像识别、提取中效果最好的方法。本文以高分辨率遥感影像为数据源,提出基于UNet网络模型进行建筑物提取,此模型延续了CNN卷积网络的特征,能够有效把握局部特征信息。采用公开建筑物数据集——马萨诸塞州建筑物数据集进行实验验证本文方法的适用性。

1方法

1.1 UNet网络

UNet网络如图1所示,UNet网络结构由编码器和解码器2部分组成。编码器部分采用CNN卷积神经网络,用于图像的下采样过程,采用5个池化层,在不断的下采样过程中不断地降低分辨率,以获得不同尺度的图像信息,完成特征提取。解码器部分对应的是特征图上采样过程,进行目标对象的定位,上采样过程先进行一次反卷积操作,使特征图的维数变为原来的1/2,然后通过跳跃连接将下采样过程中得到的特征图进行拼接,重新组成新的特征图,新特征图是原来的2倍,最后再采用2个卷积层进行对特征图进行特征提取。

CNN因为受感受野的影响,不能很好地利用全局信息,需要很多层后才能得到抽象的全局信息。因此,将UNet网络应用于背景复杂的高分辨率的遥感影像建筑物提取任务中,可以有效对全局信息和局部的细节信息进行提取。本文提出把UNet方法用于高分辨率的遥感影像建筑物提取。

2实验数据

2.1数据介绍

本文选取的数据集为马萨诸塞州建筑物数据集,地面分辨率降采样为0.3 m,选取的马萨诸塞州地区大约有2.2万栋独立建筑物。

2.2数据处理

对获取的数据集进行数据扩充处理,以便提高样本质量,使训练出来的模型效果更好。把扩充后的数据集按精度高低筛选最优的数据集,共4 000幅影像,并划分为训练集(2800幅)、驗证集(600幅)和测试集(600幅)3个部分。

3实验与算法评价

3.1硬件配置和参数设置

本文UNet模型的建筑物提取实验基于Pytorch框架进行,硬件配置采用NVIDIA Geforce RTX2060,网络优化器采用Adam,学习率设为0.0001,每个网络模型训练50次迭代,batch size值设为16。UNet模型的损失收敛函数与精度曲线变化如图2所示。可看出在模型训练过程中,训练精度和测试精度随着迭代次数的增加在逐步上升,约在第15次以后ACC趋于稳定,维持在96. 85%左右;Loss值也在不断下降,最终稳定在0.016左右。

3.2评价指标

本文选择总体精度(OA),Fl-score,m,loU,Recall作为分割效果的评估标准。OA在文中为图像中预测正确的建筑物和背景像元占所有像元的比例:Fl-score是精确率:mloU在文中计算的是真实建筑物标签与模型提取的建筑物之间的交并比:Recall计算的是真实建筑物标签与模型提取的建筑物之间的交并比。各评估标准公式为:

其中,TTP为输入图像中含有标签信息的部分被正确识别为相对应的标签信息,本文指提取到实际建筑物的个数;TTN为输入图像中含有背景信息的部分被正确识别为相对应的背景信息;FFP为输入图像中含有背景信息的部分被错误识别为标签信息;FFN为输入图像中含有标签信息的部分被错误识别为背景信息。

4实验结果与分析

4.1可视化结果分析

几种提取方法在2种建筑物数据集上的边缘提取效果对比如图3所示。对于SVM算法,其在2种建筑物数据集上的提取表现均不理想,提取结果存在大量噪声,细碎斑点较多,且对于一些复杂的地物划分不明确等问题。FCN和CNN方法在2栋相连建筑物的边缘部分提取上边缘未分离,出现了连接,图3的边缘提取不够清晰。而本文方法在图3中较好地识别了连接部分,对相邻2栋建筑物较好地完成了分离。图3中传统方法在建筑物提取上出现漏检的问题,而本文方法在小型建筑物提取上表现更出色。

总体来说,UNet方法与传统提取方法相比,在影像边缘细节的分类效果上更优,对建筑物的边缘把控得更好,轮廓更清晰。

4.2精度分析

以OOA,MmIoU,RRecall和FF1值作为评估标准对马萨诸塞州数据集建筑物提取结果进行定量化分析,结果如表1所列。结果表明,SVM决策树算法在高空间分辨率遥感影像建筑物的提取方面总体精度较低,提取效果不理想。与SVM决策树算法相比,深度学习方法——FCN和CNN方法的各个指标值远优于SVM决策树算法,但仍存在部分细微建筑物被忽略的问题。本文方法相较于SVM决策树算法和FCN,CNN方法在各项指标上均有所提高,其表现在对建筑物边缘及细小建筑物提取方面的改进,对细小建筑物的提取以及对边缘细节处理更加完善。

5结束语

本文提出一种基于UNet网络模型的高分辨率遥感影像建筑自动提取方法,使用数据集为马萨诸塞州建筑物数据集,完成数据集的扩充和筛选、UNet模型训练、建筑物提取以及精度评估,通过实验证明了本文方法可以有效地实现高分辨率遥感影像建筑物提取。

本文提出的UNet方法以及FCN和CNN三种分类算法对高分辨率遥感影像进行建筑物分类提取的结果中,总体准确率超过90%,相比之下本文方法提取的结果在边缘细节的把控上效果更优,漏检的小型建筑物也大幅减少。综上所述,通过对以上4种分类算法所得到的结果进行定性和定量分析,基于UNet网络对建筑物的提取效果更好、精度更高,具有一定的可行性和有效性。目前,基于UNet网络建筑物提取方法有时在面对遥感影像建筑物提取时鲁棒性不够强,且模型训练时间较长,后续研究中将对该处理步骤进行进一步的研究和优化。

作者简介:

屠冉(1981—),硕士,研究方向:电子信息工程。

猜你喜欢
深度学习
从合坐走向合学:浅议新学习模式的构建
面向大数据远程开放实验平台构建研究
基于自动智能分类器的图书馆乱架图书检测
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究