摘 要: 复杂场景分类是遥感图像解译的一项重要内容。本文通过优化ResNet18 深度残差网络和随机森林,实现了遥感图像复杂场景的高精度分类。首先通过数据扩充将数据库扩充以缓解因训练样本少带来的过拟合问题,然后采用ResNet18 深度残差网络自动提取遥感图像场景特征,最后使用随机森林分类器实现复杂场景分类任务并分别在NWPU-RESISC45 和UC Merced Land Use 数据库上进行了实验。结果表明,本文模型场景分类准确率分别为98.86%和99.17%,与单独使用ResNet18 深度残差网络相比,本文模型分类准确率分别提高3.36%和1.71%,相比于其他场景分类方法,本文模型分类准确率分别提高5.23%和1.55%。
关键词: 数据扩充;深度残差网络;随机森林;遥感图像;场景分类
中图法分类号: TP751.1 文献标识码: A 文章编号: 1000-2324(2024)03-0376-09
遥感技术的飞速发展使得遥感图像向实时、高分辨率、海量方向发展,海量遥感图像中隐藏着大量的有价值信息。遥感图像场景分类是解译遥感图像以获取有价值信息的一项重要内容,土地覆盖类型及遥感图像富含的有价值信息很大程度上反映出人类生活及生产规律,在自然资源监测监管[1]、土地利用[2]、城乡规划[3]等领域有着重要的研究意义和价值。
基于遥感图像的场景分类方法主要包括传统机器学习算法和深度学习算法。传统机器学习方法,如k-means[4]、粒子群优化算法[5]、人工神经网络[6]、支持向量机[7]、决策树[8]等方法在场景分类任务上表现出不错的效果。但这类方法对样本具有一定的要求,通常需要样本满足某些条件,或需要根据场景分类任务人工提取不同方面的特征,特征定义的全面程度直接影响了传统机器学习算法分类识别效果。为克服传统机器学习方法需手动提取特征的瓶颈,以卷积神经网络(Convolutional Neural Network,CNN)为代表的深度学习算法应运而生并被广泛应用到遥感图像处理的各个领域,如变化检测[9]、场景分类[10]、语义分割[11]、病虫害识别[12,13]等。CNN通过前向传播提取图像“由浅及深”的特征并计算学习误差,结合反向传播更新网络参数。如此迭代学习,使得CNN 在大数据量、背景情况复杂及类间差异小的条件下也无需事先设定描述场景的特征和分类器即可实现自动识别任务。2017 年,Cheng 等[14]验证了CNN 比传统机器学习算法在NWPU-RESISC45 数据库下45 类场景分类的效果更优,同时验证了ResNet 网络在经典CNN网络中的遥感场景分类任务上表现更为出色。Wei 等[15]通过数据扩充手段将数据库扩充并利用改进GhostNet 网络在NWPURESISC45[14]和UC Merced Land Use[16]两组数据库下实现了45 类场景和21 类场景的分类任务。张艳月等[17]提出一种基于双通道密集特征的遥感影像场景分类方法,通过提高特征的有效利用率实现场景图像的高精度分类。张康等[10]在浅层网络AlexNet 基础上进行改进,对比了Softmax 和SVM两种分类器在UC Merced LandUse数据库下场景分类的效果,但因样本少导致两种分类器的场景分类效果仍有待提升。龚希等[18]通过词袋模型充分融合UC Merced Land Use 数据库场景图像局部信息特征和全局信息特征,通过支持向量机实现了97.62%的场景分类准确率。张晓男等[19]提出一种基于集成卷积神经网络场景分类方法,通过集成多个CNN网络实现了较优的分类效果,但集成模型的训练需要更多的时间和计算资源。章晨等[20]在深度残差网络的基础上引入1×1 卷积进行特征整合,实验表明在NWPU-RESISC45 数据库下分类准确率达到93.63%,较集成卷积网络得到了一定程度的提高。
复杂场景高精度自动分类任务的核心在于样本数量、样本特征提取和分类器选择的有效组合。样本数量决定了模型学习的全面程度,图像样本有效特征的提取和分类器的组合直接决定分类效果。本文搭建了基于ResNet18[21]和随机森林[22]的遥感图像复杂场景分类模型。针对现有数据库存在的样本少的问题,利用数据扩充手段将样本数量扩充至原数据库的12 倍,以提升模型学习的能力;在样本特征提取上,针对传统机器学习方法人工提取特征问题,本文引入ResNet18 深度残差网络自动提取场景图像不同层次特征。ResNet18 深度残差网络不但能够提取颜色、纹理、边缘等浅层特征,同时也能够在浅层特征的基础上提取到更为抽象的高层语义特征,充分挖掘图像的有价值信息;在分类器选择上,选取适用于处理大数据量和高维数据的随机森林进行场景分类。与SVM相比,随机森林在训练速度,拟合能力和计算成本方面更强大[23]。实验结果证明,本文方法在NWPU-RESISC45 和UC Merced Land Use 两组数据库能够实现45 类场景和21类复杂场景高精度自动分类。
1 遥感图像复杂场景分类方法的建立
遥感图像复杂场景分类流程如图1 所示,具体流程包括主要数据扩充、特征提取和场景分类。基于NWPU-RESISC45 和UC Merced LandUse 两数据库进行数据库扩充,将扩充后的数据库按8∶1∶1 的比例划分为训练集、验证集、测试集。训练集和验证集输入到ResNet18 深度残差网络迭代泛化训练出优化的ResNet18 模型。将优化的ResNet18 模型全连接层截断,作为场景分类的特征提取器。将训练集、测试集输入到特征提取器提取特征并进行归一化处理,最后放入随机森林进行训练学习并实现分类任务,统计分类结果。