基于卷积神经网络的遥感图像分类算法

2022-07-10 04:03黄玉芬

辽宁科技学院学报 2022年3期

黄玉芬

(辽宁科技学院曙光大数据学院，辽宁本溪117004)

随着遥感技术的不断发展，它在地理数据获取、地质勘测、环境监测等领域发挥着重要的作用。能够准确、迅速地获得遥感信息遥感图像是关键，而遥感图像的分类是对遥感图像处理重要组成部分。传统的遥感图像分类算法有监督分类和无监督分类两种。监督分类方法如最大似然法、平行多面体等分类方法存在人为主观因素较强等问题；无监督分类如 K-Means方法会因某地会存在“同物异谱”和“异物同谱”等问题使模型的泛化能力不强，分类效果不理想。文章采用基于卷积神经网络(Convolutional Neural Networks)处理遥感图像分类。卷积神经网络相对于一般的人工神经网络，通过添加卷积层和池化层使模型对图像进行局部感知；通过参数共享机制降低模型复杂程度，提高模型训练效率。而遥感图像经过数字化处理后是多维数组，卷积神经网络通过卷积层对图像进行特征提取，输入图像和训练网络的拓扑结构能很好地吻合[1]，相较以统计学为基础的传统的遥感图像分类算法，卷积神经网络有更强的自主学习能力和容错能力。

1 CNN 网络结构中两个关键层

1.1 卷积层

卷积神经网络中的核心部分是卷积层，它的作用是对图像在像素值的水平上进一步的特征提取，提取的方法是在大小为n×n的特征图上用卷积核大小为m×m(通常取5×5)的滤波器(Filter)以步长(stride)为1进行移动，卷积核与特征图的图像像素值做卷积操作，生成一个大小为(m-n+1)×(m-n+1)新特征图作为下一层的输入层。

卷积操作公式为：

训练神经网络的过程实际上是在训练一个卷积层的卷积核，使这些卷积核能检测到图像的特定特征[2]。

1.2 激活函数

通常在卷积层后增加激活函数，如果没有对上一层网络的计算结果进行非线性处理，那么层与层之间都是线性关系，即输出结果为输入结果的线性组合，模型的表达能力有很大的局限性。现实生活中大部分问题也并不是简单的线性关系，激活函数可以使模型具有更强的学习能力，也可以增大整个网络的稀疏性，加快模型收敛速度。文章采用Relu函数作为激活函数，其表达式为f(x)=max(x,0),以Relu函数作为层与层之间的过渡层[3]。

1.3 池化层

从卷积层到增加激活函数再到后来的 Droupout 层，构建整个网络的过程中，通过去除一些不重要的信息，控制模型的冗余性，减小后期训练过程出现过度拟合的问题。在卷积层基础上，引入池化层的目的是可以在保持大部分信息的同时，减小特征图的尺寸，通过最大池化或者平均池化，减少输入的维度和参数的数量，进而减小计算量，提高算法的效率。

2 基于CNN对遥感图像进行分类

2.1 实验环境和参数设置

文章采用的深度学习框架为 TensorFlow1.14.0，系统为 Windows10位，处理器为酷睿i5-8265U 1.60 GHz，内存为8G，四类遥感图像，每类图像700张，模型迭代次数为 5 000 次。

2.2 遥感图像预处理

在将图像数据读入到神经网络之前需要做好数据的预处理工作，需要把所有图像的大小统一，这里采用双线性插值把图像尺寸改为64×64,然后对每张图片像素坐标进行归一化，将像素值转化到0～1之间，减小模型的运算量[4]。

2.3 构建图像数据集

把有标签的各类遥感图片整合在一起构成其图像数据集DateSet[image1,image2,……,imagen]，同时保存每张图片所属的标签Labels[label1,label2,……,labeln]，然后对整个数据集进行随机打乱，按照训练集和测试集比例为75∶25进行划分。

2.4 模型架构

整个模型中，前三层是卷积层用Convi表示，每一层卷积层包含池化层用Poolingi表示, 其中卷积层Conv1，Conv2和Conv3包含卷积核的个数分别有 64、32 和 16，三层卷积核尺寸均为3×3，滑动步长为 1，激活函数采用 Relu 。池化层Poolingi的池化窗口大小为2×2，池化方式采用最大池化进行特征图下采样。然后增加两层全连接层，并引入Dropout 随机剔除掉30%的神经元，可以有效减少过拟合。最后输出层通过 Softmax逻辑回归分类器得出最大概率对应的标签[5](如图1)。

图1 模型结构图

2.5 结果评估

在训练集中随机选出8张遥感图像进行预测，图2为识别结果，都能准确识别出各类遥图像所属的类别。

图2 预测结果

通过tensorboard可查看详细的模型训练情况，最终模型的准确率在91.7%左右，loss值最终稳定在0.16，(如图3、图4)。

图3 模型在训练过程准确率

图4 模型损失值

因为本问题属于多分类任务，准确率不能完全反映分类器的性能，宏平均 (Macroaveraging) 和微平均(Micro-averaging)是评价多分类分类器的性能优劣的两种常用方法，宏平均是指所有类别的每一个统计指标值的算数平均值，即宏精确率，宏召回率和F值[6]。

宏精确率Pmacro计算公式为：

宏召回率Rmacro计算公式为：

宏F值Fmacro计算公式为：

3 结论

文章基于CNN卷积神经网络实现了遥感图像的分类，现有遥感图像数据集中分类效果表现良好，最后用宏平均对模型进行全面的评估。该方法分类效果优于传统的遥感图像方法，模型具有良好的泛化性。