基于卷积神经网络的遥感图像分类算法

2022-07-10 04:03黄玉芬
辽宁科技学院学报 2022年3期
关键词:池化层池化像素

黄玉芬

(辽宁科技学院 曙光大数据学院,辽宁 本溪117004)

随着遥感技术的不断发展,它在地理数据获取、地质勘测、环境监测等领域发挥着重要的作用。能够准确、迅速地获得遥感信息遥感图像是关键,而遥感图像的分类是对遥感图像处理重要组成部分。传统的遥感图像分类算法有监督分类和无监督分类两种。监督分类方法如最大似然法、 平行多面体等分类方法存在人为主观因素较强等问题;无监督分类如 K-Means方法会因某地会存在“同物异谱”和“异物同谱”等问题使模型的泛化能力不强,分类效果不理想。文章采用基于卷积神经网络(Convolutional Neural Networks)处理遥感图像分类。卷积神经网络相对于一般的人工神经网络,通过添加卷积层和池化层使模型对图像进行局部感知;通过参数共享机制降低模型复杂程度,提高模型训练效率。而遥感图像经过数字化处理后是多维数组,卷积神经网络通过卷积层对图像进行特征提取,输入图像和训练网络的拓扑结构能很好地吻合[1],相较以统计学为基础的传统的遥感图像分类算法,卷积神经网络有更强的自主学习能力和容错能力。

1 CNN 网络结构中两个关键层

1.1 卷积层

卷积神经网络中的核心部分是卷积层,它的作用是对图像在像素值的水平上进一步的特征提取,提取的方法是在大小为n×n的特征图上用卷积核大小为m×m(通常取5×5)的滤波器(Filter)以步长(stride)为1进行移动,卷积核与特征图的图像像素值做卷积操作,生成 一个大小为(m-n+1)×(m-n+1)新特征图作为下一层的输入层。

卷积操作公式为:

训练神经网络的过程实际上是在训练一个卷积层的卷积核,使这些卷积核能检测到图像的特定特征[2]。

1.2 激活函数

通常在卷积层后增加激活函数,如果没有对上一层网络的计算结果进行非线性处理,那么层与层之间都是线性关系,即输出结果为输入结果的线性组合,模型的表达能力有很大的局限性。现实生活中大部分问题也并不是简单的线性关系,激活函数可以使模型具有更强的学习能力,也可以增大整个网络的稀疏性,加快模型收敛速度。文章采用Relu函数作为激活函数,其表达式为f(x)=max(x,0),以Relu函数作为层与层之间的过渡层[3]。

1.3 池化层

从卷积层到增加激活函数再到后来的 Droupout 层,构建整个网络的过程中,通过去除一些不重要的信息,控制模型的冗余性,减小后期训练过程出现过度拟合的问题。在卷积层基础上,引入池化层的目的是可以在保持大部分信息的同时,减小特征图的尺寸, 通过最大池化或者平均池化,减少输入的维度和参数的数量,进而减小计算量,提高算法的效率。

2 基于CNN对遥感图像进行分类

2.1 实验环境和参数设置

文章采用的深度学习框架为 TensorFlow1.14.0,系统为 Windows10位,处理器为酷睿i5-8265U 1.60 GHz,内存为8G,四类遥感图像,每类图像700张,模型迭代次数为 5 000 次。

2.2 遥感图像预处理

在将图像数据读入到神经网络之前需要做好数据的预处理工作,需要把所有图像的大小统一,这里采用双线性插值把图像尺寸改为64×64,然后对每张图片像素坐标进行归一化,将像素值转化到0~1之间,减小模型的运算量[4]。

2.3 构建图像数据集

把有标签的各类遥感图片整合在一起构成其图像数据集DateSet[image1,image2,……,imagen],同时保存每张图片所属的标签Labels[label1,label2,……,labeln],然后对整个数据集进行随机打乱,按照训练集和测试集比例为75∶25进行划分。

2.4 模型架构

整个模型中,前三层是卷积层用Convi表示,每一层卷积层包含池化层用Poolingi表示, 其中卷积层Conv1,Conv2和Conv3包含卷积核的个数分别有 64、32 和 16,三层卷积核尺寸均为3×3,滑动步长为 1,激活函数采用 Relu 。池化层Poolingi的池化窗口大小为2×2,池化方式采用最大池化进行特征图下采样。然后增加两层全连接层,并引入Dropout 随机剔除掉30%的神经元,可以有效减少过拟合。最后输出层通过 Softmax逻辑回归分类器得出最大概率对应的标签[5](如图1)。

图1 模型结构图

2.5 结果评估

在训练集中随机选出8张遥感图像进行预测,图2为识别结果,都能准确识别出各类遥图像所属的类别。

图2 预测结果

通过tensorboard可查看详细的模型训练情况,最终模型的准确率在91.7%左右,loss值最终稳定在0.16,(如图3、图4)。

图3 模型在训练过程准确率

图4 模型损失值

因为本问题属于多分类任务, 准确率不能完全反映分类器的性能, 宏平均 (Macroaveraging) 和微平均(Micro-averaging)是评价多分类分类器的性能优劣的两种常用方法,宏平均是指所有类别的每一个统计指标值的算数平均值,即宏精确率,宏召回率和F值[6]。

宏精确率Pmacro计算公式为:

宏召回率Rmacro计算公式为:

宏F值Fmacro计算公式为:

3 结论

文章基于CNN卷积神经网络实现了遥感图像的分类,现有遥感图像数据集中分类效果表现良好,最后用宏平均对模型进行全面的评估。该方法分类效果优于传统的遥感图像方法,模型具有良好的泛化性。

猜你喜欢
池化层池化像素
基于高斯函数的池化算法
像素前线之“幻影”2000
卷积神经网络中的自适应加权池化
卷积神经网络模型研究分析*
基于卷积神经网络的纸币分类与点钞
基于深度学习卷积神经网络的人体行为识别研究
“像素”仙人掌
基于卷积神经网络和池化算法的表情识别研究
基于全卷积神经网络的SAR图像目标分类*
用于手写汉字识别的文本分割方法