孟佳佳 王弢
摘要:论文提出了一种基于深度残差卷积神经网络的高光谱遥感数据的分类方法。我们将深度残差卷积神经网络作为一种分类器,将待分类的像元及其领域像元一同作为神经网络的输入,通过残差网络的算法模型实现高光谱遥感数据的分类。我们使用深度学习技术将数据特征提取出来再进行分类,以达到提高分类准确度和效率的目的。本文主要通过改善分类方法来增强遥感数据分类的效率和处理能力。
关键词:卷积神经网络;高光谱图像;图像分类;深度学习
中图分类号:TP391.41;TP183 文献标识码:A 文章编号:1007-9416(2019)01-0099-03
0 引言
过去几年,由于深度学习在解决很多问题上的出色表现。卷积神经网络是最早发现和应用的,也是研究重点[1]。虽然基于卷积神经网络的深度学习应用的越来越广泛。但在遥感数据的分类领域中使用这项技术还较为少见。遥感数据有很多种分类因素而具有多种分类方法。基于光谱特征的分类方法主要是从地物的光谱特征入手,表现地物特定的光谱区间和特定参数[2]。高光谱遥感图像中能够包含的信息比传统的遥感图像要多,其接收到的谱线也比传统的细致和连续,一些不可分的特征会被凸显,这种方法是通过对比分析并判别地物的光谱信息来进行区分的。基于统计模型的分类方法是对高光谱遥感数据整体样本的总体特征进行统计分析,从而对得出的不同的分布特征进行分析,可以用来识别地物目标。
目前,高光谱数据处理的自动化及智能化的水平尚不够高,深度学习和人工智能技术的发展能够提升地物分类和识别的准确度以及地物特征信息的提取速度和准确度,这还将是高光谱遥感研究的主要目标[3],选用更先进的分类算法和数据处理模型,将高光谱遥感数据更好更多地应用在更广的学科领域中。
1 深度残差网络的高光谱遥感数据分类
1.1 残差卷积网络模型
随着神经网络的深度的加深,网络的表达能力随之加强,但网络深度会带来梯度消失的问题,且随着深度加深,梯度消失问题也越来越严峻[4]。如果假设我们将多加入的多层神经网络全部定义为恒等映射,理论上完全可以认定为性能达到平衡,但是这种方法没有任何的实际意义。那么如果增加的部分可以近似为恒等映射或携有小扰动的恒等映射的情况,则很有可能实现网络性能的不变[5]。因而我们采用了残差单元。若是可以假设多个非线性层组合可以拟合于一个复杂函数,那么也同样可以假定隐含层的残差拟合于某个复杂函数。即将原来的神经网络的学习函数H(x)转化为F(x)+x,对于深度神经网络来说,这两种表达方式的训练效果是等同的。但对于深度神经网络的优化难度上来说是截然不同的。后者可以通过具有“捷径连接(shortcut)”的前馈神经网络来实现,而且残差网络的单个构建模块并不复杂。残差单元的输出由多个卷积层层叠的输出和输入元素间相加,并要求保证其卷积层输出和输入元素维度相同,再经过ReLU线性激活后得到。将这种结构层叠起来之后,我们就得到了深度残差网络。
1.2 残差块
残差块是一个两层神经网络,如图1所示。在层进行激活,得到,再次进行激活,两层之后得到。计算过程是从开始的,首先进行线性激活,根据公式1-1:
通过算出,即乘以权重矩阵,再加上偏差因子。然后通过ReLU非线性激活函数得到,计算得出。接着再次进行线性激活,依据公式1-2:
最后根据这个公式再次进行ReLU非线性激活,即,这里的g是指ReLU非线性函数,得到的结果就是。换句话说,信息流从到需要经过以上所以步骤,即这组网络层的主路径。
卷积在残差网络中有一点变化,我们将直接向后,拷贝到神经网络的深层,在ReLU非线性激活函数前加上,这是一条捷径。的信息直接到达神经网络的深层,不再沿着主路径传递,这就意味着最后这个等式去掉了,取而代之的是另一个ReLU非线性函数,仍然对进行函数处理,但这次要加上,即:,也就是加上的这个产生了一个残差块。
一个普通网络(Plain network),把它变成 ResNet 的方法是加上所有跳躍连接,每两层增加一个捷径,构成一个残差块。
2 实验结果与分析
2.1 实验数据简介
本文使用到高光谱数据有:Indianpines和Pavia U。Indianpines数据集:美国印第安纳州的松林区域,一共包含地物信息16类。每个图像规模为145×145,整个数据集的大小为145×145×200。Pavia U数据集:意大利帕尔维亚大学的附近区域,一共包含地物信息10类。每个图像规模为610×340,整体数据集的大小为610×340×103。
2.2 实验结果情况分析
2.2.1 Indianpines数据集
我们将实验环境中训练样本的数量设定为整体样本量的20%,则测试样本为剩下的80%,为了分析各网络算法模型对样本的分类效果情况,我们使用了卷积神经网络(CNN)、多层感知机(MLP)和残差网络(Resnet)三种模型分别进行实验,得到如下结果:
图2(a)为正确标记后的高光谱遥感数据,作为结果对比使用;图2(b)为使用多层神经网络(MLP)进行高光谱遥感数据分类的分类结果;图2(c)是采用卷积神经网络(CNN)进行高光谱遥感数据分类的分类结果;图2(d)是使用深度残差网络(Resnet)进行高光谱遥感数据分类的分类结果。我们从图2中能够得到,相较于MLP模型来说,卷积神经网络已经实现了部分的错误率下降,但效果还是差强人意的。但相较于CNN模型,深度残差网络对高光谱遥感数据的分类正确率已有明显的提升,分类效果比多层感知机及卷积神经网络都要好,这里体现了残差网络相较于多层神经网络及卷积神经网络的优越性,但仍未达到最优。
2.2.2 Pavia U数据集
为了分析不同数据集上各模型的分析状况,这次我们采用了同样的样本比例,即训练样本与测试样本的比例为2:8,再次分析各神经网络模型对Pavia U数据集的分类情况,我们再次使用了卷积神经网络(CNN)、多层神经网絡(MLP)及残差网络(Resnet)三种神经网络模型进行分类,得到的结果如图3所示。
我们发现,卷积神经网络比多层感知机的分类效果略好一些,而深度残差网络再次表现出了优越性,其分类效果较于前两种模型为最优。由结果图我们能看出,不论是块状地域还是线性地域的识别,深度残差网络都较其他两种模型的分类准确率高,其能够较为准确的将九类地域特征分类,边缘轮廓描绘较为完整,相较于卷积神经网络明显降低了误差,这也表明了深度残差网络解决了高光谱遥感数据分类中的一部分困难。
如表1所示,多层感知机对Pavia U数据集的地物分类精度只达到了60%左右,而卷积神经网络具有很好的分类效果,其对Pavia U数据集的地物分类精度达到了80%。从表中我们还可以发现深度残差网络对Pavia U数据集的地物分类精度竟然达到了90%左右,这进一步体现了残差网络较另两种分类模型的优越性和高效性。
3 结语
本文提出了一种基于深度残差网络的高光谱遥感数据的分类方法,通过残差网络实现了分类正确率和准确度的提升,实验结果表征了基于该算法模型的分类方法在其他同类型的分类方法中的可行性和优越性。本文以高光谱遥感数据分类为核心,深度残差网络算法模型为方法,部分解决了高光谱遥感数据因光谱维度高、数据冗余大且存在非线性特性所带来的分类困难的问题。
参考文献
[1] Zeiler M D, Fergus R. Visualizing and Understanding Convolutional Networks[M]// Computer Vision ECCV 2014. Springer International Publishing,2014:818-833.
[2] 袁迎辉,林子瑜.高光谱遥感技术综述[J].中国水运:学术版,2007,7(8):157-159.
[3] 张兵,王向伟, 郑兰芬,等.高光谱图像地物分类与识别研究[J].2004.
[4] 宋光慧.基于迁移学习与深度卷积特征的图像标注方法研究[D].浙江大学,2017.
[5] Ballester P, Araujo R M. On the performance of GoogLeNet and AlexNet applied to sketches[C]// Thirtieth AAAI Conference on Artificial Intelligence. AAAI Press,2016:1124-1128.
Abstract:This paper proposes a hyperspectral remote sensing data classification method based on deep residual convolutional neural network. We use the deep residual convolutional neural network as a classifier to classify the pixels to be classified and their domain pixels into the input of the neural network. The algorithm model of the residual network is used to classify the hyperspectral remote sensing data. We use deep learning technology to extract data features and then classify them to achieve the purpose of improving classification accuracy and efficiency. This paper mainly enhances the efficiency and processing ability of remote sensing data classification by improving the classification method.
Key words:convolutional neural networks; hyperspectral images; image classification; deep learning