刘瑞航 张佳瑜 马彩虹
(宁夏大学 地理科学与规划学院,宁夏 银川 750021)
遥感影像地物分类作为遥感技术的一个重要领域,一直倍受研究人员的关注。近年来,随着遥感技术的不断发展,卫星传感器获取的遥感影像空间分辨率也在不断提高,遥感图像分类已经成为获取地物信息的有效手段[1-5]。然而,由于遥感影像自身空间分辨率的差别以及地物在遥感影像中的“同物异谱”和“同谱异物”的特点[6-8],传统的监督分类在进行地物分类时容易出现“错分”“漏分”的现象,导致分类精度不高[9-10]。
为解决传统监督分类存在的问题,许多学者引进了不同的方法。Vapnik等[11]提出了支持向量机方法在解决小样本、非线性问题上的优势,其适用于复杂地理条件下的地物分类;王佃来等[12]基于辅助前馈(back propagation,BP)算法结合K近邻(K-Nearest Neighbor,KNN)模型,较好地解决了山体阴影和水体之间的误分问题;曹兆伟等[13]实验证明了BP神经网络算法在海岛地物分类中是一种行之有效且精确度更高的分类方法;梁玉剑等[14]基于BP神经网络对遥感影像地物分类的方法进行研究,发现BP神经网络的分类精度明显优于其他监督分类算法;王威等[15]基于图像分割及神经网络提出了一种能够显著提高道路提取效率的方法。其中,BP神经网络的较强学习能力、输入参数灵活自由等特点能够很好地结合遥感影像的光谱特征、高程、坡度、坡向等信息,对土地覆盖类别进行较为准确的识别。
大量的研究结果表明,BP神经网络具有收敛速度快、识别精度高等特点,适用于遥感影像的土地覆盖分类。本文利用矩阵工厂(matrix laboratory,MATLAB)软件的模式识别工具箱,以最佳指数法(optimum index factor,OIF)选取研究区的最佳波段组合和归一化植被指数(normalized difference vegetation index,NDVI)为BP神经网络的输入,研究区的土地覆盖类型为BP神经网络的输出,依据训练数据构建BP神经网络模型,通过模式识别的方法实现对银川市三区遥感影像的像素点进行分类,进而实现土地覆盖分类,并采用混淆矩阵的方法对分类结果进行精度评定,验证此识别模型在银川市三区土地覆盖分类中的合理性和可靠性。
银川市地处中国西北地区宁夏平原中部(37°29′~38°53′N,105°49′~106°53′E),是宁夏回族自治区的首府,是自治区政治、经济、文化科研、交通和金融中心。研究区包括银川市三区(西夏区、金凤区、兴庆区),西倚贺兰山、东临黄河,地貌类型多样,自西向东分为贺兰山地、洪积扇前倾斜平原、洪积冲积平原、河漫滩地等。
本次研究使用的数据是在地理空间数据云(https://www.gscloud.cn)中下载获取美国陆地卫星8号陆地成像仪(land satellite 8 operational land imager,Landsat8 OLI)遥感影像数据,其获取时间是2020年7月28日,数据含云量<5%,质量较好,对影像进行辐射定标、大气校正、影像融合、裁剪等预处理。
多光谱遥感影像数据提供了丰富的地物光谱特征,但是地物在各波段的辐射强度存在一定的相关性,而相关性大的波段组合所包含的信息量会出现大量的冗余。查维茨提出的OIF的概念可以用来选择信息量大且相关性小的波段组合,即
(1)
式中,Y为各个波段组合OIF值;Si为第i个波段的标准差;Rij为i、j两波段之间的相关系数。对n波段图像数据,先计算其每个波段的标准差及相关系数矩阵,然后分别求出所有可能三组波段对应的OIF值。
BP神经网络的基本思想是把学习过程分为信息的正向传播和误差的反向传播两个过程。它是一种单向传播的多层前馈网络,其结构包括输入层、中间层和输出层(图1)。当学习样本数据输入网络后,经过隐藏层的处理后得到对应输出模式,完成了一次学习的正向传播。当得到的输出模式与预期模式不符时,则开始进行误差的反向传播阶段,误差在反向传播过程中按照梯度下降的模式对各层结点的连接权重进行调整,最后返回到输入层。通过不断正向学习和误差反向传播,使得网络结构达到最佳、输出误差减少到可以接受的范围。
图1 神经网络的拓扑结构
(1)输入层和输出层节点数。BP神经网络输入层和输出层节点数要根据实际情况来确定。研究使用经OIF确定的最佳波段组合,同时,为了更好地区分植被与其他地物,加入NDVI作为输入参数之一,可确定输入层的节点数;研究区遥感影像地物分类数,就是输出层节点数。
(2)隐藏层节点数。网络隐藏层的节点数对训练结果有很大的影响。过少的节点数使得网络不能充分地训练,导致训练的精度不高;过多的节点数使得网络计算量增加、训练时间过长、容错率低,不利于得到精度较高的结果。然而,目前对于隐藏层节点数的计算并没有一个确切的数学公式来求解,只能根据实际训练情况不断调整。本研究根据式(2)[12]进行初步确定。
(2)
式中,N为隐藏层节点数;A为分类数量;B为特征向量维数。经多次实验,本研究的隐含层节点数为10。
(3)训练参数设置。神经网络创建函数为patternnet,网络训练函数采用trainscg,输入层和输出层的激活函数如式(3)所示,训练期望误差为0.01,最大迭代次数为1 000次。
(3)
式中,zi为第i个节点的输出值;C为输出节点的个数。
利用遥感影像处理平台(the environment for visualizing images,ENVI)5.3得到研究区OLI各波段统计数据及相关系数矩阵。发现影像各波段标准差的大小顺序为Band5>Band6>Band7>Band4>Band3>Band2>Band1。其中,Band5信息量最为丰富,Band6也较为丰富。Band1、Band2、Band3这三个波段相关性显著,相关系数在0.981 2~0.996 4,而其与其他波段相关性相对较小;近红外Band5与可见光Band1、Band2、Band3、Band4相关性较小;中红外Bnad6、Band7之间相关性较显著,见表1。
表1 波段组合及对应的OIF值
OIF值越大,则相应组合图像的信息量越大,对OIF进行升序排列,OIF最大的波段组合即为最优波段组合。根据上述计算得到各波段的标准差以及各波段之间的相关系数,利用OIF计算公式,在MATLAB中计算所有可能的波段组合及对应的OIF值(表1)。可知,Band4、Band5、Band6波段组合的OIF值最大,选择为最佳波段组合。
应用ENVI5.3得到各ROI的4个参数,经归一化、去除异常值等数据预处理后,作为神经网络训练的最终输入参数。输出的目标矩阵为6行n列的单位矩阵,每一行对应一类地物,其形式为:
T=[000 001%耕地
000 010%林地
000 100%草地
001 000%水域
010 000%建设用地
100 000%未利用地]
神经网络在训练到105代达到最佳,误差为0.024 6(图2)。其中横坐标为迭代次数,纵坐标为交叉熵值。
图2 BP神经网络收敛过程
待分类的遥感影像数据不能直接输入到网络中仿真,在MATLAB中采用imread函数可以将待分类的遥感影像分解成若干灰度向量。本研究采用Landsat8 OLI多波段影像,故被分解成7个灰度向量。选取基于OIF得到的Band4、Band5、Band6以及NDVI作为BP神经网络的输入参数,进行仿真得到分类图(图3)。
图3 OIF辅助BP神经网络分类结果
为了验证改进的BP神经网络分类的有效性,将其分类结果与最大似然法的分类结果(图4)、支持向量机(support vector machine,SVM)分类结果(图5)进行精度对比。为保证分析结果具有可比性,采用变量一致性原则,各分类方法使用相同的训练样本及测试样本,见表3。
图4 最大似然法分类结果
图5 SVM分类结果
表3 三种分类方法的混淆矩阵
从以上3类分类算法的混淆矩阵及精度评定(表4)可以看出,OIF辅助BP神经网络的模式识别方法在总精度(86.95%)和Kappa系数(0.843 5)方面均具优势;从生产者精度来看,该方法在林地、草地、水域和未利用地的分类中优势明显,精度都超过了90.00%,但在建设用地的分类中精度较低只有70.73%。OIF辅助BP神经网络的模式识别方法在耕地分类上精度为81.44%,略高于最大似然法的81.06%和SVM分类法的80.68%,三者相差不大;在林地分类上,精度明显优于最大似然法和SVM分类法,达到了92.49%,高于最大似然法的77.47%、SVM分类法的77.08%;在草地的分类中,精度达到了93.45%,相较于最大似然法精度(77.82%)和SVM分类法精度(74.55%),具有明显的优势;在未利用地的分类上,精度为92.38%,远高于最大似然法的63.81%和SVM分类法的46.19%;在水域的分类上,精度为93.61%,远高于最大似然法的60.15%,略低于SVM分类法的95.11%;对于建设用地的分类该方法不具优势,精度为70.73%,低于最大似然法的97.21%和SVM分类法的72.47%。
表4 三种分类方法Kappa系数与总体精度对比
本研究以Landsat8 OLI遥感影像为数据源,构建了OIF辅助BP神经网络模式识别模型,与最大似然法分类法、SVM分类法比较,其强大的非线性映射能力和灵活的网络结构能够对海量数据进行高效地处理,显著提高了分类总体精度,现研究结论如下:①OIF辅助的BP神经网络的模式识别模型的输入参数灵活,可用于地表覆盖种类多样的地区,可以精准高效地对银川市三区土地覆盖进行分类;②OIF辅助BP神经网络模式识别的总精度为86.95%,Kappa系数为0.843 5,优于SVM分类法和与最大似然法;③OIF辅助的BP神经网络的模式识别对林地、草地、未利用地的识别精度远高于最大似然法分类精度;耕地分类依然存在着错分与漏分问题,但相较于最大似然法和SVM分类算法,精度有了提高;对于建设用地的识别精度较低,与最大似然法有一定差距。
研究存在一些不足:受数据源空间分辨率的限制,并未对研究区进行更精细的分类;在构建分类模型时研究仅对输入参数进行了调整;对建设用地的识别精度较低。在后续研究中,可以采用更高空间分辨率的影像,对神经网络输入参数和隐藏层结构进行优化改进,以及探究不同的激活函数对分类结果的影响;也可尝试引入面向对象的思想,构建卷积神经网络,进一步完善土地覆盖分类的方法。