邹强 刘茜 李娟妮
摘 要:遥感影像分类是遥感技术研究发展应用中的一个重要组成部分。基于Matlab平台应用BP、LVQ两种神经网络算法对TM多光谱影像进行了分类研究,最后应用混淆矩阵对这两种网络算法与最大似然法的影像分类结果做了精度评价与对比分析。实验结果表明,神经网络分类器作为一种非参数分类器,进行影像光谱特征分类时能获得较高的分类精度,引入对比度纹理特征后精度有更进一步的提高。两种神经网络算法中,LVQ网络算法的影像分类精度比BP网络要高。
关键词:遥感影像分类 BP神经网络 LVQ 神经网络 Matlab 纹理特征
中图分类号:P237 文献标识码:A 文章编号:1674-098X(2014)04(c)-0223-02
近几十年来,遥感对地观测技术的迅速发展为地表资源调查与环境监测提供了多平台、多传感器、多时相、多分辨率的海量影像数据,这些数据加工处理后被广泛应用。人工神经网络是以模拟人脑神经系统的结构与功能为基础而建立的一个理论化数学模型,具有自学习、自组织、自适应、高度鲁棒性、全局并行分布处理等良好特性。人工神经网络分类具备较强容错性,能实现对特征空间较复杂的划分。
1 特征提取与选择
遥感影像分类是模式识别技术在遥感技术领域中的一种典型应用。该文采用的影像数据为TM多光谱影像,大小为512×512,包含除热红外波段TM6以外的其他六个波段,空间分辨率为30 m,均已几何校正与辐射定标。图1是原始TM影像的4、3、2三个波段合成的假彩色影像。如何从各波段影像中选择或者提取特征影像对后期的影像分类精度影响较大。通常既要考虑选择的特征影像所包含的地物信息量,又要考虑影像波段间的独立性。对此Chavez[5]等人在1982年提出了最佳指数因子(Optimum Index Factor,OIF)模型分析法。OIF计算公式如下式(1):
(1)
式中,Si表示第i波段数据的标准差。Rij是第i个波段与第j个波段间的相关系数。本文n取值为3。OIF值越大表明对应的波段组合兼顾波段的信息量与波段间的独立性越好。
在计算并分析TM各波段数据间的相关系数与每个波段的信息含量后,基于OIF模型计算TM影像中任意三个波段的OIF值,在TM1,2,3时,OIF值31.332;TM1,2,4时,OIF值64.185;TM1,2,5时,OIF值37.264;TM1,2,7时,OIF值26.506;TM1,3,4时,OIF值65.790;TM1,3,5时,OIF值41.100;TM1,3,7时,OIF值29.328;TM1,4,5时,OIF值67.454;TM1,4,7时,OIF值64.549;TM1,5,7时,OIF值30.867;TM2,3,4时,OIF值69.391;TM2,3,5时,OIF值39.326;TM2,3,7时,OIF值28.888;TM2,4,5时,OIF值68.653;TM2,4,7时,OIF值69.144;TM2,5,7时,OIF值29.696;TM3,4,5时,OIF值70.489。综合分析TM影像各波段数据间的相关系数与每个波段的信息含量后,考虑将TM影像的波段组合3、4、5作为其后期分类的光谱特征影像。
纹理特征是影像中普遍存在却又难以描述的空间特征,一直为研究者所关注。GLCM分析法是实际中常用纹理信息表达与提取的最具代表性的统计分析方法之一。影像的GLCM定义为从影像位置为(x,y)、灰度为i的像素出发,统计出该像素及与此像素距离为δ、灰度为j的像素同时出现的概率。数学式表达如下式(2):
(2)
式中,i,j=0,1…L-1;L是影像的灰度级数;分别为影像中的像素坐标;为影像的行列数;δ是两个像素间相隔的距离;θ是两个像素连线按顺时针方向与X正向轴的夹角。
Barald等[6]人的研究工作表明对遥感影像而言,对比度、相关性、熵、二阶矩这四种常用的纹理度量特征统计效果较好。根据以上四种纹理度量特征对纹理的描述特性结合影像上待分地物类型纹理表现特点,选择了对比度纹理特征,提取结果如下图2所示。
2 人工神经网络
人工神经网络是根据生物神经网络研究成果启发构造的一种数学模型,神经元是其最基本单元,其能学习和模仿人脑的信息处理活动。
BP神经网络是一种利用非线性可微分函数进行权值修正与调整的多层前馈人工神经网络,也是前向网络的核心部分,其主要特点是输入信号正向传递,误差反向传播。
LVQ(学习向量量化)神经网络学习算法是从Kohonen竞争算法演化而来,它由输入层,竞争层与线性输出层三层神经元组成。其中,输入层与竞争层间的神经元全连接,竞争层与输出层之间的神经元部分连接且连接权值固定为1。当用于模式分类时,其优点在于能求得全局最优且不需要对输入向量进行归一化与正交化。
3 实验结果及精度评价与对比分析
结合影像的相关背景资料并对影像目视解译,综合分析后将TM影像上的主要地物类型分为植被、河水、海水、道路用地及居民区用地等五种。本文所用的训练样本与精度测试样本通过ENVI软件获取。启动ENVI,选取一定数量分布均匀,具有典型性、代表性及准确性的训练样本与测试样本。对训练样本进行优化提纯后,确定TM影像上的待分地物类型对应选择的训练样本数目各为500个;然后为每类地物类型随机产生各150个测试样本;选择参与分类的TM影像数据组合,将这两类样本均输出保存为ASCII文本文件。
将分类影像数据及ASCII文本文件中的训练样本、测试样本读入Matlab中,分别对其进行如下式(3)的数据归一化处理,以去除不同维度数据间的数量级差别,从而避免因输入与输出数据的数量级差别太大而造成网络训练与预测误差较大。
(3)endprint
式中,分别是转换前后的数据值,分别为数据集合中的最小值与最大值。
对BP网络中的不同地物类别训练样本输入向量对应的期望输出向量采用以下一种新编码,如某一个输入向量xi(i为该输入向量的类别号),则对应的期望输出向量编码为[0.1 0.1 …0.9…0.1]mT,其中m为影像上待分的地物类别数。
在Matlab平台上创建BP与LVQ神经网络,设置并不断调整影响训练效果的相关参数,如网络的初始连接权值与阈值、学习算法函数、训练算法函数、网络传递函数、网络的拓扑结构等,然后对创建的两种网络进行大量的训练,分别取训练误差最小的网络对各组影像数据进行分类;为直观表示分类结果,使用颜色表矩阵为各地物类型对应的类别号赋予一种颜色,其中植被为绿色、河水为蓝色、海水为青色、道路用地为黄色、居民区用地为品红色,将分类结果输出为索引彩色图像。
如图3(a)、(b)、(c)、(d)分别是基于BP网络的两组TM影像数据分类结果与基于LVQ网络的两组TM影像数据分类结果。
利用训练好的多组BP与LVQ神经网络对相应归一化后的测试样本仿真预测,最终输出为各地物类别编码,针对不同地物类别统计相应的真实地物类别编码个数,输出为混淆矩阵,再求算总体精度与Kappa系数进行精度评价;同时亦对基于光谱特征的最大似然法分类结果进行了精度计算。最大似然法:总体精度:72.9%,kappa系数0.711;BP网络数据一总体精度76.5%,kappa系数0.743,数据二:总体精度80.7%,kappa系数0.788;LVQ网络:数据一总体精度79.5%,kappa系数0.774,数据二总体精度85.7%,kappa系数0.836.
对图3中TM影像数据的各组分类结果进行人眼目视观察,可明显看出LVQ神经网络算法的总体分类效果都较BP网络要好,且“椒盐现象”比较少。从表2中的定量精度分析中可获知,不论是总体精度还是Kappa系数,两种神经网络算法的都较最大似然法的影像分类精度高,其中LVQ网络算法的分类精度最高,尤其引入纹理特征后有更明显的提高。
4 结语
实验结果表明,BP与LVQ神经网络分类器从一定程度上可以克服传统遥感影像分类方法无法解决的不确定性与模糊性,能获得较高的影像分类精度,引入纹理特征后精度有更进一步的提高,说明这两种神经网络算法能有效的将光谱特征与纹理特征有机结合起来对影像进行分类,具有较强的研究价值与应用意义。
参考文献
[1] 魏丽英,夏明,田春林.基于LVQ神经网络的城市快速路事件自动检测算法[J].吉林大学学报(工学版),2010(2).endprint
式中,分别是转换前后的数据值,分别为数据集合中的最小值与最大值。
对BP网络中的不同地物类别训练样本输入向量对应的期望输出向量采用以下一种新编码,如某一个输入向量xi(i为该输入向量的类别号),则对应的期望输出向量编码为[0.1 0.1 …0.9…0.1]mT,其中m为影像上待分的地物类别数。
在Matlab平台上创建BP与LVQ神经网络,设置并不断调整影响训练效果的相关参数,如网络的初始连接权值与阈值、学习算法函数、训练算法函数、网络传递函数、网络的拓扑结构等,然后对创建的两种网络进行大量的训练,分别取训练误差最小的网络对各组影像数据进行分类;为直观表示分类结果,使用颜色表矩阵为各地物类型对应的类别号赋予一种颜色,其中植被为绿色、河水为蓝色、海水为青色、道路用地为黄色、居民区用地为品红色,将分类结果输出为索引彩色图像。
如图3(a)、(b)、(c)、(d)分别是基于BP网络的两组TM影像数据分类结果与基于LVQ网络的两组TM影像数据分类结果。
利用训练好的多组BP与LVQ神经网络对相应归一化后的测试样本仿真预测,最终输出为各地物类别编码,针对不同地物类别统计相应的真实地物类别编码个数,输出为混淆矩阵,再求算总体精度与Kappa系数进行精度评价;同时亦对基于光谱特征的最大似然法分类结果进行了精度计算。最大似然法:总体精度:72.9%,kappa系数0.711;BP网络数据一总体精度76.5%,kappa系数0.743,数据二:总体精度80.7%,kappa系数0.788;LVQ网络:数据一总体精度79.5%,kappa系数0.774,数据二总体精度85.7%,kappa系数0.836.
对图3中TM影像数据的各组分类结果进行人眼目视观察,可明显看出LVQ神经网络算法的总体分类效果都较BP网络要好,且“椒盐现象”比较少。从表2中的定量精度分析中可获知,不论是总体精度还是Kappa系数,两种神经网络算法的都较最大似然法的影像分类精度高,其中LVQ网络算法的分类精度最高,尤其引入纹理特征后有更明显的提高。
4 结语
实验结果表明,BP与LVQ神经网络分类器从一定程度上可以克服传统遥感影像分类方法无法解决的不确定性与模糊性,能获得较高的影像分类精度,引入纹理特征后精度有更进一步的提高,说明这两种神经网络算法能有效的将光谱特征与纹理特征有机结合起来对影像进行分类,具有较强的研究价值与应用意义。
参考文献
[1] 魏丽英,夏明,田春林.基于LVQ神经网络的城市快速路事件自动检测算法[J].吉林大学学报(工学版),2010(2).endprint
式中,分别是转换前后的数据值,分别为数据集合中的最小值与最大值。
对BP网络中的不同地物类别训练样本输入向量对应的期望输出向量采用以下一种新编码,如某一个输入向量xi(i为该输入向量的类别号),则对应的期望输出向量编码为[0.1 0.1 …0.9…0.1]mT,其中m为影像上待分的地物类别数。
在Matlab平台上创建BP与LVQ神经网络,设置并不断调整影响训练效果的相关参数,如网络的初始连接权值与阈值、学习算法函数、训练算法函数、网络传递函数、网络的拓扑结构等,然后对创建的两种网络进行大量的训练,分别取训练误差最小的网络对各组影像数据进行分类;为直观表示分类结果,使用颜色表矩阵为各地物类型对应的类别号赋予一种颜色,其中植被为绿色、河水为蓝色、海水为青色、道路用地为黄色、居民区用地为品红色,将分类结果输出为索引彩色图像。
如图3(a)、(b)、(c)、(d)分别是基于BP网络的两组TM影像数据分类结果与基于LVQ网络的两组TM影像数据分类结果。
利用训练好的多组BP与LVQ神经网络对相应归一化后的测试样本仿真预测,最终输出为各地物类别编码,针对不同地物类别统计相应的真实地物类别编码个数,输出为混淆矩阵,再求算总体精度与Kappa系数进行精度评价;同时亦对基于光谱特征的最大似然法分类结果进行了精度计算。最大似然法:总体精度:72.9%,kappa系数0.711;BP网络数据一总体精度76.5%,kappa系数0.743,数据二:总体精度80.7%,kappa系数0.788;LVQ网络:数据一总体精度79.5%,kappa系数0.774,数据二总体精度85.7%,kappa系数0.836.
对图3中TM影像数据的各组分类结果进行人眼目视观察,可明显看出LVQ神经网络算法的总体分类效果都较BP网络要好,且“椒盐现象”比较少。从表2中的定量精度分析中可获知,不论是总体精度还是Kappa系数,两种神经网络算法的都较最大似然法的影像分类精度高,其中LVQ网络算法的分类精度最高,尤其引入纹理特征后有更明显的提高。
4 结语
实验结果表明,BP与LVQ神经网络分类器从一定程度上可以克服传统遥感影像分类方法无法解决的不确定性与模糊性,能获得较高的影像分类精度,引入纹理特征后精度有更进一步的提高,说明这两种神经网络算法能有效的将光谱特征与纹理特征有机结合起来对影像进行分类,具有较强的研究价值与应用意义。
参考文献
[1] 魏丽英,夏明,田春林.基于LVQ神经网络的城市快速路事件自动检测算法[J].吉林大学学报(工学版),2010(2).endprint