主成分等变换及组合分类在半湿润流域的应用

2017-02-16 02:24颜梅春
地理空间信息 2017年1期
关键词:降维波段分量

方 耀,颜梅春

(1.河海大学 地球科学与工程学院,江苏 南京 211100)

主成分等变换及组合分类在半湿润流域的应用

方 耀1,颜梅春1

(1.河海大学 地球科学与工程学院,江苏 南京 211100)

以东湾流域为研究区,首先对TM影像进行主成分分析(PCA),缨帽变换,色调、亮度、饱和度彩色变换(HIS),并求得归一化植被指数、归一化建筑指数、归一化水体指数、归一化裸土指数、归一化阴影指数和第四波段灰度共生矩阵纹理特征,构造了新的特征影像;然后对其分别进行PCA、独立主成分分析(ICA)、最小噪声分离(MNF)3种变换;再对变换后的结果分别进行最大似然法、神经网络以及支持向量机(SVM)分类,以研究不同变换、不同分类方法的差异。提出了一种新的降低特征相关性的方法,并确定了最有效的一种分类—变换组合。结果表明,新特征降维方法的分类精度达到了93.457%,而单一特征降维方法最高分类精度为91.955%,证明该方法能更有效地提取影像特征。

PCA;ICA;MNF;特征组合;监督分类;东湾流域

遥感图像分类是信息提取的主要手段。由于气候和人为活动的影响,半湿润流域的地表、地物复杂破碎,分类难度较大;同时遥感影像本身的空间分辨率以及“同物异谱”、“异物同谱”也会对分类结果造成不同程度的影响,降低分类精度。随着遥感技术的发展,一些新型的分类算法被提出,如专家系统、SVM、神经网络(NNC)等。影像波段间数据有不同程度的相关性,各特征间也有类似情况。目前,降低特征相关的方法主要有PCA、MNF、ICA等。葛山运[1]提出了一种基于MNF、PCA和ICA的高光谱数据特征提取方法,通过ICA分解类别高度混合的数据、PCA的压缩数据和MNF的高度降噪等变换提高了类别高度混合数据的分类精度;但这些方法很难较好地适应光谱相应特性变化和高度混合的地类,将导致重要信息的丢失。李策[2]等通过对比研究认为最大似然法(MLC)要优于SVM分类;而梁亮[3]等通过基于ICA与SVM算法的高光谱遥感影像分类发现:ICA变换下,SCM分类要优于MLC分类。纪娜[4]等认为基于MNF变换的SVM分类能够提高分类的精度。因此,如何选择降维方法来提取遥感图像上特定区域的有效信息,选用何种分类方法以达到最优的分类效果,都是亟待解决的问题。

1 研究方法

1.1 特征提取方法

PCA是一种去除波段间的多余信息,将多波段的图像信息压缩到比原波段更有效的少数几个转换波段的方法[5]。MNF变换以信噪比最大化为变换准则[6-7],将数据分解为一系列彼此不相关的成分,可减少后续处理的计算量。MNF变换具有PCA的性质,是一种正交变换,变换后得到向量的各元素互不相关,第一分量集中了大量的信息,随着波段数量的增加,影像质量逐渐下降,变换后波段按照信噪比从大到小排列,通常用于噪声去除、特征提取、数据降维等。ICA变换是用于数据特征提取的线性变换技术,是基于信号的高阶统计特性的分析方法,经ICA分解出的各信号分量相互独立。

1.2 分类方法

基于遥感影像的信息自动提取方法大致可分为监督分类、非监督分类、决策树分类、面向对象特征提取、基于空间分析方法的信息提取5类。其中监督分类方法是一种常用的遥感影像信息提取方法,本文采用监督分类中MLC、NNC、SVM进行实验。

MLC是基于统计理论的参数分类器,现已成为应用最为广泛的分类器[8]。其建立在贝叶斯准则基础上,且分类错误概率最小,是风险最小的决策分析。NNC是近年发展起来的一种具有人工智能的分类方法。它用计算机模拟人的结构,用许多小的处理单元模拟生物的神经元,以算法实现人脑的识别、记忆、思考过程,进而应用于图像分类[9]。反向传播(BP)网络作为人工神经网络技术在遥感图像分类处理中的主要应用,通常将要分类的地物对象的条件集合或特征组合作为BP网络的输入模式,并给出期望输出模式(预测类型)。SVM在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能推广应用到函数拟合等其他机器学习问题中,基本原理见文献[10]。

2 实验研究

2.1 研究区概况

本文以伊洛河流域上游的东湾流域为研究区,伊洛河包括伊河、洛河两条河流,伊河是洛河的第一大支流。伊河面积占洛河的1/3,远超过其他支流,自成一个流域和水系,因此常把伊河和洛河两条河流合称为伊洛河。东湾属于伊河河源地区,为半湿润区,属于大陆性气候;地类高度混合,部分农田位于山沟内部,不易与植被区分,未种耕地与裸土极易混淆。选用有较高光谱分辨率和适宜空间分辨率的TM影像为数据源,成像时间为2011年8月。此外,采用2003年分辨率为30 m的DEM数据来消除地形地貌噪声。

2.2 实验方法

对原始的TM遥感影像进行几何校正、去云及阴影处理、大气校正等预处理,再进行以下变换或波段运算得到各特征:①PCA变换,取前3个主成分;②缨帽变换(TC),取前3个分量:明度、绿度、黄度;③HIS变换得到色调、亮度、饱和度;④第四波段灰度共生矩阵纹理特征,得到能量、对比度、熵、均匀性、均值、方差、非相似度、相关性等8个分量特征;⑤ 归一化植被指数(NDVI)、归一化建筑指数(NDBI)[11]、归一化裸土指数(BI)[12]、 归一化水体指数(NDWI)[13]、归一化阴影指数(NDUI)[14],具体见表1。

表1 各波段来源

将上述22个波段进行合成得到新的特征影像,再对新的特征图像分别进行PCA、ICA、MNF变换。由于各变换前10个波段的特征值累计百分比分别达到99.99%(PCA)、99.99%(ICA)、88.72%(MNF),故本次实验选用变换后的前10个波段作为实验数据。

PCA变换有对遥感图像噪声考虑不足的缺陷;MNF在变换的同时考虑了遥感数据质量评估参数——信噪比,从而比PCA变换具有更好的降维去噪能力;ICA变换不仅能消除多变量数据间的二阶相关信息,而且能消除数据间的高阶相关,比PCA变换更能消除数据间的相关性。本文提出的特征降维方法包括3个相互联系的阶段:第一阶段,利用MNF变换对遥感图像进行处理,得到一系列按信噪比从大到小排列的彼此不相关的MNF成分,选择前10个MNF分量作为下一阶段处理的输入数据;第二阶段,分别利用PCA变换和ICA变换对以上10个MNF分量进行处理,得到10个PCA分量和10个ICA分量;第三阶段,对得到的10个PCA分量和ICA分量进行重新组合(PCA前5个分量和ICA后5个分量),进而得到含有10个分量的新特征影像。对新的特征影像分别进行MLC、NNC、SVM分类,并与PCA、ICA、MNF单独分类结果进行对比研究,具体流程见图1。

图1 实验流程图

通过对影像的研究,将研究区分为水体、建筑、植被、耕地、裸土和其他6类。从预处理后的TM影像中选取以下分类样本:水体、建筑、植被、耕地、裸土和其他,其训练样本数分别为384、398、601、307、144和363;验证样本数分别为424、254、272、218、65和265。分别用MLC、NNC、SVM方法对各变换得到的前10个波段进行分类,并运用形态学算子,以类别集群的方法,使用3×3的变换核对分类图像进行侵蚀操作,去除“椒盐”。经过类别集群处理后的图像更为平滑,组合的总体精度和Kappa系数都有所提高,说明类别集群算法可改善分类结果,使其更接近真实地物,最后得到分类结果见图2。

图2 分类影像图(分类+变换)

2.3 结果与精度验证

运用上述方法进行分类后,利用混淆矩阵和分类精度指标对其进行评价,得到特征降维与分类12种组合的总体精度与Kappa系数(表2)。其中,分类效果最好的SVM-MNF+PCA+ICA组合的混淆矩阵见表3。

表2 分类总体精度和Kappa系数

表3 MNF+PCA+ICA的SVM分类混淆矩阵

3 结 语

1)本文提出的方法总体精度和Kappa系数都要优于PCA、ICA、MNF单独分类的结果。无论是新方法、PCA变换、ICA变换还是MNF变换,从总体精度和Kappa系数角度考虑,SVM分类效果最好,其次是MLC,NNC分类效果最差。

2)3种单独的特征降维方法比较:对于MLC,MNF变换的分类结果要优于ICA变换和PCA变换;对于NNC,MNF变换的分类结果要优于ICA变换,而二者都明显优于PCA变换;对于SVM,PCA变换的分类结果要优于MNF变换, ICA变换的分类结果最差,但其分类总体精度也达到了91.274 8%,Kappa系数达到了0.895 7,说明无论针对何种变换方法,SVM分类的结果都比较理想。

3)最优的分类—变换组合是基于MNF+PCA+ICA变换的SVM分类,其总体精度达到93.457 9%,Kappa系数达到0.920 0;而效果最差的分类—变换组合是基于PCA变换的NNC分类,其总体精度为75.127 5% ,Kappa系数为0.700 8。

实验证明,新的特征降维方法能更有效地提取影像特征,对于提高影像分类的精度,使分类结果更接近真实地表,具有一定指导意义。

[1] 葛山运.基于MNF、PCA与ICA结合的高光谱数据特征提取方法[J].城市勘测,2013(2):103-106

[2] 李策,何秉宇,王慧.沙漠化遥感分类方法对比分析:以新疆塔河下游为例[J].新疆环境保护,2012,34(4):10-15

[3] 梁亮,杨敏华,李英芳.基于ICA与SVM算法的高光谱遥感影像分类[J].光谱学与光谱分析,2010,30(10):2 724-2 728

[4] 纪娜,李锐,李静.MNF和SVM在遥感影像计算机分类中的应用[J].水土保持通报,2009,29(6):153-158

[5] ZHANG C Y, GUO S, GUAN Y N, et al. The Approaches of Cover Classification of the Wuda Coal Fire Area[J].Journal of Remote Sensing,2011,15(1):149-154

[6] Nielsen A A. Kernel Maximum Autocorrelation Factor and Minimum Noise Fraction Transformations[J]. IEEE Trans Image Process,2011,20(3):612-624

[7] 李海涛,顾海燕,张兵,等.基于MNF和SVM的高光谱遥感影像分类研究[J].遥感信息,2007,22(5):12-15,25

[8] CHEN C X, HU C M. Effect of Different Radiation Correction Methods of Landsat TM Data on Land-cover Remote Sensing Classification[J].Journal of Remote Sensing,2013,17(6):320-326

[9] 潘远,杨景辉,武文波.粗糙集约简的神经网络遥感分类应用[J].遥感信息,2012,27(4):86-90

[10] ZHANG F F, LI W Z, LU L Y, et al. Technologies of Extracting Land Utilization Information Based on SVM Method with Mutiwindow Texture[J].Journal of Remote Sensing,2012,16(1):67-72

[11] 陈志强,陈健飞.基于NDBI指数法的城镇用地影像识别分析与制图[J].地球信息科学,2006,8(2):137-140

[12] Rikimaru A. ITTO Workshop on Utilization of Remote Sensing in Site Assessment and Planning for Rehabilitations of Logged-over Forest [C]//Landsat TM Data Processing Guide for Forest Canopy Density Mapping and Monitoring Model, Bangkok,1996:1-8

[13] 徐涵秋.利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J].遥感学报,2005,9(5):589-595

[14] 周坚华,周一凡,郭晓华,等.城镇阴影区植物分布信息提取与亮度修复的方法[J].华东师范大学学报(自然科学版),2011(6):1-9

P237

B

1672-4623(2017)01-0019-03

10.3969/j.issn.1672-4623.2017.01.006

方耀,硕士研究生,主要研究方向为遥感与地理信息系统应用。

2015-12-07。

项目来源:国家自然科学基金资助项目(41130639);中央高校基本科研业务专项资助项目(2009B11714)。

猜你喜欢
降维波段分量
混动成为降维打击的实力 东风风神皓极
帽子的分量
降维打击
论《哈姆雷特》中良心的分量
分量
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
基于SPOT影像的最佳波段组合选取研究
基于瞬时对称分量法的三相四线制D-STATCOM控制研究
抛物化Navier-Stokes方程的降维仿真模型