有监督的邻域保留嵌入的高光谱遥感影像特征提取

2014-06-27 05:47骆仁波皮佑国
测绘学报 2014年5期
关键词:同类邻域像素点

骆仁波,皮佑国

华南理工大学自主系统与网络控制教育部重点实验室,广东广州 510640

有监督的邻域保留嵌入的高光谱遥感影像特征提取

骆仁波,皮佑国

华南理工大学自主系统与网络控制教育部重点实验室,广东广州 510640

提出一种名为判别监督邻域保留嵌入的新型特征提取算法(discriminative supervised neighborhood preserving embedding,DSNPE)。在高维超光谱遥感图像特征提取过程中,DSNPE不但能保留图像的局部流形结构和邻域信息,而且采用像素点由邻域同类像素点线性表示,将邻域中同类和非同类像素点分开处理,利用判别分式求解最优投影矩阵,使高维像素点投影到低维空间时,同类点离得尽可能近,非同类点离得尽可能远,有利于图像的分类。对3幅超光谱遥感图像的特征提取及分类的试验说明,与主成分分析(PCA)、非参数权重特征提取(NWFE)、局部保留投影(LPP)、邻域保留嵌入(NPE)等相比,具有一定的优越性和可判别性。

超光谱遥感图像;特征提取;分类

1 引 言

随着遥感技术的不断发展,超光谱遥感图像数据的获取也变得越来越容易。超光谱遥感图像包含的光谱频带波段数量多,信息丰富,广泛应用于地表目标识别领域,如环境监测[1]、土地农作物分析[2]、气象分析[3]等。近年来,如何精确智能地区分超光谱地表遥感图像中不同种类的地物已成为一个新兴热门的研究领域,其面临的主要困难是图像分类时训练样本的数量有限,不能建立精确的分类器模型,且易产生Hughes现象[4]。因而高维遥感图像特征提取算法研究引起了广泛的兴趣并获得了快速发展,如log Gabor滤波器[5]、基于融合点云的特征提取法[6]。图像特征提取在降维的同时还能够保留图像尽可能多的信息[7],有利于后续的图像处理。

主成分分析(principal component analysis, PCA)[8]是一种无监督特征提取算法,并广泛用于遥感图像处理[9]。它通过分析原始数据的协方差矩阵来进行特征提取,协方差矩阵的特征值大小代表信息量的多少,特征值较大代表有用信息,较小特征值代表的可能是噪声信息。但是作为一种无监督特征提取算法,PCA不能较好地利用类别标签信息。线性判别分析(linear discriminant analysis,LDA)和非参数权重特征提取(nonparametric weighted feature extraction,NWFE)是广泛用于遥感图像的两种有监督降维方法,它们找到一个最优投影矩阵,在投影子空间中最大化类内散度矩阵的迹同时最小化类间散度矩阵的迹。近几年,这两种算法得到不断地扩展,如:改进的Fisher线性判别分析、正则线性判别分析[10-13]等等。然而,这些算法只注重全域欧几里德结构而忽略了高维遥感数据的局部空间结构信息。

对于小样本问题,可运用线性化来构建邻域结构图进行特征提取,如有监督局部保留投影(supervised locality preserving projection,SLPP)[14]—Laplacian eigenmaps(LE)[15]的线性化,邻域保留嵌入(neighborhood preserving embedding, NPE)[16]—局部线性嵌入(locally linear embedding,LLE)[17]的线性化。SLPP能够保留样本固有的局部流形结构不变,利用局部结构信息和全域标签信息,构造邻域相似性矩阵和类相关矩阵,根据使投影后的同类像素点之间的距离尽可能小的目标,利用求最优解方法求得最优投影矩阵。因此,SLPP能把同类像素点尽可能投影在一起,把不同类的像素点尽可能分开。NPE利用局部邻域点信息,每个像素点可以被周围几个像素点线性表示,各权重系数由与目标像素点的距离决定。由此可以找到一个最优邻域嵌入映射矩阵,使得在低维空间中邻域信息得到很好的保留。然而,对于分类问题,NPE忽略了同类与非同类样本的差异。

本文在NPE基础上,提出了一种算法,名为判别监督邻域保留嵌入(DSNPE)特征提取算法。DSNPE算法中,每个像素点由邻域中的同类像素点线性表示,而不是所有邻域中的像素点,这与SLPP算法构造相似性矩阵和类相关矩阵的方式完全不同。同时在所投影的低维空间中,DSNPE能使非同类的像素点之间尽可能离得远。DSNPE主要有三大优点:①算法同时考虑了类内结构和类间结构,使分类时效果更好;②考虑了邻域点中同类样本与非同类样本的区别,使可判别性更高;③在低维空间中,能使同类样本离得更近而非同类样本离得更远。

2 邻域保留嵌入算法(NPE)

设X=[x1,x2,…,xN]为一组高维原始数据向量集,其中{x1,x2,…,xN}∈Rn,Y=[y1,y2,…,yN]表示与高维原始数据映射对应的低维空间向量集,{y1,y2,…,yN}∈Rd,(d≪ n),n表示遥感图像光谱波段数,d表示特征提取后特征空间的维数,N表示样本总数。特征提取的目标是找到一个n×d的投影矩阵A,使每一个原始数据点xi都能通过yi=ATxi,映射到另一特征空间,并且保留高维数据的绝大部分信息。

NPE算法中每个像素点可由其邻域点线性表示,建构邻域结构连接图,表示其邻域信息。某些情况下,局部子流形结构是非线性的,可以将其近似线性化。假设xi表示第i个像素点,如xj在xi的邻域内,则将他们连接起来,构建邻域结构图,用矩阵W来表示邻域结构图连接权重,Wij表示点xj到点xi的权重,若Wij值为0则表示xj不在点xi的邻域内。权重系数可以通过求解最小化目标方程(式(1))求取

然后求解广义特征根方程(式(2))得出转换矩阵A

可以看出M是对称矩阵且半正定,设列向量a1、a2、…、ad为方程(2)的解,它们对应的特征值分别为λ1、λ2、…、λd,且λ1≤λ2≤…≤λd,则嵌入公式如下

式中,yi是d维向量;A是n×d矩阵。

3 判别监督邻域保留嵌入(DSNPE)

与NPE算法不同,DSNPE算法中每个像素点由邻域中的同类像素点线性表示,而非所有像素点,即像素点xi由xi1、xi2、…、xil线性表示, xi1、xi2、…、xil与xi属于同一类,且都属于xi的K个最近邻域点,表示如下

为了突出邻近点重要性,本文权重系数的计算采用邻域像素点与xi的距离倒数计算出来, dist(a,b)即表示a到b的距离,假如xij与xi的距离越近,倒数越大,它的权重就越大,接近于1,否则权重越小,接近于0,其他非邻域像素点xj, Wij=0。设Y=[y 1 y2…ym]T为映射后的低维空间中的点集,则可以推出下列最小化目标方程

4 试验设计

本文采用美国Indian Pine、KSC和Washington DC Mall 3幅超光谱遥感图像作为试验对象,选择PCA、NWFE、LPP和NPE 4种有代表性的特征提取算法与DSNPE进行对比。试验过程是先用这5种特征提取算法对原始图像进行特征提取,然后在相同条件下采用相同分类器进行分类,比较分类效果,即总体分类正确率和Kappa系数。分类器选取最近邻分类器。

4.1 试验对象

试验对象假彩色图像如图1所示。

图1 试验对象假彩色图Fig.1 Simulated grayscale IR image for experiment

(1)图像India Pine拍摄对象是Indian Pine的西北部部分区域的光谱图像[15],地面空间分辨率为18 m,大小是145像素×145像素,此图含有220个波段,通过去除噪声通道频带后保留了185个波段,覆盖的波长范围是0.4~2.4μm。此区域所含类别数为16,为了方便试验,本文选取了其中样本数超过100的13类(见表1),试验样本总数为10 221。此图更详细资料参见文献[18]。

表1 试验样本类别及数量Tab.1 Classes and corresponding numbers of experimental samples

(2)图像KSC是在肯尼迪太空中心拍摄佛罗里达州的超光谱图像,地面空间分辨率为18 m,含有224个波段,去除噪声通道频带后保留了176个波段,覆盖的波长范围是0.4~2.4μm。本文截取512像素×614像素大小的区域进行试验。此区域所含类别数为13(见表1),试验样本总数为5211。此图更详细信息参见文献[19]和http:∥www.csr.utexas.edu网站。

(3)图像DC Mall拍摄对象是美国华盛顿城市的一片区域[16],地面空间分辨率为18 m,大小是1280像素×307像素,去掉噪声通道频带后保留了191个波段,覆盖的波长范围是0.4~2.4μm。本文选取了550像素×307像素大小的区域进行试验。这个区域所含类别数为7,选取其中样本数超过100的6类(见表1),试验样本总数为4452。此图更详细信息参见文献[20]。

4.2 试验结果及分析

为了探索各种特征提取算法的效果,本文选取了3组不同训练样本数目进行试验,训练样本的数量为在每类中随机分别选取20、40、100。试验时,选取一定比例的样本作为训练样本,其他样本作为测试样本。因为各试验图像所含类别数不同,分别为13、13和6,所以提取的最大特征数分别设置为20、20和15。试验重复10次,平均值作为最终试验结果。

试验结果见图2—图4和表2。图2—图4是当训练样本数量不变时,平均分类正确率随着提取特征数的不断增长而变化的曲线图;表2的数据是指最高平均分类正确率(对应的特征数)和Kappa系数。通过DSNPE和其他几种算法对遥感图像Indian Pine特征提取后,分类结果如图5所示。分析上述结果可以得到以下几点:

(1)与其他几种特征提取算法相比,DSNPE分类效果最好,分类正确率最高。

(2)与NPE相比,DSNPE不仅仅考虑到类内样本与类间样本的区别,还加入了类间样本的判别信息,使不同类样本之间离得尽可能远,因此分类效果得到了提高。

(3)随着提取特征数的增加,NWFE的分类正确率上升到一定程度后开始下降,而DSNPE不会下降。

(4)DSNPE分类效果同样好于PCA和LPP,说明DSNPE提取的特征更具判别性。

图2 Indian Pines分类平均正确率曲线图Fig.2 Curves of average classification accuracies for Indian Pine(Ni=100)

图3 KSC分类平均正确率曲线图Fig.3 Curves of average classification accuracies for KSC(Ni=100)

图4 DC mall分类平均正确率曲线图Fig.4 Curves of average classification accuracies for DC mall(Ni=100)

5 结 论

本文提出了一种判别监督邻域保留嵌入(DSNPE)超光谱遥感图像特征提取算法。该算法充分利用训练样本的标签信息,在目标样本线性化表示时选择邻域中同类样本而不是邻域中所有样本,并且将邻域中同类和非同类像素点分开处理,利用判别分式求解最优投影矩阵,使高维像素点投影到低维空间时,同类点离得尽可能近,非同类点离得尽可能远。与PCA、NWFE、LPP和NPE等特征提取算法的对比试验也说明DSNPE有一定的优越性,提取的特征判别性更强,使分类正确率得到提高。

图5 Indian Pine分类效果图(Ni=40)Fig.5 Classification maps for Indian Pine(Ni=40)

表2 分类平均最高正确率(提取特征数)及对应的Kappa系数Tab.2 Highest classification accuracies(features)and coreponding Kappa

续表2

[1] AGYEMANG T K,HEBLINSKI J.Accuracy Assessment of Supervised Classification of Submersed Macrophytes: The Case of the Gavaraget Region of Lake Sevan, Armenia[J].Hydrobiologia,2011,661(1):85-96.

[2] TRACOL Y,GUTIERREZ J R.Plant Area Index and Microclimate underneath Shrub Species from a Chilean Semiarid Community[J].Journal of Arid Environments, 2011,75(1):1-6.

[3] TOMLINSON C J,CHAPMAN L.Remote Sensing Land Surface Temperature for Meteorology and Climatology: A Review[J].Meteorological Applications,2011,18(3): 296-306.

[4] HUGHES G F.On the Mean Accuracy of Statistical Pattern Recognizers[J].IEEE Transactions on Information Theory,1968,14(1):55-63.

[5] XIAO Pengfeng,FENG Xuezhi.Segmentation of Highresolution Remotely Sensed Imagery Based on Features in Frequency Domain[J].Acta Geodaetica et Cartographica Sinica,2008,37(3):401-409.(肖鹏峰,冯学智.高分辨率遥感图像频域特征提取与图像分割研究[J].测绘学报,2008,37(3):401-409.)

[6] WU Hangbin.Classification and Feature Extraction of Airborne LiDAR Data Fused with Aerial Image[J].Acta Geodaetica et Cartographica Sinica,2011,40(1):134-140.(吴杭彬.融合航空影像的机载激光扫描数据分类与特征提取[J].测绘学报,2011,40(1):134-140.)

[7] FONG M.Dimension Reduction on Hyperspectral Images [R].Los Angeles:University of California,2007.

[8] SCHOTT J.Remote Sensing:The Image Chain Approach [M].Oxford:Oxford University Press,1996.

[9] FAUVEL M,CHANUSSOT J,BENEDIKTSSON J A.Kernel Principal Component Analysis for the Classification of Hyperspectral Remote-sensing Data over Urban Areas[J].EURASIP Journal on Advances in Signal Processing,2009,2009(3):1-15.

[10] DU Q.Modified Fisher’s Linear Discriminant Analysis for Hyperspectral Imagery[J].IEEE Geoscience and Remote Sensing Letters,2007,4(4):503-507.

[11] BANDOS T V,BRUZZONE L,CAMPS-VALLS G.Classification of Hyperspectral Images with Regularized Linear Discriminant Analysis[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(3):862-873.

[12] YANG J M,YU P T,KUO B C.A Nonparametric Feature Extraction and Its Application to Nearest Neighbor Classification for Hyperspectral Image Data[J].IEEE Transactions on Geoscience and Remote Sensing,2010, 48(3):1279-1293.

[13] HUANG H Y,KUO B C.Double Nearest Proportion Feature Extraction for Hyperspectral-image Classi-fication[J].IEEE Transactions on Geoscience and Remote Sensing, 2010,48(11):4034-4046.

[14] LUO Renbo,PI Youguo,LIAO Wenzhi.Research on Supervised LPP Feature Extraction for Hyperspectral Image[J].Remote Sensing Technology and Application, 2012,27(6):46-52.(骆仁波,皮佑国,廖文志.超光谱遥感图像有监督LPP特征提取研究[J].遥感技术与应用, 2012,27(6):46-52.)

[15] HE X F,CAI D,YAN S C,et al.Neighborhood Preserving Embedding[C]∥Proceedings of IEEE 2005 International Conference on Computer Vision.Beijing:IEEE, 2005:1208-1213.

[16] BELKIN M,NIYOGI P.Laplacian Eigenmaps and Spectral Techniques for Embedding and Clustering[C]∥Advances in Neural Information Processing System:14.Cambridge: MIT Press,2002:585-591.

[17] ROWEISS T,SAUL L K.Nonlinear Dimensionality Reduction by Locally Linear Embedding[J].Science,2000,290 (5500):2323-2326.

[18] University of Texas at Austin.AVIRIS NW Indiana’s Indian Pines 1992 Data Set[EB/OL].Texas:University of Texas at Austin,1992[2013-02-23].ftp:∥ftp.ecn.purdue.edu/biehl/MultiSpec/92AV3C.

[19] HAM J,YANGCHI C,CRAWFORD M,et al.Investigation of the Random Forest Framework for Classification of Hyperspectral Data[J].IEEE Transactions on Geoscience and Remote Sensing,2005,43(3):492-501.

[20] LANDGREBE D A.Signal Theory Methods in Multispectral Remote Sensing[M].Hoboken:Wiley,2003.

(责任编辑:丛树平)

Supervised Neighborhood Preserving Embedding Feature Extraction of Hyperspectral Imagery

LUO Renbo,PI Youguo
Key Laboratory of Autonomous Systems and Network Control of Ministry of Education,South China University of Technology,Guangzhou 510640,China

A novel hyperspectral remote sensing imagery feature extraction algorithm called discriminative supervised neighborhood preserving embedding(DSNPE)is proposed for supervised linear feature extraction.DSNPE can preserve the local manifold structure and the neighborhood structure.What’s more, for each data point,DSNPE aims at pulling the neighboring points with the same class label towards it as near as possible,while simultaneously pushing the neighboring points with different labels away from it as far as possible.Numerical experiments in three real hyperspectral-image datasets are reported to illustrate the out performance of DSNPE when compare DSNPE with a few computing methods,such as PCA,NWFE, LPP and NPE.

hyperspectral-image;feature extraction;classification

LUO Renbo(1986—),male,PhD candidate, majors in hyperspectral remote sensing imagery processing.

PI Youguo

P237

A

1001-1595(2014)05-0508-06

广东省教育部产学研结合项目(2009B090300269)

2013-09-11

骆仁波(1986—),男,博士生,研究方向为超光谱遥感图像处理。

E-mail:luo.rb@mail.scut.edu.cn

皮佑国

E-mail:auygpi@scut.edu.cn

LUO Renbo,PI Youguo.Supervised Neighborhood Preserving Embedding Feature Extraction of Hyperspectral Imagery[J].Acta Geodaetica et Cartographica Sinica,2014,43(5):508-513.(骆仁波,皮佑国.有监督的邻域保留嵌入的高光谱遥感影像特征提取[J].测绘学报,2014,43(5):508-513.)

10.13485/j.cnki.11-2089.2014.0079

收稿日期:2013-05-10

猜你喜欢
同类邻域像素点
融合密度与邻域覆盖约简的分类方法
基于局部相似性的特征匹配筛选算法
稀疏图平方图的染色数上界
同类色和邻近色
基于5×5邻域像素点相关性的划痕修复算法
基于邻域竞赛的多目标优化算法
基于canvas的前端数据加密
七种吃同类的动物
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
关于-型邻域空间