吴子宾 马秀丹
(山东科技大学信息科学与工程学院,山东 青岛 266590)
基于改进随机漫步的高光谱图像分类方法
吴子宾马秀丹
(山东科技大学信息科学与工程学院,山东青岛266590)
基于改进随机漫步的结合光谱信息和空间信息的高光谱图像分类方法,包括两个主要的步骤:首先,用SVM获得能够反映图像中的每个高光谱像素属于不同类别的分类概率图;然后,用结合高光谱图像空间信息的随机漫步算法对获得的像素级的分类概率图进行优化。该分类方法展示出较高的分类精度,尤其是在训练样本较少的情况下。
高光谱图像;随机漫步;图像分类;分类概率图
高光谱图像分类可以对遥感场景进行高层次的区分,因此目前广泛应用于不同的应用领域,如环境监测[1]、农业调控[2]和国防事业。然而,由于高光谱数据集的空间复杂特性,高光谱图像分类仍然有许多未解决的问题。
例如,高维度高光谱数据集在分类方面的“高斯现象”问题。“高斯现象”指的是在图像数据维数超过一定数量时,如果训练样本固定,一些监督分类方法的分类精度会显著下降。为了解决这一问题,开发出一些解决方案,如判别式学习方法。判别式学习方法包括支持向量机(SVM),多项逻辑回归和人工神经网络通过推断特征空间中类之间的非线性边界学习高维空间中类的分布。这些方法可以有效地解决上述困难引起的问题,但其自身仍存在一些问题,没有考虑到空间信息对分类效果的影响。
本文提出一种基于空间域和光谱域模型的分类方法。改进的随机漫步算法被用来对高光谱图像进行空间域和光谱域的分类。在基于随机漫步的最优框架中,用到了像素级的统计信息,空间相邻像素之间的相关信息,以及训练样本和测试样本之间的空间距离信息的总和。因此,该方法可以得到的分类结果与SVM相比分类精度更高。
1.1随机漫步
随机漫步(Random Walk,又称RW)于1903年由卡尔皮尔逊首次提出,是一种数学统计模型,由多个轨迹组成。而且每次都是随机生成的,用来表示不规则的变动模式。RW已经广泛应用于图像处理领域并取得不错的效果。图像作为一个加权图的算法模型G=(V,E),顶点v∈V和边e∈E,顶点就是图像中的像素,边就是两个相邻像素之间的相似度。连接第i个和第j个像素的每个边eij的权重定义了两个像素之间的相似度。基于权重图的形式,RW分割算法包括以下几个步骤:首先,给出一组标记像素集VM,每个像素vi∈VM由属于L= {1,……,N}标签集的n个标签标记。然后,RW通过已标记的像素计算从一个未标记像素i开始第一个到的已标记像素的概率Pin。最后,从L中选择标签按照最大概率给剩下的未标记像素VU=V∩-VM分配标签。
RW通过已标记的像素计算从一个未标记像素i开始第一个到的已标记像素的概率Pin能够通过计算以下的最小化能量函数(1)获得:
其中L表示图的Laplacian矩阵:
1.2改进随机漫步(MRW)
当顶点集VM是空集的时候RW不能运行,而且在RW的最优框架中没有包含高光谱图像的光谱信息。因此,RW不能直接应用于基于模型的概率分类。为了解决这一问题,本文采用一种改进的RW算法,除了空间函数(1)之外,再给出另一个空间能量函数:
因此(1)式和(3)式结合得到新的能量函数:
本文提出方法的算法流程包括2个步骤。①用SVM去评估表示高光谱图像中每个像素属于不同类的概率的初始概率图。让 L={1,……,N}作为标签集,x=(x1,x2,…xi)∈Rd×i表示输入的高光谱图像,高光谱图像中每个像素都是一个d维的特征向量,给出l个训练样本及其对应标签集Tl={(x1,c1),……,(xl,cl)},通过SVM的概率估计函数得到分类概率图r=(r1,……,rn)。其中,rin∈[0,1]是像素i属于第n个类的概率。②用MRW算法对由SVM获得的每个像素属于不同类的概率图进行优化。
基于MRW的最优化方法包括2个主要步骤:①用PCA对图像的光谱维数进行降维,构建能够较好地保留高光谱图像空间和结构信息的权重图G=(V,E)。②通过(4)式中的最小化能量函数得到像素对应不同类的最优概率。
实验用的图像是由机载可见光/红外成像光谱仪传感器(AVIRIS)在印第安纳州Indian Pines地区获得。高光谱图像由220个光谱波段145×145个像素组成,由16个地物类型组成,考虑到噪声、吸水率的影响,除去噪声污染严重及水汽影响的20个波段。
本文提出的方法MRW-based与经典分类方法Support Vector Machine(SVM)及最新的图像分类方法Feature Extraction of Hyperspectral Images With Image Fusion and Recursive Filtering(IFRF)作对比。表1中列出上述几种分类方法对图像分类的总体精度(OA)。表1中数据由每个实验做20次取均值所得。S为每个类的标记样本个数占总像素个数的百分比。
Hyperspectral Image Classification Method Based on the Improved Random Walk
Wu ZibinMa Xiudan
(College of Information Science and Engineering,Shandong University of Science and Technology,Qingdao Shandong 266590)
A hyperspectral image classification method based on improved random walk combined with spectral information and spatial information includes two main steps:first,SVM could be used to reflect the image of each pixel belonging to different categories of classification probability map;Then,the random walk algorithm combined with the spatial information of hyperspectral image was used to optimize the classification probability map of the pixel level.The classification method showed high classification accuracy,especially in the case of less training samples.
hyperspectral image;random walk;image classification;classification probability graph
表1 3种图像分类方法对Indian Pines数据集的总体精度(OA)
TP751
A
1003-5168(2016)05-0033-02
2016-04-26
吴子宾(1990-),男,硕士,研究方向:智能信息处理。
[1]J Pontius,M Martin,L Plourde,et al.Ash decline assessment in emerald ash borer-infested regions:A test of treelevel,hyperspectral technologies[J].Remote Sens.Environ.,2008(5):2665-2676.
[2]J L Boggs,T D Tsegaye,T L Coleman,et al.Relationship between hyperspectral reflectance,soil nitrate-nitrogen,cotton leaf chlorophyll,and cotton yield:A step toward precision agriculture[J].Remote Sens.Environ.,2003(3):5-16.