基于图像分割和LSSVM的高光谱图像分类

2017-01-19 14:28楚恒晁拴社
现代电子技术 2016年24期
关键词:图像分割

楚恒+晁拴社

摘 要: 提出一种基于图像分割和LSSVM的高光谱图像分类方法,将空谱信息结合起来进行高光谱图像的分类。首先利用均值漂移算法对高光谱图像进行分割,然后对每一块分割区域数据进行降维并且对降维后的数据LSSVM分类,最后用最大投票方法融合分割图和分类得到最终的分类结果。该文分类方法先对分割后的区域求出相似性矩阵并训练新样本集求出低秩系数矩阵,由相似性矩阵和低秩系数矩阵构造特征值方程求解出降维矩阵,然后利用混合核LSSVM对降维后的数据进行分类。实验结果表明,提出的基于图像分割和LSSVM的高光谱图像分类方法有效提高了高光谱图像的分类精度。

关键词: 高光谱图像分类; 图像分割; LSSVM; 数据降维

中图分类号: TN911.73?34; TP751.1 文献标识码: A 文章编号: 1004?373X(2016)24?0014?04

Hyperspectral image classification based on image segmentation and LSSVM

CHU Heng1,2, CHAO Shuanshe1

(1. School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China;

2. School of Geographical Sciences, Southwest University, Chongqing 400715, China)

Abstract: A hyperspectral image classification method based on image segmentation and LSSVM is proposed, which combines spatial information to realize the hyperspectral imagery classification. Firstly hyperspectral image is segmented with mean?shift algorithm, and then dimension reduction of the data in each segmentation region is conducted and LSSVM classification of the data after dimension reduction is carried out. Finally the maximum voting method is used to fuse segmented map and obtain the final classification result. With the proposed method, the similarity matrices of segmented regions are derived and the new training sample set is trained to derive the low rank coefficient matrix, and the eigenvalue equation is built by means of similarity matrices and low rank coefficient matrix to solve the dimension reduction matrix, and then LSSVM is used to classify the data after dimension reduction. The exp?erimental results show that the hyperspectral image classification method based on image segmentation and LSSVM can effectively improve the classification accuracy of hyperspectral images.

Keywords: hyperspectral image classification; image segmentation; LSSVM; dimension reduction of data

0 引 言

高光谱遥感图像由于覆盖波段多,光谱分辨率高,可以进行精细的地物分类,近年来被应用在矿物勘测、精细农业、医学检验等民用领域和军事侦察、战场地图绘制等军事应用领域。由于高光谱数据维数高,当样本数量有限时,往往会出现分类精度随特征维数的上升而下降的所谓Hughes现象[1]。支持向量机(Support Vctor Machine,SVM)在解决小样本高维数据的分类问题上具有较好的性能,是目前应用最为广泛的高光谱图像分类方法[2],为了解决SVM的凸优化求解问题提出了最小二乘支持向量机(Least Square Support Vctor Machine,LSSVM)。但由于支持向量机和最小二乘支持向量机分类器都缺乏理论依据且受核函数选择、参数设置的影响较大,不足以满足实际的应用需要。近年来,随着稀疏表示分类(Sparse Representation Classification,SRC)在高光谱图像分类上的良好表现,人们开始研究高维数据的内在低维结构,通过对每一个像元稀疏表示来进行高光谱图像分类,不仅有效解决了维数灾难的问题,而且比支持向量机可以获得更好的分类精度[3]。低秩表示衍生于稀疏表示,与稀疏表示不同的是,低秩表示不再对单个像元进行稀疏,而是寻找一个所有样本点作为向量组的最低秩的表示,它更好地保持了数据的全局结构,并且对噪声和奇异点有更好的鲁棒性[4?5]。但以上这些方法都没有将高光谱图像的空间上下文信息融合到分类中,使得分类精度不能更好满足实际应用中的需求。

本文提出一种新的空谱信息分类方法,首先利用熵率超像素分割方法得到高光谱图像的分割图,然后利用分割图区域的内在低秩结构和区域同质性构建降维特征值方程求出投影矩阵,在分类过程中使用LSSVM对降维后的数据进行分类得到分类图,最后采用最大投票方法融合分割图和分类图得到最终分类结果。通过高光谱图像分类实验,结果表明本文提出的结合空谱信息的分类方法有效提高了高光谱图像的分类精度。

1 基于均值漂移的高光谱图像分割

本文先利用主成分分析[6](Principle Compenent Analysis,PCA)提取第一主成分高光谱图像,然后对图像中的每一个像素点求出均值漂移值,基于局部区域同质性的原因,同一个类别的像素点总近似收敛到一点,这样可以将高光谱图像分割成许多形状大小不同、一致性较好的闭合区域[7?8]。均值漂移向量的基本形式定义为:

式中:[sR]是半径为R的高维球区域,[sR={x2-y2≤R2}];k表示n个样本点有k个落入[sR]区域;[x-xi]为样本点[xi]相对于[x]的偏移量。向量[mR(x)]就是对落入区域[sR]中k个样本点相对于点[x]的偏移向量然后再平均,从直观上看如果样本点[xi]从一个概率密度中采样得到,非零的概率密度就会指向概率密度增加最大的方向,因此[sR]区域内的样本点更大可能地落在沿着概率梯度的方向。因此,对应的均值漂移向量[mR(x)]指向概率密度梯度的方向。均值漂移示意图和经过均值漂移的分割图如图1、图2所示。 \

均值漂移将高光谱图像分为大小不同的封闭图像块区域,可以将每一个图像块看作一个超像素,通过对超像素块中的像素点的光谱值求和作平均得到图像块之间的空谱信息[Xw=nsxnsns]。

2 基于LSSVM的高光谱图像分类

2.1 构建降维目标函数

由上文均值漂移高光谱分割图可以得到不同形状大小的块区域,同一区域的像素是同一类的,设同一分割区域像素间的相似度为1,不同分割区域的相似度为0,以此来构造相似性矩阵[Wij]。利用图的拉普拉斯算子来描述数据的局部结构信息,为了使相邻的样本点在降维后依然保持[9]对不是同一区域的点,则不加约束,构造降维目标函数,最小化下列目标函数并变换成最小化拉普拉斯算子:

式中:[V]是降维映射矩阵,是由降维映射向量[vini=1]组成;[D]是相似性矩阵[W]的度,即每行之和;[L]是拉普拉斯矩阵。

假设高维数据集[X=x1,x2,…,xn],每一个列向量都是一个样本点都可以用数据集[X]线性表示,低秩表示[3]的目标函数为:

式中:[Z]为高维数据集[X]的最低秩表示;[D]为一个线性张成数据空间的字典,可以将数据集作为字典;[E]为噪声向量;[λ]是平衡参数。所以可将低秩表示模型看作将高维数据矩阵分解为低秩矩阵和稀疏矩阵的形式。为了避免出现NP难问题,可以将式(3)化简为:

式中:[·?]表示矩阵的核范数,即所有奇异值的和;[·2,1]为[l2,1]泛数。可以化为增广拉格朗日乘子求解问题,通过非精确拉格朗日乘子法求解低秩表示算法得出低秩表示系数矩阵[Z]。 由于低秩表示能够更好地表示数据的全局信息,因此,用低秩表示对高光谱图像进行计算,得到低秩表示系数矩阵[Z],基于低秩表示系数构造最小误差目标函数并化简为:

式中,[zini=1]是低秩表示系数。结合式(5)构造一个降维映射矩阵,最小化式(2)同时最大化式(5),即基于区域相似性低秩表示的维数约减算法目标函数可写为:

式中,[X′]是高光谱图像经过超像素分割之后得到的所有超像素的均值向量组成的新数据集。

式中:[ve]是第e个特征向量;[λe]为第e个特征值;d是降维后的维数。数据通过[V=v1,v2,…,vn]降维映射到低维空间中,经过降维后的数据,在结构上是稀疏的、低维的,可以真实反映出高光谱数据最本质的分类特征。

2.2 基于支持向量过采样的LSSVM分类

本文先利用数据的内在结构对高光谱数据进行降维,使得降维后的高维数据是低秩的、稀疏的、符合真实高光谱数据内在结构的低维高光谱数据。将原始高光谱图像进行投影,并且将降维后的高光谱图像分为标记训练集和无标记的测试集,然后利用LSSVM进行分类。但是传统的LSSVM分类器,由于为了解决SVM求解的凸优化问题而牺牲了原有支持向量的稀疏特性,使得在解决高光谱数据的多样本、不平衡分类问题时,出现少数类分类精度不高,或者与多数类分类精度差距很大。本文提出对LSSVM分类模型中的支持向量(Support Vectors,SVs)过采样来提高少数类分类精度不高的问题。SVs采样主要有两个原因:

(1) 只有少量的训练样本作为SVs且这些作为支持向量的样本一般都在判决边界上附近,对少样本类别的支持向量过采样可以减轻与多样本类别支持向量不均衡的问题;

(2) 支持向量是最小二乘支持向量机分类模型在信息量最大最有代表性的样本,对其采样比对训练样本采样更节约训练成本。本文对SVs少的一边进行过采样来使得分类边界的SVs分布平衡。本文提出的对支持向量过采样技术为用数学语言可表达为:

式中:[N+]表示多数类的SVs;[N-]表示少数类的SVs;[N-N++N-∈(0,0.5)]和[α∈(0,1)]是可调参量控制采样位置。首先计算出多核支持向量机中多数类支持向量个数[N+]和少数支持向量个数[N-],然后代入式(8)计算出过采样后的少数支持向量个数,然后将过采样后的支持向量代入多核最小二乘支持向量机模型进行不平衡分类。本处理过程只是针对少数类与多数类训练的子分类器,其他的子分类器不做处理。LSSVM是基于统计学习理论的机器学习算法,采用结构风险最小化准则,根据有限训练样本建立二分类模型通过引入非线性函数和对偶理论后,LSSVM的最大间隔的分类超平面函数为:

与以往的空谱信息分类方法[10]不同,本文先对高光谱图像利用均值漂移算法分割,然后通过对降维后的高光谱数混合核LSSVM分类得到分类图,最后用最大投票方法融合分割图和分类图得到结合空谱信息的高光谱图像最终分类结果[11]。通过大小不均封闭的分割图和混合核LSSVM分类图融合可以保证同一区域内的像素点是属于同一个类的,如图4所示。

分割图示意图中同一颜色代表同一块区域,当然这些区域内会有奇异点;分类图示意图是代表块区域内基于像素的分类情况,本文利用最大投票融合分类图和分割图消除掉分类图中的奇异点,得到最终的分类结果。

3 实验结果与分析

本文试验一采用1992年AVIRIS采集的印第安纳州西北部的Indian Pines高光谱数据,此数据有220个波段,[145×145]个像素,去除用于噪声和水汽吸收的20个光谱波段(104~108,150~163和220),有16种地物覆盖类型。这些数据被大多数研究者使用,研究结果具有可比性。通过比较LSSVM分类结果、SRC分类结果、MS分割图和LSSVM分类图融合的分类结果、MS分割图和SRC分类图融合的分类结果以及本文方法的分类结果如图5所示,表1给出了各种方法的总体分类精度(OA)、平均分类精度(AA)、Kappa系数、各地物分类精度。

本文核函数采用径向基函数,参数主要包括惩罚系数C、高斯核参数[σ]。在分类时需要预先设置C的取值范围,设置为{[10-4],[10-3],…,[102]},[σ]的取值范围设置为{[10-7],[10-6],[10-5],…,1,10,[102]},C值可通过训练样本的交叉验证获得,最优值为0.002,[σ]最优值为0.001。由表1可知,苜蓿、玉米略耕地、玉米、玉米未耕地、小麦、大豆略耕地的分类精度(不管是SVM还是SRC分类方法),在融合分割图后都有明显的提高,这也验证了融合分割图和分类图的可行性。本文方法通过对高光谱数据利用其本身的低维数据结构和区域同质性的特点进行降维 ,然后分类,更符合实际的数据特点。本文方法在分类精度上比MSSVM和MSSRC分类方法有进一步的提高,特别是大豆已耕地的分类精度达到了89.39%比MS+LSSVM的74.48%和MS+SRC的77.88%分别提高了14.91%和10.51%;混合土房的分类精度也比MS+LSSVM的66.94%和MS+SRC的73.21%分别提高了13.67%和7.40%;总体分类精度也达到了87.06%比MS+LSSVM的76.53%和MS+SRC的82.18%分别提高了10.53%和4.98%;Kappa系数为0.851 4。也达到了优良分类精度,高于MS+LSSVM的0.732 2和MS+SRC的0.796 7。

表1 Indian Pines高光谱数据样本数以及各性能指标

4 结 语

本文结合空谱信息进行高光谱图像分类,提出一种基于图像分割和LSSVM分类器的高光谱分类方法。与传统的空谱信息分类方法不同的是本文提出的方法利用分割图提取空间信息,然后利用分割图的区域同质性和高维数据内在的低秩结构构建降维目标函数,得到低秩稀疏数据通过LSSVM进行分类,最后由最大投票融合原则对分割图和分类图进行融合得到最终的分类结果,并且考虑了少数类分类精度不高的问题,提出了对其支持向量过采样来解决不平衡的分类问题。实验结果表明,本文方法很大程度上提高了高光谱图像的总体分类精度。在后续的研究中可以在保持分类精度的基础上,减少分类复杂度。

注:本文通讯作者为晁拴社。

参考文献

[1] LANDGREBE D. Hyperspectral image data analysis [J]. IEEE signal processing magazine, 2002, 19(1): 17?28.

[2] 谭琨,杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报,2008,27(2):123?128.

[3] SUN X, QU Q, NASRABADI N M, et al. Structured priors for sparse?representation?based hyperspectral image classification [J]. IEEE geoscience and remote sensing letters, 2014, 11(7): 1235?1239.

[4] 宋相法,焦李成.基于稀疏表示及光谱信息的高光谱遥感图像分类[J].电子与信息学报,2012,34(2):268?272.

[5] HE Z, LIU L, DENG R, et al. Low?rank group in spired dictionary learning for hyperspectral image classification [J]. Signal processing, 2016, 120: 209?221.

[6] RoDARMEL C, SHAN J. Principal component analysis for hyperspectral image classification [J]. Surveying and land information science, 2002, 62(2): 115?122.

[7] COMANICIU D, MEER P. Mean shift: A robust approach toward feature space analysis [J]. IEEE transactions on pattern analysis and machine intelligence, 2002, 24(5): 603?619.

[8] HUANG X, ZHANG L. An adaptive mean?shift analysis approach for object extraction and classification from urban hyperspectral imagery [J]. IEEE transactions on geoscience and remote sensing, 2008, 46(12): 4173?4185.

[9] KIM D H, FINKEL L H. Hyperspectral image processing using locally linear embedding [C]// Proceedings of 2003 First International IEEE EMBS Conference on Neural Engineering. [S.l.]: IEEE, 2003: 316?319.

[10] 王立国,孙杰,肖倩.结合空?谱信息的高光谱图像分类方法[J].黑龙江大学自然科学学报,2011(6):788?791.

[11] TARABALKA Y, BENEDIKTSSON J A, CHANUSSOT J. Spectral–spatial classification of hyperspectral imagery based on partitional clustering techniques [J]. IEEE transactions on geoscience and remote sensing, 2009, 47(8): 2973?2987.

猜你喜欢
图像分割
计算机定量金相分析系统的软件开发与图像处理方法
基于自动智能分类器的图书馆乱架图书检测
一种改进的分水岭图像分割算法研究
一种图像超像素的快速生成算法
基于鲁棒性的广义FCM图像分割算法
一种改进的遗传算法在图像分割中的应用
基于QPSO聚类算法的图像分割方法
荧光试条图像分割
基于分水岭算法的颅脑CT图像分割研究