宋相法 焦李成(西安电子科技大学智能感知与图像理解教育部重点实验室 西安 710071)
②(河南大学计算机与信息工程学院 开封 475004)
高光谱遥感图像是由几十乃至数百个连续波段图像组成的3维数据立方体,具有“图谱合一”的特点,提高了对地物的分类和监测能力,已经被广泛应用于资源勘探、环境监测、精细农业、灾害评估、目标识别等领域[1-5]。像元分类是高光谱遥感图像研究的最重要内容之一。由于硬件等因素的制约,高光谱遥感图像的光谱空间分辨率高而空间分辨率往往相对较低,如果仅利用光谱信息进行分类,其分类精度必然受到一定的制约。为了提高像元分类精度,必须进一步提取图像的其他信息,例如形状、纹理、空间关系和扩展形态剖面(extended morphological profile)特征[1]。另外,由于高光谱数据维数高、数据量大、训练样本数目有限,传统的分类方法运算速度慢,分类精度低,还会出现严重的huges现象[6]。在高光谱遥感分类中随机森林分类器[7]具有明显的优越性,因此随机森林分类器应用被归纳为高光谱遥感分类最重要的进展之一[4,5]。
由于光谱成像仪的空间分辨率限制以及自然界地物的复杂多样性,通常情况下,高光谱图像中每个像元往往包含几种地物,可以认为是图像中几个端元的线性组合。最近发展起来的稀疏表示[8]就是把图像表示为字典中基原子的稀疏线性组合。当把图像投影到这些原子组成的特征子空间时,只有少部分同时处于活跃状态,产生对该图像的稀疏表示。该方法可以描述上述高光谱图像像元的特性,并成功应用于高光谱混合像元分解[9]。
为了提高像元分类精度,本文提出了基于稀疏表示[8]的高光谱遥感图像特征提取算法,结合稀疏表示特征及光谱信息,使用随机森林方法[7]作为分类器,提出了一种新的高光谱遥感图像分类算法。实验结果表明:相对于光谱信息方法和稀疏表示特征方法,本文算法能够提高高光谱遥感图像分类的各项评价指标。
由于稀疏表示模型符合生物视觉系统特性,且能够提取图像的高级特征[8],成为了图像处理和模式识别等领域的研究热点[8-18]。本文利用稀疏表示提取高光谱图像稀疏表示特征,基于稀疏表示特征及光谱信息利用随机森林作为分类器提出了一种新的高光谱遥感图像分类算法。
如何获得高光谱图像中的端元构造字典是利用稀疏表示方法提取稀疏表示特征的关键问题。常用的端元提取方法主要有纯像元指数,N-FINDR,定点成分分析和主分量分析,这些方法假设高光谱数据位于一个凸面体内[19]。而稀疏表示模型不需要假设数据位于凸面体内,利用学习的方法构造的字典原子更能有效地捕获高光谱图像像元的谱特征,该字典可以有效地表示像元。
令高光谱遥感图像数据集X={xi|xi∈ℜm,1 ≤i≤n},字典D∈ℜm×p(每一列Dj∈ℜm为一个原子),该字典D能够捕获像元的谱特征,且每个像元xi可以被字典D中的原子稀疏线性表示。根据文献[18],可以把字典学习的问题转化为求解如下形式的优化问题:
其中A∈ℜp×n为系数矩阵(每一列Ai∈ℜp为一个系数向量),λ>0。式(1)中第1项为重构误差,第2项为稀疏惩罚函数,参数λ表示数据重构和稀疏性之间的折中关系。字典D中的元素Dj和系数矩阵A中的元素Ai是被优化的变量。
在字典学习阶段,当字典D和系数矩阵A不固定时,上述问题不是凸优化问题。通常情况下,采用迭代的方法可以求解式(1)。首先固定字典D,则式(1)转化为一个关于A的基于ℓ1-范数的最小平方凸优化问题;然后固定系数矩阵A,则式(1)转化为一个关于D的带二次约束的最小平方凸优化问题。通过多次迭代求解可以得到字典D。
利用2.1节学习得到的字典D,根据稀疏表示理论,可以把像元x∈X表示为字典D中原子的稀疏线性组合,即求解下列优化问题:
式(2)是一个凸ℓ1-正则化最小平方问题,得到的解是一个稀疏向量,即只有少数元素不为零。
由于同类像元的光谱曲线结构非常相似,因此根据字典D求得的系数也比较相似。根据文献[14],可以把作为像元x的一种新的表示形式,即像元x在字典D上的稀疏表示特征。
利用高光谱图像稀疏表示特征及光谱信息表示像元x∈X时,由于它们处于两个不同的表示空间,为了提高分类精度,本文提出利用分类器集成方法。随机森林是近年来比较流行的一种基于决策树(decision tree)的分类器集成算法。该算法是一种对参数选择不敏感,不存在过适应,分类结果稳定,学习训练速度较快的分类器集成算法,在解决多类问题上具有许多独特的优势。随机森林方法定义如下[7]:
随机森林分类器由多个决策树(h(x,θk),k=1,2,…,l)组成,其中θk是相互独立且同分布的随机向量,每个决策树对于输入给出独立的分类结果,最终根据所有决策树的分类结果通过多数投票决定输出结果。
随机森林算法包括两部分,即构建l棵决策树和投票决定分类结果。在构造决策树时,采用bagging方法[20],即从全体训练样本集中随机地有放回地选取一个子集,作为单棵决策树的训练样本集,上述过程重复l次就分别得到l棵决策树的训练样本集。同样,在每棵决策树的生成过程中也引入了随机性,若训练数据为q维特征向量,在决策树的每个节点处,并不对所有特征进行比较,而是随机选择t(t≪q)个特征进行比较,选择其中分类结果较好的特征来切分树节点。引入随机性使得每两棵树之间的差异度增加,从而使得森林的泛化误差提高。构造的决策树不进行剪枝。利用随机森林方法进行分类的最终分类结果由所有决策树通过多数投票决定。
由于随机森林采用随机子空间特征选择方法减少了输入空间的维数且能够快速构造决策树,同时根据多个决策树的结果采用投票策略决定分类结果,因此能够克服传统高光谱数据分类方法中所面临的数据维数高,训练样本数目少,运算速度慢等问题,有效地对高光谱数据进行分类。
本文提出结合稀疏表示特征及光谱信息,充分利用不同表示空间的特征信息,使用随机森林方法对高光谱遥感图像进行分类。算法步骤如下:
(1)字典学习。利用SPAMS工具箱[18]求解式(1),得到学习字典D。
(2)特征提取。利用SPAMS工具箱[18]求解式(2),得到像元x∈X的稀疏表示特征。
(3)构造随机森林。利用像元x的稀疏表示特征和光谱信息分别构造随机森林,即决策树集合的构造。
为了对本文算法的分类效果进行评估,对两组高光谱遥感图像数据集进行了实验,为了对本文算法的分类效果进行评估,对两组高光谱遥感图像数据集进行了实验;同时对于单一的光谱信息特征和单一的稀疏表示特征也采用随进森林分类器进行分类,并将他们的分类结果与本文算法的分类结果进行了比较。实验中采用常用的分类比较评价指标,即总精度(Overall Accuracy, OA)和Kappa系数。为了使得算法具有可比性,实验中将各类样本按数量随机等分成两部分作为训练、测试样本集,所有算法和实验都按照这种方式运行 10次对结果求平均值,最优结果用粗体表示。
实验1使用1992年6月AVIRIS 传感器采集的美国印第安纳州 Indian Pine实验区高光谱遥感图像,该图像来自Purdue 大学遥感图像处理实验室。去除水汽吸收和低信噪比波段后,从原始的220 个波段中选取了200个波段作为研究对象。实验数据集使用常用的9 类典型地物作为测试样本,共包含9345 个样本点,如表1 所示。
3种不同方法的分类结果如表 2所示,原始Indian Pine实验区高光谱遥感图像及其分类结果对比如图1所示。从表2中可以看出:(1)总精度分别由基于光谱信息方法的 87.3%,基于稀疏表示特征方法的84.8%提高到了本文方法的89.0%;(2)Kappa系数分别由基于光谱信息方法的0.851,基于稀疏表示特征方法的0.811提高到了本文方法的0.870。
表1 Indian Pine实验区典型地物样本信息统计表
表2 3种分类方法的实验结果对比
实验 2使用美国国家航空航天局(NASA)的机载可见/红外成像光谱仪(AVIRIS)于1996年3月23日获取的美国佛罗里达州 Kennedy Space Center(KSC)实验区高光谱遥感图像[5]。光谱范围为 400~2500 nm,波段个数为224,去掉大气水份吸收和低信噪比波段后,剩余176个波段作为研究对象。根据肯尼迪空间中心地面覆盖图和Landsat专题制图仪(TM)影像,共得到13类典型地物样本点5211个,如表3所示。
3种不同方法的分类结果如表4所示,原始KSC实验区高光谱遥感图像及其分类结果对比如图2所示。从表4中可以看出:(1)总精度分别由基于光谱信息方法的92.0%,基于稀疏表示特征方法的91.1%提高到了本文方法的93.3%; (2)Kappa系数分别由基于光谱信息方法的0.865,基于稀疏表示特征方法的0.852提高到了本文方法的0.880。
表3 KSC实验区典型地物样本信息统计表
图1 Indian Pine实验区高光谱遥感图像分类结果对比
图2 KSC实验区高光谱遥感图像分类结果对比
表4 3种分类方法的实验结果对比
由于本文算法分别利用稀疏表示特征和光谱信息构造随机森林,根据不同特征空间的分类结果进行集成得到最终结果,从上述两个高光谱遥感图像数据集上的实验结果对比可以看出,本文算法在分类精度上和视觉效果上都要优于光谱信息方法和稀疏表示特征方法。另外,实验1中光谱信息的分类结果精度高于稀疏表示特征的方法,即这两种方法的差异性大;而实验2中光谱信息的分类结果精度略高于稀疏表示特征的方法,即这两种方法的差异性小,因此本文算法在实验1上的改善程度略高于实验 2,这与集成学习中差异性对集成结果的影响是一致的。
为了直观比较各种分类方法花费的代价,使用运算时间作为计算复杂度的度量。实验中使用的机器配置为双核2.93 GHz Intel Core i3 处理器,8GB内存,在Matlab7.10环境下进行实验。表5给出了3种方法的运行时间。由表中可以看出,本文方法的运算时间高于光谱信息方法,且略高于稀疏表示特征方法。由于本文方法的分类效果优于上述两种方法,所以增加的计算开销是可以接受的。
表5 3种分类方法的运行时间(s)
针对仅利用光谱信息导致高光谱遥感图像分类精度较低的问题,本文提出基于稀疏表示理论提取高光谱图像的稀疏表示特征,根据稀疏表示特征和光谱信息这两种不同的表示形式,提出利用随机森林方法实现图像分类。对两个高光谱图像数据集分类的实验结果表明,本文所提出的基于稀疏表示及光谱信息的高光谱图像遥感分类算法的性能总体优于光谱信息方法和稀疏表示特征方法,在总精度和Kappa系数上相对于光谱信息方法和稀疏表示特征方法都有大幅度的提高。本文的研究工作还有许多有待改进的地方,例如,如何更加有效地融合稀疏表示特征和光谱信息,采用其它组合分类器算法获得更佳的分类效果,进一步研究快速算法从而降低计算开销等问题。
[1]Plaza A, Benediktsson J A, Boardman J,et al.. Recent advances in techniques for hyperspectral image processing [J].Remote Sensing of Environment, 2009, 113(9): 110-122.
[2]邸韡, 潘泉, 赵永强, 等. 高光谱图像波段子集模糊积分融合异常检测[J]. 电子与信息学报, 2008, 30(2): 267-271.Di Wei, Pan Quan, Zhao Yong-qiang,et al.. Anomaly target detection in hyperspectral imagery based on band subset fusion by fuzzy integral[J].Journal of Electronics&Information Technology, 2008, 30(2): 267-271.
[3]宋娟, 吴成柯, 张静, 等. 基于分类和陪集码的高光谱图像无损压缩[J]. 电子与信息学报, 2011, 33(1): 231-234.Song Juan, Wu Cheng-ke, Zhang Jing,et al.. Lossless compression of hyperspectral images based on classification and coset coding [J].Journal of Electronics&Information Technology, 2011, 33(1): 231-234.
[4]Chan J C W and Paelinckx D. Evaluation of random forest and adaboost tree-based ensemble classification and spectral band selection for ecotope mapping using airborne hyperspectral imagery[J].Remote Sensing of Environment,2008, 112(6): 2999-3011.
[5]Ham J, Chen Y, Crawford M,et al.. Investigation of the random forest framework for classification of hyperspectral data [J].IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(3): 492-501.
[6]Shahshahani B M and Landgrebe D A. The effect of unlabeled samples in reducing the small sample size problem and mitigating the hughes phenomenon[J].IEEE Transactions on Geoscience and Remote Sensing, 1994, 32(5):1087-1095.
[7]Breiman L. Random forests [J].Machine Learning, 2001,45(1): 5-32.
[8]Olshausen B A and Field D J. Emergence of simple-cell receptive field properties by learning a sparse code for natural images [J].Nature, 1996, 381(6583): 607-609.
[9]Iordache M D, Dias J M B, and Plaza A. Sparse unmixing of hyperspectral data. [J].IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(6): 2014-2039.
[10]Wright J, Ma Y, Mairal J,et al.. Sparse representations for computer vision and pattern recognition [J].Proceedings of the IEEE, 2010, 98(6): 1031-1044.
[11]余慧敏, 方广有. 压缩感知理论在探地雷达三维成像中的应用[J]. 电子与信息学报, 2010, 32(1): 12-16.Yu Hui-min and Fang Guang-you. Research on compressive sensing based 3D imaging method applied to ground penetrating radar [J].Journal of Electronics&Information Technology, 2010, 32(1): 12-16.
[12]屈乐乐, 方广有, 杨天虹. 压缩感知理论在频率步进探地雷达偏移成像中的应用[J]. 电子与信息学报, 2011, 33(1): 21-26.Qu Le-le, Fang Guang-you, and Yang Tian-hong. The application of compressed sensing to stepped-frequency ground penetrating radar migration imaging [J].Journal of Electronics&Information Technology, 2011, 33(1): 21-26.
[13]孙玉宝, 韦志辉, 吴敏, 等. 稀疏性正则化的图像泊松去噪算法[J]. 电子学报, 2011, 39(2): 285-290.Sun Yu-bao, Wei Zhi-hui, Wu Min,et al.. Image poisson denoising using sparse representations [J].Acta Elcetronica Sinica, 2011, 39(2): 285-290.
[14]Raina R, Battle A, Lee H,et al.. Self-taught learning: transfer learning from unlabeled data[C]. International Conference on Machine Learning, Corvallis, 2007: 759-766.
[15]Qiao Li-shan, Chen Song-can, and Tan Xiao-yang. Sparsity preserving projection with applications to face recognition [J].Pattern Recognition, 2010, 43(1): 331-341.
[16]Han Ya-hong, Wu Fei, Zhuang Yue-ting,et al.. Multi-label transfer learning with sparse representation[J].IEEE Transactions on Circuits and Systems for Video Technology,2010, 20(8): 1110-1121.
[17]Aharon M, Elad M, and Bruckstein A. K-SVD: an algorithm for designing over-complete dictionaries for sparse representation [J].IEEE Transactions on Signal Processing,2006, 54(11): 4311-4322.
[18]Mairal J, Bach F, Ponce J,et al.. Online learning for matrix factorization and sparse coding [J].Journal of Machine Learning Research, 2010, 11(1): 19-60.
[19]童庆禧, 张兵, 郑兰芬. 高光谱遙感: 原理、技术与应用[M].北京: 高等教育出版社, 2006: 262-272.Tong Qing-xi, Zhang Bing, and Zheng Lan-fen. Hyperspectral Remote Sensing —— Theory, Technology and Applications[M]. Beijing: Higer Education Press, 2006: 262-272.
[20]Breiman L. Bagging predictors [J].Machine Learning, 1996,24(2): 123-140.