谢福鼎, 杨秋艳, 嵇 敏
(1.辽宁师范大学 地理科学学院,辽宁 大连 116029;2.辽宁师范大学 计算机与信息技术学院,辽宁 大连 116081)
与多光谱图像相比,具有数百个波段的高光谱图像不仅包含了丰富的光谱信息,还拥有较高的空间分辨率,这显然有利于我们对地物进行准确的识别.目前,高光谱图像已被广泛应用于环境监测、土地管理、城市区域规划等多个领域[1-3].然而,高光谱图像的高维特征不但增加了计算负担,还会导致Hughes现象的发生(即分类精度随着维数的增加呈现出先增后减的趋势)[4].所以,为了获得较好的分类结果,在对高光谱图像分类时,有必要对其进行降维计算.
高光谱图像的降维方法一般可分为两类:特征选择和特征提取[5].特征选择是根据所设计的准则函数直接从原始的波段中选取一定数量最具代表性的波段;特征提取是通过变换的方法将原始的高维波段空间映射到低维的特征空间.一些流行的特征提取方法有线性判别分析、谱方法、主成分分析(PCA)、核主成分分析(KPCA)等[6-7].由于无监督的PCA和KPCA具有计算效率高,降维效果好,易于理解的优点,因此被广泛应用于高光谱图像的研究中[8].
近年来,基于谱-空信息的高光谱图像降维方法越来越受到了人们的关注.这是因为在降维过程中考虑了包含在图像中的空间信息,所以得到了比仅仅使用谱信息降维更好的效果.例如,利用递归滤波、加权均值滤波、邻域保持投影、局部保持投影等方法[9-12],提出了一系列基于谱-空信息有效的降维算法.
超像素是由空间相邻且颜色相近的像素组成的均质区域,具有形状和大小自适应特性的超像素在计算机视觉领域获得了成功的应用.另外,超像素的这一特征也为我们提供了丰富的空间结构信息,因此也被广泛地使用在高光谱图像的研究中.在众多的分割算法中,基于图的熵率超像素分割(ERS)算法由于在分割效率和有效性方面都具有优异的性能,且对类边缘有较好的依附性,因此被广泛应用于对高光谱图像的分割[13].Jiang等人[14]通过在每一个超像素上局部实现PCA并降维到同样的维数,从而实现了整体降维,提出了S-PCA谱-空降维方法.Zhang 等人[15]则认为对于非线性可分的样本数据,KPCA有更好的降维效果,进而提出了S-KPCA谱-空降维算法.
已有的基于超像素的降维算法都存在一个公共的问题:降维结果严重依赖于超像素的分割尺度.一般来说,最优分割尺度的获得是一个实验结果,难以事先指定.为了减缓降维效果对分割尺度的依赖性,在超像素均质性假设的基础上,本文提出了一种基于超像素合并的空谱降维方法.在两个基准数据集上的实验结果表明,在合并后的超像素图上开展降维计算,可以有效削弱降维结果对分割尺度的依赖性.
对于一副给定的具有B个波段和n个像素的高光谱图像HSI,采取下列步骤进行降维.
步骤1:超像素分割
首先使用PCA算法降维,并取第一主成分生成基础图像.然后利用ERS算法对基础图像进行超像素分割,得到如下分割结果:
HSI=S1∪S2∪…SM,Si∩Sj=∅,i,j=1,2,…M.
(1)
其中,Si(i=1,2,…,M)是包含ni个像素的超像素.
步骤2:稀疏加权网络的构造
以每个超像素Si为节点vi,用式(2)对节点进行加权连接.
(2)
其中,ki是超像素Si的空间邻居数,d(Si,Sj)通过下面的能量距离[16-17]计算:
(3)
步骤3:超像素合并
假设所构造的稀疏加权网络的权重矩阵为W=(wi,j)M×M.定义子网络Vi的局部模块度[18]如下:
(4)
在合并后的网络中,每一个子网络代表了一个新的超像素.
步骤4:降维
利用每一个新的超像素提供的空间信息,以及原始图像中包含的谱信息,在每个新的超像素上执行PCA 或KPCA算法,并降至同样的维数.
在所提出的基于超像素合并的降维方法中,通过新定义的局部模块度函数,对超像素快进行局部合并.合并后的超像素在保持超像素同质性的同时,依然满足超像素的其他性质.为了验证降维效果,通过SVM分类器对降维后的高光谱数据进行分类.
综上所述,本文提出了SMPCA、SMKPCA两种基于超像素合并的降维方法.
为了验证方法的有效性,在Indian Pine,Salinas两个典型的高光谱数据集上进行试验.程序运行平台是Matlab 2015b.为避免随机采样带来的分类结果的影响,本文进行了10组独立实验,以10次结果的平均值来报告最终的分类结果.为了证明所提出方法的优越性,将结果与PCA[5]、KPCA[6]、IFRF[9]、SPCA[14]以及SKPA[15]5种特征提取方法得到的结果进行了对比.与大多数已经存在的工作一样[19],采用总体精度(OA)、平均精度(AA)和kappa系数3个指标评价算法的性能.
图1记录了在每类随机标记30个样本,统一降到30维的情况下,分类结果随超像素数目的变化情况.由于PCA、KPCA、IFRF未涉及超像素,故实验只选取了SPCA、SKPCA两种降维方法作为对比实验.可以看出,随着超像素数目增多,4种方法的分类精度整体都呈下降趋势.这是因为随着超像素数目的增加,超像素的体积逐渐变小,从而空间信息的作用逐渐被削弱.对于Indian Pines数据集,当超像素数目从100增加到1 000时,SMPCA和SMKPCA方法的分类精度下降幅度分别为8.55%和11.50%.而SPCA、SKPCA分类精度的下降幅度分别为29.35%,29.37%.对于Salinas数据集,与Indian Pines类似,SMPCA、SMKPCA的分类精度下降幅度远小于SPCA、SKPCA的下降幅度.这证明了所提出的基于超像素合并的降维方法可有效减缓分类结果对分割尺度的依赖性.
图1 4种降维算法的分类精度随超像素数目的变化
在每类随机标记30个样本时,图2显示了7种降维算法的分类结果随降维维数的变化.从图2可以看出,所提出的两种降维方法SMPCA和SMKPCA的降维性能均优于其他5种方法,这意味着经过超像素合并后,对降维提供了更有效的空间信息,从而增强了降维效果.基于超像素的4种降维方法的降维性能都好于基于谱的PCA和KPCA,且随着维数的增加呈现出了比较稳定的趋势,这说明这4种方法可以有效提取到原始数据的光谱信息,同时也证明了空间信息在降维过程中的重要作用.但随着维度的不断增加,所提出降维方法的结果没有呈现出明显增加的趋势,说明谱信息出现了冗余现象.
图2 降维算法的分类精度随降维维数的变化
表1报告了7种方法在两个标准高光谱数据集上的分类结果.5种对比方法中的实验参数与原文一致.从表1可以看出,仅仅利用光谱信息而未利用空间信息降维的PCA和KPCA方法没有获得理想的分类结果.由于利用了空间信息和光谱信息,IFRF、SPCA、SKPCA分类精度相对较高,基于超像素技术的SPCA和SKPCA的分类结果优于基于固定大小窗口的IFRF的结果,这是由于超像素自适应大小和形状的特征比固定大小窗口能够提供更有效的空间信息.本文提出的基于超像素合并的两种算法的结果在两个数据集上均好于其余5个方法,说明提出的算法通过对超像素的合并,增大了超像素的体积,提供了更多的空间信息,有助于降维性能的提高.
表1 7种方法在两个高光谱数据集上的降维结果对比
在本文中,针对超像素的降维算法对于分割尺度具有严重依赖性的问题,提出了一种基于超像素合并的高光谱图像谱-空降维方法.该方法通过对超像素进行合并,增大了同质区体积,有效地整合空间信息.使其在降维过程中起到更有效的作用,从而提高了降维的效果.在两个常用的标准高光谱数据集上的实验结果表明,该方法有效削弱超像素分割尺度对基于超像素降维方法降维结果的影响.比较实验结果表明所提出的方法均好于其他5种降维方法.然而如何把高光谱图像降到恰当的维数,即保持有效谱信息的同时,尽可能出现少的信息冗余,目前仍是一个值得研究的问题.