基于不同降维方法的PPI端元提取效果对比研究

2017-02-15 17:47黄晨张运张立伟
安徽农学通报 2017年1期

黄晨+张运+张立伟

摘 要:传统PPI算法采用最大噪声分离(MNF)方法进行降维,MNF变换中均设定数据之间线性相关,在某些情况下会使变换后的结果具有某些人为特征,在降维过程中会丢失信号较弱的信息,导致端元数量少;分段主成分分析(SPCA)降维方法具有不改变图像的物理意义,且信息保存较完整的优势。该研究采用不同降维方法利用纯净像元指数法(PPI)对不同下垫面地表提取端元,结果表明,在地表破碎区域SPCA降维后可找出信号较弱的端元提取的端元数量多与MNF降维提取的端元数,而地物聚集区MNF降维方法提取的端元质量更好。研究结果可以为不同下垫面的高光谱影像端元提取以及降维方法的选择提供参考。

关键词:端元提取;最大噪声分离;分段主成分分析;纯净像元指数法

中图分类号 TH744.1 文献标识码 A 文章编号 1007-7731(2017)01-0013-06

Abstract:The traditional PPI algorithm uses the maximum noise separation (MNF) to reduce dimension,MNF transform was set linear correlation between the datas,and in some cases,the results of the transform will have some human characteristics.In the process of dimension reduction,the weak signal will be lost,which leads to a small number of end elements.Segmented principal component analysis (SPCA) does not change the physical meaning of the image and the information will be relatively complete preservation.This paper use the pure pixel index (PPI) for different dimensionality reduction methods and for different underlying surface to extract endmember.The results shows that the SPCA dimensionality reduction is more suit in broken underlying surface,it could find the weak signal endmember;and the MNF dimensionality reduction will find the better quality endmember in ground gathering area.The results of this research can provide reference for the endmember extraction of hyperspectral image and the selection of dimension reduction method for different underlying surfaces.

Key words:Endmember extraction;MNF;SPCA;PPI

1 引言

混合像元分解是高光谱数据处理中较为重要的组成部分,混合像元的分解分为两步,第一步是端元提取,即某一像元对应区域内仅存在一种地物类型,这个地物的光谱就是要提取的端元;第二步是丰度反演,即不同纯净地物所占像元的比例,端元提取是混合像元分解的重要前提和关键步骤。纯净像元指数法(Pure Pixel Index,简称 PPI)[1-2]是以线性光谱混合模型的几何学描述为基础,利用端元是遥感图像在特征空间中所形成的单形体的端点的特点、单形体的向量投影性质进行端元提取。PPI算法在端元提取中较为成熟,且便于实现,方法灵活,很多软件都将此方法作为端元提取的模块。但该算法不是迭代算法,投影向量均是随机产生,可能导致同一幅图多次PPI提取的端元并不同,针对以上不足,Chang、Plaza等提出快速迭代PPI(FPPI)[3],每次迭代都对上一次的端元集合进行扩充,算法逐渐收敛到一个合适的集合。徐君等[4]在其研究中提出一种区别于PPI算法的最大距离纯净像元指数法,克服了PPI算法因随机向量而产生的端元提取结果不确定的问题。郭杰[5]等针对PPI算法耗时长、运算量大等不足提出了FPGA实现方案,可以在较短时间内完成计算;同时PPI算法对图像噪声很敏感,通常使用MNF降维后再使用,使用MNF降维后的维度和波段选择没有合适的规则,且张兵等[6]在其研究中对几种降维方法做了比较,MNF虽对噪声处理较好,但是数据信息损失和数据结构变化都较大,在地表破碎的情况下该方法降维后分类精度会大大降低,而SPCA降维后不仅不会改变图像物理意义,还可以保留更多信息。刘锋[7]将PPI端元提取的数据降维算法换成小波主成分分析(Principal component analysis,PCA),增加了地物细节,端元提取取得了较好的效果;牛贝贝[8]在其研究中提出了基于独立主成分分析(Independent component analysis,ICA)特征提取的N-FINDR算法并與传统的MNF特征提取算法比较,结果解译误差减小,表明了其算法的优越性;王强[9]等在对PPI算法的降维处理方法上选择MNF正反变换,再利用图像的加减运算去除噪声,有效地去除了图像噪声;崔宾阁等[10]在对黄河口湿地的高光谱遥感端元提取的研究中表明特定区域对端元提取的方法也需要特别选取。针对不同下垫面降维分类后的效果不同,本文采用分段主成分分析的方法对高光谱数据进行降维,再利用PPI端元提取方法提取端元,与MNF降维后PPI提取端元结果做对比,尝试在不同下垫面情况下选择更适用的端元提取方法,以期为高光谱影像的处理提供参考。

2 数据处理

本研究采用的是Hyperion L1R数据,条代号119,行编号38。分别对数据进行未定标及水汽吸收严重波段剔除、绝对辐射值转化、条纹修复及坏线去除、Smile效应校正、FLAASH大气校正、几何校正及裁剪范围。Hyperion L1R产品一共有242个波段,其中1~70波段是可见光近红外波段,71~242波段是短波红外波段,有些波段未定标或者受水汽影响较大,基本上反应不出地表信息,剔除后保留176个波段,分别是8~57、79~120、128~166、179~223波段(表1)。将8~57波段(可见光近红外波段)除以40,其余波段(短波红外波段)除以80,合并后完成绝对辐射值转换。逐个波段查看并记录有坏线的波段集坏线出现的行列位置,利用坏线周围数值的平均值填补坏线处的数值,采用“全局区条纹”法去除条纹噪音。Smile效应校正采用移动线性拟合内插大方法,将每个样本波段的中心波长插值到该波段的平均成像中心波长。FLAASH大气校正以及几何校正不做赘述,裁剪选择的是地物较为复杂的区域,研究区主要地物有林地、耕地、裸地、水体和建筑,其中林地、水体、耕地所占面积较多且分布聚集,裸地和建筑相对较少且分散分布与图像中。研究区见图1,位于江苏省常熟市。

3 PPI原理

单形体在空间中的任意投影都是线段,且线段的端点必是单形体的顶点,单形体的顶点即是端元。PPI算法就是利用这一性质,在特征空间内随机投影,并记录投影在端点位置的像元,投影在端点位置的次数越多被视为越纯净,即是端元。PPI算法的示意图如图2所示:

经过多次投影后被投影到随机向量两端的像元次数达到阈值即可视为端元。由于PPI算法对图像噪音敏感,在对高光谱数据降维时常采用MNF降维,该方法相当于2次主成分分析叠加,第一次是对数据中的噪声进行分离,第二次是对噪声白化数据的标准主成分分析。MNF降维方法有较好的去噪效果,但有时会将信息较少的信号视为噪声剔除。

4 基于SPCA的PPI端元提取

4.1 分段主成分分析(SPCA) 分段主成分分析(SPCA)是Jia和Richards[12]提出,先将各波段按相关性进行分组,并对每组进行主成分分析,最后将每组的分析结果组合一起再进行分析。这种方法不改变图像的物理意义,不会忽略信息量少但仍然很重要的波段。考虑到PPI算法对噪声敏感,本文采用SPCA方法降维,降维前采用小波去噪。常用的小波基有Harr小波、Daubechies小波、Coiflets小波、Symlets小波。对于正交小波而言,Daubechies小波在算法速度,模拟和分析信号的精度上都发挥了巨大作用;Harr小波是指上就是一阶的Daubechies小波,可以很方便的通过数值积分将微分方程转换为代数方程,在求解微分方程的应用中已经有很多成果;Coiflets小波在信号处理,数值分析,故障诊断和图像压缩方面应用广泛,与其他正交小波相比,它具有更多的对称性,数值分析更加紧致;Symlets小波是对Daubechies小波的改进,它不仅具有双正交性,近似对称性,并对在实际应用中细节处理上具有很好的效果。本章节选用一个波段随机加噪声,然后选择以上4种小波对图像分解,设置阈值向量,对高频小波系数进行阈值处理最后重构图像。图3是4种小波去噪对比结果,由图3可知,4种滤波去噪都能有明显的效果,从细节上看,方框内haar小波去噪的效果不如其他3种小波,存在明显的噪声痕迹;而Coiflets小波去噪效果虽然好,但是细节模糊得最厉害。而Symlets小波是Daubechies小波改进后的方法,效果在4种小波中最好,因此本文选择Symlets小波对图像进行去噪。

分段主成分分析(SPCA)变换方法是利用高相关块沿对角线分布分特性,将整个图像分成高度相关的子集,再从每个子集中进行特征提取。这种方法不仅可以保留局部信息,还可以减少计算量。具体算法流程图如图4所示:

对研究区遥感影像各波段做相关性分析,相关性矩阵图如图5所示,颜色越亮表示相关性越高,颜色越暗表示相关性越低。横纵坐标分别是这176个波段,对角线表示相关性为1。根据相关性矩阵图将176个波段划分为4个子集,单个子集中各波段的相关性很高,波段间最低相关性都在0.7以上(表2)。

将分组后的各波段子集做主成分分析,按照贡献率从各组中提取波段重新组合进行降维,最后降维保留7个成分。部分成分对应的图如图6所示。

经过小波SPCA变换后保留7个成分,贡献率达到85%,图像较为清晰,该方法变换后地物轮廓清晰,基于分块地算法也节省了计算时间,去除噪声的同时保留局部信息,且原始数据的变化对变换后的数值影响并不大。

4.2 PPI端元提取 将降维后的数据进行PPI计算,利用可视化工具寻找聚集在一起的点作为纯净像元,提取纯净像元的波谱曲线与波谱库对比,确定像元对应的地物类型。在进行波谱分析时采用波谱角分类(SAM)方法、波谱特征拟合(SFF)方法、二进制编码方法(BE)分别对未知波谱与波谱库中物质波谱匹配程度打分,权重都设置为1,总分为3。SAM法是利用弧度来衡量未知波谱与波谱库波谱的匹配程度,键入的最大值和最小值都用弧度表示。SFF是用RMS拟合误差来衡量二者的匹配程度,二进制编码法则是输入的最大值和最小值都用正确匹配的波段百分比(0~1)表示。本研究分别用MNF降维和小波去噪后SPCA降维,通过PPI计算和可视化工具提取7个像元视作端元,由于选取的研究区主要地物只有5类,分别是林地、耕地、水体、裸地和建筑,因此提取出的端元分别与波谱库这5类的波谱匹配得分,匹配结果相同取分数较高的端元保留。结果如表3所示。表3中MNFPPI表示经过MNF降维后利用PPI算法提取的端元波谱;SPCAPPI表示经过SPCA降维后利用PPI算法提取的端元波谱。从二者的对比上看,MNF降维后提取的端元有4种,分别是水体、裸地、林地和耕地,SPCA降維后提取的端元种类有5种,分别是水体、裸地、林地、耕地和建筑。从得分上看,MNFPPI提取的4种地物得分都不低于于SPCAPPI,且裸地的分差远远高出SPCAPPI提取的裸地波谱得分。SPCAPPI提取的林地、耕地、水体得分与MNFPPI提取的地物得分相差较小,多识别出的建筑用地,且得分较高。从表3中得出,SPCA降维后提取的端元数大于MNF降维后提取的端元,多出来的建筑类型可能在影像中分布零散且分布较少,使得MNF降维中丢失这样的信号。而MNF降维后提取的端元与波普库对比的得分几乎都大于SPCA降维后提取的端元得分,由此视为MNF降维后提取的端元质量更好,可能是这几类地物较为聚集,在去除噪声后提取的端元质量更好。

4.3 对比分析 将二者提取的同一类型端元波谱进行合并后对图像进行线性混合像元分解,图像分类结果如图7所示。图7(a)是MNF降维后利用纯净像元指数法提取端元的分类结果,图7(b)是SPCA降维后提取的端元分类结果。从图7中可以看出:图(a)内容充实,林地、耕地、水体、裸地提取的面积都较大,其中林地集中分布与图的北边方向,图的中间夹杂少许看in地识别区;耕地主要分布与图的中间和西边,裸地在西南及西边中间区域有部分聚集分布,其他的都零散分布与整个图中;图(b)未识别的区域较大,主要是裸地识别面积较少,只有西南角和西边中间位置的聚集区域识别出来,林地几乎全在图的北边方向分布,耕地分布在图的中间和南边及西边方向,水体识别较少,且建筑零星分布在图的中间。从二者的对比上可以发现,图(a)提取的林地面积更大,成块分布,耕地分布区中夹杂很多土地被分类为林地,裸地识别区几乎零星分布与整幅图像,水体识别较少;图(b)提取的林地面积较小且聚集程度较图(a)分散,耕地区几乎没有林地分布,裸地和水体识别少,且比图(a)多识别出建筑用地,建筑用地分布较少且特别分散。

从图7还可以看出,研究区中林地、水体、耕地和裸地虽混合分布,但每种地物类型都相对聚集,且面积较大,这4类的分解结果MNF/PPI方法提取较好,分类结果中这4类地物面积大且聚集;建筑零星分布在图中,MNF/PPI并没有提取出,SPCA/PPI提取出零星的建筑其他4种地物也提取出,但面积相对较小,且相对破碎。因此,可以得出在选择PPI端元提取方法时,地物分布特征对降维方法的选择有要求,地物分布集中时选择MNF降维可以消除噪声,地物破碎分布时,SPCA可以保留更多信息,提取被MNF忽视的有效信号,提取的端元数量多于MNF降维后提取的端元。

5 结论

本文采用SPCA降维方法与传统的MNF降维方法比较,利用纯净像元指数法对研究区进行端元提取,通过对比二者端元提取的数量和质量,得出以下结论:在地表破碎时,经过SPCA降维后可保留更多信息,提取的端元数量较多;在地物聚集且分布较广的情况下,MNF降维后提取的端元质量优于SPCA降维后提取的端元。因此,在对高光谱数据处理时,可针对下垫面情况和处理目的具体讨论并选择合适的降维方法,实现对数据更高效的利用。

参考文献

[1]ChaudhryF,Wu CH-CH,Liu W-m,et al.Pixel purity index-basedalgorithms for endmember extraction from hyperspectral imagery[J].Transword Research Network 37/661(2),Fort P.O.,Trivandrum-695 023,Kerala,India,2006:29-62.

[2]Bateson A,Curtiss B.A method for manual endmember selection and spectral unmixing[J].Remote Sensing of Environment,1996,55(3):229-243.

[3]Chang C,Plaza A.A fast iterative algorithm for implementation of pixel purity index[J].IEEE Geoscience and Remote Sensing Letter,2006,3(1):63-67.

[4]徐君,徐富紅,蔡体健,等.一种基于最大距离的纯像元指数端元提取算法[J].地球信息科学学报,2015,17(1):86-90.

[5]郭杰,李云松,弋方,等.高光谱图像纯像元指数计算的FPGA实现[J].华南理工大学学报(自然科学版),2014,42(1):84-89.

[6]张兵,高连如.高光谱图像分类与目标探测[M].北京:科学出版社,2011:81-82.

[7]刘锋.高光谱数据降维及端元提取[D].北京:北京理工大学,2008:43-45.

[8]牛贝贝.高光谱遥感影像端元提取算法研究及应用[D].长沙:中南大学,2014:14-23.

[9]王强.Hyperion高光谱数据进行混合像元分解研究[D].哈尔滨:东北林业大学,2006:23-25.

[10]崔宾阁,庄仲杰,任广波,等.典型高光谱图像端元提取算法在黄河口湿地应用评价研究[J].海洋科学,2015,39(2):104-109.

[11]许宁,胡玉新,雷斌,等.一种基于PPI的高光谱数据矿物信息自动提取方法[J].测绘科学,2013,38(1):138-141.

[12]Jiaxiuping,J.A.Riehards.Segmented principal components transformation for efficient hyperspectral remote sensing image display and classification[J].IEEE Geoscience and Remote Sensing,1999,37(l):538-542.

(责编:张宏民)