基于顶点成分分析的高光谱图像端元提取算法❋

2014-11-28 09:39方凌江粘永健雷树涛倪志扬
舰船电子工程 2014年8期
关键词:分辨率光谱噪声

方凌江 粘永健 雷树涛 倪志扬

(济南军区联勤部后勤信息中心 济南 250022)

1 引言

高光谱遥感是指光谱分辨率高达10-2λ数量级的光谱成像技术,在地质勘探、军事侦察等领域得到了广泛的应用[1]。由于传感器空间分辨率的限制,以及地物在地表空间分布的复杂性,使得所拍摄的图像中存在大量的混合像元。端元提取就是从存在混合像元的高光谱图像中提取出场景的基本组成成分,它是高光谱解混的重要步骤。当物质之间的混合方式属于非致密混合时,光子在物质内部之间的相互作用可以忽略,可用线性混合模型来描述混合像元的形成机理[2]。近十年来,学者们在线性混合模型的基础上提出了多种端元提取算法,例如纯像元指数(Pure Pixel Index,PPI)[3]、顶点成分分析算法(Vertex Component Analysis,VCA)[4]、N-FINDR[5~6],迭 代 误 差 分 析 (Iterative Error Analysis,IEA)[7],自动形态学端元提取方法(Automated Morphological Endmember Extrac-tion,AMEE)[8]、最小体积单形体分析(Minimum Volumn Simplex Analysis,MVSA)[9],其中,VCA算法是一种端元逐次提取算法,前面提取的端元不依赖后面提取的端元,有效避免了在端元数目估计不正确的情况下,所提取的端元之间相互干扰的问题,而且该算法提取速度快,计算复杂度低。但是VCA算法是将高光谱图像中的极值像元作为端元,易受异常像元的干扰,而且它以高光谱图像中的某个像元作为端元,受噪声影响也较大。

本文在VCA算法的基础上,利用地物在地表空间成片分布这一特点,采取空间邻域迭代计算来提取空间纯区域,并将这些区域内的所有像元的均值作为待提取的端元,该算法可以有效地消除异常像元的干扰,并降低噪声对端元的影响,快速有效地提取出端元。

2 算法描述

2.1 线性混合模型

在线性光谱混合模型中,每个像元的光谱响应由各个端元的光谱响应按照其对应的丰度线性混合而成。用x∈RL×1表示波段数为L的高光谱图像中某像元的光谱响应,x可以表示为

其中M表示端元数量,N 表示像元数量,E=[e1,…,eM]∈RL×M表示构成整幅高光谱图像的端元矩阵,ei表示第i个端元,各个端元仿射独立。s[n]=[s1[n],…,sM[n]]T∈RM×1表示第n个像元的丰度向量。w[n]∈RL×1为误差向量,表示该像元被噪声污染的程度。假定噪声为零均值加性高斯噪声,则w[n]~N(0,diag(σ2j)),其中diag(σ2j)为L×L的对角矩阵,σ2j(j=1,2,…,L)为各波段的噪声方差。根据丰度的物理含义,丰度还要满足非负约束(Abundance Non-negative Constraint,ANC)及和为 一 约 束 (Abundance Sum-to-one Constraint,ASC),可以表示为

在没有噪声的干扰下,所有满足式(1)~(3)的像元构成一个以各端元为顶点的凸面单形体,VCA正是利用正交投影的方法寻找单形体的顶点来提取端元,详细步骤可以参考文献[4]。此时,所有的纯像元也都位于单形体的顶点,纯像元就是端元,但是在有噪声的干扰下,单形体体积膨胀,纯像元偏离端元的位置,位于端元的周围,此时端元不能由单个纯像元表示。

用单形体来近似拟合有噪声干扰的高光谱数据,靠近单形体的顶点的像元纯度较高,PPI算法正是利用像元纯度指数来提取端元的,可以认为,由VCA算法所得到的像元是纯像元,但是由于VCA所提取的纯像元只有一个,受噪声影响较大。对某种典型地物而言,通常它在高光谱图像中分布有一定数量的纯像元,如果可以找到更多该地物的纯像元,并以这些纯像元的均值作为该地物端元提取结果,根据统计学知识,此时的提取精度要比以单个像元作为提取结果的精度要高。

2.2 空谱联合约束下的端元优化

典型地物在空间上分布连续,纯像元的邻近像元仍然为该类地物的纯像元的可能性较大。空谱联合约束要求VCA提取的纯像元位于光谱相似、且空间连续的一致区域。下面详细描述空谱联合约束的实现过程:以VCA提取的单个纯像元为种子,采用邻近像元搜索,逐步扩大纯像元的数量,其过程如图1所示。

图1 邻近像元搜索过程

记v为VCA在第i步所提取的纯像元,搜索邻近像元记为FindNV_Pixels,实现的流程如表1所示。

表1 邻像元搜索的流程图

在表2中,V表示纯像元集合,Nb表示取邻域,本文中采用8邻域搜索,mean为取均值,dist为衡量两个像元相似度的准则,τ为门限。由FindNV_Pixels得到的V为纯像元区域,记V={v1,…,vK},K 为V 中纯像元的数量,V 具有两个性质:

1)∀vk1,vk2∈V(k1≠k2),都有dist(vk1,vk2)≤τ成立,体现了对纯像元区域具有光谱相似的约束。

2)∀vk1,vk2∈V(k1≠k2),存在一条路径U={vk,vk∈V},使得vk1、vk2连通,体现了对地物在空间上具有连续性的约束。

然而,还有两个尚待解决的问题:一是dist的选择;二是τ的选择。下面根据统计检测理论中的Neyman-Pearson(NP)准则来解决这两个问题。vi、vj这两个像元的差ε为

其中μ是由vi、vj两个像元成分不同所引起的非噪声差值。定义随机变量r

由式(4)与式(5)可知,如果xj为该类地物的纯像元,则ε~N(0,2diag()),r为自由度为L 的chi平方分布;否则,ε~N(μ,2diag()),r为自由度为L,非中心参量为‖μ‖的非中心chi平方分布。定义两个假设:

为提高纯像元区域的纯度,则应使vj误判为纯像元的概率最小,也就是使P(H0|H1)最小。预设虚警概率PFA(PFA=P(H1|H0)),根据NP准则得到:

其中τ为判决门限,可通过χ2L分布及PFA得到。与SPA、AMEE仅利用光谱信息来选取相似像元不同,本文算法利用了空间上下文信息。

在高光谱图像中,通常会有大量的异常点存在,而降维及去噪等预处理措施并不能完全去除异常点,所以在降维及去噪后的高光谱图像中仍然存在一定数量的异常点。由于异常点大多都属于数据点云的极值点,VCA会受异常点的干扰,甚至在提取结果中直接将异常像元作为端元提取的结果,从而导致算法错误。而异常点通常都是孤立点,具有数量少、在空间上不连续以及与周围点的差异比较明显等特征,可以利用这些特征来消除端元提取过程中异常点的影响。设定纯像元区域大小门限为η,当K≤η时就判定为异常像元。综上,算法的整体流程为

表2 算法的整体流程图

3 实验结果

将本文提出的算法记为SS-VCA,利用 Hysime[10]来估计噪声,端元数目已知。与 AMEE、SSEE、SPEE等算法一样,本文算法也利用了空间上下文信息,但是上述算法的性能依赖于多个参数的设置,而且参数的设置与场景的空间复杂程度有关,很难用统一的标准来比较本文算法与上述三种算法的优劣,而且本文的重点在于强调对VCA的改进作用,所以在实验中并不将上述三种算法作为比较对象。比较准则为各个端元与真实端元之间的角距离,用ei、^ei分别表示参考端元与算法提取的端元,其定义为

3.1 仿真数据实验

从美国地质调查局(USGS)光谱库中任意选择五种地物的光谱作为仿真数据的端元,该光谱库中地物光谱的波长范围是0.38μm~2.5μm,光谱分辨率为10nm,共有224个波段。丰度的生成方法是,先利用 MRF(Markov Random Field)生成空间分辨率为400×400的含有三种类别地物的分类图,再由线性混合模型模仿由于传感器分辨率不足而引起的地物混合现象,生成50×50的高光谱图像。下面用两组实验来测试算法的性能。在所有的试验中,虚警概率PFA设置为10-2,异常像元大小η为1。

图2 不同信噪比条件下的算法性能比较

实验1(测试算法的抗噪能力)。在仿真数据中加入加性零均值高斯白噪声,并逐渐改变信噪比(SNR)的大小,由10dB逐渐增加到30dB,步长为5dB。图2给出了不同算法在不同信噪比条件下的平均角距离,记为A_SAD。从图2可以得出,与VCA相比,SS-VCA具有更强的抗噪能力。

实验2(测试异常像元对算法的影响)。在USGS光谱库中另外选择一种地物,并在空间中随机选择五个不相邻的位置,将原来数据中的像元的光谱替换为当前地物的光谱,以模仿高光谱图像中的异常像元。此时SNR设为10dB。由图3可以直观看出,VCA算法提取的端元中包含了异常像元,而SS-VCA则正常提取端元。

图3 异常像元存在条件下的算法性能比较

3.2 真实数据实验

实验中采用了美国加州印度松树测试地的高光谱数据,该数据由机载可见光及红外成像光谱仪(Airborne Visible/Infrared Imaging Spectrometer,AVIRIS)拍摄而成,该数据波长范围是0.4μm~2.5μm,光谱分辨率为10nm,共有224个波段,空间分辨率为3.7m,截取大小为86×83子块作为实验对象,该块主要分布椰菜、玉米、杂草以及不同类别的生菜等自然地物,虽然该高光谱图像空间分辨率较高,但由于地物分布复杂,仍存在相当数量的混合像元。由于信噪比太低或者水吸收,36个波段被移除(波段号为1~4,104~112,150~167,220~224),仅保留188个波段用于数据处理。

为评价算法的性能,在实验中根据地表真实标记图手工从高光谱数据中选择各类地物的多个纯像元,并取各类纯像元的均值作为参考光谱。考虑到部分地物内部存在较大的光谱变异性,难以用一个端元来描述,在实验中取端元数量为10。在提取端元之后,由全约束解混FCLS[11]估计的丰度,由SS-VCA提取的端元所得到的丰度估计如图4所示。

比较真实标记图与估计丰度得到端元对应的地物,其中生菜(5wk)对应(d)、(f)、(h)三个端元,说明该地物具有较大的内部变异性,而杂草对应(g)、(j)两个端元,分别表示开始衰老的杂草及绿色杂草。SS-VCA、VCA的端元提取结果分别与参考光谱的比较如表3所示。

图4 Salinas-A数据及SS-VCA丰度所提取端元对应的丰度

表3 Salinas-A数据的角距离比较(粗体数字表示最好的结果)

在克服异常像元的影响方面,在VCA提取的端元中,有一个端元为异常像元,而SS-VCA没有。在提取结果的精度方面,由表3可以得出SS-VCA所提取的端元具有更小的平均角距离,精度更高。

4 结语

本文算法几乎不受异常像元的影响,并具有较强的抗噪能力。但它只能找出其中一块属于某类地物的纯区域,不能将空间不相邻但属于该类地物的所有纯区域同时找出来,抗噪性能的提高还有一定的空间,这是下一步要研究的方向。

[1]Keshava N,Mustard J F.Spectral Unmixing[J].IEEE Signal Processing Magazine,2002,19(1):44-57.

[2]Adams J B,Gillespie A R.Spectral-Mixture Analysis[M].Remote Sensing of Landscapes with Spectral Images:A physical Modeling Approach,Cambridge University,2004:126-167.

[3]Boardman J W,Kruse F A,Green R O.Mapping Target Signatures via Partial Unmixing of AVIRIS Data[C].1995.

[4]Nascimento J M P,Bioucas-Dias J M.Vertex Component Analysis A Fast Algorithm to Unmix Hyperspectral Data[J].IEEE Transaction on Geoscience and Remote Sensing,2004,43(8):898-910.

[5]Winter M E.N-FINDR:An Algorithm for Fast Autonomous Spectral Endmember Determination in Hyperspectral Data[C]//Proceedings of SPIE,Denver,1999,3753:266-275.

[6]Plaza A,Chang C I.An Improved N-FINDR Algorithm in Implementation.Algorithms and Technologies for Multispectral,Hyperspectral and Ultraspectral Imagery[C]//Proceedings of SPIE,Bellingham,WA,2005,5806:298-306.

[7]Neville R A,Staenz K,Szeredi T,et al.Automatic Endmember Extraction from Hyperspectral Data for Mineral Exploration[C]//Proceedings of International Conference on Airborne Remote Sensing,Ottawa,Canada,1999:21-24.

[8]Plaza A,Martinez P,Perez R,et al.Spatial/Spectral Endmember Extraction by Multidimensional Morphological Operations[J].IEEE Transaction on Geoscience and Remote Sensing,2002,40(9):2025-2041.

[9]Li J,Bioucas-Dias J E M.Minimum Volume Simplex Analysis:a Fast Algorithm to Unmix Hyperspectral Data[C]//Proceedings of IEEE International Conference on Geoscience and Remote Sensing,Boston,USA,2008:7-11.

[10]Bioucas-Dias J M,Nascimento J M P.Hyperspectral Subspace Identification[J].IEEE Transaction on Geoscience and Remote Sensing,2008,46(8):2435-2445.

[11]Heinz D C,Chang C.Fully Constrained Least Squares Linear Spectral Mixture Analysis Method for Material Quantification in Hyperspectral Imagery[J].IEEE Transaction on Geoscience Remote Sensing,2001,39(3):529-545.

猜你喜欢
分辨率光谱噪声
舰船通信中的噪声消除研究
基于三维Saab变换的高光谱图像压缩方法
基于生成对抗网络的无监督图像超分辨率算法
高光谱遥感成像技术的发展与展望
汽车制造企业噪声综合治理实践
原生VS最大那些混淆视听的“分辨率”概念
基于GPU的高光谱遥感图像PPI并行优化
苦味酸与牛血清蛋白相互作用的光谱研究
汽车变速器啸叫噪声处治
从600dpi到9600dpi