基于K-L散度与光谱可分性距离的波段选择算法

2014-11-08 06:58华文深马左红
应用光学 2014年1期
关键词:散度信息量波段

杨 佳,华文深,刘 恂,马左红

(1.军械工程学院,河北 石家庄050003;2.解放军73101部队,江苏 徐州221000)

引言

在经历了全色成像、彩色摄影、多光谱扫描成像阶段后,20世纪80年代出现了成像光谱的概念。高光谱成像是利用连续的窄小波段获取目标有关信息的技术,高光谱数据将传统的图像维和光谱维信息融为一体,在获取目标空间图像的同时,得到每个图像单元对应的光谱信息,这样,在基于空间维度进行目标分类识别的同时,能够从光谱维度依光谱特征实现目标信息的反演和识别。

高光谱数据中波段数量多,波段之间相关性强,信息冗余多,使数据处理难度加大。为了有效地利用高光谱数据的丰富信息,同时较快地完成数据处理,就需要对原始数据进行降维[1]。波段选择便是降维的重要方法之一,依据一定的判据从全部波段中选出最能表示目标特征的若干波段,并以此来表示整个数据集。该方法克服了变换法改变图像特性的缺点,较好地保留了最原始的数据信息,更有利于保持图像的原有特性,成为高光谱数据降维的重要研究方向[2-6]。

波段选择应遵循以下3个原则[7]:

1)所选的波段信息量尽可能丰富;

2)所选的波段之间相关性尽可能小,保持各波段的独立性和有效性;

3)所选的波段组合对识别或分类目标的光谱特性差异要最大、类别可分性要强。

在现阶段研究中,波段选择的基本算法可以分为2类:一种是基于信息量的最佳波段选择方法,如最佳指数因子法、波段指数法、自适应波段法等;另一种是基于类间可分性的波段选择方法,如计算离散度、光谱相关系数、波段分组等。这些方法在计算过程中,只是单独考虑波段信息量或类间可分性,导致在对已知光谱特征的目标进行分类时,效果不够理想。为解决这一问题,本文将波段信息量与可分性综合进行考虑,在保证信息量最大的前提下,对波段的类间可分性进行分析,从而找到分类精度较高的波段组合。使用K-L散度(Kullback-Leibler divergence)计算波段信息量差异,利用光谱可分性距离计算类间可分性,得到最优波段组合,实现针对特定目标的波段选择。

1 波段选择方法

1.1 K-L散度

常见的相似性度量方法有光谱角制图、光谱信息散度和相关系数等,它们可以分别从不同方面描述两波段的相似性。为了在波段选取的过程中,即保证所选波段信息量丰富,又能去除临近波段之间大量的冗余信息,这里使用K-L散度来衡量波段间的相似程度以及波段之间信息量大小的关系。K-L散度是一种在信息论中得到广泛应用的信号相似度度量[8]。对于2个概率分布为P和Q的离散随机信号,Q相对于P的K-L散度可以按照(1)式进行计算:

即按照概率P求得的P和Q对数差的平均值,并且当且仅当∑iP(i)=∑iQ(i)=1时才有意义。

将K-L散度应用到高光谱图像处理时,把每一个波段看作一个随机变量,即可求出任意2个波段的相似性[9]。假设一组高光谱数据有L个波段,表示为Y=[y1,y2,…,yL],其中yi(1≤i≤L)是N维波段列向量,代表波段i上N 个像元光谱分量。将yi进行归一化,得到,那么第j个波段相对于第i个波段的K-L散度为

式(2)的物理意义是用第j个波段来表示第i个波段所需信息量的大小。K-L散度越大,说明完全用第j个波段来表示第i个波段的难度越大,即2个波段之间的相似度越低[10]。

1.2 光谱可分性距离

为了完成针对特定目标的最优波段选择,需要对高光谱数据进行光谱可分性距离的计算,分析不同地物类别在哪些波段上最容易区分。高光谱数据是地物对电磁波反射信息和自身辐射信息的综合,本质上记载了地物的总辐射量,即像元亮度值,称为DN值(digital number)。不同地物由于结构、组成成分和物理化学性质不同,导致其光谱特性存在着差异。基于此,采用光谱混合距离可以有效地对光谱可分性距离进行计算。光谱的混合距离计算公式如下“

式中:Dkl为光谱的混合距离;ykm、ylm分别为第k类和第l类地物在m波段上的光谱亮度值。对于任意的两类地物,光谱混合距离越大,说明在该波段或波段组合上的可分性越好,判读效果也就越好。

1.3 算法步骤

算法主要由4步组成:

HBO经过专科发展已具有稳定安全的治疗方案,严重不良反应罕见,目前最常见的不良反应是中耳气压伤,其发生受加减压速度和咽鼓管功能影响。由于鼻腔手术后常有黏膜肿胀和分泌物积蓄,故治疗前应保持鼻腔、鼻窦口和咽鼓管的通畅,预防中耳和鼻窦气压伤的发生。本次实验中未观察到实验动物发生明显不良反应。综上所述,早期HBO治疗在鼻腔手术后黏膜的恢复过程中,对抑制纤维结缔组织增生和减少瘢痕形成具有促进作用,可减轻鼻内镜手术后的去黏膜化反应,甚至可能在一部分难治性鼻-鼻窦炎中起到重要的逆转作用。

1)选择初始波段对波段子集进行初始化,产生集合φ1={B1},其中B1为初始波段,与其他各波段的K-L散度值之和最大。

2)计算剩余波段与φ1中各元素的K-L散度,找到K-L散度值最大的对应波段B2,它与φ1中元素最不相似,加入1)的波段子集中,即φ2=φ1∪{B2}。

3)循环步骤2),直到φx中的波段数目达到设定阈值。

4)在φx的波段中,对特定目标进行光谱可分性分析,去掉地物可分性距离小的波段,得到最终的波段子集φ。

2 实验分析

实验所采用的高光谱数据有89个波段,波长范围从0.45μm~0.80μm,光谱分辨率为4nm。取第15、30、57波段分别作为R、G、B分量合成假彩色图,如图1所示。

图1 波段15、30、57合成的伪彩色图像Fig.1 Pesudo color image at channel 15,30,57

初始波段的选择对于整个波段选择过程具有决定性的作用。计算任意2个波段之间的K-L散度,找到相似性最低的2个波段(波段28与波段64)组成初始波段集。实际应用中,最优波段组合中的波段数目与图像复杂程度有关,图像越复杂、包含的地物种类越多,所需要的波段数目就越大,从而为后续的目标分类与探测过程提供足够的数据支撑。图像中主要有伪装目标、草坪、树木、屋顶、路面等5种地物,设置波段个数为6个,可以满足图像分类需要。

最终通过K-L散度计算得到包含6个波段的波段子集是φ={28,62,84,82,51,26}。各波段的灰度图如图2所示。

图2 波段选择结果Fig.2 Result of band selection

波段子集中,各波段分布均匀,不在成像光谱范围的两端,受到仪器本身干扰和其他噪声干扰较少,比较理想。

图3 5种地物的光谱曲线Fig.3 Spectral curves of 5 kinds of ground objects

为选出目标与不同背景地物的最佳3波段(用于合成伪彩色图像),在表1中列出的波段组合中选取最优波段子集中相关性最小,包含信息最多的3个波段:28、51、84。这3个波段出现的频率比较高,它们之间的相关系数分别为:0.825 5、0.755 0、0.710 1,相对其他波段组合相关系数较小,所以选取这3个波段用于整幅图像的最佳3波段组合,将波段84(781nm)赋予红色、波段28(557nm)赋予绿色、波段51(649nm)赋予蓝色。得到如图4所示的合成后的伪彩色图像。

表1 区别目标与其他种类地物的最优波段子集Table 1 Optimal subset of bands for distinguishing target and other kinds of ground objects

图4 波段84、28、51合成的伪彩色图像Fig.4 Pesudo color image at channel 84、28、51

3 光谱角制图分类

为了验证所选波段的分类效果,利用光谱角制图法对图像进行分类。

光谱角制图(spectral angle mapper,SAM)以光谱角为基础,将每条光谱都视为波谱空间的一个矢量,根据矢量夹角来确定两条光谱间的相似程度。夹角越小,说明像元与参考光谱越相似,分入该类;夹角超过指定的弧度阈值,则不被分为该类。在分类过程中,可以消除或减弱因太阳入射角、地形、观测角等因素引起的光谱变异的同物异谱现象,适用于高光谱数据分类。以选出的3波段28、51、82为例进行分类,设定各类地物分类时的光谱角阈值,光谱角从0开始,以0.01rad为单位逐渐增大,找到能够使各类地物分类精度高且错分精度小的光谱角作为阈值,结果如表2所示。

表2 各类地物光谱角阈值Table 2 Spectral angle thresholds of ground objects

利用表2中的光谱角阈值对图像进行分类得到如图5所示的分类结果,地面参考图像进行对比,得到混淆矩阵如表3所示。混淆矩阵,又称误差矩阵,行中各元素表示分类结果中某类集合与参考图像中各类集合的交集像元个数;列中各元素表示参考图像中某类集合与分类结果中各类集合的交集像元个数;列总计为参考图像中某类所有像元个数的之和。利用混淆矩阵,计算Kappa系数和分类精度对分类效果进行评价。

表3 分类后的混淆矩阵Table 3 Confusion matrix of classification

Kappa=(总体精度-期望精度)/(1-期望精度)。Kappa值大于80%,说明分类图像与参考图像吻合度很好,40%~80%表示吻合度中等,40%表示吻合度很差。经过计算,Kappa系数为0.887 8,说明分类效果较好。

图5 分类结果Fig.5 Result of classification

总体分类精度=(正确分类的像元数/总像元数)=(29 185/31 656)=92.2%。

其中5种类别地物的分类精度分别为:97.14%、57.81%、99.68%、95.67%、72.98%。从计算结果可以看出,整个分类过程对草地、道路、屋顶分类精度比较高,而对伪装目标与树木分类精度较低。分析造成分类精度较低的原因主要有以下几个方面:第一,分类过程受主观因素影响较大。光谱角阈值是经过反复实验观察得到,并不是最准确的。阈值偏大,会将不同类别的像元归入一类;阈值偏小,会将本该属于一类的像元归入不同类别。第二,所使用的伪装材料与树木在可见光部分光谱吻合比较好,难以区分,单纯依靠可见光3波段的光谱角制图法分类,得到的结果精度不高。加入红外波段的研究将会使分类更加准确,这也是将来工作的研究重点。

4 结论

本文设计了一种基于K-L散度与光谱可分性距离的波段选择算法。将每个波段的N个像元光谱分量看成一个N 维波段向量,利用K-L散度计算得到信息量大且相似性最小的波段组合,同时结合高光谱图像中各类地物的连续光谱特征,计算它们的光谱可分性距离,距离越大,说明在该波段中可分性越好,最终得到可以用于合成假彩色图像的3个波段。实验结果表明,本文所用的算法在应用到高光谱图像的分类时能够取得良好效果,是一种实用的高光谱图像波段选择算法。

[1] 张良培,张立福.高光谱遥感[M].武汉:武汉大学出版社,2005.ZHANG Liang-pei,ZHANG Li-fu.Hyperspectral remote sensing [M].Wuhan:Wuhan University Press,2005.(in Chinese)

[2] 刘建平,赵英时,孙淑玲.高光谱遥感数据最佳波段选择方法试验研究[J].遥感技术与应用,2001,16(1):7-13.LIU Jian-ping,ZHAO Ying-shi,SUN Shu-ling.Experimental studies about methods on optimal bands selection of hyperspectral remote sensing datasets[J].Remote Sensing Technology and Application.2001,16(1):7-13.(in Chinese with an English abstrast)

[3] 杨金红,尹球,周宁.一种改进的高光谱数据自适应波段选择方法[J].遥感技术与应用,2007,22(4):513-519.YANG Jin-hong,YIN Qiu,ZHOU Ning.An improved method of hyperspectral remote sensing data adaptive band selection[J].Remote Sensing Technology and Application,2007,22(4):513~519.(in Chinese with an English abstrast)

[4] DU Qian.Band selection and its impact on target detection and classification in hyperspectral image analysis[C].Maryland:IEEE Greenbelt,2003:374-377.

[5] CHANG Chein-I,WANG Su.Constrained band selection for hyperspectral imagery[J].IEEE Trans.Geosci.Remote Sens,2006,44(6):1575-1585.

[6] DU Qian,YANG He.Similarity-based unsupervised band selection for hyperspectral image analysis[J].IEEE Geosci.Remote Sens.2008,5(4):564-568.

[7] 杜培军.高光谱遥感信息中的特征提取与应用研究[J].光子学报,2005,34(2):293-298.DU Pei-jun.Spectral feature extraction in hyperspectral RS date and its application to information processing[J].Acta photonica sinica,2005,34(2):293-298.(in Chinese with an English abstract)

[8] SHEFFIELD C.Selecting band combinations from multispectral data[J].Photogrammetric Engineering& Remote Sensing,1985,51(6):681-687.

[9] 何元磊,刘代志,易世华.一种新的高光谱图像波段选择方法[J].光电工程,2009,37(9):122-126.HE Yuan-lei,LIU Dai-zhi,YI Shi-hua.A new band selection method for hyperspectral images[J].Opto-Electronic Engineering,2009,37(9):122-126.(in Chinese with an English abstrast)

[10] 刘雪松,葛亮,王斌,等.基于最大信息量的高光谱遥感图像无监督波段选择方法[J].红外与毫米波学报,2012,31(2):166-170.LIU Xue-song,GE Liang,WANG Bin,et al.An unsupervised band selection algorithm for hyperspectral imagery based on maximal information[J].Journal of Infrared and Millimeter Waves,2012,31(2):166-170.(in Chinese with an English abstract)

猜你喜欢
散度信息量波段
带势加权散度形式的Grushin型退化椭圆算子的Dirichlet特征值的上下界
最佳波段组合的典型地物信息提取
重磅!广东省发文,全面放开放宽落户限制、加大住房供应……信息量巨大!
定常Navier-Stokes方程的三个梯度-散度稳定化Taylor-Hood有限元
具有部分BMO系数的非散度型抛物方程的Lorentz估计
基于信息理论的交通信息量度量
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
基于f-散度的复杂系统涌现度量方法
如何增加地方电视台时政新闻的信息量