刘世界,李春来,徐 睿,唐国良,徐 艳,4,吴 兵,王建宇,3*
1. 中国科学院上海技术物理研究所空间主动光电技术重点实验室,上海 200083 2. 中国科学院大学,北京 100049 3. 中国科学院大学杭州高等研究院,浙江 杭州 310024 4. 上海科技大学信息科学与技术学院,上海 201210
光谱相似度是常用于地物分类和识别的概念,从不同的角度看,光谱曲线具有多方面的量化特征,因此光谱相似度度量方式也有很多种,目前的评价方法主要包括基于光谱形状(shape features,SF)和幅值(amplitude features,AF)两种信息,基于SF的评价方法有光谱角度匹配(spectral angle mapper,SAM)[1],光谱信息散度(spectral information divergence,SID),光谱相关系数(spectral correlation coefficient,SCC),光谱相关角度(spectral correlation angle,SCA)[2],以及两两组合的方式,如SAM-SID,SID-SCA等。基于AF的评价方法主要有欧式距离(euclidean distance,ED)和J-M距离(Jeffries-Matusita distance,JMD)[3]。SF对于光谱曲线的增益的变化比较敏感,AF对光谱曲线的偏置比较敏感,为了能使评价方法同时体现出光谱曲线对于增益和偏置的灵敏性,通常可以对两类方法做适当的融合,如光谱相似尺度(spectral similarity scale,SSS)融合了SCC和ED,归一化光谱相似度分值(normalized spectral similarity score,NS3)融合了归一化的SAM和ED[4],光谱泛相似度匹配(spectral pan-similarity measure,SPM)融合了SCC,SID和ED。在实际应用中,地物光谱往往具有指纹特性,具体表现为吸收峰或反射峰等,这些特性是对物质进行识别和分类的重要信息,但一般该类信息在光谱曲线中所占比重较少,基于SF和AF的评价方法很难体现出其重要性。一方面,压缩感知作为一项新兴理论,在光谱成像领域中已经得到了广泛应用,光谱恢复精度是评价压缩感知恢复算法性能的一个重要指标,但是目前还没有统一的评价方法。光谱恢复精度可以通过比较恢复曲线与真值曲线的相似程度来评价,因此可以利用光谱相似度来评价算法的好坏,但基于压缩感知的信息处理系统更擅长的是恢复平滑轮廓信息,吸收峰一类信息往往不会得到好的保持,利用SF和AF的评价方法尽管可以很好的反映出算法恢复信息量的能力,但并不能客观地反映出对于光谱特征的保真能力。另一方面,基于光谱相似度的分类应用中,对于光谱曲线本身轮廓信息的评价难以凸显光谱指纹特征的作用,由此会降低分类精度,实际上,仅仅少量光谱特征就可以对地物进行有效分类,因此如何突出光谱特征在光谱相似度中的评价极为重要。光谱曲线的一阶梯度信息在平滑段的值很小,在具有强烈吸收峰和反射峰的位置则具有很强的幅值,可以直接凸显出光谱指纹特征,因此,本研究提出了基于一阶梯度信息的光谱恢复精度评价方法。通过该方法可以直观地反映系统对光谱特征保真能力,同时可以在基于光谱相似度的分类应用中提高分类精度。
SAM是基于光谱形状评价光谱相似度最常用的方法,本文以此为代表分析传统基于光谱原始信息的光谱相似度评价方法,进而提出MGSAM评价方法。首先分别给出光谱角度匹配(SAM)和梯度光谱角度匹配(gradient SAM,GSAM)的计算公式分别为
(1)
(2)
(3)
(4)
由式(3)和式(4)可以看出,当SAM为0时,MSAM为0.5,此时x1和x2是两个相互垂直的向量,表明光谱相似度为0。另一方面,由于待比较的两条光谱曲线往往具有同源性,即通常情况下x1和x2的所有元素同号,此时MGSAM≥0.5。因此在同源光谱比较中,当MSAM和MGSAM取值为0.5时,意味着光谱相似度很低。但在更广泛的应用
图1 原始光谱曲线与相应梯度曲线对比(a): 汞灯特征曲线; (b): 汞灯特征曲线的梯度曲线; (c): 暗电平曲线; (d): 暗电平曲线的梯度曲线Fig.1 Comparison of the original spectral curve with the corresponding gradient curve(a): Mercury lamp characteristic curve; (b): Mercury lamp characteristic curve gradient curve;(c): Dark level curve; (d): Dark level curve gradient curve
中,如物质探测等,取值范围为[0,1],且两者都是值越接近1,表明x1和x2的相似度越高。
为了说明在光谱相似度评价方法中对于光谱特征保持的体现,首先基于汞灯的光谱曲线作分析。汞灯的光谱曲线从紫外到红外波段都具有明显的发射特征,如图1(a)所示是美国National Institute of Standards and Technology (NIST)公布的光谱曲线,选择 500~800 nm波段进行分析。
在不同光照强度下,光谱曲线的形状会根据光照强度呈倍增关系,在不同暗背景条件下,光谱曲线会出现相应的偏置,好的光谱相似度评价方法要对光谱的倍增和偏置具有一定的鲁棒性。由于所用光谱曲线均做了归一化的后处理,光谱倍增对于 MSAM 和 MGSAM 不会产生影响,可以仅考虑偏置带来的影响。为简化并充分说明问题,图1(a)为暗电平理想常数为d的理想汞灯光谱曲线模型,通常情况下,光电系统的平均信噪比(SNR)可以达到 100以上,因此将d设置在[0.001,0.01]之间。为了直观的体现出偏置对于MSAM和MGSAM的影响,选择不含有任何光谱特征的暗电平曲线(偏置曲线)作为参考进行对比,如图1(c)所示。由于梯度不受偏置影响,因此在不同d的条件下,光谱曲线的梯度是相同的,图1(b)和图1(d)分别给出了汞灯光谱曲线和暗电平光谱曲线的梯度曲线。
如图2所示,是分别计算得到的在不同偏置条件下汞灯光谱曲线与偏置曲线的MSAM和MGSAM的结果。可以看出,随着偏置的增大,MSAM呈现明显地增长,且在d=0.1时,其值接近于1,由于偏置曲线不含任何光谱信息,这显然不能客观反映出两者的光谱相似度。另一方面,光谱曲线的梯度并不受偏置的影响,梯度曲线并不会反映偏置信息的存在,因此 MGSAM 的值一直保持不变并且是个较小的值(0.5),即偏置变化对于 MGSAM 没有影响,且在数值计算中占据很小的比重,因此利用MGSAM评价光谱相似度对偏置变化具有很好地鲁棒性。
图2 原始曲线与暗电平曲线的MSAM和MGSAMFig.2 MASM of original curve and dark levelcurve, and corresponding MGSAM
光谱吸收峰深度是评价光电探测系统灵敏度的一个重要指标[5]。如图3(a),为 ENVI 软件光谱库中巴西棕榈蜡(Carnauba Wax)在0.4~2.5 μm的反射率曲线(蓝色曲线),其在1.208,1.388和1.728 μm具有明显的吸收特征峰。一方面,低灵敏度的光电探测系统会弱化光谱吸收峰的深度,极端情况下,光谱吸收峰会消失。另一方面,在压缩感知的光电探测系统中,低采样率条件下仅可以恢复光谱曲线的大部分轮廓信息,光谱吸收峰等细节往往得不到充分恢复。图3(a)中同时给出了仅仅具有巴西棕榈蜡光谱曲线轮廓信息的参考曲线(红色曲线),该曲线是经过滤波重采样得到的,可以认为是上述两种情况得到的探测或恢复结果。
利用MSAM评价光谱曲线相似度时,计算原始曲线和参考曲线得到MSAM=0.99,之所以有如此大的值,是因为两个对比曲线具有大量的相同或者接近的反射率数值,而吸收峰仅仅占据曲线的一小部分,即该数值虽然能说明参考曲线包含了绝大部分原始曲线信息,但并不能证明细节信息得到保留。图3(b)给出了原始曲线和参考曲线的梯度曲线,可以看出,原始曲线在具有强吸收峰位置的梯度具有较大幅值,强化了光谱特征,而轮廓曲线在梯度中保持平稳状态并且数值较小。因此利用GMASM进行光谱相似度评价可以
图3 光谱特征曲线与光谱轮廓曲线以及两者相应的梯度的对比(a): 巴西棕榈蜡的反射率曲线及其轮廓曲线; (b): 巴西棕榈蜡的反射率曲线及其轮廓曲线相应的梯度Fig.3 Comparison of spectral characteristic curve and spectral contour curve and their corresponding gradients(a): Reflectance curve of carnauba wax and its contour curve;(b): Reflectance curve and contour curve of carnauba wax and their corresponding gradient
突出光谱吸收峰的比重,这里计算得到GMASM=0.72,可以更客观地反映光谱特征保持结果。
压缩感知是一种新的信息处理模型,其基于信号稀疏性的特点,可以在采样少量数据的前提下恢复获得全部信息,实现压缩与采样同时进行,大大减少了数据的存储和传输的压力[6-7]。在实际应用中,所探测目标的光谱曲线本身并不稀疏,但其在频域中表现出良好的稀疏性,比如在余弦变换域和小波变换域中,稀疏系数主要集中在低频部分,该特点在空域中的直观表现为光谱曲线具有很强的平滑性。压缩感知在低采样率条件下,主要恢复得到的是集中在低频部分的少量系数,高频部分系数因数值较小而被舍弃,因此最终获得的曲线往往在平滑部分比较精确,而吸收峰等细节则容易被丢失。如图4所示,为在Discrete Cosine Transform(DCT)条件下,利用Iterative Reweighted Least Squares(IRLS)算法在不同采样率恢复得到的结果,并给出了原始曲线的对比。
从图4中可以看出,在低采样率(0.1~0.4)条件下,光谱的轮廓信息基本得到了全部恢复,而光谱吸收峰则被弱化甚至丢失,即光谱特征在压缩感知并没有得到好的保持。在进行光谱保真度评价时,由于光谱轮廓信息占据光谱曲线大多数信息,基于原始曲线的对比势必会得到高光谱相似度的结论。如图5所示,分别给出了真值曲线与恢复曲线的MSAM和MGSAM,由图5可以看出,即使在低采样率条件
图4 不同采样率下恢复光谱曲线与真值曲线的对比Fig.4 Comparison of true value curve recovery and spectrum curve under different sampling rates
图5 真值曲线与不同采样率下恢复曲线的MSAM和MGSAMFig.5 MSAM and MGSAM of truth and recovery curve at different sampling rates
下,MSAM也在0.998以上,该数值表明绝大多数光谱信息得到了保持,但显然没有反映出光谱特征被丢掉的这一客观事实。而GMSAM在低采样率时保持了较小的值,直到光谱特征得到较好的恢复时,GMSAM的值才逐渐接近于1,充分表明了光谱特征在光谱相似度评价中所起的作用。另一方面,尽管随着采样率的提高,MSAM逐渐变大,但不同采样率间的差异性却很难反映出光谱特征保真能力。而GMASM 则随着采样率的变化具有明显的变化,且具有较大的差异,可以直观地反映出压缩感知系统对于光谱特征的保真能力。
计算光谱匹配度是地物分类常用的方法之一,待分类地物与参考光谱的匹配度本质上是计算两条光谱曲线的相似度[8]。无监督分类问题通常可以使用K-Means,Hierarchical Clustering等方法,为了说明MGSAM在分类中起的作用可采用如图6所示的分类方法。
选择Salinas,Pavia和Indian Pines三个数据集,对应的类别数分别为14,9,16。其中标准光谱曲线是在GroundTruth中选择若干相应同类地物光谱曲线的平均值。如图7所示,可以直观地看出MGSAM比MSAM取得了更好的分类结果。同时表1中给出了两者分类的准确度,可以看出,MGSAM比MSAM具有更高的分类准确度。这是因为MGSAM能更好的体现出光谱特征保真度,有利于在分类过程中对于光谱特征的提取,进而提高分类精度。
图6 利用MSAM和MGSAM分类的流程Fig.6 Classification process using MSAM and MGSAM
图7 MSAM和MGSAM的分类结果Fig.7 Classification results of MSAM and MGSAM
表1 MSAM和MGSAM的分类准确度Table 1 Classification accuracy of MSAM and MGSAM
MGSAM为光谱相似度评价提供了一种新的方法,将光谱曲线的梯度信息纳入计算中,增强了光谱吸收峰等“指纹”特征在光谱相似度评价体系中的重要性,可以客观地反映光谱特征保真度,为基于压缩感知的光谱成像系统提供了一种准确地光谱保真度评价方法,同时其良好的光谱特征反映能力可以提高地物分类的精度。
MGSAM用光谱曲线一阶梯度信息进行光谱特征增强,进而提高光谱特征在评价方法中的重要性,在SAM的基础上演化而来,基于传统光谱形状的评价方法SCC等,以及基于幅值信息的ED评价方法等,同样可以将梯度信息纳入计算因素,以提升光谱特征要素的重要性,这将是未来的重点研究方向之一。