张燕,樊彦国,许明明,钟先金
(中国石油大学(华东) 海洋与空间信息学院,山东 青岛 266580)
高光谱遥感具有“图谱合一”的优点,即在获取图像空间二维信息的同时获取了图像的光谱信息,这使得高光谱图像在提取感兴趣地物信息时具有独特的优势[1]。高光谱目标检测根据有无先验知识分为监督目标检测与非监督目标检测,无任何先验知识的非监督目标检测称为异常检测[2-3]。Reed等[4]提出的RXD算法(reed-xiaoli anomaly detection)是高光谱图像异常检测的基石算法。后来学者在此基础上做出诸多改进,如Scholkopf等[5]提出的非线性核RXD(kernel RXD)算法,在图像统计时加入了非线性特征;Molero等[6]提出的基于聚类的并行RXD算法;耿修瑞[7]提出了一种基于数据白化距离的异常探测算法,先将数据进行白化处理再使用RXD算法进行探测。低概率目标探测算法(low probability target detector,LPTD)是另一种经典的异常目标探测算法,LPTD算法以单位向量作为匹配信息,是一种能量算子[8],由Harsanyi[9]在1993年首次提出。张立燕等[10]利用LPTD方法进行了高光谱图像有损压缩方法的研究。
RXD算法与LPTD算法在表述形式上类似于匹配滤波算子,二者都是假设背景为高斯分布[11-12],这种假设不能很好地描述复杂的背景,因而检测结果通常具有很高的虚警率。针对这一问题,本文提出一种基于均值匹配的高光谱图像异常目标检测后验处理方法,首先将常规异常探测算法结果做阈值分割,划分出异常目标潜在区域,随后求解出待测图像均值,并计算其与目标潜在区域的像元相似度,剔除差异较大的像元得到最终的异常探测结果,这一方法充分利用了异常目标的统计分布特征,本文采用的光谱相似性度量标准为光谱角。
至今为止,在高光谱图像异常探测中,对何为“异常目标”没有一个明确而权威的定义,被研究学者普遍接受的观点是,目标地物在某种定义的分布下与背景有差异,即与背景信息有明显不同,就可定义为异常目标[13]。
异常目标一般具有以下特点:从几何上讲[14-15],在图像特征空间中相应的端元应位于单形体结构分布的数据云团的顶点位置,即游离于大的数据云团之外;从物理特性上讲,异常目标与图像中的其他背景地物有较大差异,即光谱曲线有不同的特征;从信息量上讲,异常目标常常只占据图像的一小部分,有的甚至以亚像元的形式存在。这是高光谱异常探测的信息基础。
RXD算法假设待检测异常目标与背景服从同一的高斯分布。完整假设如下:
H0:X0~N(μ,Γ)
H1:X1~N(μ,Γ)
(1)
式中:H0为异常目标不存在的情况,即背景;H1为异常目标存在的情况。
RXD算法数学表达式:
y=DRXD(x)=(x-μ0)TΓ-1(x-μ0)
(2)
式中:μ0为图像均值;Γ为全图的协方差矩阵;x为待测图像像元向量。
根据异常目标的信息量特性可知,如果图像中存在异常目标,那么它对应的能量会很小,并且与Γ的小特征值相对应,特征值越小,则探测统计量越大,这也是RXD算法能够有效地检测图像异常目标的原因[16]。RXD算法在表现形式上又与马氏距离相似,因此可以将其理解为待测图像至待测图像均值的协方差距离。
LPTD算法同样假设异常目标与图像背景有一致分布。其数学表达式:
(3)
式中:R为全图的自相关矩阵,其计算公式如下:
(4)
式中:x为待测图像像元向量;l为与图像波段数相同的L维单位向量。因为没有目标先验知识,所以用单位向量作为匹配信息,使得图像的信噪比最大化,进而剔除更多的背景像素。LPTD算法是一种能量算子。
光谱角匹配,也称为光谱角填图,是一种有效衡量2个光谱向量间差异程度的方法[17]。
如图1所示,背景像元之间的光谱角a比背景像元与目标像元间的光谱角b大,根据这一原则可以剔除异常探测算法误检的像元。假设x=[x1,x2…xl],y=[y1,y2…yl]为2个L维光谱向量,则x与y之间的光谱夹角可表示为:
(5)
图1 光谱角匹配示意图
RXD算法与LPTD算法假设待测目标,图像背景服从同一高斯分布,根据异常目标的广义定义可知,与图像背景有明显光谱异性的地物即可定义为异常目标。从数据结构的角度来讲,异常目标远离背景像元的分布中心,而图像像元光谱均值为表征像元分布的集中趋势,那么偏离图像光谱均值较远的像元就是所需检测的异常像元。因此从高光谱像元分布集中趋势方面给出高光谱异常目标的定义为:在待检测图像中,与图像像元光谱均值差异较大的即为异常目标。
根据异常目标的这一统计特点,可有效地剔除传统异常探测算法中的误检像元。像元光谱均值向量为图像像元分布的集中趋势走向,因此可以将其看做待测图像的代表光谱向量。将此向量与传统异常探测算法检测所得像元做相似性计算,可剔除与背景相似度较高的像元,以此来剔除传统高光谱异常检测算法检测结果中大范围的虚警目标。
图像的均值可表示为:
(6)
式中:m,n为待测图像大小。
将式(6)带入式(5)可得:
(7)
RXD与LPTD异常探测算法以待测图像中像元能量值大小衡量像元是否异常,有一定的局限性,没有充分利用异常目标的其他性质。本文所提方法加入异常目标统计分布特征,认为异常目标在图像中所占面积较小,偏离图像整体像元的频数分布,方法流程如图2所示。首先采用传统异常探测算法进行预检测,本文选用常用的全局RXD算法及LPTD算法,设定合理阈值得到异常目标潜在区域,此时阈值设定应尽可能地让更多的目标像元通过。随后对待测图像求解均值向量,该向量表征了待测图像统计分布的中心位置,具有待测图像的总体的平均波段特征,将其与预处理得到的异常目标潜在区域像元做光谱相似性计算,剔除与图像整体分布相近的像元,得到最终的异常目标检测结果,本文采用光谱夹角作为光谱相似性计算标准。
图2 算法流程图
实验图像如图3(a)所示,模拟异常像元位置如图3(b)所示。
图3 PHI高光谱图像及模拟异常像元位置
该数据为PHI传感器获得的常州夏桥地区影像,尺寸为240像元×240像元,共80个有效波段(除去含水波段与噪声波段)。在一些像素中加上目标光谱,该图像的背景主要由植被、水、土壤构成,实验中选择水泥的光谱作为目标光谱,以100个像素添加,并将这些像素中的原始背景光谱作为背景并相应地减少。根据目标的丰度,将100个像素划分为10组。第一行像素具有10%目标和90%背景。第二行有20%目标和80%背景。
类似地,剩余像素每一行以增加10%目标光谱信息,减少10%背景信息为规律,第一行为第一组像素,以此类推。
分别对RXD算法与LPTD算法采用后验改进方法对AVIRIS真实地表高光谱图像进行异常检测。传统RXD算法与LPTD算法探测结果如图4(a)、图4(b)所示。采用本文所述方法进行修正过的RXD算法与LPTD算法检测结果如图4(c)、图4(d)所示。
从ROC曲线图可以看出,加以改进的异常检测算法,在保持虚警率0.1以下时,都可保持0.9以上的探测率,即可以检测出丰度10%及其以上的亚像元目标地物。
注:图中显示的像素探测统计值为归一化值,值越接近1表示像异常程度越高。图4 PHI高光谱图像各算法异常检测实验结果
图5 异常检测方法的ROC比较
该数据由AVIRIS传感器采集,尺寸为100像元×100像元,共有189个有效波段(除去含水波段与噪声波段)。图像背景主要由不同屋顶的建筑物、停机坪、机场跑道构成,如图6(a)所示,本实验选择位于左上角的飞机作为检测目标。目标位置如图6(b)所示。
图6 AVIRIS高光谱图像及异常目标位置
与PHI模拟数据高光谱图像的异常检测相同,首先分别对RXD算法与LPTD算法采用后验改进方法对AVIRIS真实地表高光谱图像进行异常检测,结果二值化显示。采用传统RXD算法与LPTD算法对AVIRIS真实地表高光谱图像进行异常检测结果如图7(a)、图7(b)所示。采用本文所述方法进行修正过的RXD算法与LPTD算法检测结果如图7(c)、图7(d)所示。
对于真实地表目标地物,本文方法依然可以有效地降低虚警率,使目标地物与背景更好地分离。将各方法取不同阈值所得的探测率与虚警率绘制成ROC曲线如图8所示。
注:图中显示的像素探测统计值为归一化值,值越接近1表示像异常程度越高。图7 AVIRIS高光谱图像各算法异常检测实验结果
图8 异常检测方法的ROC比较
从图8(a)可以看出在虚警率0.01的范围内,经加以改进的RXD算法可保持0.95以上的探测率,从图8(b)可以得到相似的结论。
本文研究了基于均值匹配的高光谱异常检测后验改进方法,首先采用异常检测算法划定异常目标潜在区域,然后求解待测图像像元光谱均值,用此向量与异常目标潜在区域像元做相似性匹配计算,剔除误检目标。此方法针对传统异常检测方法高虚警率的缺陷有一定的改进作用。实验结果证明:①在保持相近的探测率的情况下,与传统异常检测算法相比,本文提出的方法具有更低的虚警率;②本文算法能更好地检测亚像元目标;③该方法具有普适性,实验对模拟数据与地表真实数据分别采用RXD算法、LPTD算法结合后验改进方法进行检测,都有较好的检测效果。