刘德鹏, 李正周,2,, 曾靖杰, 熊伟奇, 亓波
(1.重庆大学 通信工程学院, 重庆 400044;2.重庆大学 信息物理社会可信服务计算教育部重点实验室, 重庆 400044;3.中国科学院 光电技术研究所, 四川 成都 610209;4.中国科学院 光束控制重点实验室, 四川 成都 610209)
红外小弱目标检测是远距离监测系统和精确制导的关键技术。红外小弱目标信噪比(SNR)低、结构性低,而强杂波的干扰强度大、面积大,使得传统红外小弱目标检测产生虚警率高的问题。因此,复杂背景和强杂波干扰下红外小弱目标检测成为近年来红外图像处理技术领域的难点和研究热点[1-2]。红外小弱目标检测算法可分为先跟踪后检测(TBD)算法和先检测后跟踪(DBT)算法两大类。TBD算法通过融合处理多帧图像的空域和时域信息来实现对红外小弱目标的识别,但在背景时域变化剧烈或红外小弱目标成像轨迹不连续情况下无法有效地融合时域信息,从而造成检测率降低。另外,复杂背景下某些强杂波具备与红外小弱目标类似的时空信号分布特征,会造成虚警率升高,也会使检测率降低。DBT算法通过处理单帧红外图像来进行红外小弱目标检测,可对背景时域变化剧烈、红外小弱目标成像轨迹不连续的红外图像保持稳定的红外小弱目标检测性能。DBT算法主要包括滤波类算法、模式识别类算法、基于稀疏特性类算法和基于人眼视觉机制算法4种类型。滤波类算法在复杂背景和强杂波干扰下难以有效估计背景杂波,从而会导致检测率降低、虚警率上升。模式识别类算法性能极大依赖于分类特征的设计和训练样本的选择,故对于某些训练样本所没有涉及的场景,模式识别类算法的检测率会急剧下降,虚警率则会上升。基于稀疏特性类算法通过奇异值分解[3-4]或信号表征模型[5]构建超完备字典,将红外图像用少量原子重构,通过原子分布判断红外小弱目标是否存在。此外,还有学者将红外图像中红外小弱目标检测问题通过建模转换为稀疏矩阵和低秩矩阵分解问题,在稀疏矩阵中进行阈值分割以检测红外小弱目标[6-8]。但在复杂背景下,某些强杂波具有和红外小弱目标相似的稀疏特性,会造成检测率降低,虚警率升高。综上所述可知,如何在复杂背景和强杂波干扰条件下保持较高检测率和合理虚警率,是一个具有挑战性的难题。
人眼可从复杂背景和强杂波干扰中,准确、快速地识别出红外小弱目标。受此启发,近年来大量研究人员将人眼视觉机制应用于红外小弱目标检测的研究,如局部对比度测度算法[9]、信息熵测度算法[10-11]等。然而,现有算法无法完全精确地模仿人眼视觉机制,导致复杂背景和强杂波干扰下仍将面临检测率降低、虚警率升高问题。因此,如何设计拟合人眼视觉机制的算法是进一步提升红外小弱目标检测灵敏性和鲁棒性的关键。本文采用多尺度局部对比度增强红外小弱目标以提高检测率,根据多尺度梯度一致性抑制复杂背景和强杂波干扰以降低虚警率。
红外图像可建模为
f(x,y)=ft(x,y)+fb(x,y)+fn(x,y),
(1)
式中:f为原始红外图像;ft为红外小弱目标图像分量;fb为背景和杂波图像分量;fn为红外图像噪声分量;(x,y)为像素坐标。根据红外图像的信号成分差异,红外小弱目标检测问题可看作为一个二分类问题:
(2)
在(1)式描述的模型中,红外图像中各分量具有如下特性:
1)飞机、导弹等飞行器喷尾管温度高于环境温度,故红外小弱目标所在像素的强度高于其周围背景和杂波的像素强度,这是红外小弱目标检测中最重要的特性之一。这些高对比度信号对应人眼视觉处理过程中的显著点。
2)由于飞行器与探测系统的距离较远,飞行器自身的红外辐射强度随着距离而变化,导致红外图像中的红外小弱目标无固定的尺寸和强度,无明显的纹理和结构信息,这是红外小弱目标检测的难点。
3)天空背景的红外图像中,简单背景、弱杂波部分具有较低的对比度,从而易于与红外小弱目标进行区分,虚警干扰主要来自形态各异的云层边缘。
4)云层边缘像素在梯度上表现出方向的一致性,而红外小弱目标区域的梯度围绕红外小弱目标中心具有多样性。这种一致性在人眼视觉机制中体现为被抑制和忽视的重复纹理。
本文中,基于特性1,采用基于单尺度局部对比度方法,来模拟人眼系统对显著点的视觉关注机制,对红外小弱目标和简单背景、弱杂波区域进行区分。基于特性2,将单尺度局部对比度推广到多尺度局部对比度,从而可针对不同尺寸的红外小弱目标保持高水平的检测灵敏度。基于特性3和特性4,提出基于多尺度梯度一致性的边缘抑制方法来模拟人眼对重复信息的视觉掩盖机制,从而降低复杂云层造成的虚警干扰,提升红外小弱目标检测的鲁棒性。
红外图像中特定像素f(x,y)对应的单尺度局部对比度的定义为
Cl(x,y)=f(x,y)-bl(x,y),
(3)
式中:l为单尺度局部对比度的尺度值,对应处理区域尺寸为(2l+1)×(2l+1);bl(x,y)为背景区域的平均像素强度,其定义为
(4)
式中:(x′,y′)为背景区域的像素坐标。
由于红外小弱目标的中心像素强度大于背景像素强度的平均值,Cl(x,y)数值较大;而简单背景、弱杂波区域的中心像素强度和背景强度差异较小,Cl(x,y)数值较小。
图1所示为不同尺度值下单尺度局部对比度对应的处理区域,中间灰色像素为中心像素,周边阴影像素为计算背景平均强度所参考的像素。
当单尺度局部对比度处理区域大于红外小弱目标时,单尺度局部对比度能够准确地量化红外小弱目标与背景杂波的反差。若单尺度局部对比度处理区域小于红外小弱目标,则部分红外小弱目标像素的强度会参与背景平均强度bl(x,y)的计算,从而造成单尺度局部对比度的误差。为了克服此误差,本文进一步将单尺度局部对比度推广到多尺度局部对比度:
MCj(x,y)=max {C1(x,y),…,Cj(x,y)},
j=1,2,3,…,
(5)
式中:j为多尺度局部对比度计算过程中所用到的最大尺度值。通过多尺度局部对比度,可对不同尺寸的红外小弱目标进行显著性衡量,与人眼视觉机制的多尺度特性相符。
通过多尺度局部对比度,可很好地区分红外小弱目标和简单背景、弱杂波区域。但在某些复杂背景和强杂波干扰下红外小弱目标检测场景中,云层边缘可能具有较强对比度,在处理过程中与红外小弱目标易发生混淆,从而导致检测率降低、虚警率升高。从人眼视觉机制角度来看,红外小弱目标和锐利云层边缘都具有显著性,从而会引起人类注意。但是,红外小弱目标的显著性集中在该红外小弱目标所在的紧凑范围内,而云层边缘的显著性随着边缘走向而连续存在,并且表现出很高的一致性,故人眼可准确地将上述二者区分。从机器视觉机制角度来看,红外小弱目标和锐利云层边缘都具有较高对比度,且这种对比度的分布和走向可通过图像梯度场来表征并区分。如图2所示,复杂背景下强杂波的梯度场在局部范围内存在一致性,即一个区域内的梯度具有大体一致的朝向和趋势。
对于红外小弱目标而言,其所占像素很少,则其梯度不具备一致性。基于这一特性,本文采用基于结构张量的多尺度梯度一致性来表征红外图像中各区域所对应的梯度场方向分布规律,剔除因高对比度云层边缘造成的误判。
给定红外图像中的特定像素f(x,y),其对应的梯度是1个二维列向量:
(6)
(7)
式中:r为结构张量计算区域的尺度,对应结构张量计算区域尺寸为(2r+1)×(2r+1);
(8)
(9)
(10)
(11)
(7)式结构张量矩阵中的4个元素分别统计了处理区域内所有x轴方向分量和y轴方向分量梯度的相关关系。
将结构张量进行特征值分解,其特征向量和特征值表征了单尺度梯度一致性处理区域内向量方向分布的一致性。特征值λ1、λ2通过(12)式计算:
(12)
假设与λ1、λ2对应的特征向量分别为e1、e2. 若λ1>0且λ2=0,则单尺度梯度一致性处理区域内所有梯度完全一致,都朝向e1的方向;若λ1>λ2>0,则λ1相较于λ2越大,处理区域内梯度的一致性越强;若λ1=λ2=0,则说明处理区域内梯度的方向杂乱,互不相同。
因为高对比度云层边缘相较于红外小弱目标具有更强的梯度一致性,所以本文利用基于结构张量的梯度一致性来抑制高对比度云层边缘的像素强度:
(13)
(14)
式中:gc衡量了当前处理区域内的单尺度梯度一致性;ε为一个很小的正数,以防止出现0作为分母的情况;Er为基于梯度一致性的抑制系数。根据(13)式,云层边缘区域梯度一致性强,gc取值较大,Er值较小,从而可抑制云层边缘的像素强度。
将多尺度概念引入到(13)式、(14)式,可实现类似人眼的多尺度高对比度云层边缘抑制功能,基于多尺度梯度一致性的云层边缘抑制系数的计算如下:
MEs(x,y)=max {E1(x,y),…,Es(x,y)},s=1,2,3,…,
(15)
式中:s为基于多尺度梯度一致性的云层边缘抑制系数求解过程中所用到的最大尺度值。
根据多尺度局部对比度MCj(x,y)和基于多尺度梯度一致性的云层边缘抑制系数MEs(x,y),可得到红外图像中各个像素的算法输出值:
O′(x,y)=MCj(x,y)·MEs(x,y).
(16)
将整幅图像的算法输出值归一化到0~255灰度级的范围内,得到算法处理结果图像的像素值O(x,y). 通过结果图像,可计算出自适应阈值为
Th=mean(O)+k·var(O),
(17)
式中:mean(O)和var(O)分别为结果图像的均值和方差;k为调节系数。对于结果图像像素O(x,y),若O(x,y)≥Th,则将该像素标记为红外小弱目标,否则将该像素标记为背景杂波。本文红外小弱目标检测算法的整体流程如图3所示。
为了评估算法性能,采用4个实测红外图像测试序列和2个仿真红外图像测试序列,共1 920帧图像进行实验。从每个测试序列中选取背景杂波比较复杂的图像作为代表帧,每个序列的代表帧及其强度分布三维图如图4所示。
测试序列1含有150帧红外图像,每一帧图像尺寸为200像素×256像素。测试序列1中,红外小弱目标邻域背景杂波比较平缓,而红外图像下半部分存在纹理复杂的云层。测试序列2含有170帧红外图像,每一帧图像尺寸为200像素×256像素。测试序列2的背景杂波以大面积的云层为主,红外小弱目标与云层混叠,云层边缘具有较高对比度。测试序列3含有150帧红外图像,背景杂波大部分对比度较低,但是云层边缘对比度比较高,每一帧图像尺寸为200像素×256像素。测试序列4含有150帧红外图像,每一帧图像尺寸为200像素×256像素。测试序列4中云层边缘比较平缓,但是云层内部纹理复杂且背景杂波强度较大。上述测试序列均由红外小弱目标检测平台在日间获取,测试序列中红外小弱目标为某型号飞机。测试序列5由电脑软件仿真合成,含有650帧尺寸为200像素×256像素的红外图像,每一帧中含有2个红外小弱目标。测试序列6同样由电脑软件仿真合成,由650帧尺寸为200像素×256像素的红外图像组成,其中每帧含有5个红外小弱目标。仿真测试序列中,红外图像的背景杂波图像分量来自实际拍摄不同场景的红外云层、天空图像。红外小弱目标图像分量根据广义二维高斯模型[5]产生,可模拟不同形状、尺寸、方向和非均匀性的红外小弱目标。合成仿真序列中将红外小弱目标图像分量与背景杂波图像分量叠加的方法如下:
(18)
式中:fs(x,y)为合成仿真红外图像的像素值;p(p>0)为红外小弱目标强度的调整系数,用来增加合成仿真红外图像的丰富度;T为红外小弱目标图像分量,其尺寸为m×n;x0和y0分别为T的锚点在fb(x,y)中的行数和列数。
实验中,分别将本文算法与max-mean算法[12]、max-median算法[12]、top-hat算法[13]、稀疏和低秩分解类具有代表性的IPI算法[6]和人眼视觉机制类具有代表性的MDGWIE算法[10]进行对比。
采用SNR增益(GSNR)[14]和平均残留背景(MARB)绝对值[15]对实验中的红外小弱目标算法抑制背景杂波干扰、增强红外小弱目标的性能进行评估。红外图像SNR定义为
(19)
式中:Imax为红外小弱目标所在区域内像素灰度最大值;A为红外小弱目标所在区域像素灰度平均值;σ为红外小弱目标所在局部区域像素灰度值标准差。实验中,取局部区域尺寸为9像素×9像素。
实验中,采用GSNR评估算法处理前后红外图像SNR变化情况,其定义为
(20)
式中:SNRo为待评估算法处理后结果图的SNR;SNRi为原始红外图像SNR.GSNR越大,说明相应算法抑制背景杂波、增强红外小弱目标的能力越强。
如表1所示为max-mean算法、max-median算法、top-hat算法、IPI算法、MGDWIE算法及本文算法对6个测试序列处理后得到的GSNR值。由表1可采用MARB绝对值指标[15]衡量算法处理结果中残留背景杂波的平均强度:
表1 不同算法对测试序列处理后得到的GSNR值
知,6种算法均能提高红外图像SNR,但本文算法能达到比其他方法更高的GSNR值,从而说明本文算法能有效抑制红外图像中的复杂背景和强杂波,增强红外小弱目标。
(21)
式中:R(x,y)为自适应阈值分割后被标记为背景杂波的像素灰度值;MARB计算区域的尺寸为mMARB×nMARB,本实验中取与红外图像相同的尺寸。MARB值越小,说明结果图像中残留背景杂波的平均强度越低。
如表2所示为max-mean算法、max-median算法、top-hat算法、IPI算法、MGDWIE算法及本文算法对6个测试序列处理后得到的MARB值。
由表2可知,本文算法结果中的残留背景杂波小于对比算法,这是保证本文算法在复杂背景和强杂波干扰下虚警率低的关键。
表2 不同算法对测试序列处理后得到的MARB值Tab.2 Average MARB values after processing the different test sequences by different algorithms
实验中,所有算法均采用(17)式计算其自适应阈值,最终自适应阈值的选择方法为通过调节阈值系数k,即将k由0开始,以0.1为步长逐步增大至5.0,选取其中对应检测率与虚警率较均衡的一个阈值。如表3所示为max-mean算法、max-median算法、top-hat算法、IPI算法、MGDWIE算法及本文算法处理红外图像测试序列的平均性能对比。由表3可知,本文算法耗时相比max-mean算法、max-median算法、top-hat算法较长,与MGDWIE算法相比耗时相差不大,与IPI算法相比耗时明显较小。同时,与其他经典算法相比,本文算法具有更高的红外小弱目标检测率和更低的虚警率,从而表明本文算法具有良好的检测性能和稳定性。
表3 不同算法的平均处理性能对比Tab.3 Average detection performances of different algorithms
为了分析红外小弱目标尺寸变化时算法的适用性,将测试序列中的红外小弱目标按照尺寸进行分组,讨论各对比算法在不同分组中固定虚警率为5%时所对应的检测率。如表4所示为max-mean算法、max-median算法、top-hat算法、IPI算法、MGDWIE算法及本文算法处理不同尺寸红外小弱目标的检测率。
由表4可知:max-mean算法、max-median算法、top-hat算法的性能受红外小弱目标尺寸影响较大,原因在于此类算法采取了固定的处理区域尺度;IPI算法对相对较大尺寸的红外小弱目标检测性能有所下降;MGDWIE算法和本文算法对不同尺寸红外小弱目标均保持了稳定的高检测率,原因在于二者均采用了多尺度的图像处理区域。本文算法比MGDWIE算法具有更高的检测率,表明了本文算法对不同红外小弱目标尺寸具有良好的适应性和鲁棒性。
表4 不同算法处理不同尺寸红外小弱目标的检测率Tab.4 Detection rates of different sized infrared dim small targets
为了分析算法在多红外小弱目标场景中的适用性,将测试序列中的图像按照红外小弱目标个数进行分组,分别分析各对比算法在不同分组中固定虚警率为5%时所对应的检测率,结果如表5所示。
表5 不同算法在不同红外小弱目标数量下的检测率Tab.5 Detection rates of different quantities of infrared dim small targets %
由表5可见,本文算法在不同红外小弱目标数量下均能达到较高的检测率,表明本文算法在多红外小弱目标场景及红外小弱目标相互干扰情况下性能稳定。
本文采用ROC曲线[16]分析不同算法检测率和虚警率之间的权衡关系。ROC曲线刻画了不同虚警率下算法处理所对应的检测率,对于固定的虚警率,检测率越高,说明该算法的检测性能越好。这种算法检测性能的优越性在ROC曲线上还直观地体现为某算法比其他算法的曲线上升得更快。如图5所示为不同算法对于测试数据的ROC曲线。
由图5可见,本文算法的ROC曲线能比其他算法更快达到100%检测率。由表3和图5可知,本文算法具有更高的检测率,具备良好的红外小弱目标检测能力。
如图6所示为不同算法对于6个测试序列代表帧的处理结果。为了更好地对比实验结果,图6中,对红外小弱目标区域用红色方框标记并进行放大显示,对关键背景杂波区域用蓝色方框标记并进行放大显示。
由图6可见:max-median算法的检测效果最不理想,红外小弱目标非常微弱,与残留背景杂波难以区分;max-mean算法、top-hat算法、IPI算法能显著增强红外小弱目标,但背景杂波强度较大且分布广泛;MGDWIE算法能抑制大部分背景杂波并增强红外小弱目标,但对于对比度强烈的云层边缘和复杂背景部分,仍会产生大量杂波。相较于上述算法,本文算法的红外小弱目标得到有效增强,背景杂波的强度和分布范围明显小于其他算法。top-hat算法、MGDWIE算法和本文算法相较于max-mean算法和max-median算法具有较大的性能优势,但从放大后的局部细节图可见,本文算法无论在残留背景杂波的分布范围还是残留杂波的干扰强度,均优于top-hat算法和MGDWIE算法。
1) 与max-mean算法、max-median算法、top-hat算法、IPI算法及MGDWIE算法相比:本文算法处理含有复杂背景和强杂波干扰的红外图像测试序列的SNR增益高出至少0.13,可以有效增强红外小弱目标;平均残留背景绝对值低出至少0.51,受到复杂背景和强杂波的干扰程度更低。
2) 对于不同红外小弱目标尺寸分组和不同红外小弱目标个数分组,本文算法检测率高出至少7.96%和6.23%,说明本文算法在不同红外小弱目标尺寸和个数条件下均能达到良好的检测效果。
3) 本文算法的ROC曲线大部分比对比算法上升更快,在相同检测率下虚警率更低。
综上所述可知,本文算法具有良好的红外小弱目标检测准确性和鲁棒性,能在复杂背景和强杂波干扰下保持较低的虚警率。