基于低秩和重加权稀疏表示的红外弱小目标检测算法

2023-12-08 13:09杨亚东黄胜一谭毅华
应用科学学报 2023年5期
关键词:弱小张量范数

杨亚东,黄胜一,谭毅华

华中科技大学人工智能与自动化学院,湖北武汉430074

红外弱小目标的检测是许多实际应用中的重要技术之一,包括精准制导、天基监视系统、敏感目标跟踪等,具有极高的安全应用价值。在通常情况下,目标在图像中的尺寸较小,占比小于整个图像的0.12%[1]。红外弱小目标辐射的能量较弱,往往会淹没在复杂的背景中。并且由于超远的成像距离,目标将缺失纹理信息。反映在红外图像上,红外弱小目标呈现为无明显轮廓的斑点,且其信杂比(signal to clutter ratio,SCR)较低。随着红外探测传感器的发展,红外弱小目标的检测也越来越重要。各国学者也在此领域提出许多经典的检测算法,目前的单帧检测算法可以大致分为基于背景一致性、目标显著性和数学优化方法3 个类别。

第1 类方法基于背景过渡缓慢,局部背景相似度高的假设。因此该类方法致力于平缓的背景杂波的抑制,间接实现目标增强。常见的算法有Tophat[2]、Max-Mean[3]、Max-Median[3]等,这类算法通过设计滤波器的滤波核来抑制背景杂波。缺点是固定的滤波器模板不能适应复杂的情况,只在背景简单时效果较好,从而导致检测结果中往往存在大量残留背景,导致很高的虚警率。

第2 类方法基于目标的显著性,该假设受启发于人眼的视觉系统。人眼往往关注于显著的目标,而待检测的弱小目标也往往是红外图像中平缓背景上的突兀点。因此,一些学者将人眼系统中的对比度机制、自适应尺度等机制引入检测算法中,LoG (Laplacian of Gaussian)[4]、LCM (local contrast method)[5]等是经典的显著性算法。近些年一些学者提出了更为复杂精细的度量方法,例如导数差异度量[6]、双层局部对比度度量[7]、时空局部差异度量[8],此类算法要求目标具备一定的显著性。然而真实场景很复杂,一旦存在高辐射干扰源时,此类算法将表现不佳。

第3 类方法基于数学优化方法,从数学中数据特性出发,对红外背景提出低秩性假设,红外弱小目标提出稀疏性假设,而后建立约束条件与优化方程并迭代求解,以实现背景和目标分离。随着稀疏表示和低秩矩阵恢复等理论的发展,优化方法成为该领域热点。文献[9]提出基于红外块图像模型(infrared patch-image,IPI)的红外弱小目标检测算法,算法首先将单帧图像分块重新排列元素,重新排列后的图像叫做红外块图像。然后将红外小目标检测算法转为一个矩阵的分解问题,即将原始矩阵拆解为一个稀疏矩阵和一个低秩矩阵,分别代表检测结果和背景矩阵。文献[10] 提出了一种加权的红外块模型,将红外图像的先验信息引入到优化方程中。文献[11] 在此基础上做了高维扩展,提出了红外块张量模型(infrared patch-tensor,IPT)。文献[12] 提出使用部分核范数的和来表达张量低秩性,减少了检测结果中的背景干扰。文献[13] 针对不同低秩分量重要性不同、局部先验知识不足的问题,提出了一种基于低秩张量补全和Tophat 正则化的红外目标检测方法。借用传统Tophat 变化的思想,作为一个正则化项引入低秩稀疏优化方程中,以充分利用目标的局部结构信息和提升抗噪声能力。文献[14] 提出了一种新的自正则化加权稀疏模型,利用能够检测出背景边缘信息的重叠边缘信息(overlapping edge information,OEI)特征图对稀疏项进行约束,提高检测精度。文献[15] 为了提高高度异构场景下的目标检测性能,提出了一种基于多个子空间学习和时空分块张量的红外弱小目标检测方法,并提出了一种基于张量奇异值分解(tensor singular value decomposition,tSVD)因子分解和交替方向乘子法(alternating direction method of multipliers,ADMM)的优化框架,以准确高效地恢复目标分量。文献[16] 提出了一个基于张量分解的检测框架,该框架将空间结构知识与张量分解结合起来。文献[17] 在张量的角度上继续进行探索,提出使用一种全新的范数来近似张量的秩,并添加了约束噪声的正则项。这类基于数学优化求解的方法相对于上述两种方法,在鲁棒性和检测精度上有了大幅提升。

基于低秩稀疏表示的优化方法是当前研究的热点之一,该类方法属于第3 类方法。检测精度相对于传统滤波算法有了明显提升,但是代价是牺牲了速度。IPI 模型是该类方法的一个基线方法,该模型的核心是利用鲁棒主成分分析(robust principal component analysis,RPCA)的目标函数min rank(B)+‖T‖0来描述该问题,然而该目标函数是一个NP-hard 问题。因此在求解时利用了矩阵的核范数来近似表示矩阵的秩,用L1范数近似表示L0范数以进行近似求解。这种简单的近似会带来检测误差,最明显的是背景中的强边缘往往会出现在稀疏分量中,造成较多的虚警。

因此为解决上述问题,本文以该基线方法为基础,重新分析与设计优化方程。使用γ范数描述背景矩阵的低秩性,L2,1范数描述噪声矩阵的分布,利用结构张量提取红外图像的局部先验信息权重,同时融合目标矩阵的自增强稀疏权重,使用加权L1范数来描述目标矩阵的稀疏性,使模型能够更好地抑制背景提取目标。

1 经典低秩稀疏表示的红外弱小目标检测框架

在红外弱小目标检测问题中,一般将图像视为3 个组成成分:背景、噪声和目标。其中背景占图像的绝大部分,且背景图像灰度变化平缓,在空间上具备局部相似性;噪声可能来自于探测器的随机噪声,镜头坏点等,其在空间中是随机分布,且帧间没有相关性;目标通常呈现弱小的亮斑或者亮点状,缺乏纹理特性,占比通常小于整幅图像的0.12%,且有时会淹没在复杂背景中。因此背景的缓变性可以对应于数学上的矩阵低秩性,目标的突兀点特性可以对应于矩阵的稀疏性。于是通过低秩稀疏进行红外弱小目标检测的思想可以转化为矩阵的鲁棒主成分分析(RPCA)问题。如图1 所示,图(a) 可视为图(b) 和(c) 的叠加。在RPCA 中一个数据矩阵D看作是由一个低秩分量B和一个稀疏分量T的叠加组成,公式为

图1 RPCA 问题示意图Figure 1 RPCA problem diagram

式中:D为原始的数据矩阵即红外图像,B为低秩分量即背景矩阵,T为稀疏分量即目标矩阵。优化方程为

式中:λ为权重因子,rank(·) 为矩阵的秩,‖·‖0为L0范数。

一般的检测流程是将单帧红外图像通过一定预处理后输入到算法中,进行低秩稀疏矩阵分解,然后将所得的目标矩阵进行阈值分割即可得到最终的检测结果。基于低秩稀疏表示的红外弱小目标检测算法一般都是基于式(2) 进行改进优化的。经典的IPI 模型就是在RPCA算法基础上增添了噪声模型,取得了不错的效果。但是也存在一些问题,IPI 方程求解时的近似方式会带来较大的检测误差,尤其是在处理带有强边缘红外图像时会造成较多的虚警。因此,本文将在此基础上,改进近似求解方法以及增添先验权重来提升检测效果,提高求解效率。

2 算法设计

2.1 经典IPI 模型的原理

IPI 模型[9]通过将单帧图像重新排列为红外块图像作为输入图像,从而进行低秩稀疏优化分解。其核心思想是将红外块图像Dp分解为块背景矩阵Bp、块目标矩阵Tp、块噪声矩阵Np,用公式表示为

通过RPCA 的思想,将rank(Bp) 用矩阵Bp的核范数来近似,将‖Tp‖0由矩阵的L1范数来近似。同时假设噪声分量独立同分布,且存在某个δ >0,使得‖Np‖F≤δ,即‖Dp-Bp-Tp‖F≤δ。于是IPI 的优化方程写为

式中:‖·‖*为核范数,‖·‖1为L1范数,‖·‖F为Frobenius 范数。

2.2 基于低秩和重加权稀疏表示的红外弱小目标检测算法

2.2.1 低秩表示

IPI 模型导致部分边缘背景的残留,其原因是由于该模型直接用核范数近似替代矩阵秩,鉴于此本文使用一种比核范数更加严密的近似。文献[18] 中使用了γ范数来逼近矩阵的秩,矩阵B的γ范数定义为

式中:σi(B) 是矩阵B的奇异值,使用数学中的极限可推出rank(B)。当γ趋于0 时,该范数等于矩阵B的秩;当γ趋于无穷时,该范数等于矩阵核范数。γ范数是一种介于矩阵的秩和核范数之间的范数,能够比核范数更好地描述背景矩阵的低秩性。直接使用矩阵的秩会导致方程不可解,因此本文选用γ范数来近似替换矩阵的秩。

2.2.2 融合先验和自增强的稀疏表示

在IPI 的检测结果中存在边缘虚警的问题,可以通过修改方程中的稀疏项来解决。利用结构张量[19]提取图像中的先验信息,得到权重wE,并提取红外块目标矩阵的自增强稀疏权重wT,将两个权重以加权形式放入L1范数中。接下来介绍具体的计算方式。

局部先验权重wE是通过结构张量获得的。结构张量广泛地应用于特征挖掘、图像检测等数字图像处理领域,具体的计算过程可参看文献[19]。结构张量会为每个像素位置计算出两个特征描述子λ1和λ2,这两个特征描述子具备以下物理意义:当λ2≈λ1≈0 时,说明该像素点各方向灰度梯度值都很小,其属于图像中的平坦缓变区域;当λ2≫λ1≈0 时,说明该像素点有灰度梯度值差异很大的两个正交方向,其属于图像中的边缘轮廓区域;当λ2≫λ1≫0时,说明该像素点有灰度梯度绝对值都很大的两个正交方向,其属于图像中的离散角点区域。并且结构张量的运算速度很快,可通过结构张量来快速获得图像的先验信息,提取其中的角点位置,抑制平坦区域和边缘区域。根据两个特征描述子λ1、λ2的物理含义,本文设计了先验权重,公式为

式中:(x,y) 为像素位置,min(wet(x,y)) 为wp(x,y) 的最小值,max(wet(x,y)) 为wp(x,y) 的最大值。

文献[20] 提出自增强稀疏权重,通过加权的L1范数来描述目标的稀疏性,目的同样是缓解图像中存在强边缘或噪声时L1范数的约束能力下降的问题,公式为

式中:‖·‖w,1为融合权重的L1范数;wij为权重矩阵w在位置(i,j) 处的值;C为一个常数,通常可置为1;εT >0 表示一个很小的数,为了防止|Tij| 为0 的情况,通常可置为0.001;wT为稀疏矩阵T的加权矩阵;⊙代表Hadamard 积。

通过对局部先验权重wE和自增强稀疏权重wT的介绍,描述红外块目标矩阵Tp的稀疏性可以表示为

2.2.3 噪声表示

图像中的随机噪声容易被误分至稀疏分量中,造成大量虚警。这些噪声一般由相机成像造成,文献[21] 提出使用L2,1范数来描述噪声,以区分点目标的L1范数,公式为

2.2.4 本文算法模型与优化求解

基于上述分析与改进策略,本文采用矩阵的γ范数替代核范数,以近似描述背景矩阵的秩;融合局部先验权重和自增强稀疏权重以通过加权的L1范数来描述目标矩阵的稀疏性;用L2,1范数描述噪声矩阵,最后构建优化方程,公式为

式中:‖Bp‖γ为红外块背景矩阵Bp的γ范数,将其最小化可以近似最小化矩阵的秩;‖wE ⊙wT ⊙Tp‖1为红外块目标矩阵Tp的加权L1范数,其中wE和wT分别表示图像的局部先验权重和自增强稀疏权重,融合两个权重来约束稀疏矩阵,同时抑制背景中的强边缘;‖Np‖2,1为红外块噪声矩阵Np的L2,1范数,该项用来描述噪声部分;⊙表示Hadamard 乘积;λ,β均表示权衡因子。

式(11) 中的数学模型可通过基于交替方向乘子法[22]的优化算法进行求解。具体过程为将原问题拆分为多个简单子问题,然后依次得到各子问题的解析解,最后当满足收敛条件时,协调多个子问题的解,得到原问题近似最优解。引入拉格朗日乘子Y和惩罚项,表示为

式中:〈·〉 表示矩阵的内积,μ为惩罚因子且μ >0。

模型的求解过程如下,分别固定每个元素进行优化,直到满足收敛条件迭代停止。整个算法的流程如图2 所示。

图2 本文算法流程图Figure 2 Flowchart of the proposed algorithm

算法1基于低秩和重加权稀疏表示的红外弱小目标检测算法

3 实验对比分析

为了验证本文算法的鲁棒性和有效性,在Intel Core i7-8700 处理器、32 GB 内存硬件环境下进行了数据测试,并与其他经典的检测算法进行比较。

3.1 实验数据

为了验证本文提出的检测算法的鲁棒性,在8 个复杂场景序列中进行测试,如图3 所示。测试场景包括天空厚云、地面、晴朗天空、卫星视角下的云层、沙漠等,场景中的红外弱小目标用红色框标记。

图3 8 种不同的红外场景Figure 3 Eight diffierent infrared scenes

各场景的详细描述如表1 所示。

表1 红外序列场景详情Table 1 Infrared sequence scene details

3.2 评价指标

背景抑制因子(background suppression factor,BSF)用于描述算法对局部邻域背景的抑制程度,公式为

式中:FBS为背景抑制因子,Cin和Cout分别代表原始红外图像和算法检测结果图中目标邻域背景的灰度标准差。邻域的范围常设置为以目标为中心,上下左右各为20 像素。

信杂比增益(signal to clutter ratio gain,SCRG)常用来描述算法处理前后目标的增强程度,其公式为

式中:GSCR为信杂比增益,RSC为信杂比,μt为目标的平均灰度值,μb为目标邻域的平均灰度,σb为目标邻域的标准差,下标out 和in 分别代表输入图像与输出图像。当标准差为0时,我们将标准差设置为0.01 以避免出现SCRG 为无穷的情况。

受试者工作特征曲线(receiver operating characteristic curve,ROC)用来综合评估算法的检测性能,它能够反映出各个算法在相同虚警率条件下达到的检测率。ROC 曲线的横坐标为虚警率(Fa),纵坐标为检测率(Pd),公式为

式中:n1为正确检测出的目标像素数,n2为序列中真实的目标像素数,n3为虚警的像素数,n4为检测的目标像素数,Fa 中的虚警是指算法检测结果中的非目标背景区域。ROC 曲线通过动态调节判定阈值,得到不同阈值下的检测率和虚警率,从而绘制得到。

3.3 实验结果分析

图4 是本文算法对8 种不同的红外场景检测结果,可以看出对序列图像中的红外弱小目标实现了有效的分离,避免了背景中的杂波干扰和噪声干扰。

图4 本文算法的检测结果Figure 4 Detection results of the proposed algorithm

图5 8 个场景下不同算法的ROC 曲线Figure 5 ROC curves of diffierent algorithms in 8 sequences

为了定量地比较各种检测算法的效果,选取了7 个红外弱小目标检测算法进行对比实验,包括:IPI[9]、MAXMEDIAN[3]、NIPPS[23]、RIPT[11]、TOPHAT[2]、NRAM[21]、NTFRA[17],计算并统计各算法的SCRG 和BSF。结果如表2 所示,黑色加粗字体表示这一行的最大值。

表2 所有检测算法在不同序列中的BSF 和SCRG 值Table 2 BSF and SCRG values of all detection algorithms in diffierent sequences

表3 所有算法在不同序列中的单帧平均运行时间Table 3 Average running time of all algorithms in a single frame in diffierent sequences s

从表2 可知MAXMEDIAN、TOPHAT 算法能够较好地增强目标,但是背景抑制能力较差,原因是此类方法均为基于滤波器的算法,固定的滤波核不能适应各种复杂场景,因此导致残留了大量的背景虚警。IPI、NIPPS、RIPT、NTFRA、NRAM 这些基于数学优化方法的算法在背景抑制和目标增强上均有不错表现,NIPPS 在场景6 和场景7 中的SCRG 略高于本文算法,但是整体表现不如本文所提出的算法,不具备普适性。NRAM 在场景3 中的BSF 稍高于本文算法,但其他序列均低于本文算法。结合两种评价指标,可以看出本文提出的模型在所有序列上的平均表现最好,对背景的抑制能力和对目标的增强能力较为平衡。

为了进一步验证算法的综合性能,引入ROC 曲线对算法进行评估。从8 个数据集的结果可以看出,MAXMEDIAN、TOPHAT 这两个算法表现不稳定,在相对容易检测的数据集1和3 有不错的表现,但是在其他复杂场景下表现极差。IPI、NIPPS、RIPT、NRAM、NTFRA相较前述算法表现较优,但是在部分序列中表现很差,鲁棒性较差。而本文提出的检测算法在8 个序列中几乎均表现出最优的效果。

算法的速度也是红外小目标检测中的一个重要指标。我们测试了各算法在8 个序列上的时间,得到平均单帧处理时间,其中黑色加粗是本文算法,黑色加粗加下划线是最优算法。传统滤波算法MAXMEDIAN、TOPHAT 算法的速度较快,正如前文介绍,这是该类算法的最大优势。基于数学优化的算法如IPI、NIPPS、RIPT、NRAM、NTFRA 较慢,平均单帧处理时间大于0.158 s。本文算法同样属于数学优化算法,平均单帧处理时间为0.024 s。虽然本文算法与基于滤波的传统方法相比运行速度仍较慢,但考虑到性能上的优势,这个不足是可以接受的。

4 结语

为了提升检测精度和处理速度,本文提出了一种基于低秩和重加权稀疏表示的红外弱小目标检测算法。采用γ范数替代核范数来近似描述红外块背景矩阵的秩;通过结构张量提取局部先验信息权重,同时融合的自增强稀疏权重,在L1范数上增加权重描述目标矩阵的稀疏性;利用L2,1范数来描述噪声矩阵。建立优化方程,并对方程进行优化求解,最终在目标矩阵中通过阈值分割检测候选目标。与多个基线算法对比实验说明:在信杂比增益、背景抑制比、ROC 等定量指标上都取得了较大优势。算法的速度平均为0.024 s/帧,虽然不及传统滤波算法,但对比其他优化算法仍有较大改进。从性能和时间两个方面综合考虑,本文的算法有着较好的优越性。目前本文算法还存在弱小目标检测像素丢失的问题,在后续研究中将进一步设计策略来保证目标的完整性,提高检测精度。

猜你喜欢
弱小张量范数
啊!水手,上岸吧
偶数阶张量core逆的性质和应用
四元数张量方程A*NX=B 的通解
基于加权核范数与范数的鲁棒主成分分析
矩阵酉不变范数Hölder不等式及其应用
扩散张量成像MRI 在CO中毒后迟发脑病中的应用
我有特别的喝水技巧
柴的嘲笑
一类具有准齐次核的Hilbert型奇异重积分算子的范数及应用
工程中张量概念的思考