陆 源,宋 杰,熊 伟
(海军航空大学信息融合研究所,山东烟台 264001)
随着现代战场的电磁环境日益复杂,传统的有源雷达由于其主动发射电磁波,往往容易被敌方发现,致使人们开始研究非合作双基地雷达。非合作双基地雷达是以非合作雷达为辐射源,基于双基地雷达工作方式,开展目标探测的无源探测系统[1-3]。然而,非合作双基地雷达由于辐射源的不确定性以及双基地几何模型的限制,其在探测的过程中面临许多问题:例如同步过程中直达波参数估计时会产生误差,接收通道会受其几何模型的影响而存在较强的直达波和多径干扰[4]。这些因素共同作用会导致目标信噪比低,探测过程中量测不连续,帧与帧之间的目标探测不稳定。
为了提高系统在低信噪比条件下的检测性能,最简单的办法就是降低检测门限,然而一味降低检测门限就会导致杂波的进入,产生大量的虚警。为了实现目标的可靠检测和稳定跟踪,传统的先检测后跟踪(Detect-Before-Track,DBT)方法变得难以胜任,因此人们提出了检测前跟踪(Track-Before-Detect,TBD)方法。该方法与传统DBT方法不同,TBD 方法避免门限检测从而保留目标原始量测,并通过集合多帧的方法增强了信噪比,在宣布检测结果的同时估计出目标航迹[5-6]。近些年以来,已提出了许多关于有源[7]和无源[8]的TBD 方法。然而传统的TBD 方法由于运算量较大,难以在实时性较高的系统中实现[9]。为了减少TBD 方法的计算量,Grossi 提出了一种两阶段的TBD 方法[10],可直接在检测后的数据上进行,无需对整个状态空间进行离散化处理,因此在实际系统中应用更广泛。但是,制约上述TBD 方法跟踪性能的关键因素包括值函数的选择和目标运动模型的先验知识[11],值函数体现了目标和杂波在信号、相关性、运动特性等方面的差异,而目标运动模型的先验知识在一定程度上决定了跟踪效果的好坏。
综上,针对非合作双基地雷达在实际目标探测的过程中面临量测断续以及帧与帧之间探测不稳定等问题,如何利用TBD 的方法实现目标的检测与跟踪,同时保证一定的实时性和泛化能力具有一定的研究意义。随着如今视觉跟踪获得高度关注,核相关滤波以其效率高、速度快、识别能力强等诸多优点被广泛应用于计算机视觉跟踪[12]。因此,本文利用DP-TBD 值函数累积的思想,并结合核相关滤波器的跟踪原理,提出了非合作双基地雷达弱目标KCF-TBD 方法。本文所提方法可以在不依赖运动模型的基础上实现对多个弱目标的检测与跟踪,并针对非合作双基地雷达在实际扫描过程中,帧与帧之间探测不稳定,KCF 跟踪框易漂移、丢失等问题,利用峰值旁瓣比(PSR)作为跟踪过程稳定性的监测指标和值函数,使用深度学习修正跟踪框的位置,提高了整个跟踪过程的稳定性。
图1是非合作双基地雷达的几何关系,Tx为非合作雷达辐射源发射站,Rx为接收站,Tg为目标,Tx与Rx间距为基线距离L,θt和θr分别为发射站与接收站的目标方位角,Rt和Rr分别为目标到发射站与接收站的距离。双基地距离差Rd=Rt+Rr-L。
图1 非合作双基地雷达几何关系示意图
通常情况下目标与接收机一般不被发射机天线主瓣同时覆盖,直达波往往来自辐射源的旁瓣辐射,因此参考接收机对来自非合作辐射源的直达波的侦收大多数情况下为旁瓣侦收。雷达天线的旁瓣电平一般比主瓣的峰值低20~50 dB[13]。而目标散射回波与直达波相比,由于经过了一次反射,能量再次得到衰减,直达波与目标散射回波的功率相差十分悬殊。为了更加量化非合作双基地雷达的探测性能,双基地雷达距离方程尤为重要,其表达式为
式中:RtRr为非合作双基地距离积;Pt为外辐射源发射功率;Tc为单次累积时间;Gt,Gr分别为发射天线和接收机天线功率增益;σ为目标双基地RCS;Ft,Fr为发射、接收天线方向图的传播因子;k为玻耳兹曼常数;Lt,Lr分别为发射损耗和接收端的损耗;Ts为接收机系统噪声温度;Bn为带宽;SNRmin为接收最小可检测信噪比。非合作辐射源到目标的功率密度Ps如下式所示[14]:
将式(2)代入式(1),非合作双基地雷达的距离方程可以进一步推导为
本文外场实验所用的非合作双基地雷达参数如表1所示。
表1 非合作双基地雷达参数设置
为了方便计算,将发射、接收天线方向图的传播因子Lt,Lr统一记为系统损耗L;发射端和接收端的损耗Ft,Fr设定为1;单次累积时间Tc设定为1 s;非合作辐射源到目标的距离Rt为10 km,将表1 中的数据代入式(3)中,当目标距接收站的位置Rr为7.04 km 时,信噪比SNR为5 dB,目标信号较弱,并且会随着目标与接收站之间距离的不断增大而减小,例如当Rr为10 km 时,信噪比SNR将下降到1.95 dB。所以,对于弱目标的检测,如果设置较高的门限将产生漏检,如果设置较低的门限将产生大量的虚警。
如今,计算机视觉目标跟踪创新性地将传统分类学习方法应用于计算机视觉,把跟踪过程看作一个在线学习的问题[15]。KCF 作为采用这种思想的代表性算法,于2014 年由Henriques 和Caseiro提出,并应用了近十年。KCF 的本质是一种判别式跟踪,主要是使用给出的样本去训练一个判别分类器,判断跟踪到的是目标还是周围的背景信息。利用循环矩阵对样本进行采集,使用FFT 对算法进行加速计算。其实质就是求解岭回归问题,假设目标函数是f(xi)=ωTxi,ω是映射关系中的权重系数,xi是样本,yi是样本xi对应的输出值,加入正则项ν来防止过拟合,学习的目标函数为
为了进一步提升学习性能,xi和yi之间的关系可以用映射函数φ(xi)映射到更高维空间:
将式(5)代入式(4)中计算,优化的变量由ω变成了α。因此,对α求导后,岭回归问题的解可以由文献[16]给出:
K为核空间的核矩阵,I为n*n的单位矩阵,α=[α1,α2,…,αn]T,y=[y1,y2,…,yn]T。由于K是循环矩阵,利用循环矩阵对角化的性质可得
通过式(7)学习到第一帧的权重α,那么第k帧的响应矩阵yk如下所示:
式中F和F-1分别表示傅里叶变换及其逆变换。将式(7)代入式(8)可以得到
通过上式可以看出第k帧的响应是由和共同作用的,它们分别是各自在频域上的自相关和互相关,这一点和核相关滤波器的“相关”概念相符合。
传统动态规划检测前跟踪的核心思想就是在离散的空间中按照目标运动的先验模型搜索所有可能的航迹,并估计出最佳的目标航迹。这里引入λ作为值函数,目的就是在所有可能的目标航迹组合中找到能够使值函数λ达到最大值的目标航迹序列X1:K=(x1,…,xK),其中K表示整个航迹序列的扫描帧数,xK表示第K帧的目标状态。所以值函数λ的选择会对算法的结果产生重要的影响,一般值函数的选择要能够体现目标和杂波在信号、相关性、运动特性等的差异。在选定合适的值函数后,目标航迹序列可表示为
设定一个阈值γ,当某一个状态序列累积的值函数大于阈值的时候就宣布检测到航迹,并进行航迹回溯。
因此,对于KCF-TBD,同理可以提出KCF 跟踪器生成值函数累积最大轨迹的命题。假设是KCF 跟踪器在K帧中的状态序列,那么这个状态序列的累积和就是所有物理可行路径中累积的最大值。
对于每一个KCF 跟踪器,它在跟踪框所有可能的扩展单元中进行搜索,得到响应矩阵yK。跟踪器最终会选择响应最大的矩阵进行下一帧的训练和再检测,在这个过程中每一次跟踪器都会以最大响应作为目标跟踪的结果。传统的DP-TBD用整条路径值函数累积的最大值来代表航迹,而KCF-TBD 用帧与帧之间响应最大值(值函数),代替了原先值函数的累积。从不等式的角度考虑,可得下式:
假设将响应矩阵yK取到最大值时记为,为了更加量化帧与帧之间的最大相应,引入峰值旁瓣比(PSR)[17]作为评价指标,其表达式如下所示:
式中gmax是中的最大值,在最大值周围选择一个矩形区域作为目标的峰值窗口,跟踪框以内、峰值窗口以外被称为旁瓣窗口,us和σs分别是旁瓣窗口的平均值和标准差。由于KCF 在实际应用中面临的最主要问题是跟踪框的漂移和丢失,产生这种问题的原因来源于两个方面:一是跟踪框的大小本身就是设计好的,在跟踪过程中并不会发生变化,而实际的目标可能大小会发生变化,这样就会导致滤波器模板的更新不匹配;二是跟踪过程中遇到遮挡干扰等情况。因此,PSR不仅可以作为航迹累积的值函数,还可以隐含地反映跟踪模板发生的变化,从而检验目标跟踪的稳定性。这也就意味着KCF 跟踪器检测到目标时的PSR 可以作为值函数:
这也就证明了利用PSR 作为值函数的KCF 算法本质上就是一种最佳航迹搜索的决策方法。
通过以上两小节的推导,本文所提的非合作双基地雷达KCF-TBD整体框架如图2所示。
图2 KCF-TBD框架
首先,对输入的前两帧雷达原始数据进行低阈值的CFAR 检测,分别形成第一跟踪框集合和第二跟踪框集合。由于传统的DP-TBD 在目标数量较多的情况下会面临数据处理压力较大的问题,这里借用两阶段TBD 思想筛选出潜在的目标,减少运算量。然后,将两个跟踪框的集合进行IOU[18]判决,筛选出新的跟踪框集合。进行IOU 判决的目的是筛选出潜在的运动目标,进一步减少跟踪框集合的数量并同时生成相应的跟踪模板。接着,后续的每一帧雷达数据依次输入,并经过PSR判决。判决时,将当前帧的PSR 值和前三帧的均值进行比较,当浮动范围超过一定值时判决不通过。最后,判决不通过的跟踪框将由预测修正模块给出的新跟踪框替代,而后训练生成新的跟踪器模板重新跟踪。反之,通过PSR 判决的多个跟踪框将形成相应的航迹。
其中预测修正模块是为了解决跟踪过程中面临的跟踪框漂移和丢失问题。Shin 提出使用多个搜索窗口进行重新跟踪并通过运动的矢量分析来确定一个首选的搜索窗口[19]。Shi 提出利用卡尔曼滤波来提升KCF 的跟踪稳定性[20]。这些方法对KCF 长期跟踪的稳定性有一定的提升,但是大多都是基于模型的预测,当实际的目标运动状态和模型并不适配的时候跟踪预测效果就会时好时坏。随着深度学习在越来越多的领域被使用,特别是针对时间序列预测问题,相关学者提出了长短期记忆网络(Long Short-Term Memory, LSTM)。由于LSTM 网络本身较为成熟,所以本文直接在其输出接上一层典型的MLP 结构对目标的位置进行预测。网络结构如图3所示,训练时选择均方误差(MSE)作为误差函数,自适应矩估计(Adam)作为优化器。其中网络的输入特征分别为连续s帧距离-方位平面跟踪框的位置,输出节点为网络模型预测后s+ 1帧跟踪框的位置。
图3 模型网络结构图
本文采用的数据是非合作双基地雷达对海目标探测系统实际外场实验得到的真实数据,实验场景在烟台附近海域,其示意图如图4所示。其中选用的非合作雷达辐射源为L波段岸基对海雷达,实验的探测目标是进出港口的船只,探测的主要区域由接收站定向天线所指的方向决定。
图4 实验场景
由于本文实验在实际采集过程中获取连续的多帧数据成本较高、数据量较大,所以预测模型中采用的训练航迹数据在非合作双基地对海探测系统可以探测到的范围内进行生成,具体参数设置如表2所示。由于本系统探测的海域是近岸港口,目标船只的机动性通常较弱,所以利用均匀分布随机生成CA 和CT 两种模型共计1 000 条航迹构成数据集。
表2 数据集参数设置
实际非合作双基地对海探测系统所得的矩阵是在距离-方位平面,目标在平面中由起伏的像素点构成,每一帧雷达图像都是由1 051×800 个像素单元组成,其中800 是距离分辨单元(每个单元25 m),1 051是方位分辨单元(每个单元0.087 5°)。
网络模型的参数设置如表3所示。
表3 网络训练参数
当网络以上述参数训练,输入序列长度s设置为7 时,MSE 经过3 500 轮的训练,下降到0.249 1。假设整条航迹由n个点组成,即[T1,T2,…,Tn],跟踪稳定性检测模块检测到KCF 跟踪框在第j个点发生了偏移,这时预测网络将前s个点作为网络的输入序列,即通过[Tj-s,Tj-s+1,…,Tj-1]预测第Tj个点。因此,输入序列的长度s对预测的结果有一定的影响,在神经网络参数不变的情况下通过改变输入序列长度s来探究其对预测误差的影响。图5是序列长度取4~12时,训练MSE误差变化曲线。
图5 序列长度s误差变化曲线
从图5可以看出,训练MSE误差随序列长度的增加而不断减少,这是因为序列长度越长其轨迹所包含的历史信息就越为丰富,网络预测的结果也会相对准确。输入序列的长度在4~7时,MSE随序列长度增加下降较快,在7~9 和10~13 时趋于平缓,并在9~10 时有明显的下降。KCF 跟踪器在初始阶段,误差累积较少,跟踪较为稳定,而实测的40 帧数据也表明,跟踪框出现丢失或偏移通常在10~35 帧之间。选择较短的序列长度虽然可以避免短时间间隔内的跟踪框的连续丢失,但是其MSE 误差较大。选择较长的序列长度虽然MSE 误差较低,但是期间可能发生两次跟踪框丢失间隔小于序列长度的情况,并且序列长度在10~13之间的MSE 误差上下趋于平缓。因此,选择序列长度为6 时能够满足尽可能小的跟踪误差和跟踪框间隔两个条件。
非合作双基地雷达系统中由于时间、空间同步等问题,造成方位、距离上的误差,从而引起目标位置的漂移。PSR 不仅可以作为判别跟踪稳定性的指标,还等效为KCF-TBD 的值函数。图6 是第32 帧的跟踪结果图,图中弱目标的跟踪框在长时间跟踪的过程中发生了偏移,其中未标注上跟踪框的目标被判定为静止目标。
图6 第32帧的距离-方位图
图7 是弱目标修正前后PSR 随帧数变化的曲线,其中蓝色线表示经过修正预测前的曲线,红色表示经过修正预测后的曲线。修正前,PSR 在第23 帧之前在一个值附近上下波动,当目标受到干扰或目标回波数据变弱后出现了明显的下滑。虽然下滑之后PSR 在1.07 附近趋于稳定,但实际上跟踪框已发生偏移,而KCF 跟踪器在错误的模板上进行更新迭代,因此PSR 再次趋于稳定。修正模块在PSR 低于第一个临界点时启动,实际实验中弱目标在第25 帧出现跟踪框丢失,当预测模块修正后,PSR有明显的上升。
图7 弱目标修正前后PSR对比图
通过上面的分析可以看出选择PSR 作为值函数与传统的幅度值函数相比隐含地反映了跟踪模板之间的变化,通过帧与帧之间的最大响应进行航迹回溯。值得注意的是,预测修正模块也同样发挥了重要的作用,它通过对目标运动轨迹的预测修正来消除跟踪中出现的漂移和丢失问题。预测修正模块与PSR 值函数的配合作用,进一步提高了目标跟踪的稳定性和准确性。
为了探究KCF-TBD 的实际跟踪效果,考虑采用一组使用非合作双基地雷达采集到的雷达实测数据。该数据采集于烟台港附近海域,记录时间自2022-06-18T15:22:27共计40帧雷达数据。实验采用DP-TBD作为对照组,仿真选用雷达距离-方位平面的振幅作为值函数,离散化状态空间后选定目标状态的转移状态数q=16。图8 为选取的两个单目标分别采用DP-TBD和KCF-TBD的跟踪结果。
图8 DP-TBD和KCF-TBD的对比跟踪结果
其中黑色表示实际AIS 航迹,红色表示DPTBD 跟踪结果,绿色表示KCF-TBD 跟踪结果。从图8 可以看出,DP-TBD 在实际跟踪过程中受杂波影响,值函数在满足先验运动模型的条件下依然会朝着错误方向进行累积,从而产生较大误差。而KCF-TBD 在受杂波干扰时依然有较好的稳定性,总体偏差较小。
为了更加量化地来评定KCF-TBD 和传统DPTBD 的差别,用RMSE 作为误差的量化指标。RMSE 代表的是预测值和真实值之间的平均距离,在本次实验中采用AIS数据作为真实值。
式中n为目标总数和xi分别为x方向的预测值和真实值和yi分别为y方向的预测值和真实值,误差单位为像素。
图9 是实测数据场景中多个目标平均RMSE随帧数变化的曲线,设定RMSE的最大误差像素为12。DP-TBD 从第10 帧开始丢失目标,在第31 帧又恢复了跟踪,但在第37帧又丢失了目标,整个跟踪过程的最小误差也在10 个像素以上。而KCFTBD 在整个跟踪阶段都有更好的RMSE。图10 显示的是估计位置和真实位置在误差阈值RMSE 内的帧数占总帧数的百分比。当设置RMSE 的阈值为12像素的时候KCF-TBD在所有帧中都成功跟踪了目标,而传统的DP-TBD 跟踪准确率低于60%。在运行时间上DP-TBD 处理40 帧需要21.22 s,而KCF-TBD 只需要14.23 s,处理速度提升了33%。综合来说,KCF-TBD 利用循环矩阵对角化的性质快速提取特征,相较于DP-TBD,能够显著提高计算速度。这使得KCF-TBD 在需实时跟踪多个目标的场景下能够更好地适应。其次,PSR作为值函数反映了帧与帧之间的最大响应和跟踪的稳定性,当其和修正预测模块结合时,相比于DP-TBD 能够实现更加稳定和准确的跟踪。图11是非合作双基地对海目标探测场景下,采用本文方法时的跟踪轨迹。
图9 多目标RMSE变化曲线
图10 定位精度随RMSE临界值变化曲线
图11 多目标跟踪预测KCF-TBD结果
针对非合作双基地雷达目标信噪比较低、帧与帧之间探测不完全等问题,传统先检测后跟踪方法难以实现目标的稳定跟踪。因此,本文利用DP-TBD 路径搜索和值函数累积的思想,结合计算机视觉中的KCF,将峰值旁瓣比(PSR)作为累积的值函数和跟踪稳定性的判别标准,并用深度学习的方法对跟踪过程产生的漂移和丢失进行修正。本文所提方法和DP-TBD 相比,具有更快的计算速度和更小的跟踪误差。其中,PSR作为值函数等效于KCF 帧与帧之间响应的最大值,侧面反映了目标的结构特性,有效避免DP-TBD 容易受杂波影响,产生错误累积的问题;同时KCF 利用循环矩阵进行搜索可以减少对先验运动模型的依赖,使跟踪的适应性更强。