黄馨誉, 胡士强, 郑世友
(1.上海交通大学 航空航天学院,上海 200240;2.中航雷达与电子设备研究院 射频与仿真重点实验室,江苏 无锡 214063)
计算与测试
基于PN学习的雷达目标鲁棒跟踪算法*
黄馨誉1, 胡士强1, 郑世友2
(1.上海交通大学 航空航天学院,上海 200240;2.中航雷达与电子设备研究院 射频与仿真重点实验室,江苏 无锡 214063)
传统雷达目标跟踪算法在强杂波环境下跟踪时会产生大量虚警估计的情况,单独跟踪或检测算法都不能对干扰杂波进行有效滤除。针对这个问题,在传统概率假设密度滤波器(PHD)算法的基础上,提出一种联合检测—跟踪—学习的目标鲁棒跟踪算法,即PN—PHD,引入属性检测器,将检测跟踪结果一起送入PN学习器,通过PN学习迭代更新检测器,并修正PHD算法的跟踪估计,以此实现在强杂波环境目标鲁棒跟踪的要求。仿真实验结果表明:PN—PHD滤波算法与传统跟踪算法相比,在强杂波环境下有效地提高了目标跟踪准确性和跟踪精度,同时也弥补了 PHD算法在提供目标航迹信息方面的不足。
目标跟踪; PN学习; 概率假设密度滤波器
复杂环境下的目标精确跟踪一直是目标跟踪领域研究的热点问题之一。由于气象、电磁、相似目标等干扰影响,量测集中不仅包括目标量测,还包括大量杂波信息,使得目标精确跟踪变得尤为困难。
为了减少干扰因素对跟踪精度的影响,目前经常使用的方法主要分为两类:第一类方法[1]先通过数据关联完成观测与目标间的分配,再利用滤波技术完成目标状态估计。在强杂波下该类算法会出现组合爆炸,关联很难实现。第二类是基于随机有限集的方法[2~4]将目标状态和观测表达为随机有限集合的形式,在贝叶斯框架下估计目标状态。该类算法虽然避免了数据关联,但在杂波强度增大的情况下会出现大量错估的情况。
而在视频跟踪领域中,Kalal Z提出的“跟踪—学习—检测”(tracking-learning-detection,TLD)算法[5]已实现了单视频目标长时间精确跟踪。本文正是将TLD算法的学习机制引入点目标跟踪,提出基于PN学习[6]的高斯混合概率假设密度滤波器(GM—PHD)[4]目标跟踪算法,即PN-PHD。其基本思想是:先利用独立的跟踪器和检测器分别对目标状态和属性进行估计和分类,再将估计分类结果一起输入PN学习器进行在线学习,最后将学习结果反馈到跟踪器并同时更新检测器。通过该方法可以消除传统PHD算法跟踪时所产生虚警估计问题并提供了目标航迹信息。
P-N 约束是具有以下功能的任意函数:输入是经过分类后的标记样本集L,输出是更正标记样本(Xc,k,Yc,k)。P-N约束的核心思想是目标的时空特性,即目标在同一时刻只能出现在一个地方,且目标运动在时间上具有连续性。
根据跟踪器第K时刻的目标跟踪估计结果Xk,将目标位置半径为r以内区域定义为目标候选区。再将第K时刻检测器的检测结果Lk输入学习器,将置信度高于α的量测样本为候选目标量测,置信度低于β标记为杂波量测。如果在目标候选区域内存在“正”样本,P约束首先对所有标记为“负”的量测样本进行检查,将位于目标候选区域且置信度β<μ<α的量测样本标记更正为“正”,加入检测器正训练集。N约束对所有标记为“正”的量测样本进行检查,当候选目标区域中存在高置信度量测样本时,N约束直接将候选区域外的量测样本标记更正为“负”,加入检测器负训练集;而当候选目标区域中不存在高置信度量测样本时,N约束在域外“正”标记样本中选择置信度最高的量测样本作为目标量测更新跟踪器,同时将其余“正”标记量测样本更正为“负”加入检测器负训练集。
3.1 属性信息分类
PN学习中分类器需要对目标观测进行检测,由于无法就单帧的目标状态信息对目标和杂波进行分类,故本文引入目标属性信息。雷达、ESM等传感器在对点目标扫描时所产生的属性量测可以作为目标属性特征,包括目标信噪比、反射截面积以及载频等。由于点目标跟踪存在先验数据少,单特征分类能力弱,信号漂移严重等问题,故本文中利用已有模型[7]建立雷达信噪比(SNR)和EMS载频信息的仿真数据,采用Adaboost算法对多个弱分类器进行组合,达到强分类效果。
3.2 PN-PHD算法流程
本文基于GM-PHD以Adaboost为检测器引入PN学习,具体结构框架如图1所示。
图1 PN-PHD 结构框架图Fig 1 Frame of PN-PHD
在GM-PHD滤波的更新迭代过程中,以欧氏距离为标准,设定跟踪结果半径r内为目标门,并对门内和门外的量测值做PN学习。其具体步骤如下:
1)将GM-PHD跟踪器输出的目标估计位置作为目标门中心点,将检测器分类结果划分为门内样本集和门外样本集;
2)根据P约束,检查门内是否存在高置信度样本,将漏检目标更新到正样本库;
3)根据N约束,检查门外高置信度样本是否为目标样本,将虚假检测更新到负样本库;
4)根据PN约束更新跟踪估计,并对PHD得出的错误估计进行剪枝;
5)利用更新后的正负样本集训练下一步的检测器。
由此可见,在起始目标属性信息较少的情况下,可以通过在线不断学习来完善目标属性特征记录,本文算法由于引入PN学习具有在线学习能力,即使目标出现漏检、错跟及失跟的情况,在下一时刻目标出现时,能根据检测结果及跟踪结果通过PN约束重新跟上目标。其完整流程如下:
输入:目标初始位置X0,初始属性信息训练集A0
输出:Xkx,Akx,tracker()
初始化:使用A0训练检测器detecter(),初始化跟踪器tracker();
第kx帧时处理流程:
Xkx=tracker(Xkx-1),Lkx=detecter(Zkn),
P学习过程:
If size(Xkx)≠0
for everyxi∈Xkx(i=1,2…nkn)
计算观测集Zkx与xi之间的欧氏距离;
取定小于门半径r的观测值为候选目标值,记为Zindoor观测集;
For everyzii∈Zindoor(i=1,2…nindoor)
ifZtrue={lzii>threshold|zii∈Zindoor(i=1,2,…nindoor)}
存在,即高置信度检测结果存在于候选区域内,则xi=xi,保留跟踪器结果;
else
Ztrue=0;等待转入N学习器更正目标位置;
end
end
将Z_tr={lzii>tr_thr|zii∈Zindoor(i=1,2…nindoor)},加入Akx正样本训练集
end
else
从Zkx中选择z(l>threshold)作为新的目标点xnew加入Xkx中;
如果不存在则跳过该帧,认为帧内无目标;
end
N学习过程:
将zi∉Zindoor归类为Zoutdoor
IfZtrue≠0,即门内已有真目标
将z={lzii>threshold|zii∈Zoutdoor(i=1,2…nindoor)}加入Akx负样本训练集
else
从Zoutdoor中选择z(l>threshold)作为新的目标点替换入Xkx中;
end
retraining(tracker(),Akx)
end
为简化仿真实验的条件,本文仅考虑目标在二维平面空间内的情况。假设目标的探测范围为[0,20]km×[0,20]km,目标的初始状态为[5 10 0.15 0 0 0]km,目标做几字型机动运动,目标加速度(km/s2)在第15~20 s为[- 0.03 0.03],第35~40 s为[0.03 -0.03],第55~60 s为[-0.03 -0.03],第75~80 s[0.03 0.03],其余时间做匀速运动。属性量测采用目标的信号幅度和载波频率获得。假设目标真实平均信噪比为20 dB,目标真实平均载频为100 Hz。目标检测概率为pd=0.98,λc为单位容积内杂波个数(10-6/m2)。
图2 目标运动轨迹图Fig 2 Target trajectory
下面采用三种不同的滤波算法进行对比,即最近邻卡尔曼滤波(NNK)算法,GM—PHD滤波算法以及PN—PHD滤波算法,对本文算法进行验证。采用最优次分配方法即OSPA距离[8]对不同算法的估计精度进行比较,其中阶次p=2,阶段距离c=2km。图3为不同λc(10-6/m2)下各算法的OSPA曲线图。可以看出,本文算法的跟踪精度也明显优于已有算法。
图3 不同λc下各算法OSPA距离对比图Fig 3 Comparisons of OSPA distance with different λc algorithms
从图3看出:强杂波单目标的情况下最近邻卡尔曼滤波与GM—PHD滤波算法都不能对目标进行有效跟踪,而引入PN学习对跟踪结果起到更新矫正的作用,在失跟错跟的情况下可以重新跟踪到目标,同样在虚警的情况下有效剔除了虚假目标,从而提高跟踪的准确性和精确性,且随着杂波个数的增多本文提出的算法具有很好的鲁棒性。
本文提出了一种基于在线学习结合检测的PN—PHD目标跟踪方法,该算法够在大量杂波干扰和虚警影响下,准确地对目标进行实时精确跟踪。本算法通过引入PN学习,在目标初始信息较少的情况下通过目标属性特征的在线学习更新检测器并更正估计结果。无论是与传统的目标跟踪方法还是和近期提出的PHD相关滤波技术相比较而言,本文所实现的目标跟踪算法在有效提升了复杂环境下对单目标跟踪的准确率,并提供了航迹信息。
[1] 韩崇昭,朱洪艳,段战胜.多源信息融合[M].北京:清华大学出版社有限公司,2006.
[2]MahlerRPS.MultitargetBayesfilteringviafirst-ordermultitargetmoments[J].IEEETransactionsonAerospaceandElectro-nicSystems,2003,39(4):1152-1178.
[3]ZajicT,MahlerRPS.Particle-systemsimplementationofthePHDmultitarget-trackingfilter[C]∥AeroSense2003,InternationalSocietyforOpticsandPhotonics,2003:291-299.[4] Vo B N,Ma W K.The Gaussian mixture probability hypothesis density filter[J].IEEE Transactions on Signal Processing,2006,54(11):4091-4104.
[5] Kalal Z, Mikolajczyk K, Matas J.Tracking-learning-detec-tion[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,34(7):1409-1422.
[6] Kalal Z, Matas J, Mikolajczyk K.Pn learning:Bootstrapping binary classifiers by structural constraints[C]∥2010 IEEE Confe-rence on Computer Vision and Pattern Recognition(CVPR),IEEE,2010:49-56.
[7] Lerro D, Bar-Shalom Y.Automated tracking with target amplitude information[C]∥American Control Conference,IEEE,1990:2875-2880.
[8] Schuhmacher D,Vo B T,Vo B N.A consistent metric for performance evaluation of multi-object filters[J].IEEE Transactions on Signal Processing,2008,56(8):3447-3457.
Robust tracking algorithm for radar target based on PN-learning*
HUANG Xin-yu1, HU Shi-qiang1, ZHENG Shi-you2
(1.School of Aeronautics and Astronautics,Shanghai Jiao Tong University,Shanghai 200240,China; 2.Key Laboratory of Radio Frequency and Simulation,Radar and Electronic Equipment Research Institute,Aviation Industry Corporation,Wuxi 214063,China)
Traditional radar target tracking algorithms usually cause more false alarms under complex environment.It is useless for single tracking or detecting algorithm to filter clutters effectively.Aiming at this problem,a new learning pattern combined attribution-detector and PN-learning framework is proposed to improve performance of joint detection and tracking framework which is based on PHD algorithm.The PN module is used to extract high-confidence targets from the results of attribution detector.Then these filtered results is used to retrain detector and modify outputs of PHD.Simulation tests show that the new method PN—PHD not only effectively improve target tracking capability in strong clutter environment,but also provide tracking information which original PHD method cannot offer.
target tracking; PN learning; probability hypothesis density filter(PHD)
10.13873/J.1000—9787(2016)12—0116—03
2016—01—15
航空基金资助项目(2014ZC07003,20142057006)
TN 301,TP 391.9
B
1000—9787(2016)12—0116—03
黄馨誉(1990-),女,江苏南通人,硕士研究生,主要研究方向为目标跟踪。