张昀普, 单甘霖,*, 黄 燕, 付 强
(1. 陆军工程大学石家庄校区电子与光学工程系, 河北 石家庄 050003;2. 中国人民解放军32316部队, 新疆 乌鲁木齐 830001)
随着战争形态的变化,利用诸如雷达、红外和电子支援设备等传感器获取战场信息已经成为现代战争中必不可少的环节[1-3]。在目标环境复杂、任务协同难度高、传感器资源有限的背景下,合理地根据任务态势调度传感器资源,能够在大幅度提升作战收益的同时,降低己方的损失[4-5]。因此,如何根据不同的作战任务,制定传感器调度方法,已成为相关领域的研究热点。
按照作战任务划分,不同的传感器调度方法可分别应用于目标检测[6]、目标识别[7]和目标跟踪[8-11]等任务中。其中,面向目标跟踪的调度方法是学者们研究的重点,该类方法的目的是通过合理地制定调度方案,获取理想的跟踪精度,同时减少因传感器观测行为所带来的代价。文献[8]以分布式传感器网络为研究对象,提出了一种快速调度方法以提高目标跟踪的实时性。文献[9]以主/被动传感器系统为研究对象,提出了一种传感器调度方法,使得跟踪精度和传感器辐射代价达到了合理的平衡,增强了跟踪时传感器系统的生存能力。文献[10]在文献[9]的基础上,考虑了跟踪任务的实际需求,使得系统在满足任务要求精度的同时,辐射代价达到最小。文献[11]将传感器调度过程建模为部分可观马尔可夫决策过程,提出了一种基于能量有效的调度方法,减少了跟踪时的能耗。然而,大多文献均集中于对空中目标跟踪进行研究,而忽略了地面目标。相比于空中目标,地面目标的速度慢,机动性强,且传感器对其探测时易受地物遮蔽的影响,从而造成视野盲区[12-13]。同时,文献[14-16]指出,为避免地杂波的干扰,对地探测的传感器通常采用脉冲多普勒体制,在抑制地杂波的同时,径向速度不大于最小可检测速度(minimum detectable velocity, MDV)的目标将落入多普勒盲区,致使其无法被探测,从而造成航迹中断、跟踪性能降低。因此,在对地面目标进行跟踪时,传感器调度方法也将有别于面向空中目标的方法。同时,在调度时应考虑多任务协同的情况,例如,在目标跟踪时,常常还需要对潜在目标所在区域进行检测,此时所制定的调度方法应兼顾跟踪和检测任务。
在传统的传感器调度研究中,通常以静态传感器为研究对象,随着无人机、无人车和车载雷达等移动传感器的应用越来越广泛,如何利用移动传感器系统获取最大的作战收益已成为亟需解决的问题。目前,对移动传感器的研究主要集中在大型传感器网络的协同控制上,主要的方法有蜂拥控制[17-18]和分布式优化控制[19]等,对于多移动传感器协同调度方法的研究还较少。由于移动传感器的机动能力较强,因此可通过对传感器机动方向的合理控制,适时地调整其观测位置,从而扩展探测范围,提升对目标环境的探测能力[20-21]。在地面目标跟踪中,由于目标的速度较慢,如果利用移动传感器跟踪,则目标和传感器相对位置的变化对观测性能的影响也较大,因此,可通过找出每时刻传感器的最优观测位置,提升跟踪性能。
针对上述问题,本文面向陆战场侦察中的地面目标检测和跟踪任务,以移动传感器系统为调度对象,结合多普勒盲区和视野盲区等约束因素,提出了一种考虑盲区的多移动传感器协同地面目标检测跟踪的调度方法。主要贡献如下:① 建立了目标检测模型,结合贝叶斯风险理论,给出了目标检测损失的计算方法,以衡量目标检测性能;② 建立了考虑盲区的目标跟踪模型,结合多普勒盲区和视野盲区的特点,提出基于盲区信息辅助的目标跟踪算法;③ 结合检测和跟踪任务,同时考虑传感器能耗、安全性和信息处理能力等因素建立了传感器优化调度模型,通过求解相应的目标优化函数即可得到最优调度方案。
本文考虑场景如图1所示,己方利用多移动传感器系统(以多无人机为例)对陆战场进行侦察,作战任务共分为两类:对潜在目标所在区域进行搜索检测和对已知目标进行跟踪。传感器系统采用集中式结构,由控制中心完成对战场信息的融合处理和调度方案的制定。
图1 多移动传感器协同检测与跟踪示意图Fig.1 Schematic diagram of multiple moving sensors cooperative detection and tracking
传感器调度过程如图2所示,在当前时刻传感器系统接收到调度指令,执行检测和跟踪;然后根据相关算法更新目标状态;接着,综合系统模型和实际观测值预测未来时刻的相关收益以及能耗,并结合其他约束条件,建立目标函数并求解,从而得到未来时刻的最优传感器调度方案。为了便于下文描述,做出如下假设:
(1) 己方传感器共有两种工作模式:跟踪模式和检测模式;
(2) 一部传感器在同一时刻仅能检测一个区域/跟踪一个目标;
(3) 己方传感器在任务过程中能量有限;
(4) 本文考虑二维场景,且对方目标之间的航迹互不关联。
图2 传感器调度过程Fig.2 Process of sensor scheduling
(1)
(2)
(3)
当k时刻调度t部传感器对s检测时,假定其中h部传感器的检测值为1,t-h部的检测值为0,则可结合式(2)~式(3)进行概率更新,即
--------------------
(4)
在k时刻,传感器完成检测后,控制中心会进行判决,其具体包含如下几种情况。
(5)
(6)
(7)
(8)
采用最小风险原则,则控制中心对区域s中目标存在情况的判断结果为
(9)
判断完毕后,定义其估计值对应的风险为目标检测损失,即
(10)
(11)
(12)
第3.1节给出的观测模型默认传感器必定能够成功获取目标观测,但是在地面目标跟踪中,多普勒盲区和地形障碍物所造成的视野盲区会对传感器观测造成影响,能否持续获取目标观测成为一个不确定性事件,因此需要建立考虑盲区的传感器观测模型。
当杂波为静态时,则目标n对应的杂波多普勒[25]为
(13)
(14)
当径向速度不大于MDV时,传感器无法成功探测到该目标,即无法获取其观测值。根据文献[26],结合多普勒盲区和视野盲区的特点,k时刻传感器m对目标n的检测概率可表示为
(15)
因此,考虑盲区的传感器观测模型建立如下:
(16)
式中:ρ为随机数0或1,服从伯努利分布,具体为
(17)
在k时刻,若成功获取目标的观测值,则可利用容积卡尔曼滤波(cubature Kalman filter, CKF)对目标状态进行估计,针对多运动模型目标,可结合交互式多模型算法进行估计,上述方法较常规,具体可参见文献[10,27],在此不再详述。
若没有获取目标的观测,说明目标可能进入了多普勒盲区或视野盲区,此时仅能通过运动模型对目标状态进行预测,再将各个模型的预测值融合以作为目标状态的估计值,即
(18)
(19)
(20)
(21)
显然,当目标进入传感器的多普勒盲区后,上述状态修正公式才适用。因此,当传感器没有获取目标观测时,需判断原因,以区分目标进入了传感器的视野盲区,还是多普勒盲区。文献[25]指出,目标的径向速度并不会发生突变,当目标进入传感器的多普勒盲区前,该值会逐渐减小。因此,本文建立一个长度为5的速度检测滑窗,在k时刻,该滑窗存储了时域[k-5,k-1]内各时刻的径向速度值,定义k时刻径向速度变化率为
(22)
式中:τ为传感器m的采样间隔。采取四分之三法,当下述4个不等式中有3个满足条件时,判定丢失观测值的原因是目标进入了多普勒盲区:
(23)
上述基于盲区信息辅助的目标跟踪算法的简要流程如图3所示。
图3 基于盲区信息辅助的目标跟踪算法Fig.3 Target tracking algorithm based on blind zone information assisted
根据传感器调度理论,要搜索出最优的调度方案,需要结合任务实际预测未来时刻的调度收益,因此如何确定与调度收益相关的性能指标是至关重要的。本文面向目标检测和跟踪任务,同时结合移动传感器的工作实际,主要考虑以下5种性能指标。
(1) 检测损失
若没有传感器对区域s进行检测,则
(24)
若使用t部传感器对区域s进行检测(其中h部传感器的检测值为1,t-h部的检测值为0),则
(25)
(2) 目标跟踪精度
目标跟踪精度衡量了传感器对目标的跟踪性能,为对该指标进行合理描述,本文引入后验克拉美罗下界(posterior Carmer-Rao lower bound, PCRLB),其反应了目标状态估计误差的理论下界,且其取值不依赖于具体的滤波算法,对于非线性系统也有很好的适用性[10,28]。值得注意的是,由于调度时不能获取未来时刻的系统状态与量测值,下文所提利用PCRLB量化的跟踪精度为预测值而并非实际真值。
(26)
针对高斯系统,式(26)等号右边各项的计算公式[28]为
(27)
(28)
(3) 传感器能耗
E(Uk)=
(29)
(4) 传感器的安全性
(5) 控制中心的信息处理能力
由于控制中心的信息处理能力有限,每时刻处于工作状态的传感器数量不能过多。设定同一时刻控制中心最多处理Wdetection批次检测信息和Wtracking批次目标跟踪信息(同一时刻一部传感器进行检测/跟踪,控制中心需处理一批次相关信息)。因此,结合传感器-区域的分配方案ak和传感器-目标的分配方案bk,控制中心的信息能力可用以下不等式描述:
(30)
根据第4.1节所提各项指标,建立如下的目标函数:
s.t.
(31)
(32)
图4 传感器机动方案离散化Fig.4 Discretization of sensor maneuver scheme
整个侦察区域内,己方共部署了8部传感器跟踪2个对方目标,并对3个待检测区域进行潜在目标检测,目标航迹、检测区域和传感器分布情况如图5所示。
图5 目标航迹、检测区域和传感器分布情况Fig.5 Target tracks, detected zones and multi-sensor locations
为模拟真实地面上的地形遮蔽,在仿真中设定了两处障碍,当传感器的视线被障碍遮蔽时,即产生了视野盲区,两处障碍的起始点坐标为:A(1 300, 3 600)m、B(2 200, 3 000)m、C(700, 250)m、D(1 400, 750)m。传感器的采样时间为1 s,仿真时间为50 s。所有传感器的MDV均为10 m/s,传感器的初始朝向均为0°(与X轴正方向夹角),一次采样间隔的移动距离为40 m,机动方案共有10种:静止、0°、±15°、±30°、±45°和±60°,传感器的其他参数如表1所示,为不失一般性,设定检测和跟踪性能越好的传感器能耗越大。
表1 传感器参数
传感器和目标的安全距离rsafe=300 m,控制中心的信息处理能力Wdetection=4、Wtracking=4,目标函数中平衡系数α=1,β=0.03,γ=0.01。
为充分说明本文所提调度方法的性能,采用两种调度方法进行对比:
(1) 方法1:随机调度方法,即每一时刻随机选择传感器调度方案执行任务[9];
(2) 方法2:仅考虑跟踪精度的调度方法,即在本文调度方法的基础上,令目标函数中平衡系数α=γ=0,β=1,该方法能获得使跟踪精度达到最优的调度方案。
图6给出了整个仿真过程中,不同调度方法下各区域瞬时检测损失和总检测损失的对比图。可以看出,对各个区域进行几次检测后,瞬时检测损失和总检测损失均会收敛至固定值,这说明目标的存在概率不会再改变,区域内目标存在状态的估计值也已确定,且与实际值一致,检测任务已基本完成。对比各调度方法可以看出,本文调度方法所得的检测损失最小,方法1、方法2和所制定的调度方案均不考虑检测损失,故二者所得检测损失较大。同时,方法2制定的调度方案仅关注优化跟踪精度,造成了检测性能好的传感器更可能被用于完成跟踪任务,因此其获得的总检测损失最大。图6中,本文方法、方法1和方法2完成所有区域目标检测所用的平均时间分别为7.1 s、9.4 s和10.5 s。综合上述分析,本文方法能够获得较优的检测性能,提高检测速度,在减少检测损失的同时尽快获得目标存在信息。
图6 不同调度方法下各区域瞬时检测损失和总检测损失对比Fig.6 Comparison of instantaneous detection loss and total detection loss in each region under different scheduling methods
图7给出了100次蒙特卡罗仿真实验后,不同调度方法下传感器盲区出现概率对比。对比3种调度方法可以看出,方法1不预测未来时刻目标状态,因此其“盲区传感器”出现的概率最大;方法2制定的传感器调度方案仅关注跟踪精度,因此其能够较准缺地避免“盲区传感器”的出现,故该方法下多普勒盲区和视野盲区出现的频率均为最低,也说明了本文目标函数中利用PCRLB预测跟踪收益并制定相应调度方案的做法是合理的;本文方法因为需要兼顾区域检测和控制能耗,因此出现“盲区传感器”的概率稍大于方法2,但是要远好于方法1,具有较好地规避盲区的能力。
图7 不同调度方法下传感器盲区出现概率对比Fig.7 Comparison of occurrence probability of sensor blind zone under different scheduling methods
为进一步评价调度方法的跟踪性能,引入均方根误差(root mean squared error, RMSE)和均方根的时间均值(root time average mean squared error, RTAMSE)作为评价指标。表2给出了在整个仿真时间中,不同调度方法对各目标的跟踪性能对比,表中盲区平均出现次数为100次蒙特卡罗仿真后的统计平均值。图8给出了不同调度方法在每时刻对各目标跟踪所得RMSE对比。可以看出,3种方法中,方法1不对未来时刻的系统收益进行预测,随机选择传感器调度方案,跟踪性能最差,且容易进入多普勒盲区和探测盲区中,造成跟踪精度下降。只关注优化跟踪精度的方法2所得的各项指标均为最优,这是因为该方法可根据目标的状态实时选择跟踪精度最优的传感器,并调整传感器的观测位置,从而得到能够使跟踪精度达到最优的传感器调度方案。而本文方法虽然在跟踪性能上不如方法2,但是各项指标均差距不大,尤其是从图8可以看出,本文方法在每时刻所得RMSE值与方法2所得值十分接近,说明即使本文方法需要兼顾检测和控制能耗,但依然能保证出色的跟踪性能,验证了本文方法的合理性和有效性。
表2 不同调度方法下跟踪性能对比
图8 不同调度方法下对各目标跟踪的RMSE对比Fig.8 RMSE comparison of targets tracking under different scheduling methods
图9给出了不同调度方法下总能耗对比结果。可以看出,本文调度方法由于在目标函数中考虑了优化能耗,因此所获总能耗最低,且其相较于其他两种方法差距很大,结合上文检测和跟踪的对比结果,说明本文方法能够平衡检测性能、跟踪性能和能量消耗三方面表现,从而使整体的任务收益达到最佳。
图9 不同调度方法下总能耗对比Fig.9 Comparison of total energy consumption under different scheduling methods
本文以多移动传感器系统对地面目标探测为研究背景,同时考虑检测和跟踪任务,提出一种考虑盲区的传感器调度方法。首先建立了传感器检测模型,并结合贝叶斯风险理论提出了检测损失的计算方法;然后建立了考虑盲区的目标跟踪模型,给出了基于盲区信息辅助的目标跟踪算法;最后建立了传感器调度模型,结合检测损失、跟踪精度和传感器能耗等因素建立了目标优化函数,并给出了传感器机动方案离散化方法以减少计算复杂度。通过与随机调度方法和仅考虑跟踪精度的调度方法进行对比仿真可以得出,本文调度方法能够通过合理制定传感器调度方案,使检测损失、跟踪精度和控制能耗达到合理平衡,从而令系统的整体收益达到最优。
在未来的工作中,需要将起伏地形、道路网等陆战场要素考虑进传感器调度模型中,使调度方法更具实用性。