基于区间箱粒子多伯努利滤波器的传感器控制策略

2021-07-25 17:50陈辉邓东明韩崇昭

自动化学报 2021年6期

陈辉邓东明韩崇昭

多目标跟踪中传感器控制的核心是根据一定的优化准则,选择传感器的工作状态或运行参数,进而控制量测过程以达到优化多目标跟踪性能的目的.本质上,它是一个最优非线性控制问题.这类问题的解决通常是在部分可观测马尔科夫决策过程(Partially observable Markov decision process,POMDP)的理论框架下[1−4]进行.POMDP 一般包括表征状态信息的多目标概率密度函数,一个可允许的传感器控制集合和评价函数.然而,多目标传感器控制问题一般处理高度复杂的多目标随机系统,其目标的数量不仅随时间变化,而且其量测也会受到漏检和虚警的影响.这些复杂的不确定性因素都使得多目标传感器控制策略的求解变得非常困难.

近些年来,基于随机有限集(Random finite set,RFS)的多目标跟踪方法备受关注.该方法将多目标状态和多目标量测建模为有限集值.同时通过引入有限集统计(Finite set statistics,FISST)[5−6]理论,将杂波环境下的多目标状态估计问题描述为贝叶斯滤波问题,从而避免了传统跟踪算法中较难处理的数据关联问题.基于RFS 的多目标跟踪方法可在贝叶斯滤波框架下根据每个时刻接收的集值量测递推更新多目标状态的概率密度函数.为简化在多目标状态空间上直接求解多目标贝叶斯滤波器的复杂度,Mahler 和Vo 提出了一系列最优近似多目标滤波器[7−14],包括矩递推滤波器和形式多样的(有标签和无标签)多伯努利滤波器.这些方法目前已应用在多目标传感器控制问题[15−19]中.值得注意的是,这些传统的量测模型通常用量测噪声来表征量测模型的不确定性,称为统计不确定性.然而,在许多实际应用中,这种标准的量测建模方式是不够准确的.例如,复杂的监控系统通常会遭遇未知的同步偏差和系统延迟.由此产生的量测通常会受到典型未知分布和偏差的边界误差的影响.此时,这种带有边界误差的量测可以用一个“区间量测”而不是点值量测来描述.区间量测表示一种不确定性,称为集论不确定性[20−21].文献[22] 结合序贯蒙特卡罗方法和区间分析技术,在目标跟踪背景下首次提出箱粒子的概念,其核心思想是利用状态空间内的多维区间或者体积非零的矩形区域代替传统的点粒子,同时用误差界限模型代替传统的误差统计模型.作为一种“广义粒子滤波”算法,箱粒子滤波仍然在贝叶斯滤波框架下进行[23],并通过一组带有权值的箱粒子来表征多目标后验概率密度函数.由于箱粒子可以被解释为一种由大量点粒子组成的集总形式,因此,用箱粒子滤波器进行状态估计时相当于箱粒子所覆盖的空间中的所有点粒子都参与估计,这就在很大程度上减少了所需粒子的数量,降低了算法的复杂度,节省了计算资源,提高了算法的运行速度.鉴于箱粒子滤波器估计效果较好,运行速度更快的优点,近几年,已有一些学者相继提出了箱粒子概率假设密度滤波器[24],箱粒子(多)伯努利滤波器[25−28]等.

箱粒子滤波器运行速度快的优点使得其与传感器管理的结合更具优势.遗憾的是,截至目前基于箱粒子滤波器的传感器管理并没有引起太多学者的关注,而且在我们现有的知识背景中,也并未查阅到有相关研究成果的发表.实际上,基于箱粒子滤波器进行传感器控制策略的求解,最大的难题在于如何用表征多目标概率密度的箱粒子直接求解以信息散度为代表的评价函数.这与利用点粒子求解评价函数大不相同.由于德尔塔粒子的正交特性和易于求解积分的特点,点粒子求解评价函数是方便和容易的.但箱粒子作为体积非零的矩形区域,其并没有正交消除冗余项的便利,因此直接利用箱粒子求解评价函数是极其困难的.

鉴于此,本文基于区间不确定性推理,利用箱粒子多伯努利滤波器提出了一种基于信息测度的传感器控制策略.首先,利用箱粒子实现多伯努利滤波器,并通过一组带有权值的箱粒子来表征多目标后验概率密度函数.其次,利用箱粒子的高斯分布假设,将多伯努利密度近似为高斯混合.显然,这不但避免了利用箱粒子直接求取评价函数的难题,而且将其转化为利用高斯混合求解评价函数的问题.随后,针对高斯混合分布间的信息增益大都不存在闭式解的问题,本文基于高斯混合多伯努利滤波器,研究并推导了两个高斯混合之间的柯西施瓦兹(Cauchy-Schwarz,CS)散度求解公式,并以此为基础提出相应的传感器控制策略.为了对比说明所提方案的合理性和有效性,基于蒙特卡罗方法,本文也给出了通过混合均匀采样近似箱粒子,进而利用点粒子求解CS 散度的递推公式,并给出了相应的传感器控制策略.最后,仿真实验验证了所提算法的有效性.

1 问题描述

1.1 多目标随机有限集建模

对于一个单目标系统,目标状态和量测一般由不同维数的随机矢量构成.这些矢量在随时间演变的过程中,其维数是恒定的.而多目标系统显然并非如此,其状态和量测一般由各自包含多个状态和量测的集合构成,且维数随时间而变化.假定k −1时刻在目标状态空间中存在Nx(k −1)个目标,状态分别为,目标状态维数为nx.随着时间的演化,这些目标可能会消亡,或以新的状态继续存活,而新的目标也有可能出现.此时,k时刻Nx(k)个目标的状态可记为,且状态顺序和目标顺序无关.同时,k时刻传感器接收到Mz(k)个量测在量测空间中取值分别为,量测维数为nz.这些量测既可能来自于目标,也可能来自于杂波,并且量测顺序和目标顺序无关.那么,k时刻多目标状态和多目标量测都分别构成一个无序的RFS.其中,F(X)表示X所有有限子集的并集,F(Z)表示Z所有有限子集的并集.在区间不确定性分析中,量测一般表示为区间量测,此时多目标量测为∈F(IZ),其中IZ为区间量测空间,F(IZ)表示IZ所有有限子集的并集.对于k −1 时刻给定的多目标状态Xk−1,假设目标xk−1∈Xk−1以存活概率pS,k(xk−1)继续存活在k时刻.若不考虑衍生目标,则多目标状态集Xk可建模为

其中,Sk|k−1(xk−1)是从k −1 时刻到k时刻存活目标状态的RFS.Γk为k时刻新生目标状态的RFS.

假设目标状态转移方程为

其中,fk是系统的状态转移矩阵,wwwk～N(0,Qk)为过程噪声.

此外,假设k时刻传感器以检测概率pD,k(xk)检测到目标xk∈Xk,且被检测目标以式(3)产生量测zk∈Zk.

其中,vvvk为量测噪声.在本文的实际仿真场景中,pvvv描述为零均值高斯白噪声.k时刻的传感器位置xs,k(ν)=[xs,k(ν),ys,k(ν)]T由传感器控制方案ν所决定.考虑传感器检测不确定性,此时传感器对应目标量测是一个RFS,可表示为Θk(xk).若考虑杂波的影响,则k时刻传感器接收到的多目标量测集Zk可建模为

1.2 多目标跟踪中基于信息论的传感器控制方法

多目标跟踪中基于信息论的传感器控制通常是在POMDP 框架下进行的.实际上,POMDP 是马尔科夫决策过程的推广形式,其通常包括三个要素:表征多目标状态信息的概率密度函数,一个可允许的传感器控制集合和评价函数.具体来讲,FISST理论框架下的多目标状态信息可用k时刻多目标后验概率密度pk|k(Xk|k|Z1:k)来描述.用Uk表示k时刻可允许的传感器控制集合,每一个传感器控制ν∈Uk决定下一时刻传感器的位置.对于每一个传感器控制ν给定一个对应的评价函数R(ν).则最优控制序列uk可按以下准则确定

其中,pk|k−1(X|Z1:k−1)表示k时刻多目标先验概率密度,R(ν,p,Z)是与传感器控制ν相关的评价函数,由未来量测集Zk(ν)所决定.通常未来量测集可由式(3)和(4)获得.但这种方法通常会给传感器的求解带来极大的计算负担.比较常用且实际的做法是在不考虑杂波、噪声且检测概率pD,k=1 的情况下,对每一个控制ν产生一个预测理想量测集(Predicted ideal measurement set,PIMS)[29−30],进而用PIMS 代替实际量测来进行传感器控制的求解.

此外,评价函数依据控制决策评价体系的不同可分为两大类:基于任务驱动和基于信息驱动.基于任务驱动的传感器控制策略旨在某个单一准则下基于某个特殊任务进行优化.而基于信息驱动的传感器控制策略由于能够兼顾多任务指标的竞争优化而备受关注,其评价函数通常反映了多目标概率密度间的信息增益DI(·,·),即R(ν)选择为信息测度

1.3 区间分析

区间分析又称区间数学,是一门用区间变量代替点变量进行运算的数学分支.通常,由于测量误差的存在,滤波会产生不精确结果,而区间分析技术却能精确给出误差界限.因此利用区间分析技术进行运算,其运算结果相对于传统数学方法具有更高的置信度.

区间通常定义在实数域R 内,是一个连续且封闭的实数子集,表示为.其中,表示区间下界,表示区间上界.一般地,一个d维区间或者箱体[x]∈Rd是d个一维区间的笛卡尔乘积,表示为[x]=[x1]×···×[xd].箱体的体积定义为|[x]|.

值得注意的是,对于一个非线性系统,箱体[x]在经过非线性转移函数f传递后一般会得到不规则的非箱体形状.为了保证转移后得到规则形状,以便于分析计算,区间分析技术引入了包含函数(Inclusion functions)的概念,其目的是通过包含函数快速的找到包围这种不规则形状的最小箱体.若有函数f,其包含函数可定义为:已知函数f:Rn→Rm,如果∀[x]∈IR,[f]([x])⊇f([x]),那么区间函数[f]:IRn→IRm是包含函数.收缩算法是区间分析技术中的另一个重要概念,实现箱粒子收缩首先要解决的问题就是“约束满足问题(Constraint satisfaction problems,CSP)”.它的实质是在约束集H:(f(x)=0,x∈[x])中寻找一个满足约束函数f(x)=f(x1,x2,···,xn)=0 的最小约束集S,即找到一个包含[x] 中所有x且满足约束函数f的最小体积[x].本文采用一种被广泛应用的约束传播方法(Constraints propagation,CP)[25],又称为前向后向法.

2 Box-CBMeMBer 滤波器

2.1 SMC-CBMeMBer 的本质

CBMeMBer 作为MeMBer 的改进版本,在概念上完全不同于PHD 和CPHD.它并没有“压缩”状态信息,进而用统计特性去近似多目标密度,而是通过传递一组相互独立且数量固定的伯努利参数来直接近似多目标密度.显然,CBMeMBer 的这种优势为多目标跟踪问题的递推求解和执行效率提供了极大的方便和提高.SMC-CBMeMBer 作为多伯努利滤波器的具体实现形式之一,本质上是随时间传递和更新一组德尔塔粒子和对应的权值,并最终由这组带有权值的德尔塔粒子的加权和近似表征多伯努利密度.

2.2 点粒子到箱粒子

在SMC-CBMeMBer 中,假设多目标多伯努利密度可以表示为,其中r(i)表示第i个伯努利过程的存在概率,p(i)(x)表示该伯努利过程的概率分布,M为伯努利过程个数.p(i)(x)一般有如下形式

其中,L(i)表示该概率分布的粒子个数,w(i,j)是其对应的粒子权值,δx(i,j)(x)为狄拉克德尔塔函数.当L(i)→∞时,式(7)收敛于p(i)(x).一般地,粒子个数通常会对滤波器的性能产生极大影响.粒子数越多,滤波器整体性能越优异,这显而易见.但与此同时,大量的粒子参与滤波过程会极大地提高算法的计算复杂度.文献[22] 结合粒子滤波技术和区间分析技术,提出了一种利用箱粒子代替点粒子,进而减少粒子个数的处理方法.此外,文献[22−26] 将每个“箱体”刻画成一个以箱粒子为支撑集的概率密度函数,每个均匀函数都充分反映了对应箱粒子的特性.因此,若箱粒子[x]作为支撑集,令U[x]表示该箱粒子的均匀概率密度函数,则式(7)可以表示为

事实上,Box-CBMeMBer 滤波器在形式上可以看成是用箱粒子代替点粒子的SMC-CBMeMBer滤波器,以下将给出具体递推公式.

2.3 Box-CBMeMBer 递推

1)预测步

假设k −1 时刻后验多目标多伯努利密度表示为,且每一个概率密度具有以下形式

则k时刻预测多伯努利密度可表示为

nB为新生箱粒子个数.

2)更新步

结合存活目标多伯努利密度和新生多伯努利密度,可令k时刻预测多伯努利密度πk|k−1为

其中

则后验多伯努利密度πk|k可表示为

3)重采样和状态估计

和传统的点粒子滤波器一样,箱粒子滤波器仍然需要进行重采样.但具体的采样方法却显著不同,箱粒子滤波器通常采用随机子划分法进行重采样,即可以将权重大的箱粒子用一组区间更小的箱粒子去替代.此外,目标状态是所对应箱粒子质心状态的加权和.

3 Box-CBMeMBer 中基于箱粒子高斯分布近似的传感器控制方法

尽管Box-CBMeMBer 也类似地通过一组带有权值的箱粒子来逼近多伯努利密度.但相比于SMCCBMeMBer,基于Box-CBMeMBer 进行传感器求解显然要困难许多.利用点粒子求解信息散度是极具优势的,这主要是因为狄拉克德尔塔函数(Dirac delta function)的正交特性和便于求解积分的特性.而对于箱粒子,这一体积非零的矩形区域,显然并没有正交消除冗余项的便利.因此,利用箱粒子直接求解信息测度是相当困难的.

文献[25] 利用服从高斯分布的量测噪声来构造服从均匀分布的区间量测噪声,即给出了一种由统计不确定性转化为区间不确定性的有效方法.该方法给本文以启发式的思考.特别是该方法用严格的等式给出了计算过程.由于不存在等式成立的限定条件,因此该等式合理的给出了一个高斯分布和区间箱体相互转化的方法.换而言之,利用区间噪声近似代替服从高斯分布的噪声,这显然是一个可逆过程.假设任一箱粒子[x],其质心状态mx=mid([x])=[x,x′,y,y′]T,其区间中心到边界的长度.则可通过构造高斯分布来逼近服从混合均匀分布的箱粒子,即

式(33)的重要意义就在于代替式(19)来近似多伯努利密度,如此不但避免了直接利用箱粒子求解评价函数的难题,而且进一步将基于Box-CBMeMBer 的传感器控制求解问题转化为利用高斯混合求解评价函数的问题.

利用高斯混合求解评价函数即便在以点目标滤波器为基础的传感器控制策略中也不多见,究其原因主要在于高斯混合分布间的信息散度大都不存在闭式解.尽管如此,相比于点粒子求解评价函数,高斯混合求解仍有其无法比拟的执行效率上的优势,这对于传感器的实时管理具有很重要的价值和意义.有鉴于此,本文基于GM-CBMeMBer 滤波器,研究了两个高斯混合之间的CS 散度的求取,并以此为基础提出相应的传感器控制策略.

假设p0和p1分别表示两个概率密度函数,则它们之间的CS 散度可表示为

根据式(6)和(34),评价函数可以表示为

GM-CBMeMBer 滤波器通过传递一组带有权值的高斯分量来逼近多目标密度.显而易见,每个伯努利过程对应的高斯分量对于整体的多目标密度的逼近程度是不同的.出于简化计算的考虑,本文提取存在概率r较大的伯努利过程(r >rm),从而利用这些伯努利过程去联合近似空间多目标概率密度,进而研究相应评价函数的求解.

其次,对于每种控制方案ν∈Uk确定传感器的位置xs,k(ν).随后对每一个控制ν仅产生一个相应的PIMS,可表示为

由于不考虑杂波和噪声,且pD,k=1,因此不存在继承航迹(漏检)的伯努利RFS,而对于每个PIMS 更新的伯努利RFS,其存在概率恒为1.因此,我们只需要结合GM-CBMeMBer 滤波算法,利用PIMS 对式(36)中的每个高斯分量参数进行更新,则更新后的多目标概率密度也具有高斯混合的形式,即

其中,每个高斯分量对应权值为

k时刻目标状态估计、估计误差协方差分别为

其中,Hk表示k时刻非线性量测函数的雅克比矩阵.更新后的多目标概率密度可近似表示为

值得注意的是,为了计算式(35),本文需要借助两个高斯分布之间的乘积公式,即

根据式(36)和(48),式(35)第一项可推导如下

其中

式(35)中的第二项和第三项类似于第一项的推导方法,不再赘述.则最后评价函数可写成如下形式

其中

为了直观地说明本节所提方案的求解步骤,以下给出算法1 实现伪码.

4 Box-CBMeMBer 中基于箱粒子混合均匀采样的传感器控制方法

事实上,除了上文中给出的通过构造高斯分布近似箱粒子的方法以外,一个自然的选择是基于蒙塔卡罗方法,利用采样粒子集去代替箱粒子.如前所述,箱体是一个均匀分布函数,因此本文利用混合均匀采样的思想,对每个箱粒子进行均匀采样,用得到的点粒子来近似代替箱粒子,从而将传感器策略求解问题转化为更一般的利用点粒子求解评价函数的问题.以下将给出利用点粒子求解CS 散度的递推公式.

一般地,CS 散度除了有式(34)的表示方法外.Hoang 等[31]也推导了两个泊松点过程之间的CS 散度,表达如下

其中,π1和π2表示泊松点过程,u1和u2分别是其强度函数,K表示目标状态的量测测度.此外,值得注意的是,对任一多目标概率分布最有效的泊松近似是多目标分布的一阶矩.基于这种思想,文献[19]结合式(55)给出了两个多伯努利分布间的CS 散度.本文进一步给出了传感器控制中CS 散度的粒子求解方法.

假设k时刻预测多目标多伯努利密度表示为,且每一个概率密度被一组带有权值的粒子近似

则预测多伯努利密度的强度函数为

此外,由于不考虑杂波和噪声,且pD,k=1,因此不存在继承航迹(漏检)的伯努利RFS.此时利用PIMS 更新后的后验多伯努利密度可表示为

类似地,后验多伯努利密度的强度函数为

将式(57)和(59)代入式(55)可得

利用德尔塔函数积分特性,则基于CS 散度的传感器评价函数为

为了直观地说明本方案的求解步骤,以下给出算法2 实现伪码.

5 算法程序的伪码

为了说明基于Box-CBMeMBer 传感器控制策略的整体算法流程,列出算法伪码如下:

6 仿真分析

6.1 场景参数

本文考虑距离方位跟踪 (Range-bearing tracking,RBT).设置监控区域为 [−π,π]×.场景中目标轨迹均为近常速运动模型(Nearly constant velocity model,NCVM)[32],共计出现4 个目标,其状态转移密度为

其中[25],

其中,T=1 s 为采样周期,总共采样50 次.Qk为过程噪声协方差,I2为2 阶单位矩阵,⊗为克罗内克积,ϖ=0.05 为过程噪声强度.本文借鉴文献[25](如式(32))将服从高斯分布的Qk转化为服从均匀分布的区间过程噪声.

在本文仿真中,设置检测概率pD,k=0.98.杂波强度κk(z)=λcV u(z),其中每周期杂波平均数λc=5,V为监控区域体积,u(z)表示监控区域内的杂波均匀分布.目标存活概率pS,k=0.99.目标新生过程是一个多伯努利RFS,其密度为,其中,Pγ=diag{[10,5,10,5]T}.新生箱粒子可通过采样得到.假设轨迹删减阈值为rT=10−3,伯努利过程存在概率提取阈值为rm=0.5,对应高斯混合分量权值提取阈值为wm=0.2,箱粒子个数Lbox=40,每个箱体(箱粒子)均匀采样粒子数Lsam=30.

在RBT 中,量测函数hk(x)有如下形式

其中,xk和yk表示k时刻目标的位置,xs,k和ys,k表示k时刻传感器的位置.量测噪声vvv是零均值高斯白噪声,其协方差为,其中σθ=0.25°,σr=2.5 m.此外,传感器返回的是区间量测,其区间长度为Δ=[Δθ,Δr]T,其中Δθ=4°,Δr=70 m 分别是区间量测的角度长度和距离长度.值得注意的是,传感器通常有偏差(系统误差),此时hk(x)+vvvk并不在区间量测的中心位置.因此,结合RBT 量测方程,传感器区间量测可构造如下

6.2 多目标跟踪性能评价

本文采用OSPA(Optimal subpattern assignment)距离[33]来评估多目标跟踪的性能.其定义如下:设真实的和估计的多目标状态集合分别为X={x1,···,xm}和,若m≤n,则OSPA 距离为

6.3 传感器控制集合

若k时刻传感器实际位置为xs,k=[xs,k,ys,k]T,则下一时刻传感器所有可允许控制的位置集合Uk+1可表示为

其中Nθ=8,NR=2,则Uk+1总共包括17 种控制方案(包含传感器处于静默状态).vs,c是传感器自身的容许控制速度,设为20 m/s.

6.4 实验仿真

本文设计的RBT 仿真场景中,共计出现四个目标,其运动参数如表1 所示.

表1 多目标参数Table 1 Parameters of multi-target

首先基于Box-CBMeMBer 滤波器对RBT 场景中的多目标进行单次跟踪仿真,如图1 所示.显然,即便在杂波较多的环境下,Box-CBMeMBer 仍能克服目标新生和消亡带来的不确定性,排除杂波干扰,最终得到良好的跟踪估计效果.

为了对比说明所提控制方案的合理性和有效性.本文在如图1 所示同样的场景条件下,构造了四种控制方案并进行了200 次蒙特卡罗(Monte Carlo,MC)实验.其中,方案一是“箱粒子高斯分布近似”,即本文所提控制方案.该方案通过构造高斯分布来近似表示箱粒子,进而利用高斯混合加权和来逼近多目标状态空间分布,最终在求解本文所给出的高斯混合CS 散度的基础上得到传感器最优控制方案.方案二是“箱粒子混合均匀采样”即通过混合均匀采样得到点粒子进而代替箱粒子,利用加权粒子集近似表达多目标空间分布,并求其强度函数.该方案借鉴了传统粒子滤波的思想,利用德尔塔粒子的正交特性和易于求解积分的特点,计算CS 散度并最终得到传感器最优控制方案.方案三是“随机控制”,代表每个时刻的传感器控制方案在可允许的控制集合中随机选取.这种随机选取看似简单,但该方案往往会获得比较良好的控制效果,因此经常作为典型的控制方案被加以比较.方案四是“ENT”作为一种经典的控制方案[34],其仍然利用箱粒子混合均匀采样得到的点粒子来求取相应的评价函数,其目的旨在一套可允许的传感器控制集合中决策出相应的控制方案,以使得传感器检测到目标势的后验期望值(PENT)达到最大.

图1 实际的目标轨迹Fig.1 Actual target trajectories

图2 给出了四种控制方案在200 次MC 实验中对多目标状态估计的OSPA 距离统计对比结果.可以看出,四种控制方案都有较好的跟踪估计效果,这说明了四种控制方案的有效性.具体地,OSPA 距离分别在5 s,10 s,15 s 呈现出明显的波动,这是因为随着目标的新生,多目标状态空间分布发生了较大变化,但随着传感器有目的的机动,相对于其他传感器控制方案,Box-CBMeMBer 滤波器显然很快应对了这种变化,因此OSPA 距离在短暂波动后又回到理想的平稳状态.这种快速收敛性说明在目标势摄动的情况下,本文所提算法具有相对较好的鲁棒性.另外,多目标状态OSPA 在30 s 左右也发生了较为明显的波动,究其原因主要在于在25 s 到32 s 之间,目标3 和目标4 在空间中非常接近(如图1 所示),两个目标运动过程中的“汇集”影响了彼此的状态估计.此外,比较四种方案可以看出,方案一显然比其余三种方案的跟踪估计效果要好.尤其是相比于方案二,方案一通过构造高斯分布显然更能表征箱粒子,更能逼近多目标状态空间分布,从而通过CS散度指导传感器得到最优的控制方案.而最优的控制方案能够提供更加精确的量测,进而得到更好的估计效果.方案四跟踪估计效果较差,这是因为该控制方案是以目标势后验期望值(PENT)最大化为评价准则,并没有以多目标跟踪精度达到最优作为评价指标.

图2 四种控制方案的OSPA 距离比较Fig.2 OSPA distances for four control strategies

图3 给出了方案一,即本文所提控制方案在单次实验中对传感器的最优控制轨迹.可以看出,在整个控制过程中,传感器会始终依据当前的滤波结果不断地对自身的位置进行自适应调节,即基于最优评价准则求解出当前时刻传感器相对于所有目标的最佳观测位置.特别是随着目标的出生和消亡,传感器总是会产生明显的机动来适应这种变化,进而适应总体多目标概率密度函数的变化,以保证自身能在最优的位置最大化地接收多目标信息.

图3 所提方案的传感器控制轨迹Fig.3 Sensor trajectory for the proposed strategy

目标势估计如图4 所示.显然,四种控制方案的势估计均值都很接近真实目标数.但通过统计目标势估计标准差(如图5,表2),仍能发现方案一有相对较好的估计效果.尤其是相比于方案二,方案一由于更能真实地反映多目标状态空间分布,从而能够为CS 散度的求解乃至于最优传感器位置的决策提供更加精确的多目标信息,这使得方案一在估计效果上要优于方案二.方案四对目标势的估计效果最好,这毫不奇怪,因为该方案是以目标势的后验期望值最大化为评价准则,只是针对目标势优化的单一任务进行决策,虽然在这种情况下,并不能使多目标整体定位的性能得到提升,但却可以提升滤波器对于多目标的检测性能.

表2 四种控制方案势估计误差均值的绝对值Table 2 Absolute value of cardinality error for four control strategies

图4 四种控制方案的势估计比较Fig.4 Cardinality estimation for four control strategies

图5 多目标势估计标准差Fig.5 Standard deviation of multi-target cardinality estimation

此外,图6 给出了四种控制方案在200 次MC实验中的平均包含值.可以看出,四种方案下的平均包含值都非常接近1,这说明多目标的估计状态几乎都被包含在相应箱粒子内,这同时也说明了基于四种控制方案的Box-CBMeMBer 滤波器都具有良好的跟踪估计性能.

图6 多目标平均包含值Fig.6 Mean inclusion values of multi-target

四种方案在同样的场景参数下均运行50 步,其单步平均运行时间如表3 所示.可以看出,方案一在执行效率上要优于方案二,这种差别主要来自于传感器评价函数的求解所花的时间.而利用高斯混合求解评价函数,在执行效率上具有天然的优势.从这点来看,显然方案一,即本文所提控制方案更适合作为Box-CBMeMBer 的传感器控制策略,因为两者的结合更能保留Box-CBMeMBer 滤波器执行速度快的优点.方案三运行速度最快,这是因为其在传感器求解上的时间花费几近于无,时间成本主要来源于滤波过程.方案四运行较慢,这是因为在求解评价函数的过程中需要对所有预测箱粒子混合均匀采样后的所有点粒子进行更新.

表3 四种控制方案单步平均运行时间对比Table 3 The average execution time for four control strategies

为了验证过程噪声变化对所提算法性能的影响,本文结合式(64),通过改变过程噪声强度ϖ的大小,在同样的场景条件下运行MC 仿真并统计OSPA 均值加以比较.如图7 所示,随着过程噪声强度ϖ的不断变大(ϖ=0.05,0.5,1,5,10),多目标估计精度在不断下降.但就总体趋势而言,多目标估计精度仅是有限度小范围的变化,整体变化趋势比较平稳.这说明了在参数摄动(过程噪声)的情况下,本文所提传感器控制方法具备良好的鲁棒性.

图7 所提方案中不同过程噪声强度对估计性能的影响Fig.7 Tracking performance of different process noise intensities for the proposed strategy

以下讨论量测噪声的变化对本文算法的影响.本文仍然在相同的仿真场景下通过改变量测噪声协方差系数来控制量测噪声协方差的大小,进而对比说明其对滤波器性能的影响.如图8 所示,随着ς的不断增大,多目标状态的OSPA 在不断增大,估计精度在不断降低,这反应了量测不确定性程度对滤波器精度的影响.此外,尽管噪声协方差的增大如预期的那样引起了多目标跟踪估计效果的变差,但总体而言,多目标整体滤波效果呈现了一个相对平稳的过程,在参数摄动的范围内,多目标状态估计OSPA 均值的最大变化(最大值和最小值)小于15 m,这说明了所提算法在不同的量测噪声水平下有着较好的鲁棒性.

图8 所提方案中不同量测噪声系数对估计性能的影响Fig.8 Tracking performance of different measure noise factors for the proposed strategy

事实上,箱粒子滤波同样适用于解决非线性非高斯跟踪问题.本文选择具有普遍意义的闪烁噪声[35−36]模拟非高斯噪声,闪烁噪声与高斯噪声的主要差别在于尾部较长.一般地,闪烁噪声可以分解为高斯噪声和具有“厚尾”特性的噪声之加权和[35−36],即f(g)=(1−ξ)fN(g)+ξfI(g),其中,f(g)为闪烁噪声,fN和fI分别为高斯和大方差高斯分布,其协方差分别为ΣN和ΣI,ξ为闪烁噪声概率,0<ξ <1.本文基于以上非高斯模型,设定,σθ=0.25°,σr=2.5 m,闪烁噪声概率ξ=0.2,ΣI=K ·ΣN,并在K分别取值为5,10,20,50,100 的条件下进行MC 仿真,进而对多目标状态估计的OSPA 均值进行统计分析.如图9 所示,随着K的不断增大,厚尾程度越严重,相应的多目标状态的估计精度不断下降.但从OSPA所呈现出的总体趋势来看,面对不同厚尾程度的非高斯噪声,所提算法仍能以较好的精度跟踪多目标,这也证明了本文所提方法对典型的非高斯噪声具有较好的适应性.

图9 所提方案中不同K 值对估计性能的影响Fig.9 Tracking performance of different K values for the proposed strategy

在本文所提算法中,传感器速度也会在一定程度上影响多目标状态的估计精度.本文结合实际的场景设置,分别在设定不同的传感器速度的基础上进行MC 仿真,并统计多目标跟踪估计的OSPA 均值.如图10 所示,可以看出,传感器速度的不同设定会对多目标跟踪精度产生影响,而速度为20 m/s时,多目标估计精度较好.总体而言,随着传感器速度的增大,多目标估计精度似乎在一定范围内进行有限的优化.可以理解的是,传感器的速度越大将会使传感器越快到达“最佳”观测区域.但也不是传感器速度越快就越好,因为在离散时间动态系统中,传感器每周期内的控制距离过大,也可能会使传感器“错过”最优观测位置.

图10 所提方案中不同的传感器速度对估计性能的影响Fig.10 Tracking performance of different sensor speeds for the proposed strategy

为了详细说明由于分量删减所产生的不同的高斯混合分量个数对多目标状态估计精度和计算复杂度的影响,本文分别在rm和wm不同取值的情况下进行MC 仿真,并在表4 中对多目标状态估计的OSPA 和对应运行时间进行对比分析.可以看出,随着rm和wm的不断减小,越多的高斯分量参与近似多目标密度.多目标密度的近似程度越高,所提出的多目标概率密度间的信息增益的计算也就越精确,传感器控制的效果也就越好,这最终反映在多目标状态的OSPA 上.很显然,随着阈值的不断减小,多目标的跟踪效果也在不断优化.但这种优化是有限度的,阈值小到一定程度并继续减小,跟踪精度并没有得到显著的提高,算法的计算花销却在显著提高,这严重影响了多目标跟踪中传感器管理的计算效率.因此,当进行传感器控制时,需要控制高斯分量个数来平衡多目估计精度和计算复杂度.本文中设定rm=0.5,wm=0.2,此时被提取的高斯混合分量在事实上几乎涵盖了所有的多目标信息,在保证估计精度的同时,也有着不错的运行速率.

表4 不同高斯分量个数的性能比较Table 4 Tracking performance comparison of different Gaussian components

图11(a)给出了RBT 在200 次MC 仿真中,方案一所遍历的所有传感器控制位置及与目标的相对位置.可以看出,随着多目标的不断变化(新生、消亡及状态的变化),传感器总会及时调整自身的位置以适应目标的不确定性所带来的多目标状态空间分布的变化.如图11(b)(传感器轨迹云放大效果图),尽管跟踪场景中存在诸多随机因素,导致每次MC仿真中的传感器运动轨迹都不大可能一致,但该轨迹云仍能够充分展示传感器轨迹控制的总体趋势.

图11 所提方案的传感器控制轨迹Fig.11 Sensor control trajectories for the proposed strategy

7 结论与展望

本文的主要工作是基于区间不确定性推理,利用Box-CBMeMBer 滤波器提出了基于信息测度的传感器控制策略.文中首先利用箱粒子实现Box-CBMeMBer 滤波器,并通过一组带有权值的箱粒子来表征多目标后验概率密度函数.其次,利用箱粒子的高斯分布假设,将多伯努利密度近似为高斯混合.随后,选择CS 散度作为评价函数,并详细推导了两个高斯混合之间的CS 散度的求解公式,以此为基础提出相应的传感器控制策略.该方法也是本文提出的最为核心的基于区间不确定性推理的传感器控制方案.此外,作为一种对比方案,本文利用蒙特卡罗方法,即通过对箱粒子进行混合均匀采样,进而利用点粒子求解CS 散度提出了相应的控制策略.后一种方案符合粒子滤波解决传感器控制问题的传统思路,但它的计算效率还是要明显低于所提出的箱粒子高斯近似的传感器控制策略.最后,通过几种经典方案的对比,验证了所提算法的有效性.所提方法的意义在于,通过对传感器控制策略合理近似求解,成功将Box-CBMeMBer 滤波器与现代传感器管理系统相结合.这对于广泛存在着区间不确定性的现实多目标跟踪系统的管理与控制具有重要的理论价值.显然,所提方法可以进一步推广到基于现代高分辨率传感器的多扩展目标跟踪问题中,未来对利用区间不确定性推理解决多传感器管理也具有重要的参考价值.