基于Renyi熵的非线性系统中传感器管理算法

2013-08-29 09:17崔博鑫许蕴山
电光与控制 2013年7期
关键词:增量威胁滤波

崔博鑫,许蕴山

(空军工程大学航空航天工程学院,西安 710038)

0 引言

传感器管理就是对一组传感器进行自动控制的系统或过程。其目的是选择恰当的传感器、传感器工作模式和传感器搜索方式以优化数据融合系统完成指定目标任务的性能[1]。信息的变化可用于描述目标的检测、跟踪和分类等的不确定性。在统计模型和运动模型下,Kruger等[2-4]给出了利用Shannon信息熵信息增量对传感器资源进行分配的算法。最近,基于Renyi熵的新理论开始广泛应用[5-6],Santamaria[7]首次把Renyi熵作为代价函数用到常数模算法中,使得收敛速度显著提高而计算量却增加很少。

在系统状态估计中,大部分系统都具有一定的非线性问题,Bar-Shalom[8]提出了递推滤波算法,包括扩展卡尔曼滤波(EKF)、修正增益的推广卡尔曼滤波(MGEKF)等。但EKF和MGEKF只适用于滤波误差和预测误差都比较小的情况,否则,收敛精度、收敛时间及稳定性等会降低,滤波不稳定甚至发散[9-10]。本文针对非线性系统中高机动的情形,运用无迹卡尔曼滤波(UKF)进行状态估计,减少滤波误差与预测误差。用Renyi熵度量在滤波过程中产生的信息不确定性,以Renyi信息差异作为传感器分配的代价函数,合理分配传感器资源。

1 Renyi信息差异

1.1 Renyi熵

Shannon熵是对信源输出信息的随机性的度量,当所有状态出现的概率都相等时,熵最大,这时系统的随机程度也最高。Renyi熵进一步扩展了Shannon熵的概念,反映了系统信息的高阶特性。

对一个具有概率密度函数PX(x)的连续分布的随机变量X的α阶Renyi信息熵的定义为

当α→1时,α阶的Renyi熵趋近于Shannon熵,即

当α=2时

上式称为二次Renyi熵,对应于二项概率分布。Kapur[11]指出这种交替定义的Renyi熵等价于基于最大化熵的Shannon熵。

1.2 Parzen窗函数

由于Renyi信息熵的计算需要对概率密度函数进行非线性运算,必须采用窗函数来获得对概率密度函数的近似估计。Koenderink[12]指出连续变量的二次Renyi熵可以通过非参数法即带核函数的Parzen窗来估计,文献[13]中证明了当二次Renyi熵度量结合使用高斯核的Parzen窗时能大大节省计算量。

假设已知随机变量X的样本数据集为:{xi,i=1,2,…,N},采用Parzen窗估计X的概率密度函数PX(x)的算式为

由于系统为高斯分布,采用高斯核函数:

1.3 Renyi信息增量

利用Parzen窗函数及高斯核函数,得到高斯分布下的Renyi熵为

将两种Renyi熵的差值作为Renyi信息增量,用来表征信息不确定性的变化量

从上式可以看出,高斯分布下的信息不确定性的差异仅跟分布中的方差有关,Renyi熵的信息增量在一定程度上收敛于Shannon熵的信息增量。

2 无迹卡尔曼滤波

无迹卡尔曼滤波(UKF)是在无迹变换[14]的基础上发展起来的,不需要对非线性状态和量测模型进行线性化,而是对状态向量的概率密度函数进行近似化,近似化后的概率密度函数仍然是高斯的,但它表现为一系列的采样点。

设如下非线性模型

式中:Xk∈Rn为系统状态;f(·)为n维向量函数;h(·)为m维向量函数;Wk为n维系统过程噪声;Vk为m维系统观测噪声。则无迹Kalman滤波计算过程如下。

1)初始化。

式中:Xa为系统的增广状态变量;RW和RV为过程噪声和观测噪声协方差矩阵;E表示期望运算。

2)U变换。

选取Sigma点

3)时间更新。

4)量测更新。

在U变换中,

式中:α为采样点的散布程度,α>0,它可以调节粒子的分布距离,降低高阶矩的影响,减少预测误差;β为先验分布信息,β≥0,可以提高方差的精度,控制估计状态的峰值误差;nx为系统维数;k为影响分布的尺度因子,多维系统选择k=3-n可以使均方误差最小;W(m)和W(c)分别是一阶统计特性的权系数和二阶统计特性的权系数。

3 传感器管理模型

3.1 代价函数

在Renyi熵的基础上,Renyi信息增量反映预测误差和滤波误差中信息不确定性的变化量,得到代价函数

设目标有m个,传感器有n种,由传感器组成的伪传感器(即传感器组合)共有2n-1种。考虑目标威胁度[15],影响因素包括目标类型、目标速度、目标高度、距掩护对象的距离、航路捷径及电子干扰能力。结合目标优先级,即威胁度,将代价函数J与威胁度w结合,得到效能函数

式中:wi代表目标i的威胁度;λ为威胁度的权系数。

3.2 传感器对目标的最优分配

在一个多传感器系统中,优化的目的是使传感器分配给目标后所取得的效能最大,由最优线性分配思想,得到传感器分配方案。

约束条件为

式中:xij≥0,对所有i,j均成立;τk表示第k个传感器所能跟踪目标的最大个数;S(k)为包含传感器k的所有伪传感器构成的集合。在线性优化中,xij为1或者0,等于1时,表示第i个传感器被分配给第j个目标。

4 仿真分析

威胁度为0.87。

在UKF滤波中,U变换的各项系数α取0.01,β取2,κ取-1,λ=-3.9997。

根据UKF中的预测误差协方差和滤波误差协方差,用Renyi信息增量度量代价函数,结合目标威胁度,计算效能函数,最后获得传感器管理分配方案。图1表示目标真实运动轨迹与基于Renyi熵的管理方案跟踪轨迹,图2表示在跟踪过程中,3个目标产生的Renyi熵信息增量。

图1 目标运动轨迹与Renyi熵跟踪轨迹Fig.1 Motion track of target and Renyi entropy

图2 3个目标的Renyi熵信息增量Fig.2 Renyi entropy information gain of three targets

从图1中可以看出,3个目标经过Renyi熵信息增量的分配方法,跟踪效果较好。图2中,在迭代的初期,由于目标不确定性极大,故Renyi熵信息增量也在不断增大,随着迭代次数的增加,滤波、分配效果逐渐明显,Renyi熵信息增量不断降低。其中,目标3由于其大机动、变加速的特点,滤波误差较大,Renyi熵信息增量也相应提高,给予更多的传感器资源,但在迭代后期,Renyi熵信息增量仍比其他两种目标大,符合实际情况,说明本算法有效。

为了进行对比,参照顺序分配方法,得到Renyi熵分配方法与顺序分配方法的误差,图3~图5分别为3个目标在两种算法下的均方误差。

由图3~图5可以看出,基于Renyi熵信息增量的传感器分配方法能有效反映目标跟踪过程中的不确定性,合理分配传感器资源,增强跟踪效果。针对匀速、匀加/减速、变加速大机动目标,其均方误差小于顺序分配方法,证明该算法有效。

图3 目标1的均方误差Fig.3 Mean square error of target 1

图4 目标2的均方误差Fig.4 Mean square error of target 2

图5 目标3的均方误差Fig.5 Mean square error of target 3

当系统资源无法满足目标的精度要求时,会直接导致分配算法无解,无法形成有效的分配方案。可以采取两种方法:1)调整目标的威胁度,即给予高威胁目标优先打击,例如本例中目标3为变加速大机动模型,可以适当提高威胁度,而目标1为匀速运动模型,降低其威胁度;2)等比例降低目标的精度要求,即将3个目标的Renyi熵信息增量乘以衰减因子,使得系统资源满足精度要求,从而得到有效解。

5 结束语

本文利用Renyi熵结合Parzen窗函数,准确地度量了UKF过程中信息的不确定性,以Renyi熵信息差异为代价函数,与目标威胁度构成了效能函数,合理地分配传感器资源。仿真结果表明,与顺序分配方法相比,Renyi熵分配方法能够增强跟踪效果,对于变加速、大机动目标分配更多资源,该算法合理有效。

[1]MUSICK S,MALHOTRA R.Chasing the elusive sensor management[C]//Proceedings of the IEEE NAECON,New Jersey:IEEE,1994:606-613.

[2]KRUGER A B.Integrated tracking and sensor management based on expected information gain[C]∥Proceedings of SPIESignal Processing,Sensor Fusion,and Target Recognition,2007,6567:65670C1-C11.

[3]KREUCHER CM,HERO A O,KASTELLA K D,et al.An information-based approach to sensor management in large dynamic networks[J].Proceedings of IEEE,2007,95(5):978-999.

[4]周林,刘先省,金勇.一种非线性融合系统中的传感器管理方法[J].系统工程与电子技术,2006,28(7):1064-1066.

[5]HILD K E,ERDOGMUSE D,TORKKOLA K,et al.Feature extraction using information theoretic learning[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(9):1385-1392.

[6]BONEV B,CAZORLAM E F.Feature selection,mutual information,and the classification of high-dimensional patterns[J].Pattern Analysis and Applications,2008,11(3/4):309-319.

[7]SANTAMARIA I,PANTALEON C,VIELV A L,et al.Fast algorithm for adaptive blind equalization using order——a Renyi's entropy[C]//ICASSP IEEE,13-17 May 1520-6149,0-7803-7402-9,2002,3:Ⅲ-2657-Ⅲ-2660.

[8]BAR-SHALOM Y,LI X R.Estimation and tracking:Principles,techniques and software[M].Artech House,Boston,MA,1993.

[9]申石磊,刘先省,潘泉.基于运动模型的一类传感器管理方法[J].电子学报,2002,30(2):201-204.

[10]PACHTER M,CHANDLER P R.Universal linearization concept for extended Kalman filters[J].IEEE Transaction on Aerospace and Electronic Systems,1993,29(3):946-961.

[11]KAPUR JN.Measures of information and their applications[M].New York:Wiley-Interscience,1994.

[12]OENDERINK JJ,VAN DOORN A J.Surface shape and curvature scales[J].Image and Vision Computing,1992,10(8):557-565.

[13]WU Zhaohui,WANG Yueming.3D face recognition using local shape map[C]//ICIP 2004:IEEE International Conference on Image Processing.Washington,DC:IEEE Press,2004:2003-2006.

[14]JULIER S,UHLMANN J K.A general method for approximating nonlinear transformations of probability distributions[R].Technical Report,1994.

[15]范春彦.基于最大隶属度的目标威胁评估与排序法[J].系统工程与电子技术,2003,25(1):47-48.

猜你喜欢
增量威胁滤波
导弹增量式自适应容错控制系统设计
提质和增量之间的“辩证”
人类的威胁
“价增量减”型应用题点拨
受到威胁的生命
面对孩子的“威胁”,我们要会说“不”
基于均衡增量近邻查询的位置隐私保护方法
基于自适应Kalman滤波的改进PSO算法
RTS平滑滤波在事后姿态确定中的应用
基于线性正则变换的 LMS 自适应滤波