文元全
(大连海事大学 轮机工程学院,大连 116026)
周 锐 吴雯漫
(北京航空航天大学 自动化科学与电气工程学院,北京 100191)
孔繁峨
(中国航空工业集团公司 洛阳电光设备研究所,洛阳 471009)
异构多无人机协同目标跟踪分散化最优控制
文元全
(大连海事大学 轮机工程学院,大连 116026)
周 锐 吴雯漫
(北京航空航天大学 自动化科学与电气工程学院,北京 100191)
孔繁峨
(中国航空工业集团公司 洛阳电光设备研究所,洛阳 471009)
针对主被动传感器协同目标跟踪需要,考虑到可扩展性、异构性和动态可重构性等特点,建立了适于不同测量类型和不同测量维数的异构多传感器分散化信息融合算法.以极大化信息融合所得到的信息熵及无人机(UAV,Unmanned Aerial Vehicles)观测信息质量为效能函数,建立了异构多 UAV协同目标跟踪的分散化最优控制代价函数以及通信、防撞和控制等约束模型.实现了多 UAV协同目标跟踪的分散化模型预测控制,并分析了通讯噪声等因素对分散化信息融合和协同控制的影响.
目标跟踪;协同控制;信息融合;模型预测控制;无人机
近年来,以任务和信息相耦合的多 UAV(Unmanned Aerial Vehicles)协同问题越来越受到关注和广泛研究.通过协同可以完成单个 UAV所不能完成的一些复杂任务[1].多 UAV协同目标感知是多平台协同主要形式之一[2],通过协同可以得到单平台所不能得到的一些信息.通过携带光电被动探测设备的多平台协同作用,可以实现对目标的协同定位,进而实现静默攻击.另外,也可以通过主、被动传感器的结合,实现异构型多运动平台的分散优化与协同控制[3].
多传感器数据融合技术是多 UAV协同目标跟踪的关键技术之一.经典卡尔曼滤波算法在异构探测器的多平台分散化协同目标跟踪应用中遇到了诸多困难,而信息滤波算法以其易解析为简单代数叠加之形式,并具有较好的可扩展性、异构性和动态可重构性等特点[3-4],获得广阔的应用前景.
在多 UAV的协同控制环境中,平台的运动、敏感及通信通道故障等原因,使得集中控制变得非常困难,集中控制系统缺乏基本的鲁棒性和隐蔽性.分散控制系统则能较好解决这些问题[5].
本文主要研究分别具有主动雷达和被动红外的异构多 UAV分散化协同目标跟踪方法.
考虑线性系统:
其中,x(k)为 n维状态向量;F(k)为状态传递矩阵;G(k)为噪声输入传递矩阵;w(k)为零均值不相关的高斯白噪声;Q(k)为其噪声方差阵.
非线性观测模型为
其中,z(k)为测量值;v(k)为均值为零、方差为R(k)的高斯白噪声;h(·)为非线性测量模型.
线性化观测方程为
其中,H(k)为 Jacobian矩阵.
卡尔曼滤波得到的是目标状态估计 x^及方差P,而信息滤波得到的是信息状态 y^及费歇信息Y.满足关系[4]:
其中,i(k)为观测向量 z(k)的信息状态分布;I(k)为信息矩阵.i(k),I(k)维数仅与目标状态维数有关,与传感器测量维数无关.信息滤波可以分为预测和估计两个过程.
预测过程:
估计过程:
估计结果:
设有 n个 UAV,每个 UAV的观测方程为
分散化信息融合算法在对 y^(k|k)及 Y(k|k)进行更新时,除了考虑 UAV自身的 I(k)和 i(k),还要考虑临近 UAV的通信信息.
假设Ni(Ni<n)表示与第 i个 UAV具有通信连接的其它所有 UAV集合,则通信拓扑可表示为
融合通信邻域内所有 UAV的 I(k)和 i(k):
卡尔曼滤波器的估计值不能表示成各 UAV观测信息简单线性叠加的形式[4],即
由此可见,以信息滤波为基础的分散化信息融合算法可以通过简单的代数和来融合其它UAV的信息[6],因而具有较好的可扩展性、异构性和动态可重构性.信息滤波算法对初始值的选取具有良好的鲁棒性,在得不到系统确切的初始统计特性时,选取小的非零初始值即可迭代计算[7],从而克服了卡尔曼滤波算法对初始值选取比较敏感的问题.
分别携带主动和被动传感器的两个 UAV对运动目标位置和速度进行分散化协同估计:
其中,T为采样周期;(xi(k),yi(k)),φi(k)分别为 UAV的位置和方位角;ui(k)为 UAV控制量,这里指 UAV的偏航角速率.
设 UAV-i携带被动光电探测器,观测模型为
其中,θi(k)为目标的方位角;(xf(k),yf(k))为目标位置;vi(k)为零均值高斯白噪声,方差.hi(k)的 Jacobian矩阵为
设 UAV-j携带主动雷达探测器,观测模型为
其中,r(k)为相对距离;vj(k)为零均值高斯白噪声,方差(k)的 Jacobian矩阵为
进而可得到两个 UAV的信息状态及信息矩阵 i(k),I(k),UAV之间通过数据链交换各自的信息 i(k)和 I(k),实现分散化信息融合.得到本地信息及目标状态的分散化估计为
由此可见,分散信息融合与 gij(k)有关,UAV之间传输的信息仅是 I(k)及 i(k),而不是传感器的原始测量信息.由定义可知,I(k)及 i(k)与观测向量维数无关,仅与目标状态的维数有关,因此对异构传感器,只要目标状态维数相同,分散信息融合算法就可将各 UAV传输信息I(k)及 i(k)直接线形叠加,不必考虑各传感器的类型和测量维数,而且对通信拓扑和 UAV数量的改变具有很强的适应性.
分散化信息融合与协同控制是基于局部不完全通信,则通信拓扑、数据可靠性、通信延迟、噪声和数据包丢失等情况对融合结果具有影响.考虑以上主要因素后的信息融合结果为
其中,0<αij(k)≤1为第 j个 UAV向第 i个 UAV传输信息的可靠性程度;τij和 Cij分别为通信延迟和通信噪声方差.可见,UAV数量越多,累积通信噪声的影响越大.
仅考虑 UAV之间通信噪声影响,且假设同一信道双向传递时的通讯噪声相等,即
通讯噪声与传输距离、信号功率、频率、量级及信道比特数等因素[8]有关.这里采用较为简单通讯噪声方差模型[9]:
其中,SNR为信噪比;μ>0为通信通道质量常量;dij为 UAV之间的距离.
通信拓扑范围内 UAV数量越多,累积通信噪声影响越大.所以在增加 UAV数量以提高信息冗余度的同时,应综合考虑通信噪声的影响.另外,UAV之间距离越小,通讯噪声也越小.因此,为提高跟踪精度而缩短 UAV与目标之间的距离时,应综合考虑通过提高通讯质量来提高跟踪精度,进而降低对缩短距离的要求,以提高 UAV安全性.
UAV协同目标跟踪任务是获得目标状态的最佳估计,并降低目标状态估计的不确定性程度.因此,选择分散信息融合得到的目标状态估计的信息熵(IE,Information Entropy)作为分散协同最优控制的性能指标[4],即
其中,JIE,i(·)为分散协同最优控制的代价函数.
信息融合精度还依赖于传感器对目标的观测信息质量,一般来说,传感器距目标之间的距离越近,观测信息的质量越高.
假设 UAV在固定高度上对目标进行观测,则UAV距目标之间的距离主要取决于 UAV在地面投影与目标之间的距离.此时可以考虑分散协同控制总的代价函数为[10]
其中,w1,w2,w3分别为 UAV控制量、目标状态估计的信息熵以及 UAV在地面投影与目标之间距离的加权值.
UAV偏航角速度约束为
UAV之间防撞距离约束 d1为
UAV之间通信保障距离约束 d2为
采用滚动优化(模型预测控制)方法得到UAV的分散最优协同控制策略为
采用控制器参数化或分段线性化方法实现对UAV的分散最优协同控制策略的优化,具体描述见文献[10-11].
将控制输入 ui的滚动优化时域 T′=t2-t1等间隔地划分成 np∈{1,2,…}等分,每等分的时间长度为 Δtp,因此,T′可表示为
在每个 Δtp内,根据对应分段区间内的控制输入作用,对 UAV模型进行数值积分、迭代运算.
T′被划分为 np等分 ,在 T′内 ,第 i架 UAV的连续控制输入 ui可以采用常量分段函数近似地表达为
在考虑 ui,d1和 d2情况下,两个 UAV对一个静止目标进行探测和定位,并考虑通信噪声的影响.假设 UAV-1为既能探测距离又能探测方位的雷达探测器,UAV-2为只能探测方位的红外探测器.仿真结果如图 1~图 3所示.
图1 UAV协同目标跟踪的运动轨迹
图2 x方向分散化协同估计误差
从仿真结果可以看出:通讯噪声对分散协同目标跟踪结果及误差收敛性具有明显的影响.且通讯噪声与距离有关,距离越近,通讯信噪比越高,因此 UAV协同目标跟踪最优控制运动轨迹有相互靠近的趋势.
图3 y方向分散化协同估计误差
基于分散化信息融合算法实现了对携带主、被动传感器的异构多 UAV协同目标跟踪的分散化最优协同控制.分散化信息融合算法不受 UAV传感器数量、类型、观测维数的限制,具有较好的异构性和可扩展性.另外,通信噪声对协同目标跟踪性能尤其是收敛性影响较大,因此,在增加UAV数量以提高信息冗余度的同时,应综合考虑累积通信噪声的影响.减小 UAV之间的通信距离,可降低通信噪声,进而提高对目标的跟踪精度.
References)
[1]Samad T,Bay JS,Godbole D.Network-centric systems form ilitary operations in urban terrain:the role of UAVs[J].Proceedings of the IEEE,2007,95(1):92-107
[2]Beard RW,McLain TW,Nelson D B,et al.Decentralized cooperative aerial surveillance using fixed wing miniature UAVs[J].Proceedings of the IEEE,2006,94(7):1306-1324
[3]Mathews G M,Durrant-Whyte H F,Prokopenko M.Scalable decentralised decision making and optim isation in heterogeneous teams[C]∥2006 IEEE International Conference on Multisensor Fusion and Integration for Intelligent Systems,MFI.Piscataway,NJ,United States:Institute of Electrical and Electronics Engineers Inc,2006:383-388
[4]Grocholsky B.Information-theroretic control of multiple sensor platforms[D].Sydney:University of Sydney,2002
[5]Fax JA,Murray R M.Information flow and cooperative control of vehicle formations[J].IEEE Trans on Automatic Control,2004,49(9):1465-1476
[6]Nettleton E,Ridley M,Sukkarieh S,et al.Implementation of a decentralised sensing network aboard multiple UAVs[J].Telecommunication Systems,2004,26(2-4):253-284
[7]李啸,张洪钺,邱红专.基于分散化信息滤波的移动机器人定位[J].航天控制,2004,22(3):4-8 Li Xiao,Zhang Hongyue,Qiu Hongzhuan.Mobile robot localization using decentralized extended information filtering[J].Aerospace Control,2004,22(3):4-8(in Chinese)
[8]李啸.基于多传感器信息融合的移动机器人定位[D].北京:北京航空航天大学自动化科学与电气工程学院,2006 Li Xiao.Mobile robot localization using multisensor information fusion[D].Beijing:School of Automation Science and Electrical Engineering,Beijing University of Aeronautics and Astronautics,2006(in Chinese)
[9]Mostofi Y,Chung T H,Murray R M,et al.Communication and sensing trade-offs in decentralized mobile sensor networks:a cross-layer design approach[C]∥2005 Fourth International Symposium on Information Processing in Sensor Networks.Los Angeles,CA,United States:Institute of Electrical and Electronics Engineers Computer Society,2005:118-125
[10]Geiger B R,Horn JF,Delullo A M.Optimal path planning of UAVs using direct collocation with nonlinear programming[C]∥Collection of Technical Papers-AIAA Guidance,Navigation,and Control Conference 2006.Keystone,CO,United States:A-merican Institute of Aeronautics and Astronautics Inc,2006:1257-1269
[11]Furukawa T,Whyte H F,Bourgault F,et al.Time-optimal coordinated control of the relative formation of multiple vehicles[C]∥Proceedings 2003 IEEE International Symposium on Computational Intelligence in Robotics and Automation.Kobe,Japan:[s.n.],2003:259-264
(编 辑:刘登敏)
Decentralized optimal control of multiple heterogeneous UAVs in cooperative target tracking
Wen Yuanquan
(Marine Engineering College,Dalian Maritime Universitiy,Dalian 116026,China)
Zhou Rui Wu Wenman
(School of Automation Science and Electrical Engineering,Beijing University of Aeronautics and Astronautics,Beijing 100191,China)
Kong Fan'e
(Luoyang Institute of Optic-Electronic Equipment,China Aviation Industry Corporation,Luoyang 471009,China)
The decentralized information fusion algorithms for multiple heterogeneous sensors platforms with different types and dimensions was developed to meet the needs of the target tracking with active and passive sensors.The decentralized information fusion algorithm was scalable,heterogeneous and reconfigurable.The performance cost function and constraints model of communication,collision avoiding and control for decentralized optimal control of multiple heterogeneous unmanned aerial vehicles(UAV)in cooperative target tracking were established to maximize the local information entropy obtained by information fusion and the quality of information observed by each UAV.The cooperative target tracking based on multiple heterogeneous UAV was implemented using decentralized model predictive control.The effects of imperfect communication on decentralized information fusion and cooperative control were investigated.
target tracking;cooperative control;information fusion;model predictive control;unmanned aerial vehicles
TP 273+.1
A
1001-5965(2010)05-0545-05
2009-10-14
国家自然科学基金资助项目(60975073);博士点基金资助项目(20091102110006);航空科学基金资助项目(2008ZC 13011)
文元全(1967-)男,辽宁大连人,博士生,wyq@dlmu.edu.cn.