张毅,方国伟,杨秀霞,*,严瑄
(1.海军航空大学航空作战勤务学院,烟台 264001; 2.海军航空大学岸防兵学院,烟台 264001)
无人机(Unmanned Aerial Vehicle,UAV)编队控制[1-2]一直以来都是研究的热点问题之一,将UAV编队与特定任务结合起来进行研究更具有实际工程意义。
多UAV目标跟踪[3-4]是指多架UAV保持定高飞行状态下,在目标周围均匀分布跟踪或进行盘旋跟踪的任务,通常被应用在人员搜救与对地面或海面目标进行探测等。在UAV与目标相距较远的情况下,若令多UAV直接飞行至目标周围将会影响UAV任务执行的成功率,因此,通常需要在飞往目标的途中形成预定的编队队形。Zhang和Liu[5]研究了基于虚拟编队结构的多UAV目标跟踪问题,确保了在跟踪目标前形成圆形编队,并通过虚拟无人机与目标间的制导律设计实现整个编队对目标的跟踪。然而双制导律的设计加大了算法的复杂度,因此,如何进行编队控制与目标跟踪一体化设计是一个值得考虑的问题。
无论是在编队队形形成过程中,还是目标跟踪过程中,UAV间都需要保持连续的通信和控制更新来保持编队队形。UAV间的信息通过通信网络进行传输,而通信网络带宽与计算资源十分有限,因此,如何在编队目标跟踪过程中降低UAV间通信的压力也是一个亟需解决的问题。
为了克服UAV间连续通信和控制更新的压力,出现了基于固定时间的触发控制方法[6-7],即通过周期性通信与控制更新的方式,减少UAV间的通信次数,从而缓解通信压力。然而从资源实际利用角度而言,采用周期性通信方式仍会在一定程度上造成资源不必要的浪费。
在这种背景下,事件触发策略[8-10]得以发展,其基于设定的事件触发条件来确定是否进行UAV间的通信,仅利用上一触发时刻的状态来决定下一触发时刻,在此期间邻接UAV间无需进行通信,即避免了相互间的连续通信[11]。然而事件触发机制可能出现“Zeno行为”,即在有限的时间内出现了无限多次的事件触发事件[12]。Yang等[13]基于有向拓扑研究了分散式事件触发一致性算法,使得智能体间无需连续通信,但其在设计触发函数时仅使用了自身的触发时刻状态值,造成了一定程度上的资源浪费;Deng等[14]针对多智能体编队队形跟踪问题,基于自适应控制设计了相应的触发条件,避免了连续通信;Chen等[15]针对输入饱和与切换拓扑下的多智能体系统,分别提出了集中式与群体性的事件触发机制,并证明了无“Zeno行为”;Xu和He[16]研究了多领导者的编队事件触发控制问题,将群体分成多个组,通过组间关联实现群体间的控制,且设计了最小时间间隔常数,确保了不存在“Zeno行为”;Xu等[17]基于Leader-Follower编队结构,针对不同的拓扑结构分别提出分布式、集中式和集群式事件触发结构,实现了Follower对Leader的跟踪,且降低了控制更新的频率,然而其在设计触发函数时,采用连续的邻接UAV信息,通信压力没有得到缓解。
结合当前的研究现状可知,要想将事件触发策略融入到多UAV编队目标跟踪问题中,所需要解决的主要难点在于:①设计一种满足事件触发机制的编队控制与目标跟踪一体化算法结构;②设计编队目标跟踪控制律和事件触发函数,并保证系统不出现“Zeno行为”。
本文提出了一种满足事件触发的多UAV编队目标跟踪控制算法。首先,基于参数组的目标跟踪模型设计了具备事件触发机制的目标跟踪控制算法,确定了算法中各模块的功能;其次,给出了基于事件触发的分布式目标跟踪控制律,设计了事件触发条件,并且为了防止“Zeno行为”的出现,设计了最小触发间隔系数,同时给出相应的稳定性证明;最后,仿真证实了所设计的事件触发策略能够在降低UAV间通信频率和控制输入更新频率的情况下实现编队跟踪目标的要求。
考虑到研究背景为UAV保持定高状态下的目标跟踪问题,因此可在二维平面展开研究。考虑N架无人机的运动学方程为
考虑应用2架虚拟UAV导引的目标跟踪控制算法,选择虚拟UAV运动模型为
引理1[16]若(A,B)是稳定的,则对于任意的α>0,存在一个正定矩阵P>0,满足Riccati不等式:
通过构造有向图G1与G2来分别表示UAV间的通信拓扑关系及UAV与虚拟UAV间的通信拓扑关系。定义G1=(V1,ε1)和G2=(V2,ε2),V1和V2分别表示UAV 的集合及UAV 与UAVm(m∈{l,b})的集合,ε1和ε2分别为UAV间连通关系的集合及UAV与UAVm间连通关系的集合,且(UAVi,UAVj)∈ε1表示UAVi可以接收到来自UAVj的信息,定义UAVi的邻居集合为Ni={j:(i,j)∈ε1,j∈V1,i≠j},(UAVi,UAVm)∈ε2表示UAVi可以接收到来自UAVm的信息。分别定义邻接矩阵A1=[aij]∈RN×N和A2=[aim]∈RN×2,且满足:定义H =L+diag{a1b,a2b,…,aNb},其特征值按升序排列为0≤λ1≤…≤λN。
假设1 考虑UAV系统(3)和(4)中,在UAVm与UAVi之间至少存在一条可达的信息通路,且能够满足各UAVi接收到UAVm的信息是相同的。
假设2 (A,B)是稳定的。
基于上述运动模型与问题背景,考虑控制目标为:针对UAV系统(3)和(4),通过设计一种具有事件触发机制的目标跟踪控制算法,使得多UAV能够在跟踪上目标的前提下实现尽可能少的机间通信和控制更新,减少机间通信压力和机载信息处理压力。
基于事件触发机制,提出一种多UAV编队目标跟踪控制算法,如图1所示。所设计的多UAV编队目标跟踪控制结构中主要包含3部分,分别为编队控制架构、目标跟踪控制架构及事件触发控制架构。
图1 基于事件触发的编队目标跟踪控制示意图Fig.1 Schematic diagram of formation target tracking control based on event-triggered mechanism
以下分别针对基于参数组的目标跟踪模型和事件触发目标跟踪控制算法的控制流程进行描述。
UAV编队目标跟踪问题通常需要考虑2个方面:一是多UAV编队队形的形成;二是编队如何在保持编队队形的基础上跟踪上目标。为此,基于平移、旋转与缩放3种基本运动,提出一种动态编队的队形描述方法,同时通过引入虚拟UAV追踪目标的方法,实现在动态队形保持的情况下达到跟踪上目标的目的。
考虑编队目标跟踪过程中需要完成3项基本运动,其中,平移运动表示编队的整体飞行轨迹,即UAVl的飞行轨迹;旋转运动表示UAV间的相位调整;缩放运动表示编队大小的调整。定义编队旋转因子Ri(t);编队缩放因子ri(t)∈R表示UAVi相对UAVl的距离。定义编队因子为
式中:pb=(cos(θb(t)),sin(θb(t)))T,θb(t)=ωt,ω 为 UAVb的 旋 转 角 速 度, ω =
图2 UAVl追踪目标示意图Fig.2 Schematic diagram of UAVl tracking a target
为了能够将事件触发机制与基于参数组的目标跟踪模型更好地结合起来,必须预先设定满足要求的、具有事件触发的目标跟踪控制算法流程。
由于考虑UAV间是非连续通信的,需要在无通信期间对状态xi(t)进行估计,估计值的精准度对于事件触发条件的判定是十分重要的,不同于文献[18-19]采用零阶保持器作为状态估计器,为了获得更精准的估计值,对状态量的估计值^xi(t)采用如下形式:
步骤8 信息交互网络。负责接收与发送UAV触发时刻的状态信息。
步骤9 UAVl信息更新。通过对目标运动方向估计,确定当前时刻UAVl的运动方向为
步骤10 重复步骤3~步骤9。
上述步骤中,α、fi(t)、τi和Δtiki的具体定义将在下文进行介绍。
结合定义2,给出的基于事件触发的目标跟踪控制律为
根据控制律形式可以得知,控制输入ui取决于当前时刻的估计状态,由式(13)可知,状态估计值在触发时刻就已经确定了,这说明控制输入在触发时刻就已经确定了,即在2次触发的间隙不再需要对控制输入进行更新,从而减轻了机载设备的数据处理负担。
从式(17)与式(18)中可以发现,文献[17]需要连续的邻接UAV信息来满足对事件条件的判别,文献[13]的触发函数仅使用自身状态信息,不同于文献[17]与文献[13],以下将提出一种仅利用UAV与其邻接UAV状态的估计值设计的触发函数,即仅使用触发时刻的状态值的触发函数。
定理2 在假设1和假设2成立的前提下,且满足式(21)的情况下,多UAV系统能够实现期望的编队队形且跟踪上目标,同时所设计的事件触发系统能够确保2次事件间的时间间隔满足0<τi≤τ,同时满足:
证明 同定理1证明相似,此处同样需要证明式(26)是成立的,即证明式(29)成立,但与定理1不同的是,此处是针对M2(t)进行讨论。
为了获取τ,类似式(31)选择式(26)的一个充分条件为
对其求导可得
对于式(38)而言,其满足ψ(t)≤ϕ(t,ϕ0),其中,ϕ(t,ϕ0)为等式的解。
为证实本文所提出的基于事件触发的多UAV编队目标跟踪控制算法的可行性与优越性,考虑以4架UAV(即N=4)对目标进行跟踪,UAV间的通信拓扑关系如图3所示。
图3 通信拓扑Fig.3 Communication topology
选取4架UAV初始位置为(-50,0)Tm、(30,30)Tm、(10,-50)Tm和(50,20)Tm;初始速度为(0,-2)Tm/s、(-2,0)Tm/s、(1,-1)Tm/s和(2,-1)Tm/s;UAVl的初始位置和速度分别为(0,0)T和(0,2)Tm/s;UAVb的相关参数为θb(0)=0,即pb(0)=(1,0)T,vb(0)=(0,0)T,ub(0)=(0,0)T;缩放因子ri均为10;旋转因子Ri中的θi分别为θ=[π,π/2,3π/2,0];设目标做匀速直线运动,初始位置为(0,15)Tm,速度为(-1,1)Tm/s。
选取ρ=0.24,ρ1=5/48,ρ2=1/16,则ki≤0.0111,b=0.0017,τ=0.0455,此处选取k=[0.01,0.01,0.01,0.01],τi均为0.04,同时计算可得α=0.25,则通过求解不等式(5)可得
以下通过UAV编队在跟踪上目标后是否做盘旋运动(即ω是否为0)来分别对本文算法进行验证,设定仿真时间为30 s。
ω=0时的多UAV编队目标跟踪仿真如图4所示。
图4(a)为UAV编队跟踪目标的轨迹。可以观察到,UAVl能够追踪上目标,同时UAV能够形成既定编队队形并实现对目标的跟踪,这说明了所设计的基于事件触发机制下的目标跟踪控制算法的可行性。图4(b)、(c)分别为编队位置与速度误差曲线,约在10 s左右,误差曲线均趋于0,表明在10 s左右,各UAV在UAVl周围形成预设的编队队形,并跟随UAVl继续追踪目标。图4(d)为编队目标跟踪期间各UAV的速度在x方向上的曲线,可观察到在22.5 s附近,速度数值发生了轻微变化,这是由于此时UAVl追踪上目标,调整自身速度,而UAV跟随UAVl同样需要调整自身速度,因此在22.5 s时,UAV编队已跟踪上目标。图4(e)展示了在0~4 s和10~14 s期间编队目标跟踪期间事件触发的分布,显然能够很直观地观察到有无事件触发机制对UAV间通信次数的影响,为了更直观地说明所设计的基于事件触发的多UAV编队目标跟踪控制算法在减少UAV间信息通信次数的优势,以下对有无触发机制的平均触发时间间隔进行对比,如表1所示。可以发现,当UAV机载信息处理频率为1000 Hz时,UAV间的信息通信次数仅约有无事件触发的1/80。图4(f)为状态估计值方法与采用零阶保持器所产生的状态估计值间的对比,显然可以发现,此处采用的状态估计值方法较零阶保持器更加精准。同时,从表1中也可以观察到,此处采用的估计方法相比于利用零阶保持器进行状态估计的方法,由于估计值更加精准,使得触发次数也有一定程度的减少。
表1 有无触发机制下的时间对比(情况1)Table 1 Time comparison with and without triggered mechanism(Case 1)
图4 ω=0时的仿真Fig.4 Simulation results whenω=0
选取ω的值为ω1=0.3 rad/s,ω2=0.8 rad/s,仿真结果如图5和表2所示。
表2 有无触发机制下的时间对比(情况2)Table 2 Time comparison with and without triggered mechanism(Case 2)
由图5(a)的轨迹可以观察得到,当ω≠0时,本文算法同样具有可行性,且可以发现当UAV形成期望队形后开始盘旋运动,并在跟踪上目标后继续在目标周围保持盘旋运动。图5(b)、(c)中,
图5 ω≠0时的仿真Fig.5 Simulation results whenω≠0
编队位置与速度误差曲线在10 s附近趋于0,在22.5 s时,由于编队跟踪上目标后的速度调整,导致曲线均出现小幅振荡,但随后很快又趋于0。图5(d)的速度曲线在22.5 s前为幅值为3 m/s的等幅振荡,在22.5 s之后又保持幅值约为8 m/s的等幅振荡,这2种情况的出现是由于在22.5 s前后,盘旋角速度分别为ω1=0.3 rad/s和ω2=0.8 rad/s导致的。图5(e)的触发分布同样可以观察到事件触发机制在减小通信次数的效果,表2进一步证实了事件触发机制对减少通信次数的显著效果。
对比2种情况下的仿真结果可以发现,同样的初值情况下,UAV编队跟踪上目标的时间与是否进行盘旋运动无关,而是取决于UAVl追踪上目标的时间。除此之外,对比表1与表2可以发现,2种情况下,主导事件触发的决定项发生了变化,情况1中触发次数更多的是由触发函数所决定的,而情况2则主要是由设计的最小触发时间间隔决定的,2种情况的不同体现了算法设计的有效性,算法能够选取时间间隔较大的一项作为触发项,而不是仅仅通过确定固定间隔来控制触发,相较于固定时间触发的方法,本文算法更满足实际需求。
为了进一步说明本文算法的优越性,在情况1和情况2的仿真条件下,采用文献[13]中的触发函数进行仿真比较,仿真结果如图6与表3所示。
从图6和表3中可以看出,相比于所设计的时间触发控制方法,文献[13]的事件触发的平均时间间隔明显缩短,尤其是当ω≠0的情况,从图6(b)中可以直观地观测到,在后期事件触发频率增大,这主要是由于文献[13]中没有设计最小触发时间间隔所导致的。
表3 采用文献[13]的触发函数下的时间对比Table 3 Time comparison under triggered function in Ref.[13]
图6 采用文献[13]的触发函数下的触发分布Fig.6 Trigger distribution under triggered function in Ref.[13]
综上仿真结果表明,所设计的基于事件触发的目标跟踪控制算法能够有效减少UAV间的通信次数,实现间断性通信,并实现对目标的跟踪。
本文研究了在有向拓扑结构下多UAV编队目标跟踪问题,提出了一种具备事件触发控制策略的分布式目标跟踪控制算法。
1)通过构造编队参数组,实现了具有事件触发策略的编队队形控制与目标跟踪的一体化设计,相较于编队控制律与跟踪制导律分步设计的方法,简化了目标跟踪方法的设计步骤。
2)给出了基于事件触发的分布式目标跟踪控制律,结合所设计的触发函数,实现了将UAV目标跟踪期间由连续通信与计算更新的方式转换为通过判别触发条件的间断性触发方式,降低了UAV间通信和控制输入的更新频率。
3)所设计的最小触发时间间隔系数保证了系统不会出现“Zeno行为”,且进一步降低了触发的频率。仿真证实了具有事件触发策略的目标跟踪算法在跟踪上目标的情况下能够有效减少UAV间通信的次数与控制输入的更新次数,提升了算法的工程应用价值。