具有时延及联合连通拓扑的多飞行器分布式协同编队飞行控制研究

2015-02-28 10:45:16薛瑞彬宋建梅张民强
兵工学报 2015年3期
关键词:控制协议拓扑图队形

薛瑞彬,宋建梅,张民强

(北京理工大学 宇航学院,北京100081)

0 引言

近年来,随着计算机控制、传感器、通信网络等各项技术的发展,多飞行器协同控制的应用越来越广泛,特别是在执行战场侦察、多目标攻击、环境监测、地震救援等复杂任务时,多飞行器的编队协同控制具有执行任务效率高、燃料消耗低、鲁棒性强、灵活性大等单个飞行器所无法比拟的优势[1-2]。因此,多飞行器编队飞行控制已成为飞行器领域的热点之一。

早期,典型的编队协同控制方法大致可以分为主从式、基于行为型以及虚结构/虚拟领导者等3 类[3]。其中主从式结构的研究成果较多[4]。主从式编队是一种“长机-僚机”编队模式,长机按预定轨迹飞行,僚机跟随长机以固定的编队结构一起飞行,此方法易于理解和实现,但是鲁棒性较弱,一旦长机出现故障,则整个编队控制失败。本文拟基于近些年发展起来的一致性理论开展编队飞行控制研究。

在基于一致性协议的编队协同控制中,智能体利用邻居智能体的状态信息来进行自身状态的控制,并最终使整个编队达到期望的状态,是一种分布式的编队控制,具有较强的鲁棒性和灵活性,自组织与重构能力突出,因此基于一致性理论的编队控制是目前协同控制领域研究的热点之一。早期的基于一致性理论的分布式编队控制研究,大都假设每个智能体的运动特性是一个简单的1 阶积分环节,控制量为速度[5-6]。由于2 阶模型更加接近实际系统,目前很多文献针对2 阶系统模型开展了基于一致性协议的分布式编队控制研究[7-12]。Hong 等[7]在文献[5]基础上,针对通信拓扑为联合连通情况,基于Lyapunov 稳定性理论进行了多智能体系统的聚集问题研究,控制目标是使编队系统中各飞行器的位置最终趋于一致、速度趋于0,但文献并没有考虑系统通信时延的影响。Ren 等[8]针对两种网络拓扑情况(一种是通讯拓扑图中包含一棵生成树的固定网络拓扑;另一种是子拓扑图均包含一棵生成树的切换拓扑)开展了一致性协议研究,并最终得到系统收敛的充分条件,但也没有考虑系统时延的影响。当系统中存在通信时延且网络拓扑图为强连通的平衡图时,Lin 等[9]在文献[8]基础上,给出了系统收敛到一致状态的充分条件。Lin 等[10]在文献[6]基础上,针对通讯拓扑为联合连通的2 阶系统,并且系统中存在通信时延时,开展了平均一致性问题的研究,控制目标是使多智能体系统聚集到初始位置信息的平均值处,且最终速度为0.

近几年,很多学者开展了基于一致性协议的多飞行器系统协同编队飞行控制研究。Ren[3]通过适当选择多飞行器系统期望的信息状态,将针对2 阶系统模型的一致性控制协议拓展应用到编队飞行控制问题中。Seo 等[13]提出了一种基于一致性协议的编队飞行控制算法,证明了当系统的网络拓扑在有向强连通与网络中有一棵生成树两种情况下切换时,多飞行器系统依然可以实现稳定的编队飞行。Dong 等[14]在网络拓扑中有一颗生成树的情况下,基于一致性理论研究了具有时变队形特点的多飞行器编队控制问题,得出了系统的稳定性条件,并且采用四旋翼平台进行了实验验证。Seo 等[15]通过设计一种基于一致性理论的分布式编队控制器,进行编队控制的研究,证明了只要保证网络拓扑为有向强连通,即使编队飞行过程中有飞行器丢失,多飞行器系统依然能够实现稳定的编队控制。Kuriki 等[16]针对网络拓扑为固定连通情况,设计一种一致性控制协议,研究了多飞行器系统形成几何队形的协同编队控制问题。然而,大多数基于一致性理论的协同编队飞行控制研究都是针对以下两类系统开展的:一类是假设系统通信拓扑图为固定连通且无通信时延;另一类是假设系统具有切换通信拓扑结构且无通信时延。针对网络拓扑为联合连通并且同时存在通信时延的编队控制系统的研究成果很少。而在实际情况中,飞行器之间的通信常会受到传输速度、网络拥塞等因素的影响而存在通信延迟;并且由于通讯干扰、复杂地形、通信距离限制等因素的影响,多飞行器系统的网络通讯拓扑会发生变化,因此,同时考虑通信延迟以及通讯拓扑变化两因素对系统的影响,进行协同编队飞行控制系统研究具有重要的理论意义及工程价值。

本文针对网络拓扑为联合连通且同时存在通信时延的多飞行器编队系统,通过设计具有时延的基于一致性理论的编队控制协议,同时根据网络拓扑变化的特点,基于Lyapunov 稳定性理论得出了使系统稳定的充分条件,当系统满足某些线性矩阵不等式(LMIs)时,多飞行器系统能够按期望的队形和速度实现稳定的编队飞行。

1 多飞行器系统动力学建模

本文考虑n 个自主飞行器构成的群体系统,假设多飞行器飞行高度一致,即在二维平面内研究飞行器的协同编队飞行问题。系统中第i 个飞行器的运动模型为

式中:状态向量Xi=[xi,yi,vi,φi]T,控制输入向量Ui=[vci,φci]T,其中(xi,yi)为第i 个飞行器在惯性空间的位置;vi为飞行器飞行速度;φi为航迹角,并且按照笛卡尔坐标系x 轴正向为0°,逆时针旋转为正;vci、φci分别为飞行器自动驾驶仪的速度参考输入和航迹角参考输入;τv、τφ为系统动态时间常数。本文用1 阶惯性环节来近似描述飞行器的速度动态特性和航向动态特性。

定义ℝm×n为m × n 的实矩阵集合,令ξi=[xi,yi]T∈ℝ2,ui=[uxi,uyi]T∈ℝ2,对(1)式中的对时间求导,然后将的表达式代入,第i个飞行器的动力学数学模型转化为二次积分形式:

式中:ξi为飞行器的位置;ui为飞行器的虚拟控制输入。ui和实际控制输入向量Ui之间的关系为

2 图论基础知识介绍

采用代数图论的知识对多飞行器系统及其行为进行描述:假设系统有n 个飞行器,在代数图论中,将每个飞行器看做一个节点,并对其编号;飞行器之间的通讯关系看做是边,用G(V,E,A)表示一个多飞行器系统的无向图,其中,V = {s1,s2,…,sn}是n 个节点的集合,E={(si,sj)∈s×s,i≠j}表示边的集合,A =[ai]n×n表示一个附有权重的邻接矩阵。图G 的边用eij= (si,sj)表示,对于一个无向图来说,如果当eij∈E 时,则必有eji∈E. 邻接矩阵定义为aii=0,并且aij=aji≥0,当eij∈E 时,aij>0. 节点si的邻居集定义为Ni={sj∈V:(si,sj)∈E}. 无向图所对应的Laplacian 矩阵为L =[lij]n×n,其中显然,对于任一个无向图均有L =LT. 图中的路是指由边所组成的序列,例如(s1,s2),(s2,s3),…. 如果任意2 个节点之间都有一条路,则称图是连通的。若有m 个图均具有相同的节点集合V,定义联合图其节点集为V,边集为所有m 个图边集的联合,而且,如果联合图是连通的,那么,图便称为是联合连通的。

引理1[10]若有矩阵Cn=nIn-11T(Im表示m维单位矩阵,1 代表具有相应维数的列向量[1,1,…,1]T),那么必然存在一个正交矩阵Un∈ℝn×n,使得UTnDUn=diag{nIn-1,0},并且Un的最后一列为给定一个矩阵D∈ℝn×n使得1TD =0,且D1 =0,那么其中Un表示Un的前n-1 列。

3 基于一致性理论的多飞行器控制协议设计与系统稳定性证明

3.1 基于一致性理论的多飞行器系统控制协议设计

假定编队系统由n 个飞行器组成,在任一时刻,每个飞行器根据邻居的状态信息来控制和更新自己的当前运动状态。用无向图来描述飞行器之间的通讯拓扑关系,每个飞行器看成图的一个节点;每条边(si,sj)或者(sj,si)代表相应飞行器si、sj之间的通讯连接,在每个时刻,多飞行器之间的通讯连接形成一种通讯拓扑。实际中,由于遮挡、外界干扰、通讯阻塞、硬件故障等原因,可能会导致飞行器之间通讯失败而使系统通讯拓扑不断变化。为描述变化的拓扑,引进一个分段连续的常值切换函数σ(t):[0,∞)ap ={1,2,…,N},简记为σ,其中N 表示所有可能的无向通讯拓扑图的总数。t 时刻的通讯图用Gσ来表示,对应的Laplacian 矩阵用Lσ表示。本文主要研究系统通讯拓扑为联合联通情况下多飞行器系统控制协议设计问题。

由(2)式可得到第i 个飞行器动态方程的状态空间描述为

式中:ξi(t)∈ℝ2代表飞行器的位置状态;ζi(t)∈ℝ2代表飞行器的速度状态;ui(t)∈ℝ2是控制输入量。如果编队控制协议ui(t)能够保证所有飞行器的状态达到[ξi(t)- ξj(t)]→rij,并且ζi(t)→ζj(t)→ζ*(rij= -rji代表飞行器i 与j 在编队队形中的期望距离差值,ζ*∈ℝ2代表期望速度),则表明该控制协议能够使多飞行器系统最终形成预期的编队队形,且编队按照期望的飞行速度前进。

文献[3]给出了能够使多飞行器系统形成期望编队且实现给定速度的控制协议,但仅仅针对固定通讯拓扑,且没有考虑系统时延。本文借鉴文献[3]的控制协议思想,针对存在通讯时延以及通信拓扑图为联合连通的多飞行器编队飞行控制系统,对第i 个飞行器给出线性控制协议为

式中:τ >0 代表时延常数;aij代表通信拓扑图Gσ的邻接权重;Ni(t)为第i 个节点的邻居集;k1、k2、k3均大于0,且k3=k1k2.

为了进行多飞行器系统闭环控制性能分析,需要对模型进行等效变换。因此引入编队中心的概念,编队中心即为多飞行器系统队形的形心。为了说明问题方便、便于理解,以期望队形为正五边形为例,如图1所示,其中O 代表笛卡尔坐标系原点,Oc为编队中心,飞行器i、j 以及编队中心在平面坐标系中的位置分别为ξi(t)、ξj(t)、ξ0(t),飞行器i、j 与编队中心的距离分别为ri、rj.

图1 编队平面图Fig.1 Plane graph of formation

因此,控制协议(6)式可以等效变换为

式中:rji=rj-ri. 根据多飞行器系统期望队形的位置及速度信息,令ζi(t)-ζ*,则控制协议(6)式可以变换为

如果取

则在控制协议(8)式作用下,多飞行器编队控制系统的闭环动态方程为

3.2 基于一致性理论的多飞行器编队飞行闭环控制系统稳定性分析

3.2.1 切换拓扑定义与相关引理

在给出本文主要结论之前,先介绍一些定义以及引理。首先引入切换拓扑的概念。考虑一个无穷非空、有界并且连续的时间序列[tk,tk+1),k =0,1,…,t0=0,对于某一常数T1>0,有tk+1-tk≤T1(k≥0). 假定在每个区间[tk,tk+1)内,有一个不重叠的子区间序列:

对某一常数mk≥0 以及给定的常数T2>0,满足tkb+1-tkb≥T2,0≤b <mk,使得通讯拓扑图Gσ在tkb时刻切换,且在每一个子区间[tkb,tkb+1)内,通讯拓扑图均不发生变化。若用[T1/T2]表示不大于T1/T2的最大整数,那么在每一个区间[tk,tk+1)内,最大子区间数为m*=[T1/T2].

按照以上对切换拓扑的定义,假定在某一子区间[tkb,tkb+1)内时不变的通讯拓扑具有dσ(dσ≥1)个连通的部分,并且其对应的节点集用表示,用表示中的节点数。则存在一个置换矩阵Pσ∈ℝn×n使得

并且

在每个子区间内,对于第i 个连通的部分,考虑一个形如(15)式的对称矩阵

3.2.2 多飞行器编队飞行闭环控制系统稳定条件

定理1 对于一个具有通讯延迟及切换拓扑的多飞行器系统,假定在每个时间区间[tkb,tkb+1)内,其通讯拓扑图的集合是联合连通的,那么,在每个子区间[tkb,tkb+1)内,如果存在一个正常数γ >0 及满足(16)式的,使得

证明 针对(10)式,选取Lyapunov-Krasovskii函数形式如下:

容易得出,V(t)是一个正定递减函数。而且根据(13)式,V(t)可改写为

因此,从本质上讲,V(t)是每个子区间[tkb,tkb+1)内连通部分的Lyapunov-Krasovskii 函数的组合。

首先,V(t)的导数为

并且有

因此

由此可知,(10)式是稳定的[17]。由文献[10]的分析可知因此,有定理得证。也就是说,在控制协议(6)式作用下,多飞行器系统最终能形成预期队形,并达到期望的飞行速度。

4 多飞行器编队控制系统仿真

本文通过数值仿真来验证所设计的控制协议及稳定性分析的正确性。为充分说明本文所设计的一致性控制协议能够适应多种情况下多飞行器的编队飞行控制,分以下3 种情况进行仿真说明。

4.1 非对称结构队形的四飞行器编队形成仿真

四飞行器之间的通讯拓扑图以及期望形成的队形结构图分别如图2和图3所示。

图2 飞行器通讯拓扑图Fig.2 Communication topology of flight vehicles

图3 期望队形示意图Fig.3 Expected formation

四飞行器之间的通讯拓扑按照(G1,G2,G1)的顺序切换,驻留时间为0.3 s,图中每条连通边的权重为1. 四飞行器的初始位置、速度及航迹角的给定值如表1所示。

表1 飞行器初始状态Tab.1 Initial states of flight vehicles

取飞行器的速度和航向动态特性的1 阶惯性环节时间常数τv=2,τφ=0.8. 四飞行器系统期望的速度vi= 66 m/s,航迹角φi= 26°. 通过求解(18)式,得出控制协议中一组可行参数为k1=2,k2=1.6,k3=3.2,此参数下系统所允许的最大时延τ=0.3 s,在此控制协议下,当时延τ =0.3 s 时,四飞行器编队的位置、速度、航迹角变化曲线及形成队形分别如图4~图7所示。

图4 位置变化曲线图Fig.4 Position trajectories of flight vehicles

图5 速度变化曲线图Fig.5 Velocity trajectories of flight vehicles

图6 航迹角变化曲线Fig.6 Flight path angle trajectories of flight vehicles

图7 形成的编队队形图Fig.7 Formed formation

由图4~图7可见,四飞行器系统的速度及航迹角最终均收敛到一致并且达到给定的期望值,形成了期望的编队队形并能够按照此队形保持编队飞行。

4.2 对称结构队形的八飞行器编队形成仿真

八飞行器之间的通讯拓扑图如图8所示。每个通讯拓扑图均含有相同的8 个节点数,即有8 个飞行器参与编队飞行。从图中可以看出每个拓扑图并不是连通的,但是4 个图的集合却是连通的,图中每条连通边的权重为1. 多飞行器系统之间的通讯拓扑图的驻留时间为0.2 s,并且按照(G1,G2,G3,G4,G1)的顺序切换。

图8 多飞行器通讯拓扑图Fig.8 Communication topology of flight vehicles

八飞行器系统的期望编队队形是对称的,系统中各个飞行器之间的期望距离如图9所示,8 个飞行器的初始位置、速度及航迹角的给定值如表2所示。

图9 期望编队队形示意图Fig.9 Expected formation

表2 飞行器初始状态Tab.2 Initial states of flight vehicles

τv=2,τφ=0.8,期望速度vi=76 m/s,航迹角φi=26°. 通过求解(18)式,得出控制协议中的一组可行参数为k1=2,k2=1.6,k3=3.2,此参数下系统所允许的最大时延τ=0.3 s,在此控制协议下,当时延τ=0.3 s 时,八飞行器编队的位置、速度、航迹角、飞行器之间距离差及形成的队形分别如图10 ~图14所示。

由图10 ~图14 可见,尽管速度与航迹角曲线有一定的振荡,但是,八飞行器系统最终能够达到期望的速度及航迹角的给定值,并且系统最终能够形成预期的编队队形。

4.3 个别飞行器丢失后的飞行器编队重构仿真

图10 位置变化曲线图Fig.10 The changes in positions of flight vehicles

图11 速度变化曲线Fig.11 The changes in velocities trajectories of flight vehicles

图12 航迹角变化曲线Fig.12 Flight path angle trajectories of flight vehicles

本例中初始飞行器编队由5 个飞行器组成,在t=15 s 时刻,飞行器3 因故障丢失后,其他四飞行器进行编队重构。在飞行器3 丢失前,5 个飞行器通讯拓扑图以及期望的队形结构图分别如图15 和图16 所示,通讯拓扑图的驻留时间为0.4 s,并且按照(G1,G2,G3,G1)的顺序切换;当飞行器3 丢失后,4 个飞行器通讯拓扑图和期望的队形结构图如图17和图18 所示,驻留时间为0.3 s,并且按照(G1,G2,G1)的顺序切换。

图13 形成的编队队形图Fig.13 Formed formation

图14 飞行器之间的距离差Fig.14 Distance between flight vehicles

图15 飞行器通信拓扑图Fig.15 Communication topology of flight vehicles

图16 期望队形结构图Fig.16 Expected formation

5 个飞行器的初始位置设置如表所示。τv=2,τφ=0.8,期望速度vi=70 m/s,航迹角φi=24°. 通过求解(18)式,得出控制协议中的一组可行参数为k1=0.89,k2=1.31,k3=1.17,此参数下系统所允许的最大时延τ =0.1 s,在此控制协议下,当时延τ =0.1 s 时,飞行器位置、速度、航迹角以及队形变化曲线分别如图19 ~图22 所示。

图17 编队重构后通信拓扑图Fig.17 Communication topology of formation reconfiguration

图18 编队重构后期望队形结构图Fig.18 Expected formation after formation reconfiguration

表3 飞行器初始状态Tab.3 Initial states of flight vehicles

图19 位置变化曲线图Fig.19 The changes in positions of vehicles

从图19 ~图22 中得出,在本文所设计的控制协议下,当飞行器丢失前后,只要通信拓扑图保持联合连通状态,那么飞行器系统依然可以形成期望的队形。

图20 速度变化曲线图Fig.20 The changes in velocities of flight vehicles

图21 航迹角变化曲线图Fig.21 Flight path angle trajectories of flight vehicles

图22 队形变化曲线图Fig.22 The change of formation of flight vehicles

综合3 个算例可以得出:不论飞行器系统中飞行器数量多少、期望编队队形的结构如何,在本文所提出的一致性控制协议下,只要保证通讯拓扑结构是联合连通,那么多飞行器系统就能够形成期望的编队队形,并按照给定的速度及航迹角实现编队飞行;如果飞行过程中有飞行器因故障脱离编队,只要满足通讯拓扑结构变化要求,即相关飞行器之间能够形成通讯链,那么飞行器系统是可以实现编队重构的,并且依然按照给定的期望速度及航迹角信息进行编队飞行。

最后,本文所讨论的控制协议(6)式是指多飞行器系统跟踪某一静态速度,如果跟踪动态的速度,那么控制协议里面应该有速度的导数项,其协议形式为

在控制协议(21)式下,多飞行器系统依然可以收敛,其证明过程与定理1 相似,此处不再赘述。关于跟踪变化速度的问题,可以通过实际仿真验证结论的正确性,由于空间的限制,仿真结果图在此处略去。

5 结论

本文研究了通讯拓扑为联合连通及存在通信时延的多飞行器系统的编队飞行控制问题。通过设计基于一致性的编队控制协议,多飞行器系统编队控制的稳定性问题最终转化为寻找矩阵不等式可行解的问题。事实上,在求解矩阵不等式时,只需针对每个子区间内固定通讯拓扑图中的连通部分进行计算即可,这样可以很大程度地简化整个网络的分析。当求得一组可行参数时,便可求解在此参数下,系统所允许的时延上限的值。本文进一步通过仿真验证了所设计的一致性控制协议的正确性。在本文所提出的一致性控制协议作用下,若保证系统的通讯拓扑为联合连通的,不论期望队形结构对称与否,在允许的通讯延迟时间内,编队飞行系统均能按照期望的速度及航迹角实现稳定的飞行,如果飞行过程中由于故障导致某飞行器丢失,亦可实现编队的重构。

References)

[1]Ren W,Beard R W. Distributed consensus in multi-vehicle cooperative control[M]. London:Springer,2008.

[2]樊琼剑,杨忠,方挺,等.多无人机协同编队飞行控制的研究现状[J].航空学报,2009,30(4):683 -692.FAN Qiong-jian,YANG Zhong,FANG Ting,et al. Research status of coordinated formation flight control for multi-UAVs[J]. Acta Aeronautica et Astronautica Sinica,2009,30(4):683 -692.(in Chinese)

[3]Ren W. Consensus strategies for cooperative control of vehicle formations[J]. IET Control Theory and Applications,2007,1(2):505 -512.

[4]Giulietti F,Pollini L,Innocenti M. Autonomous formation flight[J]. IEEE Control Systems Magazine,2000,20(6):34 -44.

[5]Jadbabaie A,Lin J,Morse A S. Coordination of groups of mobile autonomous agents using nearest neighbor rules[J]. IEEE Transactions on Automatic Control,2003,48(6):988 -1001.

[6]Olfati-Saber R,Murray R M. Consensus problems in networks of agents with switching topology and time-delays[J]. IEEE Transactions on Automatic Control,2004,49(9):1520 -1533.

[7]Hong Y G,Gao L X,Cheng D Z,et al. Lyapunov-based approach to multiagent systems with switching jointly connected interconnection[J]. IEEE Transactions on Automatic Control,2007,52(5):943 -948.

[8]Ren W,Atkins E. Distributed multi-vehicle coordinated control via local information exchange[J]. International Journal of Robust and Nonlinear Control,2007,17(10 -11):1002 -1033.

[9]Lin P,Jia Y M,Du J P. Distributed control of multi-agent systems with second-order agent dynamics and delay-dependent communications[J]. Asian Journal of Control,2008,10(2):254 -259.

[10]Lin P,Jia Y M. Consensus of a class of second-order multi-agent systems with time-delay and jointly-connected topologies[J].IEEE Transactions on Automatic Control,2010,55(3):778 -785.

[11]Ren W. On consensus algorithms for double-integrator dynamics[J]. IEEE Transactions on Automatic Control,2008,53(6):1503 -1509.

[12]Qin J H,Gao H J,ZHENG W X. Second-order consensus for multi-agent systems with switching topology and communication delay[J]. Systems & Control Letters,2011,60(6):390 -397.

[13]Seo J,Ahn C,Kim Y. Controller design for UAV formation flight using consensus based decentralized approach[C]∥Proceedings of AIAA Infotech@ Aerospace Conference. Reston,VA,US:AIAA,2009:1 -11.

[14]Dong X W,Yu B C,Shi Z Y,et al. Time-varying formation control for unmanned aerial vehicles:theories and applications[J].IEEE Transactions on Control Systems Technology,2014,23(1):340 -348.

[15]Seo J,Kim Y,Kim S,et al. Consensus-based reconfigurable controller design for unmanned aerial vehicle formation flight[J].Proceedings of the Institution of Mechanical Engineers,Part G:Journal of Aerospace Engineering,2012,226(G7):817 -829.

[16]Kuriki Y,Namerikawa T. Consensus-based cooperative control for geometric configuration of UAVs flying in formation[C]∥SICE Annual Conference. Nagoya,Japan:IEEE,2013:1237 -1242.

[17]Gu K,Kharitonov V L,Chen J. Stability of time-delay systems[M]. Boston,MA:Birkhäuser,2003.

猜你喜欢
控制协议拓扑图队形
低压配网拓扑图自动成图关键技术的研究与设计
简单拓扑图及几乎交错链环补中的闭曲面
队列队形体育教案
基于含圈非连通图优美性的拓扑图密码
诗歌的奇怪队形(一)
基于控制协议弱点的隐蔽通信研究
通信技术(2016年12期)2016-12-28 10:35:10
一种基于软件定义的OFDM—PON控制协议
无人机编队机动飞行时的队形保持反馈控制
方波外场下有限维量子系统的控制协议
基于拓扑规则Pb-S-O体系优势区图的绘制与应用