聂 芬,段晓君,刘易成
(国防科技大学 文理学院, 湖南 长沙 410073)
近年来,生物科学、信息科学、系统与控制科学等多个领域的研究者们都在关注多智能体系统如何合作和协调,一致性问题作为多智能体系统之间合作协调的基础,越来越受到研究者们的关注。在过去十年中,广泛研究了二阶多智能体系统的一致性问题。对于连续系统,Ren等[1]提出了二阶一致性协议,得到系统在具有固定拓扑和交换拓扑下一致性的充分条件。Xie等[2]解决了二阶系统在无向图具有固定拓扑和切换拓扑时的平均一致性问题。Yu等[3]、Zhu等[4]建立了一致性协议充要条件。对时滞二阶系统,Yu等[5]讨论了不需要速度测量的具有位置伴随跟过去位置伴随控制的一致性,得到系统无时滞不能一致,在选择合适的时滞可以促成一致性的结论。Hou等[6]讨论了一类二阶系统,得到无时滞时系统一致的充要条件,以及系统达成一致能容忍的最大时滞。系统邻接图具有有向生成树时,具有空间坐标耦合的系统一致性问题得到解决[7]。刘易成等[8]讨论了具有位置伴随和速度伴随的二阶多智能体系统的三种集群模式。在控制系统中,通常情况下,智能体无法随时获取测量数据,通常会定期更新信息。因此,对离散系统的研究显得尤为重要。Zhang等[9]研究了一类二阶离散多智能体系统,得到系统在固定拓扑和带马尔可夫切换拓扑时,系统二阶一致性的充要条件。Lin等[10]通过模型变换和应用非负矩阵的性质,在一定假设条件下,只要邻接图的并集具有有向生成树,系统可以容忍任意有界时间延迟,得到了系统二阶一致性的充分条件。Xie等[11]利用双线性变换,将二阶离散时间多智能体系统的一致性问题转化为多项式的Schur稳定性问题,得到系统二阶一致性成立的充要条件。具有时变拓扑和时变时滞的一致性问题得到了解决[12],对有限传输时滞的离散系统,有限的传输时滞不影响离散二阶一致性[13]。Cao等[14]得到了系统具有固定有向拓扑和无向拓扑时的一致性结果。具有坐标耦合的一致性问题,在选取合适采样周期、阻尼因子和旋转角,可实现不同的集群运动[15]。更多参考多智能体系统的一致性研究见随机网络拓扑[16-17]、非线性系统[18-20]、有限时间[18, 21-22]、数据采样[23-25]等方面的研究。旋转矩阵应用于一致性的研究很少,旋转矩阵在航天器姿态问题以及机器人技术等多个方面有着重要的应用, 因此研究坐标耦合的多智能体系统的一致性具有重要的理论价值及实际应用价值。本文在以上基础上,通过引入时滞,从连续系统出发,研究了一类具有坐标耦合和处理时滞的二阶离散多智能体系统的一致性,给出了在上一时刻位移伴随和速度伴随的共同作用下,得到具有空间坐标耦合的集群系统的二阶一致性的充要条件并进行了证明。针对旋转角和离散步长等特征参数临界性与一致性收敛分析的关系,设计案例进行了验证,本文证明结论可为一致性分析提供重要判据。
本文考虑n个智能体组成的二阶连续系统:
(1)
其中:ri(t),vi(t)∈R3代表t时刻智能体i的位置和速度;ui(t)∈R3代表控制输入。 对系统(1)设计控制输入:
(2)
其中
τP是处理时滞(智能体处理数据的时间),τT是传输时滞(信息从智能体传至另一个智能体的时间)。为了规范化处理时滞,令t=τPs,Ri(s)=xi(τps),Vi(s)=vi(τps),系统(1)约束控制输入式(2)得到以下形式:
(3)
得到式(3)的离散形式:
(4)
其中:Ri(k)=[xi(k),yi(k),zi(k)]T∈R3;Vi(k)=[vxi(k),vyi(k),vzi(k)]T∈R3,i=1,2,…,n,k=1,2,…;T为离散步长。 在现代通信条件下,处理时滞远远大于传输时滞,即τP≫τT,在本文工作中,忽略传输时滞,仅考虑处理时滞,也就是在式(4)中令τp=τ≠0,τT=0,得到以下系统:
(5)
为描述多智能体系统最终形成的样式,首先给出如下定义。
则称多智能体系统式(5)二阶一致性达成。
先给出后面会用到的基本概念和引理。
G=(V,E,A)是由n个节点组成的有限非空集合V={v1,v2,…,vn}上的有向图,E⊆V×V是边集,边eij=(vj,vi)∈E意味着节点vi可以接受vj节点的信息。A是加权邻接矩阵,A=[aij]n×n定义为aij≠0,如果eij∈E,aij=0;如果eij∉E,进一步aii=0对所有i成立。 那么,多智能体系统的拓扑结构将由其对应的有向图G完全决定。 记拉普拉斯矩阵L=D-A,其中D=diag{c1,c2,…,cn},ci=∑j≠iaij,i=1,2,…,n。
对于拉普拉斯矩阵的性质,可以总结为以下引理。
引理1[25]若L为有向图G对应的拉普拉斯矩阵, 则有向图G具有有向生成树,当且仅当0是矩阵L的单根,并且非零特征值均具有正的实部。此外,存在各分量非负的p∈Rn使得pTL=0,pT1n=1,且L1n=0。即p与1n分别为矩阵L的零特征值所对应的左特征向量与右特征向量。
对于三维空间中的旋转矩阵C∈R3×3,若已知其旋转轴和旋转角分别为a=[a1,a2,a3]T及θ∈[0,2π),以下引理给出旋转矩阵C的特征值和对应的特征向量的关系。
本节将通过矩阵特征值分析的方法构建多智能体系统式(5)的二阶一致性判据。
记R(k)=[R1(k),R2(k),…,Rn(k)]T,V(k)=[V1(k),V2(k),…,Vn(k)]T, 可将多智能体系统式(5)化为矩阵形式:
令Z(k)=[R(k)T,R(k-1)T,V(k)T,V(k-1)T]T,将多智能体系统式(5)化为矩阵形式:
Z(k+1)=MZ(k)
(6)
其中,M是一个12n×12n阶矩阵,即:
(7)
此外,记
可将多智能体系统式(5)化为误差系统:
(8)
其中,W是一个12(n-1)×12(n-1)阶矩阵,即:
其中
系统式(6)达成二阶一致性当且仅当系统式(8)是渐进稳定的。
引理3矩阵M如式(7)所定义,则0是拉普拉斯矩阵L的单根,当且仅当1是矩阵M的6重根。
证明:计算矩阵M的特征方程,则
det(λI12n-M)
当i=1时,u1=0为矩阵L的单根,则
可知λ=0,1是特征方程的6重根。反过来,当λ=1是特征方程的6重根,则
mij(1)=T2τ2uicj=0
由于T,τ,cj≠0,故ui=0为矩阵L的根,由充分性可知,ui=0为矩阵L的单根。
□
证明:引理的第一部分根据文献[9]引理1可得,由引理3可知,
(9)
□
引理5若0是拉普拉斯矩阵L的单根,则0是矩阵L⊗C的3重根,1是矩阵M代数重数为6,几何重数为3的特征值,1特征值相应的右特征向量和广义右特征向量分别为:
和
1特征值相应的广义左特征向量和左特征向量分别为:
其中,l=1,2,3。
证明:由克罗克内积性质可知,若0是拉普拉斯矩阵L的单根,则0是矩阵L⊗C的3重根,由引理4可知,1是矩阵M的特征值,代数重数为6。
可得:wa+Tτwc=wa;wa=wb;-TτL⊗Cwb+wc-TτγL⊗Cwd=wc;wc=wd。
□
接下来,需要一个三阶复系数方程
x3+c1x2+c2x+c3=0
(10)
稳定的判据,其中ci=ai+bii,ai,bi∈R,i=1,2,3。
定理1系统式(5)达成二阶一致性,当且仅当矩阵M的1特征值代数重数是6,几何重数是3,矩阵M的其余特征值在单位圆内,特别地,如果二阶一致性达成,则有下式成立:
其中,R∞=(pT⊗I3)R(0),V∞=(pT⊗I3)V(0),p=(p1,p2,…,pn)T是拉普拉斯矩阵L的0特征值的左特征向量,且满足pi≥0,i=1,2,…n,pT1n=1。
证明(充分性):由引理5,存在一个非奇异矩阵P∈R12n×12n使得:
所以
即
(必要性)通过反证法来证明,假设矩阵M的1特征值代数重数为6,几何重数为3,矩阵M的其余特征值在单位圆内这一条件不满足。由于矩阵L至少有一个0特征值,由引理3,矩阵M至少有6个1特征值,代数重数为6,几何重数为3,所以,有以下三种情况需要讨论:
第一种情况:矩阵M的1特征值代数重数是6,几何重数是3,存在至少一个特征值不在单位圆内;
第二种情况:矩阵M的1特征值代数重数大于6,其余特征值均在单位圆内;
第三种情况:矩阵M的1特征值代数重数大于6,还至少存在一个1特征值不在单位圆内。
对第一种情况,由引理4,若矩阵M有一个特征值不在单位圆内,则矩阵W也有一个特征值不在单位圆内,系统式(8)的渐进稳定性不能达成,系统式(6)的二阶一致性不能达成,与已知矛盾。同样可以证明第二、三种情况。
□
定理1中的代数条件不容易被验证。对于一个给定的网络结构,提出了如下选择定理来选择适当的控制参数和离散步长,确保达成二阶一致性。
定理2令T,τ>0,系统式(5)达成二阶一致性,当且仅当有向图G具有有向生成树,同时满足以下条件:
(11)
证明(充分性):若系统式(5)能达成二阶一致性,由定理1可知,矩阵M的1特征值代数重数为6,几何重数为3,其余特征值均在单位圆内,由引理3,拉普拉斯矩阵L的0特征值为单根,也就是说,有向图G具有有向生成树。
定义
(12)
固定i,容易得到:
由引理4,式(12)所有根具有负实部对i=2,3,…,n,当且仅当条件式(11)成立,所以充分性成立。
(必要性)若条件式(11)成立,式(12)的所有根在单位圆内对i=2,3,…,n成立,由引理4可知,矩阵M的特征值除0和1以外,都在单位圆内。此外,由于有向图G具有有向生成树,可知拉普拉斯矩阵L的特征值0是单根,由引理3可知,矩阵M的1特征值的代数重数是6,几何重数是3,由定理1可知,系统式(5)会达成二阶一致性。
□
本节通过数值模拟验证本文的主要结论,并对结论的应用场景进行分析。
例1假设智能体数n=4,反映系统结构的拉普拉斯矩阵L选取为如下形式:
初始位置R(0)和初始速度V(0)选取如下:
R(0)=(4,2,9,1,4,1,3,4,6,3,6,7)
V(0)=(7,8,7,4,7,2,7,0,3,0,1,8)
经过计算可知,矩阵L的特征值为u1=0,u2=0.952 5,u3=1.673 7+0.469 1i,u4=1.673 7-0.469 1i。矩阵L的0特征值的左特征向量为(0.250 2,0.191 1,0.458 7,0.100 1),由定理1可知,达成二阶一致性后,最终速度值为(5.726 2,3.439 2,4.309 9)。由定理2可知,当T=0.01,τ=3,γ=2,θc=57.139 3°为系统临界值。当θ(50°)<θc(57.139 3°)时,计算可知,当i=2,3,4,Ai(0.01,3,2)>0,Bi(0.01,3,2,50)>0,Ci(0.01,3,2,50)>0满足条件式(11),由定理2可知,系统式(5)将达成二阶一致性,如图1所示。而当θ(60°)>θc(57.139 3°)时,通过直接计算可知,当i=3,C3(0.01,3,2,60)<0不满足条件式(11),由定理2可知,系统式(5)发散,如图2所示。
(a) x轴方向速度(a) Velocity in x-axis
(b) y轴方向速度(b) Velocity in y-axis
(c) z轴方向速度(c) Velocity in z-axis图1 n=4,θ<θc时的速度收敛Fig.1 Velocity convergence when n=4,θ<θc
(a) x轴方向速度(a) Velocity in x-axis
(b) y轴方向速度(b) Velocity in y-axis
(c) z轴方向速度(c) Velocity in z-axis
图2n=4,θ>θc时的速度收敛
Fig.2 Velocity convergence whenn=4,θ>θc
例2在数值模拟中假设智能体数n=30,构建系统结构的拉普拉斯矩阵L选取为如下形式:
初始位置和初始速度取:
R(0)=(8,9,1,9,6,1,3,5,10,10,2,10,10,5,8,1,4,9,8,10,7,0,8,9,7,8,7,4,7,2,7,0,3,0,1,8,7,3,10,0,4,4,8,8,2,5,4,6,7,8,3,7,7,2,1,5,10,3,6,2,8,3,5,7,9,10,5,1,1,3,8,3,8,2,9,3,2,3,6,5,4,8,6,5,9,3,8,8,4,6)
V(0)=(5,3,7,2,7,2,4,6,8,1,9,8,5,4,4,3,5,5,8,8,6,4,8,5,4,9,9,6,6,6,2,3,5,2,8,2,2,2,2,4,3,9,4,2,9,10,4,1,3,4,6,3,6,7,2,1,3,3,4,5,1,3,8,0,9,7,5,6,2,5,10,5,5,2,5,6,7,4,4,10,0,9,9,8,1,3,3,7,1,7)
经过计算可知,当i=1时,矩阵L的特征值u1=0,当2≤i≤30时,矩阵L的特征值Re(ui)>0,系统具有有向生成树,由定理2可知,T=0.01,τ=3,γ=2,θc=40.547 3°为系统临界值。当θ(40°)<θc(40.547 3°)时,计算可知,当i=2,…,30,Ai(0.01,3,2)>0,Bi(0.01,3,2,40)>0,Ci(0.01,3,2,40)>0成立,由定理2可知,系统式(5)将达成二阶一致性,如图3所示。假设在执行任务的过程中,智能体7和23损毁,导致系统拉普拉斯矩阵第7、23列数据全部变成0,影响智能体16收不到所有智能体所发的信息,破坏了系统有向生成树的结构,即使与图3取同样的参数值,系统式(5)仍发散,如图4所示。另外,如果是智能体6和22损毁,没有破坏系统有向生成树的结构,则不影响群体的性能。取与图3同样的参数值,系统式(5)收敛,如图5所示。
(a) x轴方向速度(a) Velocity in x-axis
(b) y轴方向速度(b) Velocity in y-axis
(c) z轴方向速度(c) Velocity in z-axis图3 n=3,θ<θc时的速度收敛Fig.3 Velocity convergence when n=3,θ<θc
(a) x轴方向速度(a) Velocity in x-axis
(b) y轴方向速度(b) Velocity in y-axis
(c) z轴方向速度(c) Velocity in z-axis图4 智能体7,23损毁后的速度发散Fig.4 Velocity divergence when agent 7 and 23 were damaged
(a) x轴方向速度(a) Velocity in x-axis
(b) y轴方向速度(b) Velocity in y-axis
(c) z轴方向速度(c) Velocity in z-axis图5 智能体6,22损毁后的速度收敛Fig.5 Velocity convergence when agent 6 and 22 were damaged
本文讨论了带坐标耦合和处理时滞的二阶离散多智能体系统的一致性问题,证明了当0是拉普拉斯矩阵的单根时,旋转角小于由代数方程确定的临界值时,系统会出现二阶一致性;而旋转角、离散步长大于临界值时, 系统发散。本文针对特征参数的临界值结论,可为控制领域一致收敛分析提供理论支撑。