李 勃,陈增强*,,刘忠信,张 青
(1.南开大学计算机与控制工程学院,天津 300071;2.中国民航大学理学院,天津 300300)
含时延的多智能体系统的多静态领导者包容控制
李勃1,陈增强*1,2,刘忠信1,张青2
(1.南开大学计算机与控制工程学院,天津 300071;2.中国民航大学理学院,天津 300300)
摘要:对基于有向固定拓扑的多静态领导者的多智能体系统的包容控制问题进行研究。在系统中智能体之间信息传递存在固定通信时延的情况下,应用拉普拉斯变换技术分别研究一阶和二阶连续时间多智能体系统,通过对系统传递函数的稳定性分析而求取系统状态稳定条件,并应用终值定理,最终得到了保证系统实现包容控制的时延限制条件,最后用仿真验证了该结论的有效性。
关键词:多智能体系统;包容控制;多静态领导者;通信时延;终值定理
0引言
近几年来,对多智能体系统控制的研究逐渐成为热点。多智能体系统是人类在对自然界中的动物和鸟类集体运动的研究基础上发展起来的,其在无人机的编队控制、多机器人协同工作、通讯网络的拥塞控制等领域有着非常广泛的应用,推动着多智能体系统建模与分析的研究不断向前发展。多智能体系统的控制目标主要包括智能体编队、群集、聚集等,其中状态一致性是研究的核心问题之一。多智能体系统的研究始于Reynolds等[1]提出的模仿动物集结的计算机模型,在此基础上Vicsek等[2]从统计力学的角度提出一个非平衡多智能体系统模型,Jadbabaie等[3]对Vicsek模型线性化,从理论上研究了该模型的角度一致性问题。Moreau[4]和Ren等[5]将文献[3]的结果推广到有向网络,得到了类似的收敛性结果。
自然中的群体运动通常都有一个或多个“领袖”,受其启示,研究人员设计领航-跟随控制方案来实现多智能体网络的协调控制,根据领航者是否实际存在,可分为虚拟领航和实际领航,根据领航者的个数,可分为单领航和多领航情况。其中包容控制是多领航的一种典型情况,其本质是指一组跟随者在多个领导者的引领下,从而到达并保持在由领导者所围成的最小几何空间(凸包)中运动。在实际应用中,包容控制具有大量的潜在应用。包容控制问题由M. J等[6]提出后,REN等[7]做了大量的研究工作,不但给出了一阶、二阶系统的包容控制的数学描述,还分别研究了固定拓扑和动态拓扑的包容控制,非线性系统的包容控制问题,有限时间的包容控制问题的研究也取得了若干成果。另外对Lagrangian系统的包容控制研究和输出包容控制[8]的研究也开始起步。由于系统中智能体接收信息必然存在时间延迟(无通讯延迟的系统是理想化的系统模型),因此对时间延迟系统的研究具有很重要的实际意义,Reza Olfati-Saber等[9]研究了一阶连续时延系统,给出了保证系统收敛的时间延迟的界,Yu等[10]研究了二阶系统中的时间延迟问题,Yang等[11]研究了离散时间系统的时间延迟问题,也有研究分别考虑输入时延和通讯时延的系统和更为复杂的时变时延情况,Xia等[12-14]研究时间延迟问题在疾病传播中影响感染阈值从而促使疾病爆发等实际应用领域的工作。大量的研究工作对固定时延和可变时延的情况都进行了稳定性分析研究。
时延的不可避免性和包容控制问题的重要应用激发了对具有时间延迟的多智能体系统的包容控制问题的研究,目前对时延多智能体系统的包容控制的研究较少,Liu等[15]研究二阶连续系统中存在时变时延的情况,用LMI形式给出了系统实现包容控制时延需要满足的条件,形式比较复杂,且为充分条件。本文研究时延系统的包容控制问题,研究的对象是基于有向固定拓扑的多静态领导者的多智能体系统,假设系统中智能体之间信息传递存在通信时延且时延固定的情况下,应用拉普拉斯变换技术分别研究一阶和二阶连续时间多智能体系统,通过求取跟随者状态收敛的限制条件,然后应用终值定理得到跟随者状态的极限值。从而得到了保证系统实现包容控制的时延的限制条件,本文给出的两个条件均为充分必要条件,形式也相对比较简单。
1预备知识
假设1[16]在一个多智能体系统中,对每个跟随者,都至少有一个领导者,有一条有向路径指向它。
定义2[18]Laplacian矩阵L=[lij]∈Rn×n定义为
假设一个多智能体系统中有m(m 其中L1∈R(n-m)×(n-m),L2∈R(n-m)×m关于L1和L2,有引理1和2。 引理2[20](终值定理)若函数f(t)及其一阶导数都是可拉氏变换的,则函数f(t)的终值为 根据文献[16]中的分析,可以发现,满足假设1的系统和具有生成树的对应系统(将系统中所有的领导者合并为一个节点)相比较,前者的Laplacian矩阵中的子矩阵L1和后者的Laplacian矩阵相比,前者的特征值比后者只是少一个0,其它特征值相同。 2主要结果 2.1一阶连续系统的包容控制 多静态领导者的一阶连续多智能体系统的状态方程为 (2)其中,aij为系统对应的邻接矩阵的元素。矩阵L是该网络拓扑结构对应的Laplacian矩阵,令XL(t)=[x1(t)Tx2(t)T…xm(t)T]T,XF(t)=[xm+1(t)Txm+2(t)T…xn(t)T]T(假设系统共有n个智能体,编号1到m为领导者,m+1到n为跟随者)。τ为信息从一个节点传送到另一个节点所需要的时间。如同时考虑状态x为p维矢量,则跟随者的状态方程可写为 (3) 定理1对一个具有相同通讯时延τ>0的多智能体系统(1),假设通讯拓扑满足假设1,且跟随者之间的通讯是双向的。若该系统使用控制协议(2),那么该系统要取得全局渐近包容控制,当且仅当满足条件(4): (4) 证明:对式(3)做Laplace变换(这里用XF(s)表示XF(t)的Laplace变换),并整理: (5) (6) 要使式(3)系统中跟随者状态收敛,需保证系统的特征方程Zτ(s)=det(sIn-m+e-τsL1)的根具有负实部,根据文献[9]的研究结果,满足式(4)是系统收敛的充要条件。跟随者状态收敛也就是说是跟随者的状态是有极限的,可以对其应用终值定理,则有: (7) 2.2二阶连续系统包容控制 对多静态领导者的二阶连续系统,状态方程如式(8) (8) 这里xi和vi分别是第i个智能体的位置和速度。另为简便起见,这里假定系统的位置和速度为标量(矢量的情况类似)。假设通讯时延是固定的,本文使用控制协议(9): (9) 其中,式(9)中的参数α>0,β>0要满足的条件可以参考文献[10]。 令X(t)=[x1(t)x2(t)…xn(t)]T,V(t)=[v1(t)v2(t)…vn(t)]T。 将式(9)代入式(8)也可以写成如式(10)的简洁形式。 (10) 对领导者和跟随者系统,跟随者的状态方程为(XF,XL定义同2.1部分,VF,VL与之类似): (11) 则跟随者状态方程可简化写为 (12) 对系统(12)的特征方程det(λI2(n-m)-Α-e-λτB1)=0带入矩阵A和B1并整理得: 引理3[10]假设系统的通讯拓扑网络具有有向生成树,则g(λ)=0有一个纯虚根,当且仅当 其中,0≤θi1<2π且满足: 其中,lm()表示虚部,Re()表示实部,ui为矩阵L1的特征值,wi1定义为 当(τ1,τ2,…,τm)变化时,当且仅当一个零点出现在或穿过虚轴,多项式P的在开放的右半平面的零点的阶和才能改变。 引理5[10]假设系统的通讯拓扑网络具有有向生成树,λ是方程gi(λ)=0的解,则dλ/dτ在点τ∈Ψ处存在并且满足: 定理2对一个具有相同通讯时延τ>0的多智能体二阶系统(8),假设通讯拓扑是固定的而且满足假设1。若该系统使用控制协议(9),那么该系统要取得全局渐近包容控制,当且仅当满足如式(13)的条件: (13) 证明:对式(12)做Laplace变换(这里用YF(s)表示YF(t)的Laplace变换),并整理: (14) (15) 当系统的网络拓扑是固定的且满足假设1,可选择参数α,β,使τ=0时,系统(12)的特征方程的根均具有负实部(因L1无0特征值,因此特征方程无0根)。根据引理3,当τ从0变化到τ0时,一个纯虚根出现。根据引理4和引理5可知,当0≤τ<τ0时,特征根全部具有负实部;而当τ≥τ0时,至少有一个特征根有正实部,二阶系统不收敛。从而证明条件(13)是系统(12)收敛的充分必要条件。 即时间延迟τ满足式(13),则系统(12)收敛,跟随者状态有极限值,可对其应用终值定理: (16) 将式(16)展开可得: (17) 此处为静态领导者,VL(t)=0。 3仿真实例 本文采用的网络拓扑如图1所示,假设个体之间连接权值为1,互连个体之间通信时延为τ。 3.1一阶系统实例 对一个由式(1)描述的一阶连续系统,其网络拓扑如图1a所示,在控制协议(2)的作用下,使用式(4)计算可得,τ*=0.392 7。时间延迟τ分别取0.35和0.40的跟随者和领导者的时间轨迹仿真图分别如图2a和图2b。可以看出当τ<τ*时,跟随者的状态渐近收敛到领导者所组成的凸包中,而当τ≥τ*时,跟随者的状态发散,与定理1的结论相符。 3.2二阶系统实例 对一个由式(8)描述的二阶连续系统,其网络拓扑如图1b所示,在控制协议(9)的作用下(取α=10,β=8),使用式(13)计算可得τ0=0.057 9。时间延迟τ取0.055的跟随者和领导者的位置和速度时间轨迹仿真图分别如图3a和图3b。可以看出当τ<τ0时,跟随者的位置状态渐近收敛到领导者所组成的凸包中,跟随者的速度状态收敛到0,与定理2的结论相符。 4结论 本文研究了具有固定通讯时延的多智能体系统的包容控制问题,假设网络拓扑是固定有向的,系统是领导者-跟随者结构的,多个领导者是静态的。给出了一阶、二阶连续时间系统实现包容控制的时间延迟的限制条件并仿真验证了其有效性。下一阶段的任务是研究离散系统和多动态领导者情况下的时间延迟系统的包容控制问题和考虑输入时延等情况的包容控制问题。 参考文献: [1]Reynolds C W.Flocks,herds and schools a distributed behavioral model[J].Computer Graphics,1987,21(4):25-34. [2]Vicsek T, Czirok A, Ben Jacob E, et al. Novel type ofphase transition in a system of self-driven particles[J].Physical Review Letters,1995,75(6):1226-1229. [3]Jadbabaie A, Lin J, Morse A S. Coordination of groupsof mobile agents using nearest neighbor rules[J]. IEEETranson Automatic Control,2003,48(6):988-1001. [4]Moreau L.Stability of multi-agent systems with timedependent communication links[J].IEEE Trans onAutomatic Control,2005,50(2):169-182. [5]Ren W, Beard R W.Consensus seeking in multi-agentsystems under dynamically changing interactiontopologies[J].IEEE Trans on Automatic Control,2005,50(5):655-661. [6]JiM,Ferrari-Trecate G, Egerstedt M, et al. Containment control in mobile networks[J]. IEEE Transactions onAutomatic Control,2008,53(8):1972-1975. [7]于镝,白丽娟,李铖.非线性多智能体网络的分布式包容控制[J]. 复杂系统与复杂性科学,2013,10(2):63-68. Yu Di, Bai LiJuan, Li Cheng. Distributed containment control of nonlinear multi-agent networks[J]. Complex Systems and Complexity Science,2013,10(2):63-68. [8]Dong X W,Meng F L,Shi Z Y,et al. Output containment control for swarm systems with general lineardynamics: a dynamic output feedback approach[J].Systems & Control Letters,2014(71):31-37. [9] Olfati-Saber R, Murray R M. Consensus problems in networks of agents with switching topology and time-delays[J]. IEEE Transaction on Automatic Control,2004,49(9):1520-1533. [10] Yu W W,Chen G R,Cao M. Some necessary and sufficient conditions for second-order consensus inmulti-agent dynamical systems[J]. Automatica,2010,46(6):1089-1095. [11] 杨洪勇,张嗣瀛. 离散时间系统的多智能体的一致性[J].控制与决策,2009,24(3):413-416. Yang Hongyong, Zhang SiYing.Consensus of multi-agent system with discrete-time[J].Control and Decision, 2009,24(3):413-416. [12] Xia C Y, Wang Z, Sanz J, et al.Effects of delayed recovery and nonuniform transmission on the spreading of diseases in complex networks[J].Physica A, 2013(392): 1577-1585. [13] Wang L, Sun S W, Xia C Y. Finite-time stability of multi-agent system in disturbed environment[J]. Nonlinear Dynamics,2012,(67):2009-2016. [14] Xia C Y, Wang L, Sun S W,et al.An SIR model with infection delay and propagation vector in complex networks[J].Nonlinear Dynamics,2012(69): 927-934. [15] Liu K E, Xie G M, Wang L.Containment control for second-order multi-agent systems withtime-varying delays[J].Systems & Control Letters,2014(67):24-31. [16] Cao Y C,Ren W,Egerstedt M.Distributed containment control with multiple stationary or dynamic leaders infixed and switching directed networks[J]. Automatica, 2012, 48(8): 1586-1597. [17] Rockafellar R T. Convex Analysis[M]. New Jersey:Princeton University Press,1972. [18] Ren W, Cao Y C.Distributed Coordination of Multi-agent Networks[M].London:Springer, 2011. [19] Liu H, Xie G M, Wang L. Necessary and sufficient conditions for containmentcontrol of networked multi-agent systems[J]. Automatica,2012,48(7):1415-1422. [20] 胡寿松.自动控制原理[M].5版.北京:科学出版社,2006:636-637. (责任编辑耿金花) Containment Control for Multi-Agent System with Multiple Stationary Leaders and Time-Delays LI Bo,CHEN Zengqiang1,2, LIU Zhongxin1, ZHANG Qing2 (1. College of Computer & Control Engineering, Nankai University, Tianjin 300071, China;2.College of Science, Civil Aviation University of China, Tianjin 300300, China ) Abstract:This paper is concerned with distributed containment control of multi-agent system with multiple stationary leaders under fixed directed network topologies. Under the assumption that communication time-delays in all channels are equal, the Laplace transform is used to study the first-order and second-order multi-agent delayed system with continuous-time. Some sufficient conditions are obtained to ensure the containment of the multi-agent system by stability analysis for transfer function to get conditions and applying final value theorem. Finally,computer simulations show the effectiveness of the conclusion. Key words:multi-agent systems; containment control; multiple stationary leaders; communication time-delays; final value theorem 文章编号:1672—3813(2016)02—0105—06; DOI:10.13306/j.1672-3813.2016.02.013 收稿日期:2014-11-20;修回日期:2015-01-12 项目基金:国家自然科学基金(61174094);天津自然科学基金(14JCYBJC18700,13JCYBJC17400) 作者简介:李勃(1972-),男,山东龙口人,博士研究生,主要研究方向为多智能体系统的包容控制。 中图分类号:TP273 文献标识码:A