王雪儿,罗毅平
(湖南工程学院 电气与信息工程学院,湘潭 411104)
多智能体系统的协同控制因其在实际生活中广泛的应用,而受到许多学者的关注,成为当下热门的研究课题.其应用包括移动机器人编队控制[1],灾区多机器人救援系统[2],无线传感器网络[3],分布式车辆编队控制[4-5],微型卫星群同步研究等[6].
一致性是多智能体系统协同控制中比较重要的问题,近年来已成为该领域的研究热点,相关的研究可见文献[7-9].
然而在上述的文献中均未考虑时滞对多智能体系统的影响,由于各个智能体之间的信息交互会产生时滞,时滞会破坏系统的性能而导致系统的不稳定.所以,在多智能体系统一致性研究中,时滞大多都会予以考虑.因此,研究时滞对多智能体系统一致性的影响具有重要的现实意义.文献[10]研究了基于延迟采样数据的多智能体系统的一致性问题,提出了基于延迟采样数据的观测器输出反馈控制器.文献[11]针对一类具有不确定性和外部干扰的输入时滞多智能体系统,提出了一种鲁棒反馈控制器,以保证系统的一致性,文献[12]研究了具有输入故障和时变时滞的多智能体系统的一致性问题.
在上述提到的文献中,各个智能体之间只能通过不断地进行信息交互,使得系统实现一致.然而,在实际应用中,许多时候能提供给各个智能体的能量是有限的,而智能体又被要求不断地进行状态采样、数据传输和控制器更新等.所以,这种连续采样机制会降低控制器的使用寿命.于是有人提出事件触发控制,在使用事件触发控制技术的系统中,只有满足相应的事件触发条件,系统才会进行信息传输和调整控制信号.相比之下,事件触发控制可以进一步更有效地利用资源和减少控制器的损耗.因此,事件触发控制受到了学者们极大的关注.迄今为止,在针对设计事件触发控制器实现多智能体系统的一致性的问题上,有许多学者对此做了一系列的研究.如Zhang等[13]研究了一类单积分器多智能体系统的一致问题,提出了两种新的分布式事件触发控制方案,减少了控制器的更新频率和通信负载.针对二阶多智能体系统,文献[14]通过利用分布式事件触发策略,实现系统的一致性.Liu等[15]考虑了一类具有交换网络的多智能体系统基于事件触发控制的领导者-跟随一致性问题.
上述关于多智能体一致性控制的研究主要是考虑渐进一致,但在实际工程应用中,往往需要多智能体系统在有限时间内就实现一致,而且有限时间一致具有更强的鲁棒性和抗干扰性等良好性能.因此,多智能体系统的有限时间一致性控制研究已成为近年来的一个研究热点.然而,在上述针对有限时间的研究中,收敛时间依赖于初始状态,所以收敛时间可能会随着初始条件的增加而无限制地增大,同时在实际应用中,可能会出现初始状态无法提前预知的情况,那么上述的这些研究结果将不再有效.为了解决上述多智能体系统有限时间一致性的局限性,即可以在不考虑初始状态的情况下,设计系统能够在有限时间内实现一致性的控制方法.于是,多智能体系统固定时间一致性问题的研究就成了一个重要的课题.
目前也有一些学者研究多智能体系统的固定时间一致性问题.如文献[16]针对一阶多智能体系统,基于未知的非线性动力学特性,研究了一阶多智能体系统的固定时间一致性问题.Wang等[17]研究了一类针对通信拓扑的一阶非线性多智能体系统的固定时间一致性问题.上述文献均没有考虑时滞,而研究关于时滞多智能体系统的固定时间一致性问题的成果不多.还有许多问题值得更进一步的探讨.受以上分析研究的启发,本文研究了基于事件触发策略的一阶时滞多智能体系统的固定时间一致性问题.本文的创新点如下:
(1)研究了基于事件触发控制的具有时滞的非线性多智能体系统的固定时间一致性问题.
(2)设计了一个分布式事件触发控制器,应用李亚普诺夫函数等方法,获得了基于事件触发控制的具有时滞的多智能体系统的固定时间一致性的充分条件.
(3)对每个智能体设计了事件触发条件,只有当事件触发条件满足时,各个智能体才会向其相邻的智能体传输信息,这样不要求各个智能体之间进行连续通信,降低了能耗和通信带宽,证明了在此事件触发控制器的作用下系统能在固定时间实现一致,同时证明了这种触发机制能避免芝诺行为.
下面的符号将贯穿本文,Rn和R n×n分别表示n维的欧几里德空间,以及n×n维的实矩阵,λmax(x)和λmin(x)代表x的最大和最小特征值,1n表示元素全为1的n维列向量,I N表示N维单位矩阵.对于向量s=(s1,...,s n)T∈R n,同时,我们有这样的定义.另外,diag(...)表示块对角矩阵,sign(.)表示符号函数.用一个无向图G=(V,E,A)来表示一个多智能体系统,V={v1,...,v N}表示节点集,E⊆V×V是表示智能体之间信息交换的边集,A=(a ij)N×N是加权邻接矩阵,如果(v j,v i)∈E,a ij>0,表示智能体i可以接收到智能体j的信息,否则,a ij=0.智能体i的邻居的个数可以表示为.节点v i的度可以表示为,同时,无向图G的度矩阵可以表示为,定义拉普拉斯矩阵且j≠i.
对于一个连通的无向图G而言,拉普拉斯矩阵L只有一个特征值0,对应的一个特征向量是1n,同时可以得到,并且有
定义1[18]假设原点是系统的平衡点
其中f(t,x(t)):R+×R N→R N是一个未知的非线性函数.如果f(t,x(t))是不连续的,(1)的解可以理解为Filippov解[19].
如果系统是李雅普诺夫稳定的,则系统(1)的原点可以说是全局固定时间稳定的.即存在一个收敛时间T(x0)>0,使得任意解x(t,x0)在收敛时间T(x0)内达到平衡.
定义2[18]如果系统(1)是全局有限时间稳定的,且T是有界的,则系统(1)的原点是固定时间稳定的.∃Tmax>0,使得对于任何初始状态T≤Tmax.
注记1:一个系统能否在有限时间稳定是与初始条件有关的,而一个系统能否在固定时间稳定与初始条件无关.具体的说明可以参考文献[20].
定义3[21]如果对于给定的任何初始值x i(0),i=1,2,...,N,都存在一个与初始值有关的正数T以及固定的常数Tmax>0,且T≤Tmax,对于任意的i,j=1,2,...,N,有:
则称闭环系统达到固定时间一致性.
引理1[22]假设x1,x2,...,x n≥0,0<p≤1,q>1,可以得到:
引理2[18]如果存在一个连续的径向无界函数V(t)使得式(1)的任意解x(t)都满足,使得:
其中a,b>0,α∈(0,1),β∈(1,+∞),可以达到固定时间稳定.收敛时间T满足T≤Tmax=
假设一个由N个多智能体组成的多智能体系统,其中第i个智能体的动态可以被如下描述:
其中x i(t)∈R n表示智能体i的状态,u i(t)∈Rn表示智能体i的控制输入,A,A d是合适维数的常数矩阵,d是常数时滞,f(·)∈Rn为非线性函数.
注记2:模型(2)考虑的智能体动力方程本身包含固有时滞,输入也包含时滞.为了方便计算,假设系统所包含的固有时滞和输入时滞是相同的.当然,也可以不同,而且还可以是时变时滞.但是,无论是哪种形式,其研究方法是相同的.与文献[23]相比,模型(2)考虑了非线性项,而文献[23]只考虑了输入时滞.
假设1存在非负常数η,非线性函数f满足:
假设2在系统(2)中,无向通信图G是连通的.
在本小节中,研究基于事件触发机制的多智能体系统的固定时间一致性问题,设计智能体i的控制器如下:
其中k1,k2,k3为控制增益且均为正数,表示智能体i的最近一次事件触发时 刻,表示智能体j的最近一次事件触发时刻,智能体i利用采样信息更新控制输入的时刻为
在这里,y i(t)被定义为:
其中:
注记3:为让系统在固定时间内实现一致性,文献[24]、[25]采用的是连续时间控制器.与之相比,本文所提出的事件触发控制器可以减少能量消耗和磨损.
将测量误差定义为如下的形式:
u i(t)又可以写成:
同时,智能体i在下一次事件触发时刻的判定如下:
在判定条件(8)中,函数g i(t)可称为事件触发函数:
在(9)式中,ξ∈(0,1)是触发参数,将在后面做出相应的选择.
定理1考虑一般的多智能体系统,对于具有通信拓扑结构G且为连通无向图的多智能体网络,事件触发函数设计如下:
若(10)式成立,则多智能体系统(2)在任意初始条件下均能实现固定时间一致性.
此外,收敛时间可以由下列等式来估计:
证明:对等式(5)进行求导,可以得到:
构造李亚普洛夫函数如下:
同时我们可以得到:
然后,再对等式(12)进行求导,结合引理1和等式(7),我们可以得到:
根据引理2,我们可以得到在固定时间内V(t)→0,且收敛时间T满足:
当V(t)=0,∀t≥T时,x i(t)=x j(t),这表明多智能体系统可以在固定时间内实现一致.定理1的证明完成.
注记4:与文献[26]相比,本文采用了一个新的事件触发机制,让系统不仅能在固定时间内实现一致,还考虑了时滞对系统的影响.其次,设计的是一个分布式事件触发控制策略,在该控制策略下,系统中每个智能体的事件触发条件的判定仅依赖于其自身及邻居节点的局部状态信息,无须考虑系统的全局状态信息.因此,与文献[27]中提出的集中式事件触发共识算法相比,本文所采用的分布式事件触发控制策略能够显著地减少智能体之间的数据传输,可以较大程度地减少网络中的通信量,提高能量的利用率.
推论1对于下面所给的多智能体系统
该系统是具有通信拓扑结构G且为连通无向图的多智能体网络,事件触发函数设计如下:
此外,收敛时间可以由下列等式来估计:
定理2考虑具有事件触发控制协议(3)和触发函数(9)的多智能体系统,将不会存在芝诺行为.
证明:首先,可以得到:
从(15)式中,可以得到:
同时由事件触发条件(8),智能体i在g i(t)=0之前,不会触发下一个事件.
其中:
上述(17)式可以变成:
证明完成.
本节将通过数值仿真来验证本文结论的有效性.
考虑具有5个智能体的多智能体系统(2),该系统的所有非零连接权值均为1,通信拓扑结构如图1所示.设控制增益k1=2,k2=4,k3=0.5,触发参数ξ=0.6,常数时滞d=0.01,γ=1.8.拉普拉斯矩阵L和其他系统参数如下:
图1 无向拓扑图
图2 x i1(i=1,2,3,4,5)的状态轨迹
图3 x i2(i=1,2,3,4,5)的状态轨迹
图4 x i3(i=1,2,3,4,5)的状态轨迹
图5 触发间隔
图6 控制输入ui2的演化过程
图7 控制输入u i的演化过程
图8 测量误差
本文研究了基于事件触发控制的时滞多智能体系统的固定时间一致性问题,设计了分布式事件触发策略,给出了每个智能体的触发条件,这种方法能够降低系统的能耗和控制器更新频率.同时,所提出的事件触发控制策略可以保证任何初始条件下的收敛时间.然后应用李亚普诺夫函数等方法,获得了基于事件触发控制的具有时滞的多智能体系统的固定时间一致性的充分条件,证明了该事件触发控制能够避免芝诺行为.最后进行了数值仿真,验证了理论分析的正确性.本文研究的是针对一阶多智能体系统的固定时间一致性问题.由于二阶系统以及系统中含有干扰等因素的一致性问题比一阶系统的一致性问题更复杂,因此本文提出的方法不能直接用于处理这些问题.我们下一步的研究工作包括二阶和具有不确定性的多智能体系统的保成本一致性问题.