事件触发机制下多智能体系统的非对称二分一致性

2021-11-20 22:05王文欣,叶洪涛,罗文广,文家燕
广西科技大学学报 2021年4期

王文欣,叶洪涛,罗文广,文家燕

摘  要:通过对事件触发的多智能体系统非对称二分一致性问题的分析,针对结构平衡的无向符号图构造一类新的拉普拉斯矩阵,提出了一种分布式事件触发控制协议;运用Lyapunov稳定性理论、矩阵理论、图论、Young不等式等方法,得到系统在事件触发控制下的稳定性条件,并实现智能体状态收敛到幅值和符号均不同的非对称二分一致;运用测量误差设计事件触发条件,使智能体满足触发条件时被触发并更新控制器数据;分析计算出任意两次事件触发时刻的间隔为正常数,证明了本设计能够避免Zeno行为的发生;最后通过数值仿真验证了结论的有效性.

关键词:多智能体系统;事件触发控制;非對称二分一致性;Zeno行为;无向图

中图分类号:TP273          DOI:10.16375/j.cnki.cn45-1395/t.2021.04.005

0    引言

多智能体系统的研究最初受到自然界动物群体行为的启发,比如大雁南飞,鱼群躲避捕食者,蜜蜂筑巢等.目前,大量的研究成果已经应用于现实生活中,如多机器人协作控制、多自主水面航行器、车辆编队、无人飞行器[1-4]等.黄恩洲[5]研究了多智能体团队强化学习的交通信号控制,解决了多个交叉路口的交通信号协调控制问题.李春贵等[6]在FMS多智能体调度框架基础上,提出一种智能体生产招投标算法.Altafini[7]提出竞争关系的概念,把边的权值用负数表示,并且针对合作竞争网络的多智能体系统提出了新的控制协议,赋予多智能体系统二分一致性的概念,即当时间趋于无穷时,使得多智能体系统收敛到2个符号不同但模值相同的状态.Wu等[8]基于适当的量化标准,提出了具有静态耦合增益的分布式控制协议,解决了非线性多智能体系统二分一致性问题.Qin等[9]提出了基于低增益反馈的分布式反馈控制方法,以实现线性多智能体系统二分一致.目前大量的研究成果都集中在单一合作或竞争的通信网络中,涉及到合作竞争网络的成果多为实现多智能体系统二分一致性.Guo等[10]对多智能体系统二分一致性问题拓展到非对称二分一致,通过构造一类新的一般拉普拉斯矩阵,发现当有向图是强连通时,所有的智能体都收敛于2个不同模量的值.

随着控制科学、通信工程等的发展与融合,通信带宽是有限的,而事件触发控制具有节约资源、降低网络带宽等优势.Dimarogonas等[11]首次将事件触发机制应用于多智能体系统,分别设计了集中式和分布式事件触发控制机制,通过设定阈值来判断事件是否被触发.当误差大于设定的阈值时,事件将被触发,否则事件不触发.随着时间的变化,误差逐渐减小直到为0,从而系统达到稳定状态,同时能够减少事件触发次数.Nowzari等[12]设计了一种新的分布式事件触发控制协议,证明了在此协议下能够有效实现多智能体系统平均一致问题,并且避免了芝诺(Zeno)行为.Zeno行为是指触发器在有限时间区间内无限次触发的行为,这种行为不符合实际系统中个体之间相互通信的一些物理特征.如何避免发生Zeno行为是事件触发控制中最重要的问题,将直接关系到事件触发控制方法是否有效.Seyboth等[13]将触发条件用具有指数递减的时间函数来表示,保证了智能体状态渐近收敛到平均一致,同时排除了Zeno行为.Fan等[14]对多智能体系统分布式集合问题展开了研究,提出了新型事件触发控制器.Zeng等[15]针对无向符号图和强连通有向符号图,分别设计了不同的事件触发条件,证明了一致性理论,提出排除Zeno行为的控制算法,实现了多智能体系统二分一致.

以上有关事件触发控制的研究多集中在解决多智能体系统二分一致性问题,而针对事件触发的多智能体系统非对称二分一致性研究成果较少.在现实中广泛存在着合作竞争网络,人与人的信任/不信任程度,喜欢/不喜欢程度都不一样,因此,非对称二分一致性更具有一般性和实际意义,二分一致性可以看作是非对称二分一致性的特例.基于以上分析,本文将在多智能体系统中引入分布式事件触发控制方式,并且顺利排除Zeno行为,实现非对称二分一致.对于结构平衡的无向符号图,通过构造一类新的拉普拉斯矩阵来设计新的分布式事件触发控制协议,用李雅普诺夫稳定性理论证明系统状态的收敛性,得到能够使系统状态实现非对称二分一致的充分条件;同时计算在事件触发机制下智能体相邻两次触发的时间间隔下界为正常数,从而证明在有限时间内不会发生无限次触发.

1    图论知识与问题描述

1.1   图论知识

本文中,假设[G=(V, E, A)]表示一个含有n个节点的无向图,[V=(v1, v2, …, vn)]表示点的集合;[E?(V×V)]表示边的集合,[(vi, vj)∈E]表示一条边的2个节点为[vi]和[vj],即节点[vi]的信息可以通过这条边传输给[vj];[A=aijn×n]为无向图的邻接矩阵,[aij]表示边的权重,如果[(vi, vj)∈E]存在,那么[aij≠0],否则[aij=0].图G的度矩阵为[D=diagd1, d2, …, dn],其中[di=j=1, i≠jnaij].若对于图中任意2个节点[vi]和[vj]都有一条路径将这2个节点连接起来,则称该图为连通图.

定义1[11]  一个符号图,如果能够满足条件:

[douti=j∈Noutiaij],[dini=j∈Niniaji],

则该符号图是权值平衡的.

定义2[14]  [n]维实空间[Rn]中的卦限序用向量[h=[h1, …, hn]T],[hi∈-1, 1]来表示,规范变换是利用矩阵[H=diagh1, h2, …, hn],改变[n]维空间卦限序的一种变换,并且用[H=diagh1, h2, …, hn],[hi∈-1, 1]表示[Rn]中所有规范变换的集合.

定义3[7]  如果符号图的全部节点可以分成2个集合[V1, V2],且满足[V1?V2=V, V1?V2=?];   使[aij≥0],[?vi, vj∈Vq],[q∈1, 2],且[aij≤0],[?vi∈Vq],[vj∈Vr],[q≠r] [q, r∈1, 2],则该符号图结构平衡,否则,结构不平衡.

引理1[12]   young不等式:

对于任意实数[x∈R]和[y∈R],都有以下不等式成立:

[xy≤c2x2+12cy2,c>0].

引理2[10]  一般拉普拉斯矩阵[L]有一个0特征值且所有的非0特征值都在右半平面,还存在一个对应于拉普拉斯矩阵0特征值的左特征向量[ξ→=(ξ1, ξ2, …, ξn)T],其中[ξi>0],[i∈V1];[ξi<0],[i∈V2].

1.2   问题描述

假设多智能体系统由n个智能体组成,第[i]个智能体动力学行为如式(1):

[xi(t)=ui(t), i∈N],                             (1)

其中:[N∈1, …, n],[xi(t)]为第[i]个智能体的状态,[ui(t)]为第[i]个智能体的控制输入.为了不失一般性,假设n个智能体可以分为[V1、V2]两组,[V1∈1, …, m]、[V2∈m+1, …, n],控制协议[ui(t)]设计如下:

[ui(t)=-j=1maij(sign(aij)xi(t)-xj(t))-       j=m+1naij(ksign(aij)xi(t)-xj(t)), i∈V1-j=1maij(1ksign(aij)xi(t)-xj(t))-       j=m+1naij(sign(aij)xi(t)-xj(t)), i∈V2],      (2)

其中:[0

[xi(t)=-Lxi(t)],                       (3)

定义一般拉普拉斯矩阵[L=C-A],[C=cijn×n=diag[c11, c22, …, cnn]]是一个对角矩阵,对角元素为:

[cii=j=1maij+j=m+1nkaij, i∈V1j=1m1kaij+j=m+1naij, i∈V2].

测量误差为:

[ei(t)=xi(t)-xi(t)],                     (4)

其中:[e(t)=e1(t), e2(t), …, en(t)].根据式(4),式(3)可写为:

[xi(t)=-L(xi(t)+ei(t))],               (5)

由于符号图邻接矩阵元素有正有负,不易于后续理论分析,现采用规范变换,将邻接矩阵变为非负.由定义2,取变换矩阵[H=diag(h)],[h=h1, h2, …, hn],当[i∈V1]时,[hi=1];当[i∈V2]时,[hi=-1].

规范变换后的拉普拉斯矩阵为[L],[L=HLH],[x(t)=Hx(t)],[e(t)=He(t)],

规范变换后,式(5)可以改写为:

[x(t)=-L(x(t)+e(t))],           (6)

定义4[10]  在多智能體系统(3)中,如果存在一个常数[α],使得[limt→∞xi(t)=α],[i∈V1],[limt→∞xi(t)=-kα],[i∈V2],那么多智能体系统(3)能够实现非对称二分一致.

引理3[10]  在控制协议(2)下,多智能体系统(3)能够实现非对称二分一致,最终收敛状态为[limt→∞x(t)=(ξ)Tx(0)(ξ)Tαα].

2    事件触发的多智能体系统非对称二分一致性

定理1  考虑多智能体系统(3),通信拓扑为结构平衡的无向符号图,在分布式事件触发协议(2)下,如果对于[?i∈N]满足触发条件:

[e2i≤δz2i2ci(1-k)j=m+1naij-c2i,i∈V1e2i≤δz2i2ci(1k-1)j=1maij-c2i,    i∈V2],       (7)

且[0<δ<1],则多智能体系统(3)可以实现非对称二分一致,最终的收敛状态为[limt→∞x(t)=(ξ)Tx(0)(ξ)Tαα],其中[x(0)]是系统(3)的初始状态,[ξ]是引理2中[L]的左特征向量,[α=(α1, α2, …, αn)T],[α1=α2=…=αm=1],[αm+1=αm+2=…=αn=-k].

证明:考虑Lyapunov函数[V(x)=12xTLx],求导得:

[V(x)=xTLx=xTL(-L(x(t)+e(t)))]

令[z=z1, z2, …, zn=Lx],则

[V(x)=-zTz-zTLe(t)] ,                (8)[zTLe(t)=i=1mj=1mziaij(ei-sign(aij)ej)-    i=m+1nj=m+1nziaij(ei-sign(aij)ej)+      i=1mj=m+1nziaij(kei-sign(aij)ej)-    i=m+1nj=1mziaij(1kei-sign(aij)ej)],     (9)

将式(9)代入式(8)得:

[V(x)=-i=1nz2i-i=1mj=1mziaij(ei-sign(aij)ej)+                 i=m+1nj=m+1nziaij(ei-sign(aij)ej)-                 i=1mj=m+1nziaij(kei-sign(aij)ej)+]

[                 i=m+1nj=1mziaij(1kei-sign(aij)ej)]      ,(10)

由于文中涉及的是无向图,容易得到Laplace矩阵[L]是对称的,所以,可以得到如下关系式:

[ij∈V112ce2i=ij∈V112ce2j],         (11)

根据引理2和式(11),对式(10)进行化简得:

[V(x)≤-i=1nz2i+(1-k)i=1mj=m+1naijci2z2i+               (1-k)i=1mj=m+1naij12cie2i+               (1k-1)i=m+1nj=1maijci2z2i+]

[               (1k-1)i=m+1nj=1maij12cie2i] .             (12)

因此,让

[-i=1mz2i+(1-k)i=1mj=m+1naijc2z2i+(1-k)i=1mj=m+1naij12ce2i≤0,-m+1nz2i+(1k-1)i=m+1nj=1maijc2z2i+(1k-1)i=m+1nj=1maij12ce2i≤0, ]

即,对于每一个智能体都保证:

[e2i≤δz2i2ci(1-k)j=m+1naij-c2i,i∈V1e2i≤δz2i2ci(1k-1)j=1maij-c2i,i∈V2],    (13)

其中,[δi∈0, 1]定义事件触发条件为:

[fi(ei(t))=e2i-δz2i2ci(1-k)j=m+1naij-c2i,i∈V1e2i-δz2i2ci(1k-1)j=1maij-c2i,i∈V2].      (14)

如果任意时刻[t>0],对于每个智能体都有[fi(ei(t))≥0]成立,那么事件将触发.

进一步,将式(13)代入式(12)得:

[V(x)≤-i=1nz2i+(1-k)i=1mj=m+1naijci2z2i+(1-k)i=1mj=m+1naij12ci×δz2i2ci(1-k)j=m+1naij-c2i+]

[(1k-1)i=m+1nj=1maijci2z2i+]

[(1k-1)i=m+1nj=1maij12ci×δz2i2ci(1k-1)j=1maij-c2i].

合并整理得:

[V≤(1-δ)-1+(1-k)i=1mj=m+1naijci2i=1mz2i+]

[(1-δ)-1+(1k-1)i=m+1nj=1maijci2i=m+1nz2i] .

因此,當[0

[0

使得[V≤0].

结合引理3,多智能体系统(3)能够实现非对称二分一致,最终收敛状态为[limt→∞x(t)=(ξ)Tx(0)(ξ)Tαα].

定理2  考虑多智能体系统(3),通信拓扑为结构平衡且连通的无向符号图,在分布式事件触发控制协议(2)作用下,如果满足触发条件(7),那么对于任意的初始条件,事件触发的时间间隔恒大于0,且有下界:

[τi=t*-tik=δci2(1-k)j=m+1naij-ci>0,i∈V1τi=t*-tik=δci2(1k-1)j=1maij-ci>0,i∈V2].

证明:假设时刻[tik]是智能体[i]最近一次事件触发时间,那么[ei(tik)=0].如果[t≥tik]时间内,智能体[i]不接受邻居的信息,那么[xi(t)]和[xj(t)]都将保持最近触发时刻的状态不变,即为常数.由定义知[ei(t)=-xi(t)],解得[ei(t)=-(t-tik)zi].当[t*≥tik]时,[ei(t*)=0].当[fi(ei(t*))=0]时,智能体[i]在时刻[t*≥tik]触发事件,[t*]将满足:

[(t*-tik)2z2i-e2i=0].

因此,事件触发的时间间隔下界为:

[τi=t*-tik=δci2(1-k)j=m+1naij-ci>0, i∈V1τi=t*-tik=δci2(1k-1)j=1maij-ci>0, i∈V2],

其中:[0<δ<1],[0

[0

因此,多智能体系统(3)不会发生Zeno行为.

3    仿真分析

考虑含有6个智能体的多智能体系统,通信拓扑结构如图1所示,且[V1=v1, v2, V2=v3, v4, v5, v6],满足结构平衡.令[k=0.5],可以得到拉普拉斯矩阵为:

[L=1.5-10001-11.51000014-1-1000-12-1000-1-13-11000-13].

[L]的特征值为[λ1=0,λ2=0.91,λ3=1.80],[λ4=3.00,λ5=4.29,λ6=5.00],0特征值对应的左特征向量为:

[ξ=0.58, 0.58, -0.29, -0.29, -0.29, -0.29T],取初始状态为[x(0)=1, 2, 3, 5, 6, 7],由定理1可得[x(∞)=(-2.50, -2.50, 1.25, 1.25, 1.25, 1.25, 1.25)].根据控制协议与触发函数取[δ=0.9],[c1=c2=c3=c4=c5=c6=0.01].通过数值仿真验证结果的有   效性.

图2为智能体的状态变化图.由图2可以看出,当多智能体系统的通信拓扑是无向连通图且结构平衡时,在事件触发协议(2)下,所有的智能体状态能够实现非对称二分一致,同时仿真结果与理论计算结果一致,从而验证了定理1中的结论.图3为各个智能体的误差随时间变化的曲线.由图3可知,系统的测量误差不断减小直到为0,当误差超过定义的阈值时事件触发,误差重置为0.当智能体状态趋于一致时,误差恒为0,事件不会再触发,从而系统达到稳定状态.图4为智能体的事件触发时刻.由图4可知,在事件触发控制协议下,事件触发间隔均为大于0的常数,表明该控制协议有效地降低事件触发次数,减少能量损耗,同时能够排除   Zeno行为.

4    结论

传统的时间触发方法在降低能耗等方面具有一定的局限性.本文拟在事件触发方式下实现多智能体系统非对称二分一致性.对于无向符号图,通过构造一类新的拉普拉斯矩阵,设计一种基于事件触发的分布式控制协议,同时推导出事件触发条件,运用经典控制理论知识与数学知识推导得到系统达到非对称二分一致的充分条件以及最终的收敛值,证明了在保证稳定性的前提下能够有效避免发生Zeno行为.但是,本文仅探讨了无向符号图下多智能体系统事件触发非对称二分一致性问题.由于事件触发存在着连续检测问题,在未来的工作中将采用周期检测与事件触发相结合的控制方式,从控制器设计上直接避免了连续通信.

参考文献

[1]     CHEN X,HO Y C,BAI H X.Complete coverage and point coverage in randomly distributed sensor networks[J].Automatica, 2009,45(6):1549-1553.

[2]     DO K D.Formation control of underactuated ships with elliptical shape approximation and limited communication ranges[J].Automatica,2012,48(7):1380-1388.

[3]     LAFFERRIERE G,WILLIAMS A,CAUGHMAN J,et al.Decentralized control of vehicle formations[J].    Systems & Control Letters,2005,54(9):899-910.

[4]     杜永浩,邢立宁,蔡昭权.无人飞行器集群智能调度技术综述[J].自动化学报,2020,46(2):222-241.

[5]     黄恩洲.FMS多智能体调度系统投标算法和评估模型[J].广西工学院学报,2013,24(4):41-44,50.

[6]     李春贵,周坚和,孙自广,等.基于多智能体团队强化学习的交通信号控制[J].广西工学院學报,2011,22(2):1-5,15.

[7]     ALTAFINI C.Consensus problems on networks with     antagonistic interactions[J].IEEE Transactions on Automatic Control,2013,58(4):935-946.

[8]     WU J,DENG Q,HAN T,et al.Distributed bipartite tracking consensus of nonlinear multi-agent systems with quantized communication[J].Neurocomputing,2020,395:78-85.

[9]     QIN J H,FU W M,ZHENG W X,et al.On the bipartite consensus for generic linear multiagent systems with input aturation[J]. IEEE Transactions on Cybernetics,2017,47(8):1948-1958.

[10]   GUO X,LIANG J L,LU J Q.Asymmetric bipartite consensus over directed networks with antagonistic interactions[J].IET Control Theory & Applications,2018,12(17):2295-2301.

[11]   DIMAROGONAS D V,JOHANSSON K H.Event-triggered cooperative control[C]//Proceedings of the 2009 European Control Conference (ECC). IEEE,2009:3015-3020.

[12]   NOWZARI C,CORT?S J.Distributed event-triggered coordination for average consensus on weight-balanced digraphs[J].Automatica,2016,68(1):237-244.

[13]   SEYBOTH G S,DIMAROGONAS D V,JOHANSSON K H.Event-based broadcasting for multi-agent average consensus[J].Automatica,2013,49(1):245-252.

[14]   FAN Y,FENG G,WANG Y. Distributed event-triggered control of multi-agent systems with combinational measurements[J]. Automatica,2013,49(2):671-675.

[15]   ZENG J Z,LI F Y,QIN J H,et al. Distributed event-triggered bipartite consensus for multiple agents over signed graph topology[C]//2015 34th Chinese Control Conference (CCC). IEEE,2015:6930-6935.

Asymmetric bipartite consensus of multi-agent system under

event-triggered mechanism

WANG Wenxin1,YE Hongtao*1,2,3,LUO Wenguang3,WEN Jiayan3

(1.School of Electric, Electronic and Computer Science, Guangxi University of Science and Technology, Liuzhou 545006, China; 2. Guangxi Key Laboratory for Automatic Detecting Technology and Instruments, Guilin University of Electronic Technology, Guilin 541004, China; 3. Guangxi Key Laboratory of Automobile Components and Vehicle Technology (Guangxi University of Science and Technology), Liuzhou 545006, China)

Abstract: This paper analyzes the asymmetric bipartite consensus problem of multi-agent system based on event-triggered mechanism. For structurally balanced undirected graphs, a new type of Laplacian matrix is constructed, and a distributed event-trigger control protocol is proposed. Then, using            Lyapunov stability theory, matrix theory, graph theory, Young's inequality and other methods, the       stability conditions of the system under the event-triggered control are obtained, and the state of the agent converges to asymmetric bipartite with different modulus and signs. In addition, the measurement error is used to design the event-trigger condition, and the agent is triggered when the trigger condition is met, and the controller data is updated. In order to prove that the Zeno behavior can be avoided, it is calculated that the interval between any two event-trigger moments is a positive constant. Finally, the    validity of the conclusion is verified by the method of numerical simulation.

Key words: multi-agent system; event-triggered; asymmetric bipartite consensus; Zeno behavior;       undirected graph

(責任编辑:黎  娅)