陈世明,黎力超
(华东交通大学 电气与自动化工程学院,江西 南昌 330013)
近年来,多智能体系统的协同控制在多飞行器集结[1]、智能电 网[2]、多机器 人协同编队[3]、传感器 网络[4]等领域得到广泛应用.一致性是协同控制的基础,通常指的是多智能体系统中所有智能体的状态最终渐近收敛于一个相同的值.
在实际工程应用中,尤其在要求较高精度和较快收敛速度的控制问题上,通常需要在有限时间内达到收敛.文献 [5–6]研究了非理想环境下多智能体系统有限时间一致性.但是,若系统初始状态未知时,无法计算收敛时间的上界值.为排除系统初始状态对收敛时间的影响,文献 [7–11]解决了带有非线性动力学和不确定扰动的多智能体系统固定时间一致性问题,使得系统全局稳定收敛时间与初始状态无关.文献 [10]基于文献 [9]做出改进,在不使用速度信息的前提下,使用状态观测器利用输出信息估计状态信息,解决固定时间领导跟随一致性问题.文献 [11]考虑了更为一般的非线性模型,实现了固定时间一致性,为了减少能量损耗,引入事件触发控制和间歇通信机制,但系统无法按照期望构型收敛.
结合工程实践,系统不可避免受通信能力的制约或外界不确定随机因素的干扰[12].故由随机扰动、随机切换拓扑等因素构成的随机多智能体系统受到了广泛关注[12–23].文献 [13–18]研究了线性随机多智能体系统的平均一致性问题.文献 [13–14]研究了固定拓扑下随机多智能体一致性问题,分别给出了无向拓扑和有向 拓扑实现均方一致的充要条件.文献 [15–18]研究了切换拓扑下随机多智能体一致性问题,系统中乘性噪声的强度与智能体之间的状态差成正比.文献 [17]指出随机多智能体系统只有在适当的噪声强度下,才能达到一致.文献 [18]设计了一种新的带有乘性噪声的一致性协议,在该控制协议下,收敛速度取决于Laplacian矩阵第二小特征值.文献 [19]研究了一类具有不确定非线性环节的随机多智能体系统领导跟随一致性问题.文献 [20]在文献 [18]的基础上,研究了高阶随机多智能体系统p–阶矩稳定问题,通过递推法设计了新型的非线性分布式虚拟控制器,使得每个智能体设计的控制器只依赖于其自身状态变量和相邻多智能体的输出,适用于更广泛的多智能体系统.
结合固定时间一致性的优势,文献 [21]研究了随机多智能体系统固定时间一致性,提出了固定时间概率稳定的具体定义,并导出了多智能体系统收敛时间的上界值.文献 [22]基于文献 [21]讨论了Lyapunov函数有界和无界两种情况,给出了相应的随机系统固定时间一致性判据定理.文献 [23]在文献 [22]基础上分别研究了固定拓扑和切换拓扑下随机系统的固定时间一致性,首先分析了控制协议中参数选择对收敛速度的影响.随后讨论了不同的噪声强度对收敛时间的影响,得出结论,适合的噪声强度可以加速多智能体系统实现固定时间一致.
本文在文献 [22]和文献 [23]的基础上,分别讨论了固定拓扑和切换拓扑下非线性随机多智能体系统的固定时 间一致 性的问 题,基 于代 数图论、随 机Lyapunov稳定性理论给出了系统满足固定时间稳定的充分条件和与初始状态值无关的收敛时间的上界值.基于文献 [22]本文将通讯拓扑结构推广至切换拓扑,控制协议更具实用性.相较于文献 [23]切换拓扑子图的并集必须是完全图,本文只需满足连通条件;同时考虑了系统中有非线性环节,模型更具一般性,更贴近于实际工程应用.
智能体信息交流可用图G=(V,E,A)表示,V={v1,v2,···,vN}表示N个智能体的非空点集,E ⊆V × V表示智能体集合的边集.在无向图中,定义A=[aij]N×N为加权邻接矩阵,对角线元素aii=0,若(vi,vj)=(vj,vi)∈E,则aij>0,反之aij=0.定义度矩阵D=diag{d1,d2,···,dN},其中图G的Laplacian矩阵可表示为L=[lij]N×N=D−A,0是L的一个特征值,其余特征值均有正实部,有λmin=λ1≤λ2≤···≤λN=λmax.存在非零向量x ∈RN满足:,λ2被称为代数连通度.
引理1[22]考虑n维随机微分方程满足如下形式:
这里:x ∈Rn是状态向量,W(t)表示m维的独立布朗运动,g:Rn→Rn和h:Rn→Rn×m是连续函数且满足g(0)=h(0)=0,对于任意函数V:Rn×R+→R+,定义相关算子LV如下:
如果存在一个连续径向无界函数V:Rn→R+,对于∀x ∈Rn算子LV(x)满足如下形式:
则系统可达依概率固定时间一致,其中常数ρ1>0,ρ2>0,0
显然,E(Γ)满足0 引理2[8]假设ω1,ω2,···,ωN≥0,0 1,则有 引理3[23]对于任意无向图G(A),存在一个实数集Π={y1,y2,···,yN} ∈R满足 其中ϑ(xj,xi)=−ϑ(xi,xj),i,j ∈N,i=j. N个智能体组成的非线性多智能体系统,智能体动力学模型可表示为 其中:f:R+×R→R为非线性函数,满足如下条件: k为任意常数,xi(t)∈R表示智能体i的状态,定义向量x(t)=[x1(t)x2(t)···xN(t)]T∈RN,ui(t)∈R是系统的控制输入,系统初始状态x(0)=[x1(0)···xN(0)]T∈RN. 定义1[5]引入表示智能体的状态平均值,若给定智能体任意状态初值xi(0),i=1,2,···,N,有则称闭环系统满足以概率1渐近时间平均一致性. 定义2[22]对于控制输入ui(t),i=1,2,···,N,若给定智能体任意状态初值xi(0),i=1,2,···,N都可得一个与初始状态无关的常数T,而且E(Γ) ≤T,有 则称闭环系统满足依概率固定时间平均一致性,T被称为最大全局稳定收敛时间. 考虑多智能体系统(5)在固定拓扑下固定时间一致性问题,智能体控制协议如下: 其中: 0<α <1,k1,k2,k3是正实数,s[k]=sgns|s|k,其中s ∈R,sgn()是符号函数.这里选取的W(t)是在概率空间(Ω,F,{Ft}t>0,P)上的一维布朗运动.σij是智能体i,j之间的噪声强度,当且仅当aij>0时,σij>0,反之,σij=0.在同一信道中智能体i,j之间的噪声强度通常被认为是相同的,噪声强度矩阵Θ=[σij]N×N,满足Θ=ΘT.aij受随机扰动影响可改写为:aij→ aij(t)=aij+ 定义智能体i在t时刻的状态误差 e(t)=[e1(t)e2(t)···eN(t)]T是群分歧向量,根据式(1)(5)(8)可得型随机方程 由式(9)可以转化为误差动力系统 其中: 图G(A)和G(Θ)的Laplacian矩阵分别为LA,LΘ,把非线性项线性化,式(11)可改写为向量形式: 其中: 是常数. 定理1考虑系统(5)在控制协议(8)作用下满足如下充分条件: 系统(5)在任何初始条件下均可达依概率固定时间一致.λmax(LΘ)是矩阵LΘ最大特征值,最大收敛时间满足: 证考虑如下Lyapunov函数: 微分算子{L}作用在V(t)上,结合式(11)得 由引理2和引理3,有 结合式(17)–(18) 同理,根据引理2对ψ ′(t)第2项变形得 根据引理2,有 因此 综上所述,得到LV的上界 显然,若满足式(13),则 基于引理1,系统(5)在控制协议(8)的作用下满足依概率固定时间平均一致性的全局稳定收敛时间的期望E(T1)符合不等式(14).证毕. 本节考虑切换拓扑下多智能体系统(5)的固定时间一致性,令Λ={G1,G2,···,Gn}是有限个无向连通图的集合,Gr=G(Vr,Er,Ar),切换信号δ(t):[0,+∞)→ IΛ={1,2,···,n},n ∈R+.智能体控制协议如下: 定理2假设Gr是无向连通图,考虑具有切换拓扑Gr的系统(5),满足以下充分条件: 其中: 证因为Gr在任何切换信号δ(t)都是无向连通图,类似于定理1的证明误差动力系统可写成如下形式: 其中 Lyapunov函数 (13) 与拓扑结构无关,故在切换拓扑下同样适用,LV的上界是 当满足式(23)时,有不等式 根据引理1即可导出式(24),故满足定理2时,系统(5)可在切换拓扑下实现依概率固定时间一致性. 证毕. 考虑8个多智能体组成的系统,智能体连接关系如图1所示. 图1 总拓扑图Fig.1 Total topology 图1的Laplacian矩阵LA 设定x(0)=[−3.5− 2.5− 1.5− 1 1 2 3 4].根据定理1,设定系统控制参数选择α=0.8,η=−0.3,k1=0.4,k2=0.7,σ=1,f(t,xi(t))=−0.3×xi(t),智能体状态轨迹如图2所示. 图2 固定拓扑下智能体状态轨迹Fig.2 State trajectories of agents under fixed topology 根据式(14)可以计算出系统在固定拓扑下固定收敛时间的上界E(T1) ≤T1=3.1 s>1.1 s,在控制协议(8)作用下,系统依概率达到固定时间一致. 图3给出的是智能体输入曲线,可以看出智能体在达到固定时间一致后保持输入稳定.图4给出的是随机噪声变化图. 考虑8个智能体的切换拓扑,他们在一个切换周期下的拓扑集合Ω如图5 所示.图Gr的代数连通度λ2(Gr)=0.20155. 图3 固定拓扑下智能体控制输入Fig.3 Control input of agents under fixed topology 图4 随机噪声变化图Fig.4 Stochastic noise variation diagram 图5 切换拓扑图Fig.5 Switching topologies 根据定理2,设置参数如下:选择 设定驻留时间τ为0.01 s,0.1 s和0.5 s,选取系统初始状 态x(0)=[−4− 3− 2− 1 1 2 3 4].根据式(24)可以计算出系统在切换拓扑下固定收敛时间的上 界E(T2) ≤T2=3.28 s.τ为0.01 s,0.1 s和0.5 s时,智能体状态轨迹分别如图6上、中、下3个部分所示,系统实际收敛时间均小于最大值,故系统达到依概率固定时间一致.图7是智能体输入曲线,可以看出智能体在达到固定时间一致后保持输入稳定. 图6 切换拓扑下智能体状态轨迹Fig.6 State trajectories of agents under switching topologies 图7 切换拓扑下智能体控制输入Fig.7 Control input of agents under switching topologies 本文研究了在固定拓扑和切换拓扑下,带有自身非线性动力学的随机多智能体系统的固定时间一致性问题.首先针对固定拓扑提出了一种控制协议,结合随机Lyapunov稳定性理论和代数图论给出了实现固定时间一致性的充分条件并导出收敛时间的上界值,进而把结论推广至切换拓扑,本文切换拓扑子图的并集只需是连通图,研究对象是带有非线性项的多智能体系统,模型更具一般性.下一步对基于事件触发非线性随机多智能体系统的固定时间一致性展开研究.2.2 问题描述
3 固定拓扑下多智能体系统的固定时间一致性
4 切换拓扑下多智能体系统的固定时间一致性
5 仿真分析
6 结论