林曼菲,张天平
(扬州大学信息工程学院自动化专业部,江苏扬州 225127)
多智能体系统是由多个智能体组成的分布式独立系统,它能够解决单一智能体无法解决的问题,并提高其效率及鲁棒性.特别是分布式多智能体系统的一致性控制在传感器网络、随机多智能体系统、多机器人、机器人编队等领域得到了广泛的研究.多智能体系统的模型可分为无头节点模型和带有头节点的模型[1].对于多智能体系统的分布式控制,多智能体的一致性控制已成为一个主要的研究方向,它的目的是设计分布式算法,使得一组智能体达到给定的协议.文献[2]利用强化学习控制方法(reinforcement learning control,RLC)研究了多智能体系统(multi-agent systems,MAS)中的一致性问题,并给出了一种可视的分布式量化协议来更新动态系统.文献[3]研究了不可测量状态非线性多智能体系统的一致量化控制设计问题.文献[4]研究了具有固定拓扑结构的无向图上多智能体系统的分布式一致跟踪问题,并将命令滤波器后推技术推广到一致性跟踪控制问题中,避免了后推设计中存在的“复杂性爆炸”问题.文献[5]研究了严格反馈形式下的多智能体系统的一致性问题.文献[6]考虑了一组高阶非线性严格反馈多智能体系统在定向通信拓扑上跟踪期望轨迹的输出一致问题.
在实际工业应用中,当执行器将设计的控制信号输入到实际系统中时,它们面临两个问题:信号量化或执行器故障.量化控制技术广泛应用于现代生产过程、电力系统、智能交通和需要通信的智能设备等领域.量化是连续信号离散化的过程,必然会给系统带来额外的非线性.文献[7]引入了一种滞回量化器,并设计了一种基于动态面控制的控制律方法,去除了早期文献中量化系统的许多假设.文献[8]讨论了一类具有输入量化、未建模动态和输出约束的非线性系统的自适应输出反馈跟踪控制问题.引入了一类具有滞回和均匀量化的新的量化器来处理输入信号.文献[9–10]提出了一种有限时间输入量化自适应控制方法.文献[11–12]提出了一种由均匀量化器和对数量化器的组合的量化器.另一个问题是执行器故障,执行器故障分为部分失效和完全失效,执行器完全失效时,输出不再受执行器的影响[13–14].文献[15]引入光滑函数来处理量化以及执行器故障对于系统性能的影响,并将量化以及执行器故障推广到多智能体系统中.文献[16]针对未知执行器故障和系统不确定性,提出了一种自适应控制方案,在执行器故障的情况下实现期望的输出跟踪和闭环稳定.
将自适应动态面方法和神经网络相结合有效地解决了一类自适应非线性系统的鲁棒自适应跟踪控制问题.自文献[17]提出后推设计方法以来,后推设计被广泛应用于非线性系统的控制器设计.但是由于在递归设计的每一步都需要对虚拟控制律进行求导,造成了复杂性爆炸问题.为了解决这一问题[18]在后推设计的每一步中引入一阶滤波器,提出了动态面控制.文献[19]研究了具有动态不确定性的自适应动态面控制.文献[20]研究了一类带有未知死区的纯反馈非线性系统的自适应动态面控制.文献[21]针对一类具有全状态约束和动态不确定性的纯反馈非线性系统,利用径向基函数神经网络(radial basis function neural networks,RBFNNs)建立了自适应神经网络动态面控制(dynamic surface control,DSC).文献[22]将动态面控制方法应用于随机系统中.在实际系统中存在许多不确定性,如未建模动态、死区和状态约束,这可能会降低系统的性能,甚至影响系统的稳定性.未建模动态是不确定非线性系统研究中考虑的一种不确定性.文献[23–24]引入动态信号来处理未建模动态.文献[25]用李雅普诺夫函数来处理未建模动态.
本文在已有文献的基础上,主要解决了一类具有输入量化、未建模动态和执行器故障的非线性多智能体系统的一致跟踪问题.当多智能体系统同时存在输入量化、未建模动态和执行器故障时,每一种不确定性都会对系统稳定性产生影响,如何处理这些不确定项对系统的影响,以及如何将输入量化以及执行器故障模型线性化表示并设计合适的控制器是本文面临的挑战.本文的主要贡献如下:1)利用Young’s不等式和高斯函数的性质,有效地处理了多智能体邻居节点在设计的第1步中对子系统的耦合作用,减少了所设计的虚拟控制中神经网络基向量的变量个数,简化了稳定性分析;2) 与文献[3]相比,本文考虑了多智能体系统中存在未建模动态以及执行器故障的问题,克服了一阶滤波器常数无法求解的问题,并在设计过程中简化了自适应律的设计;3)与文献[15]相比,本文对执行器故障模型和输入量化模型进行线性化处理,避免设计中间控制器,并且简化了自适应律的设计,同时采用自适应动态面方法,最后证明了领导者和跟随者之间达成期望一致,同时保持误差一致有界.
考虑由1个领导者和N个跟随者组成的具有滞回量化器和执行器故障的不确定多智能体系统,第i个跟随者系统和滞回量化器输出Qi(ui,f)描述如下:
系统的控制目标是考虑在执行器部分失效情况下,在执行器发生故障的时间段内设计系统正常控制输入ui,f,使闭环系统中所有信号都是半全局一致终结有界的,此外,使领导者和追随者之间达成期望一致,同时保持误差一致有界.
假设1[3]相对于跟随者,领导者的信号yr∈R是可以获得的,且满足
其中B0>0为常数.
假设2[7]未知动态扰动Δi,j(zi,,t)(i1,···,N;j1,···,n)满足下列不等式
其中:ϕij1(·)是未知光滑函数,ϕij2(·)是未知非负单调递增连续函数.
假设3[15]函数ui,sf,h有界,且上界是未知正数,即存在正常数,使得|ui,sf,h(t)|≤0.
假设4[15]所有执行机构不会同时失效且每个执行器发生故障的次数为有限次,如果执行器故障小于p,则闭环系统仍与其余执行器良好工作.
假设6[3]多智能体存在根节点,根节点与其他跟随者之间有连接且根节点能够获取来自于领导者的信息.
引理1[24]如果Vi,0是系统的一个指数输入状态实用稳定的Lyapunov函数,当式(10)–(11)成立,对任意常数ci0∈(0,ci),任意初始时刻ti0>0,任意初始条件zi0zi(ti0),vi0>0,对任意连续K∞类函数满足则存在一个有限时间Ti0−ci0)}≥0,一个非负函数Di(ti0,t),对于所有t≥ti0,信号可以描述为
因此,当t≥ti0+Ti0时,Di(ti,0,t)0,且Vi,0(zi)≤vi(t)+Di(ti0,t),其中Di(ti0,t)
令G(Γ,ζ)作为一个有向图来模拟N个跟随者之间的信息交换;其中Γ{n1,···,nN}表示节点集合,ζ{(ni,nj)}∈Γ ×Γ表示边集合.定义邻接矩阵A[aij]∈RN×N,aij≥0.对于有向图,若(j,i)∈ζ,i ←j表明第i个智能体可以获取来自第j个智能体的信息,此时aij1,否则aij0.定义度矩阵以Ddiag{d1,···,dN}以及Laplacian矩阵L,LD −A,其中diNi为智能体i的邻居的集合,定义为Ni{j ∈Γ:(j,i)∈ζ}.从智能体i到智能体j的有向图是{(i,l),(l,m),···,(k,j)}的连续边缘序列形式.若存在一个称为根节点的智能体i,从i到其他智能体都有一条有向通路,则有向图G被称为生成树.此外,定义A0diag{a10,···,aN0}是领导者的邻接矩阵.ai01表示第i个跟随者可以获取来自领导者的信息,否则ai00,令HL+A0.
引理2[3]如果生成树存在于有向图G中,根跟随者有机会获得领导者的信息,那么矩阵H所有特征值均具有正实部.
在给定的紧集Ωx⊂Rn,利用径向基函数神经网络逼近未知连续函数fi(x),有
其中:δi(x)为逼近误差,ϕi(x)[ϕi1(x)···ϕiMi(x)]T∈RMi为基向量,其分量基函数ϕij(x)取为下述高斯函数:
其中:1 ≤i≤n,1 ≤j≤Mi,µij和bij分别为高斯函数的中心和宽度,Mi为第i个神经网络的节点数,理想权重定义为
引 理3[26]若Z[χ1··· χN]T∈RN,X∈Rk,{i1,···,ik}是{1,···,N}的一个子序列,µ[µ1··· µN]T,σ[σ1··· σN]T是两个常数向量,
为每个跟随者设计一种自适应神经网络动态面控制,根据跟随者之间的关系定义坐标变换如下:
根据引理2可知,H可逆.因此,有
步骤1由于第i个跟随者的同步误差为
故式(27)可重新写为
根据式(26)(29)代入式(25)得
设计虚拟控制律αi,2和估计参数的自适应律如下:
其中:ki,1>0,ηi,1>0,σi,1>0是设计参数.
注1根据假设6可知系统存在根节点,不妨设第i0个智体是根节点.由于根节点能从头节点获取信息,因此有ai001.当ii0时,存在根节点到多智能体i的通路,即存在j0i,j0∈Ni,使得1.故di≥1.进一步得di+ai0 ≥1,i1,···,N.
注2引理3提供了处理非严格反馈系统中未知函数变量不满足下三角条件的一种方法.根据上述推导可知,通过利用引理3和Young’s不等式,用于逼近未知函数的神经网络回归向量中全部状态变量可用部分满足下三角条件的变量代替,从而简化了虚拟控制器和稍后的控制器设计以及稳定性分析.
将式(31)–(32)代入式(30)得
引入一阶滤波器,定义ωi,2如下:
其中:τi,2>0是一个正常数,αi,2是一阶滤波器输入,ωi,2是一阶滤波器输出.令
对式(35)关于时间t求导得
进一步得
步骤2定义误差面如下:
将si,2关于时间t求导得
定义Lyapunov函数如下:
将V2关于时间t求导得
由Young’s不等式得
令
由Young’s不等式得
设计虚拟控制律αi,3和估计参数的自适应律如下:
其中ki,2>0,ηi,2>0,σi,2>0是设计参数.
将式(53)–(54)代入式(52)得
引入一阶滤波器,定义ωi,3如下:
其中:τi,3>0是一个正常数,αi,3是一阶滤波器输入,ωi,3是一阶滤波器输出.令
对式(57)关于时间t求导得
进一步得
利用Young’s不等式得
步骤m(3 ≤m≤n −1) 定义误差面如下:
将si,m关于时间t求导得
定义Lyapunov函数如下:
将Vm关于时间t求导得
由Young’s不等式得
为
设计虚拟控制律αi,m+1和参数的自适应律如下:
其中ki,m >0,ηi,m >0,σi,m >0是设计参数.
将式(75)–(76)代入式(74)得
定义ωi,m+1如下:
其中:ωi,m+1(0)αi,m+1(0),τi,m+1>0是一个正常数,αi,m+1是一阶滤波器输入,ωi,m+1是一阶滤波器输出.令
对式(79)关于时间t求导得
进一步得
利用Young’s不等式得
步骤n定义误差面如下:
将si,n关于时间t求导得
定义Lyapunov函数:
将Vn关于时间t求导得
根据Young’s不等式得
由Young’s不等式得
由假设3–4以及式(3)–(4)得
其中:ki,n >0,ηi,n >0,σi,n >0是设计参数.将式(95)–(96)代入式(94)得
由Young’s不等式得
定义总的Lyapunov函数和紧集如下:
定理1考虑具有控制器(95),虚拟控制器(31)(53)(75),以及自适应律(32)(54)(76)(96)的多智能体系统(1),若假设1–6成立,则对任意正常数P及有界初始条件V(0)≤P,存在ki,1,ki,j(j2,···,n),τi,j,ηi,j,σi,j满足式(101),使得当系统具有量化输入、执行器故障及未建模动态的情况下,闭环多智能体系统所有信号一致终结有界,各跟随误差收敛到原点的一个小领域内,其中
将上式两边积分得
其中:σ(H)是矩阵H的最小奇异值.对于给定的设计参数σij,选取充分大的设计参数γij.由式(101)可知,常数α0可充分大.根据式(104)可知,常数D0与所有的设计参数γij无关.因此,对于给定的设计参数σij和正常数P,通过选取充分大的设计参数γij使常数α0充分大,从而使充分小.根据式(107)可知,随着时间t的不断增大,跟踪误差能够变得足够小.
下面给出一个算例验证所设计控制器的有效性.
例1考虑如下多智能体系统:
其中:i1,2,3,4.故障模型描述如下:
考虑具有一个领导者和4个跟随者的多智能体系统,4个跟随者通过如图1所示的有向通信拓扑图连接.在图1中,领导者有指向所有跟随者“1”,“2”,“3”,“4”的路径.由拓扑图可知,
图1 多智能体的通讯拓扑Fig.1 Communication topology of multi-agents
故邻接矩阵A为
由拓扑图可知,第2个跟随者能够获取来自领导者的信息,即a201,A0为对角矩阵,表示为A0diag{0,1,0,0}.
选取
误差面定义如下:
虚拟控制律设计如下:
自适应律设计如下:
控制律设计如下:
选取设计参数如下:
选取初值如下:
仿真结果如图2–9所示.图2表明各跟随智能体对头智能体具有良好的一致跟踪性;图4表明各执行器输入信号是有界的;图5–8表明不同智能体的故障信号是有界的;图9表明估计参数随着时间的增大趋于稳定.
图2 输出yi(i1,2,3,4)和给定的期望轨迹yrFig.2 Outputs yi(i1,2,3,4)and desired trajectory yr
图3 跟踪误差曲线Fig.3 Tracking error curves
图4 控制信号Fig.4 Control signals
图5 第1个跟随者的执行器故障信号Fig.5 The actuator fault signals of the first follower
图6 第2个跟随者的执行器故障信号Fig.6 The actuator fault signals of the second follower
图7 第3个跟随者的执行器故障信号Fig.7 The actuator fault signals of the third follower
图8 第4个跟随者的执行器故障信号Fig.8 The actuator fault signals of the fourth follower
图9 自适应调节参数Fig.9 Adaptive adjustment parameters
本文针对一类具有输入量化、未建模动态和执行器故障的非线性多智能体系统,提出了一种自适应动态面控制方法.通过理论分析证明了闭环控制系统是半全局一致终结有界的,所有跟随者都能实现期望的一致性.仿真结果证明了所提出方案的有效性.