带有输出约束条件的随机多智能体系统容错控制

2020-06-11 13:24郑晓宏董国伟鲁仁全
控制理论与应用 2020年5期
关键词:跟随者执行器控制器

郑晓宏,董国伟,周 琪,鲁仁全

(广东工业大学广东省智能决策与协同控制重点实验室,广东广州 510006)

1 引言

近年来,多智能体系统协同控制在传感器网络、移动机器人和无人机编队等众多领域有着巨大的应用前景[1–6],而一致性跟踪问题作为多智能体系统协同控制的基本问题之一,更是受到了专家学者的广泛关注[7–13].文献[11]将代数图论与控制方法相结合研究了二阶多智能体的一致性问题.针对高阶非线性多智能体系统,文献[12–13]提出了自适应神经网络一致性控制方案.众所周知,随机干扰在工程系统中往往是不可避免的,是影响系统稳定的主要因素之一,因此对于随机系统的研究一直是控制领域的热点[14–17].文献[15]提出人工势场法解决了一类随机多智能体编队的避障问题.文献[16–17]利用反步法技术讨论了一类随机多智能体系统的自适应控制.但由于反步法的应用需要对系统中的虚拟控制器进行反复求导,会造成“复杂性爆炸”问题.为了克服这个困难,文献[18]针对一类严格反馈非线性系统,引入了动态面技术,在此基础上设计了鲁棒自适应跟踪控制算法.文献[19]则结合动态面技术解决了带有死区输入的严格反馈随机多智能体系统的控制问题.

值得注意的是,以上提及的研究成果不能直接应用于非严格反馈形式的系统中,相比于严格反馈系统,非严格反馈系统中的非线性项包含了所有的状态变量,采用上述控制方法如传统的反步法进行控制器设计会产生代数环问题.文献[20–21]运用神经网络的性质突破了传统反步法控制设计应用于非严格反馈系统的限制.尽管现有研究对非线性随机系统的自适应控制研究已经取得了很大进展,但却很少有同时考虑输出约束和执行器故障对非严格反馈随机多智能体系统造成的影响.

事实上,许多控制系统需要系统输出保持在一定范围内,否则在系统运行过程中会导致性能下降.对此,利用障碍李雅普诺夫函数特性能为处理输出约束问题提供有效途径[22–25].另一方面,控制系统会因复杂的工作环境、部件老化等因素的影响发生故障,故障的存在严重影响了系统的稳定性,甚至会造成安全隐患,所以研究系统的故障问题是十分有必要的[25–29].基于以上讨论,本文对含有输出约束和执行器故障的非严格反馈的随机多智体系统,提出自适应神经网络容错控制的设计方案.

本文的主要贡献如下:1)采用的系统模型为非严格反馈形式的非线性随机多智能体系统,更具有一般性.此外,系统中的随机干扰和非线性项是完全未知的,且消除了一般研究中随机干扰的有界假设;2)在反步法设计中结合动态面技术解决“复杂性爆炸”问题的同时,引入神经网络的性质[21],克服了非严格反馈形式产生代数环的问题;3)基于自适应神经网络容错控制的设计方法,同时考虑输出约束和执行器故障问题,使本文的控制方案更具有适用性.

本文的组织结构如下:第2节详细介绍了系统的数学模型和相关的准备工作;第3节提出了一种自适应神经网络容错控制设计方案及其稳定性分析,第4节通过仿真研究验证了该方法的有效性;第5节对本文的工作进行总结.

2 预备知识与问题阐述

2.1 图论

为了方便系统分析,引入图论知识来描述多智能体之间的通讯拓扑关系.本文用G=(ℵ,I)表示有向图,其中:ℵ={ℵ1,…,ℵN}代表智能体的非空节点集,I ⊆ℵ×ℵ代表边集合.(ℵj,ℵi)∈I表示第j个智能体能接收到第i个智能体的信息,邻接节点集合表示为Ni={ℵj|(ℵj,ℵi)∈I}.有向图G的通讯拓扑关系用邻接矩阵A=[aij]∈N×N表示,其中aij0.有向图G的拉普拉斯矩阵定义为L=Λ −A,其中Λ=为入度矩阵,为第i个智能体的入度.如果有向图G含有生成树,说明至少存在一个根节点,该根节点到其它任一节点都有有向路径.如果节点0是生成树的根节点,定义H=diag{a10,a20,…,aN0},则矩阵L+H为非奇异.

2.2 问题阐述

考虑由N个跟随者和1个领导者组成的非严格反馈随机多智能体系统,第i个多智能体的动态模型如下:

本文考虑的执行器故障类型为偏差和增益故障,偏差故障的表达式如下:其中wi(t)为有界函数,且增益故障的表达式如下:

其中ri为未知失控率,满足0ri <1.因此,根据文献[26],结合两种故障类型得

控制目标:针对含有输出约束和执行器故障的非严格反馈随机多智体系统(1),提出一种自适应神经网络容错控制的设计方案,使闭环系统中所有信号依概率有界,系统一致跟踪误差收敛到原点的邻域内.

假设1[26]领导者的输出信号yr是光滑函数,且都有界,即

为了处理系统(1)中的执行器故障问题,本文引入了Nussbaum增益技术,Nussbaum函数一般具有以下性质:

许多函数满足以上性质,本文选择exp(ξ2)cosξ2.

引 理1[20]定 义为Nussbaum函数,其中ξi(t)在区间[0,tf]为光滑函数,如果存在正定径向无界的函数V(t,x)满足以下不等式:

则E(V(t,x)),ξi(t)和在区间[0,tf]是有界的.其中:ℓ为微分算子,E(·)为期望算子,ki为设计参数,同时C >0和0.

2.3 随机系统

考虑随机系统如下:

其中:x∈为系统状态向量,是r维的标准维纳过程.

定义1[21]考虑系统(3),假设存在一个正定、径向无界并且二次连续可微的函数V(x),其微分算子ℓ定义如下:

其中tr{·}代表矩阵的迹.

引理2[21]给定任意精度ε>0且t →∞时,存在E|yi(t)−yr(t)|4ε,则表明在有向图下,系统(1)中的领导者和跟随者之间的跟踪误差依概率半全局一致最终有界.

2.4 障碍李雅普诺夫函数

定义2[24]定义在包含原点的开放域Ξ的系统dx=f(x)dt+g(x)dϖ中,障碍李雅普诺夫函数V(x)为正定连续的标量函数,且其在Ξ中的每一个点都存在一阶偏导数,根据V(x)→∞时,x收敛于Ξ的边界的性质,则存在b为正常数且∀t0时,V(x(t))b成立.

本文采用的障碍李雅普诺夫函数形式如下:

其中:log(·)表示自然对数,ki,b为si,1的约束.

引理3[24]对于任意的正常数ki,b,如果所有的si,1都能够满足|si,1|

2.5 径向基神经网络

系统(1)中的未知非线性函数可以用如下径向基神经网络来逼近处理,具体形式如下:

其中:θ=[θ1θ2… θκ]T为权重向量,基函数向量表示为φ(ζ)=[φ1(ζ)φ2(ζ)… φκ(ζ)]T,并且高斯函数φi(ζ)的形式如下:

其中:i=[1 2… κ],ιi=[ιi1ιi2… ιiq]T为高斯函数的中心向量,ωi表示高斯函数的宽度.一般来说,对于定义在紧集Ω ⊂上的未知非线性函数f(ζ),能用具有足够多节点的径向基神经网络(4)逼近到任意精度ϵ>0,即

其中:ϵ(ζ)表示逼近误差,ϵ∗为常数,θ∗为理想加权向量,具体定义为θ∗:=

引理4[21]状态向量=[x1x2… xq]T,且为径向基神经网络的基函数向量,对于任意正数pq,则

3 神经网络控制器设计和稳定性分析

本节将对系统(1)设计神经网络控制器,首先,基于通信拓扑,对第i个跟随者系统进行坐标变换如下:

其中:si,h为误差面,zi,h为滤波误差,αi,h和分别为虚拟控制器和滤波器输出信号.令ai0,qi,k=1,k=2,…,ni −1.ai0为正常数,表示领导者和跟随者之间的通讯关系,当且仅当第i个跟随者能够接收到领导者的信息时,ai0=1,否则ai0=0.

为了设计方便,定义以下符号和参数:λi,ς,li,ς,µi,ς,ci,ς,σi,ς表示正设计参数;定义令为Θi,ς的估计,则估计误差定义i,ς=[xi,1xi,2… xi,ς]T,其中ς=1,…,k.

步骤1结合式(1)和式(6)可得

选取李雅普诺夫函数为

结合式(1)和式(7),则ℓVi,1为

将式(9)–(11)代入式(8)中得

由Young’s不等式得

结合式(13)–(16),则式(12)可重写如下:

为了避免对αi,2反复偏微分,定义在时间常数τi,2下,让αi,2通过一阶滤波器得到则

根据文献[18],滤波误差zi,2的动态方程为

上式中Bi,2和Ci,2是基于式(14)中αi,2的偏导获得.故存在常数满足以下不等式:

步骤2(2kni −1)由式(1)和式(6)可得

选取李雅普诺夫函数为

结合式(1)和式(17),则ℓVi,k为

根据Young’s不等式得

将式(19)–(23)代入式(18)得

其中ηi,k为正设计参数,且

由式(5)得

由Young’s不等式和引理4可得

虚拟控制器αi,k+1设计如下:

再由Young’s不等式得

结合式(25)–(29),式(24)可以重写为

在时间常数τi,k+1下,让αi,k+1通过一阶滤波器得到则

滤波误差zi,k+1的动态方程表示如下:

步骤3由式(1)–(2)和式(6)可得

选取李雅普诺夫函数为

结合式(1)和式(31),则ℓVi,ni为

其中

当k=ni时,将式(25)–(26)代入式(33)中,则控制器ui和ξi的动态方程如下:

当k=ni时,应用式(29),同时结合式(34)–(36),式(33)可化简为

根据式(37)–(39),则ℓV为

则式(40)可重写为

定理1对于含有输出约束和执行器故障的非严格反馈随机多智体系统(1),通过设计实际控制器(34),中间虚拟控制器(14)和(27)以及参数自适应律(15)(28)(36),保证了闭环系统中的所有信号是依概率半全局一致最终有界,且通过合理选择设计参数,跟踪误差能够收敛到原点的邻域内.

4 仿真研究

考虑由4个跟随者和1个领导者组成的非严格反馈形式的随机多智能体系统,具体形式如下:

领导者的输出信号yr=sin(0.5t)+0.5 sin(1.5t).图1表示智能体之间的通讯拓扑图,由图1可知,跟随者的邻接矩阵

且H=diag{0,1,0,0}.

图1 通讯拓扑图Fig.1 Communication topology

选择适当的设计参数为

其中i=1,2,3,4.设置跟随者的初始状态如下:

且设置自适应参数的初始状态如下:

系统的仿真结果如图2–6所示.图2为跟随者输出信号yi与领导者输出信号yr的跟踪轨迹曲线,其跟踪误差轨迹则由图3表示,图4描述了系统控制器ui的轨迹曲线,图5–6则为自适应参数的轨迹曲线.由以上仿真结果可知,本文所提出的方案保证了系统的稳定性,同时验证了设计的控制器能保证跟踪性能,系统的输出信号能够被限定在指定范围内.

图2 领导者和跟随者的输出信号Fig.2 Output signals of the followers and leader

图3 跟踪误差si,1Fig.3 Tacking errors si,1

图4 控制器uiFig.4 Controllers ui

图5 自适应参数i,1Fig.5 Adaptive parametersi,1

图6 自适应参数Fig.6 Adaptive parameters

5 总结

本文针对一类非严格反馈的非线性随机多智能体系统,考虑了在输出约束和执行器故障情况下的协同控制一致性问题,结合有向拓扑图知识设计了一种基于神经网络的自适应容错控制方案.在反步法的基础上,构造障碍李雅普诺夫函数解决了输出约束问题,综合考虑动态面技术和Nussbaum函数,设计了一种有效的自适应容错控制器.最后通过李雅普诺夫稳定性定理,证明了闭环系统的稳定性.本文提出的自适应神经网络控制方案扩展了严格反馈非线性系统的研究成果,未来的研究将把本文的结果推广到有限时间或固定时间的非线性随机多智能体中.

猜你喜欢
跟随者执行器控制器
多场下压电喷油器执行器电学特性试验研究
更正说明
自动驾驶汽车执行器故障冗余算法
工商业IC卡控制器改造为物联网控制器实践
PLC可编程控制器相关外置的选择计算研究
X-431实测篇2010年奔驰B200空调执行器电机学习
由城市台的“跟随者”到县域“三农”媒体的 “领导者”
从“跟随者”到“引领者”的跨越
从“跟随者”到“引领者”
—— 瓮福集团PPA项目成为搅动市场的“鲶鱼”
跟随者