马煜文 李贤伟,2,3 李少远,2,3
近二十年来,多智能体系统的分布式协同控制由于在编队控制、集群控制、传感器网络等领域展现了巨大应用潜力[1–5],引起了研究者们的广泛关注.一致性问题作为多智能体协同控制中的基本问题之一,其目的在于通过各智能体间信息的交互与共享,实现某个或多个状态的趋同.各智能体状态趋向一致时遵守的信息交互规则,被称为一致性协议,是解决一致性问题的关键.
依照协议所依赖的信息,一致性协议大致分为状态反馈和输出反馈两大类.文献[6–10]研究了基于状态反馈的一致性协议.然而,在实际工程中,智能体状态信息往往难以直接测量,导致上述协议的应用场景受到很大限制.因此,如何消除一致性协议对智能体状态信息的依赖成为了研究者们关注的热点之一.在文献[11–15]中,通过额外获取邻接智能体的控制器状态信息,所设计的控制协议在使用智能体绝对输出或相对输出信息的情况下,有效解决了一致性问题.在仅依靠智能体间相对输出信息的前提下,文献[16–24]深入地研究了一致性协议的存在性和设计方法,揭示了该类协议重要优势:第一,该类协议相比于文献[6–10]中的基于状态反馈的一致性协议,无需交互控制器或观测器的状态信息,可以减轻多智能体系统在协同控制过程中的通信负担(为方便,后文统称该类协议为无控制器间通信的一致性协议).第二,在深空探测、室内协同导航等应用领域,智能体的绝对输出信息较难获取.例如深空中的绝对位置测量困难且测量误差都以千米为计量单位,而飞行器间的相对位置测量则较为简单且精度更高.因而,相比于文献[25–26]需要绝对输出信息,无控制器间通信的一致性协议在该类领域更具有应用前景.第三,当智能体间相对输出信息可直接测量时(例如文献[27]考虑了可直接测量相对姿态和间距的无人车系统),无控制器间通信的一致性协议所需的相对输出信息由智能体自身测量可得,无需与相邻智能体进行数据通信,因而避免了数据通信中的数据包丢失、数据内容篡改等网络安全威胁,对于保障多智能体系统的信息安全具有重要意义[18].
输出反馈协议的具体设计方法与所依赖的信息紧密相关.文献[15]利用相对输出信息构造了全阶一致性协议,尽管该协议需要额外的控制器相对状态信息,但是其设计条件满足类似线性系统理论中“分离原理”,计算简便.文献[20]研究了无控制器通信的全阶一致性协议,并在智能体开环极点位于左半复平面的前提下,提出了该类协议的低增益设计方法.文献[16]首先构造了基于智能体间相对输出信息和相对输入信息的降阶一致性协议,进一步以约束智能体开环极点位于闭左半复平面为代价,通过对相对输入信息项的截断,构造了无控制器间通信的降阶一致性协议.在类似智能体约束前提下,文献[19]构造了阶次不同于文献[16]的无控制器间通信的降阶一致性协议.需要指出的是,为了保证无控制器间通信的一致性协议存在性,前述设计方法均需要确定一个低增益参数,而该参数的取值范围不仅依赖于协议增益矩阵,还依赖于智能体之间的耦合强度.因而,这些设计方法并不完全具备类似文献[15]中 “分离原理” 的良好计算特性.此后,文献[21]和文献[24]更加系统地讨论了无控制器间通信的全阶一致性协议的存在性,然而从设计的角度,所提方法仍然具有上述弊端.最近,受未知输入观测器[28]启发,文献[18,23]通过设计邻居智能体的未知输入观测器,引入了巧妙的控制器增益矩阵参数化方法,为无控制器间通信的一致性协议提供了新的设计思路.需要注意的是,文献[18,23]的参数设计的存在性暗含智能体输出维数不小于输入维数的前提,使得该设计方法仍有一定的理论和应用局限性.
基于上述讨论,本文在文献[18,23]参数设计方法的启发下,提出一种新型的无控制器间通信的一致性协议.相比于文献[16,19–22],本文提出的协议参数设计方法具有类似文献[15]中 “分离原理” 的属性,使得协议设计过程更加简便.相比于文献[18,23],本协议具有与其相斥的存在性条件,因而拓展了文献[18,23]中设计方法的适用范围.另外,不同于文献[18,23]以构造智能体相对状态观测器为前提,本文提出的协议不符合未知输入观测器[28]的适用条件,协议状态并不具有智能体相对状态的估计意义,因而该协议在一定程度上也是对文献[18,23]中设计思想的理论延伸.在本文中,首先给出该协议的构造方法;然后通过对智能体动力学进行适当约束,建立协议存在的等价条件;进一步在通信图具有有向生成树的前提下,证明闭环系统的一致性.
符号说明.Rm×n表示m×n维实矩阵的集合,表示具有非负实部的复数集.I表示单位矩阵,1表示内部元素均为 1 的列向量.P >0 表示P是一个对称、正定矩阵.R e(·)和 I m(·)分别表示复数的实部和虚部.A ⊗B表示矩阵A和B的 Kronecker 积.d iag{A1,A2,···,An} 是以A1,A2,···,An为对角块的分块对角矩阵.c ol{x1,x2,···,xn} 是以x1,x2,···,xn为列元素组合成的列向量.r ank(·)代表矩阵的秩,I mage(·)表示矩阵的像空间.‖·‖ 表示向量的 2 范数.
引理 1[29]. 当且仅当图G具有一个有向生成树时,0 是L的一个简单特征值,且L的其余特征值均具有正实部,其中L是G的拉普拉斯矩阵.
考虑一个含有N个线性同构智能体的多智能体系统,智能体的动力学方程为
其中,lij是拉普拉斯矩阵L的第 (i,j)个元素.本文拟研究的一致性问题概括如下.
问题 1.针对由式 (1)构成的多智能体系统,设计降阶输出反馈一致性协议
注1.另一种常用的输出反馈协议具有如下形式
其中,Hr,Fr,Gr,Hu,Fu和Gu为具有适当维数的常数矩阵,且
式 (2)和式 (3)刻画了线性多智能体系统输出反馈一致性协议的两种一般形式.相比于协议 (3),协议 (2)仅需相对输出信息(t),而无需邻接智能体的控制器状态信息(t).因此,在(t)可以直接测量的前提下,协议 (2)并不依赖于额外的通信媒介.这也是本文称协议 (2)无需控制器间通信的原因.事实上,文献[17–24]均对类似问题 1 的一致性问题展开了研究,但对形如式 (2)的一致性协议采用了不同的叫法.例如,文献[20]称其为动态输出补偿器一致性协议,文献[16]称其为基于截断降阶观测器的输出反馈一致性协议,文献[19,21]称其为无控制器交互的输出反馈一致性协议,文献[18]称其为免受攻击的纯相对输出一致性协议.这些叫法都在一定程度上概括了这类协议的主要特征.类似于文献[18],本文考虑的协议 (2)的阶次仍然小于智能体的阶次,因此相较于文献[20–22]中的全阶一致性协议,协议 (2)也具有更低的实现复杂度.另一方面,不同于文献[18],本文考虑的协议 (2)的单个控制器阶次为nx-ny,而文献[18]的降阶控制协议的相应阶次为nx-nu(在不考虑自适应参数的前提下).
本节给出协议 (2)明确的参数设计方法,以解决问题 1 所定义的一致性问题.在给出具体设计之前,需做如下假设.
式 (5)中的λi,i=2,···,N是拉普拉斯矩阵L的特征值.对称正定矩阵是下列代数Riccati 方程的解
在分析多智能体系统 (1)基于协议 (2)和式(4)构成的闭环系统一致性之前,本节将讨论协议(2)和式 (4)的存在性条件.显然,针对式 (4)中给出的参数设计,协议 (2)的可行性取决于是否存在正定矩阵P满足式 (6),以及是否存在矩阵L使Hr为赫尔维兹的.
定理 1.当且仅当多智能体系统 (1)满足假设2和假设 3,(A,C)可检测,且有向图G满足假设 1,则协议 (2)和式 (4)存在.
证明.当且仅当假设 2 成立时,矩阵T和U可以被定义,且T和U显然为可逆矩阵.当且仅当(A,C)可检测时,式 (6)存在对称正定解P.根据引理 1,当且仅当假设 1 成立,存在满足式 (5)的常数µ.为证明存在矩阵L使Hr为赫尔维兹的,即(C⊥AT1-C⊥BU1CAT1,C⊥BU2)可稳,还需证明(C⊥AT1-C⊥BU1CAT1,C⊥BU2)可稳与假设3 的等价性.首先,根据矩阵T1,T2,U1和U2的定义,需注意到CT1=0,CT2=,CBU1=和CBU2=0.因此,经过一系列代数运算,可以得到如下等式
注 2.由定理 1 可知,协议 (2)和式 (4)的可行性与智能体系统矩阵 (A,B,C)有关.假设2 要求输出矩阵C和矩阵CB行满秩,其成立的一个必要条件是输入u的维数不小于输出y的维数1本文尚不清楚假设2 在一般情形下的直观系统解释.当nu= ny=1时,假设2 等价于要求智能体的相对阶为1.若考虑文献[18]的对应条件,即 r ank(CB)=rank(B)= nu,根据未知输入观测器理论[28],该对应条件的直观解释为邻居的控制输入信号可以直接通过相对输出获得,不过这种解释并不适用于假设2..不同于文献[16]以及文献[19-20,22]要求智能体开环极点位于闭左半复平面,本协议中假设 3 的系统意义为要求智能体在闭右半复平面上无不变零点(即系统是最小相位的).另外,注意到假设3 实际上暗含对(A,B)的可镇定性要求(因为假设3 意味着 rank[,B]=nx对所有s∈成立).还需指出的是,假设2 和假设3 与 (A,C)的可观性和可检测性没有直接关系 (例如,对于A=[1,1;0,1],B=I2和C=[0,1],显然假设2 和假设3 成立,但是(A,C)既不可观也不可检测),这也是本文明确要求(A,C)可检测以保证 R iccati 方程 (6)有镇定解的原因.
假设3 在形式上与文献[18] 中定理 2 的条件(ii)类似.如前所述,本文的一致性协议设计思想受到了文献[18,23]启发,为避免控制器间通信,构造了如式 (4)所示的协议增益矩阵参数化方法,由此引出了存在性条件,即假设 2 和假设 3.尽管如此,与文献[18,23]不同的是,由于假设 2 和假设 3 均不符合未知输入观测器的前提条件,所以本文给出的控制协议设计方法并不能直接使用文献[18]所基于的未知输入观测器理论.特别注意到,一致性协议 (2)中控制器状态ri并非是对智能体相对状态的估计,因此其设计思路并不是以设计一个智能体相对状态的观测器为前提(文献[18] 所采用的未知输入观测器思路实际上对智能体相对状态进行了估计).
注 3.就一致性协议 (2)和式 (4)的存在性条件(即假设 2 和假设 3 成立以及 (A,C)可观)而言,对于给定的多智能体系统 (1),这些条件是否成立非常容易验证.由式 (4)给出的协议增益矩阵Hr,Fr,Fu和Hu具有良好的解耦设计特性,即分别由中间参数矩阵P和L计算可得.其中,矩阵P >0 满足Riccati方程 (6),而矩阵L需使得矩阵Hr是赫尔维兹的.对于后者,可以令L=-(C⊥BU2)TP1,其中P1为以下 R iccati 方程的对称正定解
因此,若假设2 和假设3 成立,且 (A,C)可检测,则由式 (4)给出的协议参数设计方法满足类似“分离原理” 的性质,因而计算过程十分简易.特别地,与文献[16,19–22]的设计步骤不同,第 2.1 节所给出的设计步骤并不需要确定一个与其他协议参数耦合的低增益参数.
本节将给出基于协议 (2)和式 (4)的多智能体闭环系统一致性分析.
定理 2.对于式 (1)中的多智能体系统,若假设1、假设 2 和假设 3 成立且 (A,C)可检测,则协议(2)和式 (4)可以解决问题 1.
令s:=col{s1,···,sN},其中si:=col{xi,ri}.若协议 (2)和式 (4)可以解决问题 1,则当t→∞时,闭环系统的一致性状态向量可表征如下
其中,向量η∈RN满足ηTL=0 和ηT1=1.
证明.由s(t)的定义,可给出智能体 (1)基于协议 (2)和式 (4)的闭环系统动力学方程如下
由[15,式(9)]中的矩阵变换可知,拉普拉斯矩阵L可转换为如下形式
因此,联合式 (10)、式 (13)和式 (15)可得,向量ς(t)满足如下微分方程
其中,参数Hr,Hu,Fu,Fr和T1来自于式 (4).由于矩阵L的设计已经确保Hr为赫尔维兹的,所以仅需证明A+λi(BFu+T1Fr)C,i=2,3,···,N是赫尔维兹的.至此,通过代入式 (4)中的Fu和Fr值,可以得到
因此,A+λi(BFu+T1Fr)C=A-µλiPCTC,其中P为满足式 (6)的对称正定矩阵,µ是满足式(5)的正数.令Zi=A-µλiPCTC,则有
其中,Q来自于式 (6).整理式 (5)、式 (6)和式(18)可得
因为µ满足式 (5),所以Q0i≤0,Qi >0.因为P >0且Qi >0,基于李雅普诺夫方程 (20),显然对于所有i=2,···,N,Zi=A+λi(BFu+T1Fr)C均为赫尔维兹的,即说明闭环系统 (10)的状态可达到一致.
为证明式 (9),对式 (10)中的状态向量s(t)进行如下变换
又由于Hr为赫尔维兹的,所以,当t→∞,向量xi和ri满足式(9).
注 4.在定理 2 的证明中,本文首先受文献[15]启发将一致性条件转为矩阵+λi的稳定性问题,进一步经过合适的相似变换将该问题转化为矩阵A+λi(BFu+T1Fr)C的稳定性问题,最后通过引入满足 R iccati 方程 (6)的矩阵P和满足与拓扑约束有关的参数µ,有效计算出增益矩阵Fu和Fr.协议设计式 (4)、式 (5)和式 (6)作为一个整体,有效保留了文献[15]中经典输出反馈协议所满足的类似“分离原理” 的优良计算特性.
注 5.通过设计合适的增益矩阵,协议 (2)和式(4)可指定状态误差xi-xj以及ri-rj的收敛率.为此,根据式 (6),只需对式 (4)中增益矩阵的设计要求修改为: 矩阵A+λi(BFu+T1Fr)C,i=2,3,···,N和Hr的所有特征值实部均小于-α,其中α为给定的正数.若满足,则对于所有i,j=1,2,···,N,t≥0,下列不等式均成立
其中,γ为某一正数.
下面通过仿真算例验证本文无控制器间通信一致性协议的有效性,并通过与文献[16]的降阶一致性协议的对比实验来说明本文方法的优势.
本文考虑由 6 个智能体组成的多智能体系统,智能体 (1)中的矩阵如下所示
容易验证假设2 和假设3 成立且 (A,C)可检测.假设有向通信网络G的拉普拉斯矩阵为
经计算,该矩阵的特征值为 0、1、2、3.3247和 1.3376±0.5623i,表明假设1 成立.
智能体初始状态xi(0)设置为随机数值,控制器初始状态ri(0)设置为0,仿真结果如图1 和图2 所示.在参数设计过程中可以看到,参数Hr,Hu和Fr,Fu的设计过程是完全独立的,即满足类似文献[15]中 “分离原理” 的性质.图1 和图2 显示基于协议 (2)和式 (4)设计的降阶输出反馈一致性协议使闭环多智能体系统达到了一致,验证了该协议的有效性.
图1 无控制器通信一致性协议(2)下的智能体状态xiFig.1 Agent states xi under the protocol (2)
图2 无控制器通信一致性协议(2)下的控制器状态riFig.2 Controller states ri under the protocol (2)
文献[16]中一致性协议具有如下形式
图3 一致性协议 (21)下的智能体状态xiFig.3 Agent states xi under the protocol (21)
为展示本文协议在抵抗网络攻击方面的优势,假定相对输出可直接测量得到,同时假定智能体4的输入值u4在通信传输中每经过 0.1 s 被篡改一次,导致邻接智能体接收的值为 2u4.协议 (2)下仿真结果与图1 和图2 一致,因为该协议并不需要邻居智能体的输入信号(或者说该协议不需要控制器间的通信);协议 (21)下仿真结果如图4 所示.
图4 遭受网络攻击时一致性协议 (21)下的智能体状态xiFig.4 Agent states xi under the protocol (21)when subjected to a network attack
一方面,图3 的仿真结果表明,在控制器间的通信网络能够准确传送邻居输入信号的前提下,协议(21)有效地控制多智能体系统(1)达成一致.另一方面,图4 的仿真结果表明,当通信网络遭受攻击导致无法准确传送邻居输入信号时,协议(21)则有可能完全失效.与之相比,本文所提协议(2)在遭受网络攻击的情况下仍然能够达成一致(仿真结果仍如图1 和图2 所示,因为协议(2)不依赖于邻居的输入信号),从而显示出本文协议(2)在网络攻击免疫方面的优势.
本文针对线性同构多智能体系统,提出了一种新型的无需控制器间通信的降阶一致性协议.本文提出的参数设计方法仍然满足类似 “分离原理” 的性质,增益参数便于计算.当智能体非稳定时,本文协议中的控制器状态仍能在实现一致性过程中保持有界,并且可以通过调整增益矩阵,指定智能体间状态误差xi-xj的收敛率.不同于文献[18,23]以构造智能体相对状态观测器为设计前提,本文协议中控制器状态向量并非是对智能体相对状态的估计,因此本文提出的协议及其设计方法在一定程度上延伸了文献[18,23]中一致性协议设计思想的适用范围和理论框架.