曹科才,顾菊平,华 亮,赵凤申,周伯俊
(南通大学 电气工程学院,江苏 南通 226019)
近年来,受自然界鱼群捕食、鸟群迁徙等生物现象的启发,关于多个智能体集合而成的多智能体系统的相关研究引起了国内外学者的广泛关注。不同于传统系统的简单叠加,各个相对独立的智能体通过相互协作,可以大幅提高个体系统的性能与智能化程度,使得整体系统展示出“1+1 >2”的巨大应用潜力。以多智能体系统为背景的技术与理论研究引起了生物学家、社会学家、物理学家和计算机、通信、控制等工程领域专家学者的浓厚兴趣,并在工业生产、地质勘探、灾难救援、海洋探测等多个领域取得了重要应用[1-7]。
多智能体系统中各智能体交互通信和协调合作,对于协调行为的产生及整个系统的智能化程度都具有重要的影响。实际控制系统中,数字控制器由于具有编程灵活、成本低廉及可获得更优的控制性能等优点,得到了广泛的应用[8]。相对于数字传感器、数字执行器的普遍应用,实际通信条件的限制致使智能体之间信息交互不能亦不需要连续不断的传递,因而采样协调控制输入下多智能体系统的协调控制问题,受到越来越多的控制理论学者和实际应用工程师的重视。
本文在介绍采样控制系统基本结构与采样控制设计方法分类的基础上,依次从低阶积分器系统、高阶线性系统、临界稳定与不稳定线性系统几个方面分析了近年来线性多智能体系统采样协调控制的研究进展;然后,沿着低阶非线性系统—非完整(欠驱动)系统—高阶非线性系统的路线,列述了近年来非线性多智能体系统采样协调控制的研究进展;最后,指出了目前多智能体系统采样协调控制研究中还没有解决的相关科学问题,为进一步丰富和深化多智能体系统采样协调控制的相关研究提供一些参考。
采样控制系统结构如图1 所示,相对于连续系统或过程的连续控制律而言,以采样开关与信号保持器为代表的A/D 与D/A 装置的加入,使得整个闭环系统既含有连续时间信号(被控系统或过程),又包含离散时间信号(采样开关),因而采样控制律作用下的连续系统或者过程在本质上属于混杂系统范畴[9]。对于线性连续被控系统或者过程而言,由于存在相对应的精确离散化数学模型,因此其采样控制问题的研究相对比较成熟;但对于非线性连续被控系统或者过程而言,由于存在不精确对等的离散数学模型,因而非线性系统的采样控制研究则相对滞后。总体而言,目前国内外学者对于连续被控系统或者过程的采样控制设计研究可以分为以下3个流派[10-11]:
1)基于连续时间控制律的间接法设计。该方法首先对被控系统或者过程构造连续时间控制律满足给定的性能指标与要求,然后将连续时间控制律进行离散化得到相应的离散时间控制律。该方法存在的主要问题是在采样周期充分小的情况下,离散时间控制律能满足性能指标与要求;但是随着采样周期的变大,闭环系统最基本的稳定性要求有时也难以保证,同时过小采样周期容易造成不期望的ZENO 现象,对于算法的硬件实现是不小的挑战。
2)基于离散时间模型的直接法设计。该方法首先通过各种近似估计手段,获得连续系统的离散近似模型,然后针对所得离散系统设计相应的离散时间控制律,并将该控制律作为原连续系统的离散时间控制律。该方法最大的问题在于模型估计误差难以彻底消除,无法保证所得离散时间控制律对于原系统仍然有效;同时在离散控制律的设计过程中,由于只关心被控系统采样时刻的系统性能而不考虑被控系统采样区间上的动态特性,所以不能保证采样区间上控制律的有效性。
3)基于采样数据的控制设计。该方法自1990年左右提出以来,主要目标是消除线性系统采样区间上的波纹行为,同时寻求合理的控制设计方案与采样周期保证被控系统性能。相比于基于离散时间模型的直接法设计,该方法进一步考虑采样区间上的动态行为,避免了直接法设计中采样区间上系统开环运行的缺陷;但是由于研究问题的复杂性,非线性系统的采样控制研究进展相对缓慢。
本文遵循从线性系统到非线性系统的认知路线,针对近年来国内外学者广泛关注的多智能体系统的相关技术与理论,从采样协调控制的角度出发,梳理了近年来多智能体系统领域采样协调控制的相关研究进展及目前仍未解决的关键科学问题。
由于一阶积分器系统的一致性问题相对简单,本文以如下线性二阶积分器系统
为例,系统(1)的精确离散化模型可以描述为
根据速度一致性终值的不同可将该系统的一致性问题分为如下两类:
对一致性问题(C1)而言,在采样控制律
作用下,系统(1)对应的闭环系统可以描述为
类似地,对于一致性问题(C2)而言,在采样控制律
作用下,系统(1)对应的闭环系统可以描述为
其中L为Laplacian 矩阵。比较闭环系统(2)与(3)可以看出,在上述两种一致性问题的研究中,最终闭环系统特征值的分布与采样周期T 及Laplacian矩阵L都密切相关。文献[12]通过分析二阶积分器系统对应的精确离散化系统的特征值,在特征值对采样周期连续依赖的情况下,得到了不同采样周期下一致性问题收敛、震荡与发散形式的解。文献[13]针对一致性问题(C1)与(C2)在无向通信拓扑下找到了控制增益γ 和采样周期T 选择的充分必要条件,同时也给出了有向通信拓扑包含生成树条件下控制增益γ 和采样周期T 选择的充分条件。文献[14]针对一致性问题(C1)进一步在包含生成树的有向固定拓扑的情况下,找到了控制增益γ 和采样周期T 的充分必要条件,同时得到了联合动态拓扑包含生成树时实现一致性的充分条件。文献[15]针对二阶积分器系统的一致性跟踪控制问题,利用闭环系统特征值与采样周期、通信拓扑及控制增益之间的依赖关系,得到保证一致性误差有界的最大采样周期。文献[16]在有界通信时延与联合动态通信拓扑包含生成树的条件下,得到保证二阶系统一致性所需控制增益与采样周期的充分条件。考虑到一致性问题(C2)与(C1)的不同,文献[17]针对一致性问题(C2)在强连通的平衡拓扑图条件下实现了非零速度下的平均一致性
文献[18]针对有向通信拓扑结构包含生成树条件下的一致性问题(C2),通过合理地选择控制增益与采样周期得到了一致性问题的充要条件及强连通平衡拓扑下平均一致性的充要条件,较好地解决了离散二阶积分器系统的一致性问题。
不同于上述理想智能体系统速度无约束下的一致性问题,人们亦将实际智能体系统中速度约束引入到多智能体系统一致性问题研究中。文献[19]基于文献[20]提出的离散系统速度凸约束下的投影一致性算法,借助扩展状态空间的办法处理通信时延带来的难点,同时通过引入的坐标变换将非凸约束下的一致性问题转化为带有行随机矩阵描述下等价系统的稳定性问题,最终应用非负矩阵的相关理论实现了速度非凸约束下二阶系统的一致性问题(C1)。文献[21]亦针对速度非凸约束下一阶与二阶积分器构成的混合系统,利用随机矩阵的相关性质分析了切换通信拓扑下一致性问题(C1),实现速度非凸约束下位置一致性及联合通信拓扑下位置一致性与速度镇定。
相比上述实际系统中的速度约束,由于时延问题的广泛存在与不可避免,多智能体协调控制中的时延问题引起了人们的重视。文献[22]在随机通信网络下,将N 个线性定常系统的一致性问题转化为N -1 个系统的镇定问题,分析得到了采样周期对于一致性问题的影响。平行于转化为离散系统的间接法设计,亦可以直接针对离散形式的智能体系统在离散时间域内利用直接法进行协调控制设计,如文献[17]对二阶离散线性系统的一致性问题,在强连通平衡图的条件下设计得到离散的分布式协议;文献[23]针对一阶离散积分器系统一致性问题,将线性交互机制推广至离散非线性交互情况,并在有界时延的情况下解决一致性问题;文献[24]针对时延下二阶积分器系统速度不可获取的问题,给出了二阶积分器系统有界时延与固定拓扑下全状态一致性的充要条件与切换拓扑下全状态一致性的充分条件;文献[25-26]从频域的角度研究了二阶连续与离散积分器系统通信时延下的一致性问题,比较分析了非同步更新机制在补偿大通信时延方面的优势及采样周期对于一致性收敛速度、一致性收敛误差的影响;文献[27]利用频域分析法分析了二阶离散系统的一致性,得到了实现一致性所需采样周期的上界;文献[28]亦从频域的角度分析了一阶与二阶积分器系统一致性收敛速度受通信时延的影响;与前述时延补偿设计不同,文献[29]针对无向固定拓扑网络下的二阶离散积分器系统,提出了利用当前位置信息与存储的上一步位置信息实现系统一致性的研究思路,找到了选择采样周期与控制增益实现系统一致性的充要条件;文献[30]针对有向拓扑下二阶积分器系统的一致性问题,在上一步时延位置信息的帮助下找到了实现一致性目标所需采样周期、控制增益及通信拓扑谱半径需要满足的充要条件;文献[31]进一步利用历史输入信息分析了一阶离散不稳定系统的一致性问题,通过融合历史输入信息减轻时延的影响,实现了充分大时延下一阶不稳定系统的一致性。
基于上述相关研究,国内外学者进一步开展了积分器系统一致性问题的其他一些相关研究。文献[4]进一步考虑了二阶系统在通信噪声、时变时延及丢包情况下的一致性问题,并借助Bernoulli 随机过程描述切换通信拓扑,得到了实现均方一致性的充分必要条件;文献[32]通过将一致性问题转化为N -1 个系统镇定问题的方法,从时延系统的角度看待采样控制输入,利用时延系统稳定性分析框架,得到了依赖事件触发参数与一致性控制增益的线性矩阵不等式(LMI),实现事件触发参数与一致性控制增益的一体化设计。近年来,基于分数阶多智能体系统的研究,开始逐步讨论时延情况下分数阶多智能体系统的一致性问题。文献[33]针对有向图下α∈(0,1)的分数阶多智能体系统的采样一致性问题,得到无领导者、静态领导者及动态领导者情况下的采样周期,分数阶的阶数、耦合增益及拓扑结构需要满足的充要条件;文献[34]对于有向拓扑下分数阶离散多智能体系统的一致性问题,从频域的角度入手得到了保证系统稳定的时延上界阈值;文献[35]针对速度信息无法获取的分数阶系统,在系统分数阶的阶数小于2 的情况下,通过设计小于系统阶数的观测器,得到系统无时延及输入定常时延情况下实现一致性的充要条件;文献[36]亦针对通信时延下的分数阶系统,利用分数阶迭代学习控制律实现了分数阶多智能体系统Leader-follower 框架下的一致性跟踪。
不同于前述低阶积分器系统,对于高阶离散线性系统
的一致性问题(C1),主要采用如下离散形式的一致性控制律:
基于控制律(5)的具体形式可以看出,智能体之间仅仅一维系统状态的信息进行交互调整,对于其他状态,(i≥2)采取了镇定控制的设计思路,进而只能实现第一个状态的一致性,其余状态被全部镇定到零,严格意义上来讲,并没有实现全状态的一致性。基于上述控制律(5),文献[37]进一步考虑了有界通信时延情况下离散高阶系统的一致性问题,通过扩张状态空间的办法将高阶系统一致性问题(C1),转化为闭环系统特征值的分析问题,最终在联合通信拓扑包含生成树的条件下实现了高阶系统的一致性;文献[37]亦基于扩张状态空间的研究思路,研究了智能体数目增多的情况下存在维数膨胀和计算量过大的问题;文献[38]针对前述高阶系统(4)的一致性问题(C2)在通信拓扑固定且包含有向生成树的情况下提出了分布式控制律
在有限时间步长上实现了高阶离散系统的一致性。更为一般的,文献[39]利用控制律
来实现高阶线性系统中任选r 个部分状态的一致性问题,其主要设计思想仍然是对于状态进行镇定控制设计及对于状态基于线性比较协议的一致性设计。
相对于速度有界约束下低阶系统一致性的研究,文献[40]在速度非凸约束与联合通信拓扑包含生成树的条件下,针对连续时间的积分链提出控制协议
实现了连续积分链系统的速度镇定与位置一致性。对于速度约束下离散高阶系统的一致性问题(C1),文献[41]在联合通信拓扑包含生成树的条件下提出控制协议
实现了任意有界时延下的一致性问题(C1)。文献[42]针对线性系统的协调控制问题,利用存储的时延采样输出信息实现邻居状态的预测,提出了基于预测的采样协调控制律。文献[43]进一步针对输入时延、通信时延及状态时延下离散高阶线性系统的一致性问题,在状态时延、通信时延与输入时延等情况下,通过嵌套的基于预测的状态反馈控制律与状态观测器设计,得到了基于输出的一致性协议,实现了高阶离散系统全状态的一致性。文献[44]则在时变时延与参数不确定并存情况下,研究了高阶离散线性系统的一致性问题,分别在系统矩阵与输入矩阵存在范数有界不确定性与凸多面体不确定性的情况下,借助线性矩阵不等式求解线性时变一致性协议的控制增益,实现了时变时延下不确定高阶离散线性系统的一致性。文献[45]针对高阶离散线性系统一致性过程中所需数据通信量大于低阶系统一致性实现所需数据通信量的问题,提出了仅仅传输固定时间区间内邻居状态信息最小值与最大值的一致性协议,通过传输标量形式的邻居状态信息,不仅大大降低了传输信道的压力,同时实现了依赖初始状态最小值与最大值意义上的全状态一致性。
对于一般离散线性系统的一致性问题
其中矩阵A为中性稳定阵(除落在单位圆内的特征值,单位圆上的特征值代数重数等于几何重数)且(A,B)可控对,可以通过状态反馈控制律
得以解决。文献[46]在固定连通的交互拓扑下,通过分析状态转移矩阵的极限,实现了一般线性系统(6)的全状态同步;文献[47]把文献[46]静态拓扑的结果推广到切换拓扑,在动态无向切换拓扑联合联通的条件下实现了有(无)领导者下的一致性;文献[48]进一步将文献[47]动态无向切换拓扑联合联通条件放宽为动态有向切换拓扑联合联通;文献[49]则考虑执行约束下中性稳定系统的一致性问题,设计并实现了基于自身及邻居信息的调整触发参数的一致性协议。
不同于中性稳定系统,文献[50]考虑一类更广泛的有界输入下渐近零可控的离散系统((A,B)可控并且A矩阵的特征值在单位圆内或单位圆上)的一致性问题,在固定无向拓扑图与输入饱和约束的条件下,实现了ANCBC 系统的全局一致性,进一步推广了中性稳定系统一致性的相关结论;文献[51]更进一步地针对有界时延情况下多项式不稳定系统(特征值全部在虚轴上的系统)的一致性问题,基于截断预测机制在通信拓扑包含有向生成树的条件下设计得到了依赖时延的状态反馈一致性协议与输出反馈一致性协议。
若系统矩阵A具有一个落在单位圆外部的不稳定特征根,由于此时系统为指数不稳定,对其一致性问题的研究具有相当的难度,如果再考虑实际执行器的饱和约束则难以实现全局意义上一致性。文献[52]针对执行器饱和约束下不稳定系统的一致性问题,利用得到的椭圆几何估计一致性初始值的范围,实现了上述不稳定系统在给定集合上的一致性;文献[53]利用一致性定义与集合稳定性之间的联系,研究性能指标要求下不稳定线性系统的一致性问题,通过性能指标函数的优化获得最优的一致性协议增益。
对于非线性系统的协调控制研究可以追溯到早期混沌系统的同步控制研究,以离散同步控制研究为例,对于低阶非线性系统
而言,经过坐标变换x1=y,x2=后可描述为
可以看出经典的Duffing,Van der Pol 及Coulomb阵子都属于上述范畴。对于上述两个阵子间的同步控制问题,在状态误差完全可获得的情况下,可以利用同步控制律
实现其位置与速度的同步控制问题,其中ωd=[ω,]T为期望的运动形式。
与离散非线性耦合阵子
的同步控制问题,分析了耦合强度上下界在连续阵子同步与离散阵子同步中的不同作用及耦合强度大小在同步产生与同步消除中的不同作用。
文献[56]针对更为一般的低阶非线性连续系统
与非线性离散系统
的协调控制问题,利用无源系统组合后仍为无源系统的优点,首先设计内反馈实现基于自身信息的反馈无源,然后在不破坏无源性的双向通信拓扑条件下,利用个体间信息交互实现非线性系统基于无源的非线性协调控制。由于无源性对于系统动力学的非依赖性,对于非线性Euler-Lagrange 系统
可以利用如下内部反馈与外部协调的非线性控制律实现一致性:
甚至对于SO(3)空间中满足无源与旋转不变特性的姿态协调控制问题,如基于四元数描述的系统
亦可以通过内反馈与外反馈结合的协调控制律
实现姿态一致性协调[57],其中:Ii为个体i 本体坐标系下的惯性阵;τi为个体i 本体坐标系下的控制输入。文献[58]基于无源性框架下非线性系统协调控制研究,进一步考虑了水下机器人系统的编队控制问题,在通信拓扑连通的情况下实现了水下机器人的队形产生与队形跟踪控制。众所周知,连续系统离散化过程中积分器被加法器替代,造成相位滞后超过90°,因而系统的无源性无法得到保持,使得该框架下非线性系统协调控制研究主要针对连续时间系统展开,较少涉及离散非线性系统无源框架下的研究,所以尽管文献[56]对于非线性系统协调控制设计的研究提出了统一的研究框架,但由于无源性方法本身对于系统相对阶与零动态的约束条件,难以进一步将其推广到高阶非线性系统与有向通信拓扑下非线性离散系统的协调控制研究。
为解决被控系统非线性带来的困难,近年来很多学者从其他角度提出了协调控制研究新的研究思路与办法。如文献[59]针对带有非线性扰动的线性系统通过合适的线性变换后利用线性矩阵不等式实现了非线性系统的鲁棒一致性;文献[60-61]针对时变耦合下多智能体系统的一致性问题提出基于拓扑图链接构造Lyapunov 函数的办法进行输出反馈控制的设计思路,由于基于连通图的设计不依赖被控系统的线性及非线性特性,因而为非线性系统协调控制设计提供了很好的思路。与此同时,近年来国内外学者也提出了利用智能体学习算法,如基于数据驱动、神经网络及迭代学习控制算法等,建立无模型的控制设计方法以解决非线性系统协调控制的研究思路。文献[62]对于有向图下离散非线性系统的一致性问题,提出了在自适应估计基础上基于数据的终端迭代学习控制方法,该方法具有基于数据驱动不依赖被控系统模型的特点,可将其应用于非线性系统的一致性问题。文献[63]对于离散非线性系统的最优一致性问题中HJB 方程难以求解的问题,提出了基于Q 函数的自适应动态规划算法估计耦合HJB 方程解的思路,使得分布式迭代最终收敛于耦合HJB 方程的解,得到了无模型的分布式一致性协议。文献[64]对于输入约束下离散非线性系统的一致性问题,在仅有相对局部误差可以利用的条件下,利用基于神经网络的观测器重构局部误差的动力学,并在事件触发框架下得到了离散非线性系统基于神经网络的一致性协议。文献[65]对于离散非线性系统的一致性跟踪问题,基于压缩映射的理论设计了分布式迭代学习控制律,实现了个体初始条件与期望解初始条件精确相同情况下的一致性跟踪问题。
非完整系统是指受非完整约束的系统。非完整约束,简单地说是不可积的速度约束,即不能通过积分化成几何约束的一类约束,所以非完整系统主要是指带有此类速度约束的力学系统。非完整控制系统指的是带有非完整约束的一类控制系统,由于非完整约束的存在使得对于此类系统的控制问题,一般的线性控制理论和标准的非线性控制理论难以解决,因此非完整系统的控制问题吸引了广大控制理论与工程领域内的研究者。
以生活中常见移动机器人为例,非完整运动约束表现在后面两个主动轮的“只能转动而不能滑动”上,这也就意味着机器人的运动方向只能在其中心轴线的方向上。这一假设就给机器人的运动加了一个非完整约束,进而机器人运动的模型可由运动学方程
或链式系统
描述。由Brockett 关于系统可连续镇定反馈的必要条件[66]可知,上述非完整运动学系统(亦包括其动力学系统)不存在光滑(甚至连续的)纯状态的镇定反馈控制律。同时对于其协调控制问题而言,亦不能直接应用现有关于线性系统或一般非线性系统协调控制的相关结果。以上述非完整移动机器人系统相对于如下参考系统
的一致性跟踪控制问题为例,相对于通常线性系统或非线性系统设计得到的线性协调控制律
已经无法解决其协调控制问题,因而该类系统的镇定控制问题及协调控制问题受到了国内外学者的广泛关注,如群集问题[67]、路径跟踪问题[68]、编队控制问题[69-71]、一致性问题[72-73]等。上述针对非完整系统协调控制问题所得控制律,对于参考信号施加了具有线速度或角速度至少有一个不趋于零或者为持续激励信号的约束条件,其根本原因在于参考信号趋于零情况下被控系统的不可控性给协调控制设计带来较大的困难。课题组近几年针对非完整系统一致性问题、编队控制问题及路径跟踪问题等取得了一系列成果[74-78],进一步放宽了该约束条件,在统一的框架下解决了非完整系统的协调控制问题。需要指出的是,上述提及的研究主要针对连续控制对象设计了相应的连续时间的协调控制律,并未考虑实际控制实现过程中数字控制器或离散控制器的普遍性。
对于带有采样器与零阶保持器的二阶非完整链式系统
的控制问题,文献[79]曾指出可以利用构造的依赖采样的时变坐标变换
化为离散线性时不变系统的控制问题,但文献[79]所得结果仍然需要利用采样区间[kT,(k+1)T]上u1(i)≠0 的条件来保证被控系统的可控性。文献[80]亦针对如下带有扰动的一阶链式系统
利用采样区间[kT,(k+1)T]上的恒值控制输入u2(kT)=-z(kT)可以在z(0)≠0 的条件下保证xi子系统的可控性,实现了不确定非完整一阶链式系统(7)基于采样数据的输出反馈控制,后在文献[81]中推广到二阶非完整链式系统。文献[82]进一步针对更为一般的涵盖非完整系统的一类前向系统,在采样输入存在输入时延的情况下,利用标称控制律与时延补偿的办法,实现了任意长时延与任意采样周期下全局意义上的镇定。而文献[83]则直接从非线性离散时变系统的角度出发,针对非完整移动机器人系统的精确离散化模型
利用离散系统零状态可检测性与极限方程的相关理论实现了全局一致渐近性分析。由于非完整系统本身结构上的特点给采样控制设计带来了相当大的困难,因而上述离散或者采样控制研究仍然主要针对单体系统展开。控制设计上的难度使得非完整系统采样控制下协调控制研究较少,迄今为止仅检索到文献[84]针对非完整系统采样协调控制问题,在有向通信拓扑与非同步采样下利用采样一致性协议
来计算状态更新时刻的参考信号值,并设计相应镇定控制律实现采样区间上非完整移动机器人的位置与姿态调整,在混杂系统框架下实现非完整移动机器人的协调控制。
可以看出,由于非完整约束的存在,非完整(欠驱动)系统的协调控制问题具有相当的难度。近年来,虽然研究人员也取得了一些相关成果[85-88],但是采样开关、信号保持器等装置的引入及网络时延、噪声、干扰与系统不确定性等因素的叠加,使得对于此类系统的协调控制问题研究更加困难。到目前为止,对于非完整系统协调控制问题的研究还远未形成统一的理论框架,值得进一步深入探讨。
文献[89-90]针对异构类型的一般仿射非线性系统的协调控制问题
在物理层与网络层分离设计框架提出控制结构
利用无源匮乏的定义将文献[89]在任意相对阶下取得的结果进一步推广到任意相对阶与非最小相位的非线性系统。平行于无源系统对于模块化组合以后的无源不变性,文献[90]利用无源匮乏系统在自身负反馈下模块化组合对于无源匮乏的维持,在物理层与网络层分离设计的情况下进一步推广到时变通信拓扑下非仿射类的非线性系统的协调控制。
不同于前述物理层与网络层分离设计的框架,文献[92]基于不断发展的非线性系统控制理论针对仿射非线性异构系统
利用包含生成树的Laplacian 矩阵对角化办法将整个系统分解为刻画一致性行为的涌现动力系统与误差动力系统互相耦合的系统
进而在整个系统解前向完备的假设条件下,利用子系统半无源的框架实现了异构非线性仿射系统基于耗散输出耦合控制律的同步控制。文献[92]所得结果需要各个子系统输入与输出维数严格相同,同时子系统半无源的性质仅能处理子系统之间是线性耦合交互情形,对于子系统之间输入、输出维数不同及非线性交互情况下的协调控制问题,需要借助更为一般的研究框架,如输入到系统状态稳定的ISS 框架。需要指出的是,在连续控制律的实现过程中,由于采样开关的引入会导致整个系统无源性的丧失,因而非线性系统采样控制输入下协调控制问题仍然是较少探讨的问题,到目前为止未见有国内外相关研究的报道。
正如Dragslav D.Šiljak[93]指出大规模分散系统、分布式系统研究中3 个值得关注的共性问题分别为:1)Dimensionality,个体数目增多后维数灾难问题,亟待可扩展性模块化设计实现交互系统的“即 插 即 用”;2)Information structure constraints,时延、丢包、量化等信道不完美特性;3)Uncertainty,参数不确定性、结构化不确定性、非结构化不确定性。在多智能体系统采样协调控制研究过程中,仍然存在上述共性问题。除此之外由于采样器与保持器的引入,上述共性问题在多智能体系统采样协调控制研究中发生了新的变化,进而形成了采样协调自身所特有的新的关键科学问题。
1)采样周期的选择。采样周期的选择一直是采样控制系统分析与设计中的核心问题,该问题的研究对于闭环数字控制系统的性能分析与采样控制器的计算机实现具有重要的影响[8]。过大的采样周期容易丢失被控系统或动态过程中的有用信息,而过小的采样周期对于处理器运算能力及控制器的硬件实现提出了较高的要求。在同步采样控制设计中,采样周期的选择需要兼顾系统的稳定性、动态性能、稳态性能及外部干扰与不确定性等各种因素,本质上是一类折衷问题,到目前为止一直未见明确结论的报道。针对特定的控制对象与控制任务,分析采样控制律设计、采样周期的大小及系统整体性能之间的关系,给出单体系统及多智能体系统中采样周期选择的规则是未来值得研究的重要问题之一。
2)通信约束下采样机制选择。信息交互是实现多智能体系统协同工作的首要前提,通信约束下协调控制律的设计一直是多智能体系统协调控制中永恒的话题。相对于通信良好的陆地多智能体系统,该问题在水下多智能体系统协调控制中具有更为重要的理论价值与实际意义。水质对于信号传播能量的吸收、散射及噪声与干扰等因素,使得水声通信成为制约水下多智能体系统协调控制研究的主要因素。对于空中、陆地及水下智能体系统而言,为避免传感器端与执行器端连续通信、减少通信系统带宽的占用,合理选择同步采样机制、异步采样机制(时变采样、随机采样)甚至是最优采样机制都具有重要的理论与实际意义。目前越来越多的学者开始将采样作为控制系统分析与设计的关键控制参数,因而通信约束下多智能体系统协调控制设计中采样机制的选择仍将会是未来研究的热点问题之一。
3)异构智能体系统的采样协调控制。随着网络的普及与广泛应用,接入网络设备在数据采集及信息处理能力上具有较大的差异,因而迫切需要一种可以实现智能体系统“即插即用”的控制方案。如前所述,目前异构智能体系统协调控制的研究主要以线性智能体系统为主,较少涉及真正非线性异构智能体系统的协调控制研究;另外,采样器与保持器的引入将使得连续系统很多良好的性质无法得以继承,此时异构非线性智能体系统协调控制问题的研究具有相当的挑战性,目前还没有形成统一的理论框架。为实现异构智能体系统的协调控制,进一步提高智能体系统自主决策、自主运行及自主调整等能力,异构智能体系统的采样协调控制问题也是未来值得研究的重要问题之一。
正如列夫·托尔斯泰所言:“幸福的家庭都是相似的,不幸的家庭各有各的不幸”;与之类似在系统控制领域:“线性系统都是相似的,非线性系统各有各的非线性”。基于上述考虑,本文从线性积分器系统入手,沿着从线性多智能体系统采样协调控制到非线性多智能体系统协调控制的思路,综述了采样协调控制律设计的主要思想与最新进展,同时指出了非线性系统采样协调控制领域目前仍未解决的一些关键问题。在今后以及未来相当长的时期内非线性系统的采样协调控制仍将是理论研究与工程实践的重点,希望本文能为进一步丰富和深化多智能体系统的采样协调控制研究提供参考。