何 月,梁 锦,胡鸿翔
(杭州电子科技大学理学院,浙江 杭州 310018)
随着计算机技术、人工智能理论和控制理论的快速发展,多智能体系统群集行为分析成为国内外研究热点。多智能体系统[1]是由多个自主个体组成的复杂动态系统,多智能体系统的群集行为[2]指系统中的个体按照自身属性赋予其行为规则,并结合个体间的相互通信进行相应活动,最终整体系统实现某种规律性的现象。由于个体间的相互通信往往用网络拓扑来刻画,边权重成为衡量关系的标准。边权重为正表示相应个体间为合作关系,为负表示个体间的竞争关系,正负权重同时存在使其成为合作竞争网络。值得注意的是,目前绝大多数多智能体群集行为的研究是在合作网络框架下展开的,如分布式一致性跟踪[3-4]、多个体的蜂拥行为[5-6]。Zhang Z.Q.等[7]提出网络环境对个体间相互通信的影响,设计带有信息量化特征的分布式协议,并结合事件驱动控制的策略,研究二阶非线性个体的分布式跟踪问题。Su H.S.等[8]研究在多个领导者框架下多智能体系统的群一致性问题,发现若每个子群中至少有一个个体能获得相应领导者的信息,则整个系统可实现群一致性。Hu H.X.等[9]考虑不同子群间信息传递不连续的情形,设计混杂式协议讨论一阶多智能体系统的群一致性行为,并建立了相应的代数判据。在实际中,个体间除合作关系外,还具有竞争关系,因此研究合作竞争网络的群集行为更具实际意义,如Hu H.X.等[10]研究了具有切换拓扑的合作竞争网络,设计了相关的分布式时滞控制器,实现了整体系统的一致性。
以上文献的工作是在个体间关系确定的前提下展开的。但是,在实际合作竞争网络中,考虑其复杂性,个体往往无法判断其邻居的类型,使得网络存在不确定性。本文研究由二阶积分器异质个体组成的多智能体系统在不确定性合作竞争网络中的群集行为,通过设计带有Nussbaum型函数的分布式自适应控制器来实现整体异质系统的群集行为。
在合作竞争网络中,拓扑结构的平衡性对于分析Laplacian矩阵的谱特征具有重要意义,其定义如下。
考虑由N个二阶个体所组成的异质多智能体系统,其数学模型如下:
(1)
式中,xi(t),vi(t)∈R为个体πi的2个状态,bi≥1为速度阻尼系数,且不同的个体具有不同的速度阻尼系数,进而说明个体的异质性。ηi为非零未知参数,用于刻画网络的不确定性,Δi(t)是作用在个体πi上的分布式协议,采用如下形式:
(2)
注意到网络不确定性的存在,本文从Nussbaum型函数的角度出发,相应个体模型变为:
(3)
(4)
证明针对个体πi构造如下的辅助函数:
(5)
由于bi>1,则Vi(t)≥0,进一步,对时间t求导
(6)
根据动力系统(3),可得:
xi(t){-bivi(t)+ηiN0[ki(t)]Δi(t)}≤ηi[xi(t)+vi(t)]N0[ki(t)]Δi(t)
(7)
由式(4),式(7)可改写为:
(8)
两边积分可得:
(9)
(10)
下面证明自适应参数ki(t)在[0,+∞)上的有界性。设闭环系统解的存在区间为[0,tf),首先证明ki(t)在区间[0,tf)上有界。考虑函数
(11)
显然f(-x)=f(x),同时
(12)
Vi(t)≤2ηif(ki(t))+C
(13)
(14)
则由文献[15]中的引理2,可得:
由于二阶个体是异质的,可推出至少存在一个个体,其速度阻尼系数bi>1,不妨设为个体i0,即bi0>1,且由式(7)可得:
(15)
图1 具有10个个体的无向连通图
由10个异质个体组成的多智能体系统,其拓扑结构如图1所示。其中个体1,2,3,4,5组成子集V1;个体6,7,8,9,10组成了子集V2。图1中,个体间的实线边代表合作关系,即权重为正;虚线边代表竞争关系,即权重为负。本文框架中,合作竞争网络的不确定性是通过未知参数ηi的引入来描述的,个体的异质性是通过不同的阻尼系数bi来刻画的,具体的参数选取如表1所示。
表1 不同参数bi对应的参数ηi
在分布式自适应控制律和Nussbaum函数的共同作用下,xi和vi的轨线随时间t的演化分别如图2和图3所示,可以看出:10个异质个体实现了二分一致性,相应的自适应参数ki随时间t的演化如图4所示。由于系统在Nussbaum函数分布式自适应控制律的作用下实现了二分一致性,说明本文所设计Nussbaum函数的分布式自适应控制律的有效性。
同时,本文所设计Nussbaum函数分布式自适应控制律的必要性体现在当未施加该控制律时,整体闭环系统最终趋于发散,其个体的状态xi和vi轨线随时间t的演化如图5所示。
图2 xi的变化曲线
图3 vi的变化曲线
图4 ki的变化曲线
图5 无Nussbaum时,xi,vi的变化曲线
本文主要研究不确定性的合作竞争网络,针对以往研究中存在的不足,设计了新的分布式Nussbaum型自适应控制器,有效克服了网络不确定性产生的不利因素,使得整体异质系统实现二分一致性。后期将针对具有时变拓扑的不确定性合作竞争网络中的群集行为展开进一步研究。