张忠艺,徐冬梅
(上海工程技术大学 电子电气工程学院,上海 201620)
为了优化特定的目标功能,调度可以定义为“如何根据时间来调度机器和资源”[1]。由于现代生产调度具有复杂性,特别是不确定性、动态性、复杂性等因素的综合作用,使得现代制造系统的调度更加困难,导致生产任务动态变化的运行环境不确定性增加,要求调度系统具有较强的自适应性、鲁棒性和可扩展性。
针对制造业的多智能体系统的分析方法主要有频域法和Lyapunov函数法。频率域法适用于单输入单输出系统,利用稳定性准则可确定系统上界的时延[2];对一般线性系统来说,Lyapunov函数法更适合[3]。Lyapunov方法是用来分析系统的稳定性的时间域方法。其具体步骤是构造Lyapunov Krasovskii和Lyapunov Razumikhin函数,通过建立的Lyapunov函数,得到系统的时滞在一定范围内波动的一致性充分条件,大部分文献都要求解时滞上界。系统理想的通信方式是无延迟,时间域法将一致性问题转化为系统误差的渐近稳定问题,建立Lyapunov函数的线性矩阵不等式,得到系统的控制参数和控制条件。这种方法的研究对象大多是针对一级或二级多智能体系统,而对制造部门而言,其研究对象多是常阶线性时变系统,该方法在应用过程中较为困难。针对这一问题,针对制造业多智能系统,提出了基于PID的一致性分析方法,通过状态分解把一致性问题转化为降阶系统的稳定性问题,给出了系统一致性的充要条件,最后通过实验验证了所提方法的有效性。
多代理系统理论是分布式人工智能领域的一个重要研究方向,其基本思想是将一个大型的复杂系统转化为能够相互交流、相互协调的小型自治系统。制造业多智能体系统模型如图1所示。
图1 制造业多智能体系统模型
由图1可知,制造业多智能体系统由车间调度agent、任务分配agent、车间资源agent和拍卖agent四个agent组成。将调度任务输入系统后,制造业多智能体系统通过上述四个agent协同完成任务后输出相应的调度结果[4]。
1)车间调度agent
车间调度agent用来接收外部过程输入,判断任务是否能够完成,如有可能,车间调度代理将直接向任务代理分配操作,并安排最终输出作业[5]。
2)任务分配agent
任务分配agent用来将车间调度agent接收任务的流程分解成子任务,每个任务的处理时间和成本在车间调度agent中进行查询,并通过拍卖代理协调任务之间的冲突[6]。
3)车间资源agent
车间资源agent为所有可在现场执行的资源和任务提供信息,帮助拍卖agent提出最终工作计划建议[7]。
4)拍卖agent
拍卖智能体用于处理制造业调度系统中加工工序、任务处理的冲突,因此拍卖agent也是制造业调度系统的核心。制造业调度系统是通过合理安排每项调度任务,实现总损耗最小、加工时间最短等最佳目标。根据拍卖协议,以目标参考变量为基础对拍卖任务进行排序,以获得最优的拍卖结果[8]。
多智能体系统的研究中,通常将各智能体视为一个节点,结合PID法可简化整个系统:
对由各个代理构成的多代理系统,可用图G={V,ε}表示其网络拓扑结构。拓扑学中的节点用非空的有限集合N={N1,N2,…,Nn}来表示,拓扑中的每条边用一对节点表示[9]。
在有向图中,定义一对节点(Ni,Nj)的边即代理可以接收节点状态信息;而在无向图中,定义一对节点(Ni,Nj)的边即智能体i、j可以互相接收并发送状态信息,其他可通过定义的边连接的节点称为区域节点[10]。
为更直观地了解PID控制与多智能体系统的关系,需要对网络拓扑进行邻接矩阵描述[11]。邻接矩阵定义如下:
其中:
在有向图中,当aij=1时,连接两个节点Ni与Nj时,智能体j能够接收代理的状态信息,但是智能体i代理不能接收[12]。当aij=0时,两个节点Ni与Nj之间没有连接时,智能体i和智能体j之间均无法接收代理的状态信息;
在无向图中,当aij=1时,连接两个节点Ni与Nj时,智能体i和智能体j之间可以自由接收各自状态信息;当aij=0时,两个节点Ni与Nj之间没有连接时,智能体i和智能体j之间无法接收对方状态信息。因此可以看出,无向网拓扑的邻接矩阵是对称的,而有向网拓扑则不一定对称[13]。
实现PID控制前需要了解强连通图、生成树和有结点有向图等概念知识,有向图包含有向生成树,即通过有向路径中至少一个节点可以遍历所有其他节点。对于无向图,如果是连通图则包含无向生成树,如果是强连通图则被定义为任意两个结点之间的双向路径[14]。因此有向图中存在有向生成树并不一定意味着图是强连通的,但是有向生成树是存在于强连通图中的。
在系统不稳定的情况下,PID参数设计过程中,首先需要满足式(1);然后利用LMI工具箱结合定理1求解制造业调度系统所需要的增益矩阵K1和K2。根据制造业调度系统所处条件的不同,PID参数设计过程中存在以下两种情况:
1)若无噪音,则该系统为稳定系统,即各agent应一致振动。采用遗传算法求解PID参数,以跟踪误差、上升时间和控制能量作为系统优化指标。在此基础上,选取了一个基于经验的PID调整参数,并将其剩余参数等调整参数与原始数据进行比较,从而确定最优调整参数,从而使系统具有较好的收敛性能[15]。
2)假设制造业调度系统存在随机噪声,证明了系统处于不稳定状态,然后用PID参数选取适当的经验值,并将PID控制与纯比例控制相比较,说明PID控制对系统噪声的具有抑制作用。
图2是包含6个节点的有向图,第1节是根节点,从区段1开始,其可以指向其他五个节点,其中有一个树是由其直接生成的。但是节点2、3、4、5、6不能通过有向路径遍历其他所有节点,因此图中没有实现强连通。
定理1:当有向图存在有向生成树时,其对应的PID控制矩阵只是零特征值,其他非零特征值均位于右半平面。
定理2:若图中仅存在一棵生成树,则图中所对应的多主体系统将逐渐收敛。
通过以上定理可知,相应的PID控制矩阵具有唯一的零特征值,其特征值对应的特征向量为0,其他非零特征值放置在右平面上,即特征值的实部为正。
图2 含有六个节点的有向图
由于PID控制矩阵L存在唯一一个零特征值,故Rank(L)=n-1。网络拓扑的代数连通度是PID控制矩阵的最小非零特征值λ2(L)。
最小非零特征值λ2(L)与算法收敛速度成正比例关系,当λ2(L)变大,则说明算法收敛速度也随之变快;当系统出现时滞问题时,需要将最小非零特征值λ2(L)与时滞大小对比,由此避免时滞给系统运行带来的干扰。图3为含有四个节点的有向图。
图3 含有四个节点的有向图
图3的四个节点有向图中对应的邻接矩阵的入度Q与出度W为:
结合式(3)、式(4),构建PID控制矩阵为:
根据式(5)的PID控制矩阵,可确定特征值为,λ1=0,λ1=λ3=1,λ4=2。
定理1验证:通过极点配置智能体系统矩阵,确定PID参数,通过求解不等式,确定增益矩阵K1,验证结果如图4所示。
图4 定理1验证结果
由图4可知,虽然在不同PID控制矩阵的特征值下,多智能体系统状态没有趋近于0,但最终趋近于一致,使用PID控制方法可以快速消除系统余差,加快系统一致性收敛。
定理2验证:假设系统存在噪声,在该情况下确定PID参数,通过求解不等式,确定增益矩阵K2,验证结果如图5所示。
图5 定理2验证结果
由图5可知,在制造系统存在随机干扰噪声的情况下,采用PID控制方法,可以迅速消除系统余差,实现系统一致性。
为了验证基于PID的制造业多智能体系统一致性分析合理性,进行实验验证分析。
如图6所示为多智能体车间调度过程示意图。
图6 多智能体车间调度过程
如图6所示,多智能体车间调度过程主要有5个步骤:
1)车间调度代理接收处理任务,由程序模块判断是否可以完成任务。不能完成任务时输出“工序超限”命令,可以完成任务时则向代理传送工序通知任务;
2)任务分配代理将接收到的工序分解成若干个子任务,并向车间资源代理查询其消耗、工时、成本、废物处理等任务;
3)车间资源代理向拍卖代理传递任务细节;
4)任务管理通过信息将所收到的任务传送给拍卖代理,二是拍卖代理能够协调任务冲突;
5)拍卖行根据预定的目标函数协调需要拍卖的冲突,比如在最短处理时间等情况下,协调的结果将作为任务分配给单个智能体。
制造业多智能体相应的接近中心性和最小-最大距离中心性如表1所示。
表1 制造业多智能体相关参数
在表1所示的相关参数下,分别使用频域法、Lyapunov函数法和基于PID分析方法对系统状态轨迹一致性进行验证,对比结果如图7所示。
图7 不同方法系统状态轨迹一致性验证分析
由图7可知,使用频域法6个智能体系统状态轨迹在10s时间内,曲线稍有收敛,但在15s以内收敛逐渐停止,达不到一致性效果;使用Lyapunov函数法6个智能体系统状态轨迹在10s时间内,曲线相较于频域法收敛程度更高,但在15s以内依旧达不到一致性效果;使用基于PID分析方法6个智能体系统状态轨迹在10s时间内,曲线收敛速度较快,在15s以内能够达到一致性效果。由此证明,所提方法收敛性较好,能够达到系统多智能体一致性效果。
为了解决任意阶线性连续时间多智能体系统中所存在的不足,提出基于PID的制造业多智能体系统一致性分析。首先将系统一致性问题转化,然后通过PID控制矩阵给出制造业多智能体系统在有向图拓扑中存在唯一全局可达节点这一充分条件,以达到一致性。通过实验可以得出所提方法有着良好的可行性及有效性,但是由于实验的智能体数量较少,未来随着数量增加算法会越来越多,需要进行更深层次的研究。