基于自适应事件触发的交通网络预测控制

2021-06-21 10:30王梦灵薛斌强严怀成

华东理工大学学报(自然科学版) 2021年3期

赵刚，王梦灵，薛斌强，严怀成

（华东理工大学信息科学与工程学院，上海 200237）

智能交通系统 (Intelligent Transportation System,ITS)和计算机网络技术的发展使得对路网交通信号灯进行控制成为可能。假设在控制过程中道路状态的采集以及对信号灯的调节信息是通过计算机网络进行传输的，那么可以将交通信号控制过程看成是一个典型的网络控制系统(Networked Control Systems,NCSs)。网络控制系统具有信号传输速度快、易于维护和安装等优点，已在智能交通系统、工业控制系统、电力系统等领域得到了广泛的应用[1-6]。针对网络控制系统常见的网络延迟、丢包、信号量化和多包传输等问题，许多研究者采用事件触发(Event-Triggered)控制方案，以节省网络的带宽资源。然而，在实际应用中，由于网络带宽的限制，数据在传输前必须经过量化器量化，这使得网络控制系统变为参数不确定系统，给其鲁棒稳定性带来了很大的挑战。目前，已有许多学者研究了不确定性系统或具有数据丢失的网络控制系统的量化稳定性。徐胜元等[7]研究了不确定性系统的鲁棒控制，通过引入广义可镇定的H∞指标，使得控制律可以满足系统鲁棒稳定和性能指标。张凌波等[8]讨论了在控制器失效情况下，具有不确定性系统的鲁棒H∞控制问题。

与许多流行的控制方法相比，模型预测控制(Model Predictive Control, MPC)以其在处理强约束和不确定性方面的便利性而受到了广泛的研究和关注。针对具有输入和状态硬约束的加性有界扰动线性系统，Dai 等[9]提出了一种鲁棒自触发模型预测控制算法。Li 等[10]提出了一种基于模型预测控制的框架，通过约束优化问题解决控制包的设计问题，并基于传输控制协议提出了一种有效的包传输和补偿机制。Liu 等[11]提出了一种新的随机网络诱导时延和数据丢失的控制方案——具有最优估计的网络预测控制，利用无序或有延时的测量数据来提高估计精度。李德伟等[12]研究了具有有界扰动的不确定系统，通过椭圆不变集方法设计出一种有效的鲁棒预测控制器。由此可见，MPC控制策略可以有效地解决量化引起的系统不确定性问题，而且，在网络控制系统中引入事件触发机制更能充分利用有限的网络带宽、降低网络延迟、减少网络带宽堵塞。

事件触发 MPC 机制的触发条件和优化设计是控制器设计需要解决的问题。本文提出了一种基于量化的自适应事件触发MPC(Event-Triggered MPC,ET-MPC)方法，保证具有量化的网络控制系统在闭环稳定下有良好的控制性能。通过求解线性矩阵不等式(LMI) 得到事件触发矩阵，基于事件触发时控制律的预测性能计算，给出自适应事件触发条件，仿真实验结果验证了ET-MPC方法的有效性。

1 问题描述

图1示出了一种典型的智能交通信号控制系统框图[13]。车辆检测节点检测车流量和道路信息，通过无线或有线网络传送给路口信号控制节点，控制节点根据传送过来的信号进行处理，输出信号改变信号灯的持续时间，从而达到对交通流的调节，进而改变路面状况。假定交通网络系统对象是一个离散时间线性时不变系统，可以将图1抽象为图2所示的具有量化的网络控制系统，如式(1)所示。

其中：x(k)为系统状态；ν(k)为控制对象的输入，也是量化器的输出；A、B分别为系统矩阵。图2中ki为系统状态传输时刻，是离散时刻k的子集。

本文的主要目的是设计一种合适的基于事件触发机制的状态反馈图1 MPC控制器，以保证NCSs在控制输入量化时系统能够稳定，并且减少网络带宽资源的浪费。

图1 典型的交通信号网络控制系统框图Fig. 1 Diagram of typical traffic signal network control system

图2 具有量化的事件触发预测控制网络控制系统框图Fig. 2 Diagram of event-triggering predictive control for NCSs

1.1 基于扇形定界法的量化问题表示

其中Λ(k)是对角矩阵且

在进一步的理论分析之前，作如下假设：

假设1 传感器周期性地采样系统状态，状态成功传输的时间由集合 {ki|i∈N} 给出。系统状态第一次成功传输的时刻k0=0。

假设2 为了便于分析，假设网络中没有延迟。显然，传送成功的时刻{ki|i∈N} 是{mh|m∈N} 的子集，其中h是采样时间间隔，m是采样长度。

1.2 具有量化的NCSs事件触发机制

本文将事件发生器置于传感器和MPC控制器之间，给出了事件触发方案：

其中：x(ki)和x(kn)分别为最后传输的状态和当前采样的状态；Ψ＞0是待设计的正定权矩阵；σ＞0为[0,1)范围内给定的参数；kn为当前采样时间；ki为上次事件触发的时刻。为了更有效地利用网络资源，参数σ在一定范围内改变，由此得到了一种更为自适应的事件触发方法。从式(5)可以看出，一个相对较小的σ使得事件驱动机制相对容易触发，并且系统状态成功传输的数量将会增加。即如果要使得触发事件数量较少，需要相应地增大σ值，但在最坏的情况下，σ的临界值应能保证网络控制系统的稳定性。

显然，只有当当前采样时刻的状态信息与最新传输采样时刻的状态之间的差异超过某个阈值时，才会传输当前状态。因此，下一次的触发时刻可以通过式(6)得到。

其中：e(kn)=x(kn)−x(ki)；ki+1是下一次触发时刻；inf代表集合的下界。

在触发时刻ki，对象状态x(ki)将通过网络从事件触发器传输到预测控制器。同样，当不满足事件触发条件时，当前状态将不被发送，控制律保持不变。因此，在ki时刻，可得v(ki)=(I+Λ(ki))Kx(ki) ,K为控制器的状态反馈增益矩阵。同时在时间间隔[ki,ki+1) 内，由于事件没有触发，控制输出保持不变。因此，控制器输出如下：

具有控制输入量化和事件触发机制的网络控制系统模型表示如下：

因此，在式(1)中具有控制输入量化的网络控制系统被转换为具有结构不确定性和事件触发方案(式(8))的线性系统。不确定性给系统的稳定性和控制器的设计带来了很大的挑战，常规的状态反馈方法不能直接应用于控制器的设计。模型预测控制具有控制效果好、鲁棒性强、能克服不确定性等优点，可以用来解决上述问题。模型预测控制通常是基于一个预测模型和一个无限时域二次型性能指标的滚动时域优化算法。在触发时刻ki，系统的状态预测可以描述为

U∞0(ki)

控制器的预测输出序列表示为

1.3 事件触发时刻预测控制率的计算

本文将事件触发方法引入到网络控制系统中，使MPC控制器的控制律只在事件触发的情况下才得以更新，即只在触发时刻计算控制器的输出，然后在保证系统稳定性的前提下导出事件触发参数Ψ。

在事件触发时刻ki，考虑以下预测控制性能指标：

其中：Q和R是正定的对称权矩阵。

将MPC优化问题描述为一个Min-Max优化问题，那么式(11)可以改写为

其中，P是正定的对称矩阵。当系统(式(1))渐近稳定时，根据Lyapunov稳定性定理，可以很容易地导出x(∞|ki)=0 且V(0|ki)=0(V(k)＞0) 。

对式(15)从l=1到∞累加求极限，可得

引理1(舒尔补引理) 给定对称矩阵S，以下3个条件是等价的。

引理2 给定适当维度的矩阵D、E、F、R，F和R是对称矩阵且R＞0，对于任意F满足FTF≤R，那么存在某个数ε＞0，使得

2 事件触发机制的预测控制器设计及稳定性分析

定理 1 给定对数量化器的给定量化密度αq，则网络控制系统(式(11))渐近稳定，系统具有一定的控制性能ζ(ki)，且MPC控制器增益K=YX−1的条件是：如果存在正定矩阵X、Y、L、M，控制器输出u(ki|ki)以及标量ζ(ki)，使得

并满足式(20)和式(21)

如果上述矩阵不等式满足

那么，利用舒尔补引理，就可以很容易地知道不等式(25)等价于式(20)。同样地，式(21)可以遵循上述过程推导得出，证毕。

根据定理1，MPC控制器是在触发时刻ki求得的，即MPC控制器增益K仅在满足事件触发条件(式(5))时计算，从而减少了计算量，节省网络带宽。

定理 2 给定MPC控制器增益K，基于事件触发(式(5))的网络控制系统(式(8))是渐近稳定的，如果存在适当维度的正定对称矩阵Ψ和P，使得以下矩阵不等式成立。

证明构造下列Lyapunov函数:

为了使不等式ΔV(x(k))＜0成立，只需确保Ξ＜0成立。利用舒尔补引理，Ξ＜0 等价于式(26)，证毕。

具有量化的事件触发预测控制算法步骤如下：

（1）给定采样时间{mh|m∈N}, 采样长度为m，标量0＜υ＜1 (υ是步长增量)，erru和errl分别为系统采样状态和MPC预测的状态之间误差范数的上下限，控制对象的系统矩阵A,B；量化器常数ρB,β0；正定对称矩阵P、Q、R；控制器增益K和事件触发矩阵Ψ可由式(20)和式(26)计算得出。

（2）系统状态第1次成功传输的时刻k0=0，在每个当前采样时刻k，测量系统当前状态x(k)，根据式(5)判断事件触发条件是否满足。如满足事件触发条件，则执行步骤（3）；如果不满足，执行步骤（4）。

（3）令i=i+1，ki=k，计算控制输入ν(ki)，并将控制输入施加给系统。令k=k+1，返回步骤（2）继续。

（4）控制律不变，令ν(k)=ν(ki)并作用于系统，令k=k+1，返回步骤（2）继续。

（5）根据求得的控制律，如果一步预测状态和当前采样状态之间的误差范数超过erru，令σ=σ−υ，并重复执行步骤（1）至步骤（4）；如果当前采样状态和上次传输状态的误差小于errl，令σ=σ+υ，并重复执行步骤（1）至步骤（4）。

3 数值仿真实验

为验证ET-MPC方法在具有量化的网络控制系统中的有效性，假定交通信号网络控制系统可以抽象为式(1)对应的数学模型。选择Q=0.000 1I4(I4表示4阶单位矩阵),R=0.001，量化器常数ρB=0.8,β0=0.1，事件触发机制常数σ=0.1，状态向量初始值x0=[2 −1 0.5 −2]T，式(1)中系统矩阵分别为[15]

利用Matlab LMI工具箱求解式(20)和式(26)，可得控制器增益K与事件触发矩阵Ψ分别为

图3、图4分别示出了当事件触发机制参数σ=0.100时系统的控制输入和状态轨迹。图3是控制输入与时间的关系，控制输入不变时事件触发条件未满足，此时不需要重新计算控制率，因此节省了系统的网络资源。从图4可以看出，状态向量收敛到0，意味着上述方法可以保证系统的闭环稳定性。图5示出了事件的触发时刻。纵轴代表事件触发(0.5代表触发，0代表不触发)。不同σ值下的网络利用率如表1所示。从表1可以看出，事件触发机制下的发送数据远小于时间触发方式下的发送数据，而且成功传输数据的数量随着σ增加而减少，事件触发机制的自适应参数σ是为了更好地利用网络带宽。

图3 控制输入传输时刻Fig. 3 Control input transmission time

图4 系统状态分量轨迹Fig. 4 State trajectory of system

图5 事件触发的时刻Fig. 5 Triggering time

表1 自适应参数σ对触发事件的影响Table 1 Effect of σ on even triggering times

4 结论

由于交通信号控制系统可以抽象为典型的网络控制系统，针对网络控制系统存在量化以及有限的网络带宽等问题，本文提出了一种ET-MPC方法对交通信号控制过程进行探讨。采用ET-MPC算法可以利用事件触发方法的优点，节省了网络资源，通过在线优化计算可以及时补偿量化带来的不确定性。采用LMI方法对所述稳定性分析和控制器设计进行了研究，并给出了算法，通过仿真实例验证了该方法的有效性。