计算受限控制系统的一种全资源预测控制方法

2019-06-22 07:42马翠芹姚俊毅韩康赵云波

自动化学报 2019年4期

马翠芹姚俊毅韩康赵云波

近年来,物联网、信息物理系统、工业互联网及其应用领域,例如智慧家居、车联网、智慧工厂等各种智能互联系统得到了迅猛的发展.这种发展得益于通信和计算两种技术的巨大进步,一方面,通信技术的进步,特别是无线通信网络的发展,使得信息流动更容易,成本更低,促进了大规模互联系统的构建;另一方面,计算能力的进步,特别是微型嵌入式计算芯片的发展,使得更多的微型设备也可以具有计算能力,为系统的智能化发展提供了物质基础[1−6].无线通信和嵌入式计算等技术在控制系统中的广泛使用为控制系统设计和分析提出了新的挑战,也促使了各个不同但相关的研究领域的出现和发展.从考虑各种通信网络在控制系统信息传输中的作用的角度,出现了网络化控制系统的概念,该领域在过去近20年的大量研究为包含通信网络因素的控制系统的设计和分析奠定了坚实的基础[7－10];从考虑多个设备间互联及其拓扑结构和群体行为的角度,为多自主体系统的研究提供了一个重要的模型基础[11－12];从物理系统和信息系统交互影响的角度,信息物理系统的研究也在近些年蓬勃发展起来[13－14].

与上述角度不同,本文关注各类智能系统中大量采用的微型处理器及其带来的计算能力限制问题.事实上,各类智能系统以多个具有有限计算和通信能力的设备的互联互通为基本特征,势必导致其计算能力成为关注的焦点,一方面运行控制器设备本身的计算能力有限,另一方面又要在互联的设备间共享计算资源,使得对某特定的控制系统而言,其控制器的可用计算资源成为有限时变且不可预测[15−16].

传统控制系统的可用计算资源很少有不可预测的特点.因为传统控制系统往往不存在大量设备的互联,从而在系统边界上是封闭的,即控制系统的各个组件对该系统是私有的.因此,即便计算资源有限时变,这一变化特点在控制系统的范畴内也往往是事先预知的.而对已知的时变资源的分配可以采用各种资源调度的算法进行有效处理[17－19].

在本文研究的问题中,对于提供计算能力的设备,仍依赖调度算法对该设备的计算资源进行全局分配,但是,因为全局调动算法的分配很难实时准确地将控制系统的需要考虑在内,分配给控制系统的可用计算资源就难免具有有限时变且不可预知的特点.有限时变的特点意味着在某些时刻控制系统可能会因为计算资源太少而无法运行控制器,使得系统开环,在极端情况下可造成系统失稳,而不可预测的特点又使得任何离线设计的方法失效.这使得不考虑这一新特性的传统控制方法很难在这种新情境下有效发挥作用,从而要求一种全新的在线控制框架来处理这一问题.

本文面向计算受限控制系统提出一种全资源预测控制策略及相关控制器设计方法.该策略注意到了有限时变可用计算资源的另一个可能特点,即在某些时刻可用计算资源可能极为充足,在运行控制器外还有大量剩余,因此就可以使用这些充足剩余的计算资源进行控制量的前向预测,这些控制预测量进而能够在控制系统可用计算资源不足时闭合系统.这一策略仅使用已分配给控制系统的计算资源,但通过对其更充分的利用可获得更好的控制系统性能.

本文结构安排如下:第1节严格定义所考虑的问题;第2节提出全资源预测控制策略;第3节提供了一种改进的模型预测控制算法作为该策略所要求的控制器的一种具体实现;第4节使用基于MATLAB的数值仿真和MATLAB/LabVIEW联合仿真对提出的策略和算法进行验证;第5节总结全文.

1 问题描述

考虑图1所示的控制系统,其受控对象由离散时间多输入多输出线性时不变系统描述.

在图1中,控制器通过计算能力受限的某嵌入式处理器实现,并且该处理器同时负责其他系统(可能并非控制系统)的计算任务.这一模型的提出受近些年快速发展的无线传感网络和信息物理系统等类系统的启发,该类系统具有计算能力受限的设备大规模互联使用的基本特征.该模型意味着分配给所考虑的控制系统的计算资源一方面是有限的,因为处理器的计算能力本身有限,另一方面又呈现出不可预知的时变特性,因为该计算能力与所考虑的控制系统外的其他系统和设备共享,造成该计算能力在所考虑控制系统的边界之外而无法有效管理.

图1 具有时变不可预知计算资源的控制系统Fig.1 Control systems with time-varying and unpredictable computational resources

如果用R(k)表示k时刻分配给所考虑控制系统的可用计算资源,用R∗表示处理器的总计算资源,则有

将计算控制信号u(k)所需的最小计算资源记为,则应有,否则该处理器的最大计算能力都不足以运行控制器,也就是对控制系统而言完全不可用.在时刻k控制量可被计算的条件是在此时刻控制系统可使用的计算资源不小于所要求的最小计算资源,即

如式(3)不满足,则控制信号u(k)无法计算.若式(3)太长时间不被满足,则系统将很可能因为保持开环太长时间而不稳定,这在实际系统中是不允许的.

式(2)和式(3)可合并为式(4),这是传统控制方法能够使用的前提条件.

然而,可用计算资源的时变特性意味着在某些时刻R(k)会太过有限而不能计算控制信号,即

为了解决上述问题,一种可能的解决方案是对计算资源进行全局调度.然而,调度算法在该问题中难以见效,原因有二:1)在处理器的计算资源是有限的并且共享的系统和设备对处理器计算资源要求较高的前提下(这是本文考虑问题的出发点),式(4)中的计算资源要求不可能对所有时刻都满足(否则传统控制方法即可满足要求),意味着式(5)中的情形总会出现(在这些情形时传统控制方法失效);2)调度算法通常无法将控制系统的实时计算资源要求考虑在内,因此,或者会分配计算资源过少造成式(5)中的情形,或者太过保守将非必需的宝贵的计算资源分配给控制系统而造成浪费,也就是会出现如下情形:

综合上述讨论,本文考虑如下问题:

问题1.考虑如图1所示的控制系统,其中控制系统可用计算资源是有限时变而不可预知的,即在某些时刻会太少而不能执行控制器的计算(式(5)),而在其他一些时刻在执行完控制器计算后还有大量剩余(式(6)).设计控制策略以有效使用计算资源,提升控制系统性能.

注1.图1中嵌入式处理器的有限计算资源在控制系统的控制器和其他可能的共享设备中通过某种调度算法进行分配.本文并不研究这些计算资源的调度算法,而是在一定的计算资源调度算法下,研究如何对分配给控制系统的有限时变而不可预知的计算资源进行高效的使用.在这个意义上,本文所做的研究并非是计算资源调度算法的替代,而是其在控制系统应用场景下的补充.

2 全资源预测控制策略

本节首先讨论控制系统可用计算资源与控制预测步长的一个基本关系,随之给出全资源预测控制策略的描述,最后讨论使用该策略的算法性能和闭环系统的稳定性.

2.1 可用计算资源与控制预测步长

本节的讨论主要基于如下事实[20]:控制器所需的计算资源随着控制预测步长的增加而严格增加.注意到计算资源一般由分配给的处理器时间来衡量,在不引起误解的前提下,用R(k)自身表示在k时刻分配给控制系统的处理器时间,从而,这里是非负实数集.记计算控制预测步长i所需最小计算资源为(从而),有如下的从可用计算资源到控制预测步长的映射,f:,其中是非负整数集.

式(7)说明,对时刻k的任意可用计算资源,将有唯一的控制预测步长Nk与之对应.可以注意到,函数f(·)是分段常值且右连续的.

式(7)中的映射提供了看待控制系统可用计算资源R(k)的另一个视角,即它可以被等价看作计算资源可以处理的控制预测步长Nk.另外,从式(5)和式(6)可以得出:1)若式(5)成立,则Nk=0;2)若式(6)成立,则Nk?1.

前一个条件Nk=0使得传统控制算法在此处失效,因为可用的计算资源连一步控制信号都无法算出(要求Nk≥1,∀k),而后一个条件Nk?1则提供了更为有效利用可用计算资源的可能性.注意到在这种情况下,利用可用计算资源可以计算多步控制信号.

注2.式(7)中的映射是依赖具体的控制算法的.若控制算法本身复杂度高,则由R(k)映射到的Nk值较小,否则Nk值较大.但这并不影响这一映射的基本形式和Nk随R(k)递增且函数f(·)是分段常值且右连续的基本性质,因此也并不影响本文后续的讨论.

2.2 全资源预测控制策略及算法

本文提出的针对计算受限控制系统的全资源预测控制策略的基本架构见图2.

图2 面向计算受限控制系统的全资源预测控制策略Fig.2 The full resource predictive control strategy for control systems subject to computational constraints

传统控制方法仅计算当前时刻的控制量,而在本文的全资源预测控制策略中,可用的计算资源被充分使用计算尽可能多的前向预测控制量.这些预测控制量进而存储在执行器端以备使用.依照式(7)中的映射,并记基于k时刻信息计算的k+i时刻的控制预测量为u(k+i|k),i=0,1,···,Nk,则k时刻的前向预测控制序列可构建如下:

图2中的控制信号选择器包含两个部件:1个寄存器,能够存储最大可能长度的前向预测控制序列;1个简单的逻辑电路,可以用来选择合适的控制信号.控制信号选择器按如下方式工作:

1)在新的前向控制预测序列到达时更新寄存器,保证寄存器中的前向控制预测序列总是最新的.由于式(5),寄存器中k时刻的前向控制预测序列并不一定是在当前时刻计算的.记k时刻寄存器中的前向控制预测序列已经在其中存储了步,k时刻的前向控制预测序列则是在时刻计算,可写为.

2)在当前计算资源不足无法计算控制信号时,从前向控制预测序列中选取合适的替代控制量.使用上面符号,k时刻从中选取的控制量为

为使得在任何时刻从前向控制预测序列中都有控制量可用,可用计算资源需满足一定条件,如推论1所述.这也是此后所提算法1能够工作的前提条件.

推论1.若下式成立:

则式(9)中的控制量总在控制信号选择器中可供选择.

证明.注意到k时刻的前向控制预测序列U(k是在时刻计算的. 为了使得按照式(9)选取的控制量在中,前向控制预测序列的长度,即,需大于或等于k,这正是推论中给出的条件.□

注3.考虑如下两种推论1的特例情况.

所提出的策略总结为算法1,采用该算法的系统整体架构见图2.

算法1.全资源预测控制策略

步骤1.传感器采样系统状态并将采集数据传输至控制器;

步骤2.由可用计算资源R(k)按照式(7)获得可计算的控制预测步长Nk,进而按照式(8)计算前向控制预测序列并将之传至执行器;

步骤3.控制信号选择器更新寄存器,按式(9)选择控制量并令执行器执行控制量.

注4.算法1并未考虑计算时间导致的时延.因为与控制系统的时间尺度相比,该计算时延往往是足够小且可以忽略的.不过,需要指出的是,如果绝对必要,这一时延可以放入到执行器的等待时延中,因此可以在不更改系统架构下进行有效处理.

注5.算法1仅对已经分配给控制系统的计算资源做有利于控制系统性能的合理使用,其权限局限于控制系统本身.对整个嵌入式处理器的计算资源的分配需由上一级机构,即计算资源的调度算法做出.本文的全资源预测控制策略是在此意义下对计算资源调度的一个有效补充.

2.3 算法1性能讨论

传统控制方法在无法获得当前控制信号时,往往或者使用零阶保持(即保持先前的控制输入),或者采用零控制(使系统临时开环).这样,面对本文考虑的计算资源有限的控制系统,使用传统控制方法实际所采用的控制信号如下:

与之相对应的,采用全资源预测控制策略的实际控制信号由式(9)给出,或等价地写为

从式(11)和式(12)可以看出,在控制系统被分配的计算资源充足时,就实际使用的控制信号而言,使用或不使用本文提出的全资源预测控制策略并无区别;但是,在当前计算资源不足以进行控制计算时(即式(5)成立),本文策略提供了额外的自由度,使得可以针对具体情形设计式(8)中的前向预测控制序列对本来缺少的控制信号进行替代补偿.

从这一角度来说,本文提出的全资源预测控制策略通过充分使用分配给的计算资源(而并不要求更多),可以实现至少不差于传统控制所带来的控制性能 (使或 0),但通过合理设计式(8)中的前向预测控制序列U(k|k),提供了提升控制系统性能的自由度和可能性.

另外,式(8)中的前向预测控制序列U(k|k)仅是一种一般形式,针对具体形式和目标的系统还需要具体的设计.事实上,只要可以产生所需的前向控制预测序列,它允许所有可能的控制器设计方法.例如,在第3节给出了一种基于改进的模型预测控制的设计方法.进一步,从U(k|k)的一般性上说,所提出的全资源预测控制策略可用于任意受控对象,而并不局限于线性系统模型,本文采用线性对象仅为了后续系统分析和具体前向预测控制序列实现的方便.

2.4 闭环系统稳定性

采用算法1的控制系统所使用的控制信号由式(8)和式(9)给出.但是,式(8)中预测控制序列U(k|k)的设计是一个开放问题,并没有事先规定任何特定形式,因此闭环系统的具体形式和相应的闭环稳定性分析就难以一般性的给出.另一方面,控制系统的可用计算资源由上层调度机构给出,很多情况下可能无法事先估计,这导致了对可用计算资源(进而)定量描述的缺乏,也使得一般性的闭环系统稳定性分析较难进行.

为了能够探讨闭环系统的稳定性,考虑一种简单情况.首先假设预测控制序列U(k|k)采用状态反馈的情况.此时实际使用的控制信号也具有状态反馈的形式,即

闭环系统进而具有如下形式:

其次,有理由假设分配给控制系统的计算资源不是一直缺乏的,那么存储在寄存器中的前向预测控制序列就总可以在有限时间内得到更新.即存在某上界NR,使得.进而,可构建增广系统状态X(k)为

闭环系统(14)的增广形式可写为

其中,Λχ∗k由A,B,等参数确定.

将上述系统视为一般的切换系统,则可以利用标准切换系统方法在李雅普诺夫理论和线性矩阵不等式框架下得到其稳定性条件.该理论方法已经较为成熟,在相关文献中有更多的技术细节.

需要指出的是,上述稳定性分析基于对控制律的状态反馈形式假设,并不具有普适性,所得结论也很难对前向控制预测序列的设计提供好的指导意义,实际应用中闭环系统的稳定性尚需在具体的控制律设计方法给出后另行具体分析.不过,尽管在此并未给出闭环系统稳定的一般结论,但由前面两小节的分析可以看出,U(k|k)设计所带来的自由度可保证采用算法1的控制系统性能(也包括闭环稳定性)永远不差于常规方法.如何针对具体系统进行具体设计将是后续的主要工作.

3 基于改进模型预测控制的前向控制预测序列计算

如前所述,前向预测控制序列U(k|k)需针对所考虑系统具体化.针对本文所考虑系统形式(1),本节提出一种改进的模型预测控制设计方法作为U(k|k)的一种具体实现方法.经典模型预测控制是一种有限时域优化控制方法,通过优化有限步长的系统轨迹来求取一串控制序列,然后将其中的第1步用于实际控制.通过在每一步的滚动优化,模型预测控制方法可以处理噪声、不确定性和其他限制[21].

模型预测控制的目标函数一般定义如下:

上述优化问题的计算复杂性主要决定于预测时域N.记解决预测时域为N的优化问题所需的最小计算资源为RJN,式(7)中所定义的函数f(·)可对目标函数(17)进一步具体化如下:

依照式(18),在如下讨论中将以Nk指代控制系统的可用计算资源R(k).

从式(18)得到的具体形式的f(·)意味着带目标函数(17)和N=Nk的优化问题可以在时刻k使用可用计算资源求解.为解决优化问题,k时刻的预测状态可递归求解如下:

定义E(Nk)=[AT···(ANk)T]T,F(Nk)是Nk×Nk下三角矩阵块,其非零项定义为F(Nk)ij=Ai−jB,j≤i.则上式的向量形式可表示为

最优的前向控制预测序列可以通过将式(19)代入式(17)并最小化Jk(Nk)得到,其解具有如下的状态反馈形式:

其中,

使用如上的改进模型预测控制方法进行全资源预测控制的步骤总结为算法2.

算法2.基于改进模型预测控制的全资源预测控制算法

步骤1.传感器采样系统输出并将数据传输至控制器;

步骤2.基于分配的计算资源R(k),依照式(18)决定前向控制预测序列的步长Nk,通过式(20)计算前向控制预测序列并将之传至执行器;

步骤3.控制选择器更新其寄存器并依照式(9)选择合适的控制量并令执行器应用至系统.

注6.本节中的改进模型预测控制算法在两个方面不同于传统模型预测控制.首先,算法2中的预测时域是时变的并决定于可用计算资源R(k).其次,传统模型预测控制只使用所计算的控制序列中的第一个,而算法2却利用了所有可能的前向控制预测.

4 仿真算例

本节通过如图3所示的小车–倒立摆系统对所提出的全资源预测控制策略和算法进行验证.该系统可建模为式(1)中的线性系统,其系统矩阵如下:

其中,状态变量x(k)=[x1(k)x2(k)x3(k)x4(k)]T且x1(k)为小车的位移,x2(k)为小车的速度,x3(k)为倒立摆与垂直方向的夹角或偏离角度,x4(k)为刚性摆杆的角速度.各物理量都具有相应的单位,其值如下:小球的质量m=1,小车的质量M=10,刚性摆长度l=10,重力加速度g=9.8.

为了验证提出的控制策略的有效性,考虑两种情况的比较,两种情况都使用第3节提出的模型预测控制器,但一种使用第2节提出的全资源预测控制策略,另一种则不使用.也就是说,前者可利用存储在前向控制预测序列中的预测控制量,而后者在可用计算资源无法进行控制计算的时候,即R(k)<时,只能使用零控制,而在其他时刻则如传统模型预测控制一样使用预测序列的第1个控制量.

图3 小车–倒立摆系统示意图Fig.3 The vehicle and inverted pendulum system

首先进行基于MATLAB的数值仿真,进而采用MATLAB/LabVIEW相结合的联合仿真方法进行验证.

例1.基于MATLAB的数值仿真

将计算资源用整数表示,并设处理器的最大计算资源R∗=100.设控制系统进行1～7步控制预测所需的最小计算资源如下:

控制系统的可用计算资源R(k)假设为某一马尔科夫过程,并具有较高的概率小于(见式(5))或接近R∗(见式(6)).在实际中,已分配计算资源的突然大幅度切换较为少见,因此在下一时刻控制系统的可用计算资源有较高概率仍保持在原有或相近水平.在R(k)的转移概率矩阵中本文也将此特性考虑在内.

在上述系统设置下,控制系统可用计算资源R(k)的典型时间演化可见图4(a).由式(21)可知,前向控制预测序列的长度Nk可由计算资源R(k)来确定,如图4(b)所示.另外,从图4(c)中χ∗k的演化可看出,可用计算资源经常会太少不足以计算任何控制量,这使得传统控制方法无法在这种情况下工作.

图5(a)的系统响应支持本文期望的结论:在不增加任何计算消耗的前提下,使用我们的控制策略的系统状态响应更快的到达稳定,并较少波动.图5(b)也显示采用我们的控制策略的实际控制量也更为平滑.

图4 MATLAB仿真的R(k),Nk和χk随时间的典型演化曲线Fig.4 Typical evolution curves ofR(k),Nkandχkin MATLAB simulation

图5 MATLAB仿真的系统响应和控制量曲线Fig.5 The system responses and control signals in MATLAB simulation

例2.MATLAB/LabVIEW联合仿真

本例仍考虑图3中的小车–倒立摆系统,但使用MATLAB/LabVIEW联合仿真的方法来验证我们提出的全资源预测控制策略和算法的有效性.系统实现的架构见图6.其中受控对象即小车–倒立摆系统在LabVIEW中实现,而控制部分则在MATLAB中实现,二者通过LabVIEW中的MATLAB脚本调用实现联合仿真.LabVIEW 中的小车–倒立摆系统添加了一个很小的外部扰动以模拟真实情况.计算资源的刻画则以MATLAB的控制器程序运行时间为标准.因此,与仅基于MATLAB的纯数值仿真相比,这一联合仿真方案具有如下优点:1)LabVIEW中实现的小车–倒立摆系统更为真实的模拟了受控对象;2)计算资源的具体定量描述也更为真实,因此可更有效地验证本文中提出的控制策略和算法.

图6 MATLAB与LabVIEW联合仿真系统结构Fig.6 The diagram of MATLAB and LabVIEW Co-simulation

控制器执行所需要的计算资源通过MATLAB重复实验并归一化,结果如下:

与例1类似,同样使用两种方法进行比较,一种使用我们的全资源预测策略,另一种不使用.系统响应证明了全资源预测控制策略可以保证倒立摆在垂直方向的稳定性(图7(a)),而不使用我们的策略,即便采用同样的控制器设计,也无法保证倒立摆的稳定性(图7(b)).

5 结论

通过对可用计算资源的充分利用,在不增加额外计算资源要求的前提下实现了计算受限控制系统的性能提升.这是一种控制和计算的联合设计方法,对该方法的进一步改进将依赖于前向预测控制序列的更为有效的设计,另外对闭环系统稳定性的保证也是后续的研究工作之一.

图7 MATLAB和LabVIEW联合仿真的系统响应Fig.7 The system responses using MATLAB and LabVIEW co-simulation