魏才盛,罗建军,殷泽阳
(西北工业大学航天学院航天飞行动力学技术重点实验室,西安 710072)
航天器姿态控制系统是航天器最基础的控制单元之一,其与轨道控制系统互相耦合,是航天器执行空间任务的基础保障。随着航天技术的进步与应用的深化,空间任务朝向复杂化、多约束、自主化、网络化等方向发展[1],随之也对航天器控制系统的设计提出了更多问题和挑战。为了符合空间任务的需求,航天器的设计也存在多载荷、变结构、刚柔耦合等发展趋势。对于姿态控制系统的设计而言,首先,复杂化的空间任务对姿态控制系统的控制精度提出了更高的要求,高品质的姿态确定与控制关系着空间任务执行的成败。其中,“高品质”要求相应的姿控系统能够保障受控姿态系统的瞬态与稳态性能,实现定量化设计与验证。此外,区别于传统任务的要求,强不确定性问题的处理变得尤为重要。典型空间任务的完成均需要考虑和应对强不确定性的影响,如对非合作目标的在轨服务任务[2-3](目标的非合作性)、变结构航天器的姿态控制任务[4](结构变化引起的不确定性)、带挠性附件的航天器的姿态控制任务[5](模态的不确定性和未知高阶模态)、深空探测航天器长期姿态控制任务(燃料和载荷的变化、执行器效率衰减)。以对非合作目标的在轨服务任务为例,空间非合作目标往往具有信息层面不沟通、机动行为不配合等典型的非合作特性。在进行空间在轨服务和维护任务之前,服务航天器首先要实现对含有不确定性目标的交会和捕获,在捕获并完成目标抓捕后,系统质量和质心会发生明显的变化,相应的航天器姿态也会发生改变。由于抓捕的目标具有明显的非合作特性,抓捕后组合体的质量、转动惯量矩阵等惯量信息难以在线实时准确获得,从而给相应的姿态控制系统的设计带来极大的挑战。同时,考虑到服务航天器自身的燃料消耗以及空间环境的复杂特性,难以获得航天器精确的动力学信息,也会给姿态控制系统的鲁棒设计带来巨大挑战。因此,如何在惯量信息突变或未知以及不确定环境下,快速实现“高品质”、安全可靠的姿态控制,是现代和未来空间任务对姿态控制系统设计的需求。
近年来,预设性能控制(Prescribed performance control, PPC)作为一种能够先验定量刻画受控系统瞬态与稳态性能且能够处理系统约束的方法受到航空航天领域的广泛关注。该方法最早由希腊学者Bechlioulis和Rovithakis[6]在2008年共同提出,其核心思想是对受控系统的状态(误差)人为设定性能包络,通过性能包络函数的收敛特性来刻画受控系统的瞬态(如趋近速率、上调量、下调量等)和稳态(如控制精度)性能。因此为实现高品质、安全可靠的姿控系统设计提供了一个潜在可行的方法。基于近几年作者对该方法在航天器制导与控制方面的研究,本文面向解决强鲁棒、高品质、安全可靠的航天器控制问题,对现有航天器姿态控制方法以及PPC方法的发展现状进行综述,探究航天器PPC方法的未来发展趋势。
PPC方法主要是对受控系统的瞬态与稳态性能进行先验定量设计,从而保证受控系统的轨迹全程能够落在所设计的性能包络中。如图1示,PPC方法对受控系统状态e(t)进行定量化性能包络设计,性能函数ρ(t)的性质(如趋近速度、稳态边界等)决定了受控系统状态e(t)的轨迹可达范围。PPC方法的核心是设计性能包络和控制器,将受控系统的状态限制在所设计的性能包络中,从而达到定量化设计瞬态与稳态性能的目的。
PPC方法能够定量描述受控系统的瞬态与稳态性能,如何实现所预设的性能是PPC方法实施和应用的关键。PPC方法的框架和关键步骤如图2所示。本节将着重介绍PPC方法实现的三个关键步骤。
1.2.1预设性能约束
如图2所示,PPC方法有三个关键步骤。首先是预设性能约束的设计。在此步骤中,需要解决的是如何将受控系统存在的约束建模为性能边界约束,进而进行定量化描述。传统的预设性能边界约束设计为上下界约束。其通常应用一组不等式对系统状态进行上下界限制,其定量化描述为:
(1)
式中:e(t)∈R是受控系统的状态,δ∈(0,1]是超调量抑制参数,ρ(t)∈R是性能函数。
为了方便控制器设计,通常性能函数ρ(t)需要满足两个条件:
1)函数是时间相关且是单调递减的。
2)函数是连续可导的。
满足以上两个条件的函数不止一种,常用的性能函数有指数型性能函数和双曲正切型性能函数,具体形式如下:
ρ(t)=(ρ0-ρ∞)exp(-t)+ρ∞
(2)
ρ(t)=coth(1t+2)-1+ρ∞
(3)
式中:ρ0>ρ∞>0,,1,2>0是常量参数。指数型性能函数能够约束系统状态至少以指数速度进行快速收敛。双曲正切型性能函数可以应用于初始状态未知的系统,保证其状态始终位于性能包络以内。
在对受控系统瞬态与稳态性能约束进行定量表述后,为控制系统额外引入了上下界约束,进而增加了相应控制器设计的复杂度。为了方便后续控制器的设计,需要对约束下的非线性系统进行无约束化处理。
1.2.2空间对等映射
如何克服式(1)中的性能约束给控制器设计带来的额外复杂性是PPC方法设计的又一关键步骤。为了实现性能约束空间到无约束空间的对等转换,需要寻找一个可进行同胚映射的函数。现有文献多采用对数型映射函数和正切型映射函数,其中对数函数的具体形式如下:
(4)
1.2.3非线性控制器设计
经过步骤1.2.2中的无约束映射,原约束系统的控制问题转化为映射后无约束系统的状态有界稳定控制问题。由于PPC方法并没有限制设计控制器的具体方法,因此可以结合映射后系统的结构特点,采用滑模控制、退步控制等方法来设计相应的控制器。
注1. 以上是典型PPC方法的实现步骤,现有实现预设性能控制的方式还有基于障碍李雅普函数(Barrier Lyapunov function-BLF)的方法,其主要思路是将式(1)中的性能约束嵌入到BLF的设计中,通过基于Lyapunov函数的设计方法,设计相应的控制器。具体的设计步骤可以参考文献[7],文中不再赘述。
针对航天器姿态控制方法,文献[8-12]对现有理论和工程的方法进行了全面系统的介绍。其中,在实际工程中,PID方法被广泛用于航天器姿态控制系统的设计中。这主要得益于其结构简单、易于实现和经济实用的优点。但是,面对当前日益复杂的空间在轨任务(如非合作目标的在轨服务任务等),传统的PID控制方法很难获得理想的控制效果。这主要是由于现代航天任务的性能要求高,航天器结构及其动力学日趋复杂(如带挠性附件的航天器姿态控制)、动力学参数是不确定或者未知的(如抓捕非合作目标之后形成的组合体姿态接管)。在这种情况下,PID参数的整定异常困难,同时也很难保证受控航天器姿态系统的快速稳定与机动控制。因此,近年来很多学者对航天器姿态控制进行了大量理论和应用研究,提出了多种新型控制方法,如退步控制[13-14]、滑模控制[15]、LQR控制[16]、模型预测控制(Model predictive control,MPC)[17]、基于神经网络的自适应控制[18]等。其中,MPC方法由于其能够同时处理状态与控制约束,近年来不断受到航天控制领域的青睐。Eren等[19]系统地总结了MPC方法在空间系统中的应用状况,并指出MPC方法是一种潜在的可以实现空间系统在多种约束、不确定环境下的自主控制方法,具有非常高的安全性和可靠性。基于这些优点,MPC方法被广泛应用于解决空间目标的交会对接控制以及欠驱动航天器的姿态控制等问题[20-21]。
但是以上针对航天器姿态系统的先进控制方法多是依赖精确的动力学模型,并不适用于惯量参数信息未知的航天器控制。2016年7月,国家自然科学基金委员会发布了国家“十三五”第一批26个重大支持项目,其中,“空间翻滚目标捕获过程中的航天器控制理论与方法”作为重大项目之一,重点关注空间非合作目标(包括故障或失效卫星、空间碎片等)捕获过程中的航天器控制理论和方法[22]。对空间非合作目标的捕获通常分为三个阶段,分别是:捕获前的目标接近,捕获中的目标接触与抓捕,以及捕获后形成组合体的接管控制。由于目标是非合作的,因此捕获后形成的组合体的惯量信息(包括组合体的质量、质心分布等)都难以快速准确辨识。这就给相应的航天器控制系统设计带来极大的挑战。
早在2009年,于欣欣和解永春针对合作目标交会对接后的组合体进行了智能自适应控制方法的研究[23]。但是在该研究中,交会对接后的组合体的动力学模型是已知的,所提出的智能自适应控制方法并不能直接推广来解决非合作目标抓捕后组合体的姿态快速镇定与机动控制。为了解决非合作目标抓捕后组合体的姿态控制问题,现有的文献[23-26]多采用参数辨识的方法(包括基于动量的估计方法、递推最小二乘算法等)对未知不确定惯量参数进行在线辨识,然后依据辨识的结果,采用最优控制方法、滑模控制方法等进行相应控制器的设计,实现对包含未知惯量矩阵信息的组合体的姿态控制。虽然这些方法是有效的,但是“先辨识后控制”的控制思路消耗了大量宝贵的计算资源,同时不准确的辨识过程又会带来固有的鲁棒性问题。为了避免对未知惯量矩阵参数的直接辨识,作者所在团队[27-29]率先在PPC框架下,在预设抓捕后组合体航天器姿态系统瞬态与稳态性能的前提下,设计了惯量矩阵信息无关的非线性控制器,实现了组合体系统的快速稳定控制,节省了大量宝贵的计算资源。同时,PPC方法固有的鲁棒特性提升了所设计的姿态控制器的安全性和可靠性。针对一般的刚性航天器,Zhou等[30]、Shao等[31]和马广富等[32]学者分别基于李代数和滑模控制方法设计了姿态PPC控制器,实现了对刚性航天器在不确定惯量信息下的鲁棒控制。
除此之外,考虑到空间任务具有特定的任务执行窗口要求,有限时间姿态控制越来越受到学者的关注。例如,Lu等[33]针对刚性航天器姿态系统,采用非奇异终端滑模技术设计了有限时间趋近的控制律,实现了对期望姿态的有限时间跟踪。但是现有的实现有限时间姿态控制的方式主要是借助于滑模控制方法,即采用状态分数阶和符号函数来构建控制器。这种方法虽然能够实现有限时间控制,但是存在以下三点不足。首先,控制器的构造具有很强的技巧性,因此设计方法并不具有通用性。再者,状态分数阶的运用,导致控制器的形式过于复杂,且容易受到测量噪声的影响,不利于在实际工程中应用。此外,符号函数的运用导致控制律是非连续的,因此在实际工程中很难实现。最后,现有的有限时间姿态控制律只能保证受控航天器的有限时间趋近速率,并不能保证受控航天器的其他瞬态性能(如上调量和下调量等),也不能解决状态受限的姿态控制问题。因此,能否利用PPC方法来实现对航天器运动状态的有限时间或约定时间控制是值得进一步研究的问题。
综上,可以看出相比于MPC、滑模、退步等控制方法,PPC方法具有定量刻画受控航天器姿态瞬态与稳态性能,且不受未知动力学模型影响的特殊优势,同时由于不限制具体的控制器设计方法(见1.2节分析),因此PPC方法提供了一种实现高品质、安全可靠的航天器姿态控制的有效途径。为了探究未来航天器PPC方法发展的趋势,接下来对PPC方法理论本身的发展现状进行梳理和总结。
得益于PPC方法在预设受控系统性能和控制方案设计上的优势,近十年其在理论研究和应用领域得到了飞速的发展。在理论上,PPC方法的发展呈现出如下五个特点:由静态PPC方法向着动态PPC方法发展;由时间驱动的PPC方法向着事件驱动的PPC方法发展;由全状态反馈的PPC方法向着部分状态反馈的PPC方法发展;由指数收敛的PPC方法向着有限时间收敛的PPC方法发展;由不考虑执行器状况向着考虑执行器安装与故障的容错PPC方法发展。
2.2.1静态PPC方法向着动态PPC方法发展
自2008年PPC方法被系统提出以来,最典型的就是针对严格负反馈系统设计静态的类PID形式的PPC控制器。例如Rovithakis团队针对不确定严格负反馈系统提出的类比例控制的PPC方法,实现了系统在未知非线性动力学下的鲁棒控制[34]。胡云安等[35]和陈明等[36]采用退步控制,设计了鲁棒PPC控制器,实现了对级联负反馈系统的稳定控制。虽然静态PPC控制器结构简单,无需对受控系统的动力学模型进行辨识,但是其对于动力学模型和外界环境不确定性的鲁棒性和自适应性具有很强的局限性。因此,为了提升PPC方法的鲁棒性和自适应性,融合神经网络、模糊系统、支持向量机等智能算法的自适应PPC控制律不断被提出[37-38]。通过融合这些智能算法对未知不确定动力学的在线逼近能力,在PPC框架下设计了对应的自适应控制律,实现了对含有未知强不确定动力学模型系统的鲁棒控制。相比于静态的PPC控制律,自适应PPC控制律缩小了系统收敛的区域,因此提升了系统的控制精度。同时由于自适应参数的引入,增强了系统收敛的速率,使得受控系统应对不确定参数和外界环境的自适应能力也大大增强。
2.2.2时间驱动的PPC方法向着事件驱动的PPC方法发展
现有的PPC方法[34-38]多是时间驱动的,即控制系统的指令更新和通信是周期性采样的,这就对受控系统的通信能力以及执行器响应能力提出了更高的要求。但是在实际系统中,受控对象的通信带宽有限,无法保证对期望的通信和执行器指令进行周期性不间断的响应。在这种情况下,有必要引入基于事件驱动的控制策略来降低受控系统的通信/执行机构响应的频率。Choi与Yoo[39]针对带有量化非线性的单输入单输出纯反馈系统,提出了基于事件驱动的PPC方法,在保障受控系统的瞬态与稳态性能的前提下,最大程度地降低了系统的通信与执行器更新次数。针对航天器姿态系统,Wu等[40]提出了基于事件驱动的姿态PPC方法,虽然降低了航天器系统的通信频率,但是该事件驱动PPC方法是模型(转动惯量矩阵)依赖的,因此无法直接拓展解决惯量矩阵未知的抓捕后组合体航天器姿态控制问题。为了克服这个缺点,针对抓捕后组合体航天器,在惯量信息未知的情况下,作者所在团队[41]创新性地提出基于事件驱动的姿态PPC方法,在无需对未知转动惯量辨识前提下实现了对组合体航天器的姿态追踪控制,大大降低了执行器通信响应的频率。
2.2.3全状态反馈的PPC方法向着部分状态反馈的PPC方法发展
在实际系统中,传感器故障和测量能力的受限会带来受控对象部分信息缺失或不可测的情况,进而导致全状态反馈的PPC方法无法实施。近年来,观测器技术的飞速发展为不可测状态的估计提供了有效途径。针对线性系统,有比较成熟的观测器设计方法,如Kalman滤波器和Luenberger观测器。对于非线性系统,截止到目前还没有完善统一的观测器设计方法。现有的非线性观测器设计方法有:基于Lyapunov理论的方法、基于坐标变换的方法、扩展Luenberger方法以及扩展Kalman方法等[42-43]。PPC方法通过融合观测器技术,形成了基于部分状态反馈的PPC方法。例如,文献[44]借助于系统模型,针对单输入单输出的严格负反馈和非负反馈非线性系统,分别设计了相应的状态观测器,并基于PPC框架,实现了在部分状态未知情况下的非线性系统追踪控制。作者所在团队[45]针对抓捕非合作目标后的组合体航天器的接管控制问题,考虑了组合体角速度不可测问题,设计了非线性状态观测器,提出了一套不依赖惯量矩阵信息的PPC方法。
2.2.4指数收敛的PPC方法向着有限时间收敛的PPC方法发展
现有的PPC方法多采用指数形式的性能函数(如公式(2))来定量刻画受控系统的瞬态与稳态性能,这就使得受控对象具有指数收敛的趋近速率。虽然有效,但是在理论上,受控系统需要花费无限时间才能进入预设的稳态边界包络中。为了加快受控系统的趋近速率,基于终端滑模技术的PPC方法被提出[46]。其中,PPC方法用来定量刻画受控系统的瞬态与稳态性能,终端滑模技术主要用来设计有限时间稳定的控制器。这种方法虽然能够实现有限时间PPC控制,但是由于终端滑模技术的应用,导致控制器的形式复杂,且不连续的控制器难以在实际工程中有效应用。区别于现有的指数收敛的性能函数,作者所在团队创新性地提出有限时间收敛的性能函数设计方法,然后借助于PPC方法框架,使得受控对象的状态能够在有限时间内到达指定的稳态边界内[47]。相比于基于滑模技术的有限时间PPC方法,控制器设计没有用到分数阶状态和符号函数,因此可以直接避开基于滑模技术PPC方法的缺点。
2.2.5由不考虑执行器状况向着考虑执行器安装与故障的容错PPC方法发展
在进行控制理论研究时,通常只需要设计理想的控制力轨线(如研究姿态控制时,只需要设计惯性系三轴的控制力矩)。但进行实际对象应用时,必须要考虑理想控制力的实施问题,即控制执行器问题。长期的空间任务难以避免地要遭遇执行器偏心、执行器的效率下降、个别执行器卡死等故障。相对于惯量矩阵和外部干扰引起的不确定性,由执行器故障引起的不确定性量级更大、控制更难、甚至会造成控制系统失效。因此,很多学者开始研究执行器故障工况下的PPC方法。由于PPC方法具有较强的鲁棒性,传统的PPC方法可以用来被动适应执行器故障,如文献[48]。但是被动容错控制容错能力有限。为了解决这个问题,有学者在PPC框架下分别利用模糊逻辑系统[49]和神经网络系统[50]近似估计故障引起的不确定性函数,实现主动容错控制。此类方法在仿真中效果很好,但是在实际应用时会遇到计算复杂度高、实时性差等问题。为了解决上述问题,Hu等[51]和作者所在的团队[52]分别针对姿态控制系统和广义机械系统提出了低复杂度的自适应容错PPC方法。此类方法构造的自适应律复杂度低、容错效果好、容错能力强,因此更适合实际系统的容错PPC控制应用。
从应用角度,由于PPC框架能够定量地刻画受控动力学系统的瞬态与稳态性能,因此在其被提出之后,迅速得到不同应用领域的关注。PPC方法除了应用在航天器姿态控制系统中,还广泛用于机器人、高超声速飞行器、伺服电机、导弹等的控制系统中。例如Bechlioulis等[53]和Karayiannidis等[54]将PPC方法应用在机械臂关节角位置跟踪控制上;Chen等[55]将PPC方法运用到高超声速飞行器的指令跟踪上;Na等[56]将PPC方法运用到伺服系统的运动跟踪控制上。在导弹制导应用方面,Lyv等[57]将滑模控制方法与PPC方法结合设计了导弹末制导阶段导引律,提升了制导阶段的瞬态性能和打击精度。在航天领域,作者所在的团队还将PPC方法应用在空间非合作目标视线交会[58]、平动点轨道交会控制[59],以及绳系卫星的展开控制上[60],拓展了方法的应用场景。
综上,通过融合其它不同控制方法和控制策略,PPC方法在趋近率、自适应性、鲁棒性、以及控制精度上变得更具优势。不仅可以应用于刚体航天器、柔性航天器的姿态控制,还可以应用于多航天器系统的姿态协同控制;不仅可以用于姿态控制,还可以用于轨迹跟踪控制;不仅可以用于卫星的控制,还可以用于导弹和高超声速飞行器的控制,航天应用前景广泛。
尽管国内外学者围绕不同应用对象的预设性能控制方法开展了诸多工作,但是随着空间任务的不断复杂化,以及对控制系统要求的不断提升和各种新型智能算法的不断开发,基于预设性能控制进行航天器相关的控制方法研究仍具有广阔的发展空间。此外,目前PPC方法在航天领域中多用于单个航天器的姿态控制中,对于轨道控制、多航天器控制、多阶段控制的研究仍然较少。面向未来任务的需求,并考虑到现有预设性能控制方法本身存在的缺陷,航天器预设性能控制方法研究值得关注的问题和方向有以下几个方面:
在复杂的空间任务中,航天器控制系统存在多种约束和完成多种控制任务。例如由于特殊观测任务带来的航天器姿态指向约束,航天器执行机构(如飞轮、推力器装置等)的饱和、死区等物理机构约束,以及航天器通信带宽约束等。而现有的航天器PPC方法多只能解决单个约束存在的姿态控制问题。此外,当同时进行姿态控制任务和轨道控制任务时,传统控制方法需分别对姿态和轨道进行独立建模和独立的控制器设计。然而姿态运动和轨道运动具有很强的耦合性,其工程中遇到的约束也是互相耦合的。如何在多种约束并存、且多种任务的多重约束互相耦合的情况下,形成高效的航天器PPC方法,完成多约束姿轨耦合控制和制导控制一体化是亟待解决的难题和研究的重点。
未来空间任务多由多个阶段组成,每个阶段均有自己的任务完成时间窗口。为了保证任务在时间窗口内完成,基于有限时间的航天器控制方法得到了广泛关注。现有的有限时间控制方法多采用状态分数阶和符号函数来设计控制器,存在控制器结构复杂、不连续等缺点。此外,传统的有限时间控制方法只能估算出系统的收敛时间上界,且该上界会随工况的改变而改变,无法根据任务的实际需求,主动预约任务的完成时间。因此,如何在PPC框架下规避现有方法的局限,在任务约定的完成时间约束下,实现航天器控制系统的预设瞬态与稳态性能的控制是值得进一步探索和研究的问题。
预设的性能包络直接决定了受控航天器的轨迹走向。但是现有PPC方法中并没有对性能包络的优劣做定量地分析与评估,从而导致方法是非最优的,存在较大的保守性。最优控制方法利用时间最优、燃料最省等性能指标,可以定量描述航天器完成空间任务的性能优劣。然而传统的最优控制方法对于强不确定性工况适应性较差,控制鲁棒性相比于其它控制方法较低。因此,将时间最优、燃料最省等最优控制的性能指标融入预设性能包络的设计中,并通过预设性能框架保证预设性能包络的实现,不仅能够增强PPC方法的最优性,还能提升对强不确定性的鲁棒性,是值得深入研究的方向。
在复杂的空间环境下,航天器需要完成复杂、长期的空间任务(例如对非合作目标的在轨服务中,服务航天器需要依次进行目标的交会接近、接触抓捕、接管稳定、目标操作以及拖拽离轨等复杂任务;深空探测航天器需要长期工作并完成复杂任务等),在这种情况下,航天器的自身结构和惯量信息往往会发生突变。同时,在轨航天器还会遭遇未知执行器故障和不确定性因素的影响。因此,航天器的智能自主运行和控制是未来空间技术发展的趋势。作者在前期的研究工作中,通过融合自适应动态规划技术,提出了基于增强学习的航天器姿态PPC方法,实现了多个航天器在未知惯量信息和外界干扰下的智能自主控制[61]。但是其神经网络的参数整定依旧需要大量的实验数据作为支撑,数据难以先验获得,且计算量很大。随着人工智能技术的飞速发展,很多可靠小样本的学习算法层出不穷。如何在满足航天器任务需求、符合航天器计算能力的前提下形成智能自主的航天器PPC方法是值得后续深入研究的方向。
预设性能控制方法能够预先设计和保证系统的瞬态收敛性能和稳态性能,响应了工程中对收敛速度、超调量、稳态误差等性能指标的要求,因此受到了极大的关注和深入的研究。在应用于航天领域时,预设性能控制方法固有的性能预设能力、无模型特性(控制器设计不依赖于模型参数)和对不确定性的强鲁棒性,能够保证航天器在存在未知系统参数和不确定性的条件下,高品质、安全可靠地完成空间任务。本文首先介绍了预设性能控制的基本概念和主要实现步骤;随后论述了预设性能控制应用于航天器姿态控制中的必要性和价值;进而结合预设性能控制的研究现状和广泛的应用实例,总结了预设性能控制的研究热点和发展趋势;最后,面向未来任务的需求,提出航天器的预设性能控制应朝向复杂约束处理、约定时间可达、最优性能包络设计、智能自主控制等方向发展。