基于浸入与不变理论的航天器姿态跟踪自适应控制

2020-03-25 10:31夏冬冬岳晓奎

航空学报 2020年2期

夏冬冬，岳晓奎

1. 西北工业大学航天飞行动力学技术国家级重点实验室，西安 710072 2. 西北工业大学航天学院，西安 710072

由于空间任务的日益频繁和深入，各国都相继开展或实施了在轨服务技术研究。具体研究任务形式有：对报废航天器的离轨操作，对失效航天器的在轨维修，对燃料耗尽航天器的在轨加注等等。总之，航天器的在轨服务成为目前航天技术必须面对和亟需解决的一个关键课题[1]。

为了对目标航天器进行在轨服务，通常服务航天器首先需要捕获目标航天器。在捕获前服务航天器需要能够与目标航天器同步运动，以便对接；捕获后两者的组合体可能需要稳定或者重定向等[2]，这些都需要控制航天器姿态和角速度能够跟踪上一个预定的参考轨迹。但是，由于燃料的消耗、航天器构型的变换或模块的转移以及对目标的捕获组成双星复合系统等，都会造成系统的惯性特性(质量、质心、转动惯量矩阵)等发生较大变化，并且这个变化通常事先是未知的[3]。因此，本文研究惯性参数未知的航天器姿态跟踪控制具有重大的实际意义。

针对被控对象中含有参数不确定的模型，自适应控制由于不需要被控对象的先验信息而得到了广泛的研究[4]。传统的自适应控制方法是基于等价确定性(Certainty Equivalence, CE)[3-5]原则而设计的。但是由于CE方法中参数估计更新律是通过Lyapunov函数导数中干扰项的精确抵消而来的，导致其更新律中不含有自身的负反馈项。参数估计误差和跟踪误差的直接耦合，造成了系统闭环性能的下降。

针对该问题，Astolfi等[6-7]开创性提出了一种非等价确定性(Non-Certainty Equivalence, Non-CE)理论：浸入与不变(Immersion and Invariance, I&I)理论。通过在参数估计中增加一项关于状态的修正项，从而间接将未知参数引入到参数估计动态当中。通过合理设计，可以把参数估计误差动态与其自身直接建立起联系，这在CE方法中是做不到的。但是，由于理论上，获得修正项的具体形式需要求解一个偏微分方程(Partial Differential Equation, PDE)。对于一阶系统，方程的解析解总是存在并很容易通过积分求解；但对于高阶系统，方程有解析解需要满足比较严格的条件，在实际情形中一般不满足，通常被称为“可积分性障碍(Integrability Obstacle)”，这使得其应用受到极大的限制[8-11]。

针对该障碍，Seo和Akella[8-9]提出了一种基于滤波方法(Filter-based)的控制器，通过巧妙构造一个指数收敛的增广滤波系统，然后通过增广滤波状态设计修正项和控制器，使得整个闭环系统具有I&I理论的特点，从而间接地避免了求解PDE。虽然该方法给I&I控制器设计提供了一种新的思路，但是缺点是低通滤波器降低了系统的带宽；并且对增广系统滤波，会导致闭环系统的阶数急剧增加，大大加重了计算负担。

Karagiannis等[11-12]开创性地将动态放缩法(Dynamic Scaling)运用到I&I 控制器设计当中，该方法考虑参数回归矩阵不满足可积条件，通过引入状态滤波器，按照一定方式替换掉回归矩阵中的积分变量使得其可积并得到其近似解，然后运用动态放缩技术将近似解和真解之间误差部分消除。由于动态放缩法相比于Seo和Akella[8-9]提出的增广滤波法，只需对被积状态设计滤波器，因此明显地降低了闭环系统的阶数，优势比较突出，吸引了一大批研究者的关注[13-18]，极大推进了I&I理论的发展。但是，基于动态放缩法的控制器设计过程中，动态放缩因子为单调递增函数，尽管能够证明有界，但是事先并不知会增大到多大；而控制器和滤波器动态反馈增益系数与放缩因子的平方呈线性关系，这些因素会导致控制器反馈增益很大，可能会出现不希望的瞬态特性。

Yang等[17]首次将动态放缩法的I&I理论运用到航天器的姿态控制模型中。针对参数回归矩阵不可积的困难，通过添加一个补偿矩阵使其可积，然后利用构造的角速度滤波器或者参考角速度信号来抵消补偿矩阵的影响，并用动态放缩技术将其影响消除。并且针对动态放缩因子单调递增所带来“高增益”控制现象，通过使用“三标量动态(three scalar dynamics)”方法构造一个动态调节系数，使递减的调节系数中和放缩因子的增长。虽然该文章也提出了基于动态放缩法I&I控制器，但是需要额外设计标量动态，并且需要事先知道惯性矩阵的最小特征值的下界，这给实际应用带来了困难。

Wen等[18]同样将动态放缩法和I&I方法应用在姿态跟踪模型上，采用的是文献[11]中的回归矩阵改造技巧，但是创新地提出了修正缩放因子和附加调节系数动态，使得控制器中不需要惯量矩阵最小特征值，也能约束缩放因子在一个事先确定的上界内。但是该方法只是将反馈增益与缩放因子从平方线性关系修正到呈线性关系，仍需要调节系数来中和缩放因子的增长。

目前国内相关的研究[19-23]只是将I&I理论结合一些backstepping或者滑模控制方法应用到一些较简单的实际模型中。所考虑的模型都是可以拆分成一维的子系统的级联形式，此时的PDE可以直接通过积分求解，不存在不可解的问题。而本文中姿态控制、机械臂等强耦合非线性多维系统并不能直接利用I&I方法进行设计，因为其PDE并不能直接积分求解，国内文献在这方面并没有深入研究。

本文针对航天器姿态跟踪控制模型，采用I&I理论，提出了一种新的参数回归矩阵改造方式，解决了“可积分性障碍”。通过引入全新的缩放因子形式，利用动态放缩技术证明了矩阵改造带来的误差不影响闭环系统的稳定性，并且设计的姿态跟踪自适应控制器不需要缩放因子信息，也不需要惯量矩阵的最小特征值信息，有效地减小了闭环系统复杂度和闭环系统阶数，并且保证了跟踪误差的渐近收敛。

本文结构如下：第1节对本文所研究的问题进行了详细描述；第2节对本文提出的矩阵改造方法进行了介绍，并依据该方法给出了一种新的I&I姿态跟踪控制律；且第2节用Lyapunov方法证明了所设计控制器的稳定性；第3节通过数值仿真，将本文设计的控制器与CE方法的控制器和Filter-based方法的控制器进行了对比分析，表明了本文设计方法的有效性和优越性；最后，在第4节中对相关研究内容作了简单总结。

1 问题描述

1.1 坐标系定义

航天器姿态跟踪问题中，通常会涉及到3个坐标系：惯性坐标系FI、本体坐标系FB和期望坐标系FD。由于姿态控制只考虑本体坐标系的相对方位，而不考虑其质心的位置，所以以上3个坐标系均以航天器质心O为原点。其中，惯性坐标系作为基准坐标系，本体坐标系和期望坐标系的姿态均是相对于惯性坐标系而言；本体坐标系与航天器固连，其坐标轴的方位也就代表了航天器的方位；期望坐标系是一个引入的假想坐标系，坐标轴的相对方位由要跟踪的期望方位确定。坐标系的示意图如图1所示。姿态跟踪的任务就是控制航天器，使其固连的本体坐标系与期望坐标系重合。

图1 坐标系示意图

1.2 动力学模型

本文采用全局无奇异的四元数来描述刚体的姿态动力学方程

(1)

(2)

由四元数q得到的从FI到FB的坐标变换矩阵为

(3)

(4)

从FD到FB的坐标变换矩阵为

(5)

角速度跟踪误差为

ωe=ω-Reωd=ω-Ω

(6)

式中：Ω=Reωd为ωd在本体坐标系中表达的期望角速度。

这里不加推导地给出航天器姿态跟踪的动力学模型为[17-18]

(7)

(8)

(9)

1.3 参数线性化

由于J为实对称常量矩阵，可以写为

J包含6个未知参数，可以设未知参数向量为

为了方便后面控制器的设计，将式(9)改造为

(10)

式中:kq>0和kω>0分别为姿态误差反馈增益系数和角速度误差反馈增益系数，为待定常数；根据线性参数化性质:

Wθ=-ω×Jω+Jω×Ω-JΩd+J(kqqev+kωωe)

(11)

式中：W=W(ω,qev,Ω,Ωd)∈R3×6为参数回归矩阵。

2 基于动态放缩法的I&I控制器设计

考虑如下形式的控制器设计:

(12)

(13)

2.1 参数估计

根据I&I方法，参数估计一般由2项组成，因此考虑如下的参数估计形式:

(14)

(15)

(16)

为了保证闭环系统最终收敛到流形面M上，需要求解一个偏微分方程，从而得出修正项β的具体形式

(17)

但是，式(17)有解的条件是WT∈R6×3为雅克比矩阵，即

(18)

(19)

式(19)是一个很强的限制条件，在强耦合非线性系统中，参数回归矩阵一般不满足该条件。在本文航天器姿态跟踪模型中，由式(11)得到的参数回归矩阵WT由于叉乘矩阵ω×的存在，使得WT不满足式该条件，也即式(17)不可解。因此，按照传统I&I控制器设计方法在这里遇到了极大的阻碍。

观察式(11)并将其分解为

Wθ=J(kqqev-kωΩ-Ωd)+kωJω+

(-ω×Jω+Jω×Ω)=

(W1+W2+W3)θ

(20)

对于Jx=M(x)θ，可得其参数回归矩阵形式为

(21)

W1=M(kqqev-kωΩ-Ωd)，W2=kωM(ω)

(22)

(23)

(24)

(25)

(26)

(27)

式中:kf为滤波器反馈增益，是一个待定的变量。那么，可以将修正项β(ω,φ)设计为

β(ω,φ)=γ(β1+β2+β3)

(28)

并且有

(29)

为了后续叙述的简洁性和严谨性，首先给出L2和L∞范数的定义。

则称f(t)是平方可积的，或称f(t)∈L2；若其∞-范数满足：

则称f(t)是有界的，或称f(t)∈L∞。

接下来，根据以上内容，可以得出以下定理。

定理1对于航天器系统(7)～系统(9)，在惯量矩阵完全未知的条件下，若控制器(12)中参数估计由式(15)和式(28)组成；需要的反馈增益分别为

kq=1+δq,kω=1.5+δω

(30)

kf=1+δd+δf

(31)

式中：δq,δω,δf>0为任意正常数；δd为一个动态增益，其动态为

(32)

证明参见以下分析过程。

2.2 动态放缩法

为了方便以下的稳定性证明，定义如下的缩放参数估计误差:

(33)

式中:R为缩放因子，由辅助缩放因子r确定，其定义式为

(34)

式中:jm为惯量矩阵J的最小特征值；f(r)为上界缩放为1的某一饱和函数，例如双曲正切函数、反正切函数、sigmoid函数等。辅助缩放因子r的动态为

(35)

注意到，若选取r(0)>0，不管f(r)是双曲正切函数、反正切函数，还是sigmoid函数，都能保证f(r)>0和f′(r)>0；并且根据f(r)的有界性，存在某一合适常数C，可以保证lnf(r)+C>0。因此，式(35)总是有意义的。

通过式(32)和式(33)，可得以下2个性质:

(36)

jmf(r)

(37)

对式(31)求导，并利用式(27)和式(34)可得

(38)

若选择以缩放参数估计误差z为变量的Lyapunov函数为

(39)

对式(39)求导，结合式(38)和杨不等式，得到

(40)

2.3 闭环系统稳定性分析

首先考虑以下Lyapunov函数:

(41)

(42)

注意到，式(30)自动满足kq+kω>0.5，从而式(42)的正定性得到保证。

分别对式(38)和式(39)求导得到

(43)

R(qev+ωe)TJ-1Wz

(44)

定义如下Lyapunov函数:

(45)

对式(45)求导，并结合式(30)、式(31)、式(38)、式(43)和式(44)得到

(46)

(47)

接着定义如下Lyapunov函数:

(48)

(49)

对以上Lyapunov函数求导，可得

(50)

(51)

最后定义总的Lyapunov函数为

V=Vc+Vf+VR

(52)

根据式(46)、式(50)和式(51)的结果，对式(52)求导得

(53)

经过以上分析过程，有以下几点改进和创新值得说明一下：

(54)

这在CE控制方法中是保证不了的，也是I&I控制方法相对于CE方法的一大改进。

注2本文通过设计一种新颖的缩放因子式(34)，使得其满足性质式(37)。而通过饱和函数f(r)的引入，使得控制器增益中不再含有r2或者r，这在文献[12-18]中是做不到的。并且注意到，根据饱和函数f(r)的有界性，控制器中不再需要缩放因子R和r的信息，缩放因子的引入只是为了稳定性的证明，这是对已有基于动态放缩法I&I控制器的一大突破。

注3从式(48)发现，通过在滤波器增益式(31)kf中添加动态项式(32)δd，使得增益式(31)中不再需要Lipschitz常数L，从而避免了复杂的矩阵推导来确定L的过程，例如文献[17-18]中的推导过程。

3 数值仿真

对所设计的自适应跟踪控制器进行仿真，验证本文所提出设计方案的有效性和优越性。仿真中，惯量矩阵J取为

被跟踪的期望角速度轨迹设定为

ωd(t)=[0.3(1-e-0.01t2)cost+te-0.01t2(0.08π+

初始条件设定为

被跟踪的期望姿态可以根据初始姿态和期望角速度得出。控制器的常数参数设定为:kp=10,kd=20,δf=0.5。

3.1 调节系数γ、λ的影响

得到的仿真曲线如图2所示。

图2 各项参数随时间变化曲线

总之，本组仿真算例证明了本文所提出的跟踪控制器的有效性，并且增大调节增益γ、λ值能够一定程度加快闭环跟踪误差的收敛。但是，需要指出的是，尽管γ、λ值能够使得闭环系统更快地收敛，但是实际应用中并不是γ,λ值越大越好。这是因为本文的控制器和仿真均是基于姿态和角速度能够实时精确测量的假设，而实际情况中可能存在测量噪声、高频干扰以及未建模动态的影响，更大的γ,λ值将增大系统的带宽，使其更容易受到这些影响。所以，在实际应用中，应该综合闭环系统的快速性和鲁棒性，对γ,λ值进行合理的选定。

3.2 控制器性能的比较

为了验证本文所设计控制器的优越性，该组仿真将比较CE-based控制器[5]、Filter-based控制器[8]和本文提出的控制器的跟踪性能。为了保证对比的公平性，首先通过调节各控制器的反馈增益，保证3种控制器在理想情况下(惯量矩阵已知)跟踪误差的渐近收敛速度一致，然后，设定惯量矩阵未知，通过数值仿真，得到的跟踪性能曲线如图3所示。

从图3(a)和图3(b)可以看到，本文提出的控制器相比于CE-based和Filter-based控制器有更快的收敛速度和更高的跟踪精度。从图3(c)发现，初始过渡阶段，CE-based控制器和Filter-based控制器所需的控制量非常大，并且有着非常严重的瞬态，在稳态阶段，Filter-based控制器所需的控制量和本文提出的已经基本趋于相同了，但是CE-based控制器所需的控制量更大，这也可以从图3(a)和图3(b)可以看出，CE-based控制器的稳态时闭环跟踪误差比较大，并存在一定的振荡，这会额外消耗一定的控制量。

造成这样的原因主要有:首先，从控制器设计原理上，本文所提控制器和Filter-based控制器都是基于非等价确定性原则(Non-CE-based)设计的，相对于CE-based控制器在原理上就具有优越性，因为CE-based控制器只是单纯地将Lyapunov函数中关于参数不确定项抵消掉，并且只要参数估计没有收敛到真值，闭环系统就会一直存在一个外干扰附加到理想系统上；其次本文提出的控制器中滤波系数kf中的动态增益在系统运行过程中使得系统等效控制增益变大，加快了闭环系统向理想系统(流形面上的等效系统)的收敛。并且Filter-based控制器将状态、回归矩阵和控制量均进行一阶低通滤波构造出一个指数收敛的増广状态，这严重增大了闭环系统的阶数和复杂性，在计算上造成很大负担并且引入了很多的舍入误差，并且指数收敛増广状态的初值必须根据其他状态初值来设置使其为零，不然不就会有一个指数收敛的外干扰附加在理想系统上，因此本文所提控制器相对于Filter-based控制器更加简洁和高效。

图3 跟踪性能随时间变化曲线

综上，对于跟踪精度要求高和燃料有限且宝贵的航天在轨服务任务来说，本文所提出的控制器相对于CE-based控制器和Filter-based控制器有着不可比拟的优势。

3.3 控制器鲁棒性验证

在工程应用中，系统中会不可避免地存在一些干扰，例如外界干扰、测量误差等。为了验证本文设计控制器的鲁棒性，在原有的系统模型(9)中加入有界外干扰：

图4 控制误差范数和随时间变化曲线

图5 控制力矩范数随时间变化曲线

图6 估计误差范数随时间变化曲线

总之，通过该组仿真可以看出，本文设计的控制器存在有界外干扰时，仍能保证闭环系统的有界收敛，只是之前的渐近稳定品质已经丧失了，但仍可将跟踪误差控制在零附近的一个很小邻域内，表明控制器具有一定的鲁棒性。

4 结论

本文针对惯性参数不确定情况下航天器的姿态跟踪，基于浸入与不变方法设计了一种自适应控制器。首先分析了浸入与不变理论应用在航天器姿态跟踪动力学模型，存在偏微分方程不存在解析解的问题；然后针对该问题，本文提出了一种矩阵改造方法，使得参数回归矩阵满足可积条件，并通过引入一种全新的缩放因子，采用动态放缩法证明了矩阵改造前后的误差对闭环系统的影响可以消除；最后根据本文提出的矩阵改造方案设计出了一种新的I&I姿态自适应跟踪控制器，保证了跟踪误差的渐近收敛。文章的创新之处在于采用全新的缩放因子，使得控制器执行过程中不需缩放因子信息，也不需要惯量矩阵的先验信息；并且在滤波器反馈增益中加入动态自适应增益项，使得不需要去确定矩阵范数上界，总之本文设计控制器相比于已有的基于动态放缩法的I&I控制器具有更简单的形式和更低的闭环系统阶数。文章最后通过数值仿真验证和对比得出了本文设计控制器的有效性和优越性。总之，本文的设计思想和方法对参数不确定的自适应控制器设计具有一定的指导和借鉴意义。