陈传志,张云啸,张 俞,张迎雪,余虹志,张 杰,邓小康
(1.南京航空航天大学 航天学院, 南京 210016; 2.深空星表探测机构技术重点实验室, 南京 210016; 3.上海宇航系统工程研究所, 上海 201109)
随着航天科学技术不断发展,单体航天器因其复杂的结构与高维护成本已难以适应多样化的航天任务。而多个结构简单、成本较低的小型航天器相互协调完成复杂航天任务,可以有效弥补单体航天器的缺陷。此外,多航天器系统还拥有扩展性强与可靠性高等优点[1]。多航天器姿态协同控制技术是航天器编队成功完成任务的重要保障,其在多个领域如重力场测量和合成孔径雷达中有着广泛应用[2],因此近年来吸引了越来越多学者的关注。
目前,航天器姿态协同控制方法主要包括领导跟随方法、虚拟结构方法和基于行为的方法。在使用领导跟随法对多航天器进行姿态控制时,各跟随航天器在保持姿态一致的条件下需协同跟踪领航航天器姿态。Mehrabian等[3]针对特定航天任务对编队航天器姿态的高精度要求,考虑重力梯度与执行器力矩受限的影响,基于领导跟随法设计了一种多航天器姿态协同控制器。在虚拟结构法中,多航天器系统将被视为一个虚拟的刚体进行机动控制,通过建立结构状态和航天器自身状态之间的函数关系,设计控制策略,实现多航天器姿态协同控制目标。在文献[4-6]中,研究人员通过虚拟结构法提出了多种多航天器姿态协同控制方法。编队航天器往往需要同时完成多个任务目标,基于行为法是一种对每一个控制任务目标对应的控制行为进行加权平均处理的控制策略。Hu等[7]基于行为控制方法设计了一种事件触发通信方法,使信息传输受限情况下的航天器编队相对位置协调控制问题得以解决。在以上提到的方法中,虚拟结构法缺乏灵活性和适应性,基于行为法中稳定性分析复杂,而领导跟随法结构简单,易于实施,被广泛应用于多航天器姿态控制中。因此,本文中将基于领导跟随法设计姿态协同控制策略。
本文中将滑模控制应用在基于领导跟随法的姿态协同控制策略中。滑模控制因其结构简单,响应速度快,对于外部干扰与参数不确定性不敏感的特性,也被广泛应用于卫星编队控制算法的设计之中。但传统滑模控制的特点是在其平衡点附近渐近收敛,无法在有限时间内快速响应。相比之下,有限时间方法在平衡点附近收敛速度快,并且具备较强的抗扰能力[8],其中非线性终端滑模面是设计有限时间控制器的有效工具。终端滑模面相较于线性滑模面具有有限时间收敛的优点,因而基于终端滑模设计的控制器将使系统状态更快收敛至平衡点,并且具备更强鲁棒性。为克服传统终端滑模的奇异问题,文献[9]在考虑时变扰动与执行器故障的影响下,将非奇异快速终端滑模面(NFTSM)与自适应方法结合,设计了一种高精度分布式姿态协同控制器。但是其并未在控制器的设计上考虑代数环问题。文献[10]提出的基于反步法的快速终端滑模方法,不仅提高了传统终端滑模的收敛速度,避免了奇异问题,而且通过选择合适的滑模面避免了代数环问题。在有限时间方法中,当系统状态在初始时刻远离平衡点时,收敛速度会有明显下降,导致收敛时间增加。因此,亟需设计一种收敛时间独立于初始状态的姿态协同控制方法。有学者提出了固定时间控制,能保证系统状态在固定时间内收敛至平衡点。相比于有限时间控制,固定时间控制的时间上界取决于系统参数相关的正常数,而与初始状态无关[11]。因此,无论系统状态在最初时刻与期望平衡点相差多大,其也将在固定时间内收敛,从而加快系统收敛速度。此外,有限时间方法的高稳态特性、强鲁棒性和强抗扰能力依然被固定时间方法保留。
在复杂空间环境中,多航天器姿态协同会受到太阳光压、重力梯度和地磁力等不确定的干扰力矩影响,这将导致未考虑外部扰动基础上所设计的控制律的鲁棒性受到挑战。为了克服航天器外部扰动对控制系统带来的负面影响,文献[12]结合有限时间概念设计了一种新型自适应律以估计并补偿未知环境干扰;文献[13]提出了一种自适应律解决了外部扰动上界未知情况下的多航天器姿态控制问题。但上述文献使用自适应方法估计干扰值导致收敛时间较长,且未考虑实际应用中由于安装偏差、燃料消耗与帆板展开等造成的系统惯量不确定性。文献[14]采用神经网络估计惯量不确定性与外部干扰,结合反步法设计控制律实现航天器姿态跟踪,但利用神经网络观测干扰的计算成本太大、快速性差,无法保证系统固定时间收敛稳定。
基于以上研究,针对受扰动下的多航天器一致性姿态跟踪问题,将系统惯量不确定性分离出来,与外部干扰共同作为复合干扰项,采用二阶积分滑模法(SOSMC)设计复合干扰观测器对其实时估测。利用干扰观测值,基于固定时间滑模理论设计姿态跟踪控制器,并利用Lyapunov理论证明控制系统的稳定性及在固定时间内的收敛性。最后通过仿真结果表明,提出的控制器可使多航天器固定时间内准确完成姿态跟踪任务,验证了方法的有效性与优越性。
本文中通过修正罗德里格参数(modified rodrigues parameters,MRPs)建立航天器姿态运动学方程,该方法具有对旋转描述无冗余和可克服奇异性的优点。假设以N个航天器组成的姿态协同跟踪系统为研究对象,第i个成员的姿态运动学和动力学方程为
(1)
(2)
其中:qi∈R3表示第i个航天器的姿态,qi(t)=ρitan(φi(t)/4);ωi=[ωi1,ωi2,ωi3]T∈R3为航天器的姿态角速度;J0i∈R3×3为航天器标称转动惯量矩阵; ΔJi∈R3×3为惯量不确定矩阵;ui∈R3为作用于航天器的控制力矩;di∈R3为航天器所受到的外部干扰力矩。式(1)中的雅可比矩阵Ti(qi)∈R3×3定义为
(3)
In∈Rn×n为n×n单位矩阵。对于向量x=[x1,x2,x3]T,x×∈R3×3定义为
(4)
定义主航天器的姿态轨迹为qd且满足以下假设:
定义1[15]:考虑如下非线性系统:
(5)
系统初始状态为x(0)=x0。
如果在有限时间内系统式(5)的任意解x(t,x0)能收敛至平衡点,且平衡点为全局渐进稳定,即x(t,x0)=0,∀t≥T(x0),其中T:Rn→R+∪{0}为收敛时间函数,则系统平衡点可以在有限时间内趋于全局稳定。
定义2[16]:考虑系统式(5),如果在有限时间内系统任意解x(t,x0)能收敛至平衡点,且收敛时间的上界T(x0)有界,即存在正常数Tmax可使T(x0)≤Tmax,∀x0∈Rn,则系统平衡点是全局固定时间稳定的。
引理1[17]:如果ξ1,ξ2,…,ξN≥0,那么下列结论成立:
(6)
(7)
引理2[18]:考虑系统式(5),如果存在连续正定Lyapunov函数V满足以下条件:
(8)
其中,λ1>0,0<γ<1,那么系统式(5)是有限时间稳定的,且收敛时间上界Ts满足:
(9)
引理3[19]:考虑系统式(5),如果存在一个连续的径向无界函数V:Rn→R+∪{0}满足:
1)V(x(t))=0⟺x(t)=0;
则系统状态能在固定时间Tr内收敛至平衡点并稳定,且时间上界Tr其满足:
(10)
本文中以N个跟随航天器与一个主航天器组成的多航天器系统为研究对象,定义姿态跟踪误差e1i、e2i和e1ij为
e1i=qi-qd
(11)
(12)
e1ij=qi-qj
(13)
在实际航天器编队中,外部干扰与惯量不确定性难以精确测量,本节采用观测器对两者组成的复合干扰进行实时估计,提高编队系统控制鲁棒性。滑模观测器常用于对于扰动的估计中,二阶积分滑模作为传统一阶滑模的推广,在保留传统滑模良好性能的前提下,能够有效抑制抖振,因此本文设计基于二阶积分滑模控制(SOSMC)的复合干扰观测器,以实现对复合干扰的精确估计。
通过对姿态方程式(2)进行适当的变换,可构建由外部干扰与内部惯量不确定性干扰组成的复合干扰项:
(14)
则可将式(2)表示为
(15)
(16)
(17)
(18)
证明:对式(16)求导并将式(15)代入可得
(19)
将式(17)代入式(19)可得二阶积分滑模面
(20)
令
(21)
那么
(22)
由式(20)—式(22)可得
(23)
取Lyapunov函数如下
(24)
对式(24)求导有
(25)
其中
(26)
由式(20)—式(21)可得
(27)
(28)
设
因此
(29)
根据式(24)有
(30)
(31)
由引理2可知V(σim)可在有限时间Tf内收敛至0,Tf满足
(32)
注1:与传统的干扰观测器相比,本文中设计的观测器不需要干扰相关先验信息,即可实现对干扰的高精度在线估计,体现了较高的工程应用价值。
联立式(1)和式(15),可得二阶形式的姿态控制模型:
(33)
为了避免航天器实际编队飞行任务中的代数环问题(航天器i,j的控制输入ui、uj相互耦合,形成死循环)并减轻通信负担,引入一固定时间滑模观测器来估计主航天器期望姿态,其形式如下:
(34)
假设3:由N个跟随航天器组成的多航天器编队系统间的通信拓扑为无向连通图,而虚拟主航天器与接收其信号的跟随航天器之间的通信拓扑为有向连接。
上述滑模观测器的固定时间收敛特性可由下面性质给出。
(35)
其中
基于状态观测器(34),定义姿态误差θ1i和θ2i为
θ1i=qi-p1i
(36)
(37)
选取终端滑模面为
(38)
其中1/2<η<1, 1
为了实现航天器编队在复合干扰下的强鲁棒性,完成对于期望姿态的固定时间跟踪,并且避免航天器间代数环通信问题,本文中基于复合干扰观测器式(16)—式(17)、期望姿态观测器式(34)和终端滑模面式(38),设计分布式控制律如下:
(39)
定理2:对于满足假设1与假设3的多航天器编队系统式(1)、式(2),采用控制律式(35),能够使姿态跟踪误差e1i和e2i在固定时间Tab内收敛到区域Ω内,收敛时间Tab=T0+T1+T2,其中T0、T1、T2和Ω分别如式(35)、式(45)、式(51)和式(55)所示。
首先对滑模面si的收敛性质进行分析。
对于第i个航天器,选取下述Lyapunov函数
(40)
对V1i两侧同时求导可得
(41)
将姿态误差式(11)—式(12)代入式(41)有
(42)
代入式(33)与控制律式(39)有
(43)
(44)
由引理3可知,滑模面si可在固定时间T1内收敛到区域Ω1内,且T1与Ω1分别满足:
(45)
(46)
其中Δsi为一个靠近原点的正常数。
接下来考虑系统状态到达滑模面后的情况,对姿态跟踪误差e1i和e2i的收敛特性进行分析。
首先,证明e1i和e2i固定时间收敛。
当si=0时,由式(38)可得
(47)
针对第i个航天器,选取下述Lyapunov函数
(48)
沿着式(47)对V2i求导可得
(49)
根据η、r1和g1的取值,由引理1可得
(50)
其中,
由引理3可知,e1i和e2i将在固定时间T2内收敛到原点附近,T2如下:
(51)
因为当si=0时,状态变量e1i可以在固定时间内收敛至零附近,所以滑模面(38)为固定时间滑模面。
然后,分析e1i和e2i的收敛区域。
由|sim|≤Δsi可将式(38)改写为
(52)
可将式(52)表示为如下2种形式
综上所述,姿态误差量e1i和e2i将在固定时间Tab内收敛到区域Ω内,Ω如下所示:
(55)
注2:由式(51)可知,固定收敛时间与航天器编队初始状态无关,只与控制参数有关。因此,对于任意初始状态,均可通过调节控制参数提前预估收敛时间。
仿真针对4个跟随航天器协同跟踪一个虚拟领航者的编队,它们之间的通信拓扑关系如图1所示。
图1 通信拓扑关系
编队的邻接矩阵A和B定义如下:
B=diag(1,1,0,0)
编队中各航天器的标称转动惯性矩阵分别取为:
各航天器惯性不确定性矩阵分别取为:
编队中各航天器的初始姿态分别选择为:
q1(0)=[2.2,2,-2.2]T,q2(0)=[-2,2,3]T
q3(0)=[-2,-2.3,2.5]T,q4(0)=[-1.5,2.7,-1.3]T
编队中主航天器的期望参考姿态轨迹取为qd=[0.2cos(0.5t),0.2sin(0.5t),0.3]T,外部扰动力矩取为di=0.012 5[sin(0.2t),cos(0.2t),sin(0.4t)]TN·m,编队中各航天器的初始角速度设为[0,0,0]Trad/s。
复合干扰观测器(17)中参数选取为η1=2,η2=0.5。
分布式固定时间控制器(39)参数选取如下:
αi=βi=0.1,η=0.6,r1=1.3,μ1=2.3,r2=0.9,μ2=1.3,δ1=δ2=1。
图2 干扰观测器估计误差edi响应曲线
图3 复合干扰Dfi与观测值
图4 姿态跟踪误差e1i响应曲线
图5描述了控制力矩的响应曲线。可以看出,控制力矩ui在固定时间内趋于稳定,且变化光滑平稳,没有出现抖振现象。并且由图5可以看出,在航天器逐渐稳定后,控制力矩ui保持较小值周期变化,证明只需很小的控制力矩就能保证航天器在稳态阶段持续跟踪主航天器姿态。
图5 控制力矩ui响应曲线
此外,本文中将通过与自适应有限时间控制策略的对比分析,来验证所提出控制策略的有效性与优越性。选取了自适应有限时间控制策略进行对比分析,2种控制策略下的仿真结果如图6所示。其中,各对比量的定义如下:
由图6可以看出,与自适应有限时间控制策略相比,本文中控制方法中姿态跟踪误差的值始终更小,且能更快收敛至原点,说明该控制方法精度更高,收敛时间更短。虽然本文中的控制力矩在初始时更大,但在0.5 s后小于自适应有限时间控制策略,并且之后变化更加平稳,可以看出该控制方法对于执行器要求更低,燃油消耗更少。
由仿真结果可知,该控制方法对于航天器编队姿态协同跟踪控制具有不错的控制效果,且对扰动具备一定的鲁棒性。
图6 对比结果
本文中研究了受外部干扰与惯量不确定性条件下的多航天器系统姿态协同跟踪问题。设计了一致性姿态协同控制器,使得受复合干扰情况下的航天器编队能够实现对期望姿态的精确跟踪。归纳得到以下结论:
1) 设计的二阶积分滑模观测器能在较快时间内实现对复合干扰的快速准确跟踪。并且该观测器无需获得复合干扰的先验信息,涉及控制参数少,具备较高的工程应用价值。
3) 通过对比验证,与自适应有限时间方法相比,本文中提出的姿态控制策略精度更高,收敛速度更快与燃油消耗更少。
未来可以考虑航天器中实际执行器的物理限制,后续研究中进一步针对航天器控制输入饱和问题设计固定时间姿态协同控制律,提升收敛时间预估准确性,并改善执行器饱和情况给系统带来的性能下降与失稳现象。