空间惯性传感器数据驱动自适应非对称约束控制

2023-08-11 01:11孙笑云吴树范
深空探测学报 2023年3期
关键词:惯性航天器约束

孙笑云,吴树范,沈 强

(1.上海交通大学 航空航天学院,上海 200240;2.上海市引力波探测前沿科学研究基地,上海 200240)

引 言

空间惯性传感器是一类航天器系统关键载荷,广泛应用于空间探测领域。其工作原理为悬浮在航天器外壳内,为在轨航天器提供惯性基准[1]。低频段空间引力波探测是以航天器平台超静、超稳为前提开展的深空探测任务,利用空间惯性传感器提供高精度惯性基准,是探测工程实施的重要保障[2-3]。近年来,随着低频段空间引力波探测任务的发展及探测水平的提高,航天器平台中用于探测引力波信号的敏感轴在mHz频段的残余扰动加速度需优于同时对于航天器平台的位移控制精度需优于[4]。针对低频段空间引力波探测这一特殊背景,研究空间惯性传感器在复杂干扰下的控制问题也是任务实施的一项重要研究内容。

当前,针对空间惯性传感器控制方法的独立研究还较少,多数研究内容将该载荷的航天器系统平台作为一个研究整体,并认为空间惯性传感器的控制方法设计应包含在航天器系统平台的无拖曳控制系统(Drag-Free and Attitude Control System,DFACS)中,即将空间惯性传感器中仅用于内部稳定的自由度作为非敏感轴,在控制方案的设计中予以考虑由航天器外部扰动及机械接口形变、传感器刚度形变及敏感轴交叉等作用等引起的耦合现象[5]。在既往研究中,静电悬浮控制技术的发展往往依托于性能指标而展开,在无拖曳控制系统的设计中进行统一讨论,如文献[6~8]提出的基于定量反馈理论及混合灵敏度H∞的控制器设计方法,将性能指标直接转化成设计准则,用于满足不同的性能规范并实现科学探测模式下全频段能量消耗的降低。

然而,随着高精度空间惯性传感器研制进度及建模理论的进一步推进,实际惯性传感器系统中的强烈非线性及未建模动态难以忽略,基于线性方法的上述控制方案均具有一定的局限性。尽管现有线性控制方法能够实现空间引力波探测任务中空间惯性传感器非敏感轴的指标要求,但随着空间惯性传感器系统允许的残余扰动性能指标要求逐渐提高,现有线性控制方法均以默认解耦的单输入单输出系统为设计基础,实际系统中存在的刚度耦合及电压驱动耦合关系在未得到解耦或抑制前惯性传感器系统难以满足新的性能约束,因此寻求一种可实现对复杂非线性、未知动态得以实现良好估计及抑制作用的非线性控制方案是当前空间惯性传感器闭环控制器设计的前沿研究方向。

在惯性传感器这一特殊的高精度载荷控制问题研究中,硬件内部的电回路数据链传输实际为固定采样频率的离散时间系统形式,因此在连续时间系统内实现的控制方法,如文献[9~10]中提出的自适应控制方案,即使其考虑了非线性动态的影响,也仍然难以在实际的惯性传感器系统中实现转化和运用。考虑最坏的情况,即由于电压驱动耦合作用及位移传感、交流执行等诸多现象的叠加,惯性传感器的动力学模型是非仿射且未知的,此时一类基于离散采样数据的数据驱动控制方案对该系统的有效性值得探讨和研究。

数据驱动控制方案是考虑实际采样数字系统(如硬件在环)仅能获取离散量测输出信息时,利用量测数据的迭代实现闭环系统反馈控制的应用方案。目前,数据驱动控制方案已在随机衰减系统、卫星姿态动力学系统中获得相应的应用,因控制器设计仅需相邻已知的离散量测数据进行一步迭代,不涉及积分、微分器的引入,针对实际硬件系统拥有较好的可行性及简易性。文献[11~13]提出一种基于自抗扰控制的数据驱动控制方案,运用扩张状态观测器实现外连续扰动的抑制,该方案针对惯性传感器控制系统的设计具有一定的启发作用,但仍需扩展至任意连续甚至非连续干扰存在的情况。

性能指标是衡量空间惯性传感器作为惯性基准的重要尺度,在低频段空间引力波探测任务中,针对位移响应的性能指标要求也提升至较为精密的程度[2,14-15]。然而,在全过程控制中,仍然希望空间惯性传感器的静电悬浮控制系统能对被控对象的位移响应起到主动约束的作用,且该约束可以是非对称的、时变的。控制障碍函数(Control Barrier Function,BLF)是解决这一类约束控制需求的有效方法,文献[16~17]提出的各类障碍函数控制方案解决了一类具有延迟、忽略初值的非对称时变约束控制问题,而上述方案在空间惯性传感器控制问题中也尚未得到考察和应用。

为实现惯性传感器静电悬浮控制系统中仅能获得离散量测数据时的高精度控制问题,考虑性能约束要求及由静电驱动引起的非线性任意连续扰动抑制,利用数据驱动自适应控制方法,本文提出一种基于模糊规则及BLF的空间惯性传感器数据驱动约束控制方案,保证惯性传感器系统静电悬浮控制全过程满足性能约束。文章创新点如下:

1)提出一种基于模糊规则的数据驱动自适应模型估计方法,用于解决空间惯性传感器任意连续未建模动力学的估计与抑制,相比现有成果将数据驱动估计方法自Lipstchiz连续目标估计推导到非Lipstchiz连续的情况;

2)考虑空间惯性传感器实际任务需求下的性能约束问题,基于BLF设计一种非对称约束控制方案,基于BLF的输入补偿使得闭环系统控制全过程位移响应位于性能约束内;

3)考虑惯性传感器实际控制对象的离散时间系统形式,基于数据驱动方案设计的离散时间系统自适应控制方案是在空间惯性传感器控制问题中的首次应用。

文章章节安排如下:第1节对空间惯性传感器静电悬浮控制问题进行描述,给出静电力驱动关系和基于三体动力学的建模过程,并基于I/O量测数据对连续时间系统模型进行本地离散线性化;第2节给出控制系统设计结果,描述基于性能指标建立的非对称时变性能约束及BLF建立过程,设计基于模糊规则的自适应未知动态估计器及数据驱动自适应控制器;第3节数值仿真,对比验证该控制方案效果与控制系统性能,第4节给出结论。

1 问题描述

本节将对双质量块空间惯性传感器进行动力学建模,给出相应模型假设并实现本地动力学线性化。

1.1 静电力驱动关系

本文的任务背景参考LISA Pathfinder空间引力波探测试验验证任务[14]。在空间引力波探测航天器系统进行无拖曳控制的过程中,文献[18~20]指出空间惯性传感器的电压驱动模式随DFACS的工作模式发生变化,本文进行的研究则是在DFACS执行科学模式时,空间惯性传感器随之执行的高分辨率模式(High Resolution Mode,HR)下进行,此时的惯性传感器动力学系统已随达到临界稳定[18],对HR模式下惯性传感器的控制系统设计则旨在提高各非敏感轴位移精度。

作为空间惯性传感器动力学模型建立的初步,首先需描述HR模式下传感器各极板广义静电力及由控制输入决定的理想驱动力的转换关系。根据文献[18~19],在给出的极板广义静电力解算描述下,忽略电场边缘效应和驱动电子器件输出阻抗,给出由对置极板电压决定的一对平动及转动自由度x,φ上的实际静电力表达形式

其中:Fx、Fφ为各自由度对应的极板静电力;ε0、Ax、dx分别为真空介电常数、极板面积及极板间距;V1,2x,φ为对置的各极板在平动及转动自由度的电势;Ucouple为平动与转动自由度间电势贡献的耦合项,可利用V1,2x,φ表达为

其次需描述惯性传感器内部电压驱动关系,即理想输入力向各极板电压V1,2x,φ的解算。仍以x,φ方向为例,在高分辨率模式下,规定极板电压驱动刚度为特定的需求刚度,即定义为Kxx=Kxx,req,Kφφ=Kφφ,req。在传感器接受输入力fx、fφ时,给出各极板上平动及转动自由度反馈电压V1x、V2x、V1φ、V2φ的表达形式

其中:Rx(φ)、R22x(φ)是各极板电容与线位移x、角位移φ的一、二阶偏导数的对应系数。

上述反馈电压加载在各极板后,其产生的静电力将作用于惯性传感器的检验质量上,用于补偿检验质量因附加干扰产生的运动学偏差,从而实现检验质量的稳定惯性基准作用[20]。注意到理想驱动力与实际静电力之间,由于电压驱动算法的引入将具有如下的转换关系

这也构成了传感器动力学模型建立过程中主要的非线性来源之一。在动力学模型建立中,由于控制输入与理想驱动力fx,φ等价,上述过程也将直接引入动力学模型输入部分的建立中。

1.2 空间惯性传感器动力学模型

在研究空间惯性传感器动力学模型建立前,由于需考虑双质量块与航天器外壳的运动耦合作用,将首先以LISA Pathfinder空间引力波探测任务为样例[1,21-22]建立以三体动力学为基础的无拖曳控制系统动力学模型。执行探测任务的航天器构造如图1所示,由两个对置的惯性质量块TM1、TM2及航天器自身构成3个相互关联的物理实体。根据文献[21]中的分析,该多体动力学方程可以描述为下述近似二阶形式

图1 LISA Pathfinder航天器多体动力学构型[18]Fig.1 Diagram of multi-bodies dynamics for LISA Pathfinder spacecraft[18]

其中:factuation为低频悬浮执行器作用力;fstray为其它外部或内部来源构成的总噪声力;Kh、KLTP为惯性传感器耦合刚度;q∗是检验质量块相对航天器的真实位移,需考虑每个检验质量外壳、航天器接口等构建的机械形变;q则为相对位移的标称值;Mq、Mu均为敏感度矩阵,用于衡量检验质量内部及检验质量对航天器的绝对运动;usc为航天器的绝对运动。

将质量块相对位移q及航天器绝对运动usc描述为

同时给出敏感度矩阵Mq、Mu的表达形式

其中:m1、m2、I1、I2为惯性质量块质量及转动惯量;、为斜对称交叉矩阵,由标称位置矢量ro1=[ro1,x,ro1,y,ro1,z]T及ro2=[ro2,x,ro2,y,ro2,z]T给出

忽略各接口及构件机械形变,认为q∗=q,同时假设系统动力学仅存在小角度旋转,给出系统动力学的简化形式

其中:T1B、T2B为在标称位置下,航天器到检验质量块的位置变换矩阵。定义航天器和检验质量加速度

其中:m、m1、m2、I、I1、I2分别为航天器及检验质量块的质量及转动惯量;t、t1、t2、f、f1、f2为合外力矩和合外力。

本文针对空间惯性传感器静电悬浮控制问题的研究建立在科学模式下,在LISA Pathfinder任务规则中,将这种模式称为科学探测模式1或测试模式M3[23]。敏感轴及非敏感轴选取的原则为选取检验质量1的3个平动自由度、1个转动自由度及检验质量2的两个平动自由度施行无拖曳控制,其余6个自由度施行静电悬浮控制[10]。引入实现上述选取规则的坐标选择矩阵DDF、DSUS,将三体动力学系统重新表述为

其中:qDF、qSUS分别为无拖曳控制与静电悬浮控制坐标。B1、B2、BATT为参数矩阵,定义为

aSC、aTM则用于描述航天器平台与检验质量所受合外力及力矩,认为合外力及力矩由控制器输入uT、uS,外界干扰dSC、dTM,及检验质量刚度变形构成,将式(5)中的动力学模型整理为

其中:BDF=DDFB1,BSUS=DSUSB1;悬浮控制输入uS1=DDFB2uS,uS2=DSUSB2uS;dTM1、dTM2为系统输入噪声;对角矩阵Ω2DF、Ω2SUS与交叉耦合矩阵Ω2C为刚度矩阵。仅针对静电悬浮控制通道进行分析,对式(6)中描述的运动学模型进行简化,表达为

其中:qSUS=[η1,φ1,x2,θ1,η1,φ2]T。根据式(6)将aSC、aTM表达为

其中:dSC、dT为外界干扰;uT、uS分别为微推力器控制力及悬浮控制自由度极板静电力。定义状态量则计及干扰及静电力输入驱动关系式(3)的静电悬浮控制回路标准形式可表述为

其中:dTM为系统总噪声;A、B为系统状态参数矩阵,在该简化的动力学模型中,状态矩阵A中的交叉耦合刚度矩阵存在有界的慢时变余项,电压驱动关系及外源性扰动也将对原有的线性状态空间模型引入较为强烈的非线性动态。

1.3 非仿射离散时间动力学模型及局部线性化

在实际的空间惯性传感器静电悬浮控制实现中,精确的连续时间动力学模型由于电回路信号采集等因素不能准确获得,实际的控制系统设计过程也将基于离散的I/O量测输出数据。在空间关键载荷乃至航天器姿态系统的控制问题中,根据文献[17],为便于控制系统的分析设计,也可利用量测数据将动力学模型式(8)转换为如下的非仿射离散时间系统表达形式

其中:h(d(k−1),···,d(k−nd))为非线性系统干扰;f(x(k),···,x(k−nx),uS(k),···,uS(k−nu))则为包含不确定性的非线性动力学标称模型。为便于问题研究,需对模型式(8)进行如下假设。

假设1输入的变化率存在如下约束

其中:uS(k)=[uS1(k),uS2(k),···;uSn(k)]T,ρui>0为第i个输入变化率绝对值的上界,i=1,2,···,n。

假设2在该未知的非线性系统中,标称状态方程x(k+1)=f(x(k),···,x(k−nx))满足全局Lipschitz条件,即对任意两个采样点k1、k2,都有

其中:Lm为假设存在的Lipschitz常数,m∈{1,···,N},N=nx+nd+nu+3。同时,f(·)对控制输入的偏导数存在,不为零,符号不变。

假设3有界的系统干扰h(d(k−1),···,d(k−nd))非Lipschitz连续,即任意连续。在实际问题中,h(·)存在因电压驱动耦合引起的与状态相关的非Lipschitz连续扰动h1(·)及自相关的有界外界扰动h2(·),即

根据上述假设,将非仿射离散时间空间惯性传感器动力学模型式(9)改写为下述差分形式

其中:χ(k)=[x(k),···,x(k−nx),uS(k),···,uS(k−nu)];δ(k)=[d(k−1),···,d(k−nd)];ζ(k)=−f(χ(k−1),uS(k−1))+f(χ(k),uS(k−1))+h(δ(k))−h(δ(k−1));∆为差分算子,满足∆x(k+1)≜x(k+1)−x(k)。定义ΘT(k)=,认为ΘT(k)有界,且存在上界 ρΘ,则系统转换为如下的动力学局部线性形式

为实现上述模型的稳定控制,控制器的设计需同时实现①未知增益ΘT(k)的估计和②任意连续未知动态ζ(k)的逼近,从而使各闭环信号有界。考虑到标称动力学模型分量f(·)的全局Lipstchiz连续性,标称控制输入基于引入数据驱动理论的自适应控制方案,而任意连续未知动态ζ(k)则基于模糊规则进行逼近。同时,控制过程需根据性能指标要求设计非对称约束,运用BLF确保控制全过程位移响应位于约束内。

2 基于数据驱动的模糊自适应约束控制方案设计

本节将首先给出任意连续未知动态ζ(k)的模糊估计器,其次设计ΘT(k)的估计自适应律,给出闭环控制器,验证各闭环信号的有界性。

2.1 基于模糊规则的自适应未知动态估计器

ζ1(χ(k))及有界外界扰动分量ζ2(k)构成

注意到连续未知动态ζ(k)由任意连续扰动分量

其中:x0=[x1,···,xn]T∈Rn、y∈R 分别为模糊系统输入及输出;l=1,2,···,N,N为模糊规则数;Fnl、Gl为模糊集。令(xi)、(y)分别为模糊集Fnl、Gl的对应隶属度函数,那么模糊系统输出可以表达为

其中:中心值Φl=maxy∈RhGl(y),由此定义模糊基函数

令θT=[θ1,···,θN]=[Φ1,···,ΦN],φ(x)=[φ1,···,φN]T,将任意连续扰动分量ζ1(χ(k))基于上述模糊规则改写为如下形式

根据模糊基函数的定义,容易得到0<∥φ(χ(k))∥≤1。假设输入变量χ(k)处于 Rn内的紧集 Ω中,对于任意ϵ∗>0,存在模糊规则式(17)及最优权值θ∗,使得

由此将本地动力学线性化模型式(13)改写为

其中:ΘT(k)、θT(k)均未知。运用自适应律对ΘT(k)、θT(k)进行估计。对于ΘT(k),首先给出如下目标函数

其中:µ1>0代表的权重系数;(k)为ΘT(k)的自适应估计。最小化J1(ΘT(k))并推导得出

其中:γ1>0为自适应增益。类似的,为估计得到θT(k),给出如下目标函数

其中:µ2>0代表的权重系数,(K)为θT(k)的自适应估计。最小化J2(θT(k))并推导得出

其中:γ2>0为自适应增益。为分析自适应估计式(20)与式(22)的有界性,首先给出如下引理:

引理1(收缩映射原理)考虑如下迭代状态ν(k)

其中:α(k)∈RM×M为映射矩阵:κ(k)∈RM为外界输入。如果

根据上述引理给出自适应估计式(21)与式(23)的稳定性分析过程。给出如下定理。

定理1对于式(13)表达的非仿射非线性离散时间系统模型,当未知参数的自适应估计按式(21)及式(23)表达时,给定自适应增益0<γ1,γ2<2,各自适应估计误差有界,并给定误差上界

其中

证明首先证明(k)的有界性。回顾自适应律式(21),将估计误差推导为如下表达形式

其中:ζi(k−1) 为ζ 第i行的第k−1次迭代,(k)=根据的有界性,

其中:ζ1i,ζ2i代表ζ1,ζ2的第i行。注意到

考虑到0<γ1<2,µ1>0,满足0

式(28)用到了θ∗(k)的不变性,即θ∗(k)=θ∗(k−1)。类比式(26),对式(28)中部分项进一步推导得出

考虑到0<γ2<2,µ1>0,满足0

2.2 非对称约束控制器

为确保空间惯性传感器各非敏感轴在控制过程中其响应处于性能指标要求的约束范围内,引入BLF结合前节引入的模糊自适应估计完成闭环控制器的设计。给出下述Lyapunov函数V(k)

其中:跟踪误差e(k)=x(k)−xd(k),xd(k)为响应指令。在空间惯性传感器静电悬浮控制问题中,惯性传感器需对外壳保持相对静止,在以航天器外壳为原点的相对坐标系中,xd=0。为确保V1(k)非负定,需保证跟踪误差e(k)∈(−H1(k),H2(k))。对式(30)两边微分得到

其中:

代入(13)及式(14)及xd=0,将(31)整理为

利用Young’s不等式对式(32)中部分项转化,得到

其中:σ1,σ2>0。将式(33)代入式(32)并推导得出

在ϕ<−1/2∥γ1∥时,在V

其中:

对式(38)两边积分,得到

由此得到V(k)∈L∞。由于V

根据Young’s 不等式,在紧集e(k)∈(−H1(k),H2(k))上

随着采样步数k→∞,可推导得出

式(42)进一步表明了跟踪误差信号的一致有界性,且随着 γ0的合理选取,跟踪误差信号的稳态误差也将减小。

根据本节所述闭环控制器的设计结果与描述,给出该数据驱动约束控制方案结构框图,如图2所示。

图2 控制结构Fig.2 Control framework

3 仿真结果与分析

3.1 仿真参数设置

数值仿真验证基于样例空间引力波探测任务给出的空间惯性传感器非线性动力学模型[7,20]。由于需考察闭环系统各状态响应的性能指标,部分数值仿真结果展示为频域形式。数值仿真通过与QFT控制方案[7]的对比验证了该数据驱动自适应约束控制方案在2个分别代表平动和转动的非敏感轴静电悬浮自由度上针对位移噪声抑制的控制效果,设置仿真时间为3 000 s,步长为0.1 s。数值仿真结果如图3~5所示。

图3 非敏感轴频域位移响应Fig.3 Response of frequency domain on non-sensitive axis

在空间惯性传感器动力学系统中,存在以如下成型滤波器表达的随机过程噪声

其中:作用于x2,η1两敏感坐标轴上的噪声相关参数p1,p2,p3,p4,p5,z1,K1,K2的取值由文献[23]给出。在动力学模型有关的参数中,选取带有摄动的刚度矩阵

在控制器参数的选取中,选取模糊集数量N=3,并将模糊基函数按下式表述

其中

在x2,η1两通道上的其它控制器参数整定为λ=0.01,σ1=σ2=1×10−5,γ1=γ2=0.001,µ1=10−14,µ1=10−10,ϕx2=−10,ϕη1=−5.5。两通道预设的非对称时变性能边界函数选取为

3.2 仿真结果

根据数值仿真结果,展开如下分析:

1)图3~5展示了该数据驱动模糊自适应约束控制方案的性能及与常规线性控制方法的控制效果对比。其中,图3展示了该方案下两自由度位移响应的频域幅值谱密度响应,在预设的干扰及动力学参数下,该方案的位移响应优于样例空间引力波探测任务给出的性能指标。图4则展示了两自由度内该方案与QFT方案的时域控制效果对比,仿真结果表明,本文提出的方案对于扰动及非线性不确定性具有明显的抑制作用,但针对xd=0的跟踪目标,两种方案均具有一定的稳态误差,这一结果也与理论分析相对应。图5表明了两通道的位移响应位于时变且非对阵的性能约束内,满足预设的性能指标要求。

图4 与QFT方案的位移响应效果对比Fig.4 Displacement response compared with QFT-based scheme

图5 性能约束的验证Fig.5 Verification of performance constraints

2)图6给出了基于自适应方案得到的模糊权值及Lipschitz常数的估计结果。在两个非敏感轴通道,仿真曲线可表明各项自适应估计的有界性,即随着控制过程的递进,各估计有自适应趋稳的趋势。结合与线性方案对比的数值仿真结果,可以得出,在该静电悬浮控制问题中,系统中存在较为明显的未建模Lipschitz连续及任意连续分量,也表明针对非线性项及未建模动态的估计及反馈对控制效果的整体提升作用是显著的。

图6 各自适应变量估计结果Fig.6 Result of each adaptive estimation

4 结 论

在考虑硬件数据传输、实际系统运行在离散时间系统内的前提下,本文提出了一种数据驱动离散时间模糊自适应约束控制方案,用于解决空间引力波探测任务中惯性传感器静电悬浮高精度控制问题,运用数据驱动方案及模糊系统实现系统内任意连续未知分量的估计与反馈,同时基于控制障碍函数未系统位移响应设计非对称时变性能约束,使闭环控制响应满足预设的控制性能。理论分析和数值仿真结果均验证了各闭环响应的有界性,数值仿真表明了该方案对预设性能指标的满足。

猜你喜欢
惯性航天器约束
你真的了解惯性吗
2022 年第二季度航天器发射统计
冲破『惯性』 看惯性
“碳中和”约束下的路径选择
约束离散KP方程族的完全Virasoro对称
2019 年第二季度航天器发射统计
2018 年第三季度航天器发射统计
2018年第二季度航天器发射统计
无处不在的惯性
普遍存在的惯性