李雪,王青,2
(1.北京航空航天大学自动化科学与电气工程学院,北京 100191;2.北京航空航天大学国际创新学院,杭州 311115)
为了在制导任务中协调多个飞行器,时间约束下的制导控制得到了广泛的研究[1],攻击时间控制制导(Impact-time-control guidance,ITCG)及协同制导方面,现有的研究成果十分丰富。一类文献采用经典导引方法(如比例导引及其变体),以及最优控制理论。文献[2]提出一种包含最优三维比例导引项和剩余时间误差反馈项的制导律;文献[3]利用前置角法制导下剩余时间与规定的前置角之间的确定关系,设计了基于前置角法的ITCG;文献[4]设计了一种采用碰撞时间匹配策略的最优协同诱导解析制导律。另一类则采用非线性控制理论设计方法,如文献[5]针对三维六自由度问题,提出了非奇异的滑模ITCG,并突破了小角度限制;文献[6]则采用反馈线性化方法设计制导律。
上述ITCG 研究成果大多在二维情境下展开设计,而二维平面内的飞行是理想化假设,三维场景下的制导控制则具备更强的研究价值和实际意义。此外,由于剩余时间估计值表达式的局限性,多数文献中提出的制导方法要求前置角为小角度,这限制了初始航向和期望剩余时间的大小,缩小了相应制导方法的可用范围。同时,绝大多数ITCG 文献止步于对制导律的研究,而制导与控制分环设计的思想虽然能够简化设计过程,但也可能导致制导与控制系统不匹配,进而造成整个系统的机动性降低、制导性能变差,甚至造成闭环系统不稳定[7]。为解决分环设计中存在的问题,制导控制一体化(Integrated guidance and control,IGC)受到研究,在IGC 框架下,姿态和过载等综合信息被用于飞行器舵偏的反馈控制设计中,最终有效提升制导品质[8-9]。针对二维协同攻击的制导控制一体化问题,文献[10]提出了基于滑模控制器的设计方案;文献[11]针对二维平面内的拦截时间约束问题,提出了基于滑模控制的制导控制一体化方案,但未考虑三维和大前置角的情况;文献[12]采用控制障碍函数约束算法及反步法和动态逆方法,研究了过程约束下的三维IGC 问题;文献[13]在动态面控制的框架下设计了基于一致性理论和结合扩张状态观测器的分布式一体化协同制导与控制律。可以看到,现有的时间约束制导控制一体化相关研究文献较少,且多数仍局限于二维和小前置角场景,还有很大的研究空间。
非线性控制方法中,滑模控制因其对扰动和模型不确定性的鲁棒性,得到了广泛的应用。经典滑模控制方法包含非连续的切换控制项,容易造成系统状态抖振,进而降低控制性能。超螺旋算法(Super-twisting algorithm,STA)是一种连续滑模控制方法,能够应对李普希茨有界的扰动,并确保系统具有有限时间稳定性,在制导[14-16]与制导控制一体化[17]中也得到了应用,但其与时间约束制导控制一体化的结合尚未得到研究。
本文首先给出制导控制一体化模型,随后设计了一种针对大前置角的新型滑模面,并提出一种基于超螺旋算法和反步法的制导控制一体化方案,采用数值仿真验证了方案的有效性。
为研究飞行器终端时间约束下的制导控制一体化问题,本节对所研究的被控系统进行数学建模。
首先建立末制导三维弹目相对运动模型。考虑三维场景,如图1所示。图中,惯性参考坐标系记为Oxyz;r为弹目相对距离,qε为视线高低角,qβ为视线方位角,V为飞行器运动速度大小,σ为前置角。在设计时,为简单起见,忽略V随时间的变化,认为其大小恒定不变。
图1 三维弹目关系示意图Fig.1 Three-dimensional missile-target diagram
记θ为航迹倾角,ψV为航迹偏角。为简化表达,记η=ψV-qβ,三维弹目相对运动学方程如下[18-19]:
三维场景下的前置角σ定义为飞行器速度与视线之间的夹角,其范围为[0,π ]。根据坐标转换关系,前置角可由下式计算:
因此,式(1)中的第1式可简化为:
将cosσ对时间求导,有:
式中:θ与ψV的时间导数可根据式(6)获得。为方便表示,记:
飞行器的切向加速度amy,amz由气动力及重力mg产生:
式中:Q是动压,S为参考面积为升力系数对攻角α的偏导数为侧力系数对侧滑角β的偏导数。
飞行器运动学和动力学方程如下[19]:
式中:γ是滚转角,ϑ是俯仰角,γV是航迹滚动角;Jx,Jy,Jz为转动惯量;ωx,ωy,ωz为体坐标系转动角速度;Mx,My,Mz为俯仰、滚转与偏航力矩,其值可近似为:
本文的设计目标为:设计控制律u=[δx,δy,δz]T,使得飞行器在期望的终端时刻击中目标,该控制律应具有一定的鲁棒性,并且能够在大前置角的情况下实现打击任务。结合式(1),(7),(8),记状态ξ=状态方程可简记为:
式中:dq,d2,d3为外部干扰和未建模动态构成的总扰动项,
式中:K=4N-2,N为比例导引中的导航比,取值为3~5。根据其形式,当且仅当(Tf)=0,有r(Tf)=0。因此et=tgo-收敛于0 能够保证在期望的终端时刻击中目标。该表达式在小前置角的假设下推出[20],在平面[10]和三维[2,5]场景下都得到了充分的应用,并且不局限于采用比例导引的情况。然而,该表达式只在前置角较小的情况下有效。本文将在2.1 节中给出一个改进的状态变量,使其不受前置角大小的约束。
本节针对终端时间约束下的制导控制一体化问题,给出一种新的滑模面,并证明该滑模面能够使飞行器在期望时间击中目标;随后,给出基于超螺旋算法的制导控制一体化设计方案,其中包含一种控制分配算法;算法的鲁棒性及有限时间收敛特性得到了理论证明。
前文提到,式(19)仅在前置角较小,即sinσ≈σ时有效[2],该要求局限了这一时间估计方法的适用范围。即使初始前置角满足要求,当所需的剩余时间较大时,前置角也可能超过π/2,给时间估计造成困难。为了打破这一局限性,给出一种针对大前置角的新型滑模面,该滑模面使σ严格递减,并最终降为0,即速度方向指向目标。这样,系统在前置角不满足小角度要求时仍能在规定时间击中目标。
记⎿x⏋p=|x|psgnx,定义一个新的滑动流形:
ε0>0 为超参数。显然,当σ≤π/2 时,s1即转化为结合式(3),(4),将s1对时间求导得:
定理1.考虑弹目相对运动关系(1),及滑动流形(20),若系统状态滑模运动,即s1=0,前置角σ将始终减小,且当且仅当r=0时,有σ=0。
证.当系统状态位于滑模面上,有s1=0=0,显然,σ≠π/2,也即cosσ≠0。整理式(22)得:
当σ<π/2时:
式中:sin2σ>0,cosσ>0,cos(σ/2) >0,sin(σ/2) >0,由于K>2 >2cosσcos2(σ/2),故上式大于0。
当σ>π/2时:
显然,等号右侧大于0。因此,cosσ总是随时间增大,即σ始终减小。
再研究σ=0 的条件。考虑σ≤π/2,由式(23)及式(1)的第1式可得:
显然,式(28)当且仅当cosσ= 1时为0。因此,若系统状态位于滑模面上,当且仅当r= 0 时,有σ= 0。证毕。
注1.当期望的剩余时间大于r/V(1 + 1/K)时,状态运动到滑模面,前置角σ将大于π/2。ε0的选择将决定滑模面上前置角的大小,在相同的期望剩余时间下,ε0越大,s1= 0 对应的cosσ越小,则系统滑模运动所需的σ越小,飞行器运动轨迹的弯曲程度越低;然而,过大的ε0将导致所需的控制量随之增大。因此,合理选取ε0,才能实现控制需求。
注2.若不采用改进的滑模面(20),则当飞行器以式(19)跟踪时,一旦σ> π/2,飞行器将继续按背离目标的方向运动,导致无法击中目标。而采用改进的滑模面(20),仅在σ≤π/2 时等于式(19),即剩余时间跟踪误差s1=-;当σ> π/2时,s1不能代表剩余时间跟踪误差,但能够使σ随时间严格递减,最终到达σ< π/2。在其继续降低的过程中,式(19)对时间估计的准确性逐步提升[20],最终,飞行器将在预定的终端时刻击中目标。
注3. 在时间约束的制导控制一体化设计中,可以实现的期望的终端时刻Tf要大于等于初始前置角下的终端时刻,即当σ< π/2时:
当σ≥π/2时:
基于反步法和STA,给出一种制导控制一体化设计方案,使系统状态运动到2.1节提出的滑模面,进而在期望时间击中目标。
STA[15]可简述如下:对于降阶系统=v+ρ,选取合适的k1> 0,k2> 0,构成控制输入:
则降阶系统能够在有限时间内收敛至s==0:
式中:ρ为李普希茨有界的总扰动项,即存在L> 0使得≤L。与其他滑模控制方法相比,STA 的优势在于能够保证有限时间收敛,且能处理李普希茨有界的扰动,而不局限于有界扰动;其控制输入连续,不直接包含切换项,同时无需微分器观测
针对一般的系统(33),为说明一定存在k1,k2,使得该系统稳定,定义辅助状态变量z=[⎿s⏋1/2,w]T,有以下引理:
引理1[21]. 对于非负连续函数V(x(t)) =xTPx,其中P∈Rn×n为正定对称矩阵,x∈Rn,若存在正定对称矩阵Q∈Rn×n,使得-≤‖x‖-1/2xTQx成立,则有≤-ςV1/2。若系统以V为李雅普诺夫函数,则从初始状态x(0)出发的轨迹在有限时间内收敛到原点,收敛时间小于T(x(0)) =(2/ς),其中:
引理2[21]. 假设系统(33)中的扰动有上界L,则对任意L> 0,都存在k1,k2,使得原点s= 0为全局有限时间稳定的平衡点,且存在正定对称矩阵P,使得V=zTPz是系统(33)的李雅普诺夫函数,其时间导数几乎处处满足:
式中:Q为正定对称矩阵。为方便后续分析,记:
以下介绍本文提出的反步STA 制导控制一体化的具体设计过程。
步骤1.针对本文研究的时间约束的制导控制一体化问题,首先将改进的新型滑模面(20)作为状态变量,第一个子系统为:
根据STA原理,设计虚拟控制量ν*:
式中:ka1>0,ka2>0 是待设计的STA 控制增益,根据引理2,令w1=v1+,ka1,ka2及相应的正定对称矩阵Pa∈R2×2,Qa∈R2×2可通过研究下述辅助子系统获得:
虚拟控制量(41)中,ζa定义为:
对ν*进行控制分配[5],考虑代价函数:
式中:κ>0为分配权重。对β*求偏导得:
令∂J/∂β*=0得:
根据式(40)可知,当且仅当σ=0 时,上式分母为0,结合定理1,在理想的滑模运动中,σ=0 当且仅当r=0,上述控制律不会出现奇异值。然而,在考虑系统动力学特性后,s1=0 不一定时刻成立。飞行器接近目标时,σ接近0,速度可能在视线附近振荡,导致式(46)分母过小,α*,β*出现振荡。为了在飞行的最后阶段维持速度稳定指向目标,考虑一个超参数ϵr>0,令r≤ϵr时,控制任务切换为稳定ξ,即进入第二阶段。假设式(10)中| 虚拟控制量(47)中,ζq定义为: 式中:上标(i,*)表示矩阵第i行,后文中出现的上标(*,i)则表示第i列。 步骤2.记定义滑动流形s2=x2-即x2的跟踪误差,则由式(10),第2 个子系统可以变形为: 虚拟控制量(50)中,定义ϱb1如下:对于第1阶段,有: 对于第2阶段,有: 式中:μq∈R2, 定义ϱb2,ζb如下: 式中:s3=x3-即x3的跟踪误差。 步骤3.由式(10),第3个子系统可以变形为: 式中:控制增益Kc1,Kc2为对角阵,对角线上的元素(i=1,2,3)同样根据引理2设计,并有相应的正定对称矩阵Pci∈R2×2,Qci∈R2×2。 控制律(57)中,定义ϱc1,ϱc2如下: 对2.2节中所设计的控制器的有限时间稳定性进行分 析。根 据2.1 节 及2.2 节,记w1=v1+,w2=v2+d2,w3=v3+d3,wq=vq+dq,则第1 阶 段闭环系统整理如下: 第2阶段如下: 定理2.考虑闭环系统(61),(62),系统状态将分别在有限时间内收敛至平衡点,收敛时间分别不超过: 式中:ts为1、2阶段切换时刻, 证.首先分析第1 阶段。对V1,V2i及V3i分别求时间导数,有: 式中:W1,W2i与W3i为: 根据引理2,有: 将式(43),(54),(55),(59)代入式(65)可得: 这样,可得V01的时间导数: 由式(51),(58)可得: 代入到式(69),并结合式(66)可得: 由引理1可知: 对于第2阶段,同样有: 与第一阶段同理可得: 综上所述,依据引理1,系统状态有限时间稳定,系统(61)的状态在T之内收敛到平衡点,系统(62)的状态在Tq之内收敛到平衡点。证毕。 注4.由于控制律(50),(57)中包含虚拟控制量的时间导数及,为避免“微分爆炸”[12]问题,使用高阶滑模微分器对其进行观测。变量x的k阶时间导数有上界Ld,则其k-1阶高阶滑模微分器[22]的一般形式如下: 式中:zi是对x的i阶时间导数的观测,i=0,…,k,λi>0 为控制参数,可根据文献[23]选取。与通常采用的动态面控制相比,该方法用高阶滑模微分器代替1 阶线性滤波器,利用滑模微分器的有限时间稳定性,较1阶滤波器产生更小的滤波误差,从而降低对闭环系统性能的影响。 通过数值仿真,在多种不同初始条件下,对照以未经改进的剩余时间估计式(19)为状态变量的控制方案,验证本文提出的时间约束的制导控制一体化的有效性。表1 列出了初始状态,目标位于[0,0,0]Tm。控制参数见表2,其中对于虚拟控制量时间导数的观测采用5阶微分器。 表1 初始状态Table 1 Initial states 表2 控制参数Table 2 Control parameters 表3 初始角度Table 3 Initial angles 图2 飞行器运动轨迹Fig.2 Trajectory of the flight vehicle 从图2中可以看到,对于不同的初始航向,本文提出的方法控制的飞行器飞行轨迹有所不同,但总能击中目标;图3 显示,初始剩余时间低于Tdf,随后成功跟踪期望剩余时间;图4显示,前置角在仿真初期增大,这是因为剩余时间估计值需要增大以跟踪期望剩余时间,随后,在实现了剩余时间跟踪的情况下,前置角减小,并最终收敛到0,这符合本文的分析。同时,在飞行过程中,可能出现超过90°的前置角,说明本文提出的制导控制一体化算法能够突破小前置角限制,使飞行器在大前置角情况下仍能击中目标。而对照组在第5组中初始前置角较大的情况下,飞行轨迹背离目标,不能实现预期的飞行任务,这说明了本文所作改进的有效性。 图3 估计剩余时间Fig.3 Estimated time remaining 图4 前置角Fig.4 Heading angles 飞行器初始条件固定,如表1所示,初始航迹倾角θ0=-10°,航迹偏角ψV0=20°,以不同期望终端时刻飞行。各飞行器的期望终端时刻分别为10 s,15 s,20 s,25 s和30 s。图5~7为仿真结果,包括飞行轨迹、剩余时间估计、弹目相对距离、前置角、攻角、侧滑角、滚转角、角速度及舵面偏转角度。 图5 飞行器运动轨迹Fig.5 Trajectory of the flight vehicle 由图5可见,随着期望终端时刻的增加,飞行器飞行轨迹更弯曲;由图6可知飞行器总能够在期望的时间击中目标;图7 表明前置角最终总能收敛到0。而对照组,在期望攻击时间为15 s,20 s,25 s和30 s时,由于期望攻击时间较大,前置角增大至超过90°后向着远离目标的方向飞行。仿真结果符合预期,显示出本文提出的制导控制一体化方案的有效性。 图6 估计剩余时间Fig.6 Estimated time remaining 图7 前置角Fig.7 Heading angles 由于名义模型通常不能准确表示实际系统,为研究所提出的制导控制一体化方案在气动参数存在不确定性时的鲁棒性,采用蒙特卡洛方法进行分析。初始条件如表1所示,飞行器初始航向为θ0=-10°,ψV0=20°,期望终端时刻=10 s,当r<1 m 时停止仿真,脱靶量根据r(Tf)=rsinσ估算,终端时刻按照Tf=t+rcosσ/V估算。针对空气动力系数,名义值和实际值存在±20%均匀分布的误差的情况,进行1 000 次仿真,对仿真结果中的脱靶量和终端时刻误差如图8~9所示。 图8 脱靶量Fig.8 Miss distances 图9 终端时刻误差Fig.9 Impact time errors 由图8~9 可以看到,在1 000 次仿真中,r(Tf) <1 × 10-3m,|Tf-|<5 × 10-3s,这表明本文所提出的制导控制一体化方案对气动参数不确定性是鲁棒的。 本文提出了一种基于超螺旋算法和反步法的新型制导控制一体化方法,以解决时间约束三维制导控制一体化问题。通过理论分析和仿真验证,本文提出的新型滑模面能够满足大前置角和大的期望剩余时间下的时间约束制导要求,保证前置角在滑模运动中收敛到0。所提出的新型制导控制一体化方法能够实现系统状态的有限时间收敛,并对李普希茨有界的不确定性具备鲁棒性,最终使得飞行器在规定时刻击中目标。2.3 有限时间稳定性分析
3 仿真验证
3.1 固定期望终端时刻仿真结果
3.2 固定初始航向仿真结果
3.3 蒙特卡洛仿真结果
4 结论