权申明,陈雪野,晁 涛,杨 明
(哈尔滨工业大学航天学院控制与仿真中心,哈尔滨 150080)
导弹末制导阶段存在多种约束,如视场角约束、攻击角度约束、攻角约束等约束。脱靶量是末制导律最重要的性能指标。随着任务需求的不断提高,末制导阶段飞行器的落速和落角精度的重要性日益凸显。以导弹为例,其杀伤概率、突防和机动能力等性能指标均与末端角度和落速密切相关,这两个约束如果不满足可能会发生跳弹现象。目前,国内外对于末制导律的研究主要分为两类:非最优制导律和最优制导律。
非最优控制的末制导律主要采用修正比例导引,其主要手段是通过加偏置项实现落速的控制。在传统比例导引律上增加了时变偏差,可以拓宽末端角度的可达范围。由于过载的限制,传统比例导引律存在一定的末端角度死区。Ratnoo等针对地对地任务将定向制导方案和比例导引律结合,解决了死区问题,保证了任意角度末制导打击的可行性,同时将该方法拓展到非平稳非机动目标制导领域。Yuri等还提出一种满足终端角度约束的修正比例导引制导律,根据终端期望状态修正导航比。这种方法对自适应制导律有参考意义。文献[15]针对高超声速飞行器提出一种自适应比例导引律,该导引律的导航比可连续闭环更新,弱化高速飞行过程中扰动的影响,从而保证高精度的期望冲击角。
基于最优控制理论设计出的最优制导律具有精度高和能耗最优的特点。文献[17]考虑能量最优和碰撞角约束,推导出无滞后系统和一阶滞后系统状态反馈形式的最优制导律,其制导指令为阶跃响应和斜坡响应线性组合的横向加速度。最优制导律的性能直接依赖于剩余时间估计的准确性,而传统的剩余时间估计方法存在较大的估计误差。针对大曲率的终端角度约束制导轨迹,文献[18]提出一种新的剩余时间计算方法,同时得到以时间加权能量函数的最优制导律。文献[19]根据线性二次型调节器和线性二次型微分对策理论,提出两种终端角度约束制导律,并对比分析两者的性能。文献[20]基于块脉冲函数,提出一种时变系统的最优制导律设计方法,可将时变系统转化为一系列时不变系统。Lei等将分段线性函数和最优控制理论结合,提出平均时变系数的次最优制导律,该方法计算简单,占用资源少。
末制导研究大多针对脱靶量和末端角度约束,较少提及落速控制研究。落角和落速是衡量末制导打击效果的重要指标,然而现有研究通常分别考虑两个终端约束。落速控制大多通过设计期望速度高度曲线或者制导轨迹来实现。Xie等利用期望高度速度曲线推导出三维自适应比例导引律,并对比分析最优制导律和自适应比例导引律控制效果。之后谢道成等针对移动目标,提出了带终端角度和速度约束的滑模变结构导引律,提高了末制导过程的鲁棒性。基于期望速度高度曲线的落速控制精度易受模型精度和气动参数摄动的影响。文献[23-24]通过调节比例系数,进行速度控制。多位学者基于凸优化方法,进行满足终端速度约束的轨迹优化。文献[28]探究了比例导引制导律与最大化落速之间的关系。文献[29]针对不确定风况下考虑终端速度约束的无动力滑翔飞行器提出一种制导方法。此外,王荣刚等提出基于攻角和弹道倾角估计高度修正落速方法,同时设计一种变角偏差反馈系数的偏置比例导引律,提高弹道下压能力。文献[10]用贝塞尔曲线设计末制导参考轨迹,并通过神经网络预测终端速度。该方法在满足过程和终端约束条件下有良好的性能,但仅限于曲率变化有限的轨迹。Moon等设计出满足多种约束的多项式形式参考轨迹,同时提出能有效预测终端速度的数值方法,但制导精度易受气动参数扰动的影响,鲁棒性差。
针对以上问题,本文提出一种同时满足落角和落速约束的末制导律。首先,基于落角约束的最优末制导律,分析其初期过载需求较大的问题。其次,设计过渡函数,通过虚拟落角约束降低初期过载需求,并分析过渡函数中各参数对落速的影响。设计预测-校正算法计算满足落速需求的参数,得到考虑初始偏差及气动参数摄动情况下的训练样本数据。之后利用样本数据训练深度神经网络(DNN),并基于扩展卡尔曼滤波(EKF)算法在线辨识气动参数摄动值,从而在线快速估计期望过渡函数参数,最终满足落角落速约束。本文的主要创新如下:
1)引入虚拟落角约束,有效降低末制导初期的过载需求;
2)设计双层预测-校正算法,使用双参数调节落速,拓宽了速度调节范围;
3)提出同时考虑落角落速约束的末制导方案,使用离线训练与在线计算结合的方式,对落角和落速进行有效控制。
本文后续内容安排如下:建立飞行器运动模型及弹-目相对运动模型;设计基于虚拟期望落角的末制导律以降低末制导初期过载需求;结合预测-校正算法、EKF算法及DNN,设计基于虚拟期望落角的带落角落速约束末制导律;最后,进行数值仿真实验,验证算法的有效性。
选取地面静止目标,建立三维弹-目相对运动关系,俯冲平面相对运动如图1所示。
图1 俯冲平面相对运动示意图Fig.1 Diagram of relative movement in the diving plane
图1中面为俯冲平面;点为飞行器位置,点为目标位置;为飞行器的飞行速度,是飞行器速度在俯冲平面内的投影;是的高低角,是与弹-目连线的夹角;为与平面的夹角。图1中存在角度关系:
=-
(1)
俯冲平面弹-目运动规律:
(2)
对式(2)两侧求导,可得俯冲平面的弹-目相对运动方程:
(3)
末制导阶段飞行器的横向机动较小,真实作战场景中需要考虑飞行器的横向运动,转弯平面内弹-目相对运动如图2所示。
图2 转弯平面相对运动示意图Fig.2 Diagram of relative movement in the turning plane
图2中面为转弯平面;是飞行器速度在转弯平面内的投影;是的方位角,是与弹-目连线的夹角;为弹-目视线与俯冲平面的夹角。图2存在角度关系:
=-
(4)
转弯平面弹-目运动规律:
(5)
与俯冲平面的处理方法一致,可得转弯平面的弹-目相对运动方程:
(6)
联立式(3)与式(6),得到弹-目相对运动方程为:
(7)
(8)
以能量为性能指标的带落角约束的最优末制导律,能以最少的能量损耗实现落角控制。
带落角约束的最优末制导律基于最优控制理论,在已知系统状态空间方程的前提下,可控制飞行器达到期望落角,同时使给定的性能指标最优。
(9)
式(9)为设计最优末制导律的性能指标。结合最优控制理论,可得带落角约束的最优末制导律:
(10)
式中:为期望落角;是待飞时间。
为了减少末制导初期的较大过载需求,本文设计过渡函数(,,,),简记为(·),并提出虚拟期望落角的概念:将(,,,)·视为虚拟期望落角。设计过渡函数(·)如下:
(·)=
(11)
该过渡函数具有连续可导的特点,值域为[0, 1],因此虚拟期望落角的值会随着弹目距离的缩短而逐渐收敛至。同时由于初始段过渡函数值较小,期望落角项引起的需用过载不大,可有效减少输出过载持续处于饱和状态的时间。
为了对比说明引入虚拟期望落角制导律的优势,进行两组仿真,结果见图3~图5。
图3 三维轨迹曲线Fig.3 Three-dimensional trajectories
图4 过渡函数对过载系数的影响Fig.4 Effect of the transition function on the overload coefficient
图5 过渡函数对弹道倾角的影响Fig.5 Effect of the transition function on the flight path angle
通过以上仿真结果可以看出,最优制导律在前2 s内,需用过载系数达到40,处于饱和状态,而基于虚拟期望落角的制导律在过渡函数作用下,能够在满足终端弹道倾角的同时,降低末制导初期的需用过载。最大过载约束为飞行器机动能力的极限状态,因此应该尽量不触及,这种方式有效避免了初期大过载的危险飞行状态。相比于最优制导律,基于虚拟期望落角的制导律将过载需求平均在整个末制导阶段,增加了弹体的安全性。
虚拟期望落角的引入,可有效降低末制导初期的过载需求。本节通过研究可调参数对落速的影响,设计预测-校正算法,对大量飞行数据进行DNN数据训练,使用EKF进行摄动参数的估计,设计基于虚拟期望落角的带落角落速约束末制导律。
过渡函数中参数的选取会影响飞行器的轨迹,从而影响落速。在标称气动情况下,分别固定和中某一参数,调节另一参数,可得到落速随参数变化曲线如图6~图7所示:
图6 k1=0.95时,vf随k2的变化曲线Fig.6 Variation of vf with different k2 when k1=0.95
图7 k2=0.2时,vf随k1的变化曲线Fig.7 Variation of vf with different k1 when k2=0.2
由图6~图7可以看出,通过调整和能够实现落速的改变。当固定时,与落速成正相关关系。当固定时,和落速也存在正相关关系。对比图6和图7的落速范围可知,对落速的调节能力强于。改变过渡函数的参数和,飞行器的终端速度最大可达到2400 m/s,最小可达到600 m/s。该种方式对落速有较大的调节空间。
通过合理的参数设置,可实现按照设定的落角、落速对目标精确打击。现有落速控制的末制导律,大多根据期望落速由末端反向积分设计一条理想的高度-速度曲线,飞行器跟踪该条曲线从而实现对落速的控制。但这种方法容易受外界气动因素和模型精度的影响。优化类方法由于计算耗时,难以快速在线计算。本文提出的基于虚拟期望落角的带落角落速约束末制导结构框图如图8所示。
图8 末制导结构框图Fig.8 Structure diagram of the terminal guidance
在离线计算阶段,假设气动偏差可通过在线辨识得到且精度较高。对不同的初始偏差、气动偏差随机组合作为离线仿真算例,使用预测-校正算法调节参数。最后将满足落速落角约束的飞行轨迹作为训练数据集,训练DNN网络。
飞行过程中进行气动参数的在线辨识与制导律计算,将EKF的估计结果与飞行状态作为DNN网络输入,得到一组可行参数和,代入虚拟期望落角制导律,并进行控制量的实时解算,不断修正参数,改变弹道形状,最终达到期望落角落速。
具体步骤如下:
:预测-校正法获得离线弹道样本数据
由上节可知,和与终端速度相关,相同情况下对速度的调节能力较更强,优先调节,当达到单参数的调节极限时,可通过进行下一步的调节。
在每一个制导周期内,给定的初值,通过积分整个运动方程,可得到终端速度偏差。
(12)
(13)
从而,可得到该仿真条件下的满足落速需求的和。
需要说明的是,大部分仿真中,落角约束均能满足。当≈≈00时,落角约束在临近目标点时才作用于制导律。在这极短的时间,期望落角难以实现。因此当过小时,可能会影响落角精度。下面将分析最小取值。
将制导律代入俯冲平面方程:
(14)
可得闭环系统方程:
(15)
在末制导后期,为了实现以固定落角打击目标,令(·)=1,则方程变为:
(16)
当系统从=0达到终端状态时,需要时间达到峰值,假设系统在上升时间之后一直保持稳态,初始时刻到上升时间系统响应近似为正比例关系。需要说明的是,该假设中为常量,实际上会随着飞行不断减小,角度约束的最优导引律的调整时间小于。
若在末制导某时刻=-50°,=-70°,那么从该时刻之后,还需上升时间为067。换言之,若系统可保持当前状态值,最晚在距离打击目标待飞时间067进行角度的调节,可实现期望落角。结合飞行器的最大机动过载约束仿真结果,≥01时,均可实现落角约束。
:训练DNN网络
DNN是一种多层前馈神经网络,由输入层、多个隐层和输出层组成,该网络的学习过程包括向前计算和误差反向传播。DNN的训练步骤为:
1)样本获取。通过更改初始状态偏差、气动摄动偏差,可得到多条终端速度达到期望值的轨迹。该轨迹上每一个制导周期下的,均能使当前气动偏差和飞行器状态下的飞行器的终端速度达到期望值。为实现基于DNN的自适应落角落速约束末制导律,将每一个制导周期的气动偏差和飞行器状态作为训练DNN的输入数据,相应的,作为训练DNN的输出数据。
该问题中,结合飞行器交班能力与环境影响因素,设计样本如表1所示:
表1 初始状态偏差和参数摄动Table 1 Initial states deviation and parameters perturbation
2)网络训练。使用DNN对步骤1)的飞行轨迹进行网络训练,每组仿真飞行时间约为30 s,每0.5 s 取一组数据。
:EKF辨识气动偏差
真实飞行任务中,气动参数和大气密度的摄动均是影响飞行器性能的重要因素。准确辨识出气动参数和大气密度摄动量是提高制导精度的重要手段。现有文献中通常假设飞行过程中动压可测且准确,并根据加速度信息进行气动参数摄动的估计。本文采用EKF方法估计飞行器动力学模型中升力系数摄动d和阻力系数摄动d以及大气密度摄动,详细步骤可参考文献[31]。
:在线解算控制量
由于气动摄动、状态偏差均为连续变化,不会发生突变,因此实际飞行中,为了提高计算效率,控制器无需在每个制导周期都进行EKF气动摄动估计与调节参数,的更新,可适当延长参数的更新周期(本文中设定为500 ms),同时可有效避免由于参数频繁更新导致执行机构抖振而引起飞行器失稳。
为了验证本文所设计制导律的有效性,使用计算机硬件平台为Windows 10-Core i7-10510U,在Visual Studio 2010软件下编写数值仿真程序。
结合飞行器特性,设定期望落角为-72°,飞行器标称初始高度为30 km,初始速度为5000 m/s,初始弹道倾角为0°,目标位于地面且静止,初始弹目距离100 km。选取不同期望落速,分别进行预测-校正算法有效性检验仿真、落速调节适应性仿真、蒙特卡洛数值仿真。
设定期望落速2000 m/s,通过预测-校正法求解满足该约束的可行参数,设置迭代精度为=|-|≤2 m/s。仿真结果如图9所示(图中表示迭代次数)。
图9 预测-校正法求解的速度变化曲线Fig.9 Speed curves solved by the predictor-corrector method
由图9可以看出,设定为2000 m/s时,由于初始值不合理,飞行器在末制导初期飞行高度较低,减速较多。随着飞行高度增加,气动阻力减小后能量得以保持,经过5次迭代后,得到可行的参数值。
针对不同终端期望速度进行仿真,以验证基于虚拟期望落角末制导律调节落速的有效性,仿真结果如表2所示。
表2 预测-校正算法有效性检验结果Table 2 Validity results of the predictor-corrector method
图10~图11为预测-校正算法求得的和代入模型中得到的速度变化曲线。由表格数据可知,对于不同的落速约束,均可得到满足期望终端状态的可行参数值。
图10 不同vf下速度变化曲线Fig.10 Curves of speed under different vf
图11 不同vf下速度倾角变化曲线Fig.11 Curves of flight path angle under different vf
为了验证算法的有效性,在表1中各初始状态偏差和参数摄动范围内,进行100组蒙特卡洛随机仿真实验,期望落角和落速约束与前述仿真相同。
使用文献[30]中方法作为对比,记为“算法一”,在相同场景中进行仿真,统计落角落速的偏差,终端散布如图12所示:
图12 终端状态偏差直方图Fig.12 Terminal states deviation histogram
由图12可以看出,该制导律落速控制精度优于±15 m/s,落角控制精度优于±0.5°,可实现以期望落角落速打击地面静止目标,满足实际需求。对比两种算法的统计结果,落角控制精度均优于±0.5°,而算法一的落速控制精度约为±50 m/s,因此本文算法更具优势。
针对现有末制导律难以同时调节落角和落速的问题,本文提出了一种基于虚拟期望落角的带落角落速约束末制导律。为了降低末制导初期过载需求,引入过渡函数,设计基于虚拟期望落角的末制导律;在此基础上,研究各参数对落速的影响,设计预测-校正算法对落速进行调节;使用EFK对气动参数进行在线的辨识,更新制导律参数。蒙特卡洛仿真验证了所提出的算法能够在满足落角约束的前提下实现对落速的控制,相比于其他落速调节算法具有更高的控制精度。
后续将针对不依赖于离线训练网络,仅通过在线快速计算便可得到合适参数的算法开展研究,使得本文算法适用性更强,开发周期更短。