胡军,李毛毛
1.北京控制工程研究所,北京 100190
2.空间智能控制技术重点实验室,北京 100190
某些航天器完成空间任务后,需要返回地球,比如返回式卫星、载人飞船、航天飞机;某些航天器需要在行星着陆,开展行星的地面探索任务;这类航天器统称为进入式航天器[1]。对于进入有大气的行星,航天器利用自身的气动特性,控制大气阻力和大气升力,进而控制进入飞行轨迹。根据航天器自身升阻比大小的差异,进入有大气行星的航天器又可分为弹道式进入航天器、弹道升力式航天器以及升力式航天器。因为自身升阻比的差异,其控制自身进入轨迹的能力也有所不同。20世纪60年代,前苏联把航天员加加林送入太空,绕地球一周后成功返回地球,开启了人类往返太空的序幕。在此时期出现了以美国的水星号、苏联的东方号为代表的第一代弹道式载人飞船研究高潮,它们自身升力较小或者即使具备一定的升力,也不用升力进行航天器轨迹控制,因此航天器着陆精度较低。1965—1966年期间,美国发射了一系列双子星飞船,利用轴对称旋成体质心偏置,使得航天器进入大气的稳定姿态相对来流方向有一定的攻角,从而产生升力。通过控制倾侧角,可以控制升力在纵向和横向的分量,进而控制航天器的飞行轨迹。较于弹道式航天器,弹道升力式航天器大幅提升了航天器的落点精度;同时,利用大气升力,当峰值过载比较大时,减小飞行器的倾侧角,可以平缓航天器的进入轨迹,降低过载超限的风险。另外,可以通过改变倾侧角和攻角,改变飞行器的进入轨迹形式和进入时长,从而改变航天器的峰值热流。因为兼具升力和容积率高的优点,后续的几乎所有载人飞船、包括美国阿波罗飞船、龙飞船、猎户座飞船、星际客机,苏联的联盟系列飞船以及中国的神舟飞船、新一代载人飞船等,都采用上述弹道-升力原理,显示了弹道-升力式飞船蓬勃的生命力。1972年1月,美国正式提出航天飞机空间运输系统计划,它采用类似飞机的构型,升阻比大,进入轨迹的机动能力强,峰值过载小,能够实现滑翔再入,水平着陆于指定的机场。1981年第1架载人航天飞机成功飞行,美国还开发了基于同样原理的X系列可重复使用运载器,深化了再入和在轨的应用。
不论弹道-升力体,还是大升力体的进入轨迹控制,都是通过设计进入制导律,充分利用航天器自身升力分量的纵横向改变能力,保证航天器在满足制导能力约束和过程约束的基础上,实现以一定的精度到达预定的区域,满足终端约束条件。因此,制导方法的优劣直接关乎任务的成败。
走向深空、探索星际生命是航天探索的不竭动力,美国等航天强国持续开展研究,美国的探测器已经光临了太阳系所有(大)行星,也附着了小行星和彗星,对地球的近邻月球和火星则进行了深入探测。火星是太阳系内最具研究价值的行星,虽然火星的大气密度只有地球大气密度的1%,但通过增大面质比,仍可以利用火星大气作用于航天器上得到的阻力与升力,在一定范围内控制航天器的进入轨迹和过载。由于火星大气环境较地球变化剧烈,进入火星大气的航天器飞行过程更短,这就要求在较弱的控制能力和较大参数不确定性条件下,所设计的制导方法在有限的时间内保证足够高的落点精度,对制导方法的鲁棒性要求高。
进入无大气的行星或接近行星表面的着陆段时,航天器可利用自身携带的推进剂进行反推减速,实现在安全点着陆,这和航天器进入有大气的行星在执行方式上存在差异,但制导方法是相通的,都要求航天器能够控制自身的轨迹实现高精度的着陆,满足过程和终端约束条件。
航天器进入制导方法引起了国内外学者的广泛关注,很多学者也对航天器进入制导方法进行了总结。文献[2]主要针对小升阻比飞行器的进入制导方法进行了综述,着重讨论小升阻比飞行器的探月返回和火星探测。文献[3]针对可重复使用运载器的制导与控制方法进行探讨,对其特点和未来的发展方向进行了总结,并对可重复使用运载器的再入制导与控制一体化方法进行了总结和展望。文献[4]针对滑翔飞行器这种高超声速飞行器,对其弹道规划与制导方法进行了综述,尤其是结合人工智能方法,对制导方法未来发展的趋势进行了总结。文献[5]针对高超声速飞行器的制导控制方法进行了综述,总结了高超声速飞行器的分类、发展历史,以及制导控制方法的分类,尤其是对系统模型、故障机理分析、多控制器问题的切换以及智能自主控制方法进行了展望。文献[6]针对火星进入下降与着陆导航、制导与控制(GNC)技术进行了总结,给出了中国航天任务中可以借鉴的火星进入技术。可以看出,近年来相关文献针对小升阻比飞行器、高超声速飞行器以及火星进入等问题分别开展进入制导控制方法的综述。与已有文献相比,本文作者在多年的实际航天工程背景下,主要探讨航天器进入制导方法,不以飞行器的升阻比大小以及进入场景差异去探讨。尤其是提出将自适应预测校正制导方法作为飞行器进入与返回的通用制导方法,这样能给不同的飞行器提供一种自适应性强、精度高的制导方法。另外,本文作者结合未来航天器进入制导问题发展方向、工程可行性,提出在线轨迹规划与自适应预测校正制导方法的融合为今后工程上可行的方法。这些是本文与已有文献的主要区别。
本文第1节分析了航天器进入制导问题的建立及难点;第2节综述了航天器进入制导方法的研究现状,涉及跟踪标称轨迹制导方法、预测校正制导方法以及二者融合的制导方法,同时包括基于上述方法的主要改进,分析了各类方法的优缺点;特别介绍了实际应用于中国航天工程再入返回的自适应预测校正制导方法。第3节,面向未来载人登月工程自主应急救生、非设计轨道自主安全返回等任务需求,以误差或预测误差作为输入量的反馈制导方法在处理综合多约束问题时遇到困难,在线快速规划可行轨迹的重要性凸显,分析了在线轨迹规划方法的必要性和在进入过程的使用策略,也客观分析了在线轨迹规划方法所需要解决的问题以及今后的发展方向。本文指出,不同气动特性的进入式航天器,进入不同大气密度包括大气密度为零的天体,由于共同的动力学形式和制导目标,统一或通用的制导方法成为可能。本文作者团队20多年积淀的一种高精度强鲁棒的自适应预测校正制导方法,已应用于多个航天重大工程,也支持了多个应用场景的研究,理论和实践证明是一种统一或通用的制导方法[7-8]。本文给出了该方法的设计步骤,可极大提升航天器制导方法的设计效率。
航天器进入有大气的行星过程中主要受到行星引力和气动力的作用,利用航天器倾侧角或者倾侧角加攻角可以控制航天器的进入轨迹。在进入无大气的星体过程中,利用发动机进行制动减速,实现精确着陆。航天器进入制导方法对其能否在指定的地点着落或完成特定的任务至关重要。
设计航天器进入制导律时,动力学运动学方程是必须满足的强制要求,为保证进入过程航天器结构和防热的安全,需要满足动压、过载、热流等过程约束。为保证着陆安全或搜救要求,对航天器的着陆点也有精度要求。为满足上述要求,除需要事先进行轨道设计和实际飞行中通过轨道控制保证外,大气飞行中需要在线调整航天器的倾侧角或者联合调整倾侧角、攻角,控制航天器落点并满足过程中动压、过载、热流等约束。由于倾侧角和攻角存在幅值和角速率约束,显著增加了制导律的设计难度。不同飞行任务和不同飞行阶段,终端状态约束有所不同。载人飞船再入返回,对开伞点的高度、速度和航程有约束;大升阻比航天器再入返回,通常分为初期再入段、末端能量管理段以及进场着陆段。初期再入段和末端能量管理段交接点,一般以马赫数为交接班条件,同时对高度和航程有很强的约束;末端能量管理段与进场着陆段交接点,以高度为条件,同时对位置、速度、倾角、方位角等有很强的约束。机场跑道自动着陆终点处对航天器的高度、速度、下沉率和航程有较高的约束。航天器实施天对地打击任务时,对航天器的航迹倾角、速度和落点经纬度要求都很高。
在上述约束条件下,航天器进入制导问题本质上为多约束问题,如何设计制导律在有限的制导能力下,使多种终端约束和过程约束都得到满足是一个国际上公认的难题。比如,航天器初期再入段过程中,利用航天器的倾侧角和攻角调整控制飞行轨迹,只有较少的制导量却需要使高度、速度、航迹倾角和航程4种终端约束都得到满足,本质上为一种欠驱动问题。针对倾侧角和攻角约束,尤其是大升阻比航天器再入过程中,需要利用倾侧角的翻转改变航天器横向轨迹,因为自身升阻比较大,需要设计合理的横向翻转逻辑,否则会使航天器翻转过于频繁,倾侧角的角速率约束无法实现快速的翻转,将严重影响横向制导精度。另外,如果存在较大的参数不确定性和状态偏差,航天器到达能力边界时,尤其是飞行阶段后期,倾侧角和攻角约束对制导精度也有很大的影响。
航天器的气动设计不可能与实际情况一致,航天器进入大气过程中的烧蚀也不可能与地面设计完全一样,导致航天器的实际气动力系数与标称数据不可避免地存在差别。航天器进入过程中,行星的大气密度也与标称数据存在差别,尤其是执行深空探测任务时,行星的大气先验数据比较少。上述两个因素都会带来较大的参数不确定。另外,航天器在离轨时,进入点状态与标称状态也可能存在差别,尤其是应急返回,进入点的变化更大。上述因素都要求制导方法对参数和进入点初始状态的不确定有较强的鲁棒性和自适应性,才能保证航天器能够以较高的精度到达期望的终端点。
随着空间任务的增多,为了提升发射效率,要求航天器能够重复使用,因此对航天器进入过程中动压、过载以及热流的满足性要求越来越高。另外,天对地打击时,需要避开特定的飞行区域,这些过程约束都给进入制导方法的设计带来很大的难度。
目前航天器进入制导方法主要分为跟踪标称轨迹的制导方法、预测校正制导方法以及二者融合的制导方法。跟踪标称轨迹的制导方法又细分为跟踪离线生成的标称轨迹制导方法和跟踪在线规划轨迹的制导方法。
跟踪标称轨迹的制导方法是应用比较早的方法,其要求航天器在进入过程中跟踪离线或者在线规划好的标称轨迹[9]。离线规划的标称轨迹,可以根据工程经验设计得到,也可以根据约束条件利用轨迹规划方法规划好,然后预先装订几条标称轨迹在机载计算机中。在线标称轨迹可以利用航天器离轨之前的一段时间,即离轨制动后的惯性飞行过渡段,结合机载导航系统的实际飞行数据规划出标称轨迹;或者实际进入过程中利用在线轨迹规划算法计算出标称轨迹。但由于机载计算机的处理能力限制以及算法自身的收敛性、可靠性问题,做到实时在线轨迹规划存在较大的工程实现难度。在线轨迹规划算法可以充分利用离轨前的轨道和姿态信息,因此较离线规划的标称轨迹,可以显著减小进入点的初始偏差[10]。如果对轨迹规划的某些性能指标有最优性要求,则需要优化出最优飞行轨迹;如果对性能没有最优性要求,则只需快速规划出可行的轨迹即可。因此,轨迹规划可以分为最优轨迹规划和可行轨迹规划。标称轨迹优化方法可分为间接法和直接法。间接法的核心在于利用变分法和极大值原理,将最优轨迹规划问题转化成两点边值问题,因为间接法存在初始猜测问题,以及打靶求解过程中运算量很大的积分运算,算法的实时性和可靠性无法保证。直接法通过高斯伪谱方法、直接配点法等参数化航天器的状态量和控制量,将航天器的动力学运动学方程、过程约束等进行离散化处理,状态的过程约束和终端约束直接转化为规划变量的约束,从而将轨迹优化问题转化为利用非线性规划算法求解带有约束的参数优化问题,求解得到每个离散点的控制量和状态变量。直接法对于优化的变量维数比较敏感,需要特定的优化求解器进行求解。在规划出满足各种约束的标称轨迹后,设计制导律对标称轨迹进行跟踪。在航天器实际飞行过程中,由导航系统实时测量出航天器的速度增量和姿态参数,计算得到航天器的位置速度信息。制导律根据测量的实际飞行状态与标称轨迹状态间的偏差生成制导指令,向姿态控制系统发出控制指令,使航天器跟踪规划好的标称轨迹到达终端点。
传统的跟踪标称轨迹的制导方法基于参数不变和初始状态小偏差理论,制导律参数离线迭代设计。如果存在较大的状态偏差,所设计的制导律可能无法使飞行器跟踪上标称轨迹,同时针对大气密度和航天器气动参数的不确定鲁棒性差。即使在线引入参数估计,利用滤波器估计实际飞行中的气动参数等,或者用神经网络的万能逼近能力在线逼近模型偏差进行补偿,也只能部分改善跟踪标称弹道制导方法的鲁棒性[11-12]。
中国神舟一号至神舟十一号飞船,基于20世纪90年代的设计,返回再入制导律采用比例微分型控制器,跟踪高度变化率、过载、航程以及航程变化率等,为应对气动参数的变化,实际飞行过程实时估计返回舱升阻比,并在线补偿。美国的航天飞机采用跟踪阻力加速度制导律,纵向制导根据飞行状态调整阻力加速度剖面以满足要求的航程。阻力加速度剖面有动压、过载和热流过程约束所形成的硬边界,以及平衡滑翔条件形成的软边界,从而保证再入轨迹满足各种过程约束和终端约束。纵向制导根据误差更新阻力加速度参考剖面,逐步减小航程误差。航天飞机反馈增益系数为常值,当存在较大的横程误差时,标称飞行轨迹的跟踪误差较大。基于此,学者们进行了各种各样的改进。Roenneke和Cornwell[13]改变了标称轨迹的形式,用飞行器的飞行状态直接描述参考轨迹,将其中的高度、速度大小、飞行路径角作为跟踪对象。其将线性二次型调节器 (Linear Quadratic Regulator,LQR)线性最优调节器方法引入到标称轨迹的跟踪中,改变了航天飞机跟踪阻力加速度的思路,将再入制导的轨迹跟踪问题转化为标称轨迹状态空间的调节问题,从而可以利用先进的控制方法解决制导问题。另外,Roenneke他将非线性控制方法引入到阻力加速度的跟踪中[14]。Lu[15-16]在前人基础上对控制器进行了改进,将调节器模型从二维纵向平面模型推广到三维线性时变模型,并提出了一种基于逼近滚动时域策略的线性时变系统的闭环稳定预测控制制导方法。Mease等[17]在轨迹规划中考虑了侧向运动,提出了一种基于降阶模型的快速轨迹规划算法,这种算法同时考虑了再入飞行任务对纵程和航程的需求,将二维阻力加速度剖面扩展到三维,是航天飞机纵向阻力加速度制导的直接扩展。同时,针对阻力加速度剖面的跟踪,讨论了攻角和倾侧角协调控制,以及单独采用倾侧角控制的策略。该算法同航天飞机跟踪标称轨迹制导方法一样,基于阻力加速度飞行剖面,可以应用于横程较大的飞行任务。
为了提高航天器跟踪标称轨迹制导方法的自适应性和鲁棒性,国内外学者基本沿着两条途径对其进行改进: 一是研究鲁棒性能好、自适应能力强的跟踪标称轨迹方法;二是研究在线快速规划轨迹算法,利用机载计算机和导航系统的实际飞行数据,在线实时规划出满足终端落点精度以及过程约束的制导指令,尽量减小外部干扰、参数不确定性或者落点任务的改变对制导精度的影响。
针对前者,国内外学者将各种先进的控制方法引入到标称轨迹的跟踪中。比较代表性的有滑模控制方法[18]、直接模型参考自适应控制方法[19]、非线性预测控制算法[20]、动态逆控制方法[21]、最优控制方法[22]、基于降阶观测器的输出反馈鲁棒方法[23]、轨迹线性化控制(TLC)方法[24]等。他们充分利用了先进控制方法的优势,提升了制导方法对参数不确定的鲁棒性。
针对在线轨迹规划算法,Roenneke[25]提出了一种满足纵程要求的最优阻力剖面快速规划算法,该算法基于飞行轨迹上的名义离轨点,可以支持落点的选择和离轨方向的确定,再入阶段能够根据导航数据累计误差更新参考再入弹道数据。Shen和Lu[26]利用拟平衡滑翔条件(QEGC)等将过程约束转化为对制导量的约束,提出了一种满足多约束的轨迹快速在线生成方法,将满足不等式路径约束条件的无穷维优化问题转化为纵向和侧向的一维参数优化问题,通过搜索一维参数得到弹道。该算法利用机载计算机,在2~3 s内就可以规划出一条满足各种约束的可行再入弹道。Saraf和Mease等[27-28]将轨迹规划算法与轨迹跟踪律相结合,得到改进的进入加速度制导律(EAGLE)。EAGLE由2个模块组成,一个是标称轨迹规划函数用来周期性的更新标称轨迹,另外一个是计算侧倾角和攻角指令的跟踪函数。在降阶模型基础上生成阻力和横向加速度剖面,规划出三维轨迹,从而使制导方法能够处理具有较强机动性的再入制导问题。然后基于非线性控制器实现反馈线性化,生成倾侧角和攻角指令,以跟踪参考阻力和航向剖面。该方法通过在线快速重构再入轨迹减小轨迹跟踪误差,因此是一种实时制导方法,具有机上生成参考轨迹的能力,同时考虑了轨迹设计的可行性。李俊和姜振宇[29]针对高超声速飞行器滑翔再入问题,以弧长为自变量,将多种过程约束转为线性约束,经过多种凸处理以及利用割平面的思想处理禁飞区约束,等效地求解了原轨迹规划问题。呼卫军等[30]针对可重复使用运载器(Reusable Launch Vehicle,RLV)的应急返回问题,提出了一种动态伪谱方法,形成动态全局规划问题,能够解决执行机构能力下降以及最终落点变更的应急轨迹规划问题。卢宝刚等[31]利用拟平衡滑翔条件和数值预测策略的优势,设计飞行路径角剖面和攻角剖面分别使航程和速度满足约束,将轨迹规划问题转化为两个参数的搜索问题,规划效率高,适用于大升阻比飞行器在线滑翔轨迹规划。文献[32]提出了一种自适应多元高斯插值在线轨迹规划方法,减轻了机载计算机的负担,可以适用于初始状态有较大偏差的轨迹规划问题,同时提高了横向制导的性能。文献[33]将二阶锥规划思想应用于高度非线性的进入飞行轨迹优化问题中。凸优化在进入段轨迹优化应用中最重要的问题是轨迹优化问题的非线性和非凸性,因此作者重点研究了利用逐次线性化和松弛技术相结合的方法,以一种适合二阶锥规划的方式来表达现实的、高约束的进入轨迹优化问题,使轨迹优化问题得到求解,开辟了进入段轨迹优化问题的新思路。文献[34]针对包含约束的再入轨迹规划问题,提出了利用拟线性化策略进行数值求解的算法。该算法可以在不使用惩罚函数的情况下求解多类有约束的最优控制问题,而且不需要事先对一些求解信息进行猜测。
由此可见,目前在线轨迹规划方法一种思路是寻求性能指标最优,利用伪谱法、凸优化方法等进行优化求解;一种思路是将轨迹规划问题参数化处理后,转化为参数的迭代寻优问题。
各种改进的跟踪离线标称轨迹的制导方法未从根本上解决制导方法对航天器初始进入状态敏感和实际飞行过程中只能在标称轨迹一个较小范围调整飞行轨迹的问题。在线轨迹实时生成方法存在算法实时性难保证,以及算法的收敛性问题,导致其难以在工程上得到实际应用。国内外学者在计算机性能提升基础上,提出了航天器预测校正制导方法。根据预测航天器终端状态方法的不同,预测校正制导方法分为近似解析预测校正方法和数值预测校正方法。由于航天器再入制导问题,没有数学上的解析解,附加若干假设条件下的近似解析解,预测误差可能较大,导致近似解析预测校正制导方法制导误差也较大[35]。数值预测校正制导方法根据校正方式的不同,又可细分为基于迭代的数值预测校正制导方法和自适应数值预测校正制导方法等。预测校正制导方法的本质在于利用航天器的机载计算机,结合导航平台测量的航天器的实时运动状态,按照从当前点到终端点的制导指令预测出实际终端点的状态,将其与机载计算机存储的期望终端状态比较得到误差。根据终端状态误差和预测校正控制规律对制导指令进行校正,形成下一时刻的制导规律,从而(逐步)消除航天器的终端状态误差。由于预测校正过程包括了从当前点到终端点的轨迹预测,过程中的最大动压、最大过载、峰值热流以及地面投影轨迹都可得到,当预测的相关约束将不满足或达到临界情况下,采取提前修正制导指令严格控制预测的相关约束满足任务要求。因此预测校正制导方法从本质上比跟踪标称弹道的制导方法更容易处理过程约束问题。
预测校正制导方法不依赖于标称轨迹,只需要根据终端状态误差校正制导指令,并结合动压、过载等过程约束条件和倾侧角攻角等执行能力约束,得到实际的制导指令[36]。其也不存在小偏差理论的假设,可以在一个较大的范围内对飞行轨迹进行调整,因此预测校正制导方法的自适应性和鲁棒性都较强。预测校正方法需要预测实际的终端点状态,为了保证制导算法的精度,预测的精度直接关乎最终的制导精度,在设计制导律的时候需要重点解决以下几个问题:① 设计合理的初始制导剖面,根据飞行阶段的特性进行制导变量的参数化处理,从而使制导剖面更加符合物理意义,同时减小校正制导的压力;② 进入过程是有限时间内的制导问题,需要校正算法的收敛性和实时性较好;③ 对航天器进入过程中多种过程约束、终端约束的满足性,制导律设计时需充分考虑过程约束,保证航天器的飞行安全;另外制导算法需要保证在有限的制导能力下使多种终端状态约束都能得到满足。
在20世纪计算机能力有限的情况下,为了保证算法的实时性,采用解析预测的制导算法。例如阿波罗飞船利用简化的近似解析表达式进行轨迹预测,航天飞机采用分段解析的形式进行轨迹预测。Chapman和Moonan[37]总结了航天器不同飞行阶段的动力学特性和飞行特点,给出了不同飞行阶段的航程近似表达式,然后进行快速的航程预测,根据航程偏差迭代更新制导量。解析预测方法存在较多的近似策略,导致其通用性差,在发射之前为了保证实际飞行的制导精度,需要进行大量的设计工作。针对长航程的进入航天器来说,整个进入过程动态范围变化较大,一般很难得到解析解,分段近似导致算法的精度较差,不能满足航天器越来越高的制导精度需求[38]。
随着20世纪末期计算机水平的快速发展,国内外学者提出采用数值递推动力学和运动学方程的形式,预测航天器的终端状态,预测精度和算法的适应性都得到很大的提升,数值预测校正制导方法也取得了很大的进展[38-44]。Fuhry[45]为轨道航天器设计了一种自适应预测校正再入制导律,其通过设计制导量的偏导数,然后迭代求解得到倾侧角指令和唯一的倾侧角翻转时间指令。结果验证其在在大扰动条件下仍具有良好的性能,表明了预测校正制导方法具备较强的鲁棒性和灵活性的事实。预测校正制导算法也被应用到可重复使用运载器制导问题中,大升阻比航天器具有类似于飞机的外形,具备更强的制导能力,利用预测校正制导算法同时调整航天器的攻角、倾侧角以及倾侧角反转次数使航天器在满足过程约束条件的情况下实现多种终端约束的满足[46]。
进入21世纪后,数值预测校正进入制导方法也进入了快速发展的时期。针对小升阻比航天器的进入问题,文献[47]给出了2种数值预测校正进入制导算法。第1种算法是找到一条从当前位置到终端点的完整三维进入轨迹,通过得到倾侧角翻转前一时刻的一个固定的常值倾侧角,倾侧角翻转的开始时间点,以及倾侧角翻转之后的一个线性的倾侧角剖面来实现航天器的进入制导。第2种算法通过确定一个倾侧角幅值剖面,找到可行的纵向轨迹,然后采用基于漏斗边界的横向制导逻辑,控制倾侧角的翻转。上述2种算法使预测校正算法在进入制导中得到应用,Lu重点研究了倾侧角剖面的参数化方式,对预测校正制导方法的发展起到了重要的作用。倾侧角剖面的形式选择具有一定的经验性,在校正倾侧角指令的时候已经固定了倾侧角特定的形式,某些程度上降低了算法的灵活性。Brunner和Lu[48]针对小升阻比的月球返回跳跃式再入航天器,提出了一种轨迹规划和闭环制导相结合的数值预测校正方法,将轨迹规划问题转化为非线性单变量寻根问题。当侦测到剩余航程较短不需要跳跃式再入时,算法也可以自动生成直接式再入轨迹。水尊师等[49]将最优规划思想和预测校正制导方法相结合,提出了一种基于高斯伪谱方法的最优预测校正制导方法,充分利用了二者的各自优势,不需要积分弹道,提升了算法效率。Lu[50]在之前工作的基础上,对预测校正制导方法进行总结,提出了统一的进入制导方法,使预测校正制导方法在多种飞行器中都得到应用,同时引入了高度变化率的反馈,解决了大升阻比航天器可能存在的长周期震荡问题,并在预测校正制导方法中给出多种不等式形式的过程约束的处理。张洪波和曾亮[51]提出了一种跳跃式返回再入的预测校正制导方法,创新性的提出了基于嵌套式积分算法的航程快速预报方法,以及基于有界试位法的倾侧角剖面快速更新算法。同时,其针对参数不确定性的影响,根据实时的导航数据对参数不确定性进行辨识并引入到实时的递推动力学方程中,改善了预测终端状态的精度。张钊和胡军等[52-53]针对大升阻比航天器的初期再入段制导问题,提出了一种伪四自由度的预测校正制导方法,将航天器的倾侧角翻转过程考虑到预测过程中,更加符合实际的物理意义。王涛等[54]将模糊逻辑控制引入到预测校正制导方法中,在每个制导周期只进行一次数值预测,减轻了计算负担。
由于基于迭代的预测校正制导方法需要在每个制导周期内经过多次迭代得到制导指令,迭代计算对机载计算机提出了很高的要求,而且目前只能通过迭代单一参数保证算法的可靠性,如果迭代多个参数可能导致算法不收敛,这些限制了其在工程上的实际应用。究其原因本质上是没有建立制导量和终端状态误差之间的数学模型,无法快速的根据状态误差得到制导指令。
预测制导的核心是根据预测误差求取制导增量,定义预测误差与制导增量之比为动态控制增益,胡军通过理论分析和实例计算研究发现,动态控制增益是与制导过程时间相关的大范围变化量。胡军将控制增量和预测误差的关系,看成一个时变动态系统的输入与输出,将标称工况下时变动态增益函数的倒数分解为输入变换和输出变换,作用于控制增量和预测误差之间的时变动态系统,得到标称工况下动态增益为1的控制系统。实际飞行中,飞行弹道、控制指令都是非标称的,动力学参数、环境参数也相对标称值变化,上述基于标称轨迹的变换,仍具有重要效果,它使得变换后的系统,时变动态增益的变化范围大幅减小,为预测制导所有具体的设计方法均创造了良好的实现条件。根据标称工况动态增益为1而实际情况动态增益不为1、变化很大且有界的特点,胡军将动态增益变换后输入输出的关系用时变特征模型描述,采用全系数自适应控制的方法解决制导问题,形成自适应预测制导方法。与国内外普遍的迭代搜索方法不同,自适应预测校正制导的每个实时制导周期,可以仅进行一次自适应控制计算,依靠参数辨识和自适应控制的收敛性,保证整个自适应预测校正制导的收敛性。标称工况动态增益变换同样为特征模型的参数辨识和制导算法的收敛性创造了优良的条件。自适应预测校正制导的部分结果最早发表于1998年[39],当时在标称时变动态增益变换后的预测制导模型中采用的是时变系数二阶特征模型[55]。2011年,针对月地轨道跳跃式再入,杨鸣等[56]采用该方法,相对国外预测校正算法获得了更好的数学仿真试验效果,结合工程实际,给出以自适应预测制导为外环(制导周期N·T)、神舟载人飞船标称轨迹自适应纵向和自适应横向制导为内环(制导周期T)的双环自适应制导方案[57]。2014年4月胡军在杨鸣等工作的基础上,在对月地轨道跳跃式再入深入研究与仿真过程中,提出将自适应预测校正制导中标称时变动态增益函数变换后的广义对象输入输出关系,即预测制导模型由时变系数二阶特征模型改为时变系数一阶特征模型[58-59],设计了相应的参数估计和自适应控制方案。相对原来的二阶特征模型,基于一阶特征模型的制导律最大误差包络减小了20%~30%。大量背靠背的仿真研究以及文献[39]直接式再入的回归仿真,一致验证了预测制导应用一阶特征模型相对于应用二阶特征模型,误差最大包络减小了20%以上,至此构成了嫦娥五号飞行试验器返回再入制导方案的主体。为使航天器过载等过程约束得到满足,再入制导方案还包括对过载等过程约束的处理,预测环节可预测得到全程的过程约束信息,引入过载预判和约束峰值控制策略。该方案继续应用于嫦娥五号探测器,推广应用于新一代载人飞船试验船、空间站阶段神舟载人飞船等[57-64]。
自适应预测校正制导方法从控制问题的角度出发,应用基于特征模型的全系数自适应控制方法求出制导修正量与经过输入变换的预测误差之间的反馈关系,系统地解决了进入段制导问题中无具体数学模型描述终端状态误差与制导指令修正值之间关系的难题。同时利用控制理论证明了只要选取合适的制导参数,可以保证制导算法能够在有限步收敛的特性[64-65]。自适应预测校正制导方法避免了基于迭代的数值预测校正制导方法计算量大、收敛性无法保证的问题。图1为自适应预测校正制导方法的原理框图,其关键点在于时变的输入输出变换、全系数自适应控制以及积分器的采用,将当前制导指令的修正值叠加到上一制导周期的指令上,将终端航程误差的消除分布到当前点到终端点的整个飞行过程中,而不是在一个制导周期内就完全消除终端航程误差[39]。
图1 自适应预测校正制导方法
基于自适应预测校正的双环制导方法也是目前成功应用于工程的预测校正制导方法,取得了前所未有的落点制导精度。
为了充分利用多种制导方法的优势,融合的制导方法被提出,可以针对误差大小,实现自主选择制导方法[66]。为了在计算机能力有限情况下,使预测校正制导方法在工程上得到应用,Dukeman[67]在航天器进入大气层前,利用预测校正方法在线快速获得参考飞行轨迹,在实际进入过程中对飞行轨迹进行跟踪。上述融合的制导方法是预测校正制导方法和跟踪标称轨迹制导方法的浅融合,在实际飞行过程中将二者在不同的时间段使用。
胡军团队在自适应预测校正方法基础上提出了自适应双环制导方案,将跟踪标称轨迹的制导方法和预测校正制导方法进行深度融合。该方法以较慢的周期在外环实现对航天器弹道的修正;内环则在较快的周期上执行对外环形成的弹道的跟踪任务, 利用跟踪制导实现弹道的稳定控制, 并提高制导系统对导航偏差的适应性[38]。双环制导方法在制导整个过程中同时利用预测制导方法和标准制导方法。利用了外环的预测校正制导方法对初始状态误差和参数不确定性不敏感的优势,同时利用了内环跟踪标称轨迹制导方法算法简单的优势,使双环制导方法的制导精度更高。图2为双环制导方法的原理图,可以看出外环形成的实时制导指令给跟踪标称飞行轨迹的内环,通过内外环的配合一起消除终端航程误差。
图2 双环制导方法
自适应预测双环制导方法首次成功应用于2014年11月1日中国嫦娥五号飞行试验器月地返回轨道跳跃式再入中,利用双环制导方法,实现最终总的落点误差为509 m,开伞点精度是目前国际上航天器月地返回的最高精度,开启了中国航天器返回落点精度的新篇章[8]。2020年5月8日第2次成功应用于中国新一代载人飞船试验船大椭圆高速再入返回;2020年12月17日成功应用于中国嫦娥五号探测器返回器月地返回轨道跳跃式再入。2014年嫦娥五号飞行试验器和2020年嫦娥五号探测器在国际上实现了真正意义上的高精度的跳跃式再入(特指一次再入后再次跳出大气层外)。美国阿波罗飞船的探月返回过程中,没有实现真正的跳出大气层,只是大气层内的跃升,为半弹道跃升式再入。主要是由于阿波罗飞船制导方法设计中大量的近似拟合以及跟踪标称轨迹制导方法本身的适应性问题,使得所设计的制导方法对长航程的适应能力较弱。因此,阿波罗飞船仅以2 000~3 000 km航程为主,没有实现跳出大气层进入开普勒阶段的轨道。
2014年嫦娥五号飞行试验器、2020年新一代载人飞船试验船、嫦娥五号探测器的采样返回,最终都高精度着陆,表明了自适应预测双环制导方法既适用于高速长航程跳跃式再入返回,也适应于高速短航程直接式再入返回,并使得过载等过程约束满足要求。
表1给出了上述各种航天器进入制导方法的比较。可以看出,跟踪标称轨迹的制导方法在实现上容易,对机载计算机的速度和容量要求都较低,但是算法的制导精度有限,落点制导精度容易受进入点的初始状态误差和参数不确定性的影响。基于迭代的预测校正制导方法可以取得较高的制导精度,但是算法实时性限制了其在工程上的应用。自适应预测校正方法通过建立制导修正量和预测误差之间的模型,利用控制方法得到制导量的修正量,能够实现较高的制导精度,同时算法的计算量小、实时性可得到保证,算法的收敛性也得到了证明[65],是目前唯一在工程上成功应用的数值预测校正制导方法,其具有很好的应用前景。
表1 航天器进入制导方法对比
随着近几年对地打击空天武器的发展,高超声速飞行器要完成突防或对地打击任务时,需要规避地理敏感和躲避危险区域,比如地缘政治因素不允许通过的区域、敌对方反导系统可以拦截的区域等。Jorris和Cobb[68]针对美国空军的全球覆盖概念,为了实现全球打击的任务,提出在高超声速飞行器的轨迹规划中需要考虑规避区的概念。其利用直接求解方法,包括离散化和对偶化策略,并使用伪谱方法和非线性规划得到包含规避区约束的轨迹优化问题的最优解,实现了考虑禁飞区的三维轨迹优化。文献[69]利用触角思想,求解具有多种复杂构型的禁飞区的飞行器轨迹规划问题。和用于机器人路径规划的触角思想不同,传统的解析方法已不再适用,作者采用了数值求解方法。同时,为了减轻计算机的负担,每个制导周期只采用两个触角。该方法不仅适用于圆周形的禁飞区,同样也适用于更加复杂的禁飞区,也不需要禁飞区的先验知识。文献[70]同样利用了触角思想,不同于以往的单禁飞区问题,作者考虑了多禁飞区,提出了基于三触角预测方法的规避策略,同时结合航向角误差限制条件,计算规避策略的优先级实现飞行器多禁飞区的规避。文献[71]提出了一种考虑禁飞区的轨迹优化问题,通过设置离禁飞区域中心有一定距离的路径点,使飞行器飞过设计的路径点实现禁飞区的规避。王青等[72]针对考虑禁飞圆的高超声速飞行器再入问题,将禁飞区约束考虑在偏差走廊设计中,同时为了避免飞行器频繁偏转,当飞行过程中走廊较小时,进行动态补偿,得到了新的走廊,成功规避了禁飞圆。
由此看出,目前针对航天器进入过程中禁飞区的规避问题,一种思路是将禁飞区约束考虑在标称轨迹设计中,在轨迹规划过程中将禁飞区描述成不等式约束,或将其转化为对航向角的约束,采用轨迹规划方法得到考虑约束的可行的飞行轨迹。在轨迹优化的时候,一般需要禁飞区的先验知识,比如禁飞区的形状等。在实际进入过程中,需要设计鲁棒性能好的跟踪制导方法实现轨迹的精确跟踪,才能确保飞行器不进入禁飞区。另一种思路是在侧向制导逻辑中考虑禁飞区约束,控制航向角实现禁飞区的规避。
航天器进入制导方法经过了几十年的发展,算法的鲁棒性、制导精度都有了很大程度的提升。但随着空间任务需求的改变,还存在一些问题:比如载人登月应急救生与非设计轨道返回;大升阻比航天器快速发射的需求要求地面设计工作量不能过大;水平着陆、天对地打击任务等存在较多的终端状态约束;传统的预测校正制导方法只能被动的考虑过程约束,这样一定程度上牺牲了制导能力。上述这些问题都需要寻求新的解决策略。
目前得到成功应用的跟踪标称轨迹的制导方法都是跟踪离线设计好的标称轨迹,在线轨迹规划方法的实时性、可靠性以及可解性难以得到保证,导致目前其在工程上无法得到应用。预测校正制导方法虽能提升算法的灵活性和自适应性,但是存在较大的状态偏差和参数不确定时,如果航天器的制导能力有限,此时会限于能力边界。特别是在飞行阶段后期,导致校正终端状态的能力有限。目前大多数预测校正制导方法都在事先设计的参数化剖面形式基础上校正制导指令,某些程度上限制了制导方法的灵活性。如果将轨迹形式放开,利用轨迹规划方法在飞行器能力范围内规划出可行的飞行轨迹,充分利用飞行器的能力,然后将规划的飞行轨迹提供给预测校正制导方法使用,制导算法将更加的灵活。尤其是随着再入任务越来越复杂,存在落点的改变以及飞行器在多种状态下的应急返回,如果当前的制导策略已经使航天器到达能力边界,此时利用在线轨迹规划方法按照新的条件进行重新规划,打破当前制导策略的制导指令剖面形式,在飞行器的能力范围内找到合理的解,将解传递给预测校正制导方法使用,将大大减轻预测校正制导方法的校正负担。另外,航天器在进入过程中还需满足多种过程约束,如果经过校正后的制导指令不能很好的满足过程约束,将会对制导精度有较大的影响。虽说目前已有学者在预测校正制导方法中考虑多种过程约束,取得了一定的效果,但是如果在预测校正制导方法中引入轨迹规划算法,在轨迹规划中直接考虑过程约束,并且考虑一定的裕度,这样在利用预测校正制导方法时也将降低违反过程约束的风险。比如预测校正制导方法中直接考虑过载约束,一般需要降低飞行器的倾侧角,如果在飞行器飞行末段期间,将以牺牲飞行器的制导精度为代价。如果在轨迹规划中事先对过程约束进行考虑,可以更好的兼顾过程约束的满足性和制导精度二者之间的关系。
将轨迹规划方法引入到预测校正制导方法的设计中,一种策略是离线存储满足各种过程约束和终端约束的多条规划好的标称轨迹,或者在进入行星前的一段时间内,结合导航数据,利用在线轨迹规划算法快速规划出满足各种约束的飞行轨迹。如果将航天器的各种参数不确定性也考虑到飞行轨迹的规划中,在线飞行过程前根据实际的进入状态和气动参数的估计,选择标称轨迹,作为预测校正制导方法的初值,这样能很大程度提升制导算法的精度和灵活性,避免算法限于制导能力边界。另外一种策略是将在线实时轨迹规划算法全程引入到预测校正制导方法中,如果当前的制导策略已经使航天器到达能力边界或者不能很好的满足过程约束时,通过在线快速规划出一条飞行弹道,给预测校正制导方法使用。但是在线轨迹规划算法的使用存在以下几个亟待解决的问题:① 在线轨迹规划的可解性,在进入过程中,飞行状态瞬息万变,怎么合理设置性能指标,保证在线轨迹优化问题有解,这是保证其能工程应用的关键点; ② 在线轨迹规划算法的求解器,目前国内外常用的轨迹优化求解器不能直接在航天器机载计算机上使用,需要开发开源的求解器,对求解器的速度、实时性、天地交互性都提出了很高的要求;③ 在线轨迹规划解的合理性,目前常用的轨迹优化方法为了能够达到最优性能,会在迭代寻优时用尽航天器的制导能力,这样就会导致留给预测校正制导方法调整制导指令的范围很小。如前所述,轨迹优化问题侧重于使某些性能指标最优,而在线轨迹规划需要算法能够快速规划出一条可行的飞行轨迹,需要对最优性和快速性进行折中;以及怎么合理设计制导剖面的优化形式,也是一个值得思考的问题。
根据中国机载计算机和轨迹规划算法的研究进展,结合气动参数偏差和多种约束离线规划出标称轨迹或者利用离轨前的一段时间规划标称轨迹的策略是目前可以优先考虑的一种策略,因为其可以有足够的时间对轨迹进行优化调整,地面人员也可以进行人在回路的控制调整保证算法的可靠性。航天工程必须是高可靠性的,只有制导算法的可靠性足够高,才能真正在工程上得到应用。后期随着在线轨迹规划算法的上述几个问题得到解决,其也将成为我国进入制导的发展方向,将轨迹规划和预测校正制导方法完美的结合起来,充分利用二者的优势,将是一种制导精度高、适用场景广、自适应能力强的进入制导方法[8]。
目前工程应用的预测校正制导方法主要关注航程误差和倾侧角修正量之间的关系,但是针对大升阻比航天器的自动着陆、天对地打击任务中,除了终端航程约束,对航天器的高度、速度、航迹倾角都有很强的约束,但是一般航天器的执行机构比较有限,怎么设计制导方法去解决这种欠驱动问题是亟待解决的。胡军团队[73]在充分分析不同飞行阶段的特性后,采用分阶段定义不同的制导量和制导目标的策略,间接地使多种终端约束条件得到满足。比如自动着陆段利用平衡滑翔条件和关于高度的指数函数,将其分为2个子阶段使终端航程、航迹倾角和速度得到满足。这种策略跟航天器的特性、飞行阶段有很大的关联性,在给出任务后,需要进行特性分析才能设计分段策略,并没有一种统一的形式可遵循。如果能够从本质上寻求多种终端状态和制导指令之间的数学关系,在航天器的可达域内寻找一种考虑多种约束的综合指标,将会极大提升算法的通用性和设计效率,利用轨迹规划方法和预测校正制导方法的结合解决多约束问题也不失为一种发展方向。
以往的小升阻比航天器,其机动能力有限,因此纵横程耦合有限。但是针对大升阻比航天器,自身的大升阻比特性使其机动能力强,如果横程翻转策略设计不合理,就会陷入频繁翻转的问题。另外,气动参数的不确定性对翻转策略也有很大影响。倾侧角翻转过程中需要利用姿态内环跟踪外环的制导指令,在制导方法设计中必须考虑倾侧角和攻角的幅值和速率约束。如何使多种终端约束条件得到满足前提下,还能使制导指令的约束得到满足也是一个很重要的问题。
综上所述,在利用预测校正制导方法的时候,如何很好地融合多种约束条件是不可忽略的问题。
自适应预测校正制导自1998年提出,特别是2014年成功应用于嫦娥五号飞行试验器月地返回轨道跳跃式再入以来,一方面继续扩大实际航天工程应用,2020年5月8日成功应用于新一代载人飞船试验船大椭圆轨道高速再入返回,2020年12月17日成功应用于携带月壤的嫦娥五号探测器返回器月地返回轨道高速跳跃式再入返回,空间站阶段神舟载人飞船再入返回方案也将更新换代为自适应预测双环制导。另一方面,胡军及其团队继续扩展应用研究的领域,从有实际应用的载人飞船直接式再入[39]和第二宇宙速度的跳跃式再入[38,57-62],扩展到大升阻比航天器的初期再入段[74]、末端能量管理段[7]和进场自动着陆段[73]、火星进入[65]、火星大气捕获[75],高超声速航天器的上升段[36]和返回段中。将动力学方程中的大气密度设置为零,则自适应预测校正制导方法毫无疑问可以应用到航天器进入无大气的星球中,研究了月球软着陆过程中为了实现位置、速度矢量同时满足终端精度,结合速度误差补偿策略的自适应预测校正制导方法,并取得了很好的制导效果。不管是实际航天工程中2014年的嫦娥五号实验飞行器、2020年5月的新飞船再入以及2020年12月的嫦娥五号采样返回等工程验证,还是多种进入场景的数学仿真应用,都取得了很好的最终制导精度。
不管航天器升阻比如何,其进入有大气的动力学和运动学形式是一样的,只是制导量之间存在差异。进入无大气的行星,结合自适应预测校正制导方法的特性,建立制导指令和制导目标之间的特征模型,自适应预测校正制导方法仍然适用。针对上升段制导、应急返回、火箭回收也是同样的道理。因此,自适应预测校正制导方法完全可以作为一种通用的制导算法。
不同的升阻比航天器和飞行任务可以经过以下几个通用步骤设计制导算法:① 根据任务需求,选取动力学运动学方程的自变量,比如以速度或者能量为自变量,能够间接地使某些终端约束条件得到满足;同时选取方便制导律设计的动力学运动学方程形式;② 结合不同的飞行阶段特性对制导变量进行参数化,比如分段常值、分段线性、以及自变量的指数函数形式等,生成自适应预测校正制导方法的初值;③ 根据制导目标,计算出单调性较好的时变动态增益曲线;④ 利用时变动态增益曲线进行实际制导系统的输入输出变换;⑤ 在线辨识特征模型的参数,实时求取制导量的修正量,通过增量式制导算法叠加到上一制导周期的指令上。以上几个步骤是必须的,在实际制导律设计过程中,还需要针对同一个航天器的不同飞行阶段或者不同升阻比航天器,进行一些细节的差异化处理。
上述步骤表明自适应预测制导方法是一种构造性方法,是一种极易推广的方法。对非常复杂的任务需求,例如非设计轨道再入返回、初始运动状态大范围变化的载人航天应急救生落区-过载控制,采用本文称为“增强型自适应预测制导”的方法,即一次性进行的非实时的在线轨迹规划与实时的在线自适应预测制导相结合的方法,是很有发展前景的在线解决复杂任务需求的通用制导方法。
本文在分析了航天器进入制导问题的建立和难点基础上,对国内外主流的进入制导方法进行了归纳总结,总结了各种方法的优缺点。然后介绍了目前中国工程应用制导精度很高的自适应预测校正制导方法,并介绍了其不同的应用领域。最后,总结了目前制导方法设计中亟待解决的一些问题,给出了航天器制导方法的发展方向,并概括了统一制导方法的概念,为中国后续航天器制导方法的研究指出了方向。