徐西宝,白成超,陈宇燊,唐浩楠
(1. 哈尔滨工业大学航天学院,哈尔滨 150001; 2. 北京宇航系统工程研究所,北京 100076)
人类探索深空的脚步从未停止,通过七十多年的不懈努力和奋斗,航天技术得到了快速发展,正逐步揭开其神秘的面纱。从早期的人造卫星到空间站建立,从月球探测到火星探测,再从小行星探测到土星/木星探测,无论是探测深度还是对象的尺度,其范围都在逐步扩大。另一角度来看,探测目标也逐渐多元化,不再是简单的到达,拍摄,亦或是登陆,更多的是体现对科学本质的探索,如地外水资源的发现和证明,地外大气的演化以及地外生命的寻找等,甚至是建立地外基地,进行原位资源开采及利用。这些都说明了开展深空探测研究,是人类认识自我、认识未知宇宙,同时又服务于自身的必要途径。
目前针对地外天体探测任务,主要还是集中在月球和火星,其中月球作为离地球最近的地外天体,从古至今都一直是大家关注的焦点,随着阿波罗计划等多个探月任务的成功实施,人类历史上实现了多个第一,第一次登上月球、第一次采样返回、第一次看到月球背面、第一次发现月球有永久阴影区等[1-2]。而火星作为人类可能最宜移居的星球,也吸引了多个机构的研究热情,但受制于其距离地球较远,探测难度较大,目前还只是有少数国家具备探测能力,且基本上所有着陆火星的巡视器均为美国研制,例如勇气号、机遇好、好奇号等,同样也实现了多个第一,第一次看见火星的地质地貌、第一次了解火星大气、第一次长途巡视、第一次探测到火震等[3-4]。随着探测任务的推进,势必对月球及火星有更深入的了解和发现,到时候距离地外建设基地、构建星际网络的期望就会更近一步。
但在实现对月球及火星的精确、安全探测过程中,仍有很多的技术及工程难题需要攻克,作为一个大系统工程,涉及多个子系统、多个环节、多个学科的交叉,以及多个团队之间的协同,故难度大、约束多、可靠性要求高是需要直接面对的挑战。这其中,作为对地外开展探测活动至关重要的一环,即软着陆,其决定了整个探测任务的成败,故开展精确鲁棒的软着陆制导技术研究是关键。
基于上述分析,本文将针对月球及火星探测任务及软着陆制导技术的发展历程进行整理和总结。首先分别对过往的探测任务进行回顾,分析在任务层面的变化;其次对软着陆过程进行定义,并对软着陆制导技术体系进行梳理;最后给出软着陆制导技术的发展趋势及关键问题。
针对月球探测,各国的基本探测路线大体是“探”、“登”、“驻”。“探”是通过飞越、环绕对月球的环境特征进行初步探测,了解月面特征等信息,为后续探测做准备;“登”是在“探”的基础上进行硬着陆和软着陆实验,实现月球登陆;“驻”是在月球建立基地,并基于月球资源进行原位利用[5]。
通过对目前月球探测任务的梳理,如图1所示,按时间可以将探测阶段分为三期[6]:
1)第一阶段1959~1976
第一阶段主要参与者是美国和苏联,为夺取竞争空间优势,二者均进行了大量的月球探测,掀起了第一次月球探测高峰。期间共进行了121次与月球相关的发射探测活动。通过对月球的在轨探测和巡视探测,获得了大量高价值科学数据,如地质地貌,成分分析等,把人类对月球、地球和太阳系的认识提到了新的高度,并带动了一系列新技术的创新,航天技术的成果民用化极大的改进了人们的生活,月球探测取得了划时代的成就。
2)第二阶段1976~1994
受冷战缓和影响,美国和苏联对于探月热情逐渐降低,所以该阶段是月球探测的宁静期。这一期间,苏联和美国主要是对第一阶段的探测活动进行总结,对部分探测任务失败和效率低的原因进行了分析,探索和提出了更好的探测思路和方案。这一阶段也是对第一阶段探测资料消化的阶段,通过将相关技术推广和民用化,将月球探测的成果转化为丰厚的经济效益。除此之外,世界各国将新的研究点逐渐向空间往返运输能力建设以及复杂环境高鲁棒性能的探测装备研制转变。
3)第三阶段1994~至今
经过第二阶段的积累和总结,随着空间技术逐渐成熟,在空间应用和空间科学任务及空间军事活动发展的需求的推动下,开启了新一轮的月球探测。与第一次探测高潮注重发展空间技术不同,地外资源与能源的勘察、采集及利用是其主要目标,因为有价值的资源是发展的基础支撑,不仅可以补充地球上日益减少的资源储备,而且人类的探索必然逐步走向更深的宇宙空间,而月球上的这些资源可以为未来的深空探测提供保障。
相比于月球探测,由于距离地球更远,大气环境更复杂,火星探测难度更大,同时因其为距地球最近的行星,以及与地球相似的轨道,火星备受关注,也被认为是最有可能、最有条件载人登陆的行星[7]。回顾往年的探测历程,人类对火星的探索从未停止,从冷战开始,美国和苏联就开始了对火星的探索,希望通过对火星构成、地貌和大气等环境特征的探测,提高对火星的了解并寻找地外生命。但是由于技术上的不足以及任务的复杂性,大多数探测均宣告失败。直到后续技术的积累,以美国为代表的探火任务取得了历史性突破,例如“勇气号”“机遇号”“好奇号”,以及即将开展的Mars2020和ExoMars等,正逐步向人类展示火星的真实一面,并逐一解答例如是否有水、是否有生命、是否适合人类居住等多个疑惑。通过对火星探测的发展历程进行分析,如图2所示,可以得到如下启示:
1)火星探测是未来行星探测的重点:各国的行星探测任务的首选目标都是火星,然后在其基础上,再开展更遥远的深空探测计划。同时各航天大国均制订了长远而明确的火星探测任务,未来20多年大多数火星探测窗口均有发射计划,2022~2024公布的火星探测任务就有四次。
2)火星探测与月球探测技术互补:从探测路线来看,火星和月球的探索过程都经历了飞越、环绕、着陆、采样返回这四个阶段,这符合技术发展由易到难循序渐进的规律;从技术角度来看,火星和月球探测采用的大多数技术都是相通和类似的,技术发展的内在规律也类似,因此火星和月球探测的技术之间可以相互转化利用。
3)火星探测注重“技术和科学”双轮驱动:基于科学目标牵引,推动技术革新;技术积累成熟,开展科学研究。即第一阶段解决技术问题,即实现远距离和长时间的探索;第二阶段开展科学研究,在第一阶段的基础上,开展更多有价值的科学探索。
由于月球没有大气,通常所说的月球软着陆即为其动力下降阶段。当探测器到达近月点后,着陆器发动机点火制动,开始动力下降。针对不同的月球软着陆任务,会设计不同的软着陆动力下降段以适应任务的需求,一般的阶段划分为减速制动段、接近段以及最终下降段。
减速制动段持续过程从近月点(通常15 km高度)开始,到离月球表面1~2 km处,软着陆燃料大部分在此段消耗,因为其主要任务是抵消初始轨道速度和重力加速度带来的速度,故减速制动段以燃料最优为主要指标。
接近段从月球表面1~2 km开始一直到着陆点上方约30 m高度处,此过程中将要消除干扰及偏差,对危险障碍进行精确识别,最后实现对安全着陆区的选址及定位。着陆器的接近段开始的时候需要调整着陆器的姿态以使传感器保持足够的视野,在下降过程中应当满足相应的姿态角约束和高度角约束以及终端状态约束。同时在避障时,着陆点重定位需考虑着陆器燃料消耗等约束,因此接近段以满足约束条件为主要指标。
最终下降段一般是垂直下降段,为了实现平稳着陆,着陆器将以低速匀速缓慢下降,因此在最终下降段以控制稳定性为主要指标。
由于有大气的影响,传统火星着陆过程一般分为 3个阶段:进入段、下降段和最终着陆段[8]。
进入段主要指探测器从接近段进入火星大气到降落伞打开的过程。火星着陆器在与轨道器分离之后,将会调整到一个特定的姿轨状态开始在大气层外的自由巡航。当其高度接近火星大气层高度时(约125 km),开始大气再入。在此过程中,需要不断调整姿态以获得合适的侧倾角和攻角来调节侧向力和升力,降低轨迹误差,直到满足降落伞展开条件。
下降段主要是指超音速伞降阶段,即从着陆器降落伞打开到降落伞脱离结束。当着陆器经过大气减速后,降落伞在抛掉整流罩之后开始展开,当到达距离火星表面约2~5 km时抛掉降落伞,开始最终着陆过程。
最终着陆段一般是指动力下降段和着陆缓冲段(包含动力反推缓冲)。动力下降过程将主要完成安全着陆区定位,消除偏差,以及避障和重规划。在下降到一定高度时(30~200 m),火星车被释放,并通过一定的缓冲措施最终着陆。
在制导过程中,制导系统不断确定飞行器与目标或预定轨道之间的相对位置关系,并将制导信息发送给飞行器控制系统进行飞行控制。目前对月球软着陆制导方法[9]的研究可以归纳为五类:建立月球垂线法、重力转弯制导法、标称轨迹制导方法、显式制导方法和智能学习方法。火星软着陆动力下降段制导方法[10]大致可以分为三类:标称轨迹制导方法、显式制导方法和智能学习方法。在实现软着陆的任务中,制导控制算法需要满足以下要求[11]:燃耗最优或次优性,鲁棒性,自主性,实时性以及避障性能。
建立月球垂线法的基本原理是着陆器以大于0的相对速度进入月球影响球,将以月球为焦点的做双曲线运动。在到达制动点之前,调整探测器的姿态和速度,使其与月面基本垂直,推力方向尽可能与速度方向重合反向并指向月心,满足着陆初始条件后,保持垂直姿态实施软着陆。这时的制导过程基本是一种开环的方式。
这种方法需要预先选定着陆点,然后计算给出着陆方案,如果着陆过程中发生突发情况,比如发现预定区域存在障碍不适合降落,也无法重新规划,探测任务就会失败,因此这种方法在没有高精度地图的情况下应用比较有限。此外这种方法对入轨精度和中途轨道修正精度要求较高,给制导控制系统的设计带来困难,随着深空探测任务越来越复杂,这种方法的应用越来越局限。
重力转弯制导方法的主要原理是控制发动机的推力方向,使其与着陆器的速度方向重合反向,利用发动机推力减速,在发动机推力和月球引力的作用下,逐渐将探测器在月面水平方向的速度减到零,速度逐渐指向月心,实现月球的垂直软着陆。这种方法采取半开环半闭环的方式,在主制动段时主要目标是降低着陆器速度,采取开环制导方式,当着陆器与月面距离缩短到一定范围时,将敏感器的测量信息引入反馈控制器,进行闭环制导,尽可能提高着陆的精度性和平稳性。
关于重力转弯制导方法的研究主要存在于早期的无人月球着陆任务中:Citron等[12]同时对推力的大小和方向进行调节,对重力转弯着陆过程进行改进,实现定点软着陆;Mcinnes等[13]设计了非线性反馈制导控制律;文献[14]结合极大值原理,设计了重力转弯开关制导律,能实现燃料最优。
标称轨迹制导方法由开环离线轨迹规划和闭环在线轨迹控制两部分组成,着陆器在着陆前需要离线规划一条优化过的着陆飞行轨迹,着陆过程中按照该轨迹着陆,不断测量着陆器的位置速度与规划的轨迹之间的偏差,控制着陆器按规划的方案飞行完成着陆。
4.3.1着陆轨迹优化
着陆轨迹优化问题的求解可以通过解析法和数值法两种方法实现。解析法先建立关于系统状态的状态方程和最优条件,然后利用经典最优控制论求解,得到最优控制量及状态量的表达式,通过这种方法可以获得最优解的解析形式,但当系统复杂度高时,呈现强非线性,该类方法对解的最优性无法保障。而数值法则利用一定的插值逼近方法,将连续系统离散化,将其最优控制问题转化为有限维参数优化问题,通过数值解法,得到一系列最优轨迹的标称点,从而得到最优解的数值形式。相比于解析法,数值法更易于在强非线性环境下的应用,也是目前研究的主流方向,分为轨迹优化问题转化和参数优化问题求解两个阶段[15]。
数值法中轨迹优化问题的转化方法可以分为直接法和间接法[15]。直接法包括直接打靶法、配点法、微分包含法等,第一步采用参数化方法将连续空间最优控制问题的求解转化为非线性规划问题,再利用数值方法求解转化后的非线性规划问题,由此获得最优轨迹。间接法包括各种伪谱方法,其基本思想是利用Pontryagin极大值原理,将最优控制问题转化为哈密顿边值问题(HBVP)。
利用上述的转化方法,轨迹优化问题就转化成了相应的参数优化问题,对参数优化问题求解即可得到优化轨迹。目前,对于参数优化问题的求解算法主要分为精确算法、现代启示算法以及混合算法三类。精确算法包括梯度下降法、内点法、罚函数方法、动态规划法、QP以及SQP等;现代启示算法包括GA、群智能算法、模拟退火算法及神经网络算法等;而混合优化算法将以上精确算法和现代启示算法中的几种参数化算法相结合以取长补短。
4.3.2着陆轨迹跟踪制导律
着陆轨迹跟踪的目标是对离线着陆轨迹优化得到的轨迹进行在线跟踪,控制着陆器使其位置和速度与设定轨迹保持一致,实现近似最优的软着陆。实际着陆过程中位置和速度与设定轨迹一致性越好,实际轨迹的最优性也更好,因此应设计合适的跟踪制导律,使着陆器尽快到达预定轨迹并沿轨迹运动至目标点。
常用的标称跟踪的制导控制律有:多项式制导律、线性反馈制导律、非线性反馈制导律、H∞控制反馈制导律、滑模控制反馈制导律等。文献[15]利用极大值原理给出了着陆轨迹最优性推导,同时基于人工神经网络设计了闭环形式的制导律。Liaw等[16]利用滑模边界层法,设计了能够对着陆标称轨迹进行跟踪三维制导律;Liu等[17]基于H∞控制方法设计了鲁棒性和抗干扰性较好的H∞控制反馈制导律;Li等[18]基于反步法设计了自适应跟踪制导律,该跟踪律能实现在线的故障诊断容错控制。
4.3.3其它变体
除上述方法外,当实际轨迹和标称轨迹之间的偏差较小时,标称轨迹制导可扩展为摄动制导,摄动制导通过线性化,在标称轨迹附近将轨道约束函数一阶泰勒展开,然后利用线性化的结果求解控制量,线性化后的计算量大大减少且准确性也未降低。此外,也有学者利用曲线插值技术来生成轨迹,如文献[19]利用样条插值方法综合全弧段数据来数值逼近有效的落月轨迹。
显式制导方法又称预测/校正制导方法,其核心是利用控制泛函的显函数形式进行闭环制导解算。通常建立数学模型时需要对软着陆模型进行简化,得到软着陆最优控制问题的解析表达式。常见的显式制导律有迭代制导律、动力显式制导律和燃耗次优制导律等。
迭代制导方式最早应用于土星IB和土星V的飞行上[20]。迭代制导方案根据飞行器速度、位置、纵向加速度和重力加速度的状态以及期望的截止条件计算转向指令;使用飞行器更新后状态在每个制导周期中更新制导命令。迭代制导方案是一种路径自适应制导方案,因为它在所有可能的飞行器扰动类型和程度下保持其优化性能,而不会损失精度。航天飞机的制导方案是动力显式制导方法的成功应用的实例。Mchenry等[21]推导出了满足大范围机动约束的显式制导方程和由制导解产生姿态转向误差的转向方程,以及导航方程和由冗余测量值确定故障仪表的方程;Guo等[22]基于平坦地形及定量重力加速度假设,提出了一种基于Pontryagin极大值原理的相似的多项式制导律;Lu等[23]开发了一种单基线预测校正算法,该算法可应用于不同推力的着陆器。
一般情况下,GNC系统从动力下降段开始探测器根据传器得到实时状态和终端状态进行解算,具有完全的自主性。显式制导具有对抗大干扰的能力,制导末端精度几乎不受干扰影响,具有一定的鲁棒性。但是为满足实时性要求,对搭载的GNC计算机有较快的运算速度和稳定的性能。由于最优控制问题数学建模时存在大量的假设和扰动偏差,因此显式制导律的燃料消耗是次优的。
深度学习是一类新兴的多层神经网络学习算法[24]。深度强化学习具备较强的高维感知能力和具有策略性的决策能力,是一种端到端的优化学习方法,为解决类似航天器这样的复杂非线性系统的软着陆问题提供了思路。
近两年,Carlos等[25]在假设状态信息完备的情况下,对训练深度人工神经网络来表示精确着陆过程中的最优控制过程进行了详细的研究,他们的系统能够处理大量可能的初始状态,同时仍能产生最优响应;Furfaro等[26]提出了一种基于深度学习的自主登月方法,这种方法可以用于状态估计而不需要滤波器;此外,还提出了一种深度递归神经网络结构,从行星动力下降阶段的状态序列预测最优燃料推力并利用长、短期记忆网络对增加的网络信息进行跟踪,从而提高了输出估计的精度[27]。Gaudet等[28]提出了一种基于深度强化学习的行星动力下降制导方法,该方法采用了策略梯度法来生成精确且省油的轨迹。文献[29]提出了一种基于经典ZEM-ZEV的自适应反馈制导算法,使用深度强化学习来克服其局限性。文献[30]提出了一种基于递归策略和价值函数逼近器的增强元学习自适应导引系统,该系统集成了制导和导航功能。
相较于传统方法而言,深度强化学习具有全局搜索最优性。训练好的智能体运行速度非常快,具有非常好的实时性。此外,在GNC方面也有一定的优越性,例如动力学无缝衔接且无约束,不需要状态反馈、控制约束易处理等。然而,并不是每一次训练都能够让智能体损失函数收敛,并且训练好的智能体在仿真测试过程中也有可能出现失误,这在工程上是不被允许的。此外,如何能让智能体在真实环境下表现得和仿真环境一样好也是目前亟待解决的问题。
在软着陆制导问题中,受发射能力及有效载荷质量限制,携带的燃料是有限的,常以燃料最省为优化指标进行求解。同时考虑到着陆器的动力学模型和机动能力边界,需要在着陆轨迹优化的过程中考虑多种必要的状态约束和路径约束,其中包括推力约束,姿态约束,起始状态约束,终端状态约束,以及在复杂的地形环境下着陆还需要考虑障碍约束。而包含大量约束的最优控制问题一般存在严重的非线性和非凸形,求解起来十分困难且容易陷入局部最优,因此在建立最优控制问题模型的阶段均对原始任务进行不同程度的线性化或凸化[31]。常用于软着陆的约束优化方法有:二阶锥优化、连续线性化等。
近年来,可变推力大小发动机的工程研究取得了一定的突破,同时各大工程倾向于在最终着陆段引入自主避障技术,因此障碍约束的处理方法和包含推力大小约束及障碍约束的制导方法对于提高探测器的避障能力至关重要。Acikmese等[32]提出了将非凸优化问题进行凸化转化的思想,解决了以发动机推力幅值的上下界作为约束条件的燃耗最优问题。在此基础上,Blackmore等[33]的研究已经扩展到寻找最小的着陆误差轨迹的燃耗最优问题;Harris等[34]提出了一种处理半连续控制约束的方法,用于寻找一类混合整数非凸问题的全局最优解。Shen等[35]将灵敏度补偿因子应用于燃耗最优着陆问题,得到了一种考虑不确定性和扰动的最优控制方法。Lu等[36]提出了一种优化燃料和保证足够的制导裕度增强型阿波罗动力下降制导方法,该方法能适应多种任务。Cui等[37]提出了凸轨迹可以通过一种新型的和解析的轨迹曲率制导方法来构建;Bai等[38]提出了利用非凸函数对障碍物进行合并,将这些非凸障碍约束转化为凸障碍约束的线性化方法。
如图3所示,从技术的发展变化可以总结出软着陆制导技术的发展趋势呈现三个阶段,也说明了随着通用技术体系的发展,如人工智能等,对制导方法的性能优化与更新起到了关键作用。下面对每一个阶段做简要总结:
1)人为智能:固定轨迹制导
早期深空着陆任务着陆区相对平坦,其制导方法相对简单,计算量小,如月球垂线法和重力转弯法都是提前生成软着陆轨迹。该类方法最大特点是简单实用,但所规划的轨道不是能量最优轨道,故常用于早期探测任务,以及对着陆精度要求不高的探测任务。
2)机器智能:基于优化制导
随着最优控制和优化理论的发展以及搭载计算机性能的提升,轨迹优化逐渐成为制导技术的热门选择。对于离线设计的轨迹一般而言是最优的,但是这样的方法灵活性较差,自主能力和避障能力都是有限的,不适用于环境复杂的着陆任务。显式制导方法在线更新飞行的轨迹,有一定的自主性和较强的避障能力。
近年来,随着路径规划技术的兴起,RRT、PRM等基于采样理论的算法得到了快速发展。该类方法能够快速、有效地搜索高维空间,适用于复杂或动态环境下多自由度智能体路径规划求解。将基于采样的方法融入制导体系对提高探测器的实时性,进一步降低算法计算量有着巨大的潜力。
3)人工智能:基于学习制导
基于优化的设计思路,其设计较为复杂,计算量大,对着陆器动力学及扰动建模精度要求较高,目前在线求解还很少应用。而强化学习技术的出现,给出了一个全新的软着陆制导技术研究方向,既可以利用基于模型的强化学习方法来完成参数训练,也可以仅基于数据实现着陆策略的学习,这将大大提高算法的通用性及鲁棒性。当然目前基于学习的制导策略还存在其自身的问题,比如黑盒操作模式,不可解释性等,这对于后续的任务应用提出了很大的挑战。但是随着有稳定性保障的深度强化学习研究的不断深入,相信这会是未来的研究趋势。
此外,制导方案的选择很大程度上取决于着陆要求、任务目标和规划方案的不同。而一个任务往往是由若干个子任务组成,故可以根据子问题进行具体分析,通过选择不同的性能指标及约束定义运用到不同的子任务当中,最终实现整体任务的成功实现。
通过对上述三个阶段发展的本质可以看出,智能化与制导技术的融合是未来的前沿,势必会带动更多的研究热情,逐渐向着具备通用性、可解释性、以及自主学习能力的智能软着陆技术发展。与此同时,人类对于月球以及火星的探测目标已发生了转变,更多的任务将集中在复杂极区着陆,甚至是探索从未到达过的永久阴影区,其任务难度之大,对精确软着陆技术提出了更为严苛的要求。综上分析,对于月球及火星软着陆的发展,其趋势总结如下:
1)算法轻量化,规划实时化:从算法的复杂性发展过程可以看出,制导控制算法有着从简单到复杂再到精炼的发展趋势。早期深空探测任务受到星载计算机计算能力的限制,只能使用计算量小的制导算法尽量满足着陆任务的需求,着陆过程甚至存在内存溢出这样的风险。随着计算机技术的发展,复杂性更高、性能更加优越的算法得以在实际工程中运用。未来的着陆任务为了满足实时规划避障的需求,必然需要更加轻量化的制导控制算法。
2)方案多样化,技术通用化:随着探测任务的增加,以及探测目标的复杂化,势必会涉及到不同约束下的精确着陆问题。极区的复杂山地,黑暗的永久阴影区和常规的平坦区域都会对应不同的制导方案。加之对月球及火星开展探测活动的机构越来越多,可以预见软着陆制导控制方案将越来越多元化。方案多样化为不同的着陆任务提供了丰富的选择,同时,多样的方案能够凸显某些技术的共性,为技术的通用化打下了基础,使得技术和任务的关系从一对一逐渐向一对多和多对多发展。
3)平台智能化,环境自适应:着陆器作为开展地外探测任务的主体,对整个任务是非常重要的一环,精准的着陆会给后续任务带来能量、时间、安全等全方位的支撑。随着技术的发展,以及器件、处理能力的提升,其自主化程度显著提升,可以预见随着人工智能技术与航天的深入融合,必然将引导着陆器向完全智能化发展。同时随着智能化程度的变化,不仅会增加对着陆环境的检测精度及效率,同时会提升在线的解算及决策能力,结合之前多样化的制导方案,通过不断的学习,可以预见软着陆能力逐渐向环境自适应发展。
现有的软着陆技术在精度、稳定性、鲁棒性等方面都存在不足,无法满足未来密集、复杂探测任务新的能力要求。很难为后续月球/火星定点采样返回,月面/火星表面大范围巡视,地外基地建设,以及原位资源利用等任务提供有效保障,故基于上述回顾及分析,下面从三个层面浅析面临的挑战。
1)技术层关键问题
技术急需迭代创新,智能学习有望突破。传统的给定轨道及优化思想实现的软着陆制导,很大程度上依赖于先验知识,比如模型、约束、环境等,缺乏对不同任务设计的通用性,同时容易受建模偏差、不确定扰动等因素影响,且相当一部分基于优化的方法难以在线使用。而随着深度强化学习的兴起,给智能化着陆制导提供了新的思路,可以从数据的角度去摆脱对模型的依赖,通过端到端的设计去简化考虑扰动带来的影响,完全依靠神经网络实现学习,但因其黑盒的操作模式,存在着强不可解释性,无法保证运行的可靠和收敛;同时,对于训练数据的获取,以及如何实现在有限数据样本或者差异数据样本条件下的鲁棒学习等等都是值得后续研究的关键。综上,如何让传统制导方法高效化、轻量化、通用化,以及如何让学习制导方法可解释、可证明、可泛化是技术层亟待解决的难题。
2)系统层关键问题
系统急需综合优化,一体化设计势在必行。软着陆的成功与否,精度是否满足要求,除了算法本身的性能,同时与导航、控制、结构等多个环境存在耦合关联,准确的导航信息获取、可靠的控制指令执行都是决定成败的关键。目前系统之间多采取模块化设计,通过接口来实现互联,即使有提出一体化设计思路,但是在工程实践方面还是很难完全保证,而对于之间的关联还未有深入研究,什么类型的感知信息是最适合当前任务制导解算的,生成何种形式的制导指令是控制系统最佳的输入,可否通过给定任务实现从选型到技术实现的自适应设计,从系统本身更有研究的价值。综上,如何实现软/硬件灵活设计、感知/制导/控制/通信一体化融合设计是系统层需要考虑的难题。
3)任务层关键问题
任务趋于定制化,组件模块化、流程标准化的泛化设计尤为重要。除了已经开展的月球、火星软着陆任务,后续还将会拓展到其它地外天体,环境的差异(大气、密度分布、光照、辐射等)、干扰源的不同都会提出新的挑战;同时,面对未来大密度开展的月球开发任务,比如复杂月背、极区、永久阴影区等未知区域的探测,对快速障碍检测、自适应自主避障等方面都有由严格的要求;再者,高昂的任务成本,难以接受不灵活的设计方案,更加看重方案的通用性。综上,如何基于任务出发,实现适应多种环境、约束条件下的成本可控、通用化、标准化的软着陆制导系统是任务层考虑的关键。
本文对月球及火星探测任务进行了回顾,分别整理了到目前已经开展或即将开展的任务序列表,并就其任务发展的趋势及变化进行了分析。同时,针对探测过程中关键的软着陆过程进行了阐述,并总结整理了目前软着陆制导技术的发展体系,最后着重分析了该技术的发展趋势,以及制约其发展的关键问题。通过本文的梳理,意在为后续的探测发展以及学术研究提供可行的参考。