人工智能在航天器制导与控制中的应用综述

2021-07-05 13:44黄旭星李爽杨彬孙盼刘学文刘新彦

航空学报 2021年4期

黄旭星，李爽,*，杨彬，孙盼，刘学文，刘新彦

1.南京航空航天大学航天学院，南京 210016

2.北京控制工程研究所，北京 100190

随着计算机硬件性能的突破和高效算法的不断发展，近年来以机器学习为代表的新一代人工智能技术在众多领域的应用都取得了极大的进展。与传统技术相比，人工智能技术在精度、效率、实时性和预测性等方面拥有明显的优势，在高新技术领域特别是航天领域发挥越来越重要的作用，是引领未来的战略性技术。美国国防高级研究计划局(DARPA)2019年在《航空周刊(Aviation week)》刊文推广人工智能技术在航空航天领域的认同和应用[1]。欧空局将于近期发射国际上首颗人工智能技术验证卫星PhiLab，该卫星利用人工智能技术对地面观测图像进行预处理，提高图像数据下传效率[2]。国务院于2017年发布了《新一代人工智能发展规划》，首次将人工智能技术的发展提高到国家战略层面，要求到2025年在国防建设领域得到广泛应用并达到世界领先水平。

人工智能技术在航天领域主要应用于环境未知或者局部信息未知的高动态环境中，根据实时感知信息进行推理并执行合理操作，最大限度地提高任务的满意度。目前各航天大国都高度重视空间人工智能技术的研发，并已在深空探测、在轨操控、编队飞行、空间碎片清除等方向取得多项研究成果[3-8]。这些航天任务对航天器的姿轨控精度有较高的需求，表明高精度的轨迹姿态控制技术是未来航天任务的关键技术之一。航天器的制导与控制属于经典的闭环控制过程，包括测量、规划、控制、执行以及健康管理等一系列环节[8]。规划环节根据航天任务需求规划航天器任务轨迹并生成相应的控制指令，控制环节根据这些指令输出控制信号并由执行环节中的执行机构实施控制，测量环节利用传感器监测实时状态并反馈至规划和控制环节，而健康管理环节则对航天器星上姿轨控系统的运行状态进行实时监测。完整的姿轨闭环控制流程如图1所示[9]。

图1 姿轨闭环控制流程图[9]Fig.1 Closed-loop control diagram of attitude and orbit[9]

传统制导控制技术已在实际工程任务中获得良好的控制效果，可保证一定精度的轨迹和姿态控制。然而，面向未来航天任务制导控制，系统的实时、鲁棒和高精度需求，现有技术仍存在诸多缺陷和挑战。一方面，随着航天任务越来越复杂，空间环境与航天器动力学模型的强非线性以及参数的不确定性对精确控制的影响愈发严重[10-12]。目前难以离线建立高精度的动力学模型，利用传统技术难以在不确定非线性环境中实现高精度的制导和控制。另一方面，航天任务对星上姿轨控系统的可靠性存在较高要求。姿轨控系统的传感器和机构故障可能直接导致任务的失败[13]。航天器需要具备实时故障诊断以及部分机构故障情况下正常进行制导与控制的能力。为提高航天器制导与控制性能，国内外专家学者在传统控制架构下引入人工智能技术，提高航天器制导与控制的精度和效率，保证系统可靠性[3-4,6-7,14-15]。通过引入人工智能技术，对动力学系统进行逼近，实现智能轨迹姿态控制，提高航天器在不确定非线性环境影响下的轨迹规划制导和姿态跟踪控制精度，并在机构故障情况下仍可实现高精度的控制效果[10]。

本文对目前人工智能技术在航天器轨迹规划和姿态控制中的研究和应用进行归纳和分析，总结适用于未来航天任务的智能姿轨控关键技术，为人工智能技术在航天器轨迹规划和姿态控制中的研究提出发展建议。首先，针对当前航天任务的现状，分析航天器姿轨控技术的需求；然后，针对模型不确定性以及姿轨控系统故障影响下的智能控制，分别介绍人工智能技术在姿轨控中的研究和应用现状，梳理人工智能技术在航天器轨迹姿态控制中的关键技术，分析当前针对智能姿轨控的研究和应用所面临的挑战；最后，总结未来人工智能姿轨控技术的发展趋势，并提出相应的发展建议。

1 不确定非线性模型智能姿轨控研究现状

传统轨迹制导与姿态控制方法利用非线性规划算法进行轨迹规划制导，然后利用PID控制、滑模控制或自适应控制等技术实现高精度的姿态跟踪[16]。然而，未来航天任务中各类非线性和不确定性因素的影响愈发显著：① 随着任务的开展，燃料的大量消耗以及航天器载荷位置、状态发生变化，会导致卫星质量、质心位置等发生变化，该动力学模型为时变的强非线性模型；② 航天器搭载难以精确建模的挠性结构(例如天线、太阳能电池阵、太阳帆等)，通过简化模型进行近似与真实动力学模型间存在较大误差[11]；③ 空间环境中存在一些难以提前获知并精确建模的摄动，如天体附近引力场模型、磁场环境、天体大气、表面环境等[12]，目前缺乏高精度的数据以及建模方法建立高保真度的动力学模型。常用的鲁棒轨迹制导以及自适应控制技术难以基于不确定非线性模型实现高精度的轨迹规划制导和姿态跟踪控制。因此，近年来多项研究基于人工智能技术开展智能轨迹规划和姿态控制研究，提高轨迹制导和姿态跟踪的精度。这些智能制导与控制技术通过在传统姿轨控架构中引入人工智能技术，直接取代或与传统技术结合，生成相应的控制指令以及控制信号，其示意图如图2所示。利用人工智能技术逼近不确定非线性动力学模型，学习最优轨迹规划和姿态控制策略，建立智能最优制导和控制算法，根据任务需求求解动力学模型，输出最优控制时间以及机动策略，提高制导与控制精度和实时性。经过多年研究，目前已形成应用于轨迹制导的智能规划技术以及应用于姿态控制的智能自适应控制技术[17-18]。

图2 智能制导与控制示意图Fig.2 Diagram of intelligent guidance and control

1.1 轨迹智能规划制导技术

智能轨迹规划制导技术可对任务轨迹进行离线或在线的智能规划，然后根据实时的控制误差对轨迹进行在线的智能重规划，对航天器未来一段时间内的运行轨迹进行预测并输出相应的控制指令。其中，人工智能技术根据任务需求以及航天器状态，直接生成或配合常用规划技术生成航天器的控制指令，这些指令包括航天器的发动机开关机以及姿态机动的指令。根据这些控制指令制定相应的控制指令，使航天器的运行状态满足航天任务需求。

当前智能轨迹规划制导技术研究主要集中在3个方面，分别为航天器转移轨迹智能规划，航天器进入、下降和着陆(Entry, Descent and Landing, EDL)智能轨迹制导以及巡视器轨迹制导等。接下来总结介绍人工智能技术在这3个领域的研究和应用现状。

1.1.1 转移轨迹智能规划技术

对于转移轨迹的智能制导，最先开展离线智能规划技术的研究。Izzo等[3-4]综述了人工智能技术在航天器转移轨迹规划方面的研究现状，提出自适应轨迹制导技术为未来航天任务的重要技术。Reiter等[19]针对空间对抗问题，基于强化学习技术建立脉冲机动优化策略，提高规避机动的可靠性。而随着小推力系统的发展，更多研究聚焦于小推力转移轨迹的智能规划。Zhu和Luo[20]基于分类深度神经网络和回归深度神经网络提出小推力转移轨迹快速评估方法，用于判断轨迹的可行性以及燃耗最优性。李海洋和宝音贺西[21]先利用不同的特征组合进行机器学习，对燃料最优小推力轨迹转移的燃耗进行估计；然后利用训练神经网络学习具备多圈性、长时间性特征的时间最优小推力抬升轨迹[22]；并基于深度神经网络实现时间以及燃料最优小推力轨迹的快速、精确估计[23]。这些成果降低了多目标转移轨迹任务的初始设计难度，可为未来深空探测任务轨道设计提供参考。Sullivan和Bosanac[24]针对多体系统转移轨迹优化问题，基于深度强化学习技术完成时间最优小推力转移轨迹的优化，获得小推力控制策略。此外，针对太阳帆等姿轨耦合推进系统，Song和Gong[25]利用深层神经网络建立轨道特征映射与转移时间之间的映射，实现太阳帆航天器时间最优转移轨迹的规划和优化。

对于深空探测任务，为提高深空探测器的自主性，目前已发展多项在线智能规划技术，使其具备实时的星上轨迹规划能力。Li等[26]对深空转移轨迹规划技术的研究现状进行了总结，并分析了利用人工智能技术对转移轨迹进行优化的可行性。研究表明人工智能技术对于解决小推力轨迹优化问题有较大潜力。Witsberger和Longuski[27]基于递归神经网络建立小推力引力辅助转移轨迹规划方法，利用进化算法辅助神经网络的训练，实现星上在线轨迹规划。Cheng等[28]通过设计多尺度深度神经网络合作策略，建立太阳帆航天器转移轨迹的时间最优在线优化方法，同时解决了该网络对较小输入值识别困难的问题。Miller和Linares[29]针对逆行轨道间的轨迹转移问题，基于强化学习技术设计近端策略优化算法求解最优小推力转移轨迹。相比于传统规划方法，这些智能技术更能满足实时性以及可用性的两方面需求。

此外，针对动力学模型中存在不确定性的问题，目前研究主要根据航天器实时状态对转移轨迹进行重规划，通过智能自适应制导提高航天器轨迹转移精度。Bataleblu和Roshanian[30]针对空间发射系统(Space Launch System, SLS)鲁棒上升轨迹的优化问题，结合拉丁超立方抽样以及神经网络建立随机优化模型，对SLS的鲁棒轨迹进行优化，提高SLS的可靠性、安全性。考虑到不确定性可通过在线识别的方式进行识别，多项研究利用不依赖模型的强化学习技术对模型参数进行自适应调整，提高轨迹规划制导的精度和鲁棒性[31]。王晓辉和李爽[32]采用模糊神经网络对不确定性就进行分类和评估，然后利用分层任务网络对转移轨迹进行规划和修复，提高了智能规划的可靠性和灵活性。LaFarge等[33]研究平动点转移轨迹的闭环制导方法，利用强化学习技术逼近动力学模型，减少星载计算机负担。Arora和Dutta[34]针对小推力轨迹抬升问题，利用强化神经网络实现轨迹的在线自适应调整，提高控制精度。这些研究表明强化学习技术可通过在线识别方式减少不确定性对轨迹鲁棒性和精度的影响。

1.1.2 进入、下降和着陆智能制导技术

航天器EDL过程中动力学模型存在极大不确定性，可根据测量信息对EDL轨迹进行在线智能制导，提高规划的精度和鲁棒性。Furfaro等[35]以及Cheng等[36]针对月面自主着陆问题，分别利用深度递归神经网络架构以及迭代深度强化学习算法对燃料最优轨迹进行规划，提高进入制导精度。Furfaro和Linares[37]还基于强化学习技术对月面下降路径点进行规划，提高着陆精度。由于火星表面存在参数不完备的稀薄大气，对精确EDL轨迹制导带来更大的挑战。Li和Jiang[38]针对未来火星EDL任务总结了自适应制导技术的发展趋势，并分析人工智能技术的应用潜力。Zheng等[39]基于神经网络发展火星进入轨迹的实时制导方法，相比传统方法提高了轨迹制导精度。Li等[40-41]则利用径向基(RBF)神经网络对不确定性进行在线逼近，再利用二阶滑模控制提高标称轨迹的跟踪效果，实现火星大气进入的鲁棒制导。Sánchez-Sánchez和Izzo[42]基于深度神经网络研究最优状态反馈问题，为行星实时最优制导着陆问题提供参考。该研究同时表明浅层网络难以拟合复杂动力学模型。此外，与EDL任务类似，Johnson等[43]针对可重复使用运载火箭的上升制导问题，基于伪控制对冲方法的神经网络提出了模型参考自适应控制器架构，该架构可同时适应力和力矩模型的误差。陈书钊等[44]以及Nie等[45]也针对火箭的控制技术开展了研究，分别提出状态预测神经网络控制算法以及动态神经网络自适应控制器，实现控制器参数的自适应调整以及火箭上升和下降的自适应制导控制，并具备良好的鲁棒性和泛用性。

针对EDL过程中的参数不确定性，多项研究通过在线识别的方式提高轨迹的鲁棒性。Gaudet和Furfaro[46]基于深度强化学习技术设计了智能制导控制算法，提高航天器对噪声及系统不确定性的鲁棒性。此外，Gaudet等[47]还利用强化学习技术建立自适应在线制导算法，满足EDL任务实时性要求，实现燃耗最优的鲁棒轨迹精确制导。Jiang等[48]通过整合火星再入与动力下降过程，利用自适应伪谱法同时进行最优再入与动力下降制导，并利用强化学习技术进行制导过程的切换，提高了轨迹制导的最优性、鲁棒性和精度。以上研究表明强化学习技术也适用于考虑不确定性干扰的EDL轨迹制导规划任务。

1.1.3 巡视器轨迹智能规划技术

巡视探测作为深空探测的重要方式，其轨迹的智能制导技术也是当前研究热点之一。Leitner等[49]通过设计全反应神经控制器，首次尝试在机器人任务中利用神经网络直接控制执行器和持续时间来优化位置和时间。针对选定的交会对接任务情形、给定的初始位置和边界条件，利用神经控制器重现最优控制。Lan等[50]基于自适应动态规划方法，利用动作神经网络和批评神经网络研究机器人的自主制导控制方法，使其实现目标跟踪、同步和避障等多重功能。通过调整神经网络的权值，获得基于神经网络的最优智能制导律。

综上，目前基于人工智能技术的航天器轨迹规划制导研究主要利用深度神经网络对动力学环境中的强非线性进行识别和近似，并通过在线学习对参数不确定性进行在线识别。这些研究可归纳为2个主要的研究方向：① 强非线性和不确定性影响下鲁棒轨迹的快速规划研究；② 不确定性影响下轨迹自适应制导研究。

1.2 姿态智能自适应控制技术

智能自适应控制技术通过对控制参数进行自适应调整，获得比传统控制技术更好的姿态跟踪效果。智能控制技术根据控制指令以及航天器状态，输出执行机构所需的控制信号，这些信号包括姿轨控的轨控发动机和反应控制器(RCS)的开关机信号以及姿态机动的控制力矩陀螺的控制信号。人工智能技术的引入实现了对动力学模型不确定性的识别和逼近，提高了姿态跟踪控制的精度以及鲁棒性。

Murugesan[51]首先结合传统自适应控制技术以及专家系统得到实时智能姿控架构。专家系统在实时约束下进行推理和决策，自适应调整控制参数，提高航天器姿态稳定性。

随着以机器学习为代表的人工智能技术的发展，Gates等[52]针对存在不确定性的柔性卫星姿态控制问题，通过在线学习对前馈神经网络进行训练，构建稳定的控制序列使振动最小化，实现姿态自适应控制，最终达到完全稳定。在此基础上，Hu和Xiao[53]同时还考虑外部干扰以及输入饱和问题，结合PD控制及RBF神经网络建立智能姿态控制器，提高姿态控制过程中航天器的稳定性。Cheng和Shu[54]利用深度神经网络控制器代替传统PID则控制器，实现对卫星姿态的自适应跟踪。同时，他们还利用遗传算法对深度神经网络的节点权值进行优化，以减少训练时间。以上研究表明，人工智能技术可通过结合或替代传统姿态控制技术的方式提高姿态控制精度和鲁棒性。

与轨迹智能规划类似，由于参数不确定性难以离线建模，因此多项研究基于强化学习技术对不确定性进行在线识别逼近，实现智能自适应姿态控制，提高姿态跟踪控制精度[55]。Berenji等[56]利用神经网络及可微分的隶属度函数构造模糊逻辑控制架构，实现航天飞机的自适应姿态控制。该架构可通过调整隶属度函数自动适应新的控制要求，从而拓展该架构的适用范围，实现在模糊规则下航天飞机的姿态鲁棒控制。Schram等[55]与Van Buijtenen等[57]分别基于强化学习技术发展自适应姿态控制架构。这些控制架构利用评估单元估计姿态控制的效果并预测未来的控制性能，对控制系统的参数进行调整和更新，实现姿态自适应跟踪控制。Huang等[58]则利用深度神经网络对具有不确定性的参数进行估计，建立自适应鲁棒控制器进行姿态控制。该研究利用李雅普诺夫理论证明控制器的稳定性，保证航天器在不确定性和外部干扰下的姿态跟踪精度。针对多约束分布式航天器的轨道和姿态协同控制问题，Li等[59]利用自适应神经网络逼近系统的不确定性，再利用积分李雅普诺夫函数建立反馈控制器，也基于李雅普诺夫理论证明了分布式航天器姿态协同跟踪的稳定性。而Ma等[60]则针对非合作目标抓捕时组合体姿态的稳定问题，利用强化学习技术对组合体的参数进行在线识别，实现卫星姿态的重新稳定。该方法可获得比传统PD控制更高的姿态稳定性。以上研究表明强化学习技术对不确定性干扰下的航天器姿态自适应控制具有一定的普适性。

综上，深度神经网络的应用可实现非线性动力学模型的近似，而强化学习技术可对控制器参数进行在线调整，提高星上姿态跟踪控制的稳定性和鲁棒性。这些技术可通过与传统控制器相结合或直接替换的方式提高姿态控制性能，目前暂无研究对比分析这两种方式的优劣。

1.3 不确定非线性模型智能姿轨控关键技术

1.3.1 鲁棒轨迹在线快速规划技术

由于航天任务越来越复杂，空间环境与航天器自身动力学模型存在强非线性以及参数不确定性，航天器需要具备鲁棒轨迹的快速在线规划能力。深度学习技术可对强非线性模型进行高精度的逼近。基于深度学习技术对不确定性进行量化，建立智能不确定非线性动力学模型；同时对最优轨迹规划策略进行学习和训练，提高轨迹规划的鲁棒性和最优性。此外，训练后的深度学习算法为解析形式，可实现星上运行，有效提高航天器轨迹的在线规划效率，实现高精度鲁棒轨迹的快速规划，满足航天任务需求。

1.3.2 在线自适应制导与控制技术

为了保证高精度的轨迹和姿态控制，航天器的轨迹制导和姿态控制技术需要在不确定性干扰下具备自适应轨迹规划和姿态跟踪能力。目前基于自适应规划和控制算法的控制难以在卫星结构、模型和外部环境存在动态不确定的条件下实现高精度的轨迹和姿态控制，影响航天器轨迹和姿态的控制精度。而深度神经网络技术不依赖固有模型，具备良好的泛化能力，可对强非线性环境实现较好的逼近效果。此外，强化学习可对动态环境中的不确定性进行在线识别，通过反馈控制对控制输出进行实时调整，以实现高精度的智能自适应姿态控制，获得更好的轨迹和姿态跟踪效果。

2 机构故障下智能姿轨控研究现状

在实际工程任务中，姿轨控系统的测量机构和执行机构使用频率较高，容易发生故障[61]。测量机构通常由于长时间工作导致敏感器故障[62]。而执行机构故障则往往因为元件磨损和老化等导致发动机和反作用飞轮存在输出误差[63]。在实际任务中大部分故障无法提前预知，可能会在短时间内造成探测器姿态丢失，进而导致任务失败[13,64]。传统故障诊断方法依赖遥测数据进行故障检测和识别，辅助地面操作人员完成故障诊断。然而，这些方法可检测的机构数量有限，难以满足多模式的诊断；且由于带宽限制，无法显示瞬态信息，不利于早期的故障检测。为提高故障诊断的精度以及效率，多项研究构建基于人工智能技术的智能故障诊断系统。这些智能故障诊断系统的结构如图3所示，通过在健康管理环节中加入人工智能技术，实现可靠快速故障诊断，降低地面监控的依赖，满足高精度的姿轨控需求。

此外，为保证姿轨控系统故障时仍可完成轨迹制导和姿态控制，保障航天任务的正常开展，国内外还针对姿轨控系统的容错控制技术进行研究。容错控制技术能够及时、有效地对故障做出响应，确保制导与控制的稳定性，同时将系统的性能保持在可接受范围内，使系统具备处理系统不确定性以及外部干扰的能力[65]。传统容错控制技术需要高精度的航天器动力学模型或系统数据[66]。由于强非线性及参数不确定性，难以收集大量高精度的系统数据，无法满足高精度容错控制的需求。因此，国内外研究了基于人工智能技术建立智能容错控制系统，这些系统的结构可归纳如图3所示。通过利用人工智能技术的非线性逼近能力拟合动力学模型，对制导与控制的输出行实时调整，进而实现高精度的智能容错控制，提高姿轨控系统的鲁棒性和控制精度，减少测量和执行机构故障所造成的影响。

图3 智能故障诊断与容错控制流程图Fig.3 Diagram of intelligent fault diagnosis and fault tolerant control

2.1 智能故障诊断技术

航天器姿轨控系统的智能故障诊断技术可在强非线性环境中对航天器的状态进行快速确定，并对预期或意外故障进行快速检测和隔离。通过智能自适应故障调整重构，提高姿轨控系统故障条件下稳定的恢复能力和稳定性。当前研究目标为实现完全自主的智能故障诊断。

其中，专家系统已广泛用于姿轨控系统执行机构的故障诊断，是最早应用于姿轨控系统的人工智能技术，多项成果已被应用于实际工程任务：

1) NASA马歇尔飞行中心开发SPARTA嵌入式专家系统(SEES)对航天飞机主发动机进行故障诊断[67]。SEES使用正向链接策略，根据置信度对发动机状态进行分析，具备识别早期故障以及实施补救行动的能力。

2) NASA开发了动力和姿态控制专家系统(PACES)对跟踪和数据中继卫星的故障进行诊断[68]。该系统基于动力与姿态控制子系统的操作模型，对可替代的构件或冗余层进行诊断，辅助操作人员完成故障诊断任务。

3) NASA艾姆斯研究中心基于高级专家系统开发了智能姿态控制系统(IACS)[69]。该架构可在大不确定性环境中，通过对姿轨控策略以及控制器参数的自调整，实现快速星上自主故障诊断，提高控制效率以及任务可靠性。

4) 美国哈里斯公司开发了故障查找专家系统(FFES)对可替换最低单元的系统进行故障诊断[70]。FFES通过对比当前状态与标称控制规划，推理各元件的故障概率并进行排序，从而实现高精度的故障诊断。

5) NASA基于模型推理方法开发了定性故障诊断系统Livingstone进行故障检测与隔离[71-72]。该系统最早在深空一号(DS-1)上进行验证。改进的第2代系统Livingstone2也在X-37以及Earth Observing One(EO-1)任务中获得成功应用。与第1代系统相比，第2代系统独立于模型，可提高故障状态下系统的恢复能力。

6) 航天器健康推理引擎(SHINE)是由NASA开发的一种多任务、可重复使用的专家系统，实现航天器的健康监测和故障诊断[73]。SHINE可实时使用多种知识用于检测、诊断、仿真以及随机建模并通过启发式、经验知识来快速隔离候选故障，利用更深的随机推理详细分析问题，减少了错误假设。

7) FAITH是Voyager计划期间由JPL开发的诊断专家系统，该系统的重点是监测Voyager航天器的遥测数据[72]。FAITH能够对遥测数据流进行检测，并在必要时发出警报。

在实际工程任务中，动力学环境具有强非线性和不确定性，基于模型的专家系统难以精确诊断故障。为满足不确定非线性环境中姿轨控系统的故障诊断，当前研究基于机器学习技术构建故障诊断系统，提高故障诊断的精度和可靠性。

基于机器学习技术的故障诊断研究最初仅针对单个机构、单一故障模式，用以验证机器学习算法在该领域的可行性。考虑到神经网络具有估计分类以及处理不确定性和参数变化的能力，Wu和Saif[74]利用非线性迭代神经网络PID观测器(INPID)实现航天器执行机构的故障诊断。INPID利用迭代学习保证节点参数更新过程的收敛性，可在不确定性和干扰下对早期故障和意外故障进行高精度鲁棒建模，提高故障诊断过程的鲁棒性。Talebi等[75]则利用故障场景下的非线性模型对系统状态进行表征，基于神经网络设计混合非线性模型(HNM)用于故障检测和隔离。该模型可在无约束状态下保证反作用飞轮故障诊断过程的稳定性。Li等[76]则针对传统系统中的齿轮故障问题，利用深度学习算法进行齿轮的点蚀故障的诊断，并表征故障的后续发展趋势，可有效控制系统的精度和鲁棒性。然而，仅针对单个机构、单一模型进行故障诊断，存在过程冗杂、诊断效率低、实时性低等问题。

为提高航天器姿轨控系统的故障诊断性能，多机构、多模式的故障诊断方法逐渐成为研究焦点。Li等[77]基于Elman递归神经网络(ERNN)对反作用飞轮的故障类型进行判断。该架构对微小故障不敏感，能够在噪声环境中降低误诊率，获得更好的故障检测和隔离效果。部分研究同时考虑了测量机构和执行机构的故障诊断问题。Rauch和Schaechter[78]针对该问题，基于广义回归神经网络(GRNN)建立了神经决策架构。该架构利用故障概率阈值确定系统状态并完成多种故障的检测和重构，辅助健康管理系统实现故障条件下的迅速反应。Talebi等[79]针对传感器和执行机构故障诊断难问题，考虑状态和传感器的不确定性和扰动，利用低轨神经网络进行故障识别，并证明控制系统的稳定性。李新[80]则基于BP神经网络以及小波神经网络构造4种不同结构的自适应鲁棒故障诊断系统，实现了实时的在线检测与诊断。此外，Lin和Ying[81]利用卫星在轨运行的实时数据，结合多元分析以及支持向量机技术建立多敏感器的故障诊断算法，实现不依赖模型的故障诊断，提高卫星的自主性。耿飞龙等[82]基于深度神经网络提出异构陀螺的故障诊断算法，可对多种故障工况进行快速诊断，同时还对深度神经网络的选择策略进行了一定的分析。

对于具有强非线性的动力学系统，单个网络难以同时满足故障诊断的实时性和精确性需求。Huang等[83]利用双层BP神经网络架构分别对反作用飞轮进行故障监测和隔离。其中，第1层网络输出控制系统运行状态。当控制系统出现故障时，进入第2层网络进行故障识别，从而提高故障检测的效率并保证诊断的精确性。

以控制性能退化为代表的缓变故障是未来姿轨控系统更常见的故障类型。为提高对缓变故障的诊断效果，多项研究结合人工智能技术以及模糊逻辑技术，利用模糊理论对故障程度进行描述和识别，提高缓变故障的诊断效果[84]。Pereira等[85]开发了模糊专家系统(FES)辅助ENVISAT卫星的决策支持系统对陀螺仪进行故障诊断。该系统通过集成经验，可对故障的紧急程度和严重程度进行警报和具体描述，实现故障的短期监测和长期预测。Yang等[86]利用自组织模糊神经网络(SFNN)对执行机构故障进行识别。该系统对不确定性和扰动不敏感，可实现鲁棒的故障检测效果，并根据检测结果对控制策略进行重新配置。这些研究表明，模糊逻辑技术可对缓变故障进行有效的检测。

综上可知，对于多机构、多模式的姿轨控系统故障诊断，利用神经网络技术可在强非线性模型下对系统状态进行识别，提高故障诊断过程的稳定性。而模糊逻辑技术对缓变故障有良好的识别效果，将2种技术进行结合可实现瞬变和缓变故障的快速诊断，提高故障诊断过程的鲁棒性。

2.2 智能容错控制技术

当航天器姿轨控系统发生故障时，智能容错控制技术可对轨迹制导和姿态控制的输出进行调整，提高航天器在不确定非线性环境中的鲁棒性，保证高精度的轨迹制导和姿态控制。目前基于智能容错控制研究将姿轨控系统故障视为不确定性，并利用自适应控制技术对故障进行处理，通过航天器运行状态智能自适应调整执行机构的控制信号，提高容错控制的精度和鲁棒性。

Liang等[87]针对飞轮的容错控制问题设计了模糊全局滑模控制架构，抑制系统不确定性和外部干扰。该模糊控制架构属于被动控制器，可用于提高姿态控制的精度和鲁棒性。然而，该控制器只能处理有限的预期故障，可处理类型和容错控制能力有限，保守性较强。

为提高容错控制性能，多项研究通过主动容错控制的方式构建控制器。Panagi和Polycarpou[88]利用线性参数化神经网络(LPNNs)建立自适应分散自适应控制器。LPNNs可对故障条件下的动力学模型进行自适应近似，并结合自适应控制律中的死区修正和自适应边界方法来提高系统的稳定性和鲁棒性。更多研究则基于RBF神经网络研究智能容错控制技术。针对多模式故障以及连续故障的场景，Baldi等[89]基于该网络建立主动容错控制系统。当故障被正确识别后，该系统将会对故障进行补偿，以减少其对卫星姿态的影响，并恢复任务所需的姿态指向，实现鲁棒的姿态跟踪。Chen和Tao[90]则针对具有未知死区和外部不确定扰动的姿态控制系统，基于RBF神经网络建立闭环自适应容错控制器。通过网络对不确定性进行逼近，该系统具有较好的稳定性，可在未知死区、执行机构故障以及未知外部干扰的综合作用下实现高精度的跟踪控制。黄怡欣等[91]针对执行机构故障和不确定性干扰影响下的小行星绕飞航天器姿态鲁棒控制问题，利用自适应迭代学习进行控制器参数整定，实现容错控制。然后利用RBF神经网络对系统非线性部分进行逼近，提高绕飞轨迹的鲁棒性，并通过李雅普诺夫理论分析证明该自适应闭环控制系统的姿态跟踪的稳定性，保证系统动态性能。此外，针对火星再入容错控制问题，Huang等[83]基于结构自适应模型逆的RBF神经网络设计了PID参数整定控制器，在考虑执行机构故障和观测器参数不确定性的情况下，对参考模型和系统输出之间的误差进行自适应调整，保证姿态控制系统的动态性能。该系统可在机构冗余的条件下进行主动容错控制，使航天器恢复故障前的性能，提高再入轨迹的鲁棒性。王若男[92]同时考虑了传感器和执行机构故障，并在模型不确定性和外部干扰的情况下，提出基于神经网络的智能容错控制算法，提高了控制系统的鲁棒性。耿飞龙等[82]针对控制力矩陀螺的多种故障，基于深度神经网络建立自适应容错控制架构，可多个陀螺发生故障的场景下保持高精度的姿态稳定和控制。这些研究表明神经网络技术可在不确定非线性环境以及机构故障的情况下实现高精度的容错控制。

此外，Huo等[93]针对刚性航天器推进系统故障情况下的快速容错控制问题，提出自适应模糊控制技术，实现有限时间约束下的容错控制以及高精度跟踪。该系统通过结合快速非奇异终端滑模面技术(FNTSMS)和容错控制技术，实现对外部干扰、未知惯量矩阵以及推进器故障的非线性近似，提高航天器容错控制性能。而有限时间内的控制收敛能力可保证系统故障和不确定性存在是实现高精度的姿态跟踪。

根据研究可知，不确定非线性动力学环境对航天器姿轨控系统的智能自适应容错控制存在较大影响。深度神经网络可对系统的非线性动力学模型进行建模，并通过在线学习对不确定性进行在线识别，提高自适应容错控制的鲁棒性。

2.3 机构故障下智能姿轨控关键技术

2.3.1 多机构、多模式快速故障诊断技术

为保证航天任务的正常开展，在卫星姿轨控系统发生故障时需要具备在动态不确定的空间环境中快速精确实施故障诊断的能力。未来航天器姿轨控系统的故障诊断问题为多机构、多模式故障诊断问题，由于姿轨控系统机构相互耦合，特定的故障表征可能源于不同的故障机构以及故障模式。因此，当前姿轨控系统对不同场景下的精确地故障诊断以及故障隔离技术有较高的要求。目前的故障诊断算法难以适应这种多机构、多模式的故障诊断，难以实现快速故障检测并精确地隔离故障机构。而模糊逻辑可用于模型未知的复杂非线性系统，对多种模式具有较强的辨识能力和泛化能力，且可用于对缓变故障的诊断。此外，利用双层神经网络分别进行故障检测和故障隔离，可兼顾快速检测和精确隔离的故障诊断需求，与模糊逻辑相结合可获得更好的控制效果。

2.3.2 鲁棒自适应容错控制技术

为保证卫星系统发生故障时，航天任务仍能正常开展，在动态不确定环境中，卫星姿轨控系统需要具备自适应容错控制能力。目前的容错控制技术无法保证在复杂动力学环境下具备鲁棒的容错控制效果。深度学习可用于辨识复杂的非线性系统，在控制系统中具有良好的轨迹规划和姿态跟踪能力。而强化神经网络可对发生故障的系统进行在线的自适应调参，具备良好的容错控制能力，与深度学习相结合可获得良好的自适应容错控制效果。

3 航天器智能规划与控制的发展建议

3.1 航天器智能规划控制发展趋势及挑战

随着空间技术的发展，卫星挠性结构和空间动力学环境都存在强非线性和不确定性，难以精确建模，对高精度的轨迹规划制导、姿态跟踪控制带来影响。此外，姿轨控系统测量和执行机构不可避免发生故障，需要具备故障诊断以及鲁棒的轨迹和姿态容错控制能力。

人工智能技术已被应用于航天器制导和控制的研究当中，利用有限的星上资源在动态不确定环境下实现鲁棒、精确的轨迹规划制导和姿态跟踪控制，部分研究已在工程任务中发挥重要作用。通过在姿轨控系统中引入人工智能技术，在不确定非线性环境中进行高精度和鲁棒的轨迹规划制导以及姿态跟踪控制；在执行机构发生故障时快速精确地进行故障识别和重构，并实现鲁棒的容错控制，从而提高轨迹规划和姿态的控制精度，保障航天任务的正常开展，是未来卫星自主智能轨迹姿态控制的发展趋势。然而，目前人工智能技术在航天器轨迹和姿态控制中的研究及应用受到多方面的制约。

3.1.1 有效训练样本问题

当前以机器学习为代表的人工智能技术具有较强的非线性映射能力，可利用大量的真实数据对算法进行训练，实现对非线性模型的高精度逼近和拟合。然而，航天任务成本高昂，难以开展大量任务获得足够的真实数据用于训练机器学习算法。对于近地任务，虽然航天器在轨时间长且下传数据量大，但标注困难，可用于训练的有效样本较少；对于深空任务，回传地面的数据较少，不足以支持机器学习算法的训练。其中，由于航天器姿轨控系统机构发生故障的概率较低，相关样本少，无法进行训练。此外，通过地面仿真生成的训练样本存在不确定性和误差，基于这些样本训练所得算法难以满足高精度的轨迹和姿态控制的需求。

3.1.2 星载计算能力问题

由智能姿轨控技术的发展趋势可知，在线学习、强化神经网络等技术可根据实时数据对算法参数进行在线调整，提高控制效果，是未来智能姿轨控的核心技术。然而，受制于航天器的质量、体积、能源、功耗、空间环境等因素，星载计算机的计算能力与地面计算机相比存在较大差距。由资料可知，目前最新的S698PM星载计算机主频为600 MHz，运行内存20 Mb[94]，与地面常用计算机的性能存在较大差距，难以运行在线学习、强化神经网络等算法。

3.1.3 人工智能技术最优性问题

航天器执行任何航天任务都需要进行轨迹制导和姿态控制，而人工智能技术可用于几乎所有航天任务当中。考虑到人工智能技术具有专用性，将特定算法用于特定的航天任务，可获得更好的控制结果。然而，当前智能姿轨控技术的研究聚焦于将最新算法和技术应用于轨迹制导和姿态控制，并未考虑特定算法在不同类型航天任务中的最优性，如：具有不同隐含层数量的深度神经网络拥有不同的姿态跟踪精度；在线学习不适用于故障诊断等，可能会出现欠拟合或过拟合的现象。不考虑人工智能技术与航天任务之间的最优性问题难以实现最优控制效果。

3.1.4 工程实践应用问题

由于航天器轨迹制导和姿态控制任务是航天器的关键任务，直接影响航天任务的实施。经过多年的发展，基于经典理论建立的姿轨控技术研究已趋于完善，多项技术已在实际工程任务中得到验证。此外，考虑到航天器的成本较高，为保证航天任务的成功开展，航天器姿轨控所采用的技术具有一定的保守性，新技术的工程实践难度较大。目前在姿轨控中实际应用的人工智能技术仅为专家系统，以机器学习为代表的新一代人工智能技术建立的轨迹和姿态控制系统尚处于理论研究阶段，且理论研究已大幅领先工程实践。部分智能姿轨控技术已从理论上分析其可行性，譬如利用神经网络建立的自适应控制器，通过李雅普诺夫理论证明控制的稳定性，保证系统不确定性和扰动情况下的跟踪精度[58-59,90]。然而，当前研究缺少在实际工程任务中的验证，亟需证明这些技术在工程实践的可行性及其应用价值。

3.2 航天器智能制导与控制技术的发展建议

人工智能技术可有效提高航天器轨迹规划制导和姿态跟踪控制效果。然而，目前存在多方面的因素制约其在航天器姿轨控中的研究和应用。这些制约可总结为：在硬件层面，是星上在线学习的应用与星载计算机算力之间的矛盾；在算法层面，是训练样本数量需求与高精度样本数量之间的矛盾；在效果层面，是人工智能技术的最优性与航天任务的独立性之间的矛盾；在工程层面，是星上姿轨控技术的保守性与人工智能技术的可靠性之间的矛盾。

因此，我们以智能轨迹和姿态控制的关键技术为基础，以智能控制的发展趋势为背景，以应对当前人工智能技术在航天器轨迹姿态控制中的挑战为核心，提出应用于未来航天器智能轨迹和姿态控制的发展建议。

3.2.1 建立人工智能技术空间应用架构

目前，以深度神经网络为代表的新一代人工智能技术主要通过“地面训练、星上应用”的方式构建智能控制系统。该方式对于受模型不确定性影响较低的故障诊断技术是适用的。然而，智能制导、自适应控制以及自适应容错控制等关键技术都需要在星上通过在线学习的方式对模型不确定性进行逼近，当前星载计算机性能难以实现算法的在线训练，影响姿轨控技术的可靠性。因此，在综合考虑航天器资源、性能的基础上，利用传统控制技术构建航天器姿轨控系统。然后，在受模型不确定性影响的环节中引入深度神经网络，构建智能姿轨控架构。通过这种“传统+人工智能技术”的方式可保证系统可靠性、提高轨迹规划制导和姿态跟踪控制精度，是发展智能姿轨控技术的有效模式。而深度神经网络的训练则通过“地面+星上”的方式开展。首先在地面利用高精度动力学模型对如深度神经网络进行训练，使控制器具备一定的跟踪性能。然后选择合适的在线学习算法对神经网络的节点权值进行调整，进一步提高轨迹规划和姿态的跟踪精度，实现不确定性的在线逼近。

3.2.2 基于任务需求分析人工智能技术最优性

针对不同航天任务下的人工智能技术的最优性问题，需要根据任务的输入输出、数据特征等对比各人工智能技术的精度、效率等。为避免出现欠拟合以及过拟合的现象，需针对不同任务选择最优人工智能技术，并对该技术的最优架构进行分析和选择。其中，对于自主智能制导、智能自适应控制以及智能自适应容错控制技术，强化学习深度神经网络技术可对存在不确定性的非线性动力学模型进行拟合。对于多机构、多模式的智能故障诊断技术，需要同时对瞬变故障和缓变故障进行监测和隔离，可结合模糊逻辑和深度神经网络进行故障诊断。另一方面，对于人工智能技术的最优架构问题，深度神经网络的隐含层数量、节点数量和节点间的传递函数以及强化学习的奖励函数也需要进行最优性分析。目前智能制导与控制技术最优架构缺乏相关理论支撑，需要通过仿真对比不同人工智能架构的拟合效果并进行分析，选择最优人工智能技术架构。如针对小推力轨迹制导问题，分别利用具有不同数量隐含层以及节点的深度神经网络对最优机动的时刻及大小进行拟合，通过对比拟合效果获得最优架构[20]。该部分的仿真分析可利用地面仿真系统进行分析研究。

3.2.3 积累任务数据作为样本并标注

针对真实训练样本缺乏的问题，应根据智能姿轨控的需求积累并标注有效样本。对于未来轨迹姿态控制所面临的动力学模型不确定性问题，应充分积累近地以及深空探测任务的真实数据以及高精度仿真所得的数据，将这些数据作为样本构建地面数据库。对于姿轨控系统机构故障问题，可通过地面数值、实物或半实物仿真生成不同执行机构、不同故障模式的故障场景，并对这些场景中各机构的工作状况进行人为标注，将其作为训练样本并进行积累。此外，为获得更多的训练样本，可应用迁移学习技术进行算法的训练。首先，根据大量现有的高精度仿真数据样本对模型进行训练，然后引入数量较少的真实数据样本，利用迁移学习识别样本间的差异，建立新的模型，从而利用更少的样本完成动力学模型以及故障诊断模型的训练。

3.2.4 基于地面仿真测试系统验证人工智能技术

为将人工智能技术实际应用于航天器的轨迹制导和姿态控制，同时考虑人工智能技术的可靠性验证以及工程成本，需要构建高精度的地面仿真测试系统对人工智能技术进行验证。地面仿真测试系统通过实物或半实物仿真，对航天器姿轨控架构进行高精度的模拟。将基于人工智能技术建立的智能姿轨控技术导入仿真系统，将期望的控制效果作为任务输入，利用含随机干扰的高精度模型进行仿真，同时引入随机控制机构故障，记录航天器的轨迹规划和姿态控制效果。通过对比期望的航天器状态与仿真所得状态，完成基于人工智能技术建立的智能姿轨控架构的验证。

其中，为模拟真实航天器状态，模拟姿轨控系统的测量和执行机构都应该采用实物进行仿真，并通过额外的控制输入对执行机构故障进行模拟。而控制器可采用拥有星载计算机相同性能的计算机进行仿真。此外，测量机构经过测量所得的航天器状态可根据数值仿真进行模拟，以减少仿真测试系统构建的难度。

4 总结

当前人工智能技术蓬勃发展，越来越多研究将人工智能技术应用于航天领域。考虑到未来航天任务中航天器动力学模型存在强非线性和参数不确定性以及姿轨控系统的长期运行状态，可基于人工智能技术发展轨迹制导和姿态控制技术，构建智能姿轨控架构，提高轨迹规划制导和姿态跟踪控制的性能，满足未来航天器高精度姿轨控的需求。根据研究现状可知，国内外已针对自主智能姿轨控的各项关键技术开展研究工作，基于专家系统技术建立故障诊断系统已在实际工程任务中得到应用和验证，以机器学习为代表的新一代人工智能技术目前也在研究当中。

然而，样本、算力、最优性以及可靠性等4方面因素制约着新一代人工智能技术在实际工程任务中的应用。为此，可通过“传统架构+人工智能技术”“地面+星上”的方式构建自主智能姿轨控架构，同时针对不同航天任务对人工智能技术的最优性进行分析，利用高精度的仿真数据和真实任务数据对机器学习算法进行训练，然后利用地面仿真系统对自主智能姿轨控技术的性能进行验证。