在轨服务航天器的制导、导航与控制关键技术

2023-10-09 03:33刘付成武海雷曹姝清
中国惯性技术学报 2023年9期
关键词:组合体航天器目标

刘付成,韩 飞,孙 玥,武海雷,曹姝清

(1.上海航天技术研究院,上海 201109;2.上海航天控制技术研究所,上海 201109;3.上海市空间智能控制技术重点实验室,上海 201109)

高价值航天器对国民经济和国家安全发挥日益重大的战略作用,一旦发生不可在轨自主恢复的故障,如:燃料耗尽,电源、控制等分系统故障,会对国家安全带来战略风险,且经济损失巨大,严重限制空间资产的利用效率。对故障航天器实施在轨维修、延寿等任务,可以使其长期发挥业务功能。

由于空间活动日益频繁,空间碎片数量急剧增加,在轨卫星的碰撞风险日益加剧,已发生了多起碎片碰撞导致卫星损毁的事件。2009 年,美国铱星33 与俄罗斯宇宙2251 卫星在轨碰撞,前者被摧毁,产生数千块碎片。2022 年,美国Galaxy 11 同步轨道卫星在轨发生部分解体,产生的碎片对其他卫星构成威胁。同时随着星链等巨型星座的建设,空间碎片环境更加恶化,2019 年,欧航局风神卫星与星链44 险些发生碰撞,2021 年,一网0178 卫星被迫实施了轨道机动以避免与星链1546 碰撞。空间碎片严重威胁我国太空资产安全,对空间碎片实施在轨捕获、清除等任务,可以清理轨道资源、避免碰撞毁伤。

对故障航天器的在轨维修以及对空间碎片的在轨捕获清除,都属于在轨服务范畴。在轨服务是指,在地球轨道上对目标航天器实施提供服务,通过加注燃料、故障检测维修、功能拓展等方式,延长在轨航天器使用寿命,提升其执行任务的能力;或通过刚性或柔性捕获的手段对空间碎片进行清除,维护空间资产安全。

本文首先对在轨服务航天器的发展现状与趋势进行了分析,总结当前研究热点及未来的发展趋势,提出在轨服务的典型核心任务流程及能力需求。其次提出制导、导航与控制方向上的翻滚目标超近立体视觉测量、翻滚目标姿轨耦合逼近路径规划与控制、非合作目标柔顺捕获控制、组合体稳定控制四项关键技术难题,对关键技术的需求及具体内涵进行了阐述,并梳理总结四项关键技术的发展现状及后续发展需求。最后对在轨服务航天器未来发展趋势进行了展望,以期为在轨服务航天器的后续研究提供参考。

1 国内外发展现状与趋势

国外航天大国早在上个世纪就已经开展了多项在轨服务项目的验证。在轨服务任务的发展历程如图1所示。随着在轨服务技术的不断进步,适用目标逐步普适泛化,由合作稳定目标扩展到非合作翻滚目标;操控任务逐渐复杂精细,由最初的远距离接近到近距离伴飞、交会,再到与目标接触的捕获、延寿,后续将逐步开展维修、爬行、组装等任务。此类非合作翻滚目标的在轨服务仍面临众多技术挑战,是未来发展的重点。

图1 在轨服务的发展历程Fig.1 Development of on orbit service

1.1 碎片移除

2018 年9 月,英国萨里航天中心联合欧洲多家研究机构进行了空间碎片捕获实验“Remove Debris”,在轨释放一颗人造目标卫星Cubesat,依次验证了飞网捕获Cubesat 卫星、鱼叉捕获、阻力帆离轨等空间碎片捕获清除任务,完成了针对合作目标的测量与导航(图像下传地面处理)、飞网释放捕获(仅验证了飞网发射展开与目标缠绕捕获,无系绳拖曳机动)技术初步验证,如图2 所示。

图2 Remove Debris 碎片捕获Fig.2 Debris capture of Remove Debris

1.2 任务扩展卫星

2020 年2 月,美国诺斯罗普·格鲁曼公司的任务扩展卫星(Mission Extension Satellite,MEV)MEV-1通过喷管对接捕获了国际通讯卫星Intelsat-901,并接管和控制了其姿态和轨道运动,将其从坟墓轨道带回至地球静止轨道,如图3 所示。2022 年4 月,MEV-2再次成功捕获Intelsat-1002 卫星。MEV 项目完成了针对非合作稳定目标的姿轨耦合逼近跟踪、组合体接管控制等多项在轨服务GNC 技术的在轨验证。

图3 MEV-1 任务过程Fig.3 MEV-1 task process

基于MEV 平台,结合FREND 计划中研制的灵巧机械臂,美国正在研制任务机器人飞行器(Mission Robotic Vehicle,MRV),如图4 所示,主要任务包括故障部位高分辨率检视、帆板辅助解锁展开、安装附加有效载荷等,计划2024 年开展在轨验证,预期验证非合作翻滚目标姿轨耦合逼近跟踪、组合体接管控制以及在轨精细操作控制等技术。

图4 MRV 维修操作Fig.4 MRV maintenance operation

1.3 地球同步轨道卫星机器人服务

2016 年,美国DARPA 启动了“地球同步轨道卫星机器人服务”(Robotic Servicing of Geosynchronous Satellites,RSGS)项目。服务航天器(Robotic Servicing Vehicle,RSV)主要任务包括对目标故障部位的检测,太阳帆板、天线展开故障的维修,捕获后的组合体拖曳离轨,为目标安装有效载荷,如图5 所示。该任务计划2024 年开展在轨验证,预期验证非合作旋转目标的精细操作及组合体拖曳等技术。

图5 RSGS 操控任务过程Fig.5 RSGS task process

2 在轨服务典型核心任务流程

当前在轨服务航天器的任务样式多种多样,但归纳总结,其典型核心任务流程可以概括为:“追”、“看”、“跟””、“抓”、“维”五个基本步骤。

1、追,即为轨道间机动与交会,机动到目标同轨道前方/后方一定距离,形成稳定伴飞。

2、看,包括伴飞、悬停、绕飞观测,全方位观测目标,确定目标运动状态、可捕获部位等。

3、跟,是指姿轨同步逼近与跟踪,机动到预定捕获位置,维持捕获所需相对姿态、位置状态。

4、抓,是指目标捕获与稳定,通过飞网、机械臂、仿生黏附各种捕获装置,建立服务航天器与目标的稳定连接关系。

5、维,是指目标操作与维护,通过各种操作与处置装置,完成大型碎片的辅助离轨、故障卫星的在轨维修、附着延寿,大型结构的在轨组装等既定任务。

在轨服务的五步核心任务流程对传统航天器提出了五项能力要求。“追”,要求航天器具备轨道机动与交会能力,经过国内相关型号的在轨验证,相关技术已经相对成熟;“看”,要求航天器具备目标观测与导航能力,从距离目标数十公里到厘米级,测量翻滚目标外形与运动状态、相对运动状态等信息;“跟”,要求航天器具备姿轨耦合逼近跟踪能力,从距离目标数十公里逐步逼近到数米处的预定位置并跟踪;“抓”,要求航天器具备目标捕获能力,数十米外发射飞网/飞矛远距捕获目标,或者利用机械臂/黏附捕获装置,完成预定部位抵近与刚性捕获;“维”,要求航天器具备组合体接管与精细操作能力,对于柔性连接组合体,由服务星通过柔性系绳拖曳离轨,对于刚性连接组合体,由服务星接管姿态和轨道控制,利用末端操作装置完成故障部位详查检测、杆件切割、螺钉旋拧与模块更换等具体操作。典型核心任务流程与能力需求之间的关系如图6 所示。

3 在轨服务关键技术分析

为支撑航天器具备上述五项能力,需突破翻滚目标超近立体视觉测量、翻滚目标姿轨耦合逼近路径规划与控制、非合作目标柔顺捕获控制、组合体稳定控制四项关键技术。

3.1 翻滚目标超近立体视觉测量

为实现非合作目标的应急救援和在轨清除,服务航天器要具备对复杂场下非合作目标相对位姿测量能力,非合作目标观测与导航技术贯穿空间操控的整个任务过程。如图7 所示,经过多年发展,远距离乃至较近距离(数十公里到数十米)的相对测量与导航技术已经发展较为成熟,可以采用光电跟瞄、微波雷达等相对测量手段,通过测量目标的视线方向和视线距来确定点目标的相对位置和速度信息。超近距离(数十米到米级)时,目标从点目标转变为面目标,不仅需要目标的位置信息,还需要测量翻滚目标外形与运动状态等信息,通常可以采用立体视觉相机实现相对姿态角和角速度的测量。建立同步跟踪状态后,服务航天器开始实施抓捕时,机械臂末端距离捕获/操作部位从米级到厘米级过程中,需要利用手眼相机完成目标捕获/操作部位特征位置的状态测量,引导捕获/操作任务的实施。

图7 目标观测与导航Fig.7 Observe and navigation

在上述任务过程中,翻滚目标的超近距离立体视觉测量面临大量难题,是当前国内外研究的热点。失效卫星在空间通常处于高动态翻滚状态,存在较大的章动和进动。由于高动态翻滚会导致观测面周期性进出视场引起特征点丢失、尺度变化和旋转变化,传统相对测量与导航方法计算复杂,数据更新率低,无法满足高动态翻滚目标的实时观测与导航要求。因此亟需开展复杂光场高机动非合作目标的立体视觉测量技术研究,通过测量翻滚目标运动状态、相对运动姿态、整体外形及局部操作部位特征等信息,为后续逼近路径规划与抓捕控制律设计提供输入。

在超近距离视觉导航过程中,空间非合作目标的高动态翻滚、高反射率表面材料、强太阳光照等因素,导致目标特征观测与跟踪面临强时变、强干扰下的特征易丢失问题,为此需要重点解决非合作翻滚目标相对测量与状态估计技术、非合作翻滚目标形态重构与局部精细感知两方面问题,具备复杂光照条件下高动态翻滚目标特定部位的相对位姿测量能力。

(1)非合作翻滚目标相对测量与状态估计技术

非合作翻滚目标相对测量与状态估计包括基于特征、模型及深度学习的方法。

基于特征的相对测量包括基于二维图像特征和三维点云特征的方法。二维图像特征相对测量一般经过特征提取、特征匹配、运动估计等过程,实现目标的位姿解算。图像特征可以是点和线/面两类。第一类基于点特征的方法通常采用PnP 解算相对位姿。第二类是基于线/面的相对测量,该类方法需要利用目标航天器的结构信息。基于三维点云特征的相对位姿测量方法,采用三维点云分割方法对观测到的点云进行分割,基于点云的特征计算和匹配(如ICP 等),然后采用SVD 等实现目标的位姿估计,这类方法要求对点云数据的精确分割,这要求观测的点云数据具有一定的采样密度。

基于模型的相对测量需借助目标结构形状或CAD 模型,依赖于目标整体。结合目标已知的三维模型信息,通过三维到二维投影映射配准的方式,求解目标的位姿。该方法需事先已知目标的结构形状或CAD 模型,依赖于目标整体,模型未知的情况下该方法失效。

基于深度学习的相对位姿测量方法,利用神经网络辅助实现对非合作航天器间的相对位姿的求解。杨兴昊[1]采用ALexNet与ResNet相结合的端到端智能网络架构,基于分类与回归同步优化策略动态获取非合作目标的位姿信息,具有姿态估计误差小的优点。王立[2]基于神经网络完成对点云姿态特征的训练学习,并估计目标的相对位姿。

本研究团队采用基于模型的翻滚目标特征闭环检测与位姿图优化方法,解决空间复杂场下累积误差大、位姿解算不收敛的难题,完成了基于多源信息融合与测量估计的地面集成实验验证,如图8-9 所示。

图8 基于帆板特征的位姿估计Fig.8 Pose estimation based on canvas features

(2)非合作目标形态重构与局部精细感知技术

非合作目标形态重构与局部精细感知技术主要包括传统的SLAM 方法[3]和深度学习方法两大类。

传统的SLAM 方法采用先视觉重建后估计的方式。主要集中滤波设计,模型和噪声影响会加大测量误差,甚至发散,存在计算速度较慢的问题。Schnitzer等[4]采用滤波与重建相结合的方法,提出改进的SLAM 完成对非合作目标状态估计,基于RANSAC重建目标的三维模型,然后融合EKF 滤波动态估计目标位姿。该算法表面重建效果较佳,但实时性差。

深度学习方法[5]通过构建卫星模型样本数据库,结合目标检测与识别网络完成目标局部智能精细感知。李林泽等[6]在仿真环境中完成了基于改进Mask RCNN 的空间卫星智能识别。该方法基于目标状态感知数据库训练神经网络模型,存在效率低、适应性差的问题。

本研究团队采用基于深度学习的目标典型部位精细感知方法,解决复杂光场下高机动目标感知精度差、泛化性弱的难题,完成了基于相对位姿测量系统的目标在线智能识别试验验证,如图10-11 所示。

图10 非合作目标形态重构Fig.10 Reconstruction of non-cooperative target conformation

图11 基于相对位姿测量系统的目标在线智能识别Fig.11 Online intelligent recognition of target based on relative position and attitude measurement system

3.2 翻滚目标姿轨耦合逼近路径规划与控制

在航天器在轨维护、交会对接、在轨补加等任务中,为满足精度、实时性、可靠性、自适应性和安全性等要求,确保飞行器能够精确地定位、交会和跟踪目标,需开展自主交会与逼近跟踪技术研究。及时响应目标的变化,并快速做出调整;在各种复杂环境下正常运行,避免技术故障;应对不同目标、不同环境、不同任务等因素的影响,并能够自主调整控制策略;确保空中飞行器的自主控制不会对自身或其他目标造成影响。

如图12 所示,从数十公里到数十米,目标可视为点目标,航天器可以采用多脉冲制导、视线制导等制导方法,视线跟踪姿态控制、开环脉冲轨道控制等控制方法,完成对目标的自主接近,工程上已经实现应用。数十米到数米近距离接近过程中,失效卫星将不能再被当作点质量模型,失效目标自身构型复杂,而且在空间自由翻滚,追踪航天器在接近对接口的过程中安全路径是与结构布局和接近时间多重因素相关的,安全逼近路径是动态时变轨迹,同时又要达到姿轨同步跟踪的目的,因此翻滚目标姿轨耦合逼近路径规划与控制是核心挑战。

图12 姿轨耦合逼近跟踪Fig.12 Attitude and orbit coupling approach

近距自主逼近与跟踪需要重点解决时变安全逼近路径规划、姿轨耦合逼近的路径跟踪控制两方面问题。

(1)时变安全逼近路径规划技术

时变安全逼近轨迹规划包括基于最优控制、搜索、插值、采样、学习等规划方法。

最优控制方法是将自主逼近问题视为求解最优控制问题,将轨迹规划转化为求解控制参数的最优值。Zhang[7]等人提出了一种基于连续凸化的引导算法,用于在多个路径约束下生成燃料最优的六自由度近距离航天器轨迹,路径约束包括传感器视野、避免碰撞和喷口撞击,通过复合状态触发约束的方案嵌入到连续优化框架中,通过对参考轨迹附近的非线性系统动力学和约束函数进行线性化和离散化,将原始的最优引导问题转化为一系列凸子问题,并通过凸规划迭代求解。

搜索算法是将自主逼近问题转化为状态空间最优轨迹的搜索问题,典型算法包括遗传搜索算法、粒子群搜索算法、模拟退火搜索算法等。遗传搜索算法通过模拟自然界中的生物进化过程,使用交叉、变异等遗传算子对自主逼近解空间进行搜索,其适应度函数选择灵活,且能够全局搜索,但缺点是计算复杂度较高。粒子群搜索算法是模仿鸟群觅食原理,通过在状态解空间中进行搜索获得最优解,该方法计算效率高,但易陷入局部最优且难以得到精确最优解。模拟退火搜索算法是基于金属冶炼退火过程原理,通过在状态解空间中进行搜索获得优化解,该方法对初始值不敏感,能够跳出局部最优解,但算法收敛速度较慢。基于搜索的规划方法适用性广、可扩展性强,但难以保证全局最优解,需要合适的启发函数和搜索策略。

插值方法是将自主逼近问题转化为插值问题,通过插值方法构造航迹,该方法简单易实现、计算量小,但需要事先预估目标位置和速度信息,且精度较低。

采样方法是利用随机采样生成大量轨迹候选集合,从中选择最优轨迹,如RRT、RRT*算法等。这类方法能够处理复杂问题,可根据实际运动环境调整采样点的密度,提高规划方法的适用性;具备较快的计算速度,可应用于多目标问题,能够通过权衡不同目标来得到更优的规划结果。基于采样的规划方法会增加运动噪声导致轨迹规划结果的不稳定和不确定,易陷入局部最优,且由于采样点密度和阈值等参数设定会影响规划结果,对参数的选择和调整非常敏感。

基于学习的规划方法[8]是利用监督学习、无监督学习或强化学习等机器学习技术,通过对大量数据进行学习和分析,生成适应性强、高效稳定的轨迹。典型算法包括决策树、支持向量机(SVM)、神经网络、强化学习等。人工神经网络[9]是模拟人类大脑的学习和记忆机制,使用神经元、权重等概念对解空间进行搜索,能够学习和自适应,对噪声和非线性问题有较好的处理能力,缺点是训练时间较长,难以进行解释。强化学习可以自适应地学习和优化行为策略,适用于复杂决策任务,通过与环境交互实时调整策略,具有较强的泛化能力。但缺点是训练需要大量实验和调参,且收敛速度较慢、训练时间较长、对计算资源需求较高。

除了上述优化方法外,还有线性规划、非线性规划、混合整数规划、模型预测控制规划等优化方法。这些方法具有不同的优缺点,需要根据不同约束条件进行选择。例如,线性规划适用于线性约束条件下的问题,具有较好的求解效率,但需要将问题转化为标准线性规划形式。

本研究团队针对慢旋目标自主接近过程中多约束的最优路径规划问题,采用基于虚拟域的逆动力学方法,将慢旋目标自主逼近和跟踪的规划问题转化为求解满足性能指标和约束条件的最优控制问题,其中性能指标主要包括燃料最优和时间最优,约束条件包括安全防撞约束、敏感器约束等方面,如图13 所示。

图13 基于虚拟域逆动力学的优化轨迹Fig.13 Optimization trajectory based on virtual domain inverse dynamics

该方法允许匹配任意组合的终端条件,产生指定的路径点间隔,可以有效地得到所需的结果。通过数学仿真,分别验证了该方法在时间最优和能量最优下的有效性,可有效保证翻滚目标安全有效地逼近与跟踪慢旋目标。

本研究团队针对超近距离自主逼近规划问题,研究了基于高斯伪谱法的轨迹优化方法,考虑到目标旋转、安全、燃料消耗和机动因素,构建了一个包含安全区域和禁止区域的模型,基于高斯伪谱法求解最优轨迹,通过仿真验证了方案的有效性,规划轨迹能够避开禁区,分别在相对距离、燃料消耗和机动时间方面获得最优轨迹,如图14 所示。

图14 基于高斯伪谱法的燃料最优安全轨迹Fig.14 Fuel optimal safety trajectory based on Gaussian pseudospectral method

(2)姿轨耦合逼近的路径跟踪控制技术

姿轨耦合逼近控制主要包括闭环反馈控制方法、最优控制方法和强化学习方法。

闭环反馈控制是基于李雅普诺夫稳定性定理,对输入信号和输出信号的误差进行调节,包括不依赖于被控对象精确模型的误差反馈控制方法和基于现代控制理论的模型反馈控制方法。误差反馈控制方法包括位置式PID 和增量式PID,其具有方法简单、易于实现的特点。模型反馈控制方法是根据被控对象所建立的动力学或运动学模型,实现对模型状态微分变化过程的快速精确控制,包括动态逆、滑模控制、自适应控制、鲁棒控制[10]、模型预测控制[11][12]以及相应组合控制方法,其具有实时性好、稳定可靠、具有一定的抗干扰能力,鲁棒性较高,但难以评价过程和终端约束,无法对整个任务过程的优化指标进行考核,且当存在较大不确定环境和外界干扰时的鲁棒性较差。

为了指导地勘单位践行绿色理念,全面推进我国绿色勘查工作,不久前中国矿业联合会正式发布了我国绿色勘查第一个团体标准——《绿色勘查指南》(T/CMAS 00012018)。

基于最优控制的跟踪控制方法通常包括间接法和直接法。间接法是基于极小值原理,将最优控制问题转化为求解微分方程的两边边值问题,与同伦技术[13]、初始值搜索等策略相结合以提高优化性能,其控制精度高且解满足一阶最优性,但两点边值求解难度大、对初始值比较敏感。直接法不需要求解最优性条件,通过对状态量和控制量进行离散,将动态优化问题转化为非线性规划问题,典型方法包括伪谱法和凸优化等。最优控制方法由于计算复杂度高、实时性较差,通常用于离线控制任务。

强化学习[14]是基于动态规划的贝尔曼最优性原理,让智能体从与环境的交互中学习最优行动策略,可实现从传感器数据到行动策略的端到端映射,具有实时性强的优点,典型方法包括DPG、TRPO、PPO[15]等。Qu[16]等人提出了一种探索自适应深度确定性策略梯度(DDPG)算法,实现空间飞行器自主交会对接的相对位置跟踪控制,并满足安全避撞要求。Cheng[17]等人提出了一种利用多尺度深度神经网络的航天器轨道转移实时优化控制方法,实现大规模复杂系统的高精度控制。

本研究团队针对空间翻滚目标最终逼近与跟踪控制问题,在直接相对姿轨测量失效条件下,基于图像视觉伺服思想,建立了超近距离姿轨跟踪的成像运动模型;直接利用目标图像特征点坐标,推导得到指数收敛的图像视觉伺服期望广义速度、相对位置估计修正量;引入基于双滑模面控制律的相对姿轨耦合控制闭环,提出了间接估计辅助的图像视觉伺服控制方法;与基于间接估计信息的位置视觉伺服控制方法相比,其相对位置和姿态控制精度提高了2 到10 倍,具体数据如表1 所示。可为空间翻滚目标最终逼近与跟踪任务提供安全、准确、稳定的相对姿态和轨道条件。

表1 控制性能汇总对比表Tab.1 Control performance comparison

本项目团队基于双滑模控制律开展了半物理仿真实验。验证过程中目标星和追踪星运动模拟器的运动状态如图15 所示。目标星模拟器按照0.41°/s 的角速度绕本体系Y 轴旋转,位置保持控制在某一定点。在控制律作用下,追踪星模拟器最终实现了对目标星模拟器的姿态和位置同步跟踪,如图16 所示。保证喷管捕获机构始终指向目标模拟器的发动机喷管,并逐渐缩短距离,最终为捕获锁死提供精确位姿条件。

图15 逼近与跟踪地面实验Fig.15 Approaching and tracking ground experiment

图16 运动模拟器的期望轨迹与实际轨迹Fig.16 Expected trajectory and actual trajectory of motion simulator

3.3 非合作目标柔顺捕获控制

要实现对目标的接管或精细操作,需要对非合作目标进行捕获,按照捕获后形成连接是柔性还是刚性,非合作目标捕获手段包括柔性捕获与刚性捕获。其中柔性捕获主要运用飞网捕获、鱼叉捕获等技术手段,刚性捕获主要运用喷管对接捕获、仿生黏附捕获、机械臂捕获等技术手段。

柔性捕获的优点在于对控制精度要求较低,但缺点是不便于后续提供维修或燃料加注等精细服务。飞网捕获和鱼叉捕获可用于将失效卫星或空间碎片拖曳离轨,具有成本低、适应性高的特点,工程上较为容易实现。但鱼叉捕获容易产生空间碎片,飞网和鱼叉捕获都已经过在轨验证。

刚性捕获的优点在于目标卫星与服务星之间为刚性连接,对接比较稳固,但该方式技术难度较大,对控制性能要求比较高。喷管对接捕获是指,通过圆锥形抓捕工具直接插入目标远地点发动机喷管并锁紧,实现与目标的稳定固连,是早期在轨服务采用的捕获方式,技术相对较为成熟。仿生黏附捕获是基于仿生壁虎干黏附材料的在轨捕获方式,该方式可重复使用降低成本、对目标具有宽适应性,是后续发展的重要方向。机械臂捕获是指,采用一个或多个机械臂结合末端抓捕工具的结构形式,对目标的星箭对接环或发动机喷管等结构实施对接捕获,是目前研究较多的捕获方式,由于末端工具与目标接触时会产生碰撞力,可能带来目标损坏或翻滚,捕获对操控力的柔顺性、安全性和平滑性提出了要求,因此翻滚目标特定部位的柔顺捕获控制是核心挑战,如图17 所示。

图17 目标捕获Fig.17 Target capture

基于空间机械臂的特定部位柔顺捕获控制主要是指末端执行器对目标抓取时,依靠控制方法使系统适应各种不同外界环境,对环境作用力、扰动等变化做出及时响应。主动柔顺控制方法包括基于阻抗和力/位混合的经典柔顺抓捕控制、基于现代控制理论的柔顺抓捕控制和智能柔顺抓捕控制等。

阻抗控制是将机械臂视为一个“力敏感的弹簧-阻尼器-质量系统”,通过调节机械臂的阻抗参数(包括质量、弹簧系数、阻尼系数等)来实现对机械臂运动的精细控制,柔顺抓捕控制需要考虑目标形状、质量、摩擦力等因素,而阻抗控制[18]可以通过调节机器人的阻抗参数来适应不同的物体特性,提高机械臂对目标抓捕的控制精度和稳定性。力/位混合控制是一种用于机械臂柔顺抓捕的高级控制策略,结合位置控制和力控制,通过传感器获取物体的质量、位置和速度等信息,实时调整机械臂的动作,实现对目标的精确抓捕。Erfan[19]等人针对机械臂对目标抓捕任务需求,提出了一种模块化的单臂控制法用于多臂抓捕操作,遵循力和阻抗控制的概念,引入了一种自适应策略,增加了一个虚拟能量池到多臂系统中,实现了目标的抓捕操作,确保所提出控制算法的稳定性。力/位置混合控制方法在受到外界干扰时系统鲁棒性较差,且控制精度难以同时满足高精度要求。

空间机械臂执行抓捕任务时,存在模型参数不确定和外界干扰等问题,以阻抗和力/位混合为代表的经典柔顺抓捕控制方法精度难以保证。以模型预测控制、鲁棒控制、自适应控制为代表的现代柔顺控制方法,基于获取的机械臂位姿和力学信息,可实现机械臂抓捕过程中的精确鲁棒控制。Yang[20]等人针对空间操作机械臂谐波驱动带来的扰动对机械臂高精度运动和柔顺性的影响问题,提出了一种基于鲁棒扭矩跟踪的控制方法,以消除由弹性引起的意外振动,并抵消电机非线性摩擦所引起的扰动,并结合改进自适应方法,基于位置阻抗控制实现了翻滚卫星的软捕获。She[21]提出了一种用于空间非合作目标捕获后的无模型控制方法,基于系统参数线性化开发了一种激励响应映射搜索策略,建立线性校正器以减少控制误差,实现组合航天器捕获后的高精度控制。

智能柔顺抓捕控制是将模糊控制、神经网络控制和强化学习等智能控制方法应用于机械臂柔顺抓捕控制中,基于机械臂末端视觉和力传感器,实时监测机械臂的位置、姿态和力学状态,提高机械臂抓捕稳定性和适用范围。Yan[22]等人提出了一种新的自由漂浮空间机器人捕获非合作目标的控制方法,基于最大熵目标构建了软Q 网络和状态条件的随机策略网络,建立经验回放池来存储训练样本,采用软Q 学习训练策略,以最大化累积奖励和策略熵,使机器人能够实现不同方式的目标抓捕。Du[23]等人针对自由漂浮空间机器人的动态模型复杂导致难以捕获目标的问题,提出了一种针对基于学习的无模型控制方法,将任务的过程描述为强化学习过程,采用深度确定性策略算法(DDPG)来训练空间机械臂运动规划策略,实现空间机器人对目标的抓捕控制。

本研究团队采用基于位置控制内环的阻抗控制方法,解决了机械臂末端对目标接触过程中的力和位姿复合控制问题,完成了基于机械臂将圆柱形工件插入一个圆形孔洞的试验,如图18 所示,机械臂末端的接触力可以在较短的时间内实现对期望力(10N)的追踪和保持,且没有出现接触力峰值过大的情况,如图19所示,说明机械臂末端的接触力得到了良好的控制,且当平头圆柱形工件换成尖头圆柱形工件时,同样能够得到很好的控制效果。

图18 工件插入试验Fig.18 Workpiece insertion test

图19 Z 轴方向力曲线Fig.19 Z-axis force curve

3.4 组合体稳定控制

对于刚性连接组合体,可由服务星接管姿态和轨道控制。组合体的结构与个体航天器相比,存在质量和转动惯量增加、质心偏移以及挠性模态改变等变化,且由于是非合作目标,目标的质量特性参数无法获得,系统存在不确定性。组合体航天器的质量参数未知且突变、控制能力受限、外界干扰影响等问题给稳定控制带来困难。因此,组合体姿轨复合接管控制技术是核心挑战。

对于柔性连接组合体,可由服务星通过柔性系绳拖曳离轨。服务星、系绳、目标星组成复杂的刚柔耦合系统,系统存在纵向振动、横向摆动、目标航天器翻滚等问题,纵向振动会给服务航天器带来冲击,横向摆动会对航天器姿态产生干扰,目标翻滚可能会产生系绳缠绕。解决这一问题的有效方法是将系绳张力控制与系统的运动规划和控制策略相结合,因此,柔性系绳拖曳控制技术是核心挑战。

刚性连接组合体和柔性连接组合体的接管稳定控制需解决的难题如图20 所示。

图20 组合体稳定控制Fig.20 Stability control of the combination

因此,组合体接管主要涉及两部分内容:机械臂捕获和仿生黏附捕获并锁紧形成稳固连接后的组合体姿轨复合接管控制技术,通过绳系形成松弛连接后的目标拖曳控制技术。

(1)组合体姿轨复合接管控制技术

要实现对组合体高精度的姿态和轨道控制,首先需要准确求出航天器动惯量、质量和质心位置等质量特性参数,对目标航天器认识的不确定,以及航天器在轨运行带来的一些载荷或构型的变化等造成这些质量特性参数不能通过地面实验手段计算得到,需要在线对组合体的质量特性参数进行辨识。其次,目标航天器往往具有一定的运动速度,对接或捕获后组合体的动量会发生突变,可能造成组合体失稳,因此,对接完成后需要对组合体进行姿态稳定。

1)组合体质量特性参数辨识

组合体航天器质量特性参数辨识与单体航天器不同,捕获非合作目标,尤其是非合作翻滚目标后,组合体会存在较大姿态角速度,要求合理设计辨识模型和辨识方法确保组合体不能失稳,同时要兼顾组合体挠性模态增强的变化,避免激励过程引起挠性附件振动。航天器的质量特性参数在轨辨识方法有滤波类方法和最小二乘类方法[24]。

滤波类方法具有良好的平滑性,但算法相对复杂、计算量较大。为减少计算量,可以对运动方程中的耦合项做近似简化,但会对航天器的运行速度产生限制。此外,一些无需参数解耦的基于粒子群等算法的质量特性参数辨识方法也被提出,可将所有参数同时辨识得出,航天器运行速度不受限。最小二乘类方法在辨识过程中误差会不断累加,结果受测量误差影响较大。国外学者利用加速度计和陀螺,采用最小二乘辨识算法完成了飞行器转动惯量、质心、推力器大小和总质量的在线辨识,系统辨识时间在48 s 内,算法已在麻省理工学院的SPHERES 实验飞船项目中进行验证,证明了工程应用的可行性。

2)组合体稳定控制

服务航天器抓捕非合作目标形成组合体后,非合作目标组合体控制完全交由服务航天器来完成。虽然经过参数辨识,但结果并非完全准确,系统存在不确定性,组合体航天器的质量参数发生突变、控制能力受限、外界干扰影响等问题给组合体控制带来巨大挑战。组合体姿轨复合接管控制的典型控制策略包括变结构控制、自适应控制、神经网络控制等。

针对强耦合非线性系统,且某些系统参数具有较大的不确定性,可以采用变结构控制方法解决非线性控制问题,该方法对参数的不确定和外界未知干扰具有较强的鲁棒性、且系统响应速度快。自适应控制可用于解决被控对象特性未知或扰动变化较大的情况,控制系统能够根据外界的变化自动调整参数,使系统按照设定的性能指标保持运行在最优状态。神经网络控制优点是能够学习和自适应,适用于难以精确建模的复杂模型控制。Thakur[25]提出利用神经网络的方法解决时变不确定惯量参数情况下的航天器自适应姿态控制。

由于系统存在强不确定性,组合体航天器难以采用精确的数学模型对控制对象进行描述,可以采用基于数据驱动的控制方法,不依赖于系统精确的数学模型,利用充分的系统输入输出数据即可得到满足要求的控制器。1994 年侯忠生提出了新的无模型控制方法——无模型自适应控制,该方法已应用在电气、化工等领域。本研究团队创新地将该方法应用在组合体航天器控制中,解决了捕获后组合体航天器无模型自适应姿态控制问题。图21-22 为姿态初始值[5°;-5°; 0°],组合体姿态控制仿真结果曲线。

图21 组合体姿态Fig.21 Attitude of combination

图22 组合体姿态角速度Fig.22 Attitude angular velocity of combination

由仿真结果可知,组合体航天器姿态控制精度为0.005°。

在此基础上,研究团队利用气浮平台、六自由度运动模拟器,完成了组合体航天器姿态的无模型数据驱动控制的地面实验验证,如图23 所示。设定三轴姿态角的初值为(3.23°,0.12°,-0.09°),期望值设定为(2°,-0.5°,0°),实验结果如图24 所示。

图23 地面实验系统Fig.23 Ground examination system

图24 组合体姿态控制Fig.24 Attitude control of combination

由地面实验控制结果可知,基于数据驱动控制方法可实现组合体的三轴控制,控制精度为0.2°。

(2)柔性系绳拖曳控制技术

除了建立刚性连接形成组合体外,柔性系绳也是非合作目标捕获的一种技术手段。针对空间系绳捕获非合作目标后可能带来的冲击、摆动、缠绕等问题,国内外专家学者就航天器柔性系绳拖曳过程中的张力控制技术进行了大量的研究。

在横向、切向和径向方向上,通过给出绳系卫星摆角在作用力下的一阶解析解,可以基于张力控制器实现摆角振动抑制,从而实现姿态稳定控制。在沿系绳方向上,封铁凝[26]完成了一种时间最短能耗最小的组合体沿系绳方向振动抑制的最优控制策略设计,避免了系绳纵向振动可能导致系绳松弛及缠绕的问题。Jia C[27]在考虑了动力学的不确定性、推力器幅值约束和配置不确定性情况下,采用自适应反步控制方法实现碎片拖曳过程中的姿态稳控控制。

时变张力控制律对航天器姿态敏感器的测量精度和执行机构的响应速度要求很高,限制了其在工程中的应用。针对这一问题,本研究团队[28]提出一种基于相平面控制原理的恒定张力拖曳控制方法,实现绳网捕获碎片目标后绳系组合体面内外摆动的抑制,并证明了该方法的稳定性。进一步,建立了考虑失效航天器带有柔性附件情况的动力学模型[29],在此基础上设计了常值张力切换控制律。

4 在轨服务航天器未来发展方向展望

4.1 非结构化环境、目标和任务的智能化操控

目前在轨服务任务都是针对特定目标、特定场景、特定环境,按照设计好的固定范式进行操作,属于程式化操控,无法适应非结构化环境、目标和任务,无法真正在轨应用。针对未知失效翻滚目标、低轨光照变化剧烈、视线遮挡,且抓捕部位和操作部位的外形尺寸未知等问题,引入基于深度学习的目标识别和场景理解方法,提升空间非结构环境下目标识别的泛化性和鲁棒性,识别失效目标的抓捕部位和操作部位,并通过场景理解确定目标状态和操作策略;由于目标的非结构特征,操作没有标准范式,传统的目标抓捕和精细操作方法需要已知任务场景操作部位的目标形状特征,设计期望的操作动作,通过引入基于自学习的精细操作方法,掌握目标抓捕和精细操作技巧,应对操作部位尺寸、形状等场景变化的操作任务。

为此,开展目标捕获与维修的智能感知与精细操作技术研究,可提升操控感知、规划与控制对非结构化任务、对象、环境的泛化自适应、自学习能力。重点开展非结构复杂环境目标感知、柔性机器人[30]的力触视形位智能融合感知与控制、多智能体协同融合感知规划与控制等技术研究。

4.2 星表仿生附着巡游

面向空间站等大型航天器舱外巡视、检修等在轨维护任务,在通用化柔性捕获基础上发展星表仿生附着巡游,实现自由粘附和脱附,可为在轨操作提供可逆稳固黏附连接力、增强抓取和移动能力,适应星表爬行移动需求。由于空间爬行机器人面对的航天器表面形貌、材质、结构种类众多,特性差异大,同时,执行拔插电缆、更换太阳能帆板等灵巧操作面对的组件形状与硬度差异大,要求操作力幅度与操作运动轨迹多样化,并需应对操作中的异常状况,这就使得空间爬行机器人需具备非结构化环境爬行的强适应性与操作的强泛化性。

为此,开展在轨服务爬行机器人的智能触觉测量、运动规划与控制技术研究,将人工智能技术与航天技术交叉融合,模仿人类记忆与推理机制,研究包含空间操作环境、对象与技能的动态知识库构建方法和操作技能推理方法,可以使空间机器人获得强适应附着爬行和强泛化灵巧操作能力。重点开展表面未知接触状态的精准感知、空间微重力条件下黏附爬行的自适应步态规划、空间环境高功率密度仿生肌肉驱动与控制、多模态柔性触觉传感等技术研究。

4.3 大型空间结构的在轨组装

高分辨率成像、高灵敏侦察、高功率发电等大型空间系统是未来装备的重要发展方向,其性能取决于孔径和支撑结构尺寸。受运载能力及展收机构技术限制,无法单次发射入轨,在轨组装是有效解决途径。大尺度挠性结构阻尼小,易发生持续的随机振动,且频率特性随着结构尺寸增长、拓扑变化和机器人所在位置而变化,依附于结构的组装机器人要搬运大质量/惯量可展模块,因其机械臂和关节的不可忽视柔性特性,在基座干扰位移下会产生振荡,导致无法精确抓取、对准接口,甚至导致模块的碰撞。

为此,需开展适用于大尺度挠性结构上组装机器人爬行、操作的抑振运动规划和控制方法研究,实现百米级超大尺度空间桁架结构在轨建造。重点开展柔性变构型组装动力学、组装过程的精密测量与标定、挠性组装体的自适应精细运动规划、复杂多体系统的精细操作控制等技术研究。

5 结论

在轨服务已成为国内外研究的热点领域,本文通过总结典型在轨服务任务的发展现状,可以看出,服务对象已由最初的合作稳定目标扩展到非合作翻滚目标,操控任务由简单的交会、对接发展到更为复杂的延寿、维修、爬行、组装等。为使航天器具备相应的能力,对在轨服务航天器控制系统提出翻滚目标超近立体视觉测量、翻滚目标姿轨耦合逼近路径规划与控制、非合作目标柔顺捕获控制、组合体稳定控制四方面关键技术挑战。后续在轨服务将朝着非结构化环境/目标操控、星表仿生附着巡游、大型空间结构在轨组装等方向发展,存在目标捕获与维修的智能感知与精细操作、在轨服务爬行机器人的智能触觉测量/运动规划与控制、大尺度挠性结构上组装机器人爬行/操作的抑振运动规划和控制等难题需要攻关。

猜你喜欢
组合体航天器目标
SpaceX公司超重-星舰组合体首飞异常情况初步分析
2022 年第二季度航天器发射统计
空间站组合体3D展示产品
2019 年第二季度航天器发射统计
“拆”解组合体求积问题
2018 年第三季度航天器发射统计
2018年第二季度航天器发射统计
组合体的组合形式探讨
新目标七年级(下)Unit 3练习(一)
新目标七年级(下)Unit 4练习(一)