飞行器集群协同制导控制方法及应用研究

2019-09-13 08:40董希旺李清东

导航定位与授时 2019年5期

任章，郭栋，董希旺，李清东

(1.北京航空航天大学自动化科学与电气工程学院，北京 100083；2.北京航空航天大学飞行器控制一体化技术国防科技重点实验室，北京 100191; 3. 北京航空航天大学大数据科学与脑机智能高精尖创新中心，北京 100191)

0 引言

近年来，美、俄、欧等军事强国和组织均加大了对导弹防御技术的重视程度，加快了反导防御系统的建设步伐，极大影响了进攻型武器的作战效能。美国的导弹防御系统经过多年的发展，已经具备了对来袭目标全射程、多层次的拦截能力，传统的导弹突防能力进一步下降。随着日益复杂的作战环境与作战需求，单枚导弹的作战样式已经很难完成作战任务，多飞行器协同作战技术已经成为未来武器装备的重要发展方向。

多飞行器编队协同攻击是适应未来作战环境的重要作战方式。美国国防部高级研究计划局(Defense Advanced Research Projects Agency，DARPA)的“拒止环境中协同作战”(Collaborative Operations in Denied Environment, CODE)项目提出了多飞行器应采取集群协同作战的方案，提高无人飞行器的自主协同作战能力和生存率。美国海军研究局的低成本无人机蜂群技术(Low-Cost UAV Swarm Technology，LOCUST)已经成功完成了多次实验，实现了多架无人机的编队飞行与机动。美军表示，多架无人飞行器集群协同的作战样式能够很好地满足未来战场上的作战需求。美国空军研究实验室提出了忠诚僚机的概念，即通过多驾无人机在有人飞机周围以特定队形伴飞来实现多有人/无人群系统间的协同作战。多飞行器利用通信链路组成一个作战网络，打破了传统单枚飞行器孤立作战的方式。采用多枚飞行器对目标进行齐射饱和攻击，可以使对方雷达的探测等功能趋于饱和，减少导弹进入探测区域的时间间隔，进而提升突防概率。根据交接班需求设计合理的中制导段编队构型，可以实现多枚机动性较差的导弹对机动性较强的目标的拦截，有效弥补单枚导弹飞行与探测能力的不足。此外，通过对多枚导弹设计合理的编队构型，可以实现多飞行器以特定构型对目标的关键部位进行重点杀伤，从而大大提升毁伤效果。若编队中的各枚飞行器能够保持合适的角度与距离飞行，可以实现对多个方向不同目标的协同探测，提升对机动目标的观测精度与识别能力。同时，采用高配置导弹对目标实施探测、低配置导弹利用高配置导弹的导引信息进行打击的作战模式，可以在实现对目标饱和打击的同时有效提高作战效费比。总之，飞行器集群作战可以实现各枚飞行器间的作战性能互补与战场态势信息共享，完成飞行器各自为战时不能完成的任务，可以有效提升整体的作战效能。

1 多飞行器协同制导控制关键技术

多飞行器集群协同作战将成为未来的主要作战形式。随着日益复杂的作战环境与需求，不仅需要根据各种约束条件为不同飞行器合理地分配任务，还要求各枚飞行器在实现对目标精确打击的基础上，配合其他飞行器进行协同作战，完成协同探测、编队飞行和协同制导等作战任务，使己方的整体作战效能最大化。多飞行器协同制导控制技术是实施编队协同作战的关键与先决条件。与传统的制导理论研究不同，多飞行器集群协同制导控制技术的实施主要包含以下难点：

1) 如何根据弹目作战阵位、飞行器自身机动能力以及目标逃逸方式等，通过动态任务规划与目标分配，为飞行器集群规划合理的作战任务，以及为每枚飞行器分配最优的拦截对象；

2) 如何保持最优攻击队形，当目标机动时，如何及时改变各飞行器在攻击编队中的角色，变换攻击队形，保证各飞行器按预定作战编队构型攻击目标，满足中末制导交班要求，即多飞行器时变编队飞行控制；

3) 多飞行器如何在动力学约束、通信能力约束和战场环境约束等约束条件下，实现对单个或多个目标的协同攻击，即多约束条件下的多飞行器协同制导技术。

针对以上技术难点，可以将飞行器集群协同制导控制问题的关键技术总结为：协同任务规划与动态目标分配技术、时变编队协同控制技术和多约束条件下的协同制导技术，如图1所示。

图1 多飞行器协同制导控制关键技术Fig.1 The key technologies of cooperative guidance and control for multiple aerial vehicles

2 多飞行器协同制导控制方法研究现状

下面就近年来国内外关于任务规划与动态目标分配方法、时变编队协同控制方法和多约束条件下的协同制导方法的研究成果分别进行介绍。

2.1 协同任务规划与动态目标分配

多飞行器的任务规划与目标分配是实施编队协同作战的首要和关键任务。通过对战场环境、作战需求以及各种约束条件的综合分析与计算，在任务决策层面对多枚飞行器的作战任务进行合理规划，为多枚飞行器分配合理的目标，可以加倍提升对目标的攻击效能。目前，多飞行器的任务规划方法主要有集中式任务规划方法和分布式任务规划方法。集中式任务规划方法，顾名思义，即系统中存在一个中心节点，通过中心节点对系统中的其他节点进行任务层面的协调与调度。文献[1]设计了一种考虑最小转弯半径约束的多无人机集中式任务规划方法，并通过实物进行了验证。文献[2]以多无人机察打一体作战为背景，在多约束条件下建立了无人机编队的任务规划模型，并运用遗传算法设计了相应的求解策略。文献[3]针对多无人机任务规划问题进行了集中式建模，并采用混合整数规划方法进行了求解。集中式任务规划方法经过近几十年的发展，已经较为成熟，其全局特性较好，但收敛性与鲁棒性稍显不足。分布式任务规划方法不存在中心节点，能够很好地适应系统内节点数量的变化，且具备较强的鲁棒性与收敛性。文献[4]基于合同网拍卖算法，针对多无人机协同控制问题，设计了一种分布式任务规划方法。文献[5]基于组合拍卖算法，设计了一种协同空战决策方法。分布式任务规划方法原理简单，计算效率高且易于实现，针对系统节点数目变化以及其他动态不确定性的适应性较强，目前正在成为任务规划的重点研究方向。文献[6]针对对抗环境下的多无人机在线搜索攻击任务规划问题，提出了一种分布式算法，将每架无人机作为独立单元解决局部优化问题，然后通过无人机之间的信息交互，实现多无人机系统的优化决策。文献[7]提出了一种智能自组织算法，用于解决多无人机的搜索-攻击任务规划问题，该方法采用分布式控制架构，将全局优化问题分为几个局部优化问题，搜索-攻击任务规划过程包括航路点生成和路径生成两部分。文献[8]针对卫星的任务规划问题，提出了一种改进的混合整数线性规划算法，该方法将规划过程变为动态组合优化问题，能够满足在线任务规划的实时性要求。基于混合动态突变遗传算法，文献[9]提出了一种分布式在线任务规划算法，用于解决多卫星系统的任务规划问题。文献[10]针对敏捷卫星任务规划问题，比较了多种多目标优化算法，提出了交互式框架用于帮助决策者调整参数。

完成对多飞行器的任务规划后，需要根据实时变化的战场环境与作战需求为某个或某一组飞行器实时确定要打击的目标，即进行动态武器目标分配。武器目标分配是多飞行器打击多目标作战的重要组成部分，目标分配结果的好坏直接影响到整体的作战效能。武器目标分配问题的解空间规模会随着飞行器数与目标数的增加呈指数级增长，属于典型的多约束离散NP完全问题。目前求解武器目标分配问题的方法主要有两类。第一类是整数规划方法等传统方法的改进。文献[11]考虑到目标分配问题的复杂性与计算时间约束，运用拉格朗日松弛法设计了一种目标分配方法。文献[12]针对协同空战，设计了一种带时间序列约束的武器目标分配策略，并采用整数规划方法进行求解。以上的传统求解方法的改进方法可以有效地解决小规模的武器目标分配问题。当飞行器与目标的数目比较多时，或者存在其他约束条件时，求解效率会急剧下降。第二类是启发式优化算法，也是目前研究与应用的热点。文献[13]基于分布式协同拍卖算法，设计了有中心弹和无中心弹情况下的动态目标分配方法。文献[14]针对多无人机目标分配问题，分别采用遗传算法与市场竞争法进行了求解，并比较了两种方法下的分配结果。文献[15]针对多枚导弹拦截多枚飞行器，提出了一种带有分组约束的武器目标分配方法，可以保证每个目标被分配到数量合适的拦截弹，为后续的分组协同作战提供了良好的初始条件。文献[16]针对动态武器目标分配问题，设计了一种改进形式的人工蜂群方法，并和多种优化方法进行了对比，验证了所设计方法的有效性。

2.2 协同控制

多飞行器编队控制是协同控制的核心和重要基础。在很多任务和复杂环境中，需要多飞行器系统中的个体之间形成和保持预定的队形，同时适应外部环境的需求。当多飞行器形成特定编队时，与单枚飞行器相比，更有利于对目标的搜索与跟踪，群系统的鲁棒性会得到增强，任务可拓展性也会得到延伸[17]。目前编队控制问题在多机器人与多飞行器领域中的研究已经取得了很多成果，积累了大量的采用集中式、分散式和分布式编队控制结构的研究成果[18]。基于集中式结构的编队控制方法计算复杂度高，依赖于可靠的通信系统，且鲁棒性较差。基于分散式结构的编队控制方法需要进行分层混合控制器的设计，在面对复杂环境时容易出现决策层状态爆炸的缺点。基于分布式结构的编队控制方法仅需要系统内部各个分个体的信息，具有计算简单、鲁棒性强等特点，已经广泛运用于多机器人和多飞行器的编队控制问题中[19]。在分布式编队控制策略研究方面，目前主要分为基于行为的编队控制策略、基于虚拟结构的编队控制策略、基于领导者-跟随者的编队控制策略以及基于一致性的编队控制策略。

基于行为的编队控制策略主要是针对多飞行器的预先期望行为集合进行加权分配，根据行为的重要程度分配相应的权值，每个行为具有相应的控制作用，通过加权获取最终的控制作用和期望。在预先期望行为集合中包括如编队形成、障碍避碰、个体避碰、编队保持和目标跟踪等期望行为。文献[20]将编队行为分解为异常情况处理、项目标点运动、队形保持和障碍运动四种子行为。对于这种方法，每个个体动作的输出都可作为其他个体的输入，个体自身传感器获得的敏感信息也可作为输入，然后根据行为选择模块对信息进行综合处理。设计基于行为的编队控制策略的关键是设计各种基本行为和有效的协调机制，或者说如何获得各个个体之间的相对位置和状态等信息，然后根据上述信息来设计基本行为和相应的协调机制。然而基于行为的编队控制策略需要兼顾多种期望行为，没有基于实际物理系统的动力学模型，仅能通过仿真分析来进行验证，无法使用严格的理论工具对系统编队行为的稳定性进行证明，且随着系统复杂度与规模的增大，行为融合的难度与计算复杂度也会进一步增大。

基于虚拟结构的编队控制策略利用一种刚性的虚拟结构来描述多智能体系统，虚拟结构上的每一个点代表多智能体系统中的每个个体。针对每个个体预先设计了能够产生吸力、斥力和全局最小值的势能场，势场力的方向取势能场的负梯度方向。在势场力的作用下，虚拟结构代表了系统中每个个体产生期望的运动，个体之间保持一定的几何形状。在整个势能场达到全局最小值时，整个系统达到期望的编队。基于虚拟结构法的编队控制策略可以分为3个子过程：第1个子过程，定义虚拟结构期望的动力学特性；第2个子过程，转化期望运动目标，将整体目标的实现转化为多智能体系统各自实现目标；第3个子过程，获得多智能体系统轨迹控制跟踪控制方法[21]。虚拟结构法主要用于多智能体系统，尤其在多飞行器系统的编队控制和队形控制等邻域运用较为广泛。基于虚拟结构的编队控制策略具有鲁棒性好和控制精度高等特点，但虚拟结构的设计会引入较大的通信量和复杂的计算量，同时需要多体系统个体能够实时跟踪虚拟结构的对应期望位置，对实时性要求较高。

领导者-跟随者方法以其简单的控制思想得到了许多学者的青睐，国内外许多学者对其进行了深入的研究。文献[22]考虑了领导者-跟随者方法的分布式控制策略，设计了一阶控制律，在控制律中加入了一个积分项，起到对领导者速度进行观察的作用，通过选取李雅普诺夫函数证明了编队的稳定性。文献[23]针对领导者可能会出现故障的情况，提出了一种解决方法，即在编队中配置2个领导者，当前领导者出现问题时，备用的领导者立即生效，起到领航的作用。这种编队控制策略简单且易于实现，但其鲁棒性较差。整个系统的编队对领导者依赖性较高，同时整个系统缺少编队信息反馈。当领导者与跟随者之间的性能差异很大或者信息传输线路复杂，跟随者跟不上领导者时，较大的编队误差可能会使得整个系统无法实现期望的编队构型。

随着多体一致性控制问题取得越来越多的成果，很多学者尝试将一致性理论引入到编队控制问题中，形成了一种新的基于一致性的编队控制策略。其主要思想是通过分布式协议的作用，让多体系统中所有个体的状态或者输出相对于某个共同的编队参考保持一致的偏差，最后达到期望的编队。此外，相比于定常编队，时变编队更具有一般性。在很多实际的工程运用中，由于外部条件约束，多体系统的编队结构需要改变。例如在多飞行器执行打击任务时，需要执行目标区域搜索和目标跟踪等任务。当外部环境存在障碍物使前进空间受限时，多飞行器的编队构型需要改变，同时各枚飞行器之间的通信结构也可能随之改变。因此针对多飞行器集群协同控制问题，对时变编队控制方法的研究尤为重要。文献[24]针对多飞行器编队形成和变换过程中个体避碰的需求，基于一致性理论和基于人工势场法设计了一种具有避碰功能的时变编队控制方法。文献[25]基于反步控制方法，设计了一种时变编队控制器。文献[26]将多无人机系统视为二阶积分器，运用深度增强学习控制方法设计了相应的时变编队控制器。文献[27]采用非奇异终端滑模控制方法设计了适用于多架无人飞行器的时变编队控制方法。对于无人机、导弹以及某些航天器来说，某些情形下其线速度和角速度等状态变量并不能通过测量装置直接测量。因此在多飞行器时变编队控制器中引入这些状态变量作为反馈信息进行控制时可能会导致设计成本高，实际操作困难。此时运用个体的输出变量作为反馈，进行自适应状态时变编队控制器的设计更加具有一般性和实用价值。文献[28]在只有输出信息可用的情况下，为了适应无向通信拓扑和有向通信拓扑两种情况，设计了一种基于输出反馈的自适应状态时变编队控制方法。由于飞行环境等因素的变化，多枚飞行器进行编队飞行时的通信拓扑可能会发生改变。针对这一问题，文献[29]设计了在多体系统的通信拓扑发生切换的条件下，基于状态反馈和输出反馈的自适应状态时变编队控制器。文献[30]通过引入自适应输出反馈的方法，基于动态输出反馈构造了自适应输出时变编队控制器，并提出了分布式设计自适应输出时变编队控制器的算法。该方法仅需要传递维数较低的控制器输出信息，便可以实现对群系统的时变编队控制，大大节约了通信成本，适用于通信条件受限情况下的多飞行器编队控制。

2.3 协同制导

为了有效突破反导防御系统，目前国内外对于多飞行器协同制导技术的研究，主要集中在对目标实施同时打击(或者同时进入对方防区)的层面。从实现手段上来看，可以分为两大类：基于攻击时间可控的独立导引方法和基于弹间通信拓扑的协同导引方法。传统的制导方法以收敛弹目距离或收敛视线角速率为设计制导律时的目标。而考虑攻击时间控制的目的是在规定时间内把弹目相对距离减小到0，即在传统三维制导的基础上叠加时间为第4个维度，称为四维制导。为了实现多枚导弹对目标的协同攻击，提升突防能力，攻击时间控制需要预先为各枚导弹设定一个或者分组设定不同的攻击时间，然后各枚导弹按照指定的攻击时间独立完成攻击任务。换而言之，攻击时间可控的独立导引方法在实施过程中，各枚导弹之间是没有通信联络的。文献[31]对于反舰导弹面对舰空防御系统时突防概率不足的问题，提出了一种同时命中的策略来提高突防概率：发射前为每一枚反舰导弹装定相同的攻击时间，通过设计攻击时间可控的制导律来保证多枚反舰导弹对军舰的同时命中。基于弹目相对运动学关系近似线性化思想，文献[32]设计了一种考虑目标探测可观测性增强的攻击时间可控制导律。文献[33]基于传统比例导引法，设计了一种考虑导弹视场角约束的攻击时间可控制导律，该制导律仅需要当前弹目距离与航向角信息，便可以求解出有效导航比的解析解。文献[34]基于滑模变结构控制方法，设计了一种攻击时间可控的制导律，该方法适用于导弹初始前置角较大的情形，可以实现对静止目标与匀速直线运动目标的打击。文献[35]在考虑导弹动力学模型的基础上，运用滑模变结构控制方法设计了一种攻击时间可控的三维制导律。

与攻击时间控制制导方法不同，协同制导不需要预先为每枚导弹设定相同的攻击时间，多枚导弹利用数据链在线传输协调变量，然后在协同制导律的导引下，完成攻击时间的协调一致。根据导弹在通信网络中的地位的不同，协同制导又可以分为基于领弹-从弹架构的协同制导律以及分布式协同制导律。文献[36]研究了在二维横侧向平面下，领弹与从弹协同攻击固定目标的问题，领弹采用比例导引法，从弹对领弹进行跟踪，并给出了从弹的法向过载指令与轴向过载指令表达式。为了减少通信资源的占用，文献[37]基于协调变量的思想设计了从弹的协同制导律。文中以目标为领弹，以位置与速度为协调变量，给出了分布式协同制导指令的表达式，通过合理的权值选取，可以保证从弹对目标的跟踪，进而完成协同攻击任务。文献[38]基于一致性理论、代数图论以及传统比例导引法，针对多弹异构分布式协同攻击问题，设计了一类领-从分布式协同制导律。文献[39]基于高可靠的De Bruijn通信拓扑网络，设计了一种领-从式协同制导律。该方法形式简单，容错性与灵活性较好，便于工程实现。上述基于领弹-从弹架构的协同制导律具有攻击时间控制准确、便于工程实施等优点，但必须以领弹与从弹间的正常通信为前提。当领弹与从弹间的通信中断、领弹被拦截或飞行异常，将会导致整个协同作战任务的失败。与基于领弹-从弹架构的协同制导律不同，分布式协同制导律网络架构内的成员地位平等。文献[40]以剩余飞行时间的估计值为协调变量，设计了一种打击静止目标与机动目标的分布式协同制导律。为了降低通信网络的资源损耗，文献[41]基于邻居信息，设计了只依赖局部信息交互的协同制导律，并给出了保证协同制导有效的参数选择方法。文献[42]基于一致性理论，设计了一种适用于通信拓扑固定与切换情形下的分布式协同制导律，并严格证明了协同制导律的稳定性。在实际的协同作战中，由于作战环境与其他约束条件的限制，多飞行器间的通信拓扑可能发生变化。文献[42]中的方法可以很好地适应这种情况。文献[43]针对多飞行器分组打击多个目标的作战情形，基于组内通信与组间通信，设计了一种分布式分组协同制导律。基于反馈线性化的设计方法与李雅普诺夫稳定性理论，给出了分组协同制导律在固定与切换拓扑下有效的充分条件。文献[44]针对多飞行器协同攻击机动目标的问题，基于主-从飞行器架构，设计了一种异构体飞行器协同制导律，主飞行器与从飞行器组成异构协同攻击编队，对目标形成多打一的作战态势。该制导律在固定拓扑与切换拓扑情形下，均能实现对机动目标的协同攻击，为多飞行器协同攻击机动目标提供了一种可能的解决方案。

3 总结与展望

本文分析了多飞行器集群协同制导控制问题的关键技术，介绍了任务规划与动态目标分配方法、时变编队协同控制方法和多约束条件下的协同制导方法的研究成果。目前，多飞行器集群协同制导控制方法的研究还处于发展阶段，未来研究的主要发展方向有以下几点：

1)基于深度学习的多约束条件下快速任务规划与动态目标分配方法

多飞行器系统在执行任务时，会受到诸如地理、气候等因素的限制。此外，导引头视场角、探测距离、多飞行器间的通信以及飞行器自身复杂的动力学特性也是影响协同任务规划与目标分配的因素。如果在目前已有的任务规划与目标分配方法上直接添加上述约束条件，可能会大大降低规划与分配计算的准确度。深度学习作为机器学习当中一种重要并且较新的方法，具有自主学习性强、模型效果好、分配识别精度高等优点。因此，在多种约束条件下，运用深度学习实现快速任务规划与动态目标分配，是未来多飞行器协同作战技术的重点研究方向之一。

2)基于强化学习的复杂作战环境下多飞行器编队控制与队形优化

在多飞行器集群协同作战过程中，由于作战环境、敌我态势等因素复杂多变，多飞行器间的通信会受到较大影响，可能会出现拓扑切换、通信延迟和通信噪声等情况，对协同作战造成一定程度的影响。此外，针对多样化的作战需求，需要对多飞行器的编队构型进行优化，使多飞行器能够更好地完成协同探测、编队突防以及中末制导交接班等任务，对目标形成更有利的作战态势。强化学习具备对未知环境很强的适应能力，能够在控制与环境反馈的反复交互作用中以学习的方式不断优化系统的性能指标，非常适合复杂作战环境下的多飞行器编队控制与优化。因此，基于强化学习的复杂作战环境下编队控制与队形优化方法是未来重要的应用研究方向。

3)基于博弈理论的协同制导技术

相比于现有大多数制导方法，基于博弈理论的制导律不需要对目标的逃逸加速度进行估计，即可同时得到导弹的最优拦截策略与目标的最优机动策略。目前，基于博弈理论的协同制导问题研究处于起步阶段，绝大多数研究成果为单对单的追逃博弈或三体问题，多弹间的协同作战策略尚未体现在微分博弈的框架中。若通过在代价函数中加入协同打击指标或者结合势能函数的思想，将微分博弈理论成功运用到协同制导方法的设计中，不仅能够得到多弹间的最优拦截策略，还能实现对目标的协同打击，实现某种意义下的最优协同制导。因此，研究基于博弈理论的协同制导技术，是今后协同制导方向的工作重点。

总之，在未来高动态、强对抗、拒止作战背景下，飞行器集群智能化、自主化、高可靠、强鲁棒作战将成为未来战场上的主要作战形式，对多飞行器协同制导控制技术进行深入研究具有重要意义。