无人机协同控制研究综述

2021-07-02 00:36马子玉刘祖均顾凌枫刘锦涛

计算机应用 2021年5期

马子玉，何明，刘祖均，顾凌枫，刘锦涛

（中国人民解放军陆军工程大学指挥与控制工程学院，南京 210000）

（*通信作者邮箱paper_review@126.com）

0 引言

自然界中许多生物群系都是由大量个体组成。虽然个体功能简单，并且获取信息的方式单一，但它们成功凭借局部交互构成了复杂的群体行为，完成躲避捕食者［1］、寻找猎物［2］和长途迁移［3］等任务。集群行为的研究方法共经历3 个发展阶段：1）生物集群行为的发现阶段，许多生物研究者通过长时间观察发现生物群体特有的行为［4］；2）群集行为的仿真阶段，研究人员用计算机模拟并完成了生物群集行为的测试；3）严格的建模和集群行为的分析，这是目前正在进行的研究［5-6］。集群作为一种集体行为，它最重要的特点便是从简单的局部规则演化为协调的全局行为。从系统学的角度看，群体行为具有自适应性、鲁棒性、分散性和自组织性等特点［7］。无人机集群作为一种新型的集群系统，无论在民事还是在军事领域都有着广泛的应用场景。

随着技术发展，无人机（Unmanned Aerial Vehicle，UAV）逐渐代替危险环境中的工人，执行未知领域探索和危险环境监测等D3 类任务（Dull，Dirty and/or Dangerous missions，D3 missions）。科技的进步推动了无人机自动化水平的提高，让操作者可以下达抽象式指令，而非进行详细地控制，例如手动操作避开障碍等。在战场环境中，人工控制的减少将使决策中心从传统的后方转移至战场中心，相较于远程控制，直接参与作战的单位对战场有着更强的理解，能够更快地做出决策。但单无人机能力始终有一定的限度，存在搜索范围小、环境敏感度低和运行时间短等问题，同时单无人机在遇到硬件损坏或软件故障等情况时很难顺利完成任务，因而多无人机协作应运而生。无人机协同系统是一组无人机通过与其他无人机和周围环境相互作用来完成特定任务，作战成本低、自适应能力强和可扩展性强等优点［8］使得无人机集群协同作战越来越受到各个国家的重视。无人机集群技术发展至今，日益广泛地应用于国土资源遥感、警事维稳、电力巡线、环境监测和城市规划等民用领域［9-12］，同时在军事领域的火力打击、电子对抗、雷达诱骗和侦察搜索等特殊任务［13-15］中也扮演着重要角色。

协同控制算法根据控制方式和目标的不同主要分为三类，包括一致性控制、蜂拥控制和编队控制。其中一致性问题是学者关注最多的一个问题，Ren 等［16］对一致性问题研究做出系统性解释，但未包括近几年获得的一些重要成果；Sun等［17］和Wiandt 等［18］对蜂拥控制进行回顾，但没有讨论其他的相关协同技术和蜂拥控制算法的具体应用；Senanayake 等［19］研究了用于搜索和跟踪的协同算法，但缺少对协同系统的其他应用和算法的介绍。本文主要介绍近几年协同控制算法在无人机领域的具体应用和相关算法的研究进展，回顾学者在解决一些难题时做出的努力和总结目前仍存在的问题。

1 无人机应用

随着社会发展，无人机技术在越来越多的行业中扮演着重要角色。研究人员也在研究通过多架无人机合作来拓展和改进它们的应用。多无人机技术已在搜索救援、城市规划和军事需求等领域投入使用。本章将介绍多无人机协同控制的应用现状和发展潜力。

1.1 民事应用

搜索救援相较于传统的地面或直升机搜索救援，无人机成本更低且效率更高。在危险环境中搜索时间是救援能否成功的关键因素，相较于救援车，无人机可更快到达救援地点；相较于直升机，无人机装载的人脸识别系统和鸟类视觉比人眼更为灵敏和耐心。无人机部署时间短，针对大范围的搜索救援工作多无人机协同合作有着更直接的优势。在2006年的卡特里娜飓风灾后，美国使用多架自主无人机为救援行动抢下许多宝贵时间。Maza 等［20］在模拟火灾场景中使用两架无人机协作实时监控消防员的行动和安全情况。Goodrich等［21］合作研发出一套用于荒野搜索和救援的微型无人机，通过技术手段收集和分析失踪人员的可能迹象来建立模拟失踪人员行为的随机模型。如果该模型与某一受害者相匹配，那么就可以定位失踪者目前的可能位置。该系统解决了载人直升机的局限性，也为无人机协同控制方法提供新的思路。

城市规划灵活性高、视野广阔和无障碍进入多数环境等优势使得无人机成为绘制地图和城市规划的流行工具，无人机如何协助研究人员绘制地图已有很多研究［22-24］。Remondino 等［22］成功使用多无人机进行空间测绘和三维建模，对无人机的编队和分布方式提出具体要求。Lin等［23］利用无人机激光探测技术绘制芬兰部分地区的精细地图。在对违章建筑监测［25］过程中，多无人机协同配合，可快速完成区域内重点建筑的调查取证工作。不仅如此，无人机定位在危险环境或未知环境起着重要作用［26］。Han等［27］提出多无人机遥感进行核辐射场景下的测绘，降低危险环境下多无人机的工作成本并提高原子辐射探测的工作效率。

1.2 军事应用

无人机协同控制在军事领域中有着许多现实和潜在的应用。从侦查搜索到对地精准打击等任务已经证明一组低成本、组织性强的无人机群比单一的高成本无人机有着更强的作战能力。通常协同作战需要无人机以固定结构飞行，编队飞行的优势之一便是通过定位跟随可减少无人机的飞行阻力，显著降低油耗［28］。图1 展示了四种无人机集群参与的军事任务。

图1 无人机集群军事应用Fig.1 Multi-UAV military missions

火力打击相较于传统的火力打击，无人机作战距离更远、打击精度更高、人员伤亡更低。无人机集群式作战可提供更大范围的火力覆盖和更高的成功率。主动释放的诱饵无人机在受到攻击时，可收集敌方雷达和战车等重要设施的位置信息，为后方精准打击提供先机。面对敌方火力防线，无人机集群中部分无人机将作为“僚机”，负责护送携带高杀伤武器的无人机进入其有效攻击范围。不仅如此，导弹控制系统也可仿照无人机协同控制，面对敌方多层次防御体系，一组导弹协同作战更能实现对关键目标的精准打击。

电子对抗通过电子对抗进行隐藏通常被称为干扰，一般是依靠噪声形成雷达干扰以达到欺骗的作用，电子对抗使得我方单位从敌方雷达中隐去，是战场获胜的重要先机。一般而言，干扰可分为自干扰和支援干扰。自干扰是无人机采用雷达干扰以实现自我保护，支援干扰则是多架无人机协同干扰以掩护其他单位。Kim 等［29］针对无人机的护航任务，提出一种紧密编队和协同合作来欺骗对空导弹的跟踪雷达。

侦察监视无人机凭借空中优势可以有效完成侦察任务，如派往敌方空域收集重要设施的位置信息，在科索沃战争中，美军就利用侦察无人机精准轰炸了南联盟70%的军火库和30%的指挥所［30］。同时无人机可用于搜索渗透至我方范围内的敌人，在森林场景中，其特点是许多小的障碍（树或灌木丛）和一个个独立的目标单元（敌人），相应策略是增加单独行动的无人机数量，并提供一定攻击能力（如果包含火力打击任务）；而视野开阔的平原，其特点是障碍物少、目标单元密集，相应策略则是出动分布广而稀疏的无人机群，保证大范围的侦查视野。

战术格斗在正面战场上，无人机带来的“战斗零伤亡”是指挥官们一直追求的目标，通过操作员实现远程作战可有效完成各种高危险任务［31］。但在大规模对抗中，“一人一机”模式下操作员数量的增加会对控制中心和通信造成很大的负担。“有人机+无人机”模式由此提出，操作员控制单个或部分无人机，无人机群依靠协同系统共同完成操作员下达的指令。无人机群转变成作战小组，组内成员合作完成任务，同时小组间也可分工合作实现某些战术。美军曾实验5 架协同无人机与8 架配有预警机的F-22 对抗，最终战损比为8∶0［32］，由此可见，无人机集群协同控制使得战术能融入无人化作战当中，对未来战争将产生很大影响。

2 协同控制方法

根据方法的不同协同控制算法主要分为三类，包括一致性控制算法、蜂拥控制算法和编队控制算法。下面将具体介绍三种算法的一般定义与研究现状。

2.1 一致性控制

2.1.1 一致性算法

在协同控制领域中一致性一直是一个重要而复杂的问题。一致性是指一组智能体通过传感器或通信网络相互交流，使得所有智能体的状态随时间趋于一致。根据通信方式的不同，主要分为微分和差分方程两种建模方式。最常见的动态微分方程为：

其中：xi(t)表示无人机i在t时刻的状态信息，A=[aij]为邻接矩阵，如果无人机i和j之间存在通信，则aij=1。式（1）可以重写为：

其中：L=D-A表示拉普拉斯矩阵，根据拉普拉斯矩阵的性质，系统达到一致性的条件为：

当无人机之间的通信质量低时，一般可采用间歇性通信方式，通过差分方程更新无人机的信息状态。一般性离散时间差分方程［33］如下：

记x=[x1，x2，…，xn]，A[k]=[aij(k)]，则式（4）可写成矩阵形式：

相似地，智能体系统达到离散时间一致性的条件［33］为：

2.1.2 一致性控制研究现状

一致性控制起源于计算机科学和并行计算［34-35］。Vicsek等［36］提出的Vicsek模型实现了Reynolds三种规则中的“对齐”规则，集群中智能体以匀速率运动，其运动方向由周围邻居速度方向的平均值决定。过去的几年中，Jadbabaie 等［37］和Olfati-Saber等［38］的研究工作对其他学者研究一致性控制问题产生了相当大的影响。具体而言，Jadbabaie 等［37］将Vicsek 提出的动态模型线性化，通过图论和矩阵分析等工具为对齐行为提供理论支持。Olfati-Saber等［38］则提出了解决积分器网络一致性控制问题的一般性框架。随后Ren等［39］在此基础上将一致性问题推广到二阶系统，证明了有向网络中多智能体系统的稳定性。

为实现无人机集群分布式控制，许多学者已提出多种不同方法，其中基于图论的一致性控制算法越来越受到关注。该算法将无人机抽象为图中的节点，无人机之间的通信则用边表示，其优点是可用图表示任意队形，理论较为成熟。Jamshidi 等［40］为无人机的协同控制设计了一个实验台和共识技术；Rezaee 等［41］提出一种针对高阶多智能体系统的一致性协议，展示了智能体如何利用周围邻居共享的相对位置信息实现一致性；Shoja等［42］针对非线性非完全动态系统设计一种基于估计的一致性控制方案，并成功跟随多个领导者；Gallehdari 等［43］提出一种实时分布控制重构法，该算法利用智能体的最近邻信息和内部故障检测与识别功能，保证智能体出现故障时仍可以保持一致性。算法中智能体采用一阶动力模型，在最小化维持故障智能体运行成本的基础上设计控制器，从而优化了集群的性能指标。

2.2 蜂拥控制

2.2.1 蜂拥算法

与一致性算法的策略相反，基于蜂拥算法的集群并不一定是一个刚性的形状或结构，即一致性算法要求系统是固定拓扑，而采用蜂拥算法的系统的拓扑结构在运动过程中可能会发生变化。蜂拥算法一般要求智能体满足Reylnolds［44］提出的三种规则，即：

2.2.2 蜂拥控制研究现状

蜂拥被定义为由一群可独立行动的个体组成群体以实现共同目标的集体行为。蜂拥控制算法的灵感来源于自然界中的蜂群和鸟群等自然群体，并主要参照Reylnolds［44］提出的三种规则建立分布式控制算法。Reylnolds根据附近邻居的位置和速度对智能体的运动建立Boid 模型，提出分离（碰撞避免）、对齐（速度匹配）和聚集（集群中心）三种规则。智能体的影响区域被分为3 个部分：排斥区（zor）、保持区（zoo）和吸引区（zoa）。以图2无人机为例，由于局部通信存在距离限制，无人机只能感知到一定范围内的个体。考虑到无人机的碰撞体积和活动范围，无人机间为避免发生碰撞应设置安全距离，即排斥区。在排斥区内，无人机间的排斥作用力会使两者距离逐渐增大。同时，为避免保持通信的两架无人机失去联系，会在感知范围内设置吸引区，通过吸引力使邻居无人机进入保持区。而在保持区的无人机间相对势能达到最小值，且两者运动方向将逐渐一致。

图2 智能体邻域分布Fig.2 Agent neighborhood distribution

Moshtagh 等［45］基于图论知识提出一种新的蜂拥算法，通过最短距离控制来最小化相对势能以到达速度匹配和聚集的效果，实验结果证明即使集群的拉普拉斯矩阵发生变化时仍可以保持蜂拥，同时只要保证良好的通信还可以实现一致性控制。Martin 等［46］设计一种新的二阶动力学模型，认为智能体存在通信半径并且集群内各智能体的通信半径随机，并证明在选择合适的初始速度误差后集群最终实现蜂拥。Martinez 等［47］针对固定和移动障碍物下的集群行为进行研究，实验结果表明，在低噪声固定障碍物情况下，可以得到与之前相同的观察结果；但在移动障碍物情况下，集群的稳定性随障碍阻力的增加而加速破坏。同时发现另一个有趣的结论：在某些情况下，引入低阻力障碍物可得到比自由状态下更有序的集群。Zhao 等［48］提出一种具有改进自适应速度和加权策略的快速收敛模型，该模型认为少数个体对系统的影响比一般个体大，当它们中部分与集群失去联系时甚至会导致整个系统的崩溃。Jolles 等［49］将Reylnolds 模型用于对鱼群的集群行为研究，研究发现同类鱼个体离开群体探索未知区域（为获得更多食物，但风险增大）的倾向大体相同，同时鱼群间保持着清晰的吸引和排斥区，由它们的速度和航向决定。

2.3 编队控制

编队控制是指集群中所有无人机调整自己的位置状态以达到规定的几何形状。如果从感知能力和拓扑交互的角度来描述编队控制，便会遇到这样一个问题：为实现目标编队控制，传感器需要获取哪些参数信息，这些参数中又有多少是无人机可主动控制的。无人机可获取何种参数决定了个体的感知能力，同时可控的参数变量类型将与交互拓扑相联系，例如如果无人机的全局位置信息可以被主动控制，那么这些无人机便可直接移动到目标位置，而不需要局部信息交流；如果可以主动控制无人机间的距离，那么将系统视为固定拓扑，集群的网络结构则为刚体。基于以上信息，可将现有编队控制的研究分为基于坐标控制、基于位移控制和基于距离控制三种研究。表1展示了三种控制方式的主要区别。

表1 三种控制方式的区别Tab.1 Differences between three control methods

2.3.1 编队算法

根据编队算法的分类将先介绍一般性编队控制算法，之后讨论基于坐标、位移和距离三种控制算法的区别。一般性编队算法的动态方程为：

其中：xi∈表示无人机的状态信息，ui∈和yi∈表示可获取的参数变量，zi∈Rr表示无人机i的状态输出。设z*∈Rnr为给定的时间函数，则式（8）的目标编队可以写成以下约束形式：

如此，一般性编队控制问题便是在仅获取参数变量yi的情况下，如何设计一种控制协议使得关于无人机系统（8）的集合Ez*={x：F(z)=F(z*)}渐进稳定。

基于坐标控制参数yi是在全局坐标系下的绝对变量，无人机i可主动控制自己的输出zi，式（9）可写为：

基于位移控制参数yi是在全局坐标系下获取的相对变量，无人机i的输出zi具有平移不变性，式（9）可写为：

基于距离控制参数yi是在智能体的局部坐标系而非全局坐标系下获取的相对变量，无人机i的输出zi具有平移和旋转不变性，式（9）可写为：

2.3.2 编队控制研究现状

基于坐标控制智能体根据全局坐标系确定自己的位置。主动控制自己的坐标，移动到全局坐标系下的目标位置以实现协同控制。基于坐标控制的研究方向一般分为两种：1）凭借各智能体之间的相互作用来提高编队控制性能；2）引入全局协调器从个体获取反馈并为群体提供适当的协同命令，在个体的驱动能力有限或者受到干扰时这种反馈式协同十分有益。Van Tran 等［50］在假设智能体可感知自身状态和邻居相对于全局坐标系状态的条件下，提出了一种基于位置的控制协议来驱动智能体跟踪期望轨迹；Cortés［51］在基于位置控制的基础上引入分布式位置估计，每个智能体都沿最短路径运动到目标位置，实验表明系统全局估计位置以指数形式收敛至实际位置，实际位置以指数形式收敛至目标位置；刘祖均等［52］基于分布式重新建立主机-从机协议，成功实现多无人机的避障和编队重构。

基于位移控制智能体主动控制与邻近智能体的相对位移以实现协同控制，假设每个智能体能够感知到邻近智能体相对于全局坐标系的相对位置，这意味着智能体需要知道全局坐标系统的方向。不过这些智能体既不需要全局坐标系本身信息，也不需要清楚它们关于该坐标系的具体位置。Cortes［53］研究了相对位置感知故障和错误的系统鲁棒性问题，提出一种用于离散时域单积分器智能体模型的协同控制算法，并验证该算法对测量失败和错误的鲁棒性。在智能体局部坐标系方向相同的条件下，Han 等［54］通过局部通信使用速度和位移测量来估计邻居的实时相对位置，结果表明持续控制输入条件下相对位置的估计值和相对速度间呈指数收敛关系。

基于距离控制主动控制智能体间的距离以达到由期望距离所形成的协同控制。假设单个智能体可感知相邻智能体在自己局部坐标系下的相对位置，同时局部坐标系并不需要完全对齐。在基于距离的控制中，即使智能体模型是线性的，控制协议一般也是非线性的。此外多智能体系统在基于距离的控制协议下的不变集分析也是目前研究的重点。如果多智能体系统的交互图不完整，则需要智能体通过控制部分智能体间的距离来达到期望的距离。Kang 等［55］提出基于距离的领导者跟随控制算法，通过自适应算法来测量相对位移以估计领导者的速度。Ahn 等［56］设计n维基于距离的无向协同控制，但关注的是局部稳定性。在集群中只有单智能体接收到编队控制的具体信息的情况下，Yang 等［57］提出一种分布式估计器协助智能体估计变量，并在一般刚性结构系统中取得较好结果。

3 问题与挑战

随着应用无人机的不断普及，越来越多的现实问题开始出现在研究者面前。时延［58］、通信带宽［59］和躲避障碍［60］等问题阻碍无人机技术的发展，虽然学者已经取得一些相关成果，但离完全解决仍有很大的距离。

时延由于传输速度限制，且传感器获取信息需要一定时间，实际生活中几乎所有系统都存在时延问题。无人机集群在执行任务时需要对系统发出的指令立刻做出反应，以应对碰撞避免、障碍躲避等问题。在一致性控制中，时延可大致分为通信时延和输入时延，前者是通信距离造成的延迟，后者则是无人机在飞行中更新运动信息产生的延迟。Hu 等［60］证明只要通信时延在一定阈值内便不会造成系统崩溃，但依旧会影响系统的稳定性。Min 等［61］基于分数阶微积分模型求出一阶系统实现一致性的必要条件，并设置输入时延的最大上限，但对于高阶非线性系统，仍没有较好的解决方法。

避障躲避障碍是无人机执行任务不可避免的问题，对于个体具有自主决策能力的多无人机系统而言，在移动过程中躲避障碍是最基本的要求。在蜂拥控制中，避障控制的基本策略是将前方障碍物想象成一个圆柱体模型［62］，存在多个障碍物时无人机会优先避开最近的目标，但该方法没有考虑障碍物的实际大小以及障碍物与无人机之间的距离对无人机转向控制力的影响。Olfati-Saber［63］假设障碍物是一个移动的智能体，障碍物进入无人机感知范围时将障碍物视作邻居处理，但无人机在绕过障碍物后仍会受到障碍物影响。路径规划问题是无人机研究领域的一个热点，通常采用蚁群算法和模拟退火算法等算法寻找出一条合理路线，但这需要全部障碍物的位置信息。对于未知环境还需依靠无人机本身的自主决策能力。

信息估计编队控制多采用集中控制以提高系统稳定性，但对于大型无人机集群全局通信成本太过高昂。随着无人机自主化水平提高，将更多依赖局部通信，这意味着需要一种分布式协议去预测全局信息。一方面，应设计一种局部分布估计系统，可以在有限时间内估计出某些全局信息；另一方面，基于局部估计来设计局部控制器，提高闭环系统稳定性。基于估计的分布式控制本质上是集中式控制和分布式控制的结合，它将分布式控制用于全局信息的估计，将集中式控制思想用于局部控制器的设计。但包含分布式估计器的无人机系统比没有分布式估计器的无人机系统要复杂得多。在无人机协同控制系统中，必须适当地替换某些昂贵的测量设备或使用分布式估计，而代价是控制系统设计困难性增加和系统稳定性分析更加复杂。此外，诸如有界控制输入、异步通信和信息量化等物理限制可能会降低联合估计和控制方案在各种分布式无人机协同系统中的适用性。

离散通信传统的飞行控制都是假设可以连续接收控制信号或者保持持续监听，但这需要足够的计算资源和理想的通信环境来支撑。实际应用中无人机携带能源和通信带宽有限，如果持续性与周围无人机通信将造成续航时间缩短和通信堵塞等问题。因而有学者提出采用离散性控制，一般将离散控制分为周期性和非周期性两种。周期性控制是在固定时间间隔后触发通信，然而一方面在系统状态逐渐接近平衡时，周期性触发通信的机制仍可能导致通信和计算资源的过度消耗。另一方面，尽管周期性快速采样可以更有效地捕捉到关键系统状态，但高频的数据更新终将导致诸如如成本上升或通信堵塞等不利结果，对其他重要功能造成影响。因而，如何设计合适的控制方案，在保证质量控制性能的同时，显著减少通信和计算资源的过度消耗，是当前需要解决的一个重要问题。非周期性控制则是指无人机在满足某种条件后才产生通信，其中包含事件触发［64］和自触发［65］等方式，但仍存在Zeno行为［66］的风险。

4 结语

本文对无人机协同控制技术的算法和应用进行了详细介绍，分开讨论近年来研究的主要方向和所用技术。展示无人机协同控制领域的最新研究成果，并分析各种方法的优缺点，探索无人机协同控制技术在各领域的应用。本文中可能仍会遗漏一些合作领域的相关研究，但希望所做工作可以帮助读者对无人机协同控制领域形成直观了解。