基于Agent与元胞自动机的无人机集群混合式控制

2021-12-13 07:32肖宗豪张鹏迟文升刘畅

北京航空航天大学学报 2021年11期

肖宗豪，张鹏，迟文升，刘畅

（1.空军工程大学研究生院，西安 710051； 2.空军工程大学装备管理与无人机工程学院，西安 710051；3.中国人民解放军 32151部队，邢台 054007）

世界的发展总是新事物不断代替旧事物，战争模式始终都在随着武器的发展而不断革新。当前各类飞行武器、防空武器、电磁武器飞速发展，作战环境日趋复杂，信息更多源、态势更复杂、情景更动态、逻辑更多变。单无人机由于自身局限性、低容错性，而难以适应充满未知和不确定性的作战环境。相比之下，无人机集群拥有高机动、强鲁棒、强扩展、高费效比等优势［1］，在作战中系统通过功能分布化、攻击饱和化等方式形成群智效应［2］和蜂拥效应［3］，可极大提高系统作战效能，因此无人机集群作战必将成为优于传统空战的新型作战样式，可应用于空中对抗、饱和攻击、协同侦察等领域［1-4］。

无人机集群是指通过约定组织规则，使拥有自主能力的无人机，通过一定规则形成超大规模无人机作战群体，通过群间协作形成群体智能及效能涌现，以较小代价较高效率完成作战任务。而集群有效执行任务的前提是对集群实现有序、高效的动态控制，控制策略的优劣直接影响集群系统的安全与稳定，因此集群控制方式是集群研究的关键。

当前无人机集群控制方式研究的主流思想分为2种，即自上而下的集中式控制和自下而上的分布式控制［5-6］。集中式控制主要有领航-跟随法［7-8］、虚拟结构法［9］，分布式控制主要有行为控制法［10-13］、一致性理论法［14-16］。领航-跟随法以领航者无人机作为位置和姿态基准，其余无人机以其为中心跟随飞行，通过控制领航者的飞行状态使集群按照预定航迹飞行。该方法全局协调性好、结构清晰、系统简单，但对领航者节点脆弱，系统容错性、灵活性差。虚拟结构法是对领航-跟随法的一种改进，将集群编队看成虚拟刚性结构，每架无人机跟随虚拟长机飞行。该方法很好地解决了由于长机故障造成编队混乱的问题，且提高了系统控制精度，但通信负载随集群数量成比例增加，并且仍存在容错性、灵活性差的问题。行为控制法是受生物群行为启发为无人机设计相应基础行为，通过不同基础行为组合实现个体无人机及集群的控制。该方法使得集群系统具有良好扩展性，并可通过实时环境反馈及时调整编队状态，但易陷入局部最小值。一致性理论法指无人机利用邻近无人机状态信息更新自身状态，通过一致性算法使集群实现一致。该方法使集群系统机动性、可靠性、适应性增强，但通信要求高且队形变换整体性较差。

无论集中式还是分布式，各自都存在着优势与不足，对于集群控制若无交互则鲁棒容错性差，若无中心则全局可控性差。因此本文尝试将2种控制方式结合，提出了一种基于Agent与元胞自动机（Cellular Automata，CA）的集群混合式控制模型，使集群系统既可控又灵活，既局部稳定又全局一致，既降低整体通信消耗又避免中心节点过载。将集群分为中心长机、小组长机、个体无人机3个层次，依据集群作战流程构建无人机集群混合式控制体系框架结构及相关控制规则。考虑元胞自动机模型具有演化规则统一、个体受局部影响特点，Agent模型具有层次性、个体不限于邻域作用特点，遂通过2个模型实现2种控制方式结合，构建集群混合式控制模型。最后以集群的编队集结与保持任务为背景，采用50架集群规模对分布式、集中式与混合式3种控制进行对比仿真，验证了本文集群控制模型的有效性。

1 Agent与元胞自动机结合可行性

1.1 元胞自动机理论

CA［17-19］是在时间、空间维度离散的动力学系统。CA由元胞、邻居、元胞空间和状态更新规则等构成，各部分关系如图1所示。CA系统可表示为A＝（Ld，S，NA，f），A为CA系统；L为元胞空间；d为元胞空间维数；S为有限的元胞状态集；NA为包括当前元胞在内所有邻居元胞集合；f为CA状态演化规则。元胞状态受上一时刻状态及邻居元胞状态影响，并按设定的局部规则更新状态，大量元胞通过局部作用使元胞空间整体变化。

1.2 Agent基本理论

Agent概念是一类具有相互之间沟通能力、环境适应能力及通过学习改变自身行为和运行规则的个体［20-22］。在多智能体系统（Multi-agent System）中，多个智能体能够按照一定组织形式集合起来组成一个具有一定结构的系统，不同智能体具有不同角色、层次、演化规则。基本的Agent模型结构一般包含感知器、效应器、决策器、知识库、通信器等部分，如图2所示。

图2 Agent结构模型Fig.2 Agent structure model

1.3 结合可行性与适用性

CA和Agent理论都可对复杂集群系统进行反映、描述，在理论方法研究和应用存在关联，两者共性包括：①都具有良好的开放性；②都运用规则驱动系统运行；③都采用并行运算方式将问题离散化；④都具备空间性。这些共性为两者结合提供了可能。

两者差异包括：①系统结构不同，Agent系统层次性强，而CA系统是由同质元胞组成的单层结构；②个体形式不同，Agent的个体允许不同存在形式且可自治，而CA元胞形式单一且同质；③演化规则不同，Agent运行规则多样且多层，而元胞自动机演化规则统一；④影响因素不同，CA中个体元胞受局部及自身状态影响，Agent相互影响不限于局部范围还考虑环境。这些为两者结合提供了必要性。

无人机集群是复杂系统，其中不同无人机个体既存在层次性、差异性，又存在共通的运行规则。CA模型具有规则简单、运算快速等特点，但难以体现集群个体差异；Agent模型能准确地描述集群系统层次性和差异性，但无法充分体现集群个体的局部作用和统一个性，且实现复杂。因此，通过对模型适当改进实现Agent与CA结合，可更加全面地对无人机集群系统进行构建与描述。

2 无人机集群混合式控制框架与控制规则

2.1 无人机集群作战流程分析

无人机集群是庞大的复杂系统，集群控制策略的设计需从集群实际作战流程出发。

OODA作战环［23］是从整体角度对作战流程进行描述，如图3所示。无人机集群作战流程包含OODA作战环的各个要素，一次完整的集群作战行动就是一次观察、判断、决策、行动的大循环，而每一项要素又包含OODA小循环，因此，复杂的集群作战可被分解为众多的OODA环，大到整个作战系统小到单个无人机，但不同环节不同层次的控制策略不同，大循环更加注重系统战略性、整体性，小循环则侧重于局部性、实时性。

图3 OODA作战环Fig.3 OODA operations ring

在具体作战流程上，无人机集群作战的时序安排如图4所示，主要包括信息融合、战场态势分析与筹划、集群决策、集群编队抵近任务区、战术决策与编队布局、集群攻击、退出战斗。信息融合是将集群的状态、地形、气候、敌方部署与目标状态等进行融合。战场态势分析与筹划是根据情报对敌我作战实力、战场实时态势进行分析。集群决策是根据整体态势对战略布局、任务调整、航线选择等进行决策。集群编队抵近任务区是指集群按规划航线向作战空域飞行，必要时进行航线重规划及编队重构。战术决策与编队布局是指到达作战区域后集群对目标、防御等态势进行感知，而后制定战术战法，对编队进行战术部署。集群攻击指集群按照预定战法对敌目标攻击，攻击过程中集群小组可实时调整局部编队、路径，攻击完毕对攻击效果及兵力状况评估确定是否二次攻击。集群完成任务或收到退出命令则有序撤出战斗返回基地。

图4 无人机集群作战流程Fig.4 Flowchart of UAV swarms operations

由此可知，集群作战控制复杂、任务多样、层级明显、环环相扣。针对不同作战任务及模块，集群控制所侧重的系统性与局部性、统一性与灵活性、战略性与实时性要求存在很大差异，而无论是集中式还是分布式都难以单独满足复杂的差异性要求。

2.2 集群混合式控制框架及通信拓扑网络结构

集群作战是非常复杂的系统网络，为此需要一个复杂、多层的指挥体系对集群约束，又要兼顾集群个体的自主涌现性。本文构建了集群混合式控制框架与通信拓扑网络结构，将自上向下多层指挥的可控性与自下向上底层个体的涌现性融合。

2.2.1 无人机集群混合式控制框架结构

无人机集群混合式控制框架结构主要分为3级：集群中心控制主体、局部指挥控制主体、底层交战主体，如图5所示。当集群接收到作战任务，中心控制主体对任务进行分析与部署，将任务分配、传达给各集群小组，任务执行过程中各集群小组相互配合协同作战，而在各自的分任务中各集群小组以局部主体负责指挥，底层主体协调配合共同完成。集群中心控制主体由集群中心长机担任，局部指挥控制主体由各集群小组的小组长机组成，底层交战主体为集群中个体无人机，中心长机与小组长机、小组长机与个体无人机之间成双向集中式控制结构，小组长机与其他小组长机、个体无人机之间成分布式结构。

图5 无人机集群混合式控制框架结构Fig.5 Hybrid control framework for UAV swarms

中心长机性能较高，具有较强的认知决策能力。其负责与指挥控制中心通信，接收上级实时指令、反馈战场态势和集群状态；主要通过小组长机对集群进行命令下达、态势共享、编队控制等；对作战任务进行战略战术决策、任务分解分配。

小组长机负责接收、传递中心长机任务指令，向中心长机反馈集群小组状态、情报数据；对小组成员进行状态管理、局部控制、态势共享；对小组作战任务进行战术规划、组内分配、评估检测；与其他小组进行信息共享、战术协同。

个体无人机受小组长机指挥，实时反馈自身状态及探测信息；与组内无人机个体通过信息交互实现一致性控制；在小组任务中个体无人机按照上级指令要求，与其他无人机个体自主协同作战。

该混合式控制框架通过指令互联、态势共享等将三者融为一体，实现以点控面、以面聚点。中心长机将多源态势信息融合形成全局态势信息，并将态势按需共享给集群小组。小组长机与个体无人机受上级指挥，又可通过分布式网络与其他无人机协同交互。因此，该控制框架使集群兼顾了整体全局性、有序性与个体的自主性、涌现性。

2.2.2 无人机集群通信拓扑网络结构

在多智能体控制理论中，对无人机间通信拓扑网络结构的描述一般采用图论的方法。按通信方向可分类为有向拓扑和无向拓扑；按通信拓扑结构可分为固定拓扑和时变切换拓扑。本文无人机集群通信网络采取时变切换混合式拓扑结构，如图6所示，红色双向连接线为集中式通信，黑色双向连接线为分布式通信，中心长机与小组长机采用集中式通信拓扑，小组长机之间构建可交互的分布式通信拓扑，小组长机与组内无人机同样采用集中式通信拓扑，组内无人机之间应用分布式通信拓扑，且通信方向采用双向信息传输方式。同时可根据任务需求调整通信连接属性，既能实现指挥控制中心对全局的集中式通信，又可实现局部分布式通信，满足指令下达与信息交互反馈需求。该结构在保证集群通信网络连通性的基础上，极大地降低了中心节点通信负荷以及整体通信能源消耗，提高了通信网络的鲁棒性、灵活性、扩展性，可有效避免集群数量增加而导致的通信网络的复杂，便于战时通信网络的分解与重构。

图6 无人机集群时变混合式通信拓扑结构Fig.6 Time-varying hybrid communication topology of UAV swarms

2.3 无人机集群控制规则

混合式控制框架与通信拓扑网络结构为集群控制提供了硬性支撑，而要实现集群高效运行，还需集群控制规则作软性约束，根据集群层次特点，将控制规则分为集群个体行为规则和整体控制规则。

2.3.1 集群个体行为规则

集群个体行为规则适用于集群各层次无人机，包括中心长机、小组长机、个体无人机，确保每一个体在集群中生存安全、状态同步，主要规则如下。

1）集群凝聚：集群中无人机个体应凝聚成一群体，不过于分散。

2）集群分离：集群中邻近无人机个体之间应保持一定安全距离，避免发生碰撞。

3）方向匹配：集群内无人机个体与周边无人机的速度大小、方向要尽可能匹配，确保无人机个体与局部状态的一致性。

4）有限通信交互：无人机个体在群内飞行时，临近的个体之间存在相互参考作用，且只与周围有限个体进行通信交互，通过较少的交互量，实现稳定控制，减少通信冗余与信息干扰。

这些规则是集群的高效运行的基础原则。

2.3.2 集群整体控制规则

集群整体控制规则是对集群从整体、系统、战略战术角度进行调控，具体规则如下。

1）集群功能分布多样化

将功能高度集中的先进战机所具备的探测、打击、干扰、评估等功能分解，交由大量成本低廉、功能简单的无人机实现，一定数量的无人机通过不同的组织结构可形成多种的作战功能，由无人机集群代替先进平台功能，既可降低研发设计成本与作战损耗，又增强了作战系统的抗毁性、多变性。

2）功能组合与编队构型依任务而定

在任务执行过程中，集群所需采取的战术组合、应具备的作战功能、运用的编队构型及控制方式需依据任务目标而定。如图7所示，根据作战任务类型确定集群功能组合及战术方案；根据作战需求将集群作战任务由上而下进行分解，一级分解为集群小组子任务，二级分解为个体任务；集群无人机个体将自身作战能力自下而上进行上报；中心长机根据任务分解及个体能力情况，以功能为导向将多个功能个体进行组合，形成具有完成子任务能力的集群小组，再对小组内的无人机个体分配对应的个体任务；根据集群战术安排及各集群小组功能，集群整体构建战术编队，集群小组构建功能编队。

图7 集群任务分解Fig.7 Swarms task decomposition

一般无人机个体具备一个至多个单体功能，针对同一任务可形成多种形式的集群小组，同一集群小组通过变换可形成不同的群功能。形成的集群系统战术组合多样、功能动态涌现、编队机动灵活。

3）长机控制度与个体自由度随作战时序而变

集群作战主要的时序阶段包括编队飞向任务区、抵达任务区、任务区域内作战，在不同阶段由于作战环境、任务要求不同，各层级无人机的主要任务、自主程度也随之调整改变，如图8所示。

图8 集群个体自由度变化Fig.8 Change of individual degree of freedom in swarms

编队飞向任务区时战场威胁较少，为降低集群控制难度、通信消耗，集群控制偏向集中式，中心长机负责控制监督群状态、规避大型障碍、飞行航线规划等，小组长机负责跟随中心长机、组间协同等，无人机个体跟随小组长机、避免碰撞，此时中心长机控制度较高而其余个体自由度较低；集群抵达任务区，集群在等待区域集结并进行作战部署，中心长机进行态势评估、战术决策、集群任务分配，小组长机进行组内任务分配、小组编队重构、攻击路径规划，无人机个体进行组内队形变换，此时中心长机权限下放，小组长机获得部分规划决策权，无人机个体自由度提升；集群在任务区域内作战，由于威胁障碍增多、战机稍纵即逝，集群实时性、快速性要求高，集群小组拥有更多战场决策权，小组长机负责小组战术规划、攻击决策、群组配合等，无人机个体进行快速机动、目标识别攻击、友机协同，中心长机监督、调整集群状态，此时小组长机与无人机个体自由度最大，中心长机控制度较弱。

随作战时序推进，中心长机控制度与个体自由度动态调整，使集群在特定阶段发挥更大效能。

4）信息服务与通信拓扑按需可变

中心长机将通过指挥控制中心、小组长机、个体无人机及自身传感器获取的信息融合形成整体作战态势信息，同时根据集群小组作战区域、任务类型，将其需要的局部态势共享给小组长机；小组长机将小组局部态势与个体最新反馈的信息融合，按需将个体局部态势信息共享给无人机个体。

集群通信拓扑可在时变混合式通信拓扑基础上按需动态调整，当要求集群整体性、系统性，形成集中式通信拓扑；当要求集群灵活性、适应性，形成分布式通信拓扑；当无人机个体执行特殊任务或有重要情报时，可与中心长机直接建立通信。

5）集群应激自修复

集群应激自修复指在长机受损、个体加入或退出、突发特情、外部扰动等场景下集群维持稳定、自我修复的规则。

①长机更替。当中心长机及小组长机由于敌方攻击或自身故障等而无法承担长机任务时，则将设定的替补长机补充到空缺位置，也可通过联盟或协商机制分别在小组长机中选出中心长机、在集群小组中选出小组长机，若无合适对象则扩大遴选范围。

②局部编队调整。当集群有新无人机加入或有个体脱离时，集群在局部范围内进行队形调整重构。

③集群应急重构。当集群作战环境及任务突然变化，中心长机通过备用方案或实时任务规划对集群功能、编队构型做出迅速调整，形成最优队形。

④集群状态反馈。当集群内部不稳定因素及外界环境扰动时，无人机个体将状态反馈至小组长机，小组长机再反馈至中心长机，中心长机、小组长机根据反馈信息对集群及小组的飞行速度、机动角度、保持距离等参数进行调节，确保编队结构稳定。

3 集群混合式控制模型

3.1 Agent与元胞自动机混合控制结构

根据Agent与CA理论各自特点，本文建立Agent与CA的集群混合式控制结构，该模型通过融合2种理论的优势，将集中式与分布式控制有效结合，满足复杂集群系统的结构层次化和基本规则共通化要求。其结构如图9所示，该结构主要分为CA模块和Agent模块，两者通过Agent的感知器和效应器连接，实现Agent规则在元胞空间的运行。

图9 Agent与元胞自动机混合控制结构Fig.9 Hybrid control structure of Agent and cellular automata

CA模块主要实现个体基本运行规则，包括元胞空间、邻域范围、演化规则等部分。

Agent模块主要实现集群的分层、个体差异化设计以及个体较复杂基本规则构建，能够根据任务需求、外界环境、集群状态对集群进行调整，主要包括协调控制器、反应器、知识库系统、学习系统、通信、感知器、效应器等。通过为不同层次个体设计不同知识库和规则库、通信拓扑，来区分中心长机、小组长机、个体无人机。协调控制器接收感知器搜索的信息并进行分类，若为简单且紧急情况则交由反应器，若为复杂且时间充裕则交由规划器、决策器；反应器以规则库作支撑，主要使无人机对简单、紧急情况做出迅速的处理；规划器对复杂任务进行规划，由于不同层次无人机对应不同类型知识库做支撑，中心长机可进行集群全局的、长期的作战规划，小组长机完成局部的、中短期的规划，个体无人机进行个体目标攻击规划；决策器主要结合知识库进行战术决策、攻击决策、功能组合与目标分配决策、通信拓扑与编队构型决策等，不同层次无人机拥有不同决策权限与能力；学习器可通过对行动效果进行评估后，将效果好的方案加入知识库和规则库进行更新；感知器主要对外界环境、元胞空间、其他无人机个体进行感知；效应器根据决策结果、反应命令对外界环境、元胞空间、其他无人机个体进行反馈。

3.2 集群描述

假设无人机集群由N架无人机组成，在二维空间中分布，将单个无人机视为质点，则对无人机i（i＝1，2，…，N）运动模型描述为

式中：x为无人机位置矢量；v为无人机速度矢量；u为无人机加速度矢量；同时v、u应满足：

式中：Vmax为无人机个体最大速度；umax为无人机个体最大加速度。

集群中无人机划分为中心长机、小组长机、无人机个体，设立1个中心长机、M 个小组长机、N－M－1个无人机个体，将集群分为M 个小群组，每群组中有一定数量无人机个体，中心长机通过小组长机实现对群组的集中式控制，小组长机间进行分布式交互，小组长机对无人机个体进行集中式控制，无人机个体进行分布式交互。集群任务类型划分为K种，设定MI＝｛Mission1，Mission2，…，MissionK｝为任务集合，对应侦察、攻击、干扰、反辐射、评估等任务。集群作战时序划分为NT种，设定T＝｛Time1，Time2，…，TimeNT｝为作战时序集合，对应集群飞向任务区、抵达任务区、任务区域内作战等时序。不同任务类型和作战时序下集群构型及控制度不同。

3.3 元胞自动机模型

3.3.1 元胞空间及邻域设定

本文元胞空间运用二维网格空间结构，其邻域采用Moore型，如图10所示，一个元胞的上、下、左、右、左上、左下、右上、右下相邻8个元胞为该元胞的邻居，可定义如下：

图10 Moore型邻域元胞Fig.10 Moore neighborhood cell

式中：（pox，poy）为中心元胞的位置坐标，（pox，poy）∈Z2，（pix，piy）∈Z2，Z为整数集合。

3.3.2 演化规则

元胞下一时刻的状态由该时刻自身及邻域内元胞状态决定，当元胞被占用状态为1，没有被占用状态为0，受无人机气动性能限制，设定元胞下一刻移动方向为当前运动方向及邻近45°方向。

传统CA，元胞从当前位置移动到下一元胞位置时每步长速度固定，为体现无人机运动真实性，本文无人机元胞运动速度的方向、大小能够随周边无人机状态进行调整。速度变化应使个体满足集群凝聚、集群分离、方向匹配的原则［24］。

式中：dij为无人机i与无人机j的d-范数距离；xi－xj为两者实际的距离矢量；γ＞0，d-范数将多维距离向量转化为一维距离。

在感知范围R内，当无人机i与无人机j距离越近时，其控制作用则更迅速，为使控制作用大小在有限范围R内随距离平滑变化，引入具有有限截止点的冲击函数：

式中：h∈（0，1），为冲激函数下降点；fh（z）在［0，1］平滑下降，在（1，0）处截止。令z＝dij／R，使截止点与感知范围R相匹配。

无人机i与无人机j凝聚、分离作用以安全保持半径R0为分界点变化，为此设计反曲线函数：

设置R＝15、R0＝5、h＝0.3、a＝2、b＝3，ρ（dij）图像如图11所示。由图11可知，当dij在安全保持半径R0内时，随着距离的缩小分离作用迅速变强，当dij逐渐偏离安全保持半径R0时，为使dij稳定保持在R0处，在一定范围内聚合作用随偏离距离的增大而快速增强，而后聚合作用随距离的增大而缓慢变小，直至感知半径R变为0。

图11 平滑力函数图像Fig.11 Smooth force function image

考虑无人机i与无人机j速度方向、大小要匹配，基于一致性控制理论［26］，结合式（8）设计如下控制律：

式中：u1i为无人机与邻域无人机进行凝聚、分离、速度匹配的控制输入，为无人机基本运行规则；第1项为距离保持项，通过式（8）的平滑力函数确保无人机凝聚、分离作用；第2项为速度匹配项，确保无人机速度在邻域范围的一致性；c1、c2为正常数，分别为位置保持系数和速度匹配系数；aij为无人机i与无人机j的通信连接权重。

3.4 Agent模型

3.4.1 集群个体类型

3.4.3 通信拓扑

集群任务类型划分为K种，任务集合设定为MI＝｛Mission1，Mission2，…，MissionK｝，集群作战时序划分为NT种，作战时序集合设定为T＝｛Time1，Time2，…，TimeNT｝，在不同任务类型和作战时序下集群会形成特定通信拓扑结构Ak，NT，其中k＝1，2，…，K为任务代号，NT＝1，2，…，NT为时序代号。

一般情况下，中心长机UAVo为实现对小组长机UAVg集中式控制，会与每一小组长机建立通信连接，当个体无人机UAVa在发现重大情报或攻击重要目标等特殊情况下，UAVo会与UAVa建立临时通信，同时与邻域集合χno（t，κ）内的个体建立通信，因此中心长机UAVo的通信拓扑连接设定为

个体无人机与同一群组内的无人机个体UAVa进行分布式通信，在群组m中的个体无人机i的通信拓扑连接设定为

3.4.4 集群构型

集群飞行时的编队构型要符合作战任务需求，并适应当前时序下的作战环境。定义集群编队构型矩阵H＝［hij］∈RN×N，hij＝hj－hi为无人机i与无人机j期望编队构型的相对位置矢量，hi、hj分别为无人机i与无人机j在编队中期望位置。在任务k、时序NT下集群编队构型矩阵设定为Hk，NT。

3.4.5 跟随控制

假定中心长机的飞行路径通过结合指挥控制中心上传路径与自主规划形成，最终规划路径和运动状态为x*o（t）、v*o（t），则中心长机UAVo的控制输入为

小组长机主要跟随中心长机运动状态来保持在编队中的位置及速度状态，并通过与周围小组长机交互达到邻域状态的一致性，则第m小组长机UAVg的控制输入为

式中：λ1、λ2、λ3、ci1、ci2、ci3、ci4为在任务k、时序NT下预先设定的正常数；λ1为对u*1i（t）控制的权重；λ2为对小组长机m状态跟踪的权重；λ3为与群组内UAVa一致性控制的权重；ak，NTmi表示在任务k、时序NT下群组m中个体无人机i的与小组长机m的通信连接值；aoi为与UAVo通信连接值；Δuoi为UAVo对无人机个体i的介入控制量。

3.4.6 反馈控制

在集群编队飞行过程中，各层次无人机运动性能都受到各自最大速度Vmax和最大加速度umax限制，当长机速度调整过快，远超跟随无人机加速能力时，跟随无人机难以快速跟踪长机速度，同时当集群过于离散，无人机难以在短时间内到达预定编队位置，这都对集群编队构型的形成与保持产生影响。因此，长机的速度调整需要结合跟随无人机状态的反馈，本文采用分层反馈机制，个体无人机状态反馈至小组长机，小组长机状态反馈至中心长机。

个体无人机到小组长机反馈，主要从速度偏差与离散位置2个方面反馈群组m内的无人机个体状态信息。群组m内的无人机个体速度与小组长机速度的离散方差为

由式（20）、式（21）可知，当无人机个体速度、位置与小组长机的相对值偏差变大时，群组m的速度离散方差与位置离散方差增大，反馈函数fm增大，由式（23）可知，小组长机m控制输入um（t）减小；当速度、位置偏差变小时，小组长机m控制输入um（t）增大。通过动态调整小组长机m加速度，便于组内个体跟随小组长机，使集群在局部群组范围快速形成预定编队。在式（19）个体无人机控制输入ui（t）中，小组长机m加速度um（t）更新为调整后的控制输入式（23）。

同理，小组长机到中心长机的反馈，主要对m个小组长机及其所处群组的速度偏差与离散位置的状态进行评估反馈。集群内M 个小组长机与中心长机的速度的离散方差为

由式（24）～式（27）可知当小组长机及其所处群组的速度、位置离散状态变大时，反馈函数fo增大，中心长机控制输入减小；当小组长机及其所处群组离散状态变小时，中心长机控制输入增大。通过反馈调整中心长机加速度，小组长机能够快速进入预定位置，从而集群更加高效地形成并保持战术编队。

在小组长机控制输入式（23）中，uo（t）调整为反馈后的中心长机控制输入式（27）。

4 仿真验证

为验证本文混合式集群控制方法的有效性，在集群进行作战编队集结并动态保持的任务背景下，采用MATLAB进行编程仿真。设定集群数量总共为50架，其中1架中心长机，7架小组长机，每个小组6架个体无人机，最大速度100 m／s，期望速度80 m／s，最小速度60 m／s，无人机间的安全保持半径为50 m。其他仿真参数若无特殊说明则如表1所示。

表1 仿真参数Table 1 Simulation parameters

为更加客观地检验本文所提出模型对集群控制的改进效果，加入了集群分布式控制与集中式控制的对比仿真，3种控制方式的集群数量都为50，跟踪速度一致，差异设置具体如下：混合式控制中中心长机感知半径为300 m，小组长机感知半径为250 m，无人机个体感知半径为70 m；分布式控制中少数个体可获取跟随速度信息，其余个体通过分布式交互实现与周围个体速度、位置的一致，设置个体感知半径为90 m；集中式控制中中心长机获取跟踪速度信息，个体无人机在长机的集中式控制下进入编队位置并保持与长机状态一致，个体通信交互仅满足规避需求，设置中心长机感知半径为370 m，个体感知半径为60 m。

集群中无人机的初始位置在［0，500］m×［0，500］m范围内随机产生；无人机的初始速度大小在［0，10］m／s范围内随机产生，方向在［0，2π］rad内随机选取；仿真步长为0.1 s，时间区间为［0，500］s。集群仿真环境初始化如图12（a）所示。在图12（a）中，蓝圈代表无人机，无人机间的蓝色连线为通信连接，红色箭头表示无人机速度大小及方向信息。

3种控制方式的仿真结果如图12（b）～（f）所示。图12（b）与（c）分别给出了基于分布式控制的集群在感知半径为70 m和90 m下的编队最终状态，从中可以看出，在感知半径为70 m时，由于交互范围限制，集群未形成连续的通信连接，存在部分无人机游离在集群之外而组成离散小群，而当感知半径扩大为90 m时，无人机可与更多的邻域个体进行交互，单节点通信连接数增加，集群通信网络畅通，形成一不规则编队整体。图12（d）给出了集中式控制方式下的集群状态，在红色圆圈代表的中心长机集中控制下，集群形成一规则的三角形编队，与分布式编队相比集中式编队具有较强的整体性、可控性。图12（e）与（f）显示了基于混合式控制的集群分别在100 s和500 s时的状态，由图12（e）可看出，在100 s时刻小组长机已基本进入相对应的编队位置，个体无人机也陆续到达各自小组长机附近，但小组编队还未形成，在500 s时刻图12（f）显示集群已形成7个稳定的集群小组，且规则分布在红色圆圈代表的中心长机周围，中心长机到小组长机的蓝色连线表示集中式通信，图中绿色连线表示小组长机间的分布式通信，2种通信结构的融合使集群通信网络具有较强的连通性与抗毁性，而混合式控制下形成的编队拥有较强的规则性、一致性。

图12 集群编队状态Fig.12 Swarms formation status

图13（a）～（c）依次显示了分布式、集中式、混合式3种控制方式下集群速度变化曲线，由图13（a）～（c）可知，3种控制方式都能使集群到达设定速度80 m／s，图13（a）中分布式控制下集群速度大约在150 s接近80 m／s，但后续集群中个体速度并没有快速地一致收敛到80 m／s，而是在80 m／s附近波动。图13（b）、（c）中集中式、混合式控制下集群速度能够较快地一致收敛到80 m／s，在反馈机制的作用下，2种控制方式的集群速度在到达最小安全速度60 m／s后波动递升，相比之下集中式控制的集群速度递升波动较长，在300 s后才相对稳定保持在80 m／s，而混合式控制的集群速度在200 s就已到达并稳定保持在80 m／s，且其速度波动调整幅度较小，其整体速度收敛效果明显优于前2种方式。

图13 三种控制方式集群速度变化曲线Fig.13 Swarms speed variation curves of three control modes

图14（a）～（c）依次显示了3种控制方式下编队内不同个体之间的速度一致性偏差，比较发现，图14（a）中分布式控制编队速度一致性偏差的幅度明显小于后2种方式，且较快地（在200 s处）将偏差控制在较小范围，但后续偏差并未完全一致趋近于0，而在0的小范围波动。在图14（b）、（c）中，集中式与混合式控制的编队速度偏差能够一致收敛到0，在前期两者偏差幅值较分布式偏大，在收敛速度上混合式明显快于集中式，且波动周期短，收敛效果平稳。

图14 三种控制方式编队速度一致性偏差Fig.14 Formation speed consistency deviation of three control modes

图15显示了由式（26）定义的集群速度与位置的综合离散度。由图可知，3种控制方式都能使集群离散程度降低并逐渐趋向于0，从而实现集群整体在速度与位置上的一致。通过比较发现，在收敛过程中离散度幅值集中式最大，分布式最小，混合式居中，在收敛速度上混合式最快，集中式次之，分布式则最慢。这是由于混合式与集中式中的中心长机能够通过反馈信息对集群整体进行调控，进而使整体收敛一致，而分布式中个体能够较快地与邻域实现一致性，因此集群整体的离散度幅值能够保持较小状态，但由于缺少整体的调控，个体局部的一致转化为整体全局的一致需要较长的时间周期。

图15 三种控制方式的集群离散度变化曲线Fig.15 Variation curves of swarms dispersion in three control modes

图16与图17分别给出了3种控制方式下集群通信次数变化曲线与不同层次节点的最大通信次数。定义无人机与其他个体建立一次连接为一次通信。在图16中，集群某时刻的通信次数为个体通信次数的总和，随着编队整体趋向一致，集群通信次数也逐渐稳定，分布式集群通信次数最多且单时刻趋于410，混合式居中且单时刻趋于170，集中式最少且单时刻趋于148。在图17集中式集群的中心长机节点最大通信次数为49次，个体无人机节点最大通信次数为3次；混合式集群的中心长机节点最大通信次数为12次，小组长机节点最大通信次数为15次，个体无人机节点最大通信次数为7次；分布式集群的个体无人机节点最大通信次数为10次。由此可知，混合式控制既避免了中心长机节点通信的过载，又降低了个体无人机这一集群主体的通信消耗，从而使集群整体通信次数降低。

图16 三种控制方式集群通信次数变化曲线Fig.16 Swarms communication frequency variation curves of three control modes

图17 三种控制方式单节点最大通信次数Fig.17 Maximum number of single node communications in three control modes

5 结束语

本文针对无人机集群控制问题，通过结合集中式与分布式2种控制方式，提出基于Agent与无胞自动机（CA）的集群混合式控制。首先，分析了Agent与CA结合的可能性与优势性。其次，通过分析无人机集群作战流程，从体系结构层面构建了无人机集群控制体系框架，将集群分为中心长机、小组长机、个体无人机，并设计相关通信拓扑结构及集群控制规则。在此基础上，结合Agent与CA特性，设计了基于Agent与CA的集群混合式控制模型，CA实现集群个体基本的聚合、分离、速度一致规则，Agent模型实现分层交互规则。最后，以集群编队集结与保持任务为背景，对分布式、集中式与混合式3种控制进行仿真对比，验证了本文混合式集群控制方法的有效性。

然而本文中集群的飞行环境为理想状态，未考虑外界干扰对集群的影响作用，因此下一步需要考虑设计在复杂环境下混合式控制集群的抗扰优化算法。同时本文只针对典型的编队集结与保持任务下的集群控制策略进行了验证，而对于其他场景下的集群混合式控制策略建模、仿真可作为后续研究的突破点。