刘正元 吴元清 李艳洲 王 超
无人机(unmanned aerial vehicle,UAV)以其低成本,零人员伤亡,操作便捷简单和灵活可靠的特点,源于1914 年被称为AT 计划的英国军事试验.随着UAV 技术的成熟及应用范围不断扩大,其应用领域已涉及到国防、工业、民用以及科研领域.有许多国家都在积极开展UAV 研究与开发工作.我国UAV起步较晚,尽管UAV 研究已经有一百多年的历史,但是UAV 群研究却是在21 世纪逐步展开.美国国防部在2005 年8 月公布的《UAV 系统路线图2005—2030》中,把UAV 自主控制等级划分为1~10 个级别,其最高级别(10 个级别)以集群全自主为目标[1],即UAV 蜂群使用.美智库“新美国安全中心”于2014 年10 月5 日发表《战场机器人Ⅱ: 即将到来的蜂群》报告,第1 次系统地提出了无人系统蜂群战术的概念.美国空军于2016 年5 月公布《小型UAV 系统飞行计划2016—2036》,在战略上确认小型UAV 的未来与价值,明确“蜂群”,“编组”,“忠诚僚机”等3 种集群作战理念[2].中国电子科技集团于2017 年6月顺利完成了119 架固定翼小UAV 的集群飞行实验[3].UAV 群已成为国内外研究热点.
UAV 群在“数”“价”“质”“变”等4 个方面与多UAV 存在较大差异[4],根据其自主性及智能化程度从低至高依次可以划分为UAV 机群、UAV 集群和UAV 蜂群,本文从这3 个概念对UAV 群进行界定.UAV 群是指为共同执行某一任务,通过互联构成群组,通过无中心的局部交互、反应式规则和行为,涌现复杂的群体自组织能力,从而实现高度智能自主的集合体;或受统一指挥并保持目视联系或战术联系的空中集群[5].贾永楠等对UAV 集群研究动因进行分析,并从模型、协议、平台3 个视角对UAV集群研究进展进行综述[6].王祥科等对小型固定翼UAV 集群在集群系统内涵、已有典型工程、关键技术3 个视角下的国内外研究情况进行了总结[7].贾高伟等分别从以逻辑和规则为基础的自顶向下型任务规划以及以集群智能出现为基础的自底向上型任务规划两方面,综合评述了UAV 集群任务规划的研究现状[8].刘学达等在UAV 集群协同控制研究领域对演化博弈理论在UAV 集群控制研究领域的运用前景进行探究,分别从情报共享、任务分配、资源调整以及编队重组4 个方面,对其具体运用设想进行阐述[9].本文基于此得出结论: UAV 群技术应用主要服务于任务规划与编队飞行两个层面,这两个层面又是UAV 群得以实际应用的基础与重点.尽管有一些关于UAV 群的研究涉及任务规划与编队飞行两个方面[10],但是并未对二者结合后所产生的新内容与新问题进行专门细化,因此,迫切需要对多UAV 群任务规划与编队飞行相关研究状况进行深入阐述,从而为今后多UAV群在实际应用中奠定理论基础.本文旨在根据已有UAV 群在任务规划、编队飞行等方面的研究基础上,对今后多UAV 群研究中应关注及存在的差异进行展望.
任务规划作为UAV 应用过程中的顶层规划,它是针对任务所处环境态势、任务需求和自身特性而提出的一种综合调度方式,以在UAV 和任务之间建立合理的映射关系并保持机与机之间合理的协同配合.UAV 群的任务规划包括任务分配与航迹规划两个方面.
UAV 已在广泛领域中进行了应用,因其任务在各领域存在较大差异,所以模型与算法设计各不相同.本节基于UAV 的功能视角,对其任务分配进行了3 类分类概述.通信传输功能,可实现多飞行器之间信息传递;导航定位功能,可确定飞行方向及飞行速度;监控管理功能,可以完成监视、控制、指挥等多种工作.攻击功能,通常仅应用于军事领域中,需要精确、有效地对目标物进行毁伤,具有很高的准确性.侦察搜寻的职能,它的任务需要广泛的覆盖范围,对海上搜救、海上巡逻和军事侦察都起着至关重要的作用[11-12].严飞等对侦察型与攻击型UAV 构成的UAV群,采用合同网算法来解决任务分配问题[13].监管的职能,需要协同跟踪、航道测绘[14-15],船舶大气排放监管和农业喷水/药物领域都有相关的研究.SHENA 等针对港口船舶排放协同探测问题,基于多UAV 船舶发射探测特性,给每架UAV 指派了带时间的探测任务序列[16].为满足动态环境下实时性需求,设计一种以禁忌搜索算法与“最小环”方法相结合的PSO 算法.保障功能,完成各种物资补给、人员救援以及环境勘测工作.通信传输功能,将各传感器采集到的数据传递给指挥中心或其他用户设备.闫辉等提出了一种在任务接力基础上,考虑UAV 异构性与地理环境约束,旨在提升多UAV 系统总体续航时间的协同目标指派调度策略,解决了目标重要性动态变化下的协同目标指派问题[17].搜索跟踪功能,获取更详细的信息,能够实时掌握敌方态势.监视探测功能,发现并跟踪目标物.运输配送功能,任务需要考虑多成本因素且研究范围广泛、变体问题多样.有人考虑了选址-路径规划[18],有人考虑了逆向物流[19],也有人提出了协同卡车分配.MURRAY 和CHU 等介绍了一个新的旅行商问题——“飞行跟班旅行商问题”(flying sidekick traveling salesman problem,FSTSP),并提出将UAV装到卡车上方的设想,这种UAV 既能执行卡车上的一个交付任务,又能完成另外一个交付任务[20].
未来UAV 群任务分配过程中会有很多职能,其中涉及到很多方面的交叉知识,如具有察打职能、察配职能、察管职能甚至察配管职能的UAV 群.因此,对多目标任务规划进行仿真是非常有必要的.由于异构UAV 群问题较难建模与解决,现有关于异构UAV 群研究的文献还停留在察打功能UAV 群方面.
UAV 的航迹规划主要包括路径规划与轨迹优化.路径规划是对UAV 由初始位置到目标位置的计划,而轨迹优化是对UAV 的初始位姿到目标位姿的计划,它和时间相关.在飞行过程中,由于多架UAV 之间具有一定距离,且各UAV 运行环境不同,会产生相互干扰,从而导致无法实现最优解或达不到预期效果.而这些都将影响到最终的航线设计.因此,多UAV 航迹规划通常属轨迹优化问题,单UAV 航迹规划则属路径规划问题,其原因是多UAV 需考虑含有时间的四维空间,来适应多UAV 航迹点有可能重合的情况.本文航迹规划没有准确地区分路径规划与轨迹优化问题,并且对于航迹规划研究方法主要分为两大类型进行了总结: 一种是离线一次性航迹规划,另一种是线上实时滚动规划.
1.2.1 离线一次性航迹规划
航迹规划算法可以分为动态规划法、导数相关法、最优控制理论、启发式算法以及群智能算法等.在动态规划法方面,重点介绍了A*,D*的算法[21-22].其中,A*是经典的静态规划算法,D*则发展出一种基于智能体之间信息交流与交互的多Agent动态规划技术.该方法已成功应用于军事领域.就导数相关法而言,主要包括最速下降法、牛顿法和共轭梯度法.谌海云为了解决人工势场法容易陷入局部极小点且目标无法到达这一难题,提出一种“沿着目标方向作90°度运动”,以摆脱局部极小点的影响,并最终利用回归搜索法对航迹作进一步全局优化[23].最优控制理论包括数学规划法和图论法.张博渊等利用可自适应选点自适应伪谱法,把UAV 编队航迹优化控制问题化为一个非线性规划问题来解决[24].以上这3 种算法都是传统算法的一部分,随规模的扩大、维数的增加易造成求解效率不高.
针对这种情况,本文提出一种现代智能算法,包括启发式算法与群智能算法两种.针对多目标优化问题,介绍了两种不同类型的群体智能方法: 遗传算法和禁忌搜索算法.遗传算法是一种全局寻优技术,但其存在搜索效率低、易早熟收敛等缺点.在启发式算法方面有进化算法、快速扩展随机树法.ZHANG和DUAN 等利用改进约束差分进化算法,对三维环境下UAV 最优路径问题进行求解[25].武晓晶等根据半角树枝裁剪策略,设计动态步长对随机数进行双向快速展开,同时结合贪心算法以避免陷入局部极小,最后利用B 样条曲线对其进行光滑处理[26].但是这些方法都存在着计算量大、耗时长等缺点;而遗传算法虽然具有收敛速度快、鲁棒性强的优点,但它容易早熟且易于产生局部性停滞现象,从而不能满足实时性要求.并且群智能算法在蚁群算法、粒子群算法、人工蜂群算法等方面已经有很多研究[27-29],本文对近几年出现的几种新颖群智能算法进行了总结.WANG等针对三维作战环境中UAV 路径规划问题,提出改进蝙蝠算法[30].PANDEY 等利用改进萤火虫群优化算法求解三维底层环境中UAV 路径规划[31].钱洲元提出了联合修正自适应乌贼航迹规划算法[32],该算法分别给出了2 种基于混沌扰动和变异学习的强化搜索,在算法迭代进程的基础上,通过加权组合为一种联合强化搜索方式,以达到高效深度搜索的目的,最后通过引入自适应权重来达到约减搜索空间的目的.XU等在各种对抗环境中构建障碍物模型,航迹规划采用改进灰狼算法来实现,其改进途径主要有种群初始化、衰减因子更新以及个体位置更新[33].汤安迪等提出了一种基于混沌麻雀搜索的UAV 航迹规划方法: 先利用立方映射初始化群体,同时利用反向学习策略导入精英粒子,以加强群体多样性和扩展搜索区域范围,再引入正弦余弦算法,以利用线性递减策略来平衡算法发展和探索的能力,在算法停滞状态下利用高斯游走策略辅助其跳出局部最优状态[34].
离线一次性算法虽然可能获得航迹最优规划问题,但是不能处理突现及动态障碍物问题,将导致UAV 碰撞毁伤,针对这一问题,很多学者着手对实时动态航迹规划问题进行了研究.
1.2.2 线上实时滚动航迹规划
线上实时动态航迹规划多是以滚动时域控制为主流.RICHARDS 和BELLINGHAM 首先提出了滚动时域控制航迹规划,它并没有要求每次都要计划到目标,而要划分为几个阶段来计划[35-36].王文彬等在文中提出基于滚动时域控制与快速粒子群优化相结合的方法[37].在此方法中,介绍了以VORONOI 图为基础,描述航迹端点到目标点之间距离估算的代价图计算方法.基于滚动时域与人工势场法相结合的思路,把路径规划转化为一个优化问题,并采用最小距离与避障指标作为代价函数进行求解.但在实际应用中,这种代价图是不可用的.ZHOU 等提出一种新型仿植物生长算法,相较于其他生物启发算法,该算法利用趋光性及负向地性特征引导优化方向而非目标函数[38].这使得每个步骤仅需对下一路径点进行取值优化,并不要求在所有路径点上都设置目标函数.在此基础上建立数学模型并设计相应的求解方法.为了验证模型的有效性,将本文所给出的两种启发式算法应用于一个真实飞行任务当中.最后通过与A*、RRT、蚁群算法的算例对比表明: 植物生长算法路径规划能力强,参数配置合理,且算法运行效率较高,过程平稳.YAO 等在多UAV 三维协同路径规划过程中为解决目标跟踪与避障难题,采用李亚普诺夫引导向量场对目标进行跟踪,进而提出基于修正干扰流体动力系统以消除局部极小问题的避障新方法[39].在IIFDS 的框架内加入虚拟障碍策略与附加吸引流体策略,再巧妙融合两种策略,在实现目标跟踪与避障需求的前提下,对反应参数进行滚动水平优化.在多UAV 轨迹规划中,XIA 等以时间分割取代传统路点分割,构建了一种基于均匀时间区间的轨迹优化模型[40].同时引入虚拟航段来适应不同UAV 航迹长度并缩短总到达时间.为了解决传统遗传算法易早熟收敛及全局搜索能力差的问题,在进化初期采用交叉操作提高种群多样性;后期使用变异算子增强个体间信息交流能力;同时考虑初始可行解集对求解结果的影响.在代价函数上引入非线性约束,并提出基于梯度的顺序最小优化算法,使代价函数最小化,在每一次迭代过程中解耦出相互矛盾的约束,从而节约规划时间.
将离线规划方法与在线规划方法相结合,在离线规划之后,又通过在线规划方法对其加以完善或者优化.这些研究为智能交通领域提供了一定的理论参考与实践指导.熊佳新给出了一种基于全局与局部双滚动窗口融合的航迹计划方案[41].全局航迹规划时采用概率路标图法结合Dijkstra 算法对航迹粗略解进行规划,然后对局部航迹采用变长变易率快速随机搜索树法进行校正.最后利用基于状态预测的分布式协调算法,实现预定航迹的避碰航迹的优化.任敏等还采用概率路标图法与Dijkstra 算法相结合的方法对全局航迹进行规划,得到航迹的粗略解,然后采用免疫-离散粒子群混合算法对局部航迹进行校正[42].丁强等对于连续型航迹的规划问题,首先采用粒子群算法对每架UAV 初始耦合系数进行搜索,构成全局航迹预规划问题.然后在Tau-H 运动策略的基础上引入与初速度有关的项目对其加以改进,采用滚动优化的方法来解决局部航迹重新规划问题[43].
线上实时滚动式航迹规划能够有效地避开突现障碍物、动态障碍物等,但是由于对一些可视化技术及智能体技术的要求较高,因此,在实际上用于实时滚动式规划航迹时存在着一些难题.
在航迹规划中没有考虑任务分配问题,通常没有考虑UAV 的飞行特点,只是用UAV 路径来近似代替UAV 航迹进行航迹规划,给任务执行造成了一定程度的偏差.航迹规划和任务分配并不是一个单纯连续的过程,而是存在着十分密切的相互影响.因此,在任务分配之前必须首先明确两者之间关系.本文以UAV 为对象,建立了一个多目标决策模型,并设计了一种启发式算法来解决这一问题.最后通过仿真实验验证该方法的有效性.当前UAV 任务规划主要有3 个研究内容,即首先对任务进行分配,然后对航迹进行规划,其次对任务进行预先分配,最后根据任务或者航迹的变化情况,对航迹规划以及任务重规划进行研究,如果没有对任务进行预先安排,则通过对实时任务进行规划,来对实时任务进行优化分配,这时两个问题会互相耦合在一起[44].
在第1 个研究方面中,陈侠等综合考虑多UAV航迹规划与任务分配指标,采用敌我博弈策略解决任务分配问题,然后利用Voronoi 图法与快速展开随机树解决攻击运动目标航迹问题[45].但该方法存在收敛速度慢、不稳定及效率低的缺陷,因此,提出一种基于区块链的多UAV 协同空战中航迹规划系统架构,并进行仿真验证.结果证明: 这种框架可以提高任务成功率.郭兴海等首先采用区块链式拍卖算法,对多智能体互联计算进行任务指派,然后采用混沌递减权重和动态权重量子粒子群算法进行航迹规划[46].
在第2 个研究方面中,BISWAS 等提出的粒子群算法,以同时重新规划矢量化为基础来解决航迹规划问题,并采用最近邻域搜索策略,来解决任务分配模型问题,从而实现了不同UAV 对多个目标点的到达[47],当某个UAV 在飞行过程中发生故障时,另一个UAV 能够分担故障UAV 未到达目标点的任务.最后,对有静态与动态障碍时,多任务条件下UAV 任务规划问题进行模拟.它研究航迹在飞行过程中发生变化而引起任务改变的问题.LI 等研究了三维环境下多UAV 经过所需完成时间下特定任务点的路径规划问题,并在线转换任务对最优飞行路径优化问题进行了求解[48].在任务发生变化的情况下,设计任务分配算法为最适合的任务序列分配新的任务点,进而对最优飞行路径进行再规划,以确保每一架UAV都能及时飞过剩余任务点和新的任务点.针对路径规划问题,提出一种用于路径规划的改进果蝇优化算法,采用参考点与距离代价矩阵相结合的方法,达到快速平稳求解的目的.它研究任务改变引起航迹改变问题.
在第3 个研究方面中,孙小雷对多UAV 之间交会协同攻击任务展开研究,将多阶段航迹预测算法应用于实时航迹规划MSPP,该算法是一种能够为任务分配和调整过程提供必要的输入来估算目标航程[49].介绍了课题的背景意义以及国内外发展现状;给出了系统设计需求分析;再次根据实际应用对软件系统框架及功能结构进行详细设计;然后描述了软件程序流程图.MSPP 架构下包括基于A*算法路径规划、三次B 样条曲线航迹平滑、Dubins 曲线航迹交会等.任务分配时综合考虑以粒子群算法为核心的集中式和以聚类算法为核心的分布式两种模式,由此构成一个完备的任务规划体系结构.朱黔等在4个UAV 节点重要度评估指标的基础上[50],使用一种改进的近似理想解排序法,来完成对UAV 节点的重要度评估,并在区域搜索时通过UAV 角色的动态切换,使协同搜索收益和网络连通性达到均衡,最终使用分布式滚动时域优化来完成每架UAV 的线上移动计划,从而达到多UAV 协同区域搜索的目的.
UAV 群编队飞行是多架UAV 自主功能,UAV为了满足任务需求,在特定结构下形成一定队形排列组织方式,它包括编队感知、编队通信和编队决策控制等有关理论研究.
态势感知(situation awareness,SA)的研究通常集中在理论模型、评估、一致性方面.从理论模型上看,有人研究了以Endsley 三级模型为基础的个体态势感知[51];有人研究了以群体为基础的群体态势感知[52];也有人研究了以分布式态势感知为基础的模型(distributed situation awareness,DSA)[53].黄匆等从信息层面以及系统获取信息能力的角度出发,研究态势感知模型的一致性[54].为了解决态势感知中存在的不确定性问题,本文提出一种基于证据推理规则对态势感知中的一致性进行评价,在置信结构中对每一类指标信息进行统一处理,利用扰动分析法对战场环境进行仿真研究[55].但是这些模型都没有涉及到群体态势感知的相关内容.实际上,群体行为会导致局部认知不一致,从而影响整体态势判断.分布式集群态势感知为集群控制与决策提供了依据,集群态势协同感知的实现需要协同目标探测,目标识别与融合估计以及协同态势了解与分享等技术[56].但这些模型都没有考虑到网络环境下各节点间可能存在不同程度的状态不一致.因此,对态势感知中状态不一致性进行建模是十分必要的.SORENSEN 对分布式态势感知评估(测量)进行研究[57].KALLONIATIS 等在文献[58]中试图把Endsley 的三级模型与DSA 模型联合起来应用,从而为DSA 模型的构建提供一种思路.在此背景下,高杨等在文献[59]中构建了一个同构与异构的DSA,并对两个模型进行一致性分析及评价方法研究.经过对UAV 群分布式感知数据进行融合,要想较好地实现UAV 群内部协同决策与控制,还要涉及到群内部通信技术问题.
在对UAV 编队通信进行研究时,UAV 间通信属于端到端的技术(device to device,D2D),主要是考虑UAV 间飞行自组网以及中继通信.飞行自组网已开展了大量相关的研究工作,主要涉及空中机器人、无人驾驶航空自组网、UAV 自组网(UAANET)、UAV 网络(networks of UAVs)和分布式航空传感器网络等[60].但是这些算法都存在着一定不足: 第一是不能保证传输的可靠性;第二是无法避免节点间由于碰撞而导致数据丢失或时延过大的现象发生.为了解决上述问题,本文提出一种新方法.在最优链路状态路由协议的基础上,ALSHBATAT 等引入定向天线提出DOLSR,利用飞行信息(状态变量、倾斜度和偏航程度)选择路由以降低端到端的延迟[61].ROSATI 等在充分考虑UAV 间相对飞行速度的基础上,通过GPS 信息为飞行自组网提出了一种基于预报的OLSR 协议(P-OLSR 协议)[62].P-OLSR 协议有效地减少丢包率和增加吞吐量.在此背景下,付有斌等着重对飞行自组网中多种通信协议进行研究[63].CHEN 等采用等级法对UAV 飞行自组网进行定性评价[64].WANG 等采用公式法,对UAV 飞行自组网进行粗粒度定量评估[65].然而对于UAV 编队通信系统而言,这些已有的研究成果还不能满足实际应用需要.本文对现有的有关UAV 编队通信研究进行分析与总结,并指出存在的不足与未来发展方向.赵海涛等在多次迭代基础上提出的UAV 飞行自组网的评价方法,对UAV 的学习与进化能力做了进一步定量描述[66].对于通信中继问题,吴钟博等提出了一种综合考虑UAV 成员邻近域和编队成员之间社会性依存关系的最优中继选择策略[67].也有把匹配博弈理论这一数学工具应用于UAV通信中继网络中[68],来求解分布式的无线资源的优化问题.这些研究成果都是针对单个节点进行分析的,忽略了链路状态对数据传输过程的影响;而对于系统整体性能而言,只有当整个系统达到一定程度时才能获得最优解.曾弘扬等将UAV 集群网络能量效率作为优化对象,在匹配博弈基础上给出分布式多跳中继路径选择算法[69].IBRAHIM 等在文献[70]中提出了一种以UAV 网络合作通信为驱动力的可生存通信博弈方法,该博弈方法综合考虑延迟、可实现率以及能源消耗指标.可以寻找最大化数据速率,最小化延迟,能量消耗等最优路径.每架UAV 尝试在纳什网络上组成游戏,以单跳式或者多跳式构建到达发射架路径.纯策略纳什均衡算法下,每一架UAV 均能通过查看下一跳间所有可利用环节,来制定最优决策以最大化自身效用.针对上述混合网络结构,提出了一种基于多目标优化算法的UAV 编队通信方案,并通过仿真对该方案进行了分析.结果表明,采用这种方法可以有效地降低系统复杂度.混合策略下,每架UAV 都会依据一个概率值来选择其策略,这样就可以避免构建出的图形中产生任意环路.
为均衡感知范围融合与通信时延之间的关系,必须为UAV 集群编队队形制定适当的UAV 群间通信网络,来满足感知范围分享最大化与通信时延最小化的要求.提出一种基于多智能体系统理论的分布式协同组网算法(MAC),并对其进行了仿真验证.结果表明该方法能有效地解决上述问题.最后分析了不同拓扑结构下网络性能的差异.例如,大规模UAV集群可设计分簇网络或者分层网络来降低通信时延.
编队决策控制问题在编队感知、通信基础上进行了进一步研究,一般都涉及到编队感知、通信等问题.由于UAV 具有机动性强、续航时间长、隐蔽性好、作战效能高等优点,在军事领域得到了广泛的应用,尤其在侦察方面发挥着越来越重要的作用.当前UAV 编队队形已经有多种风格,例如:“V 型”[71],“十字架形”“超天平形”“人字形”“镖形”“三角形”等[72].
编队控制解决了编队稳定、路径规划和多图轨迹优化等3 个难题[73].主要包括编队集结、维持、转换、避障4 部分.顾伟从航迹规划角度出发,以编队集结、维持与转换为目标,构建最优效率模型[74].当前编队决策控制主要分为集中式与分布式两种类型,集中式可概括为领航-跟随法与虚拟结构法两种模式,分布式可概括为行为控制法与人工势场法两种模式,并结合一致性理论进行研究.分布式可分为3 种情况: 1)完全分散式;2)半集中型;3)混合式.其中,前两类比较成熟且应用广泛.后一类则在理论上还有待完善.由于每种方法各有利弊,一些研究着手对以上5 种方法进行整合,以期得到较优的求解方式,其中,集中式与分布式混合算法尤为突出.主要从这两种解决方法出发对当今编队控制研究进行概述.
2.2.1 领航跟随法
领航-跟随法也可以称为长机-僚机法.该控制策略以预设编队结构为基础,以长机航向速度、航向角及高度跟踪为手段进行僚机调整,以实现编队队形维持.与传统控制方法相比,该方法具有响应速度快、稳定性好等优点;在系统出现故障时还能继续工作而不需要更换舵面,因此,有很高的实用价值.另外它没有考虑外界干扰问题.但它的鲁棒性差,跟踪误差逐级后移和放大.
领航跟随法可以分为4 种类型,第1 种方法是一个领航者引领多个跟随者,这种方法也称为长机模式,所有僚机都以编队长机作为参考;第2 种方法是一个领航者引领一个跟随者,这种方法也称为前者模式,每架UAV 都以其前面的UAV 作为参考;第3 种方法是多个领航者引领多个跟随者,是第1 种方法的拓展;第4 种方法是不仅存在领航者和跟随者,还存在其他角色的UAV.PARK 等对一组沿圆形路径飞行的UAV 进行分析,将等距编队问题考虑到领导追随方法框架下[75],但是他们设计的控制律无法被证明具有稳定性.本文主要讨论前三种领航方式下的飞行控制系统设计与仿真.首先分析了领航过程中多机之间相对位置关系的变化情况,以及影响它们调整角度大小的因素,为后续建模打下基础.袁文以长-僚模式为基础,对多UAV 合作编队控制问题进行研究[76],采用引导点航迹引导的方法设计编队队形维持问题,以人工势场法为基础给出多步状态预测冲突避免算法.嵇亮亮讨论长机模式与前一种模式协同编队控制技术,以实现UAV 群编队维持[77].XIE 等在文献[78]中对多领航者、切换拓扑群系统自适应队形跟踪进行研究,并为实现队形跟踪引入分级灰太狼追踪策略.展开领航跟随法能够分为4 种类型,第1 类方法是一个领航者带领多个跟控器,这种方式也称之为长机模式,每只UAV 均以编队长机为参考.然后利用邻近相对状态信息,设计一种带交换拓扑自适应编队跟踪协议,来证明群系统达到编队跟踪的充分必要条件.ZHAO 给出一个基于异构角色分布式协调控制方案[79].基于分布式模型预测控制设计分布式协调控制方案框架.探讨领导者、协调者以及追随者等异质角色对UAV 群协调控制性能的影响,并提出一种基于角色成本函数的UAV 群协调控制方法.针对不同作用的UAV 给出一套协调策略,来达到群体冲突化解的目的.
2.2.2 虚拟结构法
虚拟结构法是为UAV 编队建立虚拟的长机或者虚拟的几何中心,编队内的UAV 均参考虚拟长机或者虚拟几何中心进行移动,LEWIS 等于1997 年最先提出.但综合虚拟长机并得到邻机位置要求通信质量高、计算能力强,导致编队可靠性差[80],因此,有必要加以改进.CHANG 在文献[81]中把虚拟结构法分解为刚性虚拟结构法与弹性虚拟结构法两大类,刚性结构法产生直线向量,弹性结构法产生曲线.秦澍祺等针对实际场景下并非所有UAV 均可接收虚拟领航者的信息问题[82],依据通信拓扑网络设计了一种基于分布式虚拟结构的方法,并在此基础上依据一致性编队控制律使整个集群编队趋于平稳.张佳龙等在反步推演法的基础上,设计虚拟协同导引控制律来求解多UAV 的快速队形重构问题,并迅速到达稳定状态[83].而通过与模型预测控制方法、拉普拉斯方法(Laplace)的比较,得出动态响应迅速且稳态误差较低的结论.CAI 等在虚拟目标点指导下,提出一种分布式模型预测控制方法[84],并为减轻UAV 编队计算负担考虑状态预测误差与代价函数收敛性事件触发机制.符小卫等针对切换拓扑网络中UAV集群系统避障控制问题开展了研究,提出了基于联盟的UAV 集群避障控制算法,并采用一种新的柔性协同策略,来构建分布式虚拟环境下基于合作博弈的无人智能体系统.
虚拟结构法可划分为两种编队控制方式: 一是每个UAV 跟随一个特定的虚拟引导点,可以得到UAV 群所设计编队.这种方式下的约束条件是UAV群必须是对称的,并且能够通信的UAV 之间的距离是固定且相等的;二是所有UAV 只跟随一个特定的虚拟引导点,此时不能直接定义编队结构,但会根据初始条件和设计的函数产生一个平衡的编队.这种方式下要求任务UAV 之间不存在冲突,并且每个UAV至少有一个互相通信的UAV.
多UAV 群的任务规划是编队飞行的基础,为不同UAV 群提供预先飞行规划.多UAV 群的编队飞行是对任务规划的重规划,更有利于应对飞行途中的实际情况.两者相辅相成,共同实现多UAV 群重规划和再规划的不断迭代.按复杂度区分为考虑编队飞行的多UAV 群航迹规划和任务规划,并对两者所涉及到的关键技术进行展望,如图1 所示.
图1 多UAV 群任务规划和编队飞行的关系Fig.1 The relationship between multiple UAV swarm mission planning and formation flying
LI 和FANG 等提出了一种以虚拟点为单位进行编队决策并对鸽子行为进行改进的道路规划方法,该方法通过构建直线形、V 字形以及圆形3 种编队,来确保UAV 群在有增加或减少时能够安全跨越5 种障碍(单个、多个、陷阱、持续、动态)[86].许洋等提出了一种基于自适应分布式模型预测控制的快速粒子群优化[87],采用虚拟结构法与领航跟随法结合的策略,提出了虚拟编队引导点,对多UAV 进行自适应编队控制.最后根据模型预测控制的思想,结合分布式控制方法,将协同航迹规划转化为滚动在线优化问题.张洪海等提出了一个基于路径-速度解耦的UAV 编队协同轨迹规划方法[88].在路径规划阶段设计了预瞄距离自适应,在速度规划阶段设计了基于灾变策略下的遗传算法(避免UAV 冲突).最后通过栅格法和Dubins 曲线,仿真了二维平面下UAV 跟随指定的队形.
考虑针对编队飞行的航迹规划研究存在不少,但大部分只是讨论多UAV 组成一个编队进行航迹规划的问题,未来面对多UAV 群运用的要求,需要作出相应的改变.本文从3 个方面阐述研究多UAV 群航迹规划需要注意和改进的地方.
3.1.1 UAV 群通信、感知功能
为了实现UAV 群的全自主决策,UAV 群的通信功能必不可少.UAV 群的通信功能在于群内信息交流和群间信息交流,相同UAV 的通信范围应该是以rc为半径的球体,在UAV 群内可以采用拉普拉斯矩阵l=[lij]表示UAV 间的通信关系,当UAVi与UAVj存在通信链路时,lij=-1;不存在通信链路时lij=0 ;则当i=j 时,.为了让群内所有UAV 可以间接通信,UAV群内的通信要求是通信链路中必然包含一个完整节点的可行树.而群间UAV 的信息交流,需要满足存在一对所属不同编队的UAVi,j建立通信关系,即.但UAV 群在途中仅仅考虑基础通信是不完备的,由于通信存在延迟、噪音、竞争等问题,必然也带来更复杂的建模和新的研究内容,比如最大容许时延、竞争信息发布等问题.由于通信功能可能受环境影响导致中断,所以UAV 群应具备感知功能.
UAV 群的感知功能在于辅助群内决策和感知外部障碍,相同UAV 的感知范围应该是以rv为半径的球体.群内UAV 的互相感知,是为了通过观察UAV 之间的距离来判断UAV 是否到达指定位置.基于群内通信,群外的感知是每个UAV 感知范围的叠加,则每个UAV 共享群感知范围,只要任一UAVi,j发现障碍物,即.但UAV群在途中仅仅考虑基础通信是不完备,所有UAV 即可获得该障碍物位置信息.未来UAV 感知范围可以结合视觉、惯性、动力等相关测量技术.
3.1.2 UAV 群编队队形和变换避障
为避免UAV 群中机与机之间发生冲突,需要设置安全距离jl,由于UAV 编队不一定是在同一个平面,所以每个UAV 之间的空间距离必须大于等于jl,如式(1).则每个UAV 群必然有一个机群大小,本文以安全距离作为UAV 编队的依据,主要探讨常见的3 种编队队形: 一字形、“人”字型和正多边形.一字形是所有UAV 在水平方向或竖直方向上呈一条直线,相邻UAV 之间的距离为安全距离.“人”字型是所有UAV 构造成两条均匀分布的交线,并且交点处有一个UAV,每条交线上相邻UAV 之间的距离为安全距离,此时只有保证两交线夹角大于等于60°,才能保证所有UAV 之间距离大于等于安全距离.当UAV 数量为奇数时,“人”字型编队的UAV 群是对称的;当UAV 数量为偶数时,“人”字型编队的UAV 群必然有一条交线中多一个UAV.正多边形则是UAV构造成正多边形的边,并且每个顶点上有一个UAV,每条边上相邻UAV 之间的距离为安全距离,由于正多边形的每个内角都大于等于60°,所以每个UAV之间的距离一定大于等于安全距离.使用正多边形编队时,要根据UAV 数量能整除的最小整数,来确定具体的正多边形,所以只存在为质数的正多边形.
UAV 群在避障时有两种选择: 保持编队队形和不保持编队队形.在保持编队队形情况下避障时,始终保持每个UAV 的速度、航向角和俯仰角一致,位置状态必须保持相对稳定.而在不保持编队队形避障时,按约束情况由高到低可以分为3 种情况: 一是由某种编队队形变换为另一种编队队形,例如由正多边形编队变换为一字形编队;二是由某种编队队形变换为通信约束范围内的不规则队形,即在满足所有UAV 组成的通信链路中是一个完整的可行树前提下,每个UAV 在动力学约束下可以前往任意空间位置;三是部分UAV 可以脱离编队通信约束,独自进行避障过程,在避障完成后再通过GPS 等定位信息与UAV 群汇合.
3.1.3 UAV 群之间的冲突
基于时间的四维空间下,两个UAV 群若在某时段[t0,t1]内航迹的最近点tr 小于群间安全距离Rsafe(水平和竖直两方面),则代表这两个UAV 群之间存在飞行冲突,冲突表达式如式(2),其中,g=1 代表产生冲突.
一般来说,将高等级UAV 群作为低等级UAV群的虚拟障碍物,虚拟障碍物的构建如下所示: 每个UAV 会产生一个以Rsafe为半径的虚球障碍[89],则在满足所有UAV 虚球障碍的条件下,扩充将其形成封闭立体空间,形成UAV 群虚拟障碍物.不同编队队形的虚拟障碍物形式不同,在保持不影响冲突的前提下,通过将其外形进行平滑处理,可以极大提升求解效率: 在同一线段上的UAV 使用线段长度为长,虚球半径为宽和高的圆柱体替代多个UAV 虚球,则整个UAV 编队的虚拟障碍物可以由边为圆柱体,顶点处为球缺围成.一字形编队由一个圆柱体和两个半圆体拼接而成,“人”字型编队由两个圆柱体、一个四分之一圆体和两个半圆体拼接而成,正n 边形编队由n 个圆柱体和n 个四分之一圆体拼接而成.
最近点距离dmin判别方式: 首先计算编队间每个顶点之间距离,找到最近距离d1的两个点,.然后找到距离a1第2 近的点,找到距离b1第2 近的点,由a1和a2组成线段A12,由b1和b2组成线段B12.
则p 点到b1的距离dpb1为
对式(4)求最小值:
得到点b1到线段A12的最短距离d2=mindpb1.同理可得到点a1到线段B12的最短距离d3=mindqa1(q为线段B12上的任意一点).最终可以判断两个编队间的最近距离.
尚没有完全深入研究编队飞行对多UAV 群任务规划的影响.关启学等基于向量场法提出了一种基于多任务执行的UAV 编队路径重构方法[90],但没有具体分析编队约束和编队控制,而仅仅是简单分析了路径的重构方法.SHIN 等讨论了UAV 群中的任务分配、通信网络和编队控制[91],提出了一个分布式决策的范式,但仍没有具体探讨多UAV 群任务规划产生的新问题.UAV 群作为一个整体,虽然可以简化UAV 与需求多对一映射关系为一对一关系,更好地实现任务规划,但也会带来许多新的研究问题.下面将从3 个方面对考虑编队飞行的多UAV 群任务规划与多UAV 任务规划相对比,提出未来可以着手的新研究.
3.2.1 任务规划目标的新内容
从任务目标方面去观察,将会产生编队变化效率、编队生存力等新研究内容.在编队变化效率目标中可以分成两类进行研究: 一是最小能耗变化;二是最短时间变换.一般在考虑成本的任务规划目标中,将会加入最小能耗变换的新目标,而在考虑最快到达目标点的任务规划目标中,将会加入最短时间变换的新目标.编队生存力是指UAV 群在部分UAV失效后仍能具有一定完成任务的能力,这就是UAV群自身带有的抗毁性,其值在任务规划目标中越大越好.比如在某些威胁因素区域,首先要判断是否进入威胁区域,当选择进入威胁区域时,要决定采用何种编队队形和航迹规划通过威胁区域,以保证较大的编队生存力.
而在多UAV 群中,由于不同UAV 群可能存在航迹的竞争,还可能存在不同等级,所以未来多UAV群的任务规划复杂度将比多UAV 和单UAV 群更大.
3.2.2 任务规划内容的新问题
当确定了任务目标的新内容后,就要具体研究考虑多UAV 群的任务规划内容的新问题,可以从编队出发前的初始预规划和途中重规划两方面探讨.在初始预规划阶段,不仅需要通过需求数量判断机群中UAV 的数量,还要通过任务目的设计最有效的基础编队队形.要考虑多方面因素如任务重要度等划分UAV 群等级,还要针对不同编队队形设计不同的通信拓扑结构.
由于UAV 群体系庞大,更容易遇到突发情况,所以必须采用途中在线重规划阶段,以满足UAV 群自组织、自学习、抗毁性等特性.比如,当UAV 群在飞行途中部分UAV 摧毁,首先反馈到任务分配中判断是否有必要继续执行任务,因为当UAV 数量少于一定阈值时,将不能保证完成任务.然后进行航迹重规划,最后调整编队飞行.而在某些没有时间窗等硬性约束的任务情况下,UAV 群的途中重规划可以不反馈到任务分配中,而只进行航迹和编队重规划.相比预规划阶段的新问题,途中重规划的新问题才是考虑编队飞行的重点和难点,如图2 所示.一是实时调整UAV 编队队形,UAV 群在飞行途中可能存在多种不同的编队队形,以适应任务目标;二是根据编队调整的状态,实时调整通信拓扑结构;三是存在UAV群的解散和集合,当某UAV 群因任务失败而解散前往协助其他UAV 群执行任务时,就需要考虑具体时间点和空间点与其他UAV 群集合.
图2 多UAV 群任务规划内容的新问题Fig.2 New problems of multiple UAV swarm mission planning content
3.2.3 任务规划算法的新改变
针对初始预规划和途中重规划的不同阶段,需要设计相对应的集中式和分布式算法.集中式算法和分布式算法都可以运用于初始预规划和途中重规划中,但由于初始预规划和途中任务重分配考虑的内容多而且有通信延迟等限制,所以集中式算法主要运用于初始预规划和途中任务重分配.而在途中航迹、编队重规划中更看重效率和自主性,所以分布式算法主要运用于途中航迹和编队重规划.集中式算法和分布式算法已经较为成熟,这里进一步强调近年来兴起的分层分布式算法,该算法与UAV 群的途中重规划有很好的贴合度,不仅能得到较好的UAV 群体决策结果,还能更快速、高效地求解结果.ZHANG 等在研究多UAV 路径规划问题上,考虑了一个包含4 个等级的社会鸽群算法[92].分层分布式算法可以引入群体决策中的一些优化思想,作为一个新的群体算法.Máté 在研究鸽群等级中发现分层的飞行领导模式并不是建立在分层的社会优势结构之上[93].基于这个思想启发,UAV 群中的UAV 等级应该随着时间而不断变化,这个等级变化要从历史决策、当前状态等相关属性中产生.未来将分层分布式算法结合群体决策的优化思想运用到考虑编队飞行的多UAV群途中任务重规划中,将有助于利用群体决策的涌现性,实现既高效又简单的仿生算法,如图3 所示.
图3 多UAV 群运用的新算法流程图Fig.3 New algorithm flowchart of the multiple UAV swarm application
在UAV 群任务规划的研究现状中,一是发现UAV 任务分配已涉及多方面研究领域;二是发现UAV 航迹规划可以区分为离线和在线两个方面的研究;三是在UAV 群任务规划中发现存在3 种研究方式.在UAV 群编队飞行的研究现状中,从编队感知通信和编队控制两部分综述,编队感知通信是编队控制的基础,并且在编队控制中发现可以分为5 种控制方法.最后讨论了多UAV 集群融合任务规划和编队飞行的新研究方向和相关问题,在考虑编队飞行的多UAV 群航迹规划中,主要提出了一种解决UAV 群之间的冲突解决方式;在考虑编队飞行的多UAV 群任务规划中,提出了目标的新内容、内容的新问题和算法的新改变.