基于SAGWO算法的UCAVs动态协同任务分配

2018-09-04 01:58魏政磊赵辉黄汉桥王骁飞周瑞

北京航空航天大学学报 2018年8期

魏政磊，赵辉，黄汉桥，王骁飞，周瑞

(1. 空军工程大学航空工程学院，西安 710038; 2. 西北工业大学无人机系统技术研究院，西安 710072)

随着作战环境的复杂化、作战过程的动态化、作战任务的多样化，多无人作战飞机(Unmanned Combat Aerial Vehicles， UCAVs)协同攻击多目标将是一种未来的重要作战模式。UCAVs协同任务分配是UCAV协同作战的关键技术之一，其目的是在一定战场环境和任务要求下，考虑执行任务的约束条件和技术指标，将目标合理地分配给不同的UCAV，使得整个编队作战效能达到最大。

目前，对UCAVs协同任务分配技术的研究已经成为UCAV作战研究中的热点。针对任务分配问题，文献[1]采用多种协商机制建立分布式UCAVs控制系统；文献[2]提出了基于多层树的协同攻击多目标模型；也可以采用智能优化算法对UCAVs任务分配问题求解，比如萤火虫优化算法[3]、粒子群算法[4]等。在实际的UCAV协同任务执行过程中，可能会出现任务获取信息不完整，或者在任务执行过程中存在战场环境和任务需求以及任务信息的变化，导致现有的任务分配方案对实时环境的不适应[5-6]。同时，相关文献中的任务分配算法模型同时或部分存在以下问题，如：①未考虑目标之间的支援关系；②未考虑电子干扰下的任务分配；③动态的任务分配没有用时间指标体现出来。

针对动态任务分配的特点，同时考虑到以上存在的问题，本文采用了时间片下基于改进灰狼优化(Grey Wolf Optimization, GWO)算法[7]的任务分配方法。通过对UCAV编队信息和任务目标信息的分析，提出了基于时间片的多约束动态任务分配模型；针对动态任务分配数学模型，采用了自适应灰狼优化(Self-Adaptive GWO, SAGWO)算法进行求解；最后进行了仿真验证。

1 UCAVs动态任务分配模型

假设攻击目标的L枚导弹构成集合K={k,k=1,2,…,L}，则UCAV编队的第k枚导弹与无人机Vi的第l枚导弹对应的关系为

(1)

式中：i={1,2,…,M}；l={1,2,…,Li}。

1.1 UCAV优势概率

UCAV对目标的优势概率与UCAV距离威胁因子、速度威胁因子和角度威胁因子有关。UCAV编队中Vi对目标Tj的优势概率可以表示为

PKij=c1Tij,DTij,θ+c2Tij,v

(2)

式中：c1和c2分别为无人机Vi相对任务目标Tj的距离-角度威胁和速度威胁的权重；Tij,D、Tij,θ和Tij,v分别为距离威胁概率、角度威胁概率和速度威胁概率[8]。

距离威胁概率为

(3)

式中：dij为Vi相对于Tj的距离；rW为我方UCAV导弹的有效作用距离；RWmax为UCAV的最大跟踪距离。

角度威胁概率为

Tij,θ=exp(-λ1(πθij/180)λ2)

(4)

式中：θij为UCAV速度方向与视线之间的夹角；λ1和λ2为正常数。

速度威胁概率为

(5)

式中：vi和vTj分别为第i个UCAV和任务目标Tj的速度矢量。

1.2 任务威胁分析

战场目标威胁信息分析对UCAV执行任务成功率是非常重要的。对于目标威胁特性，将目标威胁分为探测类目标威胁和杀伤类武器威胁[9]。探测类目标威胁一般指雷达威胁，杀伤类武器威胁包括地空导弹和高炮，其威胁概率采用文献[7]的模型。

当UCAV在多目标威胁空间中执行任务时，面临的威胁程度增加。这种威胁程度增加的原因不仅仅是由于多个威胁源独立探测和杀伤的叠加效果，而且是由于整个目标网络化信息管理与共享。因此，提出了目标依赖矩阵来反映目标之间的关系[10]。

定义1AN×N为目标内部之间依赖矩阵。矩阵元素aij为第i个目标对第j个目标的依赖程度，也可以说第j个目标对第i目标的信息共享或者火力支援能力。

对于多个目标的威胁，考虑到目标之间相互支援的情况，则目标对UCAV的威胁概率为

PTij=[1-∏ (1-aik,DPD(k,j))]·

[1-∏ (1-aim,GPG(m,j))]

(6)

式中：PTij为目标i对无人作战飞机j的威胁概率；aik,D为任务目标中探测类武器对其他武器的依赖程度；aim,G为任务目标中攻击类武器对其他武器的依赖程度；PD(k,j)为单个探测类武器的威胁概率；PG(m,j)为单个攻击类武器的威胁概率(包括地空导弹威胁概率与高炮威胁概率)。

对于攻击类目标，考虑到信息资源相互共享与火力支援，同时其威胁过程是即发现就攻击，探测概率为1，因此，只计算攻击类目标对UCAV的威胁概率：

PTij=1-∏ (1-aim,GPG(m,j))

(7)

1.3 任务时间分析

UCAV完成任务的时间主要是根据任务类型、可执行该任务的UCAV特性及载荷类型等先验经验得到完成各项任务的统计时间。观测某一时刻的分配情况、任务目标对UCAV的威胁、UCAV对任务目标的杀伤情况以及完成任务的效果需要引入时间片这个概念。

定义2任务时间片[11]是指对事件变量集的某一次观察。在协同攻击多目标的任务分配问题中，时间片就是每隔一定的时间去观测UCAV的任务情况。时间片的间隔越小，意味着系统观测分配结果、目标威胁程度、UCAV的杀伤情况以及对各方兵力信息的统计分析频率越高，那么决策越精细，其实时性提高；但是间隔小的时间片会引起信息量的增大，系统处理数据的时间增长，不利于战场快速决策，因此，要选取一定任务时间片是分配决策的关键问题。

定义3UCAV飞行矩阵Tfly是(M+N)×N矩阵，行包含UCAV和目标，列包含目标，tij表示节点i到节点j的时间消耗。Tfly取决于UCAV的速度和位置、任务目标的位置以及其机动性，Tfly可表示为

对于Tfly元素tij的计算主要与在时间片结束时刻UCAV的速度和位置、任务目标的位置有关，如下：

(8)

定义4任务累计完成时间ti[12]是指第i个UCAV在执行任务集Si={Ti,1,Ti,2,…,Ti,j}的累计完成时间。ti可表示为

ti=tiTi,1+tTi,1Ti,2+…+tTi,j-1Ti,j

(9)

式中：tiTi,1、tTi,1Ti,2和tTi,j-1Ti,j分别为第i个UCAV从所在位置节点到目标Ti,1节点的时间、Ti,1到Ti,2的时间和Ti,j-1到Ti,j的时间。

1.4 协同任务分配评价指标

UCAVs协同对地攻击任务目标是以整个编队的作战效能作为最优目标，而评价整个编队的作战效能指标有目标价值毁伤(Target Value Damage，TVD)、UCAV编队损耗代价(UCAV attrition)和执行任务预计消耗时间(Task Expending Time，TET)。

1) 目标价值毁伤最大化

无人机Vi完成任务Tj的目标毁伤收益值的大小体现了任务的重要程度和UCAV的执行能力，也可以量化目标价值毁伤值。编队对多目标的协同打击中，产生总的价值毁伤为

(10)

式中：f1为编队完成任务目标的价值毁伤；VTj表示摧毁目标Tj获得的价值量，其由指挥人员预先设定，在作战过程中随着态势的变化和作战意图的变化可以进行调整。

2) UCAV编队损耗代价最小化

如果在UCAV编队中无人机携带软杀伤武器，那么无人机会因为欺骗和干扰设备而增大无人机的生存概率。假设第i架无人机Vi携带ni个欺骗和干扰设备，则该机的损耗代价为

(11)

式中：VVi为无人机Vi的价值量。

在整个UCAV编队攻击过程中所遭受的损耗代价为

(12)

3) 任务时间消耗最短

执行任务的时间可以用UCAV与任务目标间的距离来衡量，距离目标越短，则执行任务消耗的时间越短。任务消耗时间最短模型如下：

(13)

式中：f3为任务时间消耗指标。

4) 总评价指标

在多机协同过程中，设计总评价指标函数时，考虑到任务目标价值毁伤最大化、UCAV编队损耗代价最小化以及任务时间消耗最短，因此，分配模型的总体评价指标函数为

(14)

式中：J(Π)为UCAV编队协同攻击多目标的总体评价指标函数，Π为分配方案；ω1和ω2分别为衡量减少UCAV代价损耗和时间损耗的权重，其来源于决策者的偏好。协同攻击多目标分配问题实质就是寻找一个方案Π使评价指标函数最小，使问题转化为寻优问题。

约束条件：

2)X1j+X2j+…+XLj=1，不允许多个UCAV导弹攻击同一个任务目标。

3)ci≤Li，单架UCAV执行任务数量ci不超过UCAV可携带最大导弹数量Li。

4) 由于UCAV性能和挂架的限制，UCAV和其挂载的武器或者导弹之间存在约束，UCAV影响武器效能的发挥可以用UCAV-武器适应度表进行描述，该适应度表中的元素用[0,1]之间的数表示，数值的大小表示武器攻击效能发挥程度，数值越小表明UCAV越不利于武器的发挥。

2 自适应灰狼优化算法

2.1 基本GWO算法及改进策略

受灰狼的社会等级制度和猎食行为的启发，Seyedali等提出了GWO算法[14]。同其他启发式优化算法相比，GWO算法具有实现简单、全局优化能力强、收敛速度快等特点，一经提出便受到了众多学者的关注与研究[15-17]。

在寻找最优解过程中，根据灰狼猎食的3个重要步骤，即接近、包围、攻击猎物，GWO算法建立了一个数学模型：狼群中每一个个体都是一个潜在解，其中α狼的位置是最好的解，β和δ的位置分别为优解和次优解，其他的候选解是ω的位置。猎食过程如图1所示,C1、C2和C3分别为α、β和δ狼的位置系数；a1、a2、a3分别为α、β和δ狼的控制参数；Dα、Dβ和Dδ分别为α、β和δ狼到ω狼的距离。在文献[14]中，通过大量的仿真实验表明，GWO在函数优化问题时具有较快的收敛速度，但是控制参数a线性变化忽略了要解决的优化问题多样性，尤其在解决多峰值函数问题时容易陷入局部最优，很难达到全局最优。

针对以上缺点与不足，本文提出了自适应调整策略，通过学习种群最优位置信息去控制种群的搜索方向；另一方面，改进算法利用最优个体与当前个体之间的位置矢量差，跳出局部最优区域来保持种群多样性。对于控制参数a(包括a1、a2和a3)来说，根据文献[18-20]的分析，为了确保算法在多种条件下具有好的优化结果，a采用二次曲线策略。

1) 自适应调整策略

为了进一步提高算法的收敛速度，采用自适应调整策略，将当前个体的适应度值Ji与灰狼群的平均适应度值Javg进行比较，如果Ji优于Javg，继续使用原策略更新灰狼位置；如果Ji次于Javg，利用式(15)变异灰狼位置[7]。

X(g+1)=

(15)

式中：X(g+1)为第g代位置更新后的灰狼位置，即第g+1代灰狼位置,g为当前迭代次数；X1、X2和X3分别为当前灰狼到α、β和δ灰狼的距离；aJ为1/Jα、1/Jβ与1/Jδ之和，Jα、Jβ和Jδ分别为α、β和δ的适应度值。

2) 跳出局部最优策略

针对原种群多样性较差，该策略对更新后的位置进行重置，通过最优个体与当前个体之间的位置矢量差随机控制当前个体不在当前局部最优解的区域内[21]：

(16)

3) 控制参数非线性调整策略

对于基本的GWO算法，选择二次曲线来设计控制参数a的调整策略。利用二次曲线在区间[0,1]上非线性递增，将GWO算法的迭代次数映射到[0,1]上，控制参数调整策略为

a=amax-(amax-amin)(g/gmax)2

(17)

式中：amax和amin分别为控制参数的最大值和最小值，一般分别取2和0；gmax为最大迭代次数。

2.2 SAGWO算法流程

由于GWO存在收敛速度慢，容易陷入局部最优的缺点，结合上面策略，提出了SAGWO算法。下面给出了SAGWO算法的流程：

步骤1初始化灰狼种群，即随机产生n个智能个体的位置；初始化a、距离系数A和位置系数C[14]；初始化Xα、Xβ和Xδ的值。

步骤2处理越界智能个体，计算每个智能体的适应度值，计算灰狼群的平均适应度值Javg。

步骤3更新当前迭代期间的Xα、Xβ和Xδ。

步骤4根据式(17)，计算各个优解的a、A和C。

步骤5采用式(15)的策略更新当前智能个体的位置。

步骤6通过式(16)，使智能个体跳出局部最优解的区域。

步骤7输出最优解Xα和最优值Jα。

步骤8如果达到结束条件(最大迭代次数或连续5次结果相差小于一定的精度)，则结束；否则转到步骤2。

2.3 SAGWO算法的收敛性分析

条件1若f(Fal(x,ξ))≤f(x)，且ξ∈S，则有f(Fal(x,ξ))≤f(ξ)。

其中：xk+1=Fal(xk,ξ)为下一次迭代结果；S为解空间；f为优化函数；ξ为迭代过程中得到的解；v(B)为集合B的Lebesgue测度；uk(B)为算法Fal第k次迭代解在集合B上的概率测度。

定理1SAGWO算法收敛于全局最优。

证明首先，SAGWO算法每次迭代都保存了灰狼群体的最优位置，保证了目标函数的适应度值的非增性，所以算法的收敛满足条件1。

其次，再需要证明SAGWO算法满足条件2，便可根据文献[23]的随机优化算法收敛定理，得到SAGWO算法收敛于全局最优。根据文献[14]的灰狼群体位置更新公式转换，可得

(18)

式中：X1(g)为更新X(g)而产生与最优解有关的中间变量；r1与r2为随机变量。

由式(18)对每一代左右累乘，可得

(19)

(20)

根据式(19)与式(20)，可得

(21)

因此必有

(22)

同理可得，优解、次优解、X2与X3收敛于最优解Xα。由式(15)可知，当g→∞时，X(g+1)收敛于最优解Xα。

SAGWO算法的单个灰狼智能体搜素空间是有限的，则由n个灰狼组成的群体的状态也是有限的。当前的群体状态仅与上一时刻的群体状态有关，所以，狼群状态具有Markov性。狼群的转移状态与时间g无关，则狼群位置的状态序列是齐次的。综上述分析，狼群位置的状态序列是有限齐次Markov链。

设优化问题的全局最优解为Xα，定义狼群位置的最优状态集为

H={q=(Xα1,Xα2,…,Xαn)}

(23)

对于狼群状态序列{Xα(t);g≥0}，最优状态集H是群体状态空间S上的一个闭集。由式(22)和狼群状态序列是有限齐次Markov链可知，S中不存在H之外的非闭空间，即群体状态序列必将进入最优状态集H，连续无穷次搜索不到全局最优解的可能性是0，则满足2.3节条件2，故SAGWO算法收敛于全局最优。

证毕

2.4 SAGWO算法的复杂度分析

根据SAGWO算法的特点与执行步骤，在这里讨论算法每一步时间复杂度。在2.2节的步骤1中，对D维空间下的n个灰狼进行初始化，需要nD次运算；在步骤2中，计算狼群的适应度值需要n次运算，一般的适应度函数的复杂度为O(D)，还要计算种群适应度值平均值，需要n次运算；在步骤3中，通过比较得到3个优解，最多需要3n-3次运算；在步骤4中，计算更新各个优解的a、A和C需要3nD；在步骤5中，计算各个狼到Xα、Xβ和Xδ的距离需要3nD次运算，根据式(15)需要D+n，包括计算更新位置与比较；在步骤6中，跳出局部最优策略需要nD；在步骤7和8中，输出最优解与判断算法是否满足终止条件，其复杂度均为常数。由于算法最多执行g次，则SAGWO算法的时间复杂度为O(((3n+1)·D+n)g)≈O(3nDg)。

3 UCAVs动态任务分配方法

3.1 目标任务序列编码

在GWO算法中，每个智能个体就是一个备选解，多个智能个体通过种群搜索和其位置更新来寻优。协同攻击多目标的任务决策关键在于确定：哪架UCAV来执行哪些任务和UCAV执行任务的时序[23]。

3.2 多目标动态任务分配流程

UCAV在执行任务过程中，所有的元素都可能随着时间发生变化。设定动态的任务分配的适应度函数为

J(Π(t),t)=

(24)

其中：Xmissile-T(t)为UCAV携带的导弹对任务目标的分配方案；Xorder(t)为UCAV执行任务的顺序方案；t表示执行任务中的时刻。

具体基于SAGWO算法的UCAV协同攻击多目标动态任务分配流程如下：

步骤1定义任务时间片长度tslice。根据估算最小的任务飞行时间min(tij)，将其划分为nt个时间片，因此，可以计算得到

(25)

步骤2初始化UCAV与目标的信息。在分配开始之前，获取初始UCAV的位置、数量、速度以及其武器信息，探测得到目标的位置、数量和机动性。计算目标的威胁概率和UCAV对目标的毁伤概率。

步骤3初始化参数。设置GWO的基本参数，控制参数最大值amax和最小值amin，GWO参数A、C，搜索方程的惯性权重ω，最大迭代次数gmax，搜索空间智能个体数为nagent。

步骤4随机生成一组实数然后基于编码生成初始分配方案。

步骤5当t=0时，根据2.2节的步骤2～步骤8，计算初始最优分配方案。

步骤6UCAV根据初始分配方案，对将要执行的任务目标进行动态追踪。

步骤7在第一个时间片开始时，获取UCAV失效信息与目标是否发生变化。

步骤8在时间片内，根据变化的信息，随机生成一组分配方案，重复步骤5，寻求信息变化后的最优分配方案。

步骤9在时间片末，根据步骤8的最优方案，利用追踪法更新UCAV的位置信息，并且输出最优分配结果。

步骤10在下一个时间片或者在t+tslice时刻，重复步骤7～步骤9，直到t≥min(tij)或者开始执行航路规划层的时候，输出最终结果。

4 仿真实验及分析

4.1 任务想定

为验证算法的有效性，针对6架UCAV对8个具有威胁的敌方目标的任务分配进行仿真实验，如图3所示，x和y分别为横向和纵向坐标。其中，UCAV编队拥有6架无人机，每架无人机携带2枚空地导弹，其攻击目标的任务是毁伤目标，相关属性见表1和表2；敌方由雷达(Radar)、SAM(Surface-to-Air Missile)防空导弹和AAGun(Anti-Aircraft Gun)防空炮3种类型目标组成，每个目标最多只能被我方1个UCAV攻击，其相关属性见表3和表4。A型空对地导弹的性能参数：有效作用距离rW-A=10 km、最大跟踪距离RWmax-A=60 km；B型空对地导弹的性能参数：rW-B=10 km、RWmax-B=80 km。表2表示UCAV与机载导弹之间约束。

UCAV 位置/km导弹数量×型号软杀伤武器数量速度/(m·s-1)价值量V1(35,0)2×A-AGM22380.8V2(40,6)2×B-AGM12380.9V3(48,10)2×A-AGM22380.95V4(54,9)2×B-AGM12380.95V5(62,6)2×A-AGM22380.85V6(67,0)2×B-AGM02380.8

表2 UCAV的武器适应度

表3 目标信息设置

表4 目标间依赖矩阵

表3表示敌方目标的编号、类型、位置信息以及价值量，由文献[7,9]可知，雷达目标性能参数：雷达参数KR=1.0×1012m4，最大作用距离Rmax=100 km；防空导弹SAM性能参数：杀伤区近界水平距离dsj=30 km，杀伤区远界水平距离dsy=100 km；高炮AAGun性能参数：有效火力半径Rg=10 km，圆锥死界半径rg=0.9 km。表4表示目标间相互支援能力。

SAGWO算法和GWO算法种群数大小设置为30，迭代次数为100次，控制参数值的最大值amax、最小值amin分别取值为2和0。对于IPSO、ACA、GA、GWO算法，其算法参数设置与文献[7]相同，便于比较参考。

任务分配模型中的威胁优势权重c1和c2分别为0.6和0.4，总体评价指标函数中的衡量减少UCAV代价损耗和时间损耗的权重ω1和ω2分别为0.6和0.4。

本文采用MATLAB 2014a进行仿真，运行环境为Inter(R)Core(TM)i5-3470处理器，操作系统为Windows7。

4.2 静态任务分配仿真

为了验证SAGWO算法的求解有效性，对该实验运行30次，得到最优分配方案、算法耗时和平均最优函数值。根据优势概率模型，计算得到我方无人机编队各个UCAV对敌方目标的优势概率，如表5所示；根据目标对UCAV的威胁模型，求出各目标对UCAV的威胁概率，如表6所示。

仿真结果：SAGWO算法耗时为0.281 06 s，最优函数值为0.733 8，最优任务分配结果如表7所示，具体分配如图4所示。

由图5可知，最优适应度值随着迭代次数的增加，渐趋于稳定，在第42代以后最优适应度值基本不再变化，其值为0.733 8；平均函数值也随着迭代次数增加而趋于稳定，虽然有微小波动，但是总体趋势不再变化。由图6可知，任务分配的各个指标值在最开始有波动，但是随着迭代次数增加，各指标值区趋于稳定，编队损耗代价值随着迭代增加而减小，目标价值毁伤值相对原来变化不大，任务时间消耗值比迭代初期减少，基本符合任务分配的目标毁伤最大化、编队损耗最小化、任务时间消耗最小化的原则。综合以上分析，SAGWO算法对任务分配问题是有效的。

表5 UCAV对目标的优势概率Table 5 Advantage probability of UCAV to target

表6 目标对UCAV的威胁概率

表7 UCAVs最优任务分配

为了验证改进算法的求解质量与求解稳定性，将SAGWO算法与IPSO、ACO、GA、GWO算法相比较[7]，并且应用于不同规模。从图7可以分析出，在分配方案变化不大的基础上，5种算法的最优函数值随着迭代次数的增加渐渐趋于稳定，只是求解精度与求解速度不一样，GWO、ACO和IPSO算法相对于其他2种算法过早的收敛，陷入局部最优；GA算法在58代时达到最优解，但是收敛速度较慢，SAGWO算法在43代达到最优解，相较于GA算法收敛速度较快。图8是针对不同规模的任务分配问题，采用不同算法的优化时间对比结果，从其可以看出，基于各个算法的任务分配优化时间随着任务分配规模增加而增加，其中GA、ACO、IPSO算法对问题规模增加更加敏感，优化时间增加得更快，而SAGWO算法与GWO算法的优化时间增加程度基本上一样。通过以上基于不同算法的任务分配实验，进一步验证了SAGWO算法的求解稳定性和有效性，也验证了SAGWO算法的求解精度好于其他4种算法，而且优化时间也好于GA、ACO、IPSO算法。

4.3 动态任务分配仿真

1) 基于目标移动的动态任务分配仿真

为了验证基于目标移动的动态任务分配有效性，对6架UCAV编队攻击8目标的动态任务分配实验运行30次，得到一定时间片末的最优分配方案、算法耗时和平均最优函数值。首先通过UCAV飞行时间矩阵定义得到表8，根据时间片定义与分析，确定最小飞行时间min(tij)和时间片数nt分别为279.3和270，得到时间片长度为1 s(取整数，方便计算)，满足大于每次任务分配优化时间。其次设置机动目标参数，如表9所示，合速度为x、y方向速度平方和的开方。在实验中，取定前240个时间片进行仿真与分析，首先对整个过程的动态任务分配进行分析，选取240个时间片其中的4个时间片与0时刻进行对比分析，然后对240个时间片的函数值曲线进行分析，最后对第240个时间片优化函数值曲线和指标值变化曲线进行分析。

图9和表10是针对基于目标移动的动态任务分配问题的任务分配图和其中5个时间片的任务分配方案。从图9可以看出，经过240个时间片，UCAV根据自己的优势去攻击相应的目标，分配结果比较均匀。表10中的5个时间片任务分配方案随着时间片的变化，其有一定的变动，这是因为目标位置发生变化，UCAV也发生变化，导致分配方案也发生变化。

表8 UCAV飞行时间矩阵

表9 机动目标速度

表11是针对基于目标移动的动态任务分配问题选取其中5个时间片的优化时间和适应度值进行比较分析，图10表示240个时间片的平均函数值与最优函数值随时间片变化的曲线。通过以上结果分析，随着时间变化，基于移动目标的任务分配方法是有效的，而且任务分配方案也是变化的。图11为第240个时间片的最优适应度值、平均值以及各评价指标值随迭代次数增加的变化趋势。通过图11的结果分析，时间片内基于SAGWO算法的任务分配是有效的，而且趋于稳定，得到最优值。

2) 基于UCAV失效的动态任务分配仿真

在第240个时间片，V4被击伤，退出战场，通过仿真实验，得到表12、表13和图12。表12中“0”表示无目标可执行。从表13的仿真结果可以知道，随着UCAV减少一架，优化时间消耗也减少。从图12中可以看出，随着迭代次数的增加，最优函数值和平均函数值趋于稳定，任务分配的各个指标值也渐趋于稳定，而且其值走向符合编队损耗代价值最小化、任务时间消耗最小化和目标价值毁伤最小化的原则。

时间/sV1V2V3V4V5V60T1T 3, T 2T 4T 5, T 8T 7T 660T 2T 1, T 3T 4T 5T 6, T 7T 8120T 3T 1, T 2T 4T 5T 6, T 7T 8180T 3, T 2T 1T 5T 4T 6T 8, T 7240T 3T 1, T 2T 5T 4T 6T 8, T 7

表11 5个时间片的任务分配优化时间消耗与适应度值

UCAVV1V2V3V4V5V6失效前失效后失效前失效后失效前失效后失效前失效后失效前失效后失效前失效后目标T3T4, T3T1, T2T1, T2T5T5T40T6T6T8, T7T8, T7

表13 一架UCAV失效前后的任务分配优化结果对比

3) 基于新增2个目标的动态任务分配仿真

对新增2个目标的性能参数如表14和表15所示。在第240个时间片之后，发现2个新目标——T9和T10，通过仿真实验，得到图13、表16和表17。从表17可以看出，随着在240时间片之后增加2目标，最优函数值和种群平均函数值都增加，并且优化时间消耗也增加。从图13可知，任务分配的最优函数值和平均函数值随着迭代次数的增加趋于稳定，任务分配的各个指标值随迭代次数增加而渐趋于稳定，而且其值走向符合任务分配各指标优化原则，提高打击敌方目标效费比。

表14 新增目标的信息设置

表15 新增目标依赖矩阵

表16 增加目标前后的任务分配方案比较

表17 增加目标前后的任务分配优化结果对比

5 结论

1) 针对UCAVs协同对地打击多目标任务分配问题的实时性、高效性以及复杂性，对UCAV编队信息以及对任务目标信息进行分析，设计了基于时间片的多约束动态任务分配模型。

2) 传统算法对动态任务分配问题求解速度慢、求解精度不高的缺点，提出了一种基于SAGWO算法的动态任务分配方法，同时证明了改进算法全局收敛，并分析了时间复杂度。

3) 本文对所设计的基于SAGWO的任务分配从静态与动态2种情况进行仿真验证。仿真结果表明，SAGWO算法可快速精确地求解出动态任务分配，且分配结果符合作战要求。由于篇幅有限，对于UCAVs武器分配尚且研究有限，需要进一步深入研究。