周同乐 陈谋, 朱荣刚 贺建良
随着隐形技术、人工智能等越来越多的高新技术在现代战争中的运用,现代空战环境的复杂性和不确定性越来越高,无人作战飞机代替有人机执行联合打击任务将成为未来空战的发展趋势[1],无人作战飞机具有速度范围大、作战范围广、高自主性、高智能性的特点[2],且由于无人作战飞机不受飞行员的情绪和身体状况的影响,具有自主决策能力的无人作战飞机在作战过程中不会因为受到刺激而出现操纵失误,可以说,在危险复杂的飞行环境中,无人作战飞机的优越性更加突出,但是单一无人机的能力是有限的,而且功能和适用性往往是相互制约的[3],功能单一的无人机,可能在单个方面的功能很强大,但是却只能执行和自己功能相关的任务,而现代战争中,获取不同来源的信息以及对多源信息的有效处理是掌握战场主动权的关键.因此,多无人机联合作战是无人机技术发展的新方向[4],为了使无人作战飞机编队打击敌方目标的效率得到进一步提高,有必要深入研究多无人作战飞机协同多目标攻防决策技术.
目前,智能算法已经广泛应用于多无人作战飞机协同多目标攻防决策技术中,已有很多的研究成果.文献[5]充分考虑目标之间的依赖关系和我方火力配置差异,通过改进遗传算法求解考虑分配次序的多无人机协同目标分配问题;文献[6]研究了基于合同网的目标分配方法,通过引入负载系数参数,迭代执行买卖合同与交换合同实现了无人机协同目标分配;文献[7]结合协同决策和控制要求,根据无人机编队的飞行特点和战场约束条件,建立了无人机编队的任务分配模型,并分别采用改进的粒子群算法(IPSO)、蚁群算法(ACA)和遗传算法(GA)解决了协同任务分配问题;文献[8]针对多机协同空战的目标分配问题,建立了综合优势函数,并在此基础上改进了人工免疫算法,得到了多机协同空战最优分配方案,满足了实际作战要求,但是,实际空战中的多无人机协同多目标攻防决策受到各种不确定性影响,往往难以达到真正意义上的最优[9],而且传统的智能优化算法往往无法满足空战高实时性的要求.
满意决策方法是一种建立在博弈理论基础之上融合了集合论思想的决策方法[10],为了提高搜索效率,满意决策通过设置满意度因子,将搜索空间限制在参与分配的个体提出的个体满意集合上,过滤掉不可行和收益低的分配策略,文献[11] 提出了基于满意决策的无人机空对地多目标攻击决策方法,根据参与目标分配的每架无人机完成任务的预估效益和预估代价提出满意集,建立拒绝函数和选择函数从而获得满意分配结果,文献[12] 研究了基于满意决策的多无人机目标分配问题,通过满意决策剪裁搜索空间,大大提高了目标分配算法的运行效率.狼群算法(Wolf Pack Search Algorithm,WPS)是一种通过模拟自然界狼群相互协作围捕猎物的行为抽象出来的新型元启发式算法[13],该算法基于“强者生存”的自然规律,通过狼群职责分工的协作式搜索方式,保证狼群能够快速围捕猎物的同时避免陷入局部最优,文献[14]基于狼群算法解决了多无人机协同任务分配问题,并与其他群智能算法进行比较,仿真结果表明,狼群搜索可以提高算法的局部开发能力,并能更好地解决多维优化问题.
本文针对多无人机协同多目标攻防决策问题,研究基于狼群算法的多无人机协同多目标攻防满意决策方法,通过狼群算法寻优满意决策的满意度因子,在保证满意决策快速性的同时,最大限度提高决策的精确性.
本文研究多无人作战飞机协同多目标攻防决策问题,考虑M架我方无人机对N个敌方目标的攻防决策,多无人作战飞机协同多目标攻防决策原理如图1所示.
当敌方无人机进入我方无人机攻击范围后,对无人机进行攻防决策,形成无人机攻防决策方案,决策目标是确定哪架无人机具体攻击哪个目标及哪架无人机采取防御策略.
在多无人作战飞机协同多目标攻防决策过程中,主要考虑以下3个方面:
1)空战态势,无人空战环境中各种态势因素,如目标的角度、距离、高度、轨迹等的变化往往能够直接影响攻防决策的结果.空战态势函数设计为[15]:
其中,Pα,Pd,Pe分别表示角度、距离、能量优势,k1,k2,k3为相应的权重系数.
图1 多无人作战飞机协同多目标攻防决策问题示意图Fig.1 Schematic diagram of multi-UCAVs cooperative multiple target attack-defense decision-making
2)无人机性能.无人空战决策早期,由于交战双方无人机种类较少、性能类似,攻防决策往往只考虑空战态势而未考虑无人机性能,但随着不同国家科技水平的发展,交战双方空战能力差异化越来越明显,无人机性能在空战中的作用也越发突出.无人机性能优势函数设计为:
式中,Capi和Capj分别为我方和敌方目标的无人机性能,与无人机的机动能力、打击能力、探测能力、操纵能力、生存能力、航程能力和电子对抗能力有关[16].
3)目标意图,现代无人空战是复杂环境下的信息博弈过程,某方能够率先解读战场信息,准确快速预测敌方未来动作,便能够在空战中掌握先机.目标意图预测能够通过前一阶段的空战态势和战场环境信息来推测下一阶段敌方战术意图,进而预知敌方短时间内的可能执行的战术动作.因此,结合敌方无人机意图进行多机协同多目标攻防决策,能够在预知敌方无人机战术动作的前提下协调调度己方无人机资源,敌机对我机的每种意图对应的目标意图优势SI如表1所示[17],敌机对我机的意图越危险,我机对敌机的意图优势越小.
表1 意图优势表Table1 Intention superiority
多无人作战飞机协同多目标攻防决策问题实质上是一个多目标优化问题,为了充分考虑空战态势和任务收益,建立如下两种目标函数[8]:
其中,xij={0,1},xij=1表示将敌方无人机j分配给我方无人机i;Sij为空战优势值,是我方无人机i对敌方无人机j的空战优势的体现;Bij和Cij为无人机i攻击无人机j所获得的收益和代价;式(3)中J1max以获得空战优势为基础,目的是最大限度地保全我方无人机;式(4)中J2max以攻击结果的收益和代价为核心,旨在保证每一次攻击产生的效果;约束条件式(5)保证所有敌方目标均会被攻击到;约束条件式(6)保证兵力分配均衡,允许协同攻击某一特定目标无人机j的最大数量为Dj;约束条件式(7)为无人机弹药约束,我方无人机i能够同时攻击敌方目标的最大数量应小于其载弹量Ei.
满意决策通过设置满意度因子,排除不可行和收益低的分配策略,从而提高算法搜索效率,但是,满意度因子设置过大会使满意集合过小或为空集,太小则不能有效缩小搜索空间,满意度因子是根据经验人为设定的,往往无法设置为最合适的值.因此,本部分使用狼群算法优化满意决策的满意度因子.
狼群算法模拟了狼群的捕猎行为和猎物分配规则,将狼群分为头狼、探狼和猛狼,狼群算法的实质在于人工狼根据自己和其他狼的情况不断地更新,从而向最优位置靠近,人工狼的新位置是狼群由探狼游走、头狼召唤和猛狼围攻3种智能行为,以及“胜者为王”的头狼产生规则和“强者生存”的狼群更新机制相互作用的结果[18],其原理如图2所示.
图2 狼群算法原理图Fig.2 Schematic diagram of WPS algorithm
为了确定满意度因子,在保证我方无人机能取得空战优势的前提下,进行满意决策,选用式(3)作为狼群算法的目标函数,以人工狼i的位置X={xi1xi2,···,xij,···,xm}(1≤xij≤n)表示攻防决策方案,xij=k表示我方无人机j攻击目标无人机k,人工狼感知到的猎物气味浓度Y=f(X),即目标函数值.根据多无人作战飞机协同多目标攻防决策问题的实际特点,对狼群算法的位置更新公式进行定义,如下式[18]:
式(8)表示随机生成S tep个二维数组(xij,xik),其中j,k=1,2,···,L且j≠k,并按这些二维数组的顺序将Xi对应位数编码的数值进行交换.
游走行为中,探狼试探性地向h个方向进行侦察,即随机地执行h次Θ(Xi,stapa),其中stepa为探狼游走步长,并记录每次所感知到的猎物气味浓度[18].该过程可以理解为狼群试探性地在搜寻猎物.
召唤行为中,猛狼经头狼召唤迅速以较大奔袭步长stepb向头狼所在位置靠拢,即对猛狼位置Xi执行一次Θ(Xi,stapb)[18],该过程可以理解为在保留猛狼个体特性的同时,狼群优秀个体(头狼)对猛狼群体进行指导.
围攻行为中,参与围攻的人工狼执行Θ(Xi,stapc)操作,探狼与猛狼在头狼指挥下进行围攻行为[18],围攻行为可以理解为狼群在优秀猎物周围进行小范围的群体运动,对优秀解域进行精细搜索,同时增加种群多样性,避免算法早熟.
在迭代过程中,狼群不断进行游走、召唤和围攻行为,直到达到优化精度要求或最大迭代次数kmax,输出头狼的位置,即为在目标函数(3)下,优先考虑无人机空战优势函数保证我方无人机的生存能力的最优决策方案XS,计算在此攻防决策方案下的收益BS和代价CS,则满意度因子可由下式计算可得:
在得到空战优势的满意度因子后,再基于满意决策获得最终的多无人机协同多目标攻防决策方案.在目标函数(4)下,使得总体攻击收益和总体损失代价之间达到一个有效的平衡,为了满足无人空战实时性的要求,该平衡也许并非最优,但可以达到战术要求,完成攻击任务.
满意决策理论的个体满意集定义为[19]:
其中,Ws(u)和Wr(u)分别为定义在决策空间上的接受函数和拒绝函数,Ws(u)和Wr(u)分别设计为:
其中,γ ∈(0,+∞)为惩罚调节因子,mj为同时攻击目标j的无人机数量,当mj超过阈值Dj时,f会迅速减小,对无人机过于集中攻击某一目标的行为进行惩罚.
最后,根据总体选择函数和总体拒绝函数实现多无人机协同多目标攻防决策,得到最终决策方案.
综上所述,多无人作战飞机协同多目标攻防决策算法流程图如图3所示.
图3 多无人作战飞机协同多目标攻防决策算法流程图Fig.3 Flow chart of multi-UCAVs Cooperative multiple target attack-defense decision-making algorithm
为了验证本文所研究基于狼群算法的多无人机协同多目标攻防满意决策算法的有效性,本节进行数值仿真研究.
考虑4架无人机攻击6个敌方目标,仿真场景1和仿真场景2 空战态势分别如图4和图5所示所示.
图4 仿真场景1空战态势图Fig.4 Air combat situation of simulation scene 1
式(11)和式(12)中,Bz和Cz为攻防决策方案对应的收益和代价,Vjmax和Vimax分别为敌方和我方无人机最大价值量,用于归一化处理,f为惩罚因子,对过于集中的分配结果进行惩罚,设计为:
首先基于优势函数计算满意决策的满意度因子,根据战场敌我双方态势信息、战机性能和目标意图,仿真场景1和仿真场景2 我方战机对敌方战机的综合优势值分别如表2和表3所示.
图5 仿真场景2 空战态势图Fig.5 Air combat situation of simulation scene 2
表2 仿真场景1我方战机对敌方战机的综合优势值Table2 Comprehensive superiority of simulation scene 1
表3 仿真场景2 我方战机对敌方战机的综合优势值Table3 Comprehensive superiority of simulation scene 2
设置狼群规模为50,算法最大迭代次数为kmax=50.我方无人机与敌方目标攻防决策方案如表4所示.
表4 基于综合优势值攻防决策方案Table4 Attack-defense scheme based on comprehensive superiority
对于仿真场景1,在此攻防决策方案下的收益和代价可以计算得到:BS1=2.631 2,CS1=1.938 9,对于仿真场景2,在此攻防决策方案下的收益和代价可以计算得到:BS2=2.578 7,CS2=1.925 0.
则满意度因子可以计算得:
经过满意决策,最终攻防决策方案如表5所示.
表5 最终攻防决策方案Table5 Attack-defense scheme
在最终攻防决策方案下,仿真场景1的收益和代价分别是B1=2.588 2,C1=1.885 0;仿真场景2的收益和代价分别是B2=2.617 7,C2=1.810 6.
由仿真结果可知,在仿真场景1中,无人机U1攻击目标T1、T3,U2 攻击T6、T4,U3和U4分别攻击T2和T5;在仿真场景2中,无人机U2 攻击T1、T2,U3 攻击T5、T6,T3、T4 则被分配给了U4,U1 由于所处环境较为不利,选择防守策略保存自身实力,不对敌机进行攻击.仿真结果与实际情况相符.
为了进一步分析本文所提出算法(WPSBSD)的性能,将本文算法与粒子群(PSO)算法、遗传算法(GA)、传统WPS算法和传统满意决策算法(SD)进行比较,对仿真场景1的空战态势进行50次仿真,统计每种算法求解的最优值和消耗时间,仿真结果如表6所示.
表6 不同算法比较结果Table6 The comparison results of different algorithms
由表6可知,相比于其他方法,本文所提出的算法在保证运行效率的同时,能够兼顾两种目标函数的影响,使攻防决策结果更加合理,使用传统的WPS算法更注重空战优势函数的影响,而攻防收益和代价对满意决策算法影响更大,基于满意决策的无人机多机协同多目标攻防决策方法,和基于空战优势函数运用WPS算法寻优了满意因子,大大缩小了满意决策的寻优空间,提升了算法运行效率,因此,本文提出的基于狼群算法和满意决策的多无人作战飞机协同多目标攻防决策算法能够完成现代无人空战的需求.
本文对多无人作战飞机协同多目标攻防决策问题进行了研究,建立了多机对多目标攻防决策问题数学模型,在优先考虑空战优势的情况下,通过狼群算法寻优满意决策满意度因子,在保证效率的同时提高了满意决策的效率,然后基于满意决策理论,根据攻击满意集来搜索攻防决策满意解,使总体攻击收益和总体损失代价之间达到一个有效的平衡,最后给出实验数据和实验结果.由仿真结果可知,所研究的基于狼群算法的多无人机协同多目标攻防满意决策算法是可行有效的.