刘 振,徐学文,刘 勇
(海军航空大学 岸防兵学院,山东 烟台 264001)
空战决策问题本质上是一个目标分配问题,其目的在于将目标合理地分配给攻击飞机,使得机群的整体效能最大。当前有众多的研究者利用各种的智能优化算法求解目标分配问题,进化算法在寻优的简便性、通用性以及全局寻优性上的优势,使得其应用广泛,例如文献[1-2]就分别利用遗传算法和文化基因算法等优化方法进行求解,也逐步提出一些改进类型的进化算法应用于目标分配问题,例如文献[3-4]分别利用精英改选机制粒子群算法和启发式粒子群算法求解空战决策问题。现在的作战环境逐步趋向于分布式网络化,因此诸多文献都采用了分布式的求解方法,文献[5]利用协同拍卖求解目标分配问题。合同网也逐步应用到目标和任务的分配中[6],基本思想都是利用合同网机制中的拍卖合同、竞标合同以及交换和置换合同等方法处理静态和动态的分配问题。
当前已经提出了诸多方法用于求解空战决策和目标分配问题,随着网络化作战环境的逐步建立和完善,多作战平台在战场环境下能够实现态势的共享。因此,当某架飞机发射导弹后,若该机失去制导能力或者需要做机动规避的情形下,如何使得另一架飞机有效地实现对导弹的协同制导是一个需要解决的问题。当前较多文献关注多机协同制导下的制导律设计[7],关于协同制导下的目标分配和任务分配研究的相对较少,文献[8]较早关注到了该问题,并提出了协同制导决策方法,文献[9-10]进一步拓展推广了制导优势模型,以此为基础建立了考虑协同制导的任务分配模型,所考虑的制导交接因素过多注重于当前空战态势因素。
本文针对多机协同制导情况下的决策模型和求解方法进行探讨和分析。在本文的分析过程中,将发射导弹的飞机称为交班平台,将协同制导的飞机称为接班平台。在危险的战场环境下,交班平台在发射完导弹后可以进行有效的规避,而制导的任务则可以交给有制导能力的接班平台,从而避免人员的伤亡,提高整体作战效能。通过查阅以及分析国内外文献,本文设计了一种协同制导交接方案,以敌方毁伤最大以及我方损失最小,建立了考虑协同制导下的空战决策模型,该模型不仅充分考虑态势优势,同时也将截获概率和交接成功概率作为候选制导平台的重要因素,为提高求解该模型的收敛速度和精度,提出一种分布估计免疫算法(estimation distribution immune algorithm,EDIA)来求解该模型。
双机或多机协同制导就是在分布式网络化的作战条件下,当交班平台无法有效地对所发射的导弹进行制导时,将空空导弹的中制导权交给制导平台,协同制导示意图如图1所示。
从图1可以看到,交班平台在发射完导弹后,由于有其他作战任务或者本身受损,无法继续完成所发射导弹的制导任务,因此将中制导任务进行交接,接班平台可利用中继制导平台,如预警机提供的探测信息,完成对导弹的制导任务。
美国于二十世纪七八十年代就开始对协同作战能力系统进行研究,但在国外公开发表的资料中尚未看到空战中相关的研究。因此,研究协同制导下的空战决策问题具有重要的现实意义。本文对这个问题进行了初步探讨分析,提出了协同制导下的决策模型和求解方法。
首先进行如下的假设:
①假设1。 交班平台和接班平台距离小于接班平台的最大制导距离,即接班平台能够对交班平台发射的导弹进行有效的制导;
②假设2。 导弹在发射后,直至命中目标,都处于接班平台的制导范围内。
文献[8]将接班平台优势函数作为制导交接的依据,但优势函数最大的接班平台,并一定能够有效地对导弹进行制导。因此,本文给出一种多机协同制导情况下接班平台的选择方法,在考虑制导优势外,将导弹导引头截获目标概率和交接成功概率也作为接班平台的选择依据。
1.1.1 交接制导优势
交接制导优势主要由态势优势和效能优势构成。
1)态势优势。
空战态势优势可以表示为
TSI=β1Ta+β2Td+β3Tv
(1)
式中:Ta,Td和Tv和分别为角度、距离和速度优势;β1,β2和β3分别为3种态势优势的权重系数,并且β1+β2+β3=1,一般可取0.2,0.4和0.4。
2)空战效能优势。
(2)
式中:Ci和Cj分别为交班平台和候选接班平台的空对空作战能力。
在得到空战态势优势和空战效能优势后,总的制导优势为
w=a1TSI+a2TC
(3)
式中:a1和a2通常由专家评估或者根据经验知识得到,分别为态势优势和效能优势对制导优势的影响权重系数,本文设定a1=0.6,a2=0.4。
1.1.2 导引头截获目标概率
协同制导的目标就是使导弹能够命中目标,提高整体效能,因此制导交接需要考虑导弹的导引头截获目标的概率。只有成功截获目标,才能实现对目标的有效制导[11]。导引头截获目标概率可按下式获得:
Pm=PdPaPv
(4)
式中:Pm为导引头对目标的正确截获概率;Pd,Pa和Pv分别为距离、角度和速度截获概率。
1.1.3 交接成功概率
在满足协同制导的前提条件下,除了候选制导平台自身的优势以外,还必须考虑交班平台与接班平台的交接成功概率,优势较大的飞机如果不能有效地捕获导弹,优势即使再大也是没有意义的。交接成功概率PH由3个方面的因素构成[12],分别为:导弹落入概率PD、对导弹的发现概率PF以及对导弹的锁定概率PL。不考虑交班设备的可靠性,交接成功概率为
PH=PDPFPL
(5)
通过上述的分析,接班平台的选择概率为
PSE=PmPHw
(6)
在确定了接班平台以后,针对目前广泛使用的惯导+指令修正中制导和主动雷达末制导的空空导弹,给出一种协同制导交接方案:
①导弹发射后转入中制导段,交班平台对导弹进行稳定跟踪,同时接收接班平台传送的目标信息,经时空一致性转换后向导弹发送中制导指令;
②交班平台交接形势判断模块在导弹飞行过程中实时进行判断计算,当满足制导交接条件时启动交接程序。交班平台向接班平台发送“开始交接”信号和导弹的飞行空域预测信息;
③接班平台接收“开始交接”信号和报文,控制机载雷达转向导弹预测飞行空域,由接班平台的接力交接控制模块控制自身机载雷达向导弹发送一次询问信号,并等待接收应答信号;
④导弹分时接收两平台的制导指令,并发送应答信号;
⑤接班平台交接状态判断模块依据接收的应答信号对交接状态进行实时判断,判断交接成功后,向交班平台发送“交接成功”信号,交班平台接收“交接成功”信号,停止向导弹发送指令,随后接班平台开始在询问信号后加入制导信息,以固定的频率向导弹发送制导信息。
按照协同制导交接方案,交班平台就可以把导弹的制导权顺利地移交给接班平台。
①每个目标至多分配一枚导弹;
②每枚导弹只能用于攻击一个目标。
如果此时Ri的机载导弹Mk需要进行协同制导,Ri发射后并不对Mk进行制导。在协同制导的情形下Mk击毁Bj的概率Tkj并不等于Ri对Bj的威胁Tij,需要考虑制导交接的成功概率,故此时Tkj=PHTij。
则蓝方损失的威胁可以表示为
(7)
式中:ω为导弹目标分配方案。
满足约束条件式(8)和式(9):
(8)
(9)
当第k枚导弹用于攻击第j个目标时,则Xkj=1。如果在各架飞机挂载的导弹数目都为S时,通过观察该方程可以看出,当i=1,2,…,M,式(7)中k的取值范围只能为Ui=[iS(i+1)S-1],式(7)可以表示为
(10)
(11)
(12)
在考虑消除威胁最大的同时,还必须考虑我方受到的威胁最小,因Ri对Bj的威胁为Tij,则Bj对Ri的威胁为Tji,Tji可以看作Bj对Ri的击毁概率,则红方受到的总威胁为
(13)
由于飞机一般都携带有欺骗设备和干扰设备,从而可以有效地降低其所受到的威胁,软杀伤武器系统可以等效为欺骗设备,假定Ri等效后的欺骗设备的数量为mi,因此考虑欺骗设备和干扰设备后的总威胁为
(14)
因此总的空战决策评估函数为
R(ω)=E(ω)-Q(ω)
(15)
协同制导空战决策问题对求解速度和求解精度有较高的要求,智能优化方法由于其强大的寻优能力以及操作上的方便性,已经被广泛用于求解该类问题。免疫算法是受生物免疫系统启示的一种寻优搜索算法,具有良好的学习记忆能力和优良的全局寻优性能,已经被广泛研究和应用[13-14],本文考虑利用免疫算法求解空战决策问题。但通过对免疫算法的研究发现,基本免疫算法难免存在寻优效率不高,寻优效果不佳等问题。扩展紧致遗传算法[15]作为一种进化性能优越的分布估计算法,利用优良解集的概率模型指导进化的方向,通过将染色体基因位划分为MPM,从而保证优良模式不在进化过程中被破坏。因此为提高免疫算法的求解性能,本文将分布估计的思想融入到免疫算法中,提出分布估计免疫算法(EDIA),基于MPM进行交叉和变异操作,可以有效地提高算法的进化效率,避免算法过早收敛。
1)编码方法。
编码方式如图2所示。
染色体共有M段组成,染色体长度L=MN,染色体中第i(1≤i≤M)部分的第j(1≤j≤N)位为1,则代表第i架红机能够用于攻击第j架蓝机。
2)种群初始化方法。
在算法的运行过程中引入启发式信息,启发式信息是指在算法的运行开始阶段,根据问题的特点、以往的经验以及实际的资源和环境条件,在算法的初始化阶段所构造出的启发信息,例如当第i架红方飞机不能用于攻击第j架蓝方飞机时,则可将该染色体相应的位置设为0。在算法的运行过程中,根据问题的实际特点,如果产生不可行解,人工修改染色体中相应的位置,调节算法的搜索范围和方向。
随机的初始化种群不便于种群个体进化,且有陷入局部极值的风险,为了使种群能保持较好的多样性,文献[16]利用反向学习方法进行种群的初始化,证明能够有效地提高算法的进化效率,本文利用文献[16]提出的方法进行种群初始化。
在进化算法中,利用交叉方式可以有效地提高种群多样性,获得全局优良解,但交叉方式选择至关重要,优良的交叉方式可以有效地保证积木块的累积,因此本文采用文献[15]提出的基于MPM的交叉。将MPM作为一个整体进行交叉,从而可以有效地保证种群个体基因位之间的链接关系,使得优良模式得到保留和进化。同时本文也采用了MPM变异,即按照变异概率Pu,对某一MPM中的基因位进行变异操作。在种群进化过程中,如果整个进化过程中采用统一的变异概率,收敛过程缓慢,不便于优良个体进化,利用自适应变异概率,第i个个体的变异概率设置为
(16)
为保证进化种群的多样性,避免单一选择方式导致的进化停滞和陷入局部极值,利用适应度共享增强种群进化的多样性,对于进化种群中的抗体ai(t)和aj(t),其共享函数可以定义为
(17)
式中:σs为共享半径,dij为抗体之间的距离,ai(t)的适应度可以表示为
(18)
(19)
利用本文提出的分布估计免疫算法求解协同制导下的决策模型,首先需要初始化进化参数信息,包括种群规模N,循环迭代次数Tmax,依据敌我双方飞机数目确定的染色体长度L,共享半径σs,变异概率Pu,其主要流程可概述为:
①步骤1。 依据当前态势信息和空战决策模型,初始化进化算法参数信息;
②步骤2。 利用反向学习方法,初始化种群P(t),并根据初始启发式信息剔除不合理个体;
③步骤3。 对种群P(t)中的染色体分别进行交叉和变异操作,其中交叉和变异均按照MPM方式进行,变异概率按照式(16)设置;
④步骤4。 计算抗体和抗原之间的亲和力,依据式(18)进行适应度共享操作,并依据式(19)的选择概率进行免疫选择;
⑤步骤5。 判断是否满足结束条件,满足则结束,输出分配结果,否则转步骤2。
在标准态势和随机态势下进行仿真分析,其示意图分别如图3(a)和图3(b)所示,标准态势的数据来自文献[8],用以对比分析本文采用的制导平台选择方法与文献[8]的区别联系,随机态势用以仿真分析本文提出的空战决策模型及分布估计免疫算法的正确性。
标准空战态势如图3(a)所示,其中B、C和D3架飞机对攻击目标T的某枚导弹进行协同制导,得到3架飞机的态势优势分别为0.627 7,0.412 0和0.326 0,根据文献[8],效能优势都为0.75,因此3架飞机总的制导优势为0.676 6,0.547 2和0.495 6。依据文献[8],若单纯考虑制导优势,应该选择平台B作为接班平台,但从实际空战情况出发,为有效提高作战效能,确保制导平台能够顺利截获目标并完成对导弹的协同制导,除了考虑制导优势外,还应考虑目标截获概率和制导交接成功概率。若B,C和D对需要协同制导的导弹进行制导后,雷达截获概率分别为0.90,0.99和0.99,交接成功概率分别为0.924,0.975和0.988,则按照本文计算得到的制导平台选择概率分别为0.522 0,0.528 2和0.484 8,故此时应该选择平台C作为制导接班平台。
由此可以看出,当考虑了雷达截获概率和交接成功概率后,与单纯依靠制导平台优势进行选择发生了冲突。经分析发现,单纯考虑制导优势,并不能综合考虑制导交接后的空战效能变化情况,由于平台B的雷达截获概率及交接成功概率较低,因此不宜作为接班平台,平台C的制导优势虽然不如平台B高,但其雷达截获概率和交接成功概率有优势,因此应以平台C为接班平台。在复杂的战场环境下,单纯依靠制导优势进行选择过于片面,依据本文的方法,当考虑了影响制导交接的多个约束条件后,能够更加全面地刻画此时交接的情况。
随机交战态势如图3(b)所示,红方R飞机数量M=4,每架飞机可以挂载4枚导弹,蓝方B飞机数量N=14。红方R此时的总导弹数目为14,R1,R2,R3和R4挂载的导弹序号分别为1~4,5~8,9~12,13~14。R3由于在前一波次的攻击中发射了2枚导弹,因此此时只有2枚导弹,并且其制导系统受到损坏,不能对其发射的导弹进行中制导。
在随机态势下,R4由于战术原因需要对其挂载的导弹进行协同制导。依据1.1节提出的方法,最终选择R3为其接班平台,R4将第13和14枚导弹的中制导权交给R3,最终计算得到的分配方案为
R1{1,2,3,4}→{B13,B7,B12,B9}R2{5,6,7,8}→{B3,B6,B14,B5}R3{9,10,11,12,13,14}→{B2,B8,B10,B11,B1,B4}
其中左边括号内为红机Ri制导的导弹编号,右边括号内为Ri分配的蓝机编号,从最终的分配方案可以看出,R4挂载的第13和14枚导弹被用于攻击B1和B4。
将采用协同制导后的效能以及不同求解算法获得的效能进行对比,仿真结果如图4所示。图4(a)为采用协同制导前后的效能对比图,其中横坐标为迭代次数(t),纵坐标为效能值(f),两者均无量纲。从中可以看出采用协同制导后的效能值有了明显提高,这是因为若不采用协同制导,则R3必须退出攻击,从而造成了资源的浪费和效能的降低。
图4(b)为在随机态势下,分别用遗传算法(GA)、免疫遗传算法(IGA)以及分布估计免疫算法(EDIA)协同制导决策问题进行对比,从图中可以发现,本文提出的算法能有效提高整体作战效能,并且本文提出的EDIA收敛速度也优于GA和IGA。
本文分析协同制导下的空战决策方法,给出了协同制导的接班平台选择方法和协同制导交接方案设计,建立了协同制导下的空战决策模型。为提高问题的求解效率,提出利用分布估计免疫算法求解协同制导下的空战决策问题,对本文提出的方法和模型进行了仿真分析,证明了本文模型和方法的正确性。
对协同制导下的空战决策问题,现在开展的研究还相对较少,因此在下一步的研究中考虑如何在复杂环境下进行协同制导决策,特别是动态目标的协同制导空战决策,是进一步研究的方向。
[1] CHEN Jie,XIN Bin,PENG Zhihong,et al. Evolutionary decision-making for the dynamic weapon-target assignment problem[J]. Science China:Series F-information Science,2009,52(11):2006-2018.
[2] 王晓光,章卫国,陈伟. 无人机编队超视距空战决策及作战仿真[J]. 控制与决策,2015,28(2):352-357.
WANG Xiaoguang,ZHANG Weiguo,CHEN Wei. BVR air combat decision making and simulation for UAV formation[J]. Control and Decision,2015,28(2):352-357.(in Chinese)
[3] 王昱,章卫国,傅莉,等. 基于精英改选机制的粒子群算法的空战纳什均衡策略逼近[J]. 控制理论与应用,2015,32(7):857-865.
WANG Yu,ZHANG WeiGuo,FU Li,et al. Nash equilibrium strategies approach for aerial combat based on elite re-election particle swarm optimization[J]. Control Theory and Application,2015,32(7):857-865.(in Chinese)
[4] LUO Delin,YANG Zhong,DUAN Haibin,et al. Heuristic particle swarm optimization algorithm for air combat decision-making on CMTA[J]. Transactions of Nanjing University of Aeronautics & Astronautics,2006,23(1):20-26.
[5] EDALAT N,XIAO Wendong,ROY N,et al. Combinatorial auction-based task allocation in multi-application wireless sensor networks[C]//The 9th International Conference on Embedded and Ubiquitous Computing. Melbourne:IEEE,2011:3622-3627.
[6] 廖沫,陈宗基. 基于多Agent分布协同拍卖的动态目标分配算法[J]. 北京航空航天大学学报,2007,33(2):180-183.
LIAO Mo,CHEN Zongji. Dynamic target assignment method based on multi-agent decentralized cooperative auction[J]. Journal of Beijing University of Aeronautics and Astronautics,2007,33(2):180-183.(in Chinese)
[7] ZHAO Jiang,ZHOU Rui,DONG Zhuoning. Three-dimensional cooperative guidance laws against stationary and maneuvering targets[J]. Chinese Journal of Aeronautics,2015,28(4):1104-1120.
[8] 肖冰松,方洋旺,胡诗国,等. 多机空战协同制导决策方法[J]. 系统工程与电子技术,2009,31(3):610-612.
XIAO Bingsong,FANG Yangwang,HU Shiguo,et al. Decision methods for cooperative guidance in multi-aircraft air warfare[J]. Systems Engineering and Electronics,2009,31(3):610-612.(in Chinese)
[9] 冉华明,周锐,吴江. 超视距空战中多机协同制导方法[J]. 北京航空航天大学学报,2014,40(10):1457-1462.
RAN Huaming ZHOU Rui,WU Jiang,et al. Cooperative guidance of multi-aircraft in beyond-visual-range air combat[J]. Journal of Beijing University of Aeronautics and Astronautics,2014,40(10):1457-1462.(in Chinese)
[10] 周德云,杨振,张堃. 多UCAV超视距协同空战中的交接制导方法[J]. 弹道学报,2017,29(2):1-7.
ZHOU Deyun,YANG Zhen,ZHANG Kun. Method of guidance handover in beyond-visual-range coordinated air-combat for multi-UCAVs[J]. Journal of Ballistics,2017,29(2):1-7.(in Chinese)
[11] 樊会涛. 复合制导空空导弹截获目标概率研究[J]. 航空学报,2010,31(6):1225-1229.
FAN Huitao. Study on target acquisition probability of air-to-air missiles with combined guidance[J]. Acta Aeronautica et Astronautica Sinica,2010,31(6):1225-1229.(in Chinese)
[12] 刘兴堂,周自全,李为民,等. 现代导航、制导与测控技术[M]. 北京:科学出版社,2010:173-176.
LIU Xingtang,ZHOU Ziquan,LI Weimin,et al. Modern navigation,guidance and TT&C[M]. Beijing:Science Press,2010:173-176.(in Chinese)
[13] SIMONE S F. Artificial immune algorithm applied to distribution system reconfiguration with variable demand[J]. Electrical Power and Energy Systems,2016,82:561-568.
[14] SHANG Ronghua,DU Bingqi,MA Hongna,et al. Immune clonal algorithm based on directed evolution for multi-objective capacitated arc routing problem[J]. Applied Soft Computing,2016,49:748-758.
[15] 刘振,胡云安,彭军. 协同进化扩展紧致量子进化算法[J]. 控制与决策,2014,29(2):320-326.
LIU Zhen,HU Yunan,PENG Jun. Coevolutionary quantum evolutionary algorithm based on extended compact[J]. Control and Decision,2014,29(2):320-326.(in Chinese)
[16] RAHNAMAYAN S,TIZHOOSH H R. A novel population initialization method for accelerating evolutionary algorithms[J]. Computers and Mathematics with Applications,2007,53(10):1605-1614.
[17] CHENG Lijun,DING Yongsheng,HAO Kongrong. An ensemble kernel classifier with immune clonal selection algorithm for automatic discriminant of primary open-angle glaucoma[J]. Neurocomputing,2012,83(15):1-11.