空陆攻防博弈的动态武器目标分配*

2019-04-26 05:33:28张先剑

国防科技大学学报 2019年2期

张先剑

(国防科技大学智能科学学院, 湖南长沙 410073)

武器目标分配是现代大规模攻防作战的核心问题，它的最终目的是期望通过最优的武器目标分配方案，充分发挥武器系统的整体效能，以实现攻防作战的最佳结局。传统研究主要利用动态规划算法、粒子群优化、蚁群优化、类电磁算法等方法解决静态或动态武器目标分配问题，但大部分研究[1-8]均把目标设想为无智慧、无对抗能力的被动防御对象，单一从己方角度考虑武器目标分配问题，忽略对手的策略和利益，没有充分考虑实战中的动态博弈特征——作战双方行动和策略的关联性。攻击与防御是互相对立的双方，共存于博弈的统一体中，相互制约、相互激励，没有考虑对抗双方动态博弈特性的攻防决策难以应用于实战。具体到武器目标分配问题研究，必须同时兼顾作战双方的战术策略[9-10]、效能指标等重要因素，这正是使用博弈论方法的优势之处。

针对动态武器目标分配问题，本研究将重点聚焦对抗建模，构建了基于双方动态博弈的综合数学模型，并利用纳什均衡和帕累托最优算法进行求解。

1 基于纳什均衡的武器目标分配

1.1 双方博弈

博弈中竞技者(决策主体)都是理性的，在选择决策的时候都有着明确的“使自己的利益最大化”的目标。博弈论就是专门研究博弈现象中各方是否存在最合理的行动方案，以及如何找到合理的行动方案即均衡解的数学理论和方法。而这里的均衡解，就是一个能够得以维持的结果，或者说是所有竞技者不得不接受而又不可能更好的结果[11]。

定义1博弈可以描述为式(1)所示数学形式[12]。

Γ=[N,P,{SK},J,{J(xK)}]

(1)

式中：N为任意的竞技者集合；P为联合组织(机构)的集合；K表示具有共同行动和利益的竞技者小组；SK为联合K∈P的任意策略集合；J为在P上的所有博弈结果的任意集合；J(xK)为如果联合K采取策略xK，那么在P上可能的结果集合。

一般情况下，博弈可以简化为包含竞技者、策略和盈利(损失)函数的表达形式。

Γ=[N,S,J]

(2)

式中，N=[1,2,…,n]，S=[S1,S2,…,Sn]，J=[J1,J2,…,Jn]。

定义2策略qr=(qr,1,…,qr,mk)是指标函数J的纳什均衡解，如果对于任意的qi∈Si,有

(3)

1.2 武器目标分配模型

并且有

考虑距离因素，如

(4)

那么，被击中的第j类目标平均数量为：

(5)

(6)

式中，tk-1→tk为多个导弹发射装置单次齐射周期。

那么目标损失函数可以表示为：

Je(ν)=∑aesJes

其中，索引i，j分别代表主动武器和被动目标。

损失函数有这样的思想，即每一方都期望敌方主、被动目标最终数量最小，而使己方主、被动目标数量最大化，并且通过权重系数控制敌方主动武器数量的衰减速度。那么有J甲→min，J乙→min。

1.3 武器目标动态分配算法

使用纳什均衡的武器目标分配算法共分四个阶段：在第一阶段获取作战双方的目标信息，如数量、速度、距离、飞近时间、方位等；在第二阶段根据目标信息和命中率函数计算命中率；在第三阶段构建策略空间和策略收益；在第四阶段寻找最优策略。

1.3.1 获取作战双方武器目标信息

在作战期间，侦察预警探测系统全天候实时监测各种飞行目标，并获得如出发位置、数量、速度、距离、实时空间位置、方位等信息，对获取的敌方信息进行鉴别，如判断是否佯攻、使用欺骗手段和制造假象等。分析敌方作战行动意图、策略和可能攻击目标区域。

在获取目标信息后，可以利用层次分析法(Analytic Hierarchy Process, AHP)等方法根据目标速度、高度、距离和方位角等因素进行多因素综合威胁排序。

1.3.2 计算命中率

基于1.2节中获得的距离、方位等信息，根据式(4)计算命中率。在计算命中率时，还应综合考虑电子对抗环境对于导弹命中率的影响，比如地面防御系统电子干扰装置会对空袭目标的命中率产生直接积极影响，也可能会对己方拦截导弹产生微弱消极影响。电子对抗影响因素主要跟电子干扰装置的功率有关。

Pij=Pijmax·e-μi·λd·e-μj·λk

(7)

1.3.3 构建策略空间和策略收益

策略空间与控制参数的数量和取值步长有关，设步长为l，控制参数νij数量为q，则单次齐射目标分配策略空间数为(1/l)q。

1.3.4 寻找最优策略

首先获得所有符合策略收益的策略解集合，然后根据纳什均衡解定义，在有效解的集合中选取符合作战双方目标损失函数的均衡解。在均衡解的选取过程中应注意，纳什均衡解可能有一个或多个，此时应根据极大极小原理进行筛选(基于最坏情况考虑，争取最好的结果)。

2 实例分析

2.1 基本想定

作战想定：攻击方首先使用陆、海、空平台发射若干战术导弹打击防御方地面防御系统，企图瘫痪或消灭防御方防空力量，然后指派战斗机编队护航轰炸机编队对防御方重要目标实施打击。防御方实施分层分段拦截，轰炸机的威胁指数最高，战术导弹其次。

所研究的目标动态分配是指在连续动态作战中不同阶段的目标分配，阶段划分是由地面拦截导弹的射程决定的，比如首先是远程拦截，而后进行中近程拦截(如图1所示)。

图1 阶段划分示意图Fig.1 Illustration of stage division

2.2 模型构建

设甲乙两方参与攻防作战，甲方为空袭系统，组成包括轰炸机、导弹、战斗机和电子战飞机；乙方为地面防御系统，组成包括导弹发射装置、雷达站、电子对抗装置和指令站等。

图2 甲乙双方对抗关系示意图Fig.2 Illustration of A-B counters relationship

首轮(远程拦截防御阶段)双方对抗过程如图3所示，空袭系统首先发射导弹打击地面防御系统，防御系统远程导弹实施拦截打击。

图3 首轮甲乙双方对抗关系示意图Fig.3 Illustration of A-B counters relationship in the first round

综合数学模型有:

(8)

(9)

次轮(中程拦截防御阶段)双方对抗过程如图4所示，首轮拦截打击之后，由中近程导弹负责对成功突防的导弹和轰炸机进行拦截。

图4 次轮甲乙双方对抗关系示意图Fig.4 Illustration of A-B counters relationship in the second round

综合数学模型有：

(10)

(11)

2.3 实验分析

假设初始条件如下：X1=14,X2=14,X3=12，X4=14,X5=8,X51=24,X52=32,X6=2,X7=4,X8=2；a11=0.25,a12=0.25,a13=0.45,a14=0.05,a21=0.35,a22=0.35,a23=0.25,a24=0.05,Р521=0.5,P522=0.5,P524=0.5,P3521=0.5,P3522=0.5,P3524=0.5。

首轮对抗结果如表1～3所示。