标准化全连接残差网络空战目标威胁评估*

2020-08-10 00:59翟翔宇杨风暴吉琳娜李书强吕红亮
火力与指挥控制 2020年6期
关键词:残差准确率威胁

翟翔宇,杨风暴*,吉琳娜,李书强,吕红亮

(1.中北大学信息与通信工程学院,太原 030051;2.中国电子科技集团第五十四研究所,石家庄 050000)

0 引言

伴随着高新技术的不断发展和进步,当今社会已步入了信息化大数据时代,战场态势中蕴含着大量的不确定因素和非线性复杂信息,具有很多涌现性特征,态势数据也呈现出了典型的大数据“4 V”特性[1]。大量先进电子侦察技术的运用提高了感知战场态势的能力,同时也带来了如何处理战场态势大数据的问题[2]。此时,战场态势这个复杂系统更为复杂,战场态势动态变化的速度加快,对空中目标进行威胁评估成为当代空战中必不可少的一环。研究空战态势中面向大样本数据集的目标威胁评估技术,不仅对飞行员分析当前空中态势环境有益,还对今后发展的无人机空战自主决策具有重要意义。深度学习具有强大的非线性处理能力,逐层理解、自动分析提取的结构[3],自学习能力很强,为突破大样本数据集战场态势,实现空战目标威胁评估智能化提供了宝贵契机。

目前用于复杂战场环境下解决目标威胁评估的方法主要有:贝叶斯网络推理[4]、层次分析法(AHP)[5]、多属性决策理论[6]、模糊综合评价法[7]和灰色关联法[8]等。文献[9]提出一种基于云模型和改进熵权的威胁评估方法;文献[10]将贝叶斯网络推理法和层次分析法结合起来解决空战目标威胁评估的问题;文献[11]采用层次分析法和熵权法组合赋权。然而,上述的这些方法没有自学习能力,智能化水平不足,依赖人的经验,缺少对数据的深入挖掘处理,面对大样本数据集难以有效推理。

多层全连接神经网络具有很强的自学能力和强大的非线性处理能力,面对大样本数据具有很强的推理能力,可以充分逼近任意复杂的非线性关系。网络中神经元的权值是通过训练学习得到的,训练过程中不存在专家赋权值的情况,专家经验可以运用到样本的标记中,进而融入网络的计算中。

针对传统方法的不足,本文提出了一种基于标准化全连接残差网络的空战目标威胁评估的方法。分析了全连接神经网络结构,研究了影响空战目标威胁的主要因素,利用批量归一化算法提高收敛速度,运用残差网络增强网络学习能力,构建了基于标准化全连接残差网络的空战目标威胁评估模型。最后,利用Tensorflow 仿真验证了该方法的可行性。

1 模型算法基础

1.1 多层全连接神经网络

图1 是一个4 层的全连接神经网络结构。4 层全连接神经网络由输入层、输出层和隐含层3 个部分组成,隐含层有两个,相邻两层之间的节点全连接,同一层的节点之间无连接。相邻的两层之间,上一层的输出即为下一层的输入。

图1 4 层全连接神经网络

输入x 与输出y 之间通常是非线性的关系,式(1)中括号里的部分表示了层与层之间的线性关系,激励函数f 又添加了两层之间的非线性关系,通过训练调整层与层之间的参数,实现从数据中学习输入与输出之间的关系。

1.2 批量标准化算法和残差网络

为了加快算法的训练速度与收敛速度,增强网络的非线性拟合能力,本文运用了批量标准化优化算法和残差网络优化结构。

1.2.1 批量标准化算法

对于包含很多隐含层的网络,在训练过程中每层的参数不断变化,每个隐含层都会面临协变量移位(Covariate Shift)的问题:上一层网络参数的不断变化导致下一层隐含层的输入分布不固定,训练过程中隐含层的输入分布总是变化不定。

1.2.2 残差网络

深度学习本质上是通过多层非线性层堆叠无限逼近需要学习的复杂分布函数H(x),但H(x)过于复杂,直接拟合很困难,网络不断加深时,超高层网络会出现梯度消失或者梯度爆炸的现象,网络优化困难,造成退化。残差网络[13]是一种跳跃结构,运用分步学习的思想,先学习残差F(x),再计算H(x)=F(x)+x,普通网络结构和残差网络结构如图2、图3 所示。网络深度带来的非线性层的增加会带来复杂的非线性拟合能力,残差网络解决了网络因深度增加而产生的网络退化的问题,可以增强网络的学习能力。

图2 普通网络结构

图3 残差网络结构

2 威胁评估网络模型

2.1 目标威胁评估影响因素分析

本文针对的场景是空战场,从战斗机飞行员的角度考虑,结合空战的实际情况,考虑飞行员在空战中主要关注的以下7 个因素,应用G.A.Mllier 的9级量化理论[14],获得各影响因素的特征值[15]:

1)目标导弹攻击距离。使用导弹攻击我方是来袭目标典型的攻击手段,即使同一目标,目标导弹的攻击距离直接影响对目标的威胁评估。通常,来袭目标导弹的攻击距离越大,对我方的威胁程度越大。

2)目标航向角。目标航向角是指目标前进的方向与目标的实际位置到我方位置的连线的夹角。通常,目标航向角越小,目标越可能突然出现,对我方的威胁也越大。

3)目标距离。目标与我方之间的距离越小,则留给我方的反应时间越少,防御时间越少,威胁程度越大。反之,目标与我方之间的距离越大,不仅我方的反应时间和防御时间越长,而且此时目标相对我方的攻击意图不明显,威胁程度越低。

4)目标速度。目标的速度越快意味着目标到达我方位置的时间越短,同时速度越快也会相应提高我方导弹的攻击难度,对我方的威胁程度越大。本文将这一指标按非常快、快、较快、一般、较慢、慢、非常慢一次量化为9、8、7、6、5、4、3。

5)目标高度。近距离时,飞行高度比我方高的目标对我方的威胁越大。本文使用目标与我方的飞行高度差来衡量这一指标,将这一高度差指标按超高、高、较高、中、较低、低、超低依次量化为8、7、6、5、4、3、2。

6)目标类型。目标的类型不同对我方的威胁程度也不同。本文将目标按侦察机、无人机、小型目标(战术弹道导弹、隐身飞机)、大型目标(如轰炸机、歼击机)4 类对目标的威胁属性用9 级量化理论进行量化,按侦察机、无人机、小型目标、大型目标依次量化为2、4、6、8。

7)目标干扰能力。目标的干扰能力也是目标袭击的手段之一,本文将指标按无、弱、中、强依次量化为2、4、6、8。

对上述这些因素量化进行仿真分析,得到训练集测试集数据。本文最终选择了23 组数据,采用其中20 组数据作为训练集样本,3 组数据作为测试集样本,部分样本数据如下页表1 所示。

2.2 模型结构及构建流程图

本文提出一种使用批量归一化全连接残差模型算法进行空战目标威胁评估的方法,旨在解决传统评估方法存在自学习能力、智能化不足的问题。其核心的评估思想是:通过将数据映射到高维空间中,增加数据的可分性,增加数据间的相关性分析,利用优化器训练网络确定参数,进而智能地拟合数据的非线性分布。评估过程中不显性地体现权值,隐性地弱化对评价结果影响较小的属性因素。

本文提出的网络模型结构主要由全连接网络、批量归一化算法和残差网络组成。全连接网络作为模型的主体结构,将输入数据映射到高维空间,最终映射到样本标记空间,起到分类器的作用。批量归一化算法可以使网络着重学习非线性,加快网络收敛速度。残差网络可以在全连接网络接近饱和时,继续提升网络的训练精度和测试精度,在保持原有网络性能的基础上继续提升网络性能。故本文采用全连接网络、批量归一化算法和残差网络结合的方案,使模型快速精细地拟合数据分布的非线性。

表1 部分样本数据

表2 网络模型结构

将影响空战目标威胁评估的7 个主要因素作为网络模型的输入,输入数据通过网络模型的计算进行三分类,输出相应威胁的概率预测,网络模型结构如表2 所示。网络共有7 个全连接层,两个残差网络层,每个全连接层都进行批量标准化。由于ReLu 函数具备计算过程简化,在梯度下降或反向传播时更有效,可避免梯度消失和梯度爆炸等的优点,故网络模型使用ReLu 函数作为激励函数。残差网络层中包含两层全连接网络,同时也进行了两次批量归一化。输出层通过归一化指数函数(Softmax函数),将最后的结果进行归一化,使得输出的向量分别对应属于相应威胁的概率,更直观地显示威胁评估结果。将样本标记和网络输出的交叉熵作为网络的损失函数(简称损失)如式(4)所示,训练过程中运用反向传播算法[16]计算梯度,通过修改连接节点的参数,使得损失最小化。训练过程也是拟合数据集分布的过程,网络从数据集中自学习分布规律,最终学习到的分布规律由各节点的参数共同计算得到。

目标威胁评估模型算法流程图如下页图4 所示,使用本文提出的网络模型进行威胁评估训练模型是非常重要的一步。结合相应的威胁评估大样本数据,在训练和测试过程中,通过分析网络训练以及测试的准确率和损失的变化判断网络的性能,对模型的超参数进行调整,必要时会替换优化函数或对模型结构进行微调。

图4 目标威胁评估模型算法流程图

3 模型验证与仿真

使用MATLAB R2014b 对数据进行仿真,将仿真好的数据随机分为训练集样本和测试集样本,分别存储在不同的文件中。使用Tensorflow 编程读取训练集样本,对模型进行训练,训练集样本共有20组,每组数据分为10 批进行训练,每训练一批数据将相应的损失和准确率记录下来。模型既利用了全连接网络自学习能力强的优点,又添加了批量归一化算法和残差网络结构来增强网络模型的自学习能力,同时防止网络退化。

训练结束后显示实验结果,图5 和图6 给出了20 组数据训练模型时,准确率和损失的变化,图7 和图8 给出了20 组数据训练好的模型在测试集数据测试时准确率和损失的变化图。由上述4个图可见,模型面对大量数据样本时可以获得很高的准确率。同时图5 和图7 显示的损失相对较小,表明模型拟合的非线性规律与数据样本规律近似,训练模型可以使模型从数据样本中学习到样本的非线性规律。

图5 模型训练(20 组数据)准确率变化

图6 模型训练(20 组数据)损失变化

图7 模型测试(20 组数据)准确率变化

图8 模型测试(20 组数据)损失变化

减少训练样本,选取3 组样本和5 组样本分别进行训练,得到的模型训练准确率和损失变化结果分别如图9~图12 所示,可见模型在训练初期准确率和损失变化幅度很大,表明模型训练的收敛速度很快。图13 和图14 给出了训练集样本为3 组数据、5 组数据、20 组数据时,对应训练好的模型在测试集上测试的准确率和损失变化的对比图,经计算可得3 种条件下训练好的模型测试的平均准确率分别为89.7%、91.8%、93.0%。图中数据结果显示,在只有3 组数据训练模型在测试集上的平均准确率仍高达89.7%,训练数据量越大,模型的测试准确率越高。

图9 模型训练(3 组数据)准确率变化

图10 模型训练(3 组数据)损失变化

图11 模型训练(5 组数据)准确率变化

图12 模型训练(5 组数据)损失变化

图13 模型测试准确率变化对比

图14 模型测试损失变化对比

仿真结果表明,本文所提出模型训练的较快收敛速度表明模型具备很强的学习能力,可以快速从数据中拟合出数据的非线性规律。训练样本较小时,准确率仍然很高;训练数据量越大,模型测试的准确率越高,表明模型在训练过程中对大样本态势数据进行了有效处理。

4 结论

本文研究了全连接神经网络的结构以及批量标准化算法和残差网络两种优化方法的原理,分析了影响空战目标威胁评估的主要因素,构建了基于标准化全连接残差网络的空战目标威胁评估模型,得出以下结论:

1)本文提出的模型具备很强的自学习能力,可以在数据中通过学习来提升模型本身对空战目标威胁评估数据信息的处理能力;

2)模型克服了传统空战威胁评估方法缺少对数据的深入挖掘处理,和面对大样本数据集难以有效推理的缺陷;

3)训练好的模型测试威胁的平均准确率可以达到93.0%,增加训练数据量继续训练模型,可以进一步提高模型测试准确率。

通过分析,该模型具有很好的评估能力,训练出的模型可以快速准确地评估目标的威胁程度,可以为任务分配和自主决策技术提供支持,为空战目标威胁评估提供了新的方法。

猜你喜欢
残差准确率威胁
基于残差-注意力和LSTM的心律失常心拍分类方法研究
融合上下文的残差门卷积实体抽取
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
基于残差学习的自适应无人机目标跟踪算法
人类的威胁
基于深度卷积的残差三生网络研究与应用
搞笑图片