王家鑫,王瑞琪,孟海波,蔺红明,陈天群
(1.海装驻上海地区某部,上海 201109;2.上海机电工程研究所,上海 201109)
在目前日益紧张的国际局势中,制海权一直是大国之间博弈的重点,海上舰艇编队的进攻与防御体系的建立是掌握制海权的关键,也是各国一直以来研究的重点。在海上作战时,防空反导一直是主要防御手段,防空导弹自20世纪50 年代问世以来,就引起了世界各国的高度关注。在进入21世纪后,随着技术的不断进步与更新迭代,海上防空体系与高强度空袭体系间的对抗强度愈发激烈,如何识别敌方来袭目标的攻击意图是提升海上防空反导拦截效率的必要手段。在当下信息化战争时代,海上战场环境日益复杂,在军事需求和信_息技术双轮驱动下,海上舰艇编队作战针对来袭目标攻击意图识别是目前态势分析领域研究的热点,是防空反导作战中指挥控制决策[1]的重要依据。战场的复杂性、瞬时性的影响使得作战指挥控制系统在短时间内无法处理大量战场信息,指战员无法做出最优决策,因此需要智能化作战指挥控制系统辅助指战员决策。智能化辅助决策系统提供的分析结果和预测模型可以提高指战员的决策效率与准确性,提升指挥控制质量。随着分布式杀伤、马赛克战、频谱战等新型作战样式与新型武器的应用,强敌海上作战体系具备较强的多域体系作战和网络中心作战能力,对我国领海安全构成重大威胁。强敌新型作战概念与方式的运用,增加了海上防空反导指战员对于来袭目标攻击意图的识别在短时间内做出准确判断的难度,对作战指挥控制的战略战术安排产生了至关重要的影响。
目标攻击意图识别是通过量化分析来袭目标的各项参数指标,以此判断来袭目标可能锁定打击的我方舰艇,进而辅助防空反导指战员根据敌方作战意图制定作战决策,从而提高防空反导拦截效率以及减少我方舰艇作战损耗。根据目标的攻击意图生成合理的防空反导拦截方案是防空作战的重要组成部分。由于分析过程会受到未知与不确定因素的影响,现有模型的预测准确率得不到很好的验证。现有研究主要基于模板匹配[2]、专家经验模型[3-4]、层析分析法等[5-6]、弹道预测等[7],严重依赖专家经验生成的权重系数,不仅过于主观,也不适用新的作战样式。
2016年提出使用神经网络自适应学习能力[8],从训练数据中提取特征规则并用于目标攻击意图识别[9-10]。此方法能够解决先验知识及专家经验不足情况下分析与识别目标攻击意图的难点[11],但是由于采用了简单的BP(反向传播算法)算法,不仅收敛速度慢,而且容易达到局部最优,无法收敛到最优解。2018年有学者使用深度神经网络对空中目标的作战意图进行识别,采用了Adam 优化器和ReLu(rectified linear unit)[12-20]激活函数,但是存在Relu激活函数在学习率较大的情况下容易导致神经元坏死的问题,同时Adam 优化器在这类问题可能出现无法收敛到最优解的问题。
文中提出了一种针对深度神经网络优化后的预测模型[13-14],分析了来袭目标对我方单个目标的打击概率,综合考虑各项参数量化分析结果得出来袭目标的攻击意图识别,有效解决以往评估方法的不足[17]。文中采用GeLUs[18]激活函数(Gaussian error linear units)作为激活函数解决梯度爆炸和梯度消失问题,并提升模型训练速度。同时采用AdaMod优化算法(adaptive and momental bound)[15]加快模型收敛,并解决了Adam 模型可能无法收敛到最优解的问题。文中采取的方法可以更好地解决在先验知识不足的情况下识别目标攻击意图的问题。
现有的海上防空反导攻击意图提取方法存在特征识别单一,不能充分利用获取到的目标信息,信息深度挖掘不够,导致对攻击意图的深层次分析不足,攻击意图识别的稳定性与准确度都不够,导致往往攻击意图识别出来的结果给与决策者一个错误的判断或者根本没法使用。如何挖掘现有目标信息的各个属性参数信息,是目前攻击意图识别的难点,文中从多个角度对攻击意图特征进行提取。
针对敌方来袭目标的攻击行为会遵从一定的规则:搜索目标、发现目标、锁定目标、打击目标。来袭目标不同的作战行动与攻击行为表现为目标态势信息的改变,直观表现为目标的各项运动参数及状态发生变化,可以用来识别其攻击意图。敌方来袭目标在搜索目标和发现目标阶段往往无法识别其攻击意图,直到其锁定目标并实行打击过程阶段,其攻击意图才有明显的特征。由于敌方来袭目标的攻击意图的显现是一个动态的过程,在不同的阶段会有不同的特征表象,仅依赖某时刻的目标态势信息识别其攻击意图具有片面性和不确定性。
充分识别来袭目标特征属性,了解目标的特殊属性与攻击意图,以达到充分挖掘信息的目的,可以依据不同阶段,各个特征点属性不同来得到不同的数据集,可以更好地优化属性得到更理想的结果。
由于敌方来袭目标的意图和状态间存在特定的联系,文中根据专家经验选取了部分参数:目标坐标(x,y,z)、目标速度Vt、速度方向φt、目标加速度at、加速度方向φt、目标俯冲角θt,目标径向速度Vr,目标径向到达时间Tr,我方舰艇坐标((xi,yi,zi)i∈1,…,k,k为我方编队舰艇数量)。文中选取舰艇数量为5的典型编队配置,训练样本数据集(data)的每一项为5*25形状。根据训练样本数据集在不同阶段得到的特征不同,但是攻击意图识别的结果相同,就可以优化模型参数,提取其重要特征,以达到相对较好的结果,为攻击意图的预测提供有效的数据训练基础。
文中选取的特征数据均为数值数据,可以使用神经网络直接处理。由于数据在各评价指标下的性质不同,通常具有不同量纲和数量级,为保证结果可靠性,加快数据收敛速度,以及降低奇异数据的对算法的敏感度,需要对原始数据进行归一化处理。数据的归一化是将数据按比例缩放到一个特定区间,将数据统一映射到[0 1]区间上。设MinA和MaxA分别是属性A的最小值和最大值,将A的一个原始值x映射到区间[0 1]的值x′的公式如下:
式(1)用于模型训练的数据集中的数据全部进行归一化处理。转化后用于模型的学习数据为矩阵A(n),矩阵A(n)的行数为5,列数为25,归一化处理后的A(n)为:
在未来智能化时代,战场数据呈现海量形态,智能化的指挥与辅助决策手段将被广泛运用,作战空间由物理域、信息域向认知域加速拓展,对指挥控制的精确性、时效性、实用性提出了更高的要求。由于战场环境复杂,信息量巨大,敌方攻击行为和作战样式不断涌现并且复杂多变,仅依赖领域专家难以在短时间对目标信息进行分析。以下两种数据来源可用于生成目标攻击意图识别标签:
1)由真实作战或实战演练数据提供的来袭目标攻击意图记录;
2)由领域专家根据不同的态势判断敌方目标的攻击意图;
如图1所示,典型水面舰艇编队配置如下,每艘舰艇都拥有相应编号。
图1 水面舰艇编队配置
图2 深度神经网络结构图
样本数据对应的攻击意图转化后用于模型学习的标签数据为矩阵S(n),由专家识别或记录后标记的矩阵为:
其中数据的索引值对应舰艇编号,数值1代表攻击意图识别分析结果识别对应编号的舰艇被敌方锁定攻击,数值0代表未被锁定。来袭目标攻击意图的识别结果同样为格式相同,数据不同的矩阵,数值为0~1之间的概率值。经过one-hot处理后生成的识别结果与标签数据完全一致。
传统基于来袭目标攻击意图特征识别来辅助指挥者决策的方法,是需要大量的领域内专家经验对来袭目标攻击意图特征的权重、先验概率等进行先验量化,明确目标攻击意图特征之间的对应关系,但是战场形式一旦发生变化,此种方法会由于缺乏灵活性与自由度,往往会导致指挥者决策失误,这是基于先验知识确定来袭目标攻击意图特征的最大不足。
而深度神经网络可以在领域专家先验知识不足条件下,通过自身训练得到来袭目标攻击意图特征之间的规则。针对传统的神经网络算法在更新网络节点权值时收敛速度慢、容易陷入局部最优的问题,通过引入GeLUs激活函数和AdaMod优化算法,设计了基于深度神经网络的来袭目标攻击意图识别模型。
人工神经网络由称为神经元的简单元素构成,这些元素具有真实值,乘以权重,然后通过非线性激活函数运行。深度神经网络(DNN)具有多个处理输入的神经元 “隐藏层”,隐藏层中的每个神经元都会接收部分输入变量,然后将其结果传递给下一层,网络可以学习非常复杂的功能。深度学习网络更准确,随着添加更多的神经元层可以进一步提高准确性。只要有足够的计算能力,神经网络就能够学习任何函数的形状。神经网络的优点是对于高维问题非常有效,能够处理变量之间的复杂关系,可以更好的提取数据特征,在领域专家先验知识不足的条件下根据态势数据进行训练,用于来袭目标攻击意图识别。强大的调整选项可防止过拟合(over-fitting)和拟合不足(under-fitting),防止领域专家的主观性对训练结果产生影响。
深层神经网络存在梯度消失和梯度爆炸的问题,都是因为网络层数太深而引发的梯度反向传播中的连乘效应,其连乘后结果变得很小导致梯度消失。Sigmoid激活函数[19]在深层神经网络中极大概率会引起梯度消失,还有很小的概率出现梯度爆炸。常用的Relu激活函数解决了梯度消失的问题,但是可能导致神经元死亡,权重无法更新。近期的Leaky-ReLU 解决了Relu中的神经元死亡问题,但是其中的超参数α需要人工调整。后期的PReLU 和RRelu激活函数都是针对超参数α进行优化调整[12]。ELUs是试图将激活函数的平均值接近零,从而加快学习的速度。同时通过正值的标识来避免梯度消失的问题。
为改善深层神经网络的性能,需要一种新的激活函数模型,使其在学习过程中,能同时对激活函数的陡度,位置及映射范围进行调节,降低深层神经网络存在梯度消失和梯度爆炸的问题发生率,且具有更强的自我修复能力,提高模型的拟合能力与收敛速度。
GeLUs是一个新的激活函数,它引入了随机正则的思想,直观上更加符合高斯分布,实验效果强于Relus。GELUs不仅解决了深层神经网络的梯度消失和爆炸问题,同时对于模型的拟合能力和收敛速度起着至关重要的重用,公式如下:
其中:Φ(x)指的是x的高斯正态分布的累积分布。
式(2)可近似表示为:
其中:σ的选择比较关键。
深度学习通常需要大量时间和计算机资源进行训练,这也是困扰深度学习算法发展的主要原因。优化算法可以使用更少资源并使得模型收敛更快,从根本上提高了机器学习的速度和有效性。Adam 算法就是以为快速收敛为目的而设计的。自适应矩估计(Adam)是一种在神经网络中被广泛采用的优化器,是一种对随机目标函数执行梯度优化的算法。由于Adam 算法梯度的对角缩放(diagonal rescaling)的不变性,适用解决大规模参数以及稀疏梯度的非稳态问题。Adam 算法只需要一阶梯度和很小的内存,通过第一第二梯度的估计来计算不同参数的自适应学习速率。此外Adam 算法的超参数可以直观的解释,不需要大量调参。
由于Adam 算法的收敛性较差,为了保证更优的结果,文中采用了名为AdaMod的优化算法,这是一种基于Adam的改进优化器,可以在训练的同时计算自适应学习率的指数长期平均值,根据长期平均值对学习率进行修剪,去除过高的学习率。相比Adam 优化器,AdaMod能够从训练开始就控制自适应学习率的变化,无需预热。AdaMod优化器不仅能够使用更少资源加快模型收敛,同时也不需要进行大量调参就可以使模型得到一个稳定可靠的结果。
AdaMod算法比Adam 算法多出的第九步操作St=β3st-1+(1-β3)ηt,其中β3定义了记忆长度。定义了当前平滑值和过去 “长期记忆”(long-term-memory)的关系,之后从当前学习率ηt中选择最小值从而剔除高学习率。当β3=0时,AdaMod等价于Adam。
训练深度神经网络模型并输入目标态势对目标攻击意图进行识别,步骤如下:
1)从数据记录系统中提取目标参数,经转换后提取目标特征数据,并根据作战实际结果记录以及领域专家对结果的判断生成标签,数据结构形如[0,1,0,0,0]。其中被敌方锁定的我方舰船标记为1。
2)将数据集随机打乱,并采用10折交叉验证(Crossvalidation)进行训练。实现方式为将初始样本分割为10个子样本,其中10%的子样本作为测试集,其余90%样本用于训练。交叉验证重复10次,每个子样本验证一次。
3)调整深度神经网络结构,设置隐藏层数和节点数。
4)输入训练数据到构建的好的神经网络中,并调整参数。在计算资源充足的情况下并行调试多个模型,选取最优的模型迭代优化。
5)将待识别目标特征数据输入训练完成的模型,对敌方目标攻击意图做出预测。
不同的参数和超参数设置决定了模型的精确度。在普通的模型中,由于刚开始训练时,模型的权重(weight)是随机初始化的,此时若选择较大的学习率,可能带来模型的不稳定。通常会选择预热(Warmup)学习率的方式,在最初训练的几个epoches中使用较小的学习率,在预热的小学习率下,模型可以慢慢趋于稳定,等模型相对稳定后再选择预先设置的学习率进行训练,使得模型的收敛速度更快,模型效果更佳。文中采用了AdaMod优化器,它的优点是对学习率超参数不敏感,训练曲线更平滑,并且不需要预热(Warmup)。从图3可以看到即使学习率相差两个量级,也能收敛到同一个结果。而其他的优化器例如Adam,如果不预热,效果可能非常差,不能保证达到可用标准。基于此特点,设置神经网路的学习率α=0.05,超参数β1=0.9,β2=0.99,β3=0.999,平滑项ε=10-7。
图3 不同学习率下AdaMod优化器的精确度
实验结果表明,通过对模型进行并行训练得到在迭代次数为200次左右时,设置神经网路的学习率α=0.05的模型表现最好。
此外,神经网络隐藏层结构层数的设计会影响模型识别的准确度。图4与图5分别使用了不同层级的神经网络结构层数来验证使用AdaMod优化器的模型对来袭目标攻击意图识别的准确率。从图中可以看到在训练次数50 次之后,使用AdaMod优化器的模型验证的准确率基本趋于稳定。隐藏层设置为3层的准确度相比于隐藏层设置为1层的准确度更加的稳定于准确。当然,如果隐藏层设置的层数越多,其预测的准确度与稳定性也开始下降。原因是层数越多,节点越多,虽然在训练模型上的效果越好,但随之带来模型过拟合问题,会造成稳定性变差,准确度下降。
图4 三层节点神经网络准确率
图5 五层节点神经网络准确率
为验证最终模型的精确度,将原数据集再次随机打乱,并抽取前90%作为训练样本,剩余的10%数据作为测试样本。将训练样本作为模型输入并用测试样本检测模型精确度,测试结果如图6所示。在迭代次数为250次的情况下,模型的准确率高于98.4%。从识别结果可以得出结论,该深度神经网络模型在现有样本的条件下可以有效识别来袭空中目标的攻击意图,同时模型准确率高于98%,识别可靠性高。
图6 训练后的模型准确率
实验中所提出的激活函数和优化器配置对比基于单层BP神经网络模型,普通深度神经网络模型,Sigmiod激活函数与Adam 优化器深度神经网络模型,ReLu激活函数与Adam 优化器深度神经网络模型的识别效果对比如图7所示。
图7 不同模型准确度对比
由图7可知,文中提出的GELUs激活函数与AdaMod优化器改进的深度神经网络模型在同样的数据集上能得到比其他模型更好的识别效果。其中使用Adam 优化器的深度神经网络模型特定学习率参数设置下收敛存在问题,出现了无法收敛的情况。在不预热的情况下,模型准确率过低,如图8所示。作为对比,文中提出的深度神经网络模型不存在无法收敛到最优解的问题,同时收敛的速度更快,识别效果更好。在保证精度问题的同时,还解决了训练数据量不足的情况下,其他模型训练结果不理想的情况。
图8 无预热情况下模型准确度对比
通过上述的模型分析与实验对比可以发现,文中提出的GELUs激活函数对神经网络具有更好的泛化能力,可以需要更少的训练样本,得到更好的预测效果,而AdaMod优化器让模型有了更好的收敛性与收敛速度,只需要一个较小的样本集对模型进行训练,就可以让敌方空袭目标意图识别结果稳定可靠、准确率高。
故此,采用AdaMod优化器与深层神经网络GeLUs激活函数的来袭目标攻击意图识别模型有以下几个特点:
1)模型鲁棒性性好,结果输出稳定;
2)收敛速度快,样本集需求少;
3)攻击意图特征提取充分,数据挖掘比较完全;
4)模型训练结果可靠性高,准确度高。
当然,由于战场态势千变万化,战场信息错综复杂,受神经网络各参数的初始化数据影响较大,小样本集的训练可能会有所偏差,所以此模型有待进一步的改进与提高。
文中结合了敌方空袭目标意图识别问题的特点,提出采用自适应学习率的深度神经网络来解决特征数据庞大,领域专家知识不足条件下的攻击意图识别问题。
文中选择了当前较为新颖同时效果更好的GeLUs激活函数和AdaMod优化器对深度神经网路模型进行优化,最大程度降低了初始学习率设置对模型的影响,提高了模型收敛速度,降低训练时间,同时提高了模型识别效果。此外,文中设计的模型对训练样本的数量要求更低,解决了当前样本不足的难点。
深度神经网络模型能够很好地对来袭目标攻击意图进行识别,有着优异的准确性和可靠性。同时实验结果显示,该模型的表现由于其他常用模型,解决了使用Adam 模型可能出现无法收敛到最优解的问题。