基于生成对抗网络和深度神经网络的武器系统效能评估

2020-03-11 12:51刘海滨
计算机应用与软件 2020年2期
关键词:神经网络样本深度

李 健 刘海滨 胡 笛

(中国航天系统科学与工程研究院 北京 100048)

0 引 言

武器系统的效能通常指的是在特定环境下武器完成任务的能力,是规划、研发武器系统的基本依据,也是评价武器系统极其重要的指标,是军事运筹研究的出发点和归宿[1]。

由于武器系统的复杂性,导致其效能的评估变得尤其困难。武器系统的评估,必须要综合考虑影响其效能的所有重要指标。现阶段评价武器系统的方法主要有神经网络[2-3]、支持向量机[4]和模糊综合评估[5]等方法,每种方法都各有优劣[6]。

基于神经网络的评估方法简单易行,但最终效果对于训练集的大小有一定的依赖性。若训练集太小,容易造成欠拟合,模型找到的规律不能很好地表现数据特征,进而不能准确地拟合预测结果。

基于支持向量机的评估方法对于小样本数据有比较好的预测效果,但支持向量机对缺失数据敏感,同时对于非线性问题核函数的选择没有通用的解决方案。

基于模糊综合评估法的模型,能够将影响因素全部纳入考量范围,准确率较高,但其中的隶属度函数和权值的选择目前还存在不确定,需要人工进行选取。

本文主要是针对神经网络评估的劣势问题,提出了“生成对抗网络+深度神经网络”的解决方案。探索研究生成对抗网络在样本扩增方面的应用,结合深度神经网络建立评估模型,并对其效果和性能进行了对比分析。

1 系统评估主要算法

1.1 生成对抗网络

生成对抗网络(GAN,Generative Adversarial Nets)是一种深度学习模型,最早由Goodfellow等[7]于2014年10月提出。GAN的优化过程是一个极小极大博弈问题,其优化目标是达到纳什均衡[8]。

生成对抗网络如图1所示,包括两部分,生成模型G和判别模型D。生成模型G用于获取数据的分布,判别模型D用于估算数据来自于训练样本还是生成模型G的概率。G的训练是为了使得D最大化犯错误的可能性。该模型类似于一个双人博弈游戏,在G和D的函数解空间中存在着唯一解。伴随着G得到训练数据的分布,D输出的概率逐渐趋于1/2。当G和D定义为多层感知器的情况下,整个系统可以通过反向传播进行训练。在训练和产生样本的过程中,不需要任何的马尔可夫链或者近似推理网络。

图1 GAN算法的基本结构

生成模型G:一个生成网络,通过接收噪声z,产生伪数据G(z);

判别模型D:一个判别网络,通过接收输入样本数据x,输出数据是真数据还是G(z)的概率D(x)。

对于判别模型D,其目的是区分数据的真假,即来自于原样本数据x的D(x)的输出越接近于1越好,而对于D(G(z))越接近于0越好。对于生成模型G,其目的是使该模型产生的伪数据G(z)尽可能地骗过判别模型D,即D(G(z))越大越好[9]。因此,GAN中D与G的训练便成为使用函数V(G,D)的二者博弈极小极大值问题:

minGmaxDV(D,G)=

Ex~pdata(x)[logD(x)]+Ez~pz(z)[log(1-D(G(z)))]

(1)

对应生成模型G和判别模型D的代价函数为:

minGV(D,G)=-Ez~pz(z)[log(1-D(G(z)))]

(2)

maxDV(D,G)=-Ex~pdata(x)[logD(x)]-

Ez~pz(z)[log(1-D(G(z)))]

(3)

1.2 深度神经网络

深度神经网络[10-11]如图2所示,其内部结构可以分为三层:输入层、多层隐藏层和输出层。深度神经网络是一种有效的多层神经网络学习方法,其主要特点是信号前向传递,而误差后向传播,通过不断调节网络权重值,使得网络的最终输出与期望输出尽可能接近,以达到训练的目的。

图2 深度神经网络的基本结构

假设有m个训练样本,其中tk为对于输入xk的期望输出。其一般代价代价函数Ep为:

(4)

利用得到的误差值进行逆向传播,利用求导等方式得到神经元权值ω、偏执量b的修正:

(5)

(6)

(7)

(8)

可以看出,神经元权值和偏执量的变化取决于误差,与激活函数无关。

1.3 支持向量回归

支持向量回归(Support Vector Regression,SVR)是Vapnik等在1996年提出的应用在数据拟合问题的向量机算法。与传统的SVM(Support Vector Machine)相比,SVR的目的也是寻找最优超平面,但是SVR能找到更准确预测数据分布的平面[12]。目前,SVR算法在数据的拟合、预测等方面有着非常良好的效果。

SVR模型表示为:

(9)

(10)

经过拉格朗日函数及其求偏导数一系列变化之后可得到最终需要优化的目标W为:

(11)

由此可知,SVR的性能主要取决于参数C、ε、核函数类型以及核参数。常用的核函数包括:线性核、多项式核、径向基核函数等。

2 模型构建及评价指标

2.1 模型构建

本文运用GAN算法进行数据生成,同时利用深度神经网络进行预测,实现诸多影响因素与最终结果之间的映射关系。其详细过程如图3所示。

图3 模型构建流程图

由于影响电子对抗的因素种类较多,且不同因素之间的量纲不同,不具有可比性。因此,在实验过程中,首先对原始数据进行标准化处理,将其统一转化到[-1,1]区间。每组影响因素之间的转化公式为:

(12)

将标准化后的数据进行生成对抗网络训练,其中,主要是生成模型G和判别模型D的博弈。使用随机噪声和真实样本数据训练生成网络和判别网络,使得两者达到纳什均衡,最终获得功能强大的判别网络和可模拟原数据的生成网络。

生成模型G是一个生成网络,通过接收随机高斯噪声z,产生伪数据G(z)。假设已知训练样本的分布p(x),那么就可以在分布中随机抽样得到新样本。生成模型就是在不断循环和训练中得到噪声z和训练样本x之间的关系。在实验中,随机噪声服从均值为0,标准差为1的高斯分布N(0,1)。

判别模型D是一个判别网络,通过接收输入x,输出数据是真数据还是G(z)的概率D(x)。对于判别模型D,其目的是区分数据的真假,即来自于原样本数据x的D(x)的输出越接近于1越好,而D(G(z))越接近于0越好;对于生成模型G,其目的是使该模型产生的伪数据G(z)尽可能地骗过判别模型D,即D(G(z))越大越好。通过生成模型G和判别模型D的相互博弈和训练,使得G和D的性能在迭代过程中不断提升,最终达到纳什均衡状态。

GAN模型采用随机梯度上升更新判别模型,同时采用随机梯度下降更新生成模型,设置最大迭代次数T=500,判别模型的训练步数k是一个超参数,实验中k=Round(N/batch),Ronud(*)表示取整函数,N表示样本量,batch表示每次取出样本的数量。

从分布pz(z)、pdata(x)的m个样本{z1,z2,…,zm}、{x1,x2,…,xm}中分别选取batch个样本,利用式(3)计算其代价函数,通过随机梯度上升更新判别模型:

(13)

待k次训练更新判别模型之后,从分布pz(z)的m个样本{z1,z2,…,zm}中选取batch个样本,利用式(2)计算其代价函数,通过随机梯度下降更新生成模型:

(14)

假设有真实数据data,可以看作一组向量,pdata(x)为真实数据对应分布。在整个训练过程中,pz(z)逐渐地收敛于pdata(x)。对应有如下理论:

定理1固定G,得到最优的判别模型D:

(15)

证明:固定G,原最优函数转化为求maxDV(D,G)。将原公式中的数学期望展开为积分形式。

V(G,D)=Ex~pdata(x)[logD(x)]+Ez~pz(z)[log(1-D(G(z)))]=

(16)

求积分的最大值可以转化为求被积函数的最大值。上式中不涉及判别模型D的项都可以看作常数项。因此,被积函数可以表示为f(D)=alogD+blog(1-D)。当被积函数导数为0时,D可以取到最大值。

(17)

计算可得:

(18)

定理2如果G和D有足够的性能,对于上述定理1中的每一步,给定G,判别模型能够达到最优,并且通过更新pz(x)来提高判别准则:

(19)

要使得上式值达到最优,则D*(x)=1/2,即pz(x)=pdata(x)。

证明:将定理1中的结果代入目标函数中:

C(G)=V(G,D*)=

(20)

(21)

从JS距离的定义可知,当且仅当KL(a‖b)中的a=b时,等号成立。所以当pz(x)=pdata(x)时:

C(G)=-log4+2JSD(pdata‖pg)≥-log4

(22)

当且仅当D*(x)=1/2,即pz(x)=pdata(x)时,该不等式取到等号,C(G)取到最小值。

由定理1和定理2可得,整个模型达到纳什均衡后,生成模型已经得到原数据分布的良好的估计分布,即pz(z)=pdata(x)。

待对抗网络训练结束后,使用训练后的生成模型生成一定量的伪数据F,与原始样本数据R组成扩增样本K。较原始数据相比,扩增样本分布与其基本一致,但数据量有明显提升。

使用扩增样本K训练基于BP神经网络的深度网络,深度网络共11个输入节点,中间多层隐藏层,一个输出节点。通过误差的反向传播理论,利用式(4)-式(8)逐层反向传播,修正偏执量和神经元权值。最终得到一个完整的生成对抗网络和深度神经网络的模型。

2.2 指标体系

本文以电子对抗的效能评估为例进行说明。由于影响电子对抗的因素太多,这里选取干扰强度、干扰时间、检索速率、干扰频率、距离检索范围、距离追踪范围、距离追踪精度、角度跟踪精度、速度追踪范围和速度追踪精度等作为影响因子[13-15]。

2.3 模型评价指标

本文采用均方根误差(Root Mean Square Error,RMSE)作为模型的评价指标。RMSE是预测值与实际值之差的平方和与数据总量比值的平方根。与标准差对比,均方根误差用来衡量预测值和实际值之间的偏差,标准差则衡量一组数据自身的离散程度。

(23)

3 实验设计及结果分析

实验使用226个测试数据作为原始样本数据,利用生成模型生成伪数据的扩增样本为1 800个。归一化后的数据样本如表1所示。

表1 归一化之后的数据样本

实验中我们采用结果对比来验证模型的优劣,对比的模型为:

• 遗传算法得到最优参数的SVR。

• 原始数据训练的深度BP神经网络。

每次实验从原始样本中随机取出10个作为预测值,剩余的数据作为训练集分别对遗传算法改进SVR、深度BP神经网络进行训练,然后使用除去预测值的扩增样本训练扩增深度神经网络。

实验总共进行了7组预测,表2为不同组别不同模型下的RMSE值。

表2 随机测试数据在不同模型下的RMSE

从表2可以看出,原始数据训练的神经网络的拟合效果除了第3组和第7组优于SVR之外,其他5组拟合效果均不如SVR。这说明大多数情况下小样本的拟合SVR是普遍优于神经网络的,也一定程度上说明传统的武器效能评估模型的不稳定性,使得在效能评估的时候难以抉择合适的模型。但是,扩增样本训练的深度神经网络的RMSE值均小于原数据训练得到的神经网络和SVR,说明该模型的拟合效果要优于SVR和小样本训练得到的神经网络。另外,从第1组、第2组和第6组数据结果可以看出,本文提出的的模型要优于两个对比的传统模型,这种差异在图4中表现得更加直观。图4为7组随机测试数据在不同模型下的RMSE柱状图。

图4 7组随机测试数据在不同模型下的RMSE

为了更好地展示各模型的综合优劣性,对7组RMSE求均值,如图5所示。

图5 7组随机测试数据在不同模型下的RMSE均值

扩增样本训练的模型平均RMSE为0.046 5,原数据使用BP神经网络训练的模型平均RMSE为0.072 1,原数据使用SVR训练的模型平均RMSE为0.067 6,较原数据神经网络训练结果小0.005左右,可见在武器系统的小样本数据的效能评估方面,SVR要优于深度BP神经网络,但优势不是非常明显。通过本文模型训练得到的平均RMSE最小,比其他两种模型分别小0.025 6和0.021 1,差值明显。由此可得,从综合效果来看,扩增样本训练得到的深度网络模型要远优于传统的两种对比模型。

选取其中一组的结果进行展示,图6为第7组对应的实际值和预测结果。

图6 模型预测结果和真实值对比

从图6可以看出,原数据训练的深度BP神经网络和SVR拟合的效果各有优劣,但是扩增样本训练的深度网络模型的拟合曲线明显更契合原始数据点。从单组拟合效果来看,本文的模型优于传统的两种模型。

从上述所有结果中可以看出,无论从单组的误差还是均误差亦或是拟合效果,扩增样本训练的深度神经网络都明显优于其他两个算法。这是由于扩增样本通过扩充深度神经网络中的训练数据,使得其模型预测效果更佳。

在实验过程中发现,对于某些异常值(如第4组实验结果中的标记点),三个模型预测效果均比较差,如图7所示。

图7 模型预测结果和真实值对比(含异常值)

图7中的标记点及其图6中的第2个点,对应三种模型预测的结果都比较差,因此可以假设原专家给分或测试可能有误,或其不是来自于统一标准。以往在专家或测试给出评测之后,无法得知此次评估是否与先前的经验有较大的差别,而现在可将该系统的评估结果输入到判别网络对其进行打分,验证其与先前的评估是否存在较大差异,进而决定专家是否需要再一次的进行讨论评估或测试。

4 结 语

本文探索性地将生成对抗网络与深度BP神经网络结合建立模型,并将其应用于武器系统评估。利用对抗网络可以产生更加清晰且接近真实的样本,用以解决武器系统评估或测试中样本量较少、无法满足训练深度网络要求的问题。同时,判别网络还对评估或者测试的结果是否存在问题为专家提供了一定参考。此外,模型中扩展样本训练的深度网络,还为以往需要大量专家工作或者专业人员测试的评估问题提供了一种简洁高效的解决方法。通过对比实验,验证了本文模型的可行性及其优越性,探索性地将深度学习方法融入到军工方面。

虽然GAN模型崩溃和训练不收敛的问题已经基本被解决,但是对GAN模型还存在一定的影响,同时GAN模型不适合处理离散形式的数据,例如文本数据等。这一系列的问题都使得GAN模型的应用受到了限制,因此其应用领域还需要不断扩大与发展。本文的实验模型虽然一定程度上解决了武器系统效能评估中少样本的问题,但是对于几十个甚至更少样本量的武器系统的评估仍然无法达到令人满意的效果,这一方向将是未来研究的重点。

猜你喜欢
神经网络样本深度
基于神经网络的船舶电力系统故障诊断方法
四增四减 深度推进
深度思考之不等式
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
简约教学 深度学习
规划·样本
人大专题询问之“方城样本”
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
随机微分方程的样本Lyapunov二次型估计