基于ELM的作战方案样本验证及评估方法*

2015-05-05 08:28:34丁晓剑程文迪
现代防御技术 2015年4期
关键词:训练样本神经网络样本

丁晓剑,程文迪

(信息系统工程重点实验室,江苏 南京 210007)

基于ELM的作战方案样本验证及评估方法*

丁晓剑,程文迪

(信息系统工程重点实验室,江苏 南京 210007)

针对专家制定作战方案训练样本时容易受主观性影响的问题,提出了基于ELM的样本验证及评估方法。首先根据ELM建立作战方案样本的预测模型,然后更正错误标记的样本。仿真实验表明,利用ELM模型训练更正后的样本集能有效降低均方根误差值和提高预测的准确率。与RBF神经网络相比,训练ELM模型的时间缩短了98.8%,而且无需调节激活函数的参数就可以得到足够好的泛化性能。

超限学习机; 径向基函数;作战方案;评估;泛化性能

0 引言

现代化作战需要在战前经过严格论证,建立多个可行的作战方案,并从中选取最优方案,该过程也称为作战方案评估。传统的方法是由作战参谋对方案进行推演分析,然后做出决策,给出作战效果[1-2]。这种方法受人的主观因素影响较大,决策结果具有不确定性。一个可行的方法是军事专家根据经验对该任务建立训练样本,给出可信的打击效果。然后利用机器学习方法对作战方案训练样本集进行学习,得到预测网络,再对不同的作战方案进行预测。

上述方法会衍生一个重要的问题,如果根据经验建立的训练样本的标签值出现错误,是否会对未知的测试样本预测造成影响。机器学习方法的成功率受训练样本准确性的依赖较大,如果训练样本的标签值被错误地赋值,预测出的测试样本可能也会出现错误,在训练样本集较小的情况错误率会明显放大。

针对这个问题,本文利用一种新型神经网络方法ELM (extreme learning machine)[3-6]对作战方案进行建模,寻找可能标记错误的训练样本,并测试ELM网络在未知样本上的泛化性能。

1 相关工作

神经网络类型算法由于其模式识别和函数逼近能力较强,在军事作战方案领域有较多成功的应用。文献[7]利用基于神经网络的集成方法建立了合成旅作战方案评估网络,有效降低了评价过程中认为因素的影响。文献[8]设计了基于BP神经网络对一般性机动发射导弹作战方案评估的方法,在短时间对多个作战方案评估可以有效节约时间。文献[9]利用径向基(radial basis function, RBF)神经网络设计了联合作战方案的评估网络,并给出了应用实例。RBF神经网络是由输入层、隐层和输出层3层组成的典型前馈式神经网络,不但具有最佳逼近性能和全局最优性,而且结构简单,学习速度较快。然而RBF神经网络需要调节隐层节点个数、隐层节点中径向基函数的中心和宽度、隐层到输出层连接权值等多个参数才能得到最优训练网络,不仅耗时,而且网络性能对参数值比较比较敏感。

ELM和RBF同属于单隐层神经网络(single-hidden layer feedforward neural network,SLFN),但是ELM网络可以表示为线性方程组的形式,而且线性方程组中的隐藏矩阵是随机生成的,与训练样本无关。不同于传统的神经网络算法,ELM网络能在最小化训练样本错误的同时获得较好的泛化性能。ELM网络主要用于函数的逼近,既可以用于分类学习,也可以用于回归分析。文献[10]证明了当激活函数是Sigmoid函数g(x)=1/1+e-x时,SLFN可以以任意精度逼近任意的连续函数。文献[11]已证明几乎所有的分段连续函数(可微的或者不可微的)用于ELM时都具有全局逼近性质。

2 ELM方法与方案建模

2.1 ELM方法

j=1,…,N,

(1)

(2)

这N个方程可称为线性方程组的形式:

Hβ=T,

(3)

式中:

(4)

(5)

(6)

式中:H†为矩阵H的Moore-Penrose广义逆。

ELM是基于参数随机化和最小二乘解思想的SLFN,ELM算法可描述如下:

步骤1:随机赋值输入权wi和偏置bi,i=1,…,N;

步骤2:计算隐藏层输出矩阵H;

步骤3:计算输出权值β=H†T,其中T=(t1,…,tN)T。

算法步骤1中输入权wi和偏置bi在(-1,1)N×(0,1)中基于平均概率分布随机取值。步骤2矩阵H的计算参考式(4),激活函数g(x)可选取sigmoidal函数或者指数函数等等。步骤3输出权值β的计算参考式(6),利用广义逆矩阵的方法不但能最小化训练样本的错误,还能最小化β模的值,能够保证ELM算法具有较好的泛化性能。

2.2 ELM与RBF的比较

(7)

式中:βi=(βi1,βi2,…,βim)T为连接第i个核和输出神经元的权向量;μi=(μi1,μi2,…,μim)T为第i个核的中心;σi为核的宽度。一般用高斯函数的形式来表示核φ:

(8)

训练RBF网络需要进行2个阶段的学习:核参数和权值向量。首先确定核函数的中心和宽度,然后再进行连接权值的学习。核参数的确定通常需要额外的算法和多次迭代才能找到最优值。

与RBF网络相比,ELM网络中的核函数参数由随机分布函数产生,并且与训练样本无关。训练ELM网络即连接权值β的学习,只需简单地计算线性方程组,无需迭代过程。

3 实验仿真与结果分析

本节实验的目的是验证ELM网络在作战方案评估中的效果以及与传统神经网络RBF网络的学习性能比较。ELM的激活函数使用常用的sigmoid函数,即g(x)=1/(1+exp(-x))。文献[3]指出BP网络由于其学习机制需要花费大量时间迭代得到最优网络结构,并且泛化性能较差,在趋向于实时效果的作战方案评估应用中不太适合,本文不采用BP网络进行试验比较。

3.1 实验数据

实验的数据来自文献[9]的航空兵火力打击作战方案数据,分为训练样本集和拟评估测试样本集。训练样本集有8个样本,见表1。测试样本集有4个样本,见表2。

表1 作战方案训练样本集Table 1 Training samples of battle scheme

表2 作战方案测试样本集Table 2 Testing samples of battle scheme

3.2 方案建模

借鉴文献[9]中的航空兵火力打击方案数据,ELM网络的训练样本xi可选取飞机机型、数量、携弹威力、命中精度、突防高度、突击速度等10个参数作为属性,ti可选值有“袭扰”、“压制”和“摧毁”。由ti的可选值可以看出,对方案的建模实际上是回归学习的过程。将火力打击效果 “袭扰”、“压制”和“摧毁”量化为1,2和3。对测试样本进行学习时,预测的火力打击效果模型为

(9)

式中:f(xi)为ELM网络对测试样本xi的预测值。

3.3 训练样本实验分析

本节实验的目的是验证训练样本的健壮性。训练样本是由专家组听取多方意见,共同决策而形成的较为可信的样本。然而在战前筹划阶段,由于时间紧任务重,专家制定的训练样本也可能出现误差。将训练样本分为2组,用ELM网络训练一组样本,再用训练好的ELM网络测试另一组样本。每次实验将样本次序随机打乱,取前4个样本训练,后4个样本测试。一共进行10次实验,利用均方根误差(root mean square error, RMSE)、预测正确率(test rate,TR)、预测错误的样本(test error data, TED)和预测的值(prediction value, PV)作为测试指标。

从表3可以看出,在10次实验中,预测错误的样本以4号和8号居多。在第1,5,8次实验中,8号样本为训练样本,4号样本作为测试样本预测的值接近于2,即8号样本的标签值。在第2,4,6,7,10次实验中,4号样本为训练样本,8号样本作为测试样本预测的值接近于1,即4号样本的标签值。从表1分析4号样本和8号样本的特点,可以看出这两个样本在8个属性上是完全一样的,只有飞机数量和携弹威力2个属性的值上有少许不同,这说明2个样本是很相似的,应该赋予相同的标签值。在第9次实验中,虽然2个样本都预测正确,但是8号样本偏离标签的值较4号样本大一些。结合第3次实验,8号样本的标签值应赋予“袭扰”,即数值1。

下面比较ELM网络在原始训练样本和更正后的训练样本上的泛化性能,实验采用本节的配置,结果见图1。

表3 训练样本实验结果Table 3 Training samples simulation results

图1 ELM在2个数据集上泛化性能比较Fig.1 Generalization performance comparison of ELM on two datasets

从图1 a)可以看出,修正训练样本的标签值以后,RMSE值更小,这表明ELM网络在更正后的样本集上预测准度更高一些。在10次实验中ELM网络在原始训练样本集上的只有1次完全预测正确,而在更正后的训练样本集上只有2次预测不正确。

3.4 ELM与RBF的泛化性能比较

本节的目的是分析ELM与RBF对表2测试样本的泛化性能。测试指标包括训练时间(training time,TT)、均方根误差(root mean square error, RMSE)和预测的值(prediction value, PV)。由于文献[4]中没有给出样本的标签值,我们通过多次实验比较和属性值的分析,得出4个样本的标签值为:“压制”、“摧毁”、“袭扰”和“袭扰”,分别量化为:2,3,1,1。RBF网络的学习利用Matlab软件提供的神经网络工具箱,对4个样本的PV为(2.045 7, 3.000 0, 1.192 6, 1.056 3),RMSE值为0.102 9,TT为0.039 8 s。训练ELM网络得到的PV为(1.808 2, 3.000 0, 1.048 5, 1.005 7),RMSE值为0.099 0,TT为4.746 1e-4 s。

从上面的结果看出,RBF网络的泛化性能和ELM相差不大,但是训练网络的时间是ELM的83.86倍。这是由于训练RBF网络首先要确定核函数的中心和宽度,然后再进行连接权值的学习。核参数的确定通常需要额外的算法和多次迭代才能找到最优值,所以网络训练时间很长。当训练样本较大时,将会极大增加网络训练的时间,影响方案决策的效率。由于ELM网络中的核函数参数由随机分布函数产生,与训练样本无关,所以ELM网络无需迭代即可完成训练过程,所需训练时间很短。另外ELM网络的所有参数都是由某分布随机产生,与训练样本无关,比较使用于时效性要求较高的军事应用场合。

4 结束语

作战方案训练样本集通常由专家根据经验制定,含有主观因素,可能含有错误的标签值。利用错误的训练样本预测未知的样本集,可能会得到错误的预测结果。而这种标记错误的样本通常难以检测,而且会加大作战方案的评估误差。基于ELM网络的训练样本检测方法,能够弥补专家决策方法的不足,消除由主观因素带来的影响,提高对未知作战方案样本的预测精度。

[1] 王锋,李远华,许长鹏. 基于动态推演的合同战斗作战方案评估研究 [J]. 装备指挥技术学院学报,2012, 23(1): 40-44. WANG Feng, LI Yuan-hua, XU Chang-peng. Research on the Combined Combat Operational Plan Assessment Based on Dynamic Evolvement [J]. Journal of the Academy of Equipment Command & Technology, 2012, 23(1): 40-44.

[2] 齐燕博,王平. 基于推理的作战方案评估系统研究 [J]. 计算机与数字工程, 2010, 38(1): 78-102. QI Yan-bo, WANG Ping. Reasoning Based Operational Scheme Assessment System [J]. Computer & Digital Engineering, 2010, 38(1): 78-102.

[3] HUANG G B, ZHU Q Y, SIEW CK. Extreme Learning Machine: Theory and Applications [J]. Neurocomputing, 2006, 70 (1-3): 489-501.

[4] HUANG G B, DING X J, ZHOU H M. Optimization Method Based Extreme Learning Machine for Classification[J]. Neurocomputing, 2010, 74(1-3):155-163.

[5] 丁晓剑,赵银亮. 优化极限学习机的序列最小优化方法[J]. 西安交通大学学报, 2011, 45(6): 7-12. DING Xiao-jian; ZHAO Yin-liang. A Sequential Minimal Optimization Method for Optimization Extreme Learning Machine [J]. Journal of Xi′an Jiaotong University, 2011, 45(6): 7-12.

[6] HUANG G-B, ZHOU H, DING X, et al. Extreme Learning Machine for Regression and Multiclass Classification [J]. IEEE Trans Syst Man Cybern Part B,2012, 42(2): 513-529.

[7] 王静岩,郑建军,吴裕树. 一种基于神经网络的作战方案评估方法[J]. 军事运筹与系统工程, 2005, 19(1): 57-61. WANG Jing-yan, ZHEN Jian-jun, WU Yu-shu. A Neural Network Method for Battle Scheme Evaluation [J]. Military Operations Research and Systems Engineering, 2005, 19(1): 57-61.

[8] 高桂清,施旭鑫,李治,等. 基于BP神经网络的导弹作战方案评估方法[J]. 四川兵工学报, 2011, 32(11): 6-9. GAO Gui-qing, SHI Xu-xin, LI Zhi, et al. Evaluation Method of Missile Operation Scheme Based on BP Neural Network [J]. Journal of Sichuan Ordnance, 2011, 32(11): 6-9.

[9] 刘祖煌,程启月.径向基神经网络的联合作战方案评估仿真[J]. 火力指挥与控制, 2013, 38(1): 14-17. LIU Zu-huang, CHENG Qi-yue. Research on Evaluation Model of Joint Operation Scheme Based on RBF Nenral Network [J]. Fire Control & Command Control, 2013, 38(1): 14-17.

[10] LLANAS B, SAINZ F J. Constructive Approximate Interpolation by Neural Networks [J]. Joumal of Computational and Applied Mathematics, 2006, 188(2):283-308.

[11] HUANG G B, CHEN L. Enhanced Random Search Based Incremental Extreme Learning Machine [J]. Neurocomputing, 2008, 71(16-18):3460-3468.

[12] HUANG G B, BABRI H A. Upper Bounds on the Number of Hidden Neurons in Feedforward Networks with Arbitrary Bounded Nonlinear Activation Functions [J]. IEEE Transactions on Neural Networks, 1998, 9 (1): 224-229.

Verification and Evaluation Method Research of Battle Scheme Samples Based on Extreme Learning Machine

DING Xiao-jian, CHENG Wen-di

(Science and Technology on Information Systems Engineering Laboratory,Jiangsu Nanjing 210007, China)

In order to overcome the deficiency of subjectivity in deciding the label of battle scheme training samples by experts, a verification and evaluation method based on extreme learning machine (ELM) is proposed. The prediction model of battle scheme samples is constructed based on ELM and the wrong samples are corrected. The simulation experimental results show that lower root mean square error and better testing rate can be obtained by training ELM model on correct samples. In contrast with RBF neural network, the training time of ELM is reduced by 98.8%, and a good generalization ability can be obtained without parameters of activation function needing to be adjusted.

extreme learning machine(ELM); radial basis function(RBF); battle scheme; evaluation; generalization ability

2014-09-13;

2014-10-20

丁晓剑(1982-),男,江苏南京人。工程师,博士,研究方向为联合作战推演评估技术。

通信地址:210007 江苏省南京市1406信箱69分箱 E-mail:wjswsl@163.com

10.3969/j.issn.1009-086x.2015.04.034

E917; TP18;TP39

A

1009-086X(2015)-04-0204-06

猜你喜欢
训练样本神经网络样本
用样本估计总体复习点拨
人工智能
神经网络抑制无线通信干扰探究
电子制作(2019年19期)2019-11-23 08:42:00
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
电视技术(2016年9期)2016-10-17 09:13:41
基于稀疏重构的机载雷达训练样本挑选方法
基于神经网络的拉矫机控制模型建立
重型机械(2016年1期)2016-03-01 03:42:04
村企共赢的样本