基于SDAE+Softmax模型的体系贡献率评估方法*

2021-08-06 06:24殷小静胡晓峰郭圣明杨永利
火力与指挥控制 2021年6期
关键词:贡献率效能概率

殷小静,胡晓峰,郭圣明,马 骏,杨永利,3

(1.国防大学联合作战学院,北京 100091;2.解放军96941部队,北京 100085;3.解放军65183部队,辽宁 辽阳 111200)

0 引言

战争是交战双方作战体系之间的对抗。习主席指出:要以对作战体系的贡献率为评价标准,科学设计装备需求和技术指标[1]。提出体系贡献率的概念,旨在通过体系贡献率评估回答体系组分对作战体系的影响程度。体系贡献率评估是体系建设和分析的重要内容,是研究作战体系构建、优化体系结构、提高体系能力、引导体系演化和打击敌方作战体系的重要依据,是当前体系研究的热点和难点[2]。体系是典型的复杂系统,组分的增、减、改等对体系效能的影响具有非线性、涌现性等特点[3],体系贡献率评估指标应该是指挥员关心的体系级指标。传统基于人工定义的体系基础指标只能反映体系效能的一个侧面且主观性强,而直接根据任务指标来评估体系贡献率又过于片面,不能体现体系变化的涌现性和非线性。因此,需要挖掘能够表征体系效能涌现性的综合特征指标,以作为体系贡献率评估的指标。

深度学习(Deep Learning,DL)[4-5]具有良好的非线性表达能力,能够很好地刻画复杂系统内部特征。栈式稀疏自编码网络(Stacked Sparse AutoEncoder,SSAE)是一种可以实现高效编码的人工神经网络[6],经过加噪优化的栈式稀疏降噪自编码网络(Stacked Denoising AutoEncoder,SDAE)不仅具有较强的特征提取能力,而且具有很好的鲁棒性。本文针对体系贡献率评估的特点和要求,采用SDAE+Softmax 模型对体系效能涌现过程进行建模,并根据Softmax 分类器的机理,从体系基础指标中挖掘分类类别的相对概率值,作为体系贡献率评估的综合特征指标。该指标能够科学有效地反映体系效能的深层变化情况,为体系贡献率评估提供了全

新的思路。

1 基本思想

1.1 体系贡献率概念

贡献率是经济领域常用的概念,既可以表示投资的收益率,又可以表示不同部门对总收益的贡献程度。借鉴经济领域“贡献率”的定义,我军创造性地提出了体系贡献率的概念[2]:待评对象(焦点对象)对包含它的作战体系完成作战使命任务的影响程度的度量。体系贡献率反映了评估要素(贡献者)对作战体系的贡献程度,是评估要素在作战体系中所发挥作用的一种度量。当前评估要素主要针对武器装备,考虑到武器装备必须在作战中才能体现出作用[7],评估体系贡献率是在衡量武器装备对作战体系的贡献程度。

按照度量方法,体系贡献率可以分为绝对贡献率和相对贡献率,分别对应基于增量的度量模型和基于比值的度量模型[8]。其中,基于增量的度量模型可能得出体系贡献率为100%的不合理结果,适于评估同类装备的体系贡献率。目前武器装备的贡献模型常用相对贡献率的概念模型[9]:

目前,从体系能力和体系效能的视角开展体系贡献率研究评估最为普遍。能力是相对静态的概念,而效能是相对动态的概念[10]。针对装备在作战应用中的贡献情况,多以体系效能视角评估体系贡献率。评估武器装备对体系效能的贡献率,最直接的角度是从作战效果和完成任务使命的程度来衡量,例如导弹命中数量、是否摧毁敌方目标等。另外,OODA环数、OODA时长、对抗势能等基于网络化体系建模的指标,从不同侧面衡量了体系效能的涌现性。但体系贡献率具有层次性和涌现性,如果单纯以是否完成使命任务作为衡量体系贡献率的指标,可能组分变化前后都能或都不能完成使命任务,并不能说组分的变化对体系效能就没有影响。因此,需要挖掘能够衡量体系效能涌现性的综合特征指标来衡量体系贡献率。

1.2 综合特征指标计算方法

传统综合特征指标的计算方法主要是通过基础指标的加权计算,其隐含的假设是指标之间相互独立,这显然与网络化作战体系指标之间相互关联的特点不匹配。随着大数据和机器学习技术的发展,人们开始探索利用数据挖掘的方法得到综合特征指标,例如文献[11-12]依托作战实验数据分别基于重要性分析、社团分析方法与主成分分析法(PCA)相结合,挖掘体系效能的多个综合特征指标。这种通过主成分分析法进行降维处理和指标聚合的思路,采用线性映射得到数据的低维结构,往往不能完备地表达体系的特征,会有信息丢失,而且得到的综合特征指标是对作战体系涌现能力某一方面的反映,虽然为体系贡献率的评估提供了不同视角,但单个指标并不能表达体系涌现能力的整体影响。

作战体系中组分系统具有非线性关联和共同演化关系,使得体系贡献率评估中面临诸多非线性问题。深度学习具有良好的特征提取能力,可以对体系效能的非线性涌现过程进行建模,从而挖掘体系贡献率评估指标。深度神经网络模型作为“深层结构”,能够有效揭示复杂输入的内在规律,但是深度学习是一种通用的“黑箱”模型,其按网络层次提取的特征具有不可解释性,不能直接作为体系贡献率评估的指标,需要定义新的综合特征指标。根据Softmax模型基本原理:

即Softmax模型的输出表征了不同类别之间的相对概率,为[0,1]区间的概率值,且输出结果之和为1,可以将其解释为类概率。因此,定义标签xi的分类概率相对值为:

该概率可以表征输入数据被分为标签xi时的可能性。如果标签xi代表作战体系能否完成某任务,那么分类概率相对值越大,则输入数据达到标签xi的可能性越大,表明体系完成某任务的能力越强,进而可以用来作为量化体系效能的非线性变化。分类概率相对值作为一种概率表达形式,能够很好地反映作战效能涌现过程的不确定性,作为评估体系贡献率的综合特征指标更为科学有效。

2 基于SDAE+Softmax模型的体系效能评估模型

为了得到可靠的分类概率相对值,首先需要构建具有较高准确性的体系效能评估模型,进而提取分类概率相对值作为体系贡献率评估的非线性指标。栈式稀疏自编码神经网络SSAE结构简单、容易训练,被广泛用于数据降维、数据分类等方面,本文采用加噪优化的栈式稀疏降噪自编码网络SDAE与Softmax分类器相结合构建体系效能评估模型。

2.1 SDAE+Softmax模型基本结构

SDAE模型具有良好的特征提取能力,加入去噪声机制后,可以提高自编码网络的鲁棒性,与分类器结合能够较好地完成对输入样本的分类识别。构建SDAE+Softmax评估模型,首先将稀疏降噪自编码网络DAE进行堆叠,完成对输入数据的特征提取任务,然后将提取的数据特征输入到Softmax分类器中进行分类,基本结构如图1所示。其中,特征提取网络采用稀疏降噪自编码网络堆叠,具有良好的鲁棒性和拟合能力。

图1 SDAE+Softmax模型的基本结构

对于稀疏降噪自编码器,输入层数据需要先经过降噪处理再进行特征提取,代价函数为:

其中,JAE为重构误差项,用于衡量重构数据与原始数据的差异,Ωsparse为稀疏约束项,用于约束隐含层节点激活量,利于提取重要的隐藏特征,Ωweight为权重正则项,防止权重过度拟合。训练过程中通过最小化代价函数J(w,b)初始化网络参数权值w和偏置b,即:

不同于传统的浅层神经网络,SDAE+Softmax评估模型是深层神经网络,可以增减隐含层的堆叠数目,通过逐层提取特征表示复杂高维函数,提高分类识别的准确性。

2.2 模型的训练过程

深度神经网络的训练情况直接决定模型的效果,SDAE+Softmax评估模型的训练分为两个过程:无监督的预训练和有监督的微调。将训练样本分为无标签的训练样本和有标签的训练样本,利用无标签训练样本,通过无监督学习的方式训练栈式稀疏降噪自编码网络,然后,利用有标签训练样本对网络参数进行微调。SDAE+Softmax模型的训练流程如图2所示。

图2 SDAE+Softmax模型训练流程图

首先通过无监督的方式,采用逐层贪婪无监督算法逐层训练堆叠降噪稀疏自编码网络,实现数据的高层特征提取。设置前向训练中的迭代次数、稀疏参数等,随机初始化权值w和偏置b,计算代价函数J(w,b),以反向传播算法更新权值,编码器的权值与对应解码器的权值互为转置。每次仅训练一个隐含层的参数,即在训练第l层时,其他网络层参数保持不变,训练完毕后其输出作为下一层网络的输入,直至所有自编码网络预训练完毕,得到特征提取网络的所有连接参数。然后,将提取的特征输入Softmax分类器,利用有标签的训练样本进行有监督的训练,对比分类结果与原数据标签,对网络进行微调,从而实现网络优化,达到数据分类的目的。

3 实验结果与分析

3.1 实验环境

本文基于Keras平台搭建深度神经网络模型,在处理器为i7-4790CPU@3.6GHz、显卡为NVIDIATITAN X的计算机上进行模型的训练和测试。依托体系仿真实验床平台,设计作战想定,采集体系指标样本数据。

3.2 数据采集

以防空作战为背景,构建红蓝对抗实验想定。定义红方作战体系的指标参数,共386维。批量更改想定中红蓝对抗体系的参数,并多次运行想定,得到初始样本集。将指标参数进行归一化处理,其中167个指标作为模型的输入数据,将红方要点是否被摧毁为模型的输出类别。运行想定得到数量为12 000的样本集,将样本集分为无标签的训练集、有标签的验证集和有标签的测试集,数量分别为:8 000,2 000,2 000。

3.3 SDAE+Softmax模型的训练

3.3.1 基本参数的确定

对于构建的SDAE+Softmax模型,首先需要确定模型的参数,包括决定模型结构的网络层数、各网络层节点数等结构参数,激活函数、稀疏惩罚、噪声等级等调优参数,以及学习率、迭代次数、批尺寸等训练参数。以基础指标数据的维度作为输入层节点数,即386维;根据对指标集进行社团划分的经验,可以划分4~10个有意义的社团,因此,定义SDAE网络输出层节点数为10,Softmax分类器类别数量为2。设定SDAE+Softmax模型的主要参数如表1所示,并通过对比实验确定模型中隐含层的结构。

表1 模型参数设置

3.3.2 隐含层参数的确定

为确定深度神经网络中隐含层层数,通过实验讨论其选取问题。研究表明[13],当第1隐含层节点数大于输入层节点数时,堆栈自编码器可以提取较好的特征信息。节点数越多,网络的学习能力越强,但节点数增多会增加计算量,并且影响网络的泛化能力,造成过拟合的问题。另外,并非隐含层数越多,分类识别效果越好,因此,通过实验决定隐含层的层数和结构。通常设定第1隐含层节点数大于等于输入层节点数的两倍,本文选择隐含层结构分别为800-10(SDAE1)、800-80-10(SDAE2)、800-400-80-10(SDAE3)、800-400-200-80-10(SDAE4),利用训练样本集对4个模型进行训练,并利用测试集得出分类准确率,实验结果如表2。

表2 不同层数模型测试情况对比表

通过表2可以看出,随着隐含层数的增加,3层隐含层模型的准确率高于2层隐含层模型,但随着隐含层数的继续增加,4层、5层隐含层模型的准确率却在下降,也就是说,当隐含层数为3时,构建的模型可以更好地提取本数据集的特征并进行更好的分类。训练过程中迭代次数与重构误差的关系如图3所示。

图3 不同隐含层数的模型训练情况

由图3可以看出,随着迭代次数的增加,SDAE模型的重构误差逐渐减少,在迭代2 000次左右后趋于平缓,其中,隐含层数为3层的模型重构误差最小,因此,构建隐含层数和节点数为800-80-10结构的神经网络模型。同理,经过交叉实验验证,对比不同参数下模型的平均分类准确率,可确定模型的最优参数组合。学习率的大小可以直接影响神经网络的收敛速度和寻优能力,将学习率设定为0.1;为保证模型的稀疏性,设定稀疏惩罚为0.05;为实现降噪功能,设定噪声等级为0.2。

3.4 对比传统分类模型

在机器学习中,常用的分类模型还有支持向量机(SVM)、随机森林(RF)、朴素贝叶斯(NB)、多层感知机(MLP)以及PCA+Softmax 模型等,这些均属于浅层结构模型。基于同一指标数据样本,将SDAE+Softmax 模型、未加噪的SSAE+Softmax 模型以及常用的机器学习分类算法相比较,实验结果如图4 所示。

图4 不同学习模型的测试情况

通过本文构建的SDAE+Softmax 模型与常用机器学习分类算法在样本分类上的结果对比发现,SDAE+Softmax 集成模型的分类准确率最高,即体系效能评估的准确性最高,满足可信性要求,也说明了深层神经网络结构模型的分类效果要优于传统浅层结构模型。SDAE+Softmax 模型与未加噪的SDAE+Softmax 集成模型相比准确率更高,验证了加噪处理的有效性。因此,可以选择SDAE+Softmax 模型作为体系效能评估模型,并提取模型的相对分类概率作为衡量体系效能非线性变化的指标。

3.5 体系贡献率的计算

根据作战需要,选取某型预警雷达作为体系贡献率评估的焦点装备,在红方作战体系中添加某型预警雷达,红方体系指标随之改变。作战效果体现为红方重心是否被摧毁,如果被摧毁,则任务完成指标为0;反之为1。将添加某型预警雷达前后的体系指标分别输入训练好的SDAE+Softmax 模型,得到分类类别均为1,即红方作战体系不论是否添加某型预警雷达,均能完成某重心的防护任务。

对添加某型预警雷达前后的SDAE+Softmax 模型提取分类相对概率。添加某型预警雷达前,体系完成任务的相对概率为0.7 和0.3,相对值为0.4;添加某型预警雷达后,任务指标完成的相对概率为0.8 和0.2,相对值为0.6,因此,某型预警雷达对体系完成重心防护任务的贡献率为33.33 %。根据Softmax 模型分类概率相对值的物理意义,说明添加预警雷达前后,红方体系均能够完成重心的防护任务,但该预警雷达的增加提高了任务完成的可能性。另外,通过分类概率相对值还可以计算出对任务完成贡献率不高的焦点装备,从而减少这类装备的部署。

3.6 结果分析

根据实验结果可以看出:1)SDAE+Softmax 模型准确率很高,验证了评估模型的有效性,也保证了体系效能贡献率评估指标的准确性。2)SDAE+Softmax 模型评估的准确性高于传统模型SSAE+Softmax 模型,说明了加噪处理的有效性。3)基于深度神经网络的效能评估方法优于传统机器学习方法,说明深度神经网络具有较强的特征提取能力,也印证了作战体系的非线性特点。4)从体系贡献率评估应用来看,选取分类相对概率值作为评估体系效能贡献率的综合特征指标,能够量化体系变化对作战效能带来的非线性影响,这是传统体系效能贡献率评估方法所做不到的。

4 结论

深度学习通过多层神经网络对体系效能涌现过程进行建模,不同于以往人工设计和线性拟合方法,依托作战实验数据可以从神经网络模型中挖掘综合特征指标。本文构建的SDAE+Softmax 模型具有较高的准确性,基于分类概率相对值的综合特征指标,能够有效衡量组分变化对体系的非线性影响,较传统方法更为科学有效。

猜你喜欢
贡献率效能概率
立足优化设计提高作业效能
概率统计中的决策问题
概率统计解答题易错点透视
红外空空导弹抗干扰效能评估建模
提升水域救援装备应用效能的思考
概率与统计(1)
概率与统计(2)
14.8%
高等教育体制改革的贡献率研究:1998—2011年的数据观察
新形势下如何发挥专卖内管委派制的作用和效能