赵晓晓 肖玉杰 马吟龙 徐蕾 郭慧鑫
1.北方自动控制技术研究所山西太原030006
作战任务规划的结果直接影响到作战进程[1−2],并且现阶段的作战任务规划技术水平有限、任务规划结果的可信度不高.因此,分析作战任务规划的合理性至关重要.基于作战任务规划合理性分析需求,针对实时变化的战场态势,通过分析战场态势和作战任务规划的构成要素,抽取影响任务规划合理性的决策因素,建立作战任务规划合理性分析的指标体系.由于战场态势与作战任务规划的数据形式多样、随机性大、非线性、高维度等特点,采用传统的评估分析方法已经无法满足需求,因此,将人工智能应用到作战任务规划的合理性分析中,是解决上述问题的有效途径.
作战任务规划结果合理性的影响因素众多,并且这些因素与合理性分析结果之间存在复杂的非线性关系.而传统的评估方法,如层次分析法、TOPSIS法、Delphi 法,只能解决线性评估问题,不能解决这一类非线性评估问题[3].深度学习是一种多层神经网络,能够逼近任意非线性函数,并被广泛用于解决复杂的非线性问题[4].因此,本文引入深度学习,然后基于深度学习,建立任务规划合理性分析模型对任务规划结果的合理性进行评估.
基于任务规划的规划要素以及规划流程,确定了任务规划合理性分析的判别要素,拟通过兵力选择、弹药匹配、目标选择、瞄准点选择、时效性、空间资源分配等方面进行任务规划合理性分析.
1) 兵力选择.兵力选择是作战任务规划依据作战任务和敌方目标,为了达到我方作战目的而选择的我方参战兵力的类型和数量.兵力选择与作战样式、战法相协调,将不同性质、功能的兵种以及作战武器平台合理区分,合理优化配置单位、人员、装备,合理利用火力打击力量,形成作战编组,既有通用性,又发挥兵种长处和针对性,最大限度地利用非对称作战,以最大程度发挥作战效能[5].在作战任务规划中,要结合我军特色战法、根据作战目的、样式、规模以及所处作战环境,通过分析兵力编组、兵力配置以及作战效果,进而分析得到兵力选择的合理性.
2)弹药匹配.为了高效地完成作战任务,亟需可靠的弹药保障.而弹药保障的前提是合理的弹药匹配.准备合理地预计弹药需求量,是战争制胜的关键.通过分析作战目的、武器弹药、毁伤要求等方面,进而分析弹药匹配的合理性.
3) 目标选择.目标选择主导着信息化战争的决策、行动筹划和实施,在作战指挥活动中占据越来越突出的地位[6].根据作战任务要求和所受敌威胁情况,通过分析目标的价值以及敌目标的威胁程度,进而对作战目标进行选择.通过分析作战任务、目标价值以及威胁度,可以分析得到目标选择的合理性.
4) 瞄准点选择.导弹等武器的射击效果与所选取的瞄准点息息相关.对于单发或多发射击打击单个目标时,目标的中心即为最佳瞄准点: 对于打击面目标或体目标而言,瞄准点的选择更加复杂.该瞄准点的选择过程是多变量多峰值的最优化问题.需要通过分析打击概率和毁伤效果对瞄准点选择的合理性进行分析[7].
5)时效性.作战任务规划贯穿于整个作战过程,战前辅助指挥员科学、快速地提出作战构想、定下作战决心、拟制作战计划.战中对任务进行监控并进行临机调整,战后基于作战全过程积累的数据,分析评估作战方案计划,总结敌方作战特点、战术战法.战场环境瞬息万变,因而对作战任务规划的时效性提出了更高的要求.通过分析任务规划的规划时间以及规划效果,对作战任务规划结果的时效性进行分析.
6)空间资源分配.空间资源作为核心的战略资源,其分配结果直接影响到战场态势的转变,例如对作战飞机、无人机等飞行器的航迹规划以及对各类导弹的弹道解算,均属于空间资源分配范畴.通过分析空间资源的分配是否存在冲突以及空间资源的利用效率,进而对空间资源的分配进行合理性分析.
基于作战任务规划结果的重要组成部分,分析各个因素的决策要素,得到任务规划合理性分析的指标体系.作战任务规划合理性分析指标体系如图1所示.
传统的合理性分析过程主要包含两个方面: 建立一套作战任务规划合理性分析指标体系: 确定各指标的权重、并使用一定的评估计算方法来分析和计算每个指标的数值.通常情况下,采用主观权重设置方法确定指标权重,底层指标的评估数值计算强烈依赖于数学模型.由于模型与实际作战情况差距较大,因此,传统的分析方法效果不太理想.
深度学习的提出可为研究作战任务规划合理性分析问题提供宝贵的契机.作战任务规划的合理性分析实质是一类回归问题,并且是高维度、高度非线性问题,因此,将深度学习算法用于解决该问题.基于深度学习的作战任务合理性分析的基本结构如图2所示.
首先,利用专家打分、仿真数据等历史合理性分析数据得到样本数据,样本数据中包含分析指标数据以及对应的分析结果数据;其次,将样本数据中的合理性分析的评估指标作为输入变量,并将分析结果作为输出变量.利用深度学习算法对训练样本进行学习,建立从分析指标到分析结果的非线性映射,完成基于深度学习的作战任务规划合理性分析模型的构建; 最后,输入一组新的分析指标数据,利用经过训练的深度学习模型给出相应的合理性分析结果的预测输出,得到作战任务规划合理性分析结果.通过对作战任务规划合理性分析数据进行不断学习,形成智能分析能力,实现实时、在线对作战任务规划合理性进行分析,辅助指挥员及时、快速掌握任务规划结果的合理性.
图1 作战任务规划合理性分析指标体系
图2 基于深度学习的作战任务合理性分析的基本结构
由于深度学习是通过多个隐藏层的逐层非线性变换,最终得以逼近复杂函数,因此,其表达能力更强.基于深度学习的作战任务规划合理性分析过程中,通过大量样本的学习,形成对作战任务规划合理性分析的特征提取和分类,当样本训练完成后,该深度学习网络能够有效模拟指挥员思维模式,具有合理性分析的能力,最终能够实现对作战任务规划合理性分析.
2.2.1 多层神经网络模型的结构设计
本文采用多层神经网络模型结构,分为3 部分,分别为输入层、隐藏层和输出层.输入层主要由输入神经元组成: 隐藏层由单层或多层神经元组成;输出层由输出神经元组成.
作战任务规划合理性分析中,亟需解决的关键问题是选择最优的神经网络模型结构以确保网络的泛化能力.网络的泛化能力是指训练后的网络对新的样本数据作出正确反应的能力,是神经网络的重要性能指标.样本数据的质量和数量、模型的结构等因素,均会影响神经网络的泛化能力.通常情况下,训练样本数据相对固定,因此,网络模型的结构成为影响神经网络泛化能力的主要因素[8].
随着深度学习层数增多,层间的连接权值也越多,进行模型训练的难度以及需要的数据量也就相应增加.对于图像、语音等非结构化的数据,其特征不明显,直接使用原始数据很难进行分类,因此,这类问题需要进行特征变换以及特征提取也就更加复杂,隐藏层的层数相对较多[9].相比于图像、语音等数据,结构化数据的回归预测问题,其特征与预测因子相关性较强,因此,其隐藏层的层数一般不是特别多,通常采用2 ∼3 个隐藏层的模型结构.通过分析,本文中多层神经网络的输入层包含15 个神经元,输出层包含1 个神经元,共有3 个隐藏层.基于多层神经网络的结构,构建了基于多层神经网络的作战任务规划合理性分析模型,如图3所示.
2.2.2 多层神经网络的神经元节点数据传输计算
多层神经网络中的每个神经元模型包含输入、输出与计算功能.典型的神经元模型如图4所示.
其中,X1∼Xn是神经元的输入信号:θ 表示一个阈值,或称为偏置,偏置的设置是为了正确分类样本,是模型中一个重要参数;∑表示各输入信号X与权重相乘后的累加和,是一个线性变换;F(·)称为激活函数或激励函数,激活函数的主要作用是完成数据的非线性变换,解决线性模型的表达、分类能力不足的问题[10].
神经网络的一层或多层隐藏神经元,通过逐层提取数据中的多种有用特征,不断逼近复杂的函数,使神经网络可以学习复杂的合理性分析过程[11].
在深度学习中,目前最流行的激活函数是ReLU函数[12]:
图3 基于多层神经网络作战任务规划合理性分析模型
图4 典型神经元模型的结构
其中,x是神经元经过所有突触输入的加权和减去偏置的局部诱导域,f(x) 是通过激活函数得到的神经元的输出.该函数在训练多层神经网络时,更容易收敛,并且具有更好的预测性能.
2.2.3 基于深度信念网络算法的合理性分析样本数据训练方法
1)获取训练和测试样本数据
获取训练和测试样本数据是运用遗传神经网络对合理性分析问题进行建模与研究的前提和基础.而样本数据的获取较为困难,需要历史和经验数据的积累,本文样本数据来源主要有3 种[13]: ①专家打分;②部队训练演习的实况数据;③作战模拟系统产生的仿真数据.通过以上3 种数据来源,结合作战任务规划合理性分析指标,选取相应的数据作为样本数据.
单个样本空间构建完成之后,需要由多位专家同时提供训练样本,构成一个完整的训练样本集.各位专家首先进行讨论,基本确定训练样本生成的原则,然后由各位专家提供一个训练样本集,最后汇总各专家的训练样本,形成一个完整的训练样本集.
2)基于深度信念网络算法的样本数据训练方法
基于深度学习的作战任务规划合理性分析是通过对训练样本的学习,建立从分析指标到分析结果的非线性映射,进而输入一组新的分析指标变量,利用经过训练的深度学习模型能够给出相应分析结果的预测输出,是一类回归预测问题.由于本文主要解决回归预测问题,因此,拟采用深度信念网络(Deep Belief Nets,DBN) 算法.深度信念网络是由多个受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)层和一层BP 神经网络构成的一种深度网络模型[14].训练单隐层神经网络时,参数是随机初始化的,这样很容易使网络陷入局部最优,而DBN 通过逐层预训练对网络参数的初值进行优化,避免了陷入局优.多层神经网络能够对输入特征进行多次特征变换,得到更有效的特征,但直接训练多层神经网络时,面临模型复杂度高、收敛困难等问题,而DBN 通过逐层预训练避免了直接训练所带来的问题[15].基于DBN的作战任务规划合理性分析样本数据训练方法如图5所示.
深度信念网络的训练步骤主要分为预训练和微调两个过程,具体过程如下[16]:
①预训练: 分别单独无监督的训练每一层RBM网络,将特征向量映射到不同特征空间,确保数据的特征信息尽可能被保留下.在这个过程中,数据输入到输入层,生成一个向量V,再通过权值W传给隐藏层.具体过程分为以下3 个步骤:
a)将输入数据赋值给输入层,对由输入层V0与第1 个隐藏层H0构成的模型RBM1 进行训练.训练完成后,RBM1 内的参数达到最优.
b)通过训练好的RBM1 得到隐藏层H0的值,将H0看作输入层信息,与第2 个隐藏层H1构成RBM2,使用与步骤a)相同的方法进行RBM2 的训练,使得RBM2 网络的参数达到最优.
c) 按照步骤a) 和b),对所有的RBM 模型分别进行训练.
②微调:在DBN 的最后一层设置BP 网络,它的输入特征向量是RBM 网络的输出特征向量.每一层RBM 网络只能确保自身层内的权值对该层特征映射达到最优,因此,网络还存在一定的误差.反向传播算法将误差信息自顶向下传播至每层RBM,微调整个DBN 网络.
BP 网络训练过程中往往会因为随机初始化权值参数而陷入局部最优,导致训练时间较长.而RBM网络训练的过程相当于对深层BP 网络的权值参数进行了初始化,避免了陷入局部最优和训练时间长的问题.
2.2.4 作战任务规划合理性分析的网络模型的评价指标
为了检验作战任务规划合理性分析的深度信念网络模型的分析能力以及泛化能力,本文利用训练样本对构建完成的分析模型进行训练,训练结束后,将测试样本进行回代检验.
使用均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)两项指标进行评价模型[17].以上两项指标的计算公式如式(2)和式(3):
其中,yi表示第i个作战任务规划合理性分析结果的实际值,yˊi表示使用基于深度学习的作战任务规划合理性分析模型之后得到的第i个样本的预测值.
图5 基于DBN 的作战任务规划合理性分析样本数据训练方法
RMSE 与MAE 的量纲相同,但是RMSE 先对误差进行平方的累加后再开方,其实质是放大了较大误差之间的差距,而MAE 反映的是真实误差,因此,在衡量中RMSE 的值越小其意义越大,因为该指标的值能够反映其最大误差也是比较小的.利用样本数据中的测试样本,对作战任务规划合理性分析的网络模型进行评价,RMSE 与MAE 两项指标值越小,说明该模型的分析能力与泛化能力越好[18].
通过研究调查、统计历史数据,得到15 个经专家认可的样本.通过10 名任务规划领域的专家运用常规方法对15 套任务规划方案进行评估,得到15 个可靠的样本数据.其中,10 个样本数据作为深度信念网络的学习训练样本,5 个样本数据作为测试数据.经过数据的归一化和无量纲化处理,得到训练样本和测试样本,分布如表1和表2所示.
本文采用Matlab 进行仿真验证.建立深度信念网络模型,将表1中的数据作为训练样本,对深度信念网络进行训练.设置循环最大次数为1 000 次,学习步长为0.01,RMSE 和MAE 均为0.01.
表1 训练样本数据
表2 测试样本数据
将表2中的测试数据作为训练好的深度信念网络模型的输入,检验模型的分析能力以及泛化能力.深度信念网络模型得到的数据与专家评估结果的比较如表3所示.
表3 模型评估值与测试样本值比较
由表3可知,深度信念网络模型的均方根误差和平均绝对误差均小于0.01,误差在允许的范围之内.综上所述,该深度信念网络模型的误差满足要求,具有较强的分析能力与泛化能力.因此,该模型能够用来评估任务规划的合理性.
本文分析了影响任务规划合理性的因素,建立了任务规划合理性分析的指标体系.利用深度学习的非线性映射能力和自学习能力,构建了基于深度信念网络的任务规划合理性智能分析模型.实验结果表明,该评估模型能够较为准确地评估任务规划结果的合理性.与传统的方法相比,该模型在解决复杂的非线性评估问题中具有广泛的运用.但是,本文在解决评估问题中引入深度学习只是进行了初步探讨,对算法的优化、收敛等问题还需进一步探究.