刘 芳,王宏伟,宫 华,许 可
(1.沈阳理工大学 理学院, 沈阳 110159; 2 辽宁华兴机电有限公司, 辽宁 锦州 121017)
可靠性是弹药产品质量的关键指标,是弹药产品在战斗中完成任务的核心保障。和平时期,弹药产品长期处于贮存状态,如何评估弹药产品在贮存状态下的可靠性是各国军队亟待解决的重要问题。长期以来,国内外学者对弹药贮存可靠性的评估方法进行了大量研究。传统的弹药贮存可靠性评估方法主要以建立Bayes模型、Possion模型、随机滤波模型和马尔可夫模型等数理统计模型为主[1-5]。这些方法在使用中通常需要样本的先验分布类型,而弹药产品的特殊性使其先验分布又难以获得,导致这些方法不能很好的应用于实际问题。近几年,许多学者将BP网络、局部逼近 RBF网络、支持向量机、粒子群等智能算法引进可靠性的评估与预测,做了一些初步尝试[6-12]。智能评估算法不需要预先知道样本的先验分布信息,能够基于历史数据直接评估和预测弹药可靠性。但由于神经网络训练速度慢,且容易陷入局部最小和支持向量机算法对缺失数据的极端敏感性,使得将智能算法应用于可靠性研究中还有很多问题需要解决。
本文提出的两种智能算法优化模型:自适应蚁群优化BP神经网络弹药贮存可靠性评估模型(AACA-BP)和精英蚁群优化BP神经网络弹药贮存可靠性评估模型(EACO-BP),采用不同的蚁群优化策略智能选取BP网络的初始权值和阈值,解决了BP网络易陷入局部最优和收敛速度慢的问题。AACA和EACO算法对传统蚁群算法(ACO)的信息素更新策略均进行了改进与提升。
传统的蚁群算法是模仿蚂蚁在寻找食物中搜索最优路径的策略创建的群智能优化算法。蚂蚁在觅食过程中,在经过的路径上残留一种称为信息素的物质。跟随蚂蚁通过辨别前方路径上信息素浓度的含量,选择信息素浓度最高的路径继续前行,最终以最短路径的方式到达食物所在地。蚁群算法描述了蚂蚁觅食的信息积累和传递的优化机制,通过个体之间的信息交流与相互协作作为反馈机制获得全局最优解。
蚁群算法的两个核心策略分别为蚂蚁择路策略和信息素更新策略。蚂蚁择路策略描述了蚂蚁如何选择下一步经过的路径,如式(1)。信息素更新策略描述了蚂蚁在觅食了一段时间后路径上的信息素更新方案,如式(2):
(1)
ηj(t+τ)=(1-μ)ηj(t)+Δηj
(2)
BP神经网络是一种前馈人工神经网络,它通过信息的正向传递与误差的反向传播,实现从输入空间到输出空间的高度非线性逼近。弹药贮存可靠性的历史数据与弹药现场数据构成一个时间序列,存在隐含的非线性关系。神经网络所具有的联想记忆、非线性和良好的泛化与容错能力,能够挖掘弹药可靠性历史数据和现场数据之间的非线性函数关系,为可靠性的评估与预测提供了算法支持。本文采用由输入层(m个节点)、隐含层(h个节点)和输出层(l个节点)构成的m×h×l的3层网络拓扑结构。网络适应度函数:
(3)
传统蚁群算法有两方面缺欠有待改进。一方面是传统蚁群容易陷入局部最优;另一方面是收敛速度慢。本文采用自适应蚁群和精英蚁群两种改进蚁群算法解决以上两方面问题。每种算法在全局最优解的搜索策略和收敛速度两方面均做了改进与提升。
自适应蚁群在传统的蚁群方法的基础上,将信息素更新统一模式更改为局部信息素更新与全局信息素更新相结合的模式。蚂蚁在探寻路径中,根据自身的情况,不断调整对路径的选择,最终寻得最短路径。其中,信息素局部更新方案如式(4)所示。信息素全局更新方案如式(5)所示:
ηij=(1-ε)·ηij+ε·η0
(4)
(5)
式(4)中,ηij表示蚂蚁从地点i走到地点j这条路径上的信息素量,η0表示初始的信息素量。ε是一个常数,范围在0~1之间。式(5)中,L*表示当前最优路径的长度。
在信息素局部更新策略中,增加了初始信息素的调节功能。传统蚁群算法中每条路径的初始信息素浓度设置为同一数值,每条路径初始被选择的可能性是等概率的。这种路径搜索方案会出现最优路径在初始几次循环信息素累计较少而降低其被选择的可能性。增加的初始信息素信息,缩小了不同路径上信息素浓度的差距,提升了信息素浓度少的路径被选择的可能性,避免算法陷入局部最优。在信息素全局更新策略中,只对当前状态下最优路径上的信息素进行更新。通过引进u/L*的增量,进一步增加了最优路径的信息素浓度,提高了当前最优路径在下次被选择的概率,加速了算法收敛速度。
精英蚁群通过改进传统信息素的更新模式和限定信息素浓度的方式实现了算法速度和全局搜索能力的提升。
精英蚁群对路径上信息素浓度设置上下界[τmin,τmax]。当某条路径的信息素浓度超过τmax或者低于τmin时,这条路径的信息素量会被强制地限定为τmax或者τmin。信息素浓度限定策略可以有效地减少某条路径的信息素浓度过大或者过小,降低算法陷入早熟的可能性,避免算法陷入局部最优。在信息素更新策略方面,蚂蚁在完成一次路径选择循环后,根据蚂蚁的种类更新信息素浓度。找到最优路径的蚂蚁定义为精英蚂蚁。精英蚂蚁走过的路径信息素浓度额外增添一个与精英蚂蚁个数有关的增量。这样可以让蚂蚁在下次路径选择中能够更多选择当前最优的路径,提高收敛速度。信息素更新公式如下:
ηij(t+τ)=(1-u)·ηij(t)+Δηij(t)+Δηij(t)*
(6)
(7)
Δηij(t)*表示精英蚂蚁额外增添的信息素的量。精英蚂蚁的个数记作g。
BP神经网络初始权值和阈值的随机性是导致评估结果不稳定的一个主要因素。本文采用两种改进的蚁群优化BP神经网络算法(AACA-BP和EACO-BP),将BP神经网络的权值和阈值作为待优化的参数,通过蚁群的择路策略和信息素更新策略最终获得最优化的网络初始权值与阈值的集合,有效提高了BP神经网络评估的精度和稳定性。算法具体过程如下:
步骤1:对训练样本数据集和测试样本数据集进行归一化处理。
(8)
步骤2:建立m×h×l三层网络拓扑结构。
步骤3:初始化蚁群参数。
步骤4:启动蚂蚁,自适应蚁群根据式(4)和式(5)方案更新信息素浓度,精英蚁群根据式(6)和式(7)方案更新信息素浓度。
步骤5:重复步骤4,直到所有蚂蚁都选择同一条路径或者达到最大迭代次数为止,转为步骤6。
步骤7:将测试数据进行反归一,还原测试数据形态。
(9)
本文选取某弹药在2014—2018年内在同一地点、同一贮存条件下的4个季度的可靠度统计数据作为实验数据,如表1所示。
表1 弹药贮存可靠度统计数据
以连续4个季度的数据作为输入数据,下一季度数据为输出数据,构建BP网络输入和输出数据集,如表2所示。
表2 BP网络输入与输出
数据集中统计的数据仅为5年弹药可靠性数据,样本容量小。神经网络作为一种学习机器,能否对新的例子做出正确反应,与训练集给出的问题的信息量有直接关系。本文采用增加噪音信号的方法对样本进行扩充处理。处理后的训练样本数量相比扩充前增加15倍,显著提升训练集的信息含量和质量,能够有效提高网络的评估精度和泛化能力。
具体操作如下:对网络输入数据增加噪音,输出数据保持不变。设向量(x1,x2,x3,x4)为输入数据向量,xi(i=1,2,3,4)表示输入向量中的第i个分量。δi为增加的噪音值,取值为0.000 1。分别对向量(x1,x2,x3,x4)中任意一个xi、任意两个不同的xi、任意3个不同的xi和4个xi加上δi,经过四步扩充后,每一样本被扩充成16个不同样本,原始16个样本被扩充为256个样本。
BP神经网络的目标误差设为0.000 01。学习效率为0.1。迭代次数设为1 000。 BP网络隐含层激励函数为tansig, 输出层的激励函数为purelin,网络训练函数选取trainlm。改进蚁群待优化的BP神经网络的权值和阈值参数维度为37,每个参数值在[-1,1]中随机取20个数值,蚂蚁数量为60,信息素初始值设为1,信息素挥发系数取0.1、蚁群最大迭代次数设为800。
选用MATLAB 2016a编程工具编制m文件分别对基于BP算法、ACO-BP算法、AACA-BP和EACO-BP算法的弹药贮存可靠性评估模型进行仿真实验,对结果进行分析。
本文分别对四种智能算法进行了精度、稳定性和速度的性能对比仿真实验。为了避免实验结果的偶发性,在对每种智能算法的各种性能比较中,均采用了随机抽取的10次试验结果的均值作为参考数据。
由表3可见,AACA-BP和EACO-BP算法求解的可靠度的精度明显高于单独BP算法和ACO-BP算法。两种改进蚁群算法优化BP模型中,EACO-BP算法计算出的期望可靠度与实际可靠度的均方误差均值相对于AACA-BP降低3.8%。这说明EACO-BP算法在弹药可靠性评估中比AACA-BP算法评估的可靠度精度略高。由表3的迭代次数统计中可见,AACA-BP和EACO-BP算法的迭代次数明显少于BP算法和ACO-BP算法的迭代次数。AACA-BP算法分别比BP算法和ACO-BP算法迭代次数减少47.5%和34.375%。 EACO-BP算法分别比BP算法和ACO-BP算法迭代次数减少70%和62.5%。两种改进蚁群算法优化BP模型中,EACO-BP算法的迭代次数相对于AACA-BP降低了42.86%。由图1可见,AACA-BP算法与EACO-BP算法的评估曲线比BP网络曲线的波动性小,算法稳定性好。AACA-BP算法比EACO-BP算法更稳定。
表3 四种智能算法精度与迭代次数
图1 4种算法期望可靠度与实际可靠度均方误差曲线
表4 2018年4个季度的可靠度数据对比
1) 提出了两种弹药贮存可靠性评估算法:AACA-BP和EACO-BP算法。通过弹药历史数据评估弹药现场数据。在AACA算法和EACO算法中,采用了不同的信息素更新策略,解决了传统蚁群算法易陷入局部最小和收敛速度慢的问题。
2) 由两种改进蚁群优化BP网络的权值和阈值具有更好的网络评估性能,提高了单独BP神经网络评估弹药可靠度的精度和稳定性,减少了迭代次数。EACO-BP算法在评估的精度和迭代次数方面优于AACA-BP,而AACA-BP算法稳定性能比EACO-BP算法更高。
3) 两种弹药可靠性评估方法均可推广应用于具有历史数据或者影响因素的各种可靠性评估问题,为可靠性评估研究提供了一种新的智能途径。