基于改进WOA-LSTM 的焦炭质量预测

2022-03-24 09:16刘立邦杨颂王志坚贺欣欣赵文磊刘守军杜文广米杰
化工学报 2022年3期
关键词:焦炭鲸鱼猎物

刘立邦,杨颂,王志坚,贺欣欣,赵文磊,刘守军,杜文广,米杰

(1 太原理工大学化学工程与技术学院,山西 太原 030024; 2 太原理工大学省部共建煤基能源清洁高效利用国家重点实验室,山西 太原 030024; 3 山西省民用洁净燃料工程研究中心,山西 太原 030024;4 中北大学机械工程学院,山西 太原 030051)

引 言

在“双碳”背景下,对于钢铁行业的高质量发展提出了更高的要求。焦炭作为当前高炉冶炼中关键原料之一,其质量对生产能效、CO2排放、钢铁质量等影响重大。因此,如何调控与提升焦炭质量意义重大。在实际生产中,通过扩大炼焦煤种类与配煤炼焦,可得到符合要求的焦炭。然而,配煤炼焦是一个极其复杂的工业生产过程,不仅配合煤质量对焦炭质量影响重大,炼焦过程中的操作参数亦是影响焦炭质量的关键环节(如炉温和结焦时间)。配合煤在半焦收缩阶段,焦炭气孔率随温度的增加而减小,虽然焦炭的耐磨强度有所提高,但由于微裂纹的增加导致耐磨强度随之降低。缩短结焦时间,可增加胶质体内粒子的接触,改善配合煤的黏结性,提升焦炭的机械强度。但若炼焦时间过短,导致配合煤无法完全形成焦炭。此外,配合煤的灰分、硫分、挥发分、黏结指数、水分以及细度等参数不仅影响焦炭的化学组成,对其机械强度也有较大影响。炼焦过程的复杂性使得焦炭质量的预测变得极为困难。针对这一问题,研究者们多采用基于线性回归、神经网络等方法来进行焦炭质量预测,并取得较大进展[1-3]。传统的线性回归是主要的焦炭质量预测方法。高志芳等[4]提出一种多元线性回归的方法,并建立利用配合煤煤质指标来预测焦炭质量的预测模型。张进春等[5]运用多重多元线性回归的方法搭建模型,通过配合煤煤质指标预测焦炭质量。谢海深等[6]采用线性加修正的处理方法预测配合煤的各项指标,结合多元回归和逐步回归方法分别建立焦炭机械强度模型,其焦炭灰分、硫分的预测平均误差在2%以内,焦炭冷态强度的预测平均误差在5%以内。然而,不论选用多个还是单个因子,传统的预测方法虽能得到较理想的预测结果,但由于炼焦过程的复杂性与非线性,导致回归分析中某些因子的不可预测性,使得线性回归模型预测受限。

人工神经网络由于其强大的非线性拟合与并行计算能力,近年来得到了广泛的关注。赵树果等[7]采用ANN(artificial neutral network)建立炼焦配煤质量预测模型对选取的参数样本进行训练,得到了黏结指数误差小于0.11%、硫分相对误差小于2.63%、挥发分相对误差小于1.45%、灰分的预测值与实测值的相对误差小于1.17%,虽然可以满足实际需要,但ANN 只考虑配合煤特性而未考虑焦炉加热制度,难以全面反映影响焦炭质量的因素。此外,该网络结构不易确定,训练时误差易陷入局部最小,易导致“过学习”现象,具体表现为:其只能较好地拟合已有数据,但预测结果精度偏低。随着机器学习的飞速发展,其应用也越来越广泛。基于统计学习的BP(back propagation)多层前馈网络,具有自适应、自学习能力以及非线性等特性,为焦炭质量预测带来新的方向。周洪等[8]以配合煤的挥发分、灰分、黏结指数和硫分作为输入,以用于评估焦炭质量的硫分、灰分、耐磨强度和抗碎强度作为输出,搭建3 层BP 神经网络,对焦炭冷强度进行预测。结果表明,预测相对误差小于5%,符合工业要求。冯立颖[9]提出一种基于压缩映射的遗传算法,可对标准BP神经网络优化的算法,极大地缩短了训练步数和训练时间。尽管针对基于机器学习构建模型预测焦炭质量的研究已取得较多成果,但其普遍存在着算法与配合煤煤质参数贴合程度差的问题,其选取模型与预测的煤质质量指标适配性不高,具体表现在计算精度高但却脱离了参数意义。考虑到可采用高维数据替代,但又存在着运算复杂度高、运算时间长等问题。采用优化后的BP神经网络,可提高运算时间,但将带来梯度爆炸、梯度消失等问题[10-17]。长短期记忆LSTM(long short-term memory)在传统的RNN 结构上做出了相对复杂的改进,依靠其特有的记忆性,可成功解决梯度消失、梯度爆炸的问题。由于其优秀的泛化能力,并能有效减少模型的预测误差,被作为机器学习发展史上的里程碑而广泛应用于各个领域。受钟南山院士团队将LSTM 循环神经网络用于新冠病毒传播与预测研究的启发[18],本文尝试将该模型应用于化工生产实践中。典型LSTM 中存在着超参数即隐藏神经元个数m以及时间步长c,其中隐藏神经元个数决定模型的拟合效果,时间步长决定训练过程。这些过分依靠经验得到的超参数,将对预测精度产生影响。群体智能优化算法是一种模拟自然界中各种生物的社会活动新的优化算法,鲸鱼优化算法WOA(whale optimization algorithm)是Mirjalili 等[16]提出的一种新型群体智能优化算法,将该方法用于优化LSTM 超参数上,可展现出操作简单、参数少以及跳出局部最优解能力强等优点。

基于此,本文提出一种优化LSTM 的算法,即基于自适应全局搜索改进鲸鱼优化算法的LSTM——AGWOA-LSTM(adaptive global whale optimization algorithm long short-term memory)焦炭质量预测模型,用于配煤炼焦中焦炭关键性质的在线监测,并结合实际测试结果对其有效性进行验证。将主成分分析PCA(principal component analysis)和工艺条件相结合,用来解决焦炭质量预测模型中关键参数的选择,其目的是使算法与焦炭质量预测更适配;采用LSTM 算法用于解决网络的梯度消失、梯度爆炸;利用WOA 优化LSTM 中的超参数,以提升运行速度;引入混沌特性初始化种群改进WOA 算法可提高模型预测精度,引入自适应权重和最佳领域扰动算法避免模型陷入局部最优。相较于传统算法,该模型与焦炭质量预测的适配性更好、运行速度更快、预测精度更高。将新的智能算法应用到焦炭的预测模型中,不仅可提升焦炭质量达标率,亦是对煤炭资源的合理利用。本研究将为炼焦行业高效低耗生产提供理论支撑。

1 AGWOA-LSTM 神经网络模型

1.1 LSTM神经网络模型

LSTM 是循环神经网络RNN(rerrent neural network)的优化。由于RNN在每一时刻的隐藏状态均由上一时刻隐藏层的值与该时刻输入值共同决定,故针对长期记忆并不具有优势。LSTM 可通过“门控装置”有效缓解该问题,能够选择性地存储信息。LSTM 在RNN 的基础上增加输入门、遗忘门、输出门用于控制全局的记忆元胞,其结构如图1所示。可看出LSTM 中一个memory cell 具有4 个input 和1 个output,以及三个控制gate 的门控信号。三个门均采用sigmoid 函数表示取值范围为[0,1],用于表示gate 打开的程度;激活函数采用tanh 奇函数表示取值范围为[-1,1],用于归一标准化,从而避免因特征差异造成不必要的权重影响。完整的LSTM 公式如式(1)~式(6)所示。根据具体结构(如图2 所示),与公式结合解释LSTM 的各个模块。LSTM 的关键在于细胞状态c,在图2的上方其贯穿始终。第一层是遗忘门,通过sigmoid函数处理决定是否从记忆细胞中丢弃一些信息。遗忘门接收来自输入和上一层隐状态的值进行加权处理,将新事物X<t>和现有经验a<t-1>相结合判断记忆中的事物c正确与否,计算公式见式(1)。其中Wf是遗忘门的权重矩阵,[a<t-1>,X<t>]表示将两个向量连接成一个更长的向量,bf表示遗忘门的偏置项。对于更新门、输出门,权重矩阵、偏置项的表达方式相同。在更新门中对存入细胞状态的信息进行选择,通过tanh 得到记忆细胞的候选值,更新门与候选值的计算公式见式(2)、式(3)。将新事物与现有经验相结合判断信息正误后,存入记忆c中。根据遗忘门、更新门、上层记忆细胞值以及记忆细胞候选值共同决定更新当前细胞状态,其计算公式见式(4)。LSTM 提供单独的输出门,利用新事物与现有经验对新的记忆c进行梳理得到新的经验a<t>和记忆c<t>见式(5)、式(6)[19-24]。

图1 LSTM神经网络基本结构图Fig.1 Structure of LSTM

图2 LSTM 神经网络详细结构图Fig.2 Unfold of LSTM

1.2 鲸鱼优化算法WOA

鲸鱼优化算法是近年来提出的一种智能优化算法。根据模拟自然界座头鲸捕获猎物的行为搜索得到最优解。其主要包括三种算子,通过收缩包围机制和螺旋更新机制实现局部搜索后,采用随机搜索策略实现算法的全局搜索,由于精准度高且收敛速度快的特点,在求解优化问题中展现出优良的性能和广泛的应用前景。座头鲸采用两种方式进行捕获猎物,首先将猎物包围后选取泡泡网攻击,且每次攻击选取方式不同,在最优位置与随机鲸鱼个体中更新,并向更新后的位置靠拢。

(1)包围猎物(encircling prey):当座头鲸包围猎物时,它会选择最适合定位和包围方向,计算公式见式(7)、式(8)。

其中,t表示迭代次数;A、C为系数向量;X*是猎物的位置向量;X为其余鲸鱼的位置向量。在计算过程中通过调节向量A、C的值进而寻找X在最优解周围的位置。A、C的计算公式见式(9)、式(10)。其中作为调整向量的a从2线性减小到0;r向量是[0,1]中的随机向量。

(2)泡泡网攻击方式(bubble-net attacking method):通过两种方式模拟座头鲸的泡泡网行为。

收缩包围机制:可通过减少式(9)中a值实现,当a由2 线性减小到0 时,向量A是[-a,a]中的随机数,即搜索代理的下一个位置是初始位置和当前最佳位置之间的值。当a减小时,A的变化范围也会缩小,a的计算公式见式(11)。

螺旋更新位置:首先计算出鲸鱼个体位置与猎物位置距离,为模拟座头鲸的螺旋狩猎方式建立如式(12)、式(13)的螺旋方程式。其中b用于定义对数螺旋形状,l为随机数[0,1]。

(3)搜索猎物(search for prey):座头鲸具有独特的搜索猎物方式,可根据鲸鱼彼此的位置而非猎物位置进行随机搜索,数学表达见式(14)、式(15),其中随机选中的鲸鱼个体位置用Xrand表示。将在搜索阶段根据最近选择的搜索代理而非最佳搜索代理进行更新,|A|>1 可强制搜索代理远离参考鲸鱼,并允许WOA算法进行全局搜索。

首先,通过生成[0,1]的随机数p判断算法是否进入泡泡网攻击机制,p>0.5 时开始泡泡网攻击,否则根据系数向量A的绝对值判断系统是否进入搜索猎物或包围猎物阶段,|A|<1 时进入猎物包围阶段;|A|≥1 时进入搜索猎物阶段。随着迭代次数不断增加,a逐渐由2 减小到0,算法从搜索猎物阶段过渡到包围猎物阶段[25-36]。

1.3 鲸鱼优化算法WOA的改进

鲸鱼优化算法由于可提高模型准确度,在国内外广受关注。但作为一种新型智能种群优化算法,WOA通过概率分布实现算法种群的随机分布,导致其收敛速度低,面临无法跳出局部最优的困扰。为此引入基于自适应全局搜索改进WOA。

(1)混沌特性初始化种群:优化领域中多采用混沌映射可对提高WOA 收敛速度、搜索精度有所帮助,本文采用Singer 映射改进算法得到种群初值,Singer 映射可产生相对较均匀的序列,计算公式见式(16)。

(2)自适应权重:削弱鲸鱼最优位置对当前个体位置的影响,有助于跳出局部最优。在位置更新中加入自适应权重w,其随迭代次数而变化,逐渐提升最优位置在算法中的影响。算法前期权重较小,变化速度快;后期权值增大,变化速度减小。w计算公式见式(17)。

动态调整w大小,使得鲸鱼个体与最优鲸鱼位置即使在不同时刻均紧密联系,充分保证其他鲸鱼种群可尽快收敛到最佳位置,加快算法收敛速度。改进后的位置更新计算见式(18)、式(19)。

(3) 最佳邻域扰动:由于在WOA 优化算法迭代过程中,只有超越最优界限时,最优位置才会发生更新,但更新次数减少将会导致算法预测精度下降,故引入最佳邻域搅动策略,优先在最佳鲸鱼位置附近进行随机搜索遍历,进而寻找最佳全局值,有利于跳出局部最优,并提高收敛速度。

针对邻域扰动公式见式(20),其中X͂是更新后位置,如果生成的位置比原位置更优,则将其更新为全局最优,反之不变。

结合上述的改进策略,提出基于自适应全局搜索改进鲸鱼优化算法的LSTM算法流程如图3所示。

图3 AGWOA-LSTM 算法流程Fig.3 Algorithm flowchart for AGWOA-LSTM

2 实例分析

2.1 数据来源

实验样本数据均采自山西晋南某焦化企业,其中样本集为配合煤各项指标以及焦炭各项指标,共计261个样本。通过二级冶金焦标准来评定每个焦炭样本的质量,详见表1。

表1 原始数据部分样本Table 1 Part of the raw data

2.2 数据预处理

原始样本数据中指标的量纲以及物理意义不相同,为避免数值大的数据特征掩盖小数值特征,例如

2.3 主成分分析PCA可视化

除配合煤的水分、灰分、挥发分、黏结指数、硫分等参数将影响焦炭质量外,配合煤的细度也不可忽略,因此选择上述6 个变量为初选因子。但如何进一步选取重要因子作为焦炭质量预测模型的输入变量是后续预测精度的关键,通常使用的方法有灰关联分析法、遗传算法以及PCA。通过数学降维更新数据信息是PCA 的特点之一,将具有线性关系的变量转化为相互独立的成分,且指标之间的相关性越高,降维效果越好,PCA 显著性越高。将更新后的数据计算方差,按照降序排列。方差最大的为焦炭质量预测模型中,黏结指数与全硫的变动区间相差较大,在网络训练前通过归一化处理使得所有参数取值范围为[0,1]。可通过式(21)计算,遍历每一个数据,将Max 和Min 存储,其中Max-Min 作为基数(即Min=0,Max=1)进行数据更新。对样本数据采用预处理的方法让寻优过程更平缓、更易收敛到最优情况。第一变量,其变异性最大,也称为第一主成分;第二个变量的方差大小次之,称为第二主成分。以此类推,且主成分之间是相互独立的。当m个主成分的方差累计贡献率达到80%时,可认为这m个主成分充分反映了所需信息。通过PCA 算法将6个初选变量降维,计算其解释的变异性百分比。表2 为主成分解释的各项变异性,前三个成分即可解释所有变异性的92.99%,将其数据进行可视化,如图4所示。

图4 前三个主成分空间中可视化Fig.4 Visualization in the first three principal component spaces

表2 主成分解释的各项变异性Table 2 Variability of principal component explanations

选择配合煤指标中的水分Mt,灰分Ad,挥发分Vdaf,硫分St,d,黏结指数G作为模型的外部输入变量对LSTM网络进行优化。

2.4 基于改进WOA-LSTM 建立焦炭质量预测模型

对连续生产过程中的261 d 数据进行分析,依据PCA 得到的解释变异性较大的5 个指标,同时加入炉温、加热时长等两项过程工艺条件指标,即将261×7 的数组作为输入序列。选择衡量焦炭质量的6 个指标,分别为焦炭的水分、灰分、全硫、挥发分、M25、M10,即将261×6 的数组作为输出序列。利用改进后的自适应全局鲸鱼优化算法对LSTM 的超参数进行迭代优化。通过目标函数fitness 最优原则,可判断是否达到循环迭代条件,模型以学习率为0.001来增加学习速度,在保证损失函数尽可能低的情况下提高学习率,隐层激活函数为“sigmoid”,最大迭代次数为250 以防止过拟合,输出最优的模型结构参数:LSTM 长短记忆网络中超参数的神经元个数m以及时间步长c分别选取10 和3。由于WOA 与其他种群优化算法对比其精确度更高,收敛速度更快,加之采用Singer 映射改进算法从而得到种群初值;加入自适应权重以及最佳领域扰动算法,削弱最优位置对当前个体位置的影响,避免更新次数减少引发精度降低的问题。从而得到的LSTM 超参数即为最优参数组合。相对传统算法自适应全局搜索改进WOA 模型与焦炭预测的适配性更好、算法收敛速度更快、预测精度更高。

3 结果与讨论

3.1 基于鲸鱼优化算法LSTM预测实验结果分析

为验证AGWOA 优化LSTM 的性能,将典型LSTM、WOA 优化LSTM、与AGWOA 优化LSTM 进行性能对比。为了避免偶然性影响实验结果的精确程度,采用十次实验结果取平均值表明其平均水平。将AGWOA-LSTM 与WOA-LSTM、LSTM 的迭代情况进行对比,如图5所示,可以看出改进后的鲸鱼优化算法LSTM 相较于另外两种模型,能更快得到最优解,收敛效果更好。图6 为AGWOA-LSTM的参数空间。

图5 AGWOA-LSTM 与WOA-LSTM、LSTM迭代对比Fig.5 Iterative comparison of AGWOA-LSTM with WOALSTM and LSTM

图6 AGWOA-LSTM 的参数空间Fig.6 Parameter spacec of AGWOA-LSTM

为更好地描述算法模型的训练结果,本文选用均方根误差(RMSE)和R2来检验算法。均方根误差RMSE的计算方法为预测值和实际值偏差的平方和与次数n比值的平方根。RMSE 可评价数据的变化程度,其值越小,表明该预测模型描述实验数据的精确度越高。由图7 可以看出,每一阶段的大部分输出值都与目标值非常吻合,且误差大部分在0.01以下。因此AGWOA-LSTM 可以很好地用来解决焦炭的质量预测问题。

图7 AGWOA-LSTM 的误差情况Fig.7 Error fitting of AGWOA-LSTM

R2误差的大小意味着模型的拟合度的好坏。R2误差取值范围为0~1,值越接近1说明模型的拟合度越好。将AGWOA-LSTM 与WOA-LSTM、LSTM进行对比,实验均迭代250次达到收敛条件,此时的各算法性能对比见表3。

如表3所示,自适应全局搜索鲸鱼优化算法LSTM训练时长为366 s,RMSE 为2.09×10-3,R2为0.98。在相同的收敛次数下,与其他算法相比运行速度更快;误差指标明显小于其余模型;预测效果突出。AGWOA-LSTM 模型具有更快的运行速度以及较高的预测精度,将该模型应用于焦炭指标预测,其泛化性以及预测的精确度均优于WOA-LSTM、LSTM模型。

表3 模型性能对比Table 3 Performance comparison of models

通过对以上结果分析,本文采用的自适应全局搜索模型对焦炭质量指标预测效果良好,预测结果稳健,对炼焦产业生产具有一定的理论指导意义。

3.2 焦炭质量分类可视化

在程序中编译,将二级冶金焦标准可视化。选取全部数据利用AGWOA-LSTM 网络模型的测试结果,运行调用函数得到焦炭质量,将预测的焦炭各指标数据进行可视化评估。按照同天样本将预测和实际的焦炭质量分类结果进行对比,如图8所示。图中以实际目标值为横坐标,预测输出值为纵坐标。可发现输出和目标近似拟合在虚线上,即二者近似相等。此外R值近似等于1 也能得出上述结论。

图8 预测和实际焦炭质量的分类拟合Fig.8 Classification fit for predicted and actual coke quality

4 结 论

针对炼焦行业在线实时监测难,且焦炭质量预测模型存在的运算速度慢、精确度低等问题。本文采用主成分分析特征提取的方法设定网络参数,加入自适应惯性权重与最佳扰动更新改进鲸鱼算法优化LSTM 循环神经网络,可解决在时间序列的预测问题。将模型算法应用于预测焦炭质量指标中,在一定程度上缩短了网络训练时长,均方根误差减小为2.09×10-3,R2为0.98 接近于1,都可证明该模型与预测焦炭指标的适配性良好,通过与典型LSTM、WOA-LSTM 对比,发现自适应全局搜索改进WOALSTM 网络模型在模拟和实验的精度与运行速度方面均有提升。本研究为焦炭质量预测提供了新的思路,在理论指导焦炭在线生产方面具有一定价值。

猜你喜欢
焦炭鲸鱼猎物
2月份我国出口煤及褐煤29万t同比增长9.0%
小鲸鱼
三木落
2020年我国累计出口焦炭349万t
延迟焦化装置焦炭自燃的原因及对策
昆钢2500m3高炉使用劣质焦炭生产实践
迷途鲸鱼
鲸鱼
可怕的杀手角鼻龙
鲸鱼岛——拖延症