曹宇轩 刘惠康 江典蔚
(武汉科技大学教育部冶金自动化与检测技术工程研究中心 武汉 430081)
LF(ladle furnace)精炼炉是炼钢生产的主要工序,作为炼钢过程的重要一环,位于转炉和连铸之间,具有承上启下调节生产节奏的作用[1]。生产中钢水温度控制、合金加入、底吹氩气的控制精度和准确性,直接影响钢水的质量和工序的顺序进行。传统炼钢中主要是操作工依据经验来预测钢水温度,只能通过多次测温来判断是否需要电机升温或者加废钢降温,该预估方法不可靠且多次测温效率不高,可能会带来很大误差,直接影响吹氩压力大小和加合金时间,致使钢成分不达标,严重情况下可能会由于温度过低导致钢水报废,造成极大的经济损失[2]。
因此建立精确的LF炉温度控制模型具有很强的实际意义。从国内外温度模型的研究实例可以看出,常用的建模方法分为3类,分别是经验建模、机理建模和数据建模[3,4]。经验建模是操作工经长期的现场冶炼过程和经验总结的经验公式,它忽略了一些内在和外在的因素,因此经验公式准确性势必受到影响。机理建模主要考虑精炼过程中物理反应和化学反应发生的热量变化、钢包散热、冶炼过程中的吹氩搅拌和耗电量,运用公理或定理及数学方法进行推导得出数学模型,但精炼环节过多的物理化学反应导致推导过程复杂,势必影响到建模的准确性[5]。数据建模是从生产数据中找出冶炼过程中影响钢水温度的各种工艺参数及其之间的必然联系,在人工智能快速发展的今天,数据建模相对于经验建模和机理建模来说具有明显的优势,运用最多的是使用BP神经网络来预测钢水终点温度,但传统BP神经网络结构的构建严重依赖于人的经验和专业知识,缺乏明确的理论指导,因此如何构建出精确、高效、泛化能力强的温度预报模型具有很强的现实意义[6]。
本文参考经验建模和机理建模确定了影响钢水终点温度的主要参数,采用邻近炉次法和最大似然法对数据进行筛选建立准确的样本数据库,并引入蒙特卡洛算法生成神经网络架构,省去了确定神经网络结构时需要由人工实验的方法来不断尝试的复杂过程。最后再用遗传算法对生成的BP神经网络进行优化。通过仿真分析,该预报模型精确度较高,对于实现LF炉“一键精炼”具有较大意义。
准确制钢液温度是LF精炼过程的主要任务。温度预报模型主要根据钢液进站温度、目标精炼温度及时间、吹氩流量、加入的合金、渣料的加入量及各种热损失,根据能量守恒原理计算不同处理阶段需要投入的电能,并预测钢液温度,最终达到控制钢液温度的目的[7]。
传统炼钢中经验建模主要是操作工依据工作经验总结的经验公式来预测钢水温度,如下为某钢厂第二炼钢分厂经验公式。
T=T0-▽T
(1)
▽T=▽T1+▽T2-▽T3+▽T4-▽T5
(2)
其中,T0为初始值,▽T为过程温降量,▽T1为与时间有关的温降量,▽T2为加入合金造成的温降量,▽T3为脱氧产生的升温,▽T4为其他因素(罐况等)造成的温降,▽T5为电极加热产生的升温。
在机理建模中,首先要求清楚整个系统单位时间内的热量吸收和流失情况,并清楚电极加热的升温效率及所有会导致钢水温度变化的因素,最终根据能量守恒定律来计算任意时刻的钢水温度。LF炉精炼过程中输入的能量主要是电极加热产生的热量及少量合金的溶解热和化学反应热[8]。进入熔池的热量又分为如下几个去向。
第1部分是用于钢液的升温及精炼过程中添加的合金及渣料的升温熔化。
第2部分为通过包衬损失的热量,其中又包括2部分,分别为使包衬温度升高的包衬耐火材料蓄热及钢壳与周围大气之间的热交换。
第3部分是通过渣层损失的热量,其中包括由渣面的辐射和对流传热导致的热损失以及由熔池的高温气体通过渣面带走的热量。
由以上分析可知影响钢水温度的主要因素有:
(1) 钢水初始温度。一般将实际测量的温度作为初始温度。
(2) 钢水重量。每炉钢包中钢水的重量存在差异,将会对LF炉的温度产生一定的影响。
(3) 钢包处理时间。指钢包到达工作站点到钢包离开工作站点之间的处理时间。
(4) 钢水氧含量。在传统机理建模中往往只考虑合金加入时对钢水降温的影响,而忽略氧化反应放出的热量对钢水升温的影响。在某些特殊钢种的冶炼中,钢水加入合金时有部分脱氧合金(AL或硅锰合金)与钢水中的氧反应会产生大量的热,为保证模型精度和适用性要求,此部分不可忽略。
(5) 渣厚。渣层可以防止钢液温度的散发,由于渣的导热系数相对较小,使渣层起到隔热保温作用,可有效减少钢水热损失。
(6) 罐况。新钢包和旧钢包对LF炉的温度也有不同程度的影响,钢包的使用次数也称包龄,在此温度模型中根据每个钢包的包龄和保温效果将其从好到坏依次分为A、B、C、D 4类。
(7) 电极加热。LF炉是通过三相石墨电极进行加热的,电极的加热是炉内热量的主要来源。
(8) 吹氩量。氩气的搅拌可以均匀炉内钢水温度,使钢水和加入的合金进行充分的化学反应,同时将钢液中的杂质送入渣层进行化学反应,达到成分微调的目的。但是该过程也带走一部分热量,尤其是强吹氩时,对LF炉的温度影响较大。
(9) 加入合金量。对钢水进行成分微调或者脱氧时加入的合金与钢水反应、溶解也会对钢水温度产生一定影响。
(10) 渣料加入量。当钢水温度过高时会加入废钢进行调温。
神经网络结构搜索(neural architecture search, NAS)是自动机器学习(automated machine learning, AutoML)中的热点问题之一。通过设计经济高效的搜索方法,自动获得泛化能力强、硬件友好的神经网络结构,可以大量节省人工。
图1展示了基于人工的神经网络结构设计和NAS的对比。完全基于人工的神经网络结构设计一般包括以下关键流程。
(1)由已知的神经变换(operations)如卷积(convolution)池化(pooling)等设计一些拓扑结构;
(2)在所给定训练集上训练这些网络至收敛;
(3)在测试集上测试这些网络收敛结果;
(4)根据测试准确率选择网络结构;
(5)人工优化拓扑结构设计并回到步骤(1)。
其中,步骤(5)需要消耗大量的人力和时间,而且在探索网络结构时更多的来自于经验,缺乏明确的理论指导。将该步骤自动化,转交给计算机完成是NAS的核心目的。
图1 人工的神经网络结构设计和NAS对比
蒙特卡罗方法(Monte Carlo method),也称统计模拟方法,是20世纪40年代中期随着科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类重要的数值计算方法,使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。蒙特卡罗方法的解题过程可以归结为3个主要步骤,构造或描述概率过程、实现从已知概率分布抽样及建立各种估计量。
计算机技术的发展使得蒙特卡罗方法在最近10年得到快速的普及。现代的蒙特卡罗方法,已经不必亲自动手做实验,而是借助计算机的高速运转能力,使得原本费时费力的实验过程变成了快速和轻而易举的事情。从理论上来说,蒙特卡罗方法需要大量的实验。实验次数越多,所得到的结果越精确。本文将以蒙特卡洛方法来实现BP神经网络结构的设计,省去了BP神经网络设计中由人工实验不断尝试来确定网络结构的复杂过程。
BP(back propagation)神经网络是一种在误差反向传播算法的指导下进行训练的多层前馈网络,经过多年的发展已经成为目前应用最广泛的神经网络模型。BP网络可以在事前未揭示输入输出之间映射关系的条件下,通过训练数据的学习,逼近可以描述问题中输入输出关系的数学方程[9]。网络以最速下降法作为学习规则,网络的输出误差沿着网络逐层反向传播,每层神经元根据误差关系不断调整连接权值和阈值,以不断降低网络输出误差为目标,最终达到误差平方和的最小值。BP神经网络模型拓扑结构包括输入层(input layer)、隐含层(hidden layer)和输出层(output layer)。
遗传算法是模拟种群在自然界中的遗传和进化过程而建立起来的一种高度并行的全局性概率搜索算法,体现着―优胜劣汰、适者生存的自然界法则[10]。遗传算法运行效率高,可以并行处理问题而且是从全局出发进行搜索,能在搜索中主动学习和积累其空间的知识,不断缩小搜索范围以最终达到最优解[11,12]。
遗传算法主要由编解码规则、遗传算子和适应度函数等几个部分组成。其中,遗传算子包含选择算子、交叉算子和变异算子。
通过对印度比莱钢铁厂LF炉现场工艺分析结合经验建模和机理建模,得出影响温度变化的主要因素有钢包初始温度、钢水重量、钢包处理时间、钢水氧含量、渣厚、罐况、电耗、冶炼过程中的吹氩量、加入合金量和废钢加入量10个输入量。
神经网络结构搜索一般包括3步。首先定义搜索空间;然后通过搜索策略找出候选网络结构,对它们进行评估;根据反馈进行下一轮的搜索[13]。
(1) 定义搜索样本空间
为了缩小样本空间,本文对网络结构做如下规定:
1)网络输入层输出层神经元个数:与输入输出数据参数个数对应,分别取10和1。
隐藏层层数及神经元个数:理论上一个3层的BP神经网络可以完成任意n到m维的映射。因此本文为缩小样本空间隐藏层层数设定为1。隐藏层神经元个数在1至50之间随机取值。
2)激活函数选择:在logsig、tansig、relu、purelin、hardlim函数中选择。
3)训练函数选择:在traimlm、trainbr、trainrp、trainscg中选择。
(2) 确定搜索策略
本文搜索策略采用蒙特卡洛方法进行模拟随机搜索。通过多次实验发现通过对搜索策略做如下定义可提高搜索效率:每次随机生成3个网络结构并记录最好的网络结构,剩下的2个网络结构中1个在保持当前最优网络结构的隐藏层神经元个数不变的情况下,对各层网络的激活函数和训练函数随机生成,另一个在保证与当前最优网络结构中激活函数和训练函数相同的情况下对于隐藏层神经元个数随机生成。
(3) 网络结构评估
本文中神经网络结构随机搜索以实际输出与期望输出之间的均方根误差值(RMSE)为评估函数,如式(3)所示。
(3)
(1) 输入变量编码和种群初始化
本文采用遗传算法进行BP网络权值和阈值的优化过程中,对初始种群采取实数编码,每个个体由一组实数串组成。当通过蒙特卡洛方法确定BP网络结构后,个体编码长度也随权值和阈值个数确定。本文将种群大小初始化为20,最大进化代数设置为100,遗传算法以这20个个体作为初始点进行迭代。
(2) 适应度函数计算
BP神经网络的误差绝对值越小越好,而遗传算法中,适应度值越大越好,因此本文选取测试集数据误差平方和的倒数作为适应度函数,以便使遗传算法朝向适应度函数增大的方向进化。
(3) 选择交叉变异
选择交叉变异是遗传算法的核心[14]。本文选择操作采用轮盘赌法,首先产生0与1之间的随机数确定种群中个体被选中次数,然后根据上述适应度函数计算,选择适应度大的进入下一代种群。在权值和阈值优化过程中,交叉操作采用交叉算子,利用一对个体根据给定的概率重组产生新的种群后代。算法流程如图2所示。
本文实验数据以印度比莱钢铁厂某一钢种的400组冶炼数据为原始样本,通过最大似然法剔除当中有明显误差的不合理数据,采用邻近炉次法去除时间太久的不具有参考价值的历史数据。经过挑选之后剩下360组数据建立新的数据库进行仿真分析,其中240组数据用作训练集进行训练,120组用作验证集进行验证,结果发现,NAS-GA-BP温度模型预测LF终点温度的预测数据与实际数据的预报误差在±5 ℃的命中率达到90.52%,在±10 ℃以内的命中率达到了96.93%。通过对比孙小强[8]采用BP神经网络与修正方法相结合的方法预报误差处于±10 ℃以下的数据为85%,±15 ℃以内的数据为90%;李强等人[14]采用人工神经网络和专家系统相结合建立的LF温度预报模型,预报误差在±5 ℃的命中率为85%;李军等人[7]采用遗传算法(GA)和粒子群算法(PSO)混合优化BP神经网络的权值和阈值建立的GA-PSO-BP温度预报模型的预报误差在±5 ℃的误差为88%,可知该模型比传统的几种算法具有更高的预测精度和学习能力,其部分仿真预测数据与实际数据对比如图3所示,可知此温度预报模型可以满足大部分钢种甚至某些特殊钢种的实际生产需要。
图2 算法流程图
本文通过对传统的经验建模和机理建模的研究发现,钢水脱氧时的升温对钢水温度的影响较大,在考虑特殊钢水加合金进行调成份和脱氧的工艺条件下,加入钢水氧含量这一关键输入参数增加了该模型的适用性和精确性。
图3 预测数据与实际数据对比图
针对神经网络方法对结构设计要求很高,比较依赖结构和设计使用者的经验的问题,本文提出了一种基于蒙特卡罗方法实现神经网络结构自生成的基础上使用遗传算法优化BP神经网络权值和阈值的LF温度预报模型。该模型的应用节省了人力,具有更好的泛化能力。
表1 实验数据(20组)
用最大似然法和邻近炉次法对原始数据进行挑选之后,通过对BP网络、GA-BP网络和NAS-GA-BP网络预测LF终点温度的比较发现,该模型相比于传统的几种算法要好,本模型的预报误差在±5 ℃的命中率达到90.52%,在±10 ℃以内的命中率达到了96.93%,具有较高的预测精度,能够满足LF炉炉外精炼生产需要。