基于bootstrap的高炉铁水硅含量预测

2015-05-15 03:24:08董梦林蒋朝辉
有色冶金设计与研究 2015年3期
关键词:铁水高炉预测值

董梦林,蒋朝辉

(中南大学 控制工程研究所,湖南长沙410083)

基于bootstrap的高炉铁水硅含量预测

董梦林,蒋朝辉

(中南大学 控制工程研究所,湖南长沙410083)

高炉铁水硅含量的实时准确预测对高炉炉温的调控和稳定炉况具有重要作用,但其预测结果一直存在准确度不高和缺乏可信度表征等问题。为此,本文融合神经网络和bootstrap预测区间方法,用预测区间宽度表征点预测值的可信度,实现在预测硅含量值的同时给出了其预测结果的可信度。应用实例表明,论文提出的方法提高了硅含量点预测结果的准确度,且预测区间宽度能正确的表征点预测结果的可信度,对实际生产操作具有较好的指导意义。

高炉;bootstrap;预测区间;可信度

铁水硅含量是衡量高炉冶炼过程炉况稳定性与铁水质量的重要生产指标,也可作为表征高炉热状态及其变化趋势的参考变量,因此准确地预测铁水硅含量对稳定高炉炉况、保障高炉顺行具有重要的意义。

近年来基于偏最小二乘模型[1]、自回归模型[2]、神经网络模型[3]、非线性时间序列模型[4]、贝叶斯模型[5],支持向量机模型[6]、混沌模型[7]等均在高炉铁水硅含量的预测中得到应用。但这些模型均存在一定的局限性,模型性能较为不稳定、命中率不高等问题[8],易导致炉温调控方向错误。由此可见,单一的预测硅含量值对高炉炉温的表征缺乏可信度保障。因此本文提出的预测模型实现了在预测下一时刻硅含量值的同时给出其预测结果的可信度区间,对提高现场操作人员的操作正确率具有重要的意义。

近些年,基于Bootstrap的预测区间方法在机场行李托运系统[9]、产品可靠性分析领域[10]中得以应用,它充分考虑了检测的不确定性和预测值的离散度,构建的预测区间对于数据的波动反映敏锐,可较为准确地反映出预测结果的不确定性。因此,本文尝试引入bootstrap预测区间方法,同时输出铁水硅含量的点预测值的同时给出该预测值的预测区间,然后用预测区间宽度表征点预测值的可信度,通过输出点预测值的可信度,对可信度较低的预测值给予警示,使操作者有选择的参考预测结果进行操作,可以进一步提高对高炉炉温的调控能力和精度。

1 Bootstrap预测区间

预测区间方法是在神经网络的基础上发展起来的,特别是近二十年来,出现了大量的相关论文,应用也在逐渐变广[11]。预测区间的上下限是根据观测值以1-ɑ的概率落入某区间求得的。构建预测区间的主要目的是衡量点预测值的可信度,由预测区间的宽度表征。

1.1 预测区间的数学描述

假设目标值的建模如下:

yi表示第i次采样的铁水硅含量的真实值,ti表示对应的硅含量测量值(i=1,2…n)。εi表示噪声,一般可假定其服从均值为0的正态分布,εi的存在使得测量值ti偏离真实值yi。在构建预测区间过程中,假设各次采样的样本误差独立同分布。假设预测模型对yi的预测输出为那么模型的误差可以表示为:

式2所示的预测误差包括两个部分,yi-yi表示硅含量真实值与模型预测值的误差,对其分布的估计可以表示为对模型预测结果置信区间CI的估计。εi表示数据噪声,是构成预测误差的另一个部分。yiyi表示预测误差,描述了模型预测值与实际观测值之间的差别,对其分布的估计可以表示为对模型预测结果PI的估计。当与εi相互独立时,预测模型的预测方差可表示为:

接下来,主要介绍如何利用Bootstrap方法得到硅含量的点预测值及预测区间的构建方法。

1.2 预测区间的构建

从原始数据集D1有放回的进行N次有放回的抽样得到一个子样本训练集Di1。重复上述步骤L次,即可得到L个子样本训练集,数据集D2分别输入到上述训练得到的L个神经网络同时对硅含量进行预测,可得到L个预测值。真实回归值可以由L个神经网络输出的预测值的平均值来估计:,并用这L个数据集训练得到L个神经网络

假设神经网络组合模型是无偏的,那么该模型的泛化误差可以由L个神经网络的预测输出方差来估计:

残差与对应数据样本D2的输入样本构建一个新的数据集:

通过数据集Dr2训练一个新的神经网络NNσ,用来估计未知参数。NNσ神经网络引入了最大似然估计方法,建立新的目标函数来训练模型[12],定义为:

2 应用验证

2.1 参数的选取

本文以国内某钢铁厂2号高炉采集到的2013年1月9号到2月19日共800组数据为研究对象,验证上述预测模型及算法的有效性。结合现场经验及相关性分析,选取对铁水硅含量[Si]影响较大的数据:透气性指数、富氧流量、喷煤量、料速、热风温度、鼓风动能、全压差、实际风速、矿焦比、风速、冷风流量共11个变量。

2.2 模型仿真

将800组数据分为三个样本集D1,D2,D3,其中D1、D2用来训练硅含量预测模型,样本数分别为400和200,D3为测试样本,样本数为200。选取重抽样次数L=1 000。模型输出结果如图1所示。

为了对比预测模型的硅含量预测值的精度,对于同样的数据样本再分别采用偏最小二乘模型和ARIMA模型进行仿真测试。结果表明,本预测模型中由多个预测值得到的平均值作为硅含量预测值的预测命中率为84%,明显要优于单一的神经网络(75%)、偏最小二乘模型(70%)和ARIMA模型(73%)。从图1可以看出,硅含量预测值很好地跟踪实测值的变化,特别是在一些数据波动比较大的情况,预测值也能保持与实际值相同的变化趋势,但此时预测的误差较大,预测值不能体现出实际值的剧烈变化。然而,预测值对应的预测区间宽度看出相对于其他较为平稳的炉次处的明显变宽,说明预测区间宽度确实可以反映出预测值的可信度。

图1 铁水硅含量预测模型预测结果

2.3 预测区间宽度与预测结果可信度的关系

建立预测区间宽度与预测结果可信度之间的关系,首先需要将预测模型输出的预测区间基于宽度进行合理分类,然后讨论不同预测区间宽度范围内硅含量预测值的可信度。如表1所示,对200炉硅含量预测结果进行了统计,得到了硅含量预测值与真实值的绝对误差不同的情况下,对应的预测区间宽度的平均值。根据该预测统计结果,可将预测区间宽度的分成3类(见表2)。

在对高炉铁水硅含量预测结果评价中,结合现场实际经验,当预测值与真实值的绝对误差>0.1,认为没有命中真实值,<0.1,认为命中真实值。预测结果的可信度通过预测样本中“准确命中”的预测样本比例来体现。对于每个预测区间宽度类别内的预测样本,计算对应的预测结果可信度,结果如表2所示。

表1 高炉铁水硅含量预测模型的预测结果统计

表2 预测区间宽度和点预测结果的可信度关系

结合图1和表2可知,预测结果可信度并不是稳定不变的,当数据波动较小时,该预测模型输出的硅含量预测值能够很好的跟踪实测值,预测精确度较高,预测结果可信度也较高;而当炉况较差时,硅含量数据波动较大,预测值很难及时跟踪实测值的趋势变化,预测的准确度会明显下降,预测结果的可信度也会随之下降。该预测模型能在预测硅含量值的同时给出该预测结果的可信度,现场操作人员能依据可信度有选择的相信点预测结果,降低炉温调控过程中的不确定性,有利于提高高炉现场的炉温调控能力和准确性。

3 结论

本文提出了基于Bootstrap方法的高炉铁水硅含量预测模型,实验表明,对于硅含量波动不大的炉次,该模型的预测结果能很好地跟踪铁水硅含量的变化趋势,但对于那些硅含量波动比较大的炉次,该模型仅能大致保持硅含量实测值的变化趋势,预测误差较大。同时,该预测模型能够给出硅含量的预测区间,且预测区间宽度的变化能够较为准确的表征预测结果的可信度,实现硅含量值及其可信度的同时预测,能够让操作者有选择的依照预测结果进行炉况调控,并能提前得到炉况波动的预警。但是该预测模型也存在着模型复杂,计算复杂度大,运算时间长等问题。

[1] 李志玲.基于主成分分析和偏最小二乘的高炉炉温预测模型的研究[D].包头:内蒙古科技大学,2011.

[2] 王文慧.基于小波分析理论的高炉炉温预测模型研究[D].杭州:浙江大学,2005.

[3] W.Chen,B.X.Wang,H.L.Han.Prediction and control for silicon content in pig iron of blast furnace by integrating artificial neural network with genetic algorithm[J].Ironmaking&Steelmaking,2010; 37(6):458-463.

[4] Saxén H,Pettersson F,Gunturu K.Evolving nonlinear time-series models of the hot metal silicon content in the blast furnace[J]. Materials and Manufacturing Processes,2007,22(5):577-584.

[5] 龚淑华,刘祥官.模糊贝叶斯网络应用于预测高炉铁水含硅量变化趋势[J].冶金自动化,2005,29(5):30-32.

[6] C.H.Gao,L.Jian,S.H.Luo.Modeling of the thermal state change of blast furnace hearth with support vector machines[J].IEEE Transactions on Industrial Electronics,2012,59(2):1134-1145.

[7] Gao C,Chen J,Zeng J,et al.A chaos‐based iterated multistep predictor for blast furnace ironmaking process[J].AIChE Journal, 2009,55(4):947-962.

[8] Nix D A,Weigend A S.Estimating the mean and variance of the target probability distribution[C]//Neural Networks,1994.IEEE World Congresson ComputationalIntelligence.,1994 IEEE International Conference on.IEEE,1994,1:55-60.

[9] 郜传厚,渐令,陈积明,等.复杂高炉炼铁过程的数据驱动建模及预测算法[J].自动化学报,2009,35(6):725-730.

[10] Khosravi A,Nahavandi S,Creighton D,et al.Optimizing the quality ofbootstrap-based prediction intervals[C]//Neural Networks(IJCNN),The 2011 International Joint Conference on. IEEE,2011:3072-3078.

[11] Khosravi A,Nahavandi S,Creighton D,et al.Comprehensive review of neural network-based prediction intervals and new advances[J].Neural Networks,IEEE Transactions on,2011,22 (9):1341-1356.

[12] Nix D A,Weigend A S.Estimating the mean and variance of the target probability distribution[C]//Neural Networks,1994.IEEE World Congress on Computational Intelligence.,1994 IEEE International Conference on.IEEE,1994,1:55-60.

The Prediction of the Silicon Content in Hot Metal of Blast Furnace based on Bootstrap

DONG Menglin,JIANG Zhaohui
(Central South University,Shangsha,Hunan 410083,China)

Accurate real-time forecasting of silicon content in hot metal of blast furnace plays an significant role in the furnace temperature regulation,but the prediction results have low hit rate and always lack of any indication of their accuracy.Therefore,a prediction model of silicon content in hot metal based on the integration of bootstrap method and neural network is constructed to predict the silicon content of next time,meanwhile,providing the prediction interval of the reliability of point prediction.Application results show that not only does the established model improve the prediction accuracy of silicon content in point shooting,but the prediction interval width correctly characterizes the reliability of point prediction.The proposed method will be beneficial to the actual production process.

Blast Furnace;bootstrap;prediction interval;reliability

TP391

A

1004-4345(2015)03-0027-04

2015-06-04

国家自然科学基金重大项目(61290325);国家自然科学基金创新研究群体科学基金(61321003)。

董梦林(1990—),女,主要研究方向为高炉铁水硅含量预测。

猜你喜欢
铁水高炉预测值
IMF上调今年全球经济增长预期
企业界(2024年8期)2024-07-05 10:59:04
5100m3高炉长期休风快速恢复实践
山东冶金(2022年2期)2022-08-08 01:50:38
山钢5100m3高炉提高铁水装准率的实践
山东冶金(2022年1期)2022-04-19 13:40:16
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
今日农业(2021年19期)2022-01-12 06:16:32
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
昆钢2500m3高炉开炉快速达产实践
昆钢科技(2021年3期)2021-08-23 01:27:36
昆钢2500m3高炉停炉及开炉快速达产实践
昆钢科技(2021年3期)2021-08-23 01:27:34
法电再次修订2020年核发电量预测值
国外核新闻(2020年8期)2020-03-14 02:09:19
低铁比条件下低硅、低温铁水加煤块冶炼生产实践
山东冶金(2019年5期)2019-11-16 09:09:06
高炉前
当代工人(2019年18期)2019-11-11 04:41:23