李婷婷
摘要:本文主要介绍了关于钢水配料方案模型的建立,对于不同类型不同情况,采用决策树模型进行分类,针对每一类别,提供不同参数的线性回归方程。在优化过程中,结合Boost算法的原理,将错误数据权值调大,进行迭代,从而得到拟合优度较高的模型。
关键词:Boost算法;皮尔逊相关系数;决策树
一、简介
在炼钢过程中,金属的氧化反应是非常关键一步。这个过程将各个金属融合在一起,从而炼出合金。对于钢厂而言,如何提高各个金属的利用率是非常重要的,可以减少成本、提高产量。
二、研究背景
對于不同金属的配料,不仅与合金中相应金属的需求息息相关,还需要考虑各个金属之间互相的影响。因为添加配料中的某一种金属不可能被全部吸收,所以对于金属的加入量,应综合考虑其吸收程度等因素。
根据不同金属,先求解其吸收程度,然后对多种因素进行线性回归。对于出现的误差数据,可以将其权值调大,进而统计,经过多次迭代,最终得到拟合程度较好的模型。
三、模型建立与分析
根据数据计算出C、Mn被合金吸收的质量以及C、Mn加入的质量,进而求得C、Mn的历史收得率。
(一)决策树分析
基于求得的历史收得率,发现C、Mn的历史收得率在某个钢种,某个钢号,以及是否加脱氧剂的情况下,C、Mn的历史收得率有很大差异,因此针对这三个分类方式,采用决策树的方法,最终得出一种最优的分类顺序,即先对钢种进行分类,再对钢号进行分类,最后再对是否加脱氧剂进行分类。沿着决策树的某一分支,对影响C、Mn的收得率因素进行分析。影响收得率的因素可能有许多,将这些因素分别与C、Mn的历史收得率计算Pearson相关系数,挑取相关系数较大的因素,最终得到影响收得率的主要因素,决策树框架如图1
(二)主成分线性回归
建立主成分线性回归模型,使用AdaBoost对数据表进行处理,使用主成分线性回归方法进行预测,对比发现,预测的结果较未使用AdaBoost改进的准确很多。首先对影响收得率的因素进行因子分析,找出原始因素之间的关联,提取相对数量的因子,从而减少变量。多元线性回归进行预测,为减小预测的误差,使用AdaBoost对数据表进行处理,将历史数据可靠性不强的样本数据赋予较小的权重,从而提高数据表的准确性,进而加强了主成分线性回归的预测结果的准确性。
将C元素钢号HRB400D作为训练数据,数据分布如图2所示。对于Boost过程,进行训练样本数据的初始化,接着开始迭代,在得到新的权值分布的情况下,选取误差率最小的分类器进行二次迭代。不断反复此步骤,一共迭代6次,整合得强分类器,使正确率提升。
(三)规划方案
脱氧合金化不仅要保证C、Mn、Si、P、S含量达到标准,而且要使合金成本达到最小。因此本文提出以C成本最小化为目标,C、Mn、Si、P、S含量达到标准为约束,以合金加入量为决策变量优化,线性规划,得到最优化的合金配料比,结果如表1。
四、结语
模型稳定性强,误差较小;充分考虑数据的有效性与准确性。模型针对不同类别钢种不同环境,可以较为准确地预测出收得率;改变脱氧剂的加入情况,决策树会分支成不同路径,能较好的适应不同环境;主成分分析是选取代表性指标,对于原始影响因素进行降维,灵敏性较好;对于不同类别钢种,对应不同的表达式,可移植性较好,可以适应各种情况。
参考文献
[1]王熙辰.浅谈转炉炼钢技术的应用和革新途径[J].科技风,2019(15):148.
[2]连克强.基于Boosting的集成树算法研究与分析[D].中国地质大学(北京),2018.