基于梯度提升决策树的湿法磷酸过程软测量建模

2023-02-27 07:42:42李显军赵小平余德靖赵亮
石化技术 2023年12期
关键词:湿法决策树磷酸

李显军 赵小平 余德靖 赵亮

1. 贵州磷化(集团)有限责任公司 贵州 贵阳 550002 2. 华东理工大学 上海 200237

当前磷化工行业都在逐步转向以磷酸铁锂、磷酸铁、六氟磷酸锂为主要产品的新能源电池行业,除此以外如磷酸和磷酸一铵等被广泛应用于化工、农业、医药、食品、电子、建筑材料等领域[1]。在工业数字化转型的背景下,如何使用机器学习算法对磷化工行业进行赋能转型是一个值得关注的问题。

在湿法磷酸生产中,反应槽中的SO3浓度和P2O5浓度对磷酸生产是非常重要的,但由于人工化验时间较长、次数较少,分析结果不能及时、准确地反映生产过程中每一时刻的实际情况[3]。为解决这个问题,提出了一种基于梯度提升决策树的软测量建模方法。该方法应用于磷化工生产过程中的磷酸系统研究,可以辅助和指导生产操作。

1 磷酸工艺流程简介

磷酸工艺过程是一种制备磷酸盐的工业化工过程,主要制备方法分为酸矿反应的湿法磷酸和电炉加热的热法磷酸两种。本文涉及的是湿法磷酸生产过程,目前湿法磷酸生产过程中采用的有硫酸、盐酸、硝酸。根据产生物不同形态的硫酸钙结晶体,湿法磷酸流程可细分为三个类别:无水物流程、二水物流程和半水物流程,即在酸矿反应过程中分别生成无水硫酸钙、二水硫酸钙、半水硫酸钙。

研究建模对象为湿法磷酸二水物流程的重点生产单元反应槽模型。二水物流程是传统的磷酸生产方法之一,具有生产效率高、反应速度快等优点。其主要反应方程式如式 下:

反应后的混合料液中含有一定量的杂质磷酸溶液,以及固态的石膏和未被硫酸分解的含磷矿物。液态和固态可以通过过滤和洗涤来分离。

反应过程中,给定的硫酸与过滤系统返回的磷酸在混合三通中混合。返回磷酸的流量和浓度由反应槽中的料浆固含量和液相P2O5浓度决定,以控制反应料浆的固含量在25%到35%之间,液相P2O5浓度约为28%。另外控制SO3浓度有利于减少晶间磷酸的损失,提高产品的转换率。因此,对P2O5浓度和SO3浓度的监控对磷酸生产过程来说至关重要。

2 集成学习与梯度提升决策树

2.1 集成学习

集成学习是机器学习的一种有监督学习方法,其核心是通过组合多个学习器来增强预测精度。其原理是通过训练多个基学习器(weak learner),然后将它们组合成一个强学习器(strong learner)。在训练过程中,每个基学习器都会对样本进行学习并输出预测结果,最后将这些预测结果进行集成,得到最终的预测结果。

2.2 梯度提升决策树

Friedman提出的梯度提升决策树(GBDT)是一种集成学习算法,它通过将多个弱学习器重新组合构成强学习器。

预测函数F是以若干个弱学习器加权的方式构成加法模型,模型中x为输入样本,ht为第t棵回归树,ω是回归树的参数,α表示每棵树在预测函数中的权重:

对于N个样本点,寻求最优模型等同于使损失函数L最小化。应用求解算法归结如下:

首先模型初始化,定义初始化基学习器为f0。同时定义

在每次迭代中都构造一个基于回归树的基学习器,设根据磷化工反应槽工业数据之间的差异将工业数据划分为N类,并利用神经网络拟合出N个基学习器,因此对于模型的训练样本为,相应的预测目标函数为

3 软测量模型建立

本文采用梯度提升决策树对反应槽的SO3浓度和P2O5浓度进行软测量建模。实验在英特尔i5笔记本电脑上进行,硬件主板配置2.3GHz, 8G内存和nvidia GeForce GTX 1060。软件环境为Windows 10, Python 3.8, scikit-learn 1.1.0版本。

3.1 数据预处理

本实验采用的数据是由于仪表读数波动较大且存在异常,产生的粗大误差对模型的预测性能产生很大影响,需要对数据进行预处理。此处采用平均值滤波方法。训练集与验证集样本的取样时间为2022年3-7月上午8点至4月20日晚上20点,采样间隔12h。

3.2 辅助变量选择

在软测量建模实践中,辅助变量的选择起着关键性的作用,直接影响到模型的精度和效果。灰色关联分析法利用灰色关联度的大小来确定各变量对系统主要行为的贡献程度。计算步骤如下:

第一步:确定分析序列;

初始变量集可用Xi表示:

输出变量表示为:

式中,Xi为原始数据变量集,Y为输出变量集,k为数据量编号,m和n分别为输入、输出变量个数。

第二步:无量纲化;

数据预处理阶段,采用均值法对数据进行无量纲化处理,使其在同一尺度下进行分析。第三步:计算灰色关联系数;

式中,ρ取0.5。

第四步:计算关联度值。

采用公式(10)计算关联度。

本实验软测量对象为磷酸生产反应槽,通过数据采集获取磷酸生产反应槽各装置数据,并通过灰色关联度算法来对反应槽中的SO3浓度和P2O5浓度进行关联度分析。

3.3 模型拟合建立

将数据集80%作为训练集,分别对SO3和P2O5浓度作为目标变量,使用GBDT算法对模型进行分类,GBDT算法的基本思想是,通过迭代地生成多个决策树,每个决策树都是一个弱分类器,然后将这些决策树的输出进行加权投票或平均,从而得到最终的预测结果。

3.4 模型评估

本实验采取的三个常用的性能评估指标用来判断模型的优缺点,包括MSE、MAPE和R2。

其中是目标值,是模型的预测值,N是测试集的样本数。MSE和MAPE分别代表了预测值和实际值之间的误差。R2代表预测值解释了变量的方差的比例,是衡量模型预测与真实值拟合程度的重要指标。对于MSE和MAPE,数值越低越好,而对于R方,数值越高越好[2]。

4 结论

集成学习方法的梯度提升决策树,成功建立了磷酸生产过程中关键单元的生产参数质量模型。并对现场真实数据进行了仿真研究,验证了模型的有效性。结果表明,使用梯度提升决策树算法对湿法磷酸生产中的反应槽SO3、P2O5浓度数据拟合效果非常理想,对曲线趋势拟合效果极佳,达到预期目标,建立的模型对反应槽的重点生产参数SO3和P2O5浓度的R方均能达到0.95以上,能够应用指导于实际生产过程,以提高磷化企业的经济效益。

猜你喜欢
湿法决策树磷酸
湿法PU/PVDF共混膜的制备及其性能研究
国际磷酸—铵市场再次走跌
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
上半年磷酸二铵市场波澜不惊
2018年下半年 国内磷酸一铵市场走势简析
磷酸二铵:“钱景”如何
单晶硅各向异性湿法刻蚀的形貌控制
基于决策树的出租车乘客出行目的识别
中蒙医解毒化湿法治疗布鲁氏菌病