基于回归分析与机器学习的乙醇偶合制C4烯烃模型

2022-03-26 06:30王岩立霍海棋谭荣昊
新型工业化 2022年1期
关键词:负载量烯烃收率

王岩立,霍海棋,谭荣昊

(1.华南理工大学 电子商务系,广东 广州 510006;2.华南理工大学 化学与化工学院,广东 广州 510641;3.华南理工大学 电力学院,广东 广州 510641)

0 引言

C4烯烃广泛应用于化工产品及医药的生产,乙醇是生产制备C4烯烃的原料。在制备过程中,不同的催化剂组合(即:Co负载量、Co/SiO2和HAP装料比、乙醇浓度的组合)与温度对C4烯烃的选择性和C4烯烃收率将产生影响,效率越高的催化剂和温度组合对生产有着巨大的帮助,因此通过对不同的催化剂组合进行分析,探索乙醇催化偶合制备C4烯烃的条件具有非常重要的意义和价值。

1 利用回归分析求解问题一

1.1 对数据进行分析

Cross-validation方法,假设有N组数据 其中。本文以Q作为拟合阶数,每次将第j组数据删除,同时对另外N-1组数据做Q阶多项式拟合,得到拟合方程

,将被删除的数据的自变量代入至拟合方程中,得到一个估算值 ,然后重复该过程直至将N组数据都删除过一次,并计算残差平方和 :

并求出最小的残差平方和:

本文设置多项式最大拟合阶数为6阶,所以Q=1,2,...5,6。

对各催化剂组合下不同温度下乙醇转化率和C4烯烃的选择性的散点图,做Cross-validation的分析,求解后得到最优的多项式拟合阶数。在得到这两组最佳拟合阶数后,分别对各组数据进行对应的多项式拟合分析,并得到一系列的拟合曲线和表达式[1-2]。

该拟合曲线的表达式为:

由拟合曲线可以推断,随着温度增加,C4烯烃的选择性在前段是增加的,直到温度到达一个临界值,C4烯烃的选择性下降,可能是温度增加促进了副反应的生成导致C4烯烃的选择性降低。

A1组的温度-乙醇转化率的拟合曲线图,如图1所示:

该拟合曲线的表达式为:

1.2 对350℃时给定催化剂组合在不同反应时间的反应结果分析

本文采用Cross-validation的方法以时间为x轴,乙醇转化率和C4烯烃选择性为y轴作出散点图并进行残差分析,得到最佳拟合阶数。

表1 最佳拟合阶数汇总

时间-乙醇转化率按照二阶来进行多项式拟合,如图2所示:

该拟合曲线的表达式为:

分析该曲线可知,在催化剂组合不变的情况下,短期内,随着反应时间的逐渐增加,乙醇转化率逐渐降低,可以推断是反应时间过长会有副反应发生,抑制了主要反应的进行,导致乙醇转化率降低。

同样的,对时间-C4烯烃选择性进行一阶多项式拟合分析也就是线性拟合分析。该拟合曲线的表达式为:

在催化剂组合不变的情况下,随着反应时间的增加,虽然乙醇转化率降低,副反应增加,但是C4烯烃所占总产物的量仍在增加。

2 利用单变量分析求解问题二

由于有4个变量,直接对4个变量进行四元拟合分析会出现许多的交叉项,导致拟合方程过于复杂,所以本文将这4个变量分别利用控制变量的方法,进行单变量分析。

2.1 对Co负载量的单变量分析

控制另外3个变量不变,只改变Co负载量,根据实验数据,可以得出Co负载量和乙醇转化率及C4烯烃选择性的关系。

2.2 对Co/SiO2和HAP装料比的单变量分析

控制另外3个变量不变,改变Co/SiO2和HAP装料比,根据实验数据得出Co/SiO2和HAP装料比与乙醇转化率及C4烯烃选择性的关系。

以300℃的情况为例,可以看出有一部分的数据的离散程度比较大,因此可得出Co/SiO2和HAP装料比对乙醇转化率和C4烯烃选择性的影响差异比较大。但可以明显得出,当Co/SiO2和HAP装料比为2.0时,乙醇转化率和C4烯烃选择性显著下降;当Co/SiO2和HAP装料比为0.5时,虽然有部分数据显示其乙醇转化率和C4烯烃选择性比1.0时高,但是乙醇转化率和C4烯烃选择性最高的仍然是Co/SiO2和HAP装料比为1.0的条件,因此Co/SiO2和HAP装料比的最优选择为1.0。

2.3 对乙醇浓度的单变量分析

控制另外3个变量不变,改变乙醇浓度,根据实验数据得出乙醇浓度与乙醇转化率及C4烯烃选择性的关系。

当乙醇浓度为0.3时,乙醇转化率最高,但是C4烯烃选择性较低,可以推断出此时虽然乙醇反应得比较彻底,但是有比较多的副反应产生,降低了C4烯烃的选择性。而随着乙醇浓度增高至0.9时,乙醇转化率有些许下降,但是C4烯烃的选择性显著提高,推断是乙醇浓度的增加抑制了部分副反应的产生,牺牲些许转化率可以显著提高C4烯烃的选择性,可以大大提高该反应的经济效益。

当乙醇浓度再度提高至1.68时,乙醇转化率继续降低,同时C4烯烃的选择性也降低,可能是乙醇浓度的提高促进了另外一部分得益于该变化的副反应的进行,这同样是不利于该反应。而乙醇浓度为2.1时,乙醇转化率继续降低,而C4烯烃选择性基本保持不变。

分析可知,乙醇浓度在0.9左右为最佳值,既提高了原料的利用,又减少了副反应的生产,提高了C4烯烃选择性。

2.4 对温度的单变量分析

当催化剂组成不变时,可以明显得出在250℃~400℃之间,乙醇转化率与C4烯烃选择性均随着温度的上升而增加,但在450℃时,两者的数值下降,出现这种情况有可能是在400℃以上的高温下,乙醇被分解导致乙醇转化率降低;温度升高虽然有利于主反应的反应速率,但副反应的反应速率也随着上升,导致C4烯烃选择性下降。

3 利用BP神经网络和粒子群算法求解问题三

3.1 BP神经网络的结构

数学上已经证明,一个典型的三层网络能逼近任意的非终性函数。输入训练样本,经计算,得到网络输出值,将其与期望输出值比较,如果误差不满足要求,反向传播误差以修正各层的权重和阈值,再次正向传播,如此反复直到误差满足要求。隐含层和输入层的传递函数均为双曲正切函数。

表达式为:

其中:x为输入信号。

定义误差函数为均方误差(mean square error),表达式为:

由于MSE是权值矢量的二次函数,因此本研究利用最速梯度下降准则调节权值,使MSE达到最小[3]。

3.2 预测C4 烯烃收率的BP网络建立

C4烯烃收率大小的预测是在部分因素基本不变的情况下,确定催化剂组合和温度与C4烯烃收率之间的非线性映射关系:式中rate为C4烯烃收率,xc为温度,xi为不同组成的催化剂。通过实验数据建立这一非线性映射的关系模型是很困难的,而神经网络可以将C4烯烃收率与不同组成的催化剂、温度之间的复杂关系通过网络模型来确定。

经过处理,总共得到114组样本,本研究将其分为三部分:任意取出85组作为训练集,2组作为监督集,剩余27组和从85组训练样本中任意取27组样本(共54组)作为测试集。

由于传递函数tan-sigmoid函数为非线性函数,将(-∞,+∞)的输入压缩到[-1,1]的输出,从而加快网络的训练速度。

归一化处理的方法为:

SoP、Smax、Smin、SP分别代表样本数据的原始值、样本中的极大值、极小值和预处理后的值[4]。

3.3 网络参数的确定

本研究以训练集和监督集的平均相对误差(%)均达到极小为标准来确定网络的各个参数。

平均相对误差的计算公式如下:

其中 和MRE分别代表网络输出值、实际值、样本个数和平均相对误差。

3.4 优化效果分析

利用PSO算法进行全局搜索,确定达到最大C4烯烃收率时的催化剂和温度的最优组合。算法优化结果如下:Co/SiO2质量:200;Co负载量:2.53;HAP质量:200;乙醇浓度:1.23;温度:400℃。对应的最高收率为51.43%[5]。

为了显示优化方法的可靠性,我们使用PSO重复运行3次,分别得到了50.58%、50.23%%和49.97%的收率,提高了实验的收率,从而证明BP神经网络混合PSO方法是有效的。

类似地,增加温度不能大于350℃的条件后,我们得到五种工艺条件为温度:350℃;Co/SiO2质量:200mg;Co负载量:3.74 wt%;HAP质量:200mg;乙醇浓度:1.01ml/min,最高收率达到 47.28%。

4 关于问题四的探究

4.1 问题分析

我们已经对不同催化剂组合和温度对乙烯转化率和C4烯烃选择性的影响有了初步的判断:当温度为450℃时,乙醇转化率和C4烯烃选择性的数值相较400℃的数值均有所下降,推测400-450℃中存在一个最佳温度,因此要增加一组实验确定最优温度的大小。

在350℃,乙醇浓度为1.68的条件下,需要补充一组实验,修改CO负载量的值为3.5,目的是与第9组进行对照,以确定最优的CO负载量。

在400℃,CO负载量为1.0的条件下,选取乙醇浓度为1.2再补充一组实验,目的与第15组进行对照,以确定最优的乙醇浓度。

在上述前三次实验得出的结果的基础上,增加一个实验,实验条件为将温度设置为最佳温度,CO负载量选取最佳数值,乙醇浓度为0.9,目的是与第15组与第一次补充实验进行对照,以确定温度和CO负载量为最佳数值时能否获得更优的实验数据。

最后一个补充实验的实验条件为将温度设置为最佳温度,CO负载量为最佳数值,乙醇浓度为上一个补充实验得出的最佳浓度,目的是与第4组补充实验进行对照,以确定在温度、CO负载量和乙醇浓度同时为最佳数值时能否获得更优的实验数值。

4.2 实验设计

经过分析,可以得出表2。

表2 实验设计方案

5 结论

本文基于回归分析、Cross-validation、BP神经网络、粒子群算法系统分析了催化剂组合和温度对C4烯烃选择性和乙醇转化率的各种影响。

在问题一中,本文使用了回归模型和Cross-Validation的方法,可以比较直观地得到自变量与因变量的关系,并可以有效地减少过拟合。在问题二中,本文创造性地将催化剂的各变量转换成新的变量,并对变量进行单独分析,得到每个自变量与因变量的关系。在问题三中,我们采用的BP神经网络和粒子群算法得到了较优的结果,并证明BP神经网络混合PSO方法是有效的。

猜你喜欢
负载量烯烃收率
FCC汽油加氢装置工艺过程烃类组成变化规律研究
基于乙醇偶合制备C4烯烃的研究
焦磷酸亚锡合成收率影响因素探讨
不同负载量对‘马瑟兰’枝条贮藏营养的影响
新型3-【4-(苯氧基)苯基】-5-【2-甲硫基-4-(三氟甲基)苯基】-1,2,4-噁二唑化合物的合成研究
上海地区不同果实负载量对信浓乐葡萄品质影响研究
榛子主干横截面积和产量关系的研究
提高半合成紫杉醇得率研究
不同负载量对夏黑葡萄果实品质的影响