张丽梅
(山西工商学院 计算机信息工程学院 山西省太原市 030000)
C4烯烃在医药行业与化学产品的生产中应用较广,现阶段,为减少化工产业对环境的不良影响,化学物质在制备过程中对原材料的绿色、清洁性也有严格的要求。在C4烯烃的制备过程中,C4烯烃的选择性和乙醇转化率会受到催化剂组合(即:Co负载量、Co/SiO2和 HAP装料比、乙醇浓度的组合)与温度的影响。因此合理设计催化剂的组合,对研究乙醇催化偶合制备C4烯烃的工艺条件具有十分重要的意义和价值。
本文中模型的建立是基于Python实现,Python是由Guido van Rossum提出,于1991年正式发布。与其他的编程语言相比,Python编程有如下优点:
(1)与其他编程语言具有较好的互通性,极大地提高了开发效率;
(2)具有丰富的第三方工具包。如:Numpy、Matplotlib、Scipy等科学计算包,它们使得Python的功能并不低于其他常用的计算软件如Matlab等;
(3)代码具有较好的规范性。Python语言中大量的使用了英文,且使用强制空白符来区分代码块之间关系,使得Python代码具有更强的美观和易读性;
(4)有效的内存管理;
(5)强大的异常处理功能,几乎所有的错误在Python中均会提示异常。
人工神经网络并不需要事先确定输入与输出之间的映射关系,仅需通过自身的训练,学习某种规则,在给定输入值时,输出最接近期望值的结果,是一种智能的信息处理方法,它的核心为算法。而BP(back propagation)神经网络是一种多层前馈神经网络,它的训练是按照误差逆向传播算法,是目前神经网络中应用最广泛的模型之一。
本文是数据来源为2021年全国大学生数学建模大赛B题,构建基于BP神经网络的乙醇转化率、C4烯烃的选择性及C4烯烃收率(C4烯烃收率=乙醇转化率*C4烯烃的选择性)建模。
BP(back propagation)神经网络于1986年由Rumelhart和McClelland为首的科学家提出,是一种具有三层或者三层以上神经元的神经网络,按照误差逆向传播算法训练的多层前馈神经网络,各层神经元的权值通过BP学习算法不断加以修正,进而达到此网络的输出样本与实际输出的误差值所需要的精度。
BP神经网络的一般过程包括:
(1)输入层、输出层、中间层(隐层)的层数以及各层网络神经元数的确定,输入层、输出层一般根据实际问题的进行设置。中间层的神经元个数对模型的建立尤为重要,通常需根据训练情况进行确定,如果神经元(即节点数)过少会出现适应性的缺失,因此会有欠拟合现象发生。相反,若神经元数过多,各节点的训练信息量不够充足,会导致过度拟合现象。这样即使在学习数据中有足够的信息,但由于中间层的节点数过多,会相应地增加训练学习的时间,很难达到预期的效果。
隐层(中间层)节点的个数的确定一般依据公式:
其中:n表示隐层神经元数,n表示输入神经元数;n表示输出神经元数;h的取值一般为1~10之间的整数。
(2)选取各层的激励函数及训练函数。
本文中BP神经网络模型建立时选取learngdm作为学习函数,traingdx作为训练算法,各层的激励函数选用Sigmoid,训练次数、学习速率、误差精度等根据具体问题确定,其他采用默认值。
首先,对2021年全国大学生数学建模B题附件中给出的数据进行说明,数据中有:
(1)21组不同催化剂组合(分别是:Co的负载量,即Co与SiO2的重量之比;HAP即翔基磷灰石,它是一种催化剂载体;乙醇浓度);
(2)温度,即反应温度,在不同催化剂组合给出的温度值有:250、275、300、325、350、400、450共7种情况;
(3)乙醇转化率(%)即单位时间内乙醇的单程转化率,共有114个数值,其值为100%*(乙醇进气量-乙醇剩余量)/乙醇进气量;
(4)C4烯烃选择性(%),共有114个值;
(5)其他值:乙烯选择性(%)、乙醛选择性(%)、碳数为4-12脂肪醇选择性(%)、甲基苯甲醛和甲基苯甲醇选择性(%)、其他生成物的选择性(%)。
数据如表1所示。
表1:数据表
2.2.1 影响因素与乙醇转化率、C4烯烃选择性的关系
对2021年全国大学生数学建模B题附件1中提供的数据进行分析。
(1)在同一催化剂组合中,分析温度与乙醇转化率、C4烯烃的选择性之间的关系:采用Excel进行线性回归模型建立的方法,并依据统计学分析中,用最小二乘法对进行参数估计时,决定系数R平方的值为回归平方和与总离差平方和之比,它代表回归平方和可解释总离差平方和的比例,这个数值越大代表模型精确度越高,回归效果更加显著。从数值上看,R平方的取值(0-1区域间)越接近于1,表示回归拟合的效果越精确,超过0.8的模型表示拟合优度较高。对温度与乙醇转化率、温度与C4烯烃的选择性分别进行线性拟合后,得到的R平方均接近于0.9,说明所得模型拟合具有很强的说服力,因此可得到变量之间的关系:温度与乙醇的转化率基本呈正比关系、温度与C4烯烃的选择性也基本呈正比关系。
(2)在不同催化剂组合,在其他条件相同的条件下,乙醇转化率、C4烯烃的选择性也不相同。
由上面的分析可知,催化剂组合及温度直接影响乙醇转化率(%)、C4烯烃选择性(%)的输出结果,因此将Co与Sio2重量(mg)、Co与Sio2重量比(wt%)、HAP-乙醇浓度、温度这四种元素作为输入,乙醇转化率(%)、C4烯烃选择性(%)作为输出,进行BP神经网络建模,通过实验对隐层层数、神经元个数进行训练,最终选用隐层的层数选为1,隐层神经元的个数选为6下的均方误差(mse)最小。
乙醇转化率、C4烯烃选择性的BP神经网络流如图1所示。
图1:乙醇转化率、C4烯烃选择性的BP神经网络流
建模过程网络参数选择:
(1)最大迭代次数:max_epochs = 10000
(2)学习率:learn_rate = 0.035
(3)结束条件:mse_final = 6.5e-4
(4)输入数:input_number = 4
(5)输出数:output_number = 2
(6)隐层单元数:hidden_unit_number = 6
从图2、图3中可以看出实测值(用*表示)与预测值(用●表示),乙醇转化率与C4烯烃选择性的实测值和模拟预测值的曲线的趋势基本一致。抽取相关数据进行验证,两者的实测值和模型预测值的误差在可接受的范围内,可说明,采用BP神经网络算法所建模型达到了对乙醇转化率、C4烯烃选择性的预测。
图2:乙醇转化率实测值与模型预测值对比图
图3:C4烯烃选择性实测值与模型预测值对比图
2.2.2 影响因素与C4烯烃收率的关系
催化剂的组合(Co负载量、Co/SiO2和HAP装料比、乙醇浓度的组合)与温度直接影响C4烯烃的收率(C4烯烃收率=乙醇转化率*C4烯烃的选择性),因此应考虑如何选择催化剂组合与温度,使得在相同实验条件下C4烯烃收率尽可能高。首先用EXCEL对附件中给出的乙醇的转化率与C4烯烃的选择性做了一个乘积处理,得到C4烯烃收率的具体值,如表2所示。
表2:乘积处理
根据分析,将催化剂组合中的Co与Sio2重量(mg)、Co与Sio2重量比(wt%)、HAP-乙醇浓度以及温度这四种元素作为输入,乙醇转化率(%)和C4烯烃选择性(%)的乘积即(C4烯烃收率)作为输出。进行BP神经网络建模,通过实验对隐层层数、神经元个数进行训练,最终选用隐层的层数选为1,隐层神经元的个数选为6下的均方误差(mse)最小。
C4烯烃收率的BP神经网络流如图4所示。
图4:C4烯烃收率的BP神经网络流
建模过程网络参数选择:
(1)最大迭代次数:max_epochs = 10000
(2)学习率:learn_rate= 0.035
(3)结束条件:mse_final= 6.5e-4
(4)输入数:input_number= 4
(5)输出数:output_number= 1
(6)隐层单元数:hidden_unit_number = 6
从图5中可以看出实测值(用*表示)与预测值(用●表示),曲线的波折程度大致一致,抽取相关数据进行验证,C4烯烃收率的实测值和模型预测值之间的误差在可接受的范围内,因此可说明,采用BP神经网络算法所建模型达到了对C4烯烃收率的预测。
图5:C4烯烃收率实测值与模型预测值对比图
本文是对题意进行正确、清楚地分析后,建立了科学的、符合实际的计算模型,为C4烯烃的高效率制备提供了条件,主要优点有:
(1)在模型建立时,对2021年全国大学生数学建模B题附件中的众多表格进行了处理,分析了许多变量之间的潜在关系;
(2)模型的建立有坚实可靠的数学基础,很多数学理论已经证明BP神经网络算法在计算和推论中具有广泛的应用性;
(3)模型易于实现,能使C4烯烃收率发挥最大效能;
(4)建立的BP神经网络模型可与C4烯烃制备紧密联系,且对制备过程中出现的问题进行求解,因此该模型具有较好的通用性与推广性。
该模型亦有不足之处,可在今后继续改进:
(1)数据的来源是全国大学生数学B题建模附件中所提供,数据量不足够大;
(2)规划模型时考虑的约束条件较少,模型处理未考虑实际中出现的其他问题,可在今后通过增加实验完成。例如:对附件2中给出的数据通过分析可知,在同一温度,相同催化剂组合在不同时间内,C4烯烃收率也不相同:时间越长,C4烯烃收率越小,主要原因是催化剂(酶)随着时间的增长,消耗越大,活性越低,效果会越小,而在模型建立时,并未将时间计入影响因素;另外,催化剂的活性与温度关系密切,而在模型建立时,数据中没有中间温度点的相关测试数据(如:300-350、400-450之间的温度点等)。
本文给出了基于BP神经网络的C4烯烃收率、乙醇转化率及C4烯烃选择性的拟合模型,为如何选取合适的催化剂组合及温度来设计反应的最优性能提供了参考,可对不同催化剂组合及温度下的C4烯烃制备做出预测,且做出了模拟值和实测值的折线对比图,两者之间曲线走势基本一致,抽取相关数据进行验证,实测值和模型预测值的误差在可接受的范围内,可说明BP神经网络算法在制备C4烯烃的相关实践过程具有较好的适用性,对解决此类问题的有很好的应用价值。