基于联立方程的汽油精制过程中辛烷值损失预测模型的构建

2021-11-25 09:42刘嫣
科学与生活 2021年16期
关键词:数据挖掘

摘 要:首先采用K-Means聚类算法对变量进行降维,然后通过斯皮尔曼相关性检验筛选出建立预测模型的关键性主要变量。因操作变量之间具有高度相互强耦联的关系,故选择通过建立联立方程模型来模拟影响辛烷值损失各变量之间的多向因果关系,并对联立方程进行拟合优度检验。最后根据联立方程可得影响辛烷值损失的关键变量,汽油精制过程中可通过改变关键变量来提高汽油产品的经济效益。

关键词:数据挖掘;损失预测模型;联立方程

一、研究目的与意义

近年来汽车尾气污染问题日益严重,越来越受到人们的重视,各国先后制定了相应的汽车尾气排放法规并且越来越严格。排放标准的加强,促进了汽车排放控制技术的进步和燃料油质量的提高。

辛烷值是评价汽油品质的一个重要指标用于衡量汽油抗爆性能的好坏,如果燃料辛烷值偏低则发动机容易发生爆震影响其正常工作。汽油的辛烷值与汽油的组分有关,如果汽油中高辛烷值的组分含量越多则汽油的辛烷值越高。

某石化企业的催化裂化汽油精制脱硫装置运行4年,积累了大量历史数据,其汽油产品辛烷值损失平均为1.37个单位,而同类装置的最小损失值只有0.6个单位。故本文以该石化企业数据为依托,通过建立辛烷值损失预测模型来提高汽油产品的经济效益。

二、建立预测模型

根据数据可知,影响辛烷值损失量共涉及367个变量,其中包括7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质、2个产品性质变量以及另外354个操作变量。

首先对变量进行降维处理。利用K-Means聚类算法对变量聚类,进行划分降维,得出聚类中心;然后根据欧式距离计算公式选出距离聚类中心点最近的变量作为其代表性变量;最后对所得代表性变量做斯皮尔曼相关性检验,在一定的显著性水平下筛选出最具代表性的变量,继而将其作为建立预测模型的关键性主要变量。

因操作变量(控制变量)之间具有高度非线性和相互强耦联的关系,各变量之间并不是单一的因果关系,多数变量之间互为因果关系。故本文将建立联立方程模型来模拟影响辛烷值损失各变量之间的多向因果关系,建立辛烷值损失预测模型,而达到更加准确的验证假设。

其中,L为最终的辛烷值损失量;S0为原料硫含量;T为原料饱和烃含量;S1为汽油硫含量;R为汽油中辛烷值;X1,...X18为18个操作变量。

上述结构式模型中,经模型可识别性检验后可得,第一、二、三个方程都是恰好可识别的,即模型系统是恰好可识别的。

由于模型系统是恰好可识别的,故本文使用恰好识别方程的估计方法进行估计,即选择三阶段最小二乘法对联立方程组进行检验估计。此方法的优点在于不仅考虑内生变量的潜在空間相关性,同时也顾及各单方程变量之间的相关性,从而使得出的结果更加可靠严谨。结合Matlab软件对其进行求估计可得三个方程判定系数(R-Square)都较为接近1,说明回归方程拟合度良好。

三、模型结果及分析

综合以上分析,可得影响辛烷值损失量各因素之间的因果关系:原料饱和烃量和操作变量直接影响汽油内硫含量、汽油内辛烷值以及辛烷值的损失量;原料中的硫含量会对汽油中硫含量及辛烷值产生影响;汽油内硫含量又会直接影响辛烷值的损失量和汽油内的辛烷值量,而汽油内的辛烷值直接关系到最终辛烷值的损失量。

参考文献:

[1]田勇震,杨忠义,马健波.降低汽油加氢装置辛烷值损失的优化措[J].石化技术与应用,2019,37(5):345-348.DOI:10.3969/j.issn.1009-0045.2019.05.017.

[2]黄宏林,李烨,谷晓琳.优化操作条件降低汽油加氢装置辛烷值损失[J].石油化工应用,2015,34(12):116-118.DOI:10.3969/j.issn.1673-5285.2015.12.032.

作者简介:刘嫣(1997年),女,汉,河北。硕士,信息管理与信息系统,天津工业大学,天津,300387。

猜你喜欢
数据挖掘
近十年国内教育数据挖掘领域的应用技术分析
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘技术在物流企业中的应用
数据挖掘过程模型及创新应用
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
电子政务中基于云计算模式的数据挖掘研究
数据挖掘创新应用
数据挖掘的系统构成与发展趋势