数据挖掘技术优化软件在芳烃抽提装置的运用

2018-07-21 04:51朱以斌
石油化工技术与经济 2018年3期
关键词:模式识别芳烃分数

朱以斌

(中国石化上海石油化工股份有限公司芳烃部,上海200540)

中国石化上海石油化工股份有限公司(以下简称上海石化)1#芳烃抽提装置是根据德国克虏伯公司提供的N-甲酰吗啉(NFM)抽提蒸馏专利技术进行设计的国产化芳烃抽提装置。装置处理加氢汽油420 kt/a,生产纯苯191.1 kt/a、甲苯98 kt/a;副产抽余油58.8 kt/a、C8+馏分72.8 kt/a。乙烯副产物裂解汽油经过加氢后主要含有芳烃和非芳烃两类物质,两者的蒸汽压比较接近,用一般的蒸馏方法难以将它们分离,通过在原料中加入选择性溶剂NFM,被NFM溶解的芳烃不易挥发,进而用蒸馏的方法将芳烃与非芳烃分离。

影响抽余油中苯质量分数的因素有溶剂比、溶剂进料温度、塔压、塔底温度、塔真空度等。抽余油中苯的质量分数是影响芳烃收率的主要因素,由于影响抽余油中苯质量分数的因素多,变量与变量之间有很强的相关性,生产机理比较复杂,很难从复杂数据中提取有价值的信息,制约了收率的提高。装置的工艺机理复杂,难以用机理模型解释,而进行数据分析时,受变量多、且非线性,变量之间存在较强耦合性等因素制约,很难用一般的数理统计方法处理。对于小样本集,运用神经网络等较新兴的机器学习方法训练出来的模型结构,存在过拟合与欠拟合、局部极小点问题。

由思华数据有限公司研发的数据挖掘技术(DMOS)优化软件为工程师提供了一个有效分析生产数据的工具。该软件能处理多变量、非线性、变量之间强关联、数据又被“噪声”污染的复杂数据。DMOS采用数据挖掘技术,综合应用数理统计、模式识别、机器学习、计算机可视化等技术,从大量的数据集合中发现隐藏的、有价值的规律进行优化生产。采用DMOS优化软件可以进行装置操作参数的优化,提供优化操作方案,达到降低抽余油中苯质量分数的目的。

20世纪90年代中期,在统计学习理论基础上发展起来的支持向量机算法在解决小样本、非线性及高维模式识别问题的过程中所取得了核函数应用等方面的突出进展,参照这一优化算法,DMOS优化软件不断改进,以期在处理复杂数据方面明显的优势成为工程化的优化软件。

1 DMOS优化软件在降低抽余油中苯质量分数的运用

从C6、C7馏分中分离芳烃的生产过程涉及到两个塔:苯抽提蒸馏塔(DA-4503塔)和苯产品汽提塔(DA-4504塔)。以抽余油中的苯质量分数作为目标变量(y),选取11个工艺参数作为相关变量(xi):苯馏分进料量(x1)、溶剂比(x2)、进料苯质量分数(x3)、DA-4503塔回流比(x4)、DA-4503塔塔顶压力(x5)、DA-4503塔塔底温度(x6)、DA-4503塔灵敏温度(x7)、苯馏分温度(x8)、溶剂温度(x9)、DA-4504塔塔底温度(x10)、DA-4503塔真空度(x11)。收集上述变量数据,我们得到DMOS软件数据处理报告,并提出优化操作调整建议,实施后取得了较好的效果。

1.1 优化前的生产状况

为了对优化前变量之间的相关性等有所了解,以确定采用数据分析的方法,首先用DMOS优化软件的数理统计模块对生产数据进行统计分析(见表1)。

从表1中可以看出:此生产状况下抽余油中苯质量分数尚不够稳定,平均值为2.3%,标准差为1.1%。抽余油中苯质量分数在2%以上的样本点占全体样本的56%,抽余油中苯质量分数在2%以下的样本点占全体样本的44%,反映出生产状况不是很好,分布离散。优化的目标是降低抽余油中的苯质量分数的均值,并减少标准差,使生产过程更平稳。

表1 优化前抽余油中苯质量分数

为了进一步研究变量之间、以及变量与目标之间的关系,用DMOS软件进行了相关性分析,并列出变量之间的相关因子(见表2)。

表2 相关因子

表2中目标变量y与x5、x8、x10的相关因子分别为:0.662,0.804,-0.708,这些变量与产品质量有着较大的线性相关性。另外,许多变量之间的线性相关系数较大,如:x5与x6、x5与x8、x5与x10、x6与x8、x6与x9、x6与x10、x8与x10。数据中存在强共线性问题,用DMOS优化软件中模式识别方法进行数据分析。

1.2 生产数据的模式识别分析

运用数理统计方法对数据进行分析,可以深层次帮助人们更好地了解生产情况,获得一些有意义的信息。但要进行深入地分析,并获得生产优化的规律,需要用到DMOS的模式识别方法。

模式识别方法的原理可以用高维空间的聚类进行分析和理解。既然优化问题常常是一个多因素问题,就可以将所有相关变量构建一个高维空间,并把收集到的数据在这个高维空间中表达。根据“物以类聚”的道理,优类样本点必然会形成优化区,通过合适的算法,将高维数据空间投影到两维平面(称为特征面),就可以直观地在平面图形上看到样本点的分布和优化区形状,进而研究优化操作的规律。

(1)建训练集

将优化前3个月数据构成训练集,定义抽余油中苯质量分数<2%的为优类样本,抽余油中苯质量分数>2%的为差类样本。训练集中优类样本数33个,占41%;差类样本数41个,占59%。

(2)建模

图1 特征图

从图1中可以看出:优类点明显聚集在一起(有32个样本点,占84%,落在优化区内),形成了一个优化区,将生产操作参数控制在特征平面的优化区内,则有84%的概率使抽余油中苯质量分数小于2%,与此前的生产相比,优类点概率提高40%。

(3)操作参数对目标变量的作用和影响

特征图只表示了样本点在高维数学空间中的分布规律,它可以告诉我们优化规律的存在,但不能直接提示操作的方向。为了与工艺参数联系起来,使用软件的权重图工具分析,通过这个图形工具可以将特征图和工艺参数联系起来,分析各个工艺参数在优化生产中的作用和影响。

权重图在横坐标上标出了10个变量,根据优化软件的研判方法,方块在横坐标上方表示该变量若增加有利于接近目标值(苯质量分数降低),反之,方块在横坐标下方表示该变量若减小有利于接近目标值(苯质量分数降低),并且根据方块的高度判断各个变量对目标影响的力度(见图2)。

图2 权重图

通过对特征图和权重图的分析,对各个主要变量的作用得到以下初步结论:

x10、x6、x8、x5、x4、x9等变量对目标值的影响有较大作用。x1、x2、x7、x11等变量对目标值的影响作用较小,但可作参考。

(4)优化方案

根据实际生产情况,参照装置设计工艺条件,通过运用DMOS软件的特征图和权重图对数据进行分析,运用研判法提出优化操作建议(见表3)。

表3 优化操作建议

注:上下箭头表示该变量继续增大或减少,对优化生产有利,可视情况继续调。

2 应用效果

上述操作建议在随后的生产中进行实施,运行一段时间后,收集优化实施后的数据,并对数据进行统计分析(见表4)。

表4 优化实施后的抽余油中苯质量分数

如表4所示:优化后的生产状况下产品质量稳定,抽余油中苯质量分数的平均值为0.97%,标准差为0.69%。通过与优化前产品质量作比较,抽余油中苯质量分数的平均值由2.3%降至0.97%,降低了1.33个百分点;标准差由1.1%降至0.69%,下降了0.42个百分点。抽余油的设计产能为58.8 kt/a,由此推算,优化后石油苯产量可增产782 t/a。

3 结论

(1)应用DMOS优化软件对芳烃抽提装置抽余油中苯质量分数实施优化后,抽余油中苯质量分数明显下降,增效明显。

(2)运用DMOS优化软件指导优化生产,投入少、见效快、无风险,是数据处理实现优化生产的有效工具之一,具有实用价值。

(3)DMOS优化软件适用于内部机理复杂、影响因素多的生产装置,可以有效地处理复杂的生产数据,对优化生产操作具有指导意义;利用现有的数据资源,通过优化生产达到增效,同样对各类炼油化工装置的优化生产具有推广价值。

猜你喜欢
模式识别芳烃分数
分数的由来
关于重芳烃轻质化与分离的若干思考
无限循环小数化为分数的反思
可怕的分数
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
算分数
第四届亚洲模式识别会议
可拓模式识别算法中经典域的确定方法
轮胎填充油中8种多环芳烃的检测
高芳烃环保橡胶填充油量产