燃料油中有机硫化物在不同色谱柱上的定量结构保留关系(QSRR)的研究

2017-08-12 16:16张晓彤石丽华宋丽娟孙兆林
石油炼制与化工 2017年8期
关键词:描述符燃料油硫化物

张晓彤,石丽华,宋丽娟,孙兆林,孙 挺

(1.辽宁石油化工大学 辽宁省石油化工催化科学与技术重点实验室,辽宁 抚顺 113001; 2.东北大学理学院)



燃料油中有机硫化物在不同色谱柱上的定量结构保留关系(QSRR)的研究

张晓彤1,2,石丽华1,宋丽娟1,孙兆林1,孙 挺2

(1.辽宁石油化工大学 辽宁省石油化工催化科学与技术重点实验室,辽宁 抚顺 113001; 2.东北大学理学院)

硫组分的含量是表征燃料油品质的重要指标。采用遗传算法-多元线性回归法(GA-MLR)、BP神经网络法、列文伯格-马夸尔特人工神经网络算法(L-M ANN)对52种有机硫化物在4种不同极性固定相上的气相色谱保留指数分别进行了定量结构-气相色谱保留关系研究。采用GA-MLR方法选取模型的输入参数,并将筛选得到的描述符:一阶分子连接性指数(1χ)、二阶分子连接性指数(2χ)、电子能(EE)、Y轴偶极(Dy)用于BP神经网络、L-M ANN人工神经网络定量结构保留(QSRR)模型的构建。结果表明:3种方法所建立的定量模型均具有较强的稳定性和良好的预测能力,其相关系数均在0.98以上,但L-M ANN模型的预测结果稍好于其它2种方法;L-M ANN算法首次被应用于燃料油中有机硫化物定量结构-气相色谱保留关系的研究中,效果十分理想,表明L-M ANN算法可以作为一种替代性的建模方法用于物质的定量结构保留关系的研究中。

燃料油 有机硫化物 色谱保留行为 遗传算法-多元线性回归法 BP神经网络 列文伯格-马夸尔特人工神经网络算法 气相色谱-硫化学发光检测法

燃料油是由原油加工过程中的渣油、催化裂化柴油等为原料调合而成,具有黏度适中、雾化性好、热值高、腐蚀性相对较小等优点[1]。在石油加工、交通运输、炼焦以及核燃料加工等行业均具有较广泛的应用。硫组分的含量是表征燃料油品质的重要指标。燃料油中含有多种硫化物,主要为硫醚、硫醇、二硫化物、噻吩类硫化物。美国石油公司对7种典型原油的分析结果表明,硫化物的含量相差较大,但硫化物的种类基本不变。其中,噻吩类硫化物约占原油中硫含量的50%~70%,主要为苯并噻吩(BT)和二苯并噻吩(DBT);其次为硫醚和硫醇类化合物[2]。随着我国进口高硫原油的增加以及环保法规要求日益严格,对燃料油中硫化物的分析已成为国内炼油企业较为关注的问题。气相色谱法是目前较为常用的分析燃料油中硫化物的方法。但由于部分硫化物的气相色谱标准样品价格昂贵、难于购置齐全,成为硫化物分析测试一大难题。对于分析人员而言,硫化物的毒性会造成诸多分析上的不便。色谱保留指数(RI)是研究燃料油中有机硫化物环境行为的重要参数,这些数据如能从实验测定,固然是最有效的,但是对每一种硫化物分子都用实验测定其理化数据,这在人力、物力和财力上都存在一定的局限性。

RI是进行色谱分析的重要参数。而化合物在色谱柱中的保留行为又与其分子结构密切相关。本研究通过对燃料油中有机硫化物的分子结构与其色谱保留时间的相关性进行分析,建立相应的定量结构保留(Quantative Structure Retention Relatinship,QSRR)模型,从而实现一系列有机硫化物的定性预测,并对其在不同极性色谱中的保留行为进行研究。

1 基本原理和方法

遗传算法(GA)又称为基因进化算法,或进化算法,属于启发式搜索算法的一种,通过模拟达尔文生物进化论的自然选择和遗传机制进行复制、交换以及突变等遗传操作,最终使优胜个体繁殖,不良个体淘汰。1975年,Holland在其出版的著作中对遗传算法的原理和方法进行了详细的阐述。其中,遗传算法在解决最优问题时具有如下优点:①可应用于连续优化或离散变量,且不需要衍生信息;②可以实现同时搜索,而不是从几个单点进行[4]。目前遗传算法已被广泛应用于机械智能系统、人工生命科学等领域。本研究将遗传算法与多元线性回归方法相结合,建立燃料油中52种有机硫化物的QSRR模型,并将通过GA-MLR筛选得到描述符作为BP神经网络、列文伯格-马夸尔特人工神经网络(L-M ANN)的输入参数,进行QSRR模型的构建。

人工神经网络是目前较为常用的构建定量校正模型的神经网络[5-7],具有容错能力强、部分神经元受损不会影响整个网络的活动等优点。目前,最为常用的人工神经网络是BP神经网络[8-9],其结构如图1所示。BP神经网络具有结构简单、鲁棒性好、非线性映射能力及容错能力强等优点,但BP神经网络训练时间长、收敛速度慢、容易陷入局部极小点。L-M ANN是一种新型的人工神经网络算法。列文伯格-马夸尔特(Levenberg-Marquardt)法是高斯牛顿法的改进形式,属于最优化算法中的一种[10]。它结合了梯度下降法与高斯牛顿法的优点,收敛速度快、且不易陷入局部极小点。因此,新型的神经网络算法——L-M ANN算法可以有效地解决BP神经网络存在的上述问题。

图1 BP神经网络的典型结构

2 实 验

2.1 数据来源

本研究以52种有机硫化物在4种不同极性的固定相(阿皮松M(Apiezon M)、苯基(50%)甲基聚硅氧烷(OV-17)、曲拉通X305(Triton X305)、聚乙二醇-1000(PEG-1000))上的RI[11]为研究体系。表1为体系中有机硫化物的名称。将表1数据集随机分为2组:训练集(含有36种化合物)用于模型的建立;检测集(含有16种化合物)用于模型的校验。

表1 石油产品中有机硫化物的名称

2.2 模型的建立

采用分子模拟技术构建52种有机硫化物分子微观结构的可视化模型,并选用Materials Studio(MS)软件(美国Accelrys公司产品)的DISCOVER模块中的COMPASS力场优化分子的几何构型,由QSAR模块产生分子描述符。然后在MS软件的模块中完成分成分子描述符的计算。对计算得到的分子结构描述符进行分析与初步筛选:舍去数值为零或常数(或近似为常数)的描述符;删除部分共线性较高的描述符(R>0.95)。采用GA对上述计算得到的描述符进行进一步筛选:通过设置不同的初始GA程序,在程序运行过程中选取最佳种群模型[12]。GA筛选出的描述符用于多元线性回归(MLR)模型、BP模型和L-M ANN模型的建立。最终筛选得到的有效参数如表2所示。

表2 定量结构色谱保留关系模型中应用的分子描述符

3 结果与讨论

3.1 遗传算法-多元线性回归法

多元线性回归是目前QSRR研究中最常用的建模方法之一。多元线性回归方法通过建立化合物分子描述符与RI间的相关性模型,用于预测未知化合物的色谱保留值。其中,分子描述符数据与RI之间的关系如式(1)所示:

y=α0+α1x1+α2x2+…+αnxn

(1)

式中:α0为回归方程截距;αn为各项回归系数;x、y分别代表分子描述符数据及色谱保留值。通过GA-MLR方法筛选得到的描述符分别为拓扑指数和量子化学描述符两类。这在一定程度上减少了使用单一类型描述符进行QSRR建模所带来的不足。通过GA-MLR方法所建的QSRR模型,化合物在4种不同极性固定相上的色谱保留指数的实验值与预测值如图2所示。由图2可见,基于GA-MLR方法燃料油中52种有机硫化物在4种不同固定相上RI的预测值与实验值拟合效果良好,但体系在Apiezon M、OV-17固定相上仍存在几个偏差值较大的点,表明其模型的预测能力稍逊于体系在PEG-1000、Triton X305固定相上所建的QSRR模型。

图2 基于GA-MLR方法的4种固定相上的RI预测值和实验值的关系■—训练集; ▲—检验集。图3、图4同

3.2 BP神经网络

采用MATLAB建立燃料油中52种有机硫化物在4种不同固定相上的色谱保留指数与结构描述符之间的BP神经网络模型。将GA-MLR方法筛选得到的描述符作为BP神经网络的输入参数。其训练精度和学习效率分别设置为0.000 1和0.1;转换函数为Sigmoid-Logsig。经过多次神经网络训练,最终确立的BP神经网络结构分别为2×4×1(Apiezon M),2×5×1(OV-17),3×3×1(PEG-1000),3×5×1(Triton X305)。将BP神经网络法预测得到的色谱保留指数与其实验值进行拟合分析,结果如图3所示。通过对比可知,体系在Triton X305色谱柱中的预测效果稍好于体系在其它3项色谱柱中所建的QSRR模型。

3.3 L-M人工神经网络

通过L-M ANN方法所建的QSRR模型,化合物在4种不同极性固定相上的RI的实验值与预测值如图4所示。

图3 基于BP方法的4种固定相上的RI预测值和实验值的关系

图4 基于L-M ANN方法的4种固定相上的RI预测值和实验值的关系

模型的预测性能及有效性通过复相关系数(R)、均方根误差(RMSE)进行评价。一个好的QSRR模型必定具有较高的R值和较低的RMSE值。表3为在4种固定相上用3种模型得到的详细统计学参数。由表3可见,L-M ANN神经网络的R值最高,RMSE值最低,即预测效果最为理想。

表3 不同极性固定相上GA-MLR、BP和L-M ANN模型的预测能力

采用L-M ANN方法所建立的QSRR模型可用于预测燃料油中有机硫化物的RI,根据已知分子的结构信息对未知燃料油品中的硫醚、硫醇以及噻吩类硫化物的RI进行估算以及定性分析,同时为研究气相色谱中不同极性固定相上的分子保留行为提供一定的技术参考。

3.4 化合物色谱保留行为关系分析

物质在色谱柱中的保留行为主要与化合物分子与固定相的相互作用有关,两者间作用力越大,保留时间越长[13]。两者的相互作用也受固定相极性的影响:当固定相为非极性时,物质在固定相中的色谱保留主要与色散力有关;当固定相为极性时,其色谱保留主要受色散力和诱导力两者的影响。其中,色散力主要与空间位阻、分子的大小及分支情况有关,而诱导力主要受分子偶极矩的影响。1χ提供了分子尺寸和分支情况的信息;2χ包含了分子极性方面的信息[14]。由此可知,通过GA-MLR方法最终筛选得到的描述符(1χ、2χ、EE、Dy)不仅具有明确的物理意义,而且包含了体系分子的大小、极性以及电性等多方面信息。因此,上述描述符能很好地表达燃料油中有机硫化物体系在不同极性固定相中的保留与分子结构的关系。由表3可见,有机硫化物体系在4种不同极性固定相上的GA-MLR模型的R在0.981~0.999区间内。这进一步说明通过GA-MLR方法筛选得到的4个分子描述符1χ,2χ,EE,Dy,能较好地解释燃料油中有机硫化物体系的保留行为。

4 结 论

通过GA-MLR方法筛选得到的描述符包含了分子大小、极性、电性等方面的信息,物理意义明确,能较好地解释燃料油中有机硫化物体系在不同极性固定相上的色谱保留行为。采用上述描述符建立的QSRR模型相关性好、稳定性强,可用于预测燃料油中有机硫化物的RI,以及其色谱保留行为的分析,对色谱分离条件的优化有很大的指导意义。

新型的L-M ANN算法结合了梯度下降法与高斯牛顿法的优点,收敛速度快、不易陷入局部极小点,可将其作为一种替代性的建模方法广泛应用于物质的定量结构保留关系的研究中。

[1] 宋红艳,何静,李春喜.燃料油深度脱硫技术及进展[J].石油化工,2015,44(3):279-285

[2] Martin G,Barroeta N.Gas-phase thermolysis of sulphur compounds.Part I.Di-t-butyl disulphide[J].J Chem Soc, Perkin Trans,1976(12):1421-1424

[3] Wang Ting,Wang Heng,Xie Haofei.Networked synchronization control method by the combination of RBF neural network and genetic algorithm[C]The 2nd International Conference on Computer and Automation Engineering(ICCAE),2010

[4] 陈慧琴.基于人工神经网络的遗传算法理论及应用[D].武汉:武汉理工大学,2003

[5] Xu Huiying,Wang Wei,Xu Xiaolu,et al.A QSRR study on the chromatographic retention indices of hydroxylated polychlorinated bipheny[J].Chinese J Struct Che,2013,32(4):578-584

[6] Kaliszan R.Chromatography in studies of quantitative structure-activity relationships[J].Journal of Chromatography A,1981,220(1):71-84

[7] 董一芬.Levenberg-Marquardt神经网络算法研究[J].商场现代化,2009(3):385

[8] 王国清,杜志国,张利军,等.应用BP神经网络预测石脑油热裂解产物收率[J].石油化工,2007,36(7):699-704

[9] 许禄.化学计量学方法[M].北京:科学出版社,1995:287-289

[10]D′Archivio A A,Incani A,Ruggieri F.Retention modelling of polychlorinated biphenyls in comprehensive two-dimensional gas chromatography[J].Anal Bioanal Chem,2011,399(2):903-913

[11]李浩春.分析化学手册(第五分册)[M].北京:化学工业出版社,1999:469-482

[12]Riahi S,Pourbasheer E,Ganjali M R,et al.Investigation of different linear and nonlinear chemometric methods for modeling of retention index of essential oil components:Concerns to support vector machine[J].Journal of Hazardous Materials,2009,166(2):853-859

[13]Gassiot M M,Firpo P G.Relationships between gas chromatographic retention index and molecular structure[J].Journal of Chromatography A,1980,187(1):1-19

[14]堵锡华.PCDDs气相色谱相对保留因子的QSRR研究[J].华中科技大学学报,2006,34(10):111-112

QSRR MODELS TO PREDICT RETENTION INDICES OF ORGANIC SULFUR COMPOUNDS IN FUEL OIL ON DIFFERENT GC COLUMNS

Zhang Xiaotong1,2, Shi Lihua1, Song Lijuan1, Sun Zhaolin1, Sun Ting2

(1.LiaoningProvincialKeyLaboratoryofPetrochemicalCatalyticScienceandTechnology,LiaoningShihuaUniversity,Fushun,Liaoning113001; 2.CollegeofScience,NortheasternUniversity)

Sulfur content is indispensable to evaluate the quality of fuel oil.Quantitative Structure Retention Relationship(QSRR)studies were performed for predicting the gas chromatographic retention times of 52 organic sulfur compounds in fuel oil on four different GC columns.The input parameters were selected by Genetic algorithm and multiple linear regression(GA-MLR)method.The final selected parameters including molecular connectivity indexes1χand2χ,electron energy(EE)and Y dipole(Dy)were then used as inputs of Error-back Propagation Network(BP)and levenberg-marquardt artificial neural network(L-M ANN).The three QSRR models all have strong stability and good predictive ability,all of the correlation coefficients based on above methods are higher than 0.98.The predictive ability of L-M ANN model is superior to other two models and indicates that L-M ANN can be used as an alternative modeling tool for QSRR studies.

fuel oil; organic sulfur compound; GC retention behavior; GA-MLR; BP neural network; L-M ANN; GC-SCD

2017-02-20; 修改稿收到日期: 2017-04-26。

张晓彤,副教授,硕士生导师,主要研究方向包括现代分析测试技术、化学信息学、化学化工行业软件开发,先后在国内外学术刊物及会议上公开发表论文70余篇,申报专利5项。

宋丽娟,E-mail:lsong56@263.net。

国家自然科学基金资助项目(21376114);辽宁省高等学校科学研究一般项目(L2014158)。

猜你喜欢
描述符燃料油硫化物
基于结构信息的异源遥感图像局部特征描述符研究
基于AKAZE的BOLD掩码描述符的匹配算法的研究
Linux单线程并发服务器探索
利用CNN的无人机遥感影像特征描述符学习
亚洲燃料油周三收市报告
大洋多金属硫化物自然氧化行为研究
连续流动法测定沉积物中的酸挥发性硫化物
Li2S-P2S5及Li2S-SiS2基硫化物固体电解质研究进展
钨酸锰催化氧化脱除模拟油硫化物