基于拉曼光谱与PLS的钻井液混合物定量分析

2022-03-09 02:55王国良韩伟航李存磊
辽宁石油化工大学学报 2022年1期
关键词:钻井液特征提取偏差

王国良,韩伟航,李存磊

基于拉曼光谱与PLS的钻井液混合物定量分析

王国良1,韩伟航1,李存磊2

(1.辽宁石油化工大学 信息与控制工程学院,辽宁 抚顺 113001; 2.辽宁石油化工大学 石油天然气工程学院,辽宁 抚顺 113001)

随钻测井技术相比传统测井能够获得更真实的地层数据信息,因而更适用于实际应用。但是,在随钻检测的过程中,需要迅速、精确地判断混合物中是否含有原油,即实现混合物的定性分析。激光拉曼光谱分析技术作为当前发展较为完整的分子光谱分析技术,被广泛应用到多种物质分析的领域中。针对原油钻井液混合物的特点,基于激光拉曼光谱分析技术,提出一种以偏最小二乘分析法为基础的定性分析算法,同时对已知获得的拉曼光谱进行平滑去噪、基线校正、归一化等预处理操作,并在此基础上完成以奇异值分解为主要方法的特征提取处理,进而实现对混合物定性分析的目的,并在一定的精度内完成定量计算。

拉曼光谱分析技术; 基线校正; 特征提取; 偏最小二乘分析法

现代光谱分析技术是一种具有综合性质的分析技术,也是一种依靠分析物质的光谱进而实现鉴别待测物质的类别、化学成分等的方法[1]。拉曼光谱分析作为现代光谱分析技术的一种,凭借检测范围广、检测手段灵活、谱峰特征突出等优点被广泛应用到物质的成分检测中。目前,在石油勘探过程中,由于随钻测井技术可以实时、快速分析地层中的油气资源而被迅速推广,也使拉曼检测的方式由地面检测转为地下检测。如何在地下复杂的环境条件下实时、快速地对混合待测物质进行成分的分析与鉴定成为研究热点[2⁃3]。为了更好地处理这个问题,在实验室配制与现场环境大体一致的钻井液,模拟了地下的检测环境,并选择辽河原油配置不同质量分数的钻井液混合物,通过激光拉曼设备得到一系列拉曼光谱谱图,并实现对待测混合物的定性分析和定量计算。

1 算法和原理

对不同质量分数的原油钻井液经过激光拉曼仪的照射,经由设备的转换,得到一系列的拉曼光谱。当前获得的拉曼光谱中存在荧光背景和检测噪声等干扰信息,依靠设备本身不能完全消除[4],需要对得到的拉曼光谱进行平滑去噪、基线校正、归一化预处理及特征提取操作。基于上述操作得到的数据,通过偏最小二乘分析法(PLS)完成定性分析,进一步实现定量计算。

1.1 拉曼光谱的预处理

拉曼光谱分析法是用于分子结构研究的一种分析方法,是在拉曼散射效应的基础上,对不同入射频率的散射光谱分析得到分子振动、转动方面的信息,进而用于物质定性分析的方法。

1.1.1平滑去噪 信号平滑方法建立在光谱中携带的噪声为零均值的随机噪声的基础上,通过对原始信号均值求解来提高信噪比,是目前噪声消除常见的主要方法之一[5]。本文使用目前较为通用的多项式移动平均值滤波法(Savitzky⁃Golay)算法对光谱信号进行平滑去噪[6]。

对质量分数不同的原油钻井液的60次实验结果进行平滑滤波处理,结果如图1所示。

1.1.2基线校正 拉曼光谱中显示的拉曼谱峰所对应的数据信息是数据分析的主要基础,但是由于基线漂移的存在,会导致对拉曼光谱的信息处理有误,因此在下一步的分析处理前,需要对光谱进行“基线校正”处理,尽可能减少基线漂移对光谱信息的影响。当前可以用于基线校正的方法很多,考虑本文所用数据的实际情况,选择基于多项式拟合的校正方法。该方法对光谱数据的极小值点,通过最小二乘的方式进行拟合处理,进而得到光谱的基线,最终实现校正处理。

多项式拟合的次数与最终基线的校正效果有关,次数设定越高,可以拟合出复杂度更高的基线,使基线的校正效果越好,但是同时也增加程序的运行时间。因此,可以依据基线漂移的情况确定合适的参量。综合考虑,初步设定的参量为5~8[9]。

基于上述多项式拟合原理,对预处理后的拉曼光谱进行了基线校正处理。由于拟合阶数对校正结果存在一定影响,为了对比校正效果,选择两种阶数的多项式分别对数据进行四阶、七阶多项式拟合处理,结果如图2所示。

图2 四阶、七阶多项式拟合基线校正

从图2可以看出,七阶拟合后的效果更为明显,原始光谱的特征峰高度下移,图线整体更为平滑。在仿真部分对两种阶数校正后的数据进行了定性分析。从精确度的角度来看,选择七阶多项式拟合的方法对光谱进行基线校正的效果更为理想。

1.1.3归一化处理 拉曼光谱的信号强度不仅与物质的质量分数相关,还与激光强度、积分时间和聚焦束尺寸有关,因此在光谱预处理部分添加归一化处理[10]。

在拉曼光谱的分析中,通过等比缩放的方法将光谱的原始强度重新规定在某一个标准的范围。在原始数据中选择一个常量作为参考标量,原始数据除以参考标量,即为校正原始光谱强度的方法[11]。根据待测物质的数据信息,选择一种适用的参照值,然后按照式(7)完成归一化处理。

本文选用拉曼光谱谱峰的强度作为参照值,对拉曼光谱进行归一化处理。

1.2 特征提取

特征提取可以认为是在高维度的特征空间内,利用线性或者非线性非映射的方法,在对应的低维度空间内完成映射,获得相对较为容易处理的数据,防止高维数据在处理过程中产生维数灾难和特征冗杂等一系列问题。待测物质的特征峰的个数、强度是采用光谱分析技术进行定性分析与定量计算的主要衡量依据。若特征峰少,在拉曼光谱中所占比例较小,则会使待测物质质量分数变化在光谱信号中很难体现,导致特征提取定性与定量处理难度加大。只考虑特征峰的方式,即不考虑待测物质的性质直接保留特征峰所在的波数区间,完全剔除其他波数范围的方法,会由于实验条件的改变等存在不确定因素,进而导致分析结果的不准确。

如果采取直接截取特征峰所在波数范围的方法,由于受实验条件、待测物质本身的特点等因素的影响,会使截取的波数范围涵盖的信息并不能完全反映待测物质的原始信息,进而使定性分析与定量计算存在一定的误差,降低准确率[12]。

1.2.1数据分类 对同一质量分数的原油钻井液进行60次实验,对比同一质量分数的原油钻井液在全波长下的数据及同一波数下的数据,其中5次测量结果(见表1)。

从表1可以看出,同一波数下不同次实验得到的结果并不完全相同,甚至彼此之间的差距较大。对每种原油钻井液在同一个波数下的60组数据进行初步的分类处理,结果表明实验结果可以控制在一定范围内,即不同次实验数据的偏差不超过一个数量级。

表1 全波长拉曼光谱测试其中5次测量结果

对应有:

依据奇异值分解定理的原理,对光谱进行特征提取处理,减少当前的变量个数。当前每种原油钻井液每次实验对应的光谱数据包含1 961个自变量,自变量个数过多,对定性分析处理的影响较大,所以在保证原始数据完整性的情况下,应尽量减少自变量个数,方便后续算法进行。

对原油质量分数为0的钻井液分类后的实验数据进行奇异值分解处理,原始数据为10组,每组数据由1 961个自变量组成,经由奇异值分解处理后,查看奇异值矩阵,发现前10个奇异值已经可以代表整体的数据信息,因而将原数据集合用前10个奇异值对应的数据替代,可极大地方便后续的运算处理,顺序排列的前10组奇异值数据如表2所示。

1.3 定性分析与定量计算

对预处理及特征提取后的光谱数据进行定性分析与定量计算。定性分析是判断“有无”,即对待测混合物中是否含有原油进行判断;定量计算是在定性分析的基础上,对原油钻井液的质量分数进行计算预测。

目前用于混合物定性分析的算法众多,且各不相同,结合当前待测物质的拉曼光谱数据的特点,并考虑算法的运行时间等因素,采用PLS定性分析待测物质。

表2 顺序排列的前10组奇异值数据

2 实验与仿真

配制原油质量分数为0、5%、25%、45%、65%、85%、95%、100%共计8种钻井液的混合物,为了更加接近辽河油田的实际现场情况,选择聚磺体系钻井液配比为:质量分数4.0%膨润土+质量分数0.1%PAC聚阴离子纤维素降滤失剂+质量分数2.0%SMP⁃2磺化酚醛树脂+质量分数2.0%SPNH褐煤树脂+质量分数0.4%FCLS铁铬木质素磺酸盐稀释剂[15]。模拟实验温度为60 ℃时,辽河原油密度约为0.9 g/cm3;钻井液密度为1.8 g/cm3。含油含岩屑钻井液成分如表4所示。

表4 含油含岩屑钻井液成分

含油含岩屑钻井液配置步骤为:

(1)取不同体积的水基钻井液,分别装入6个大号玻璃瓶中;

(2)取原油,水浴加热至80 ℃进行降黏;

(3)取一定质量的岩屑,将其研磨至小颗粒状;

(4)向每个玻璃瓶内分别加入表4所示含量的原油、岩屑和钻井液充分震荡,混合后静置一段时间,待溶液中原油温度由80 ℃降至常温后,再次充分震荡;

(5)将6个玻璃瓶放入水浴箱中,加热至60 ℃;

(6)对纯原油、纯钻井液、纯岩屑进行激光拉曼光谱测定,确定仪器所用的功率、照射时间和照射次数,防止出现超过其熔点的情况;

(7)水浴加热至60 ℃后,持续30 min,取出含油钻井液对其充分震荡,拿入暗室对其进行激光拉曼光谱测定,对同一个样品取不同的点,照射60次,每进行一次照射对其进行充分震荡;

(8)重复步骤5-7。

经上述实验操作后,得到原油质量分数分别为0、5%、25%、45%、65%、85%、95%、100%的8种钻井液,对每种原油钻井液可测得60组数据,共测得480组的拉曼光谱数据。

为了验证对所测的原油钻井液混合物是否可以实现定性分析和定量计算,采用MATLAB仿真软件对数据进行处理。同时,在运算仿真之前,对所获得的480组拉曼光谱数据进行预处理和特征提取处理,依据键值进行分类操作及奇异值的分解。

2.1 实验结果

首先对数据不做处理,选择480组中的一部分数据进行模型的建立,直接用于PLS算法仿真,PLS建模效果及验证效果如图3所示。

图3 PLS建模效果及验证效果

从图3可以看出,当拉曼光谱数据不做任何处理,直接用PLS算法进行仿真时,得到的数学模型并不足以准确地反映原油质量分数,甚至初步的定性分析也不能完成;将数学模型用于验证,去判断未参与建模的数据组对应的原油质量分数,仿真数据与实际数据之间的偏差较大,不能反映待测物质的真实质量分数。

对拉曼光谱数据进行第一次平滑去噪、基线校正、归一化和特征提取处理,在基线校正部分采用多项式拟合的校正方法,运算过程中采用四阶和七阶两种多项式对数据进行仿真处理。建模数据同一质量分数选择5组数据,共计40组数据;验证部分同一质量分数选择3组数据,共计24组数据。四阶拟合的建模效果和验证效果如图4所示。

图4 四阶拟合的建模效果和验证效果

从图4可以看出,四阶拟合后建模及验证效果相较图3更接近实际数据,大约有50%的数据可以达到仿真数据与实际数据几乎重合,其余的偏差相对较为明显。基于该数学模型,对未知数据进行验证。对同一质量分数的钻井液选择3组数据,共计24组数据。结果表明,原油质量分数为0的钻井液的仿真数据与实际数据相比误差较小,在0.05以内,可认为基于该数学模型能达到定性分析的目的。继续对比其余7组原油钻井液的仿真数据与实际数据。结果表明,随着原油质量分数的升高,仿真数据与实际数据的偏差有所改变,但是30%以上的仿真数据贴近实际数据。换言之,四阶拟合后定量计算的偏差相较“无处理”数据有所提升,但是偏差仍然存在。

对每种原油钻井液选择8组建模数据,共计64组数据;验证部分每种原油钻井液选择2组数据,共计16组数据。七阶拟合的建模效果和验证效果如图5所示。

图5 七阶拟合的建模效果和验证效果

从图5可以看出,原油质量分数为0钻井液的仿真数据与实际数据偏差较小,即可以达到定性分析的目的,原油质量分数为5%、65%的钻井液的验证效果相对较好,仿真数据与实际数据之间偏差较小,但是其他原油钻井液的仿真数据与实际数据存在一定的偏差,不能达到定量计算的要求。

对上述结果进一步分析,重新对数据进行规划。将数据分成两组,即“高原油质量分数”数据组和“低原油质量分数”数据组。其中,将原油质量分数为65%、85%、95%、100%的数据划分到高质量分数数据组;原油质量分数为0、5%、25%、45%的数据归到低质量分数数据组。对两组数据分别进行同等的预处理和特征提取的操作,建模数据每种原油钻井液选择12组数据,共计36组数据;验证数据每种原油钻井液选择3组数据,共计9组数据。低质量分数数据组七阶拟合的数据建模效果和验证效果如图6所示。

图6 低质量分数数据组七阶拟合的数据建模效果和验证效果

从图6可以看出,原油质量分数为0的仿真数据与实际数据之间的偏差可以忽略不计,质量分数为5%和25%的数据的建模效果的偏差在0.05~0.10,基于模型对应的验证效果的仿真数据的最大偏差在0.10以内,整体偏差小于0.05。

基于上述仿真结果加大质量分数差距,选择原油质量分数为45%、85%和100%的数据进行仿真,建模数据每种原油钻井液选择12组数据,共计36组数据;验证数据每种原油钻井液选择3组数据,共计9组数据。原油质量分数为45%、85%和100%的数据组建模效果和验证效果如图7所示。从图7可以看出,建模图像中的仿真数据在实际数据附近,验证图中实际数据与仿真数据之间的偏差大部分在0.10~0.20。

图7 原油质量分数45%、85%和100%的数据组建模效果和验证效果

对高质量分数数据组进行七阶多项式仿真处理。用于建模的数据,每种原油钻井液选择8组数据,共计32组数据;验证部分每种原油钻井液选择2组数据,共计8组数据。高质量分数数据组七阶拟合的数据建模效果和验证效果如图8所示。从图8可以看出,建模部分的仿真数据与实际数据近乎重合偏差可以忽略,从验证效果来看,原油质量分数为85%、95%、100%的仿真数据与实际数据的偏差小于0.02;原油质量分数为65%的仿真数据与实际数据的偏差大于0.10。验证效果表明,该数学模型可以较准确地反映当前数据的情况,并可以得出较为准确的仿真结果。

图8 高质量分数数据组七阶拟合的数据建模效果和验证效果

2.2 仿真结果

激光拉曼光谱数据经由预处理、特征提取后,再由PLS算法得到建模数据对应的数学模型,通过该数学模型去判断验证数据组中数据的仿真结果,对比实际数据去判断数学模型是否适用于当前数据。通过对比8种原有钻井液数据的全部建模、验证效果和“低质量分数”数据组、“高质量分数”数据组的建模、验证效果,发现质量分数间隔缩小后,得到的建模效果更为理想,且验证部分的仿真数据与实际数据偏差可以精确到0.05以内。

3 结 论

针对原油钻井液存在颜色过深且内部信息复杂、定性分析与定量计算效果相对较差等问题,对原油钻井液混合物的拉曼光谱的原始数据进行平滑去噪、基线校正、归一化预处理,以及奇异值特征提取处理,完成原油钻井液的定性分析与定量计算。最后经由偏最小二乘分析法对处理后的数据进行数学模型的建立,对8种原油钻井液的数据进行低质量分数与高质量分数数据组的分开处理,并完成对应数据组的质量分数的预测。原油质量分数为85%、95%、100%的仿真数据与实际数据的偏差可以精确到0.02以内。此项研究不仅可以依据拉曼光谱对原油钻井液混合物的数据进行定性分析,初步判断混合物中是否含有原油,依据建立的数学模型还可以对原油质量分数进行计算预测,将定量计算的精度控制在一定的范围内,这对随钻检测技术用于分析井下实时数据具有一定且可行的实际意义。

[1] Raman C V, Krishnan K S. A new type of secondary radiation[J]. Nature, 1928, 12: 501⁃502.

[2] 董学锋. 拉曼光谱传递与定量分析技术研究及其工业应用[D]. 杭州:浙江大学, 2013.

[3] 褶小立. 化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社, 2011.

[4] 李津蓉. 拉曼光谱的数学解析及其在定量分析中的应用[D].杭州:浙江大学, 2013.

[5] 陈珊. 拉曼光谱背景扣除算法及其应用研究[D].长沙:中南大学,2011.

[6] 李秀霞,孝芳,王珍,等.水体中孔雀石绿液相色谱⁃荧光法检测前处理方法的改进研究[J].渤海大学学报(自然科学版),2019,40(3):212⁃216.

[7] Baek S J, Park A, Kim J, et al. A simple background elimination method for Raman spectra[J]. Chemometrics & Intelligent Laboratory Systems, 2009, 98(1):24⁃30.

[8] 保罗·戈培林. 化学计量学实用指南[M].2版. 吴海龙,康超译.北京:科学出版社, 2012.

[9] 郭平,卢汉清,杜为民.对拉曼光谱信号分类的模式识别[J].电子与信息学报, 2002, 24(6):789⁃793.

[10] 林艺玲. 成品汽油关键成分的拉曼光谱分析[D].杭州:浙江大学,2011.

[11] 淡图南. 基于光谱分析的燃油组分检测技术研究[D].杭州:浙江大学,2011.

[12] Schulze G, Jirasek A, Yu M, et al. Investigation of selected baseline removal techniques as candidates for automated implementation[J]. Applied Spectroscopy, 2005,59(5):545⁃574.

[13] 莫冰,李和平,陈娟,等.表面增强拉曼光谱(SERS)及其在定量测量中的研究进展[J]. 光谱散射学报, 2013,25(3): 219⁃ 234.

[14] 黄承伟.仪器间的光谱模型传递及谱图标准化[D].杭州:浙江大学,2012.

[15]Vickers T J, Wambles R E, Mann C K. Curve fitting and linearity: Data processing in raman spectroscopy[J]. Applied Spectroscopy, 2001, 55(4):389⁃393.

Quantitative Analysis of Drilling Fluid Mixtures Based on Raman Spectroscopy and PLS

Wang Guoliang1, Han Weihang1, Li Cunlei2

(1.School of Information and Control Engineering,Liaoning Petrochemical University,Fushun Liaoning 113001,China;2.College of Petroleum Engineering,Liaoning Petrochemical University,Fushun Liaoning 113001,China)

Logging while drilling (LWD) technology can obtain more real formation data information than traditional logging, so it is more suitable for practical applications. What follows is how to quickly and accurately determine whether the mixture contains crude oil in the process of testing while drilling, that is, to achieve qualitative analysis of the mixture. Laser Raman spectroscopy analysis technology, as a relatively complete molecular spectroscopy technology currently developed, has been widely used in the field of many kinds of material analysis. In this paper, according to the characteristics of crude oil drilling fluid mixture, based on laser Raman spectrum analysis technology, a qualitative analysis algorithm based on partial least squares analysis was proposed. At the same time, the known Raman spectra are smoothed and denoised, baseline correction based on the fitting polynomial method, normalization and other pre⁃processing operations. On this basis, the feature extraction process with singular value decomposition as the main method was completed, thus attained the aim of qualitative analysis of mixture, and completed the quantitative calculation within a certain precision.

Raman spectroscopy analysis technology; Baseline correction; Feature extraction; Partial least squares analysis

TE626;TP13

A

10.3969/j.issn.1672⁃6952.2022.01.014

1672⁃6952(2022)01⁃0078⁃08

2020⁃10⁃04

2020⁃11⁃23

国家自然科学基金项目(61473140);辽宁省兴辽人才支持计划项目(XLYC1807030);辽宁省高校创新人才计划项目(LR2017029);辽宁省教育厅科研基金项目(L2016024)。

王国良(1981⁃),男,博士,教授,从事Markov系统与广义系统方面的研究;E⁃mail:glwang@lnpu.edu.cn。

http://journal.lnpu.edu.cn

(编辑 陈 雷)

猜你喜欢
钻井液特征提取偏差
同步定位与建图特征提取和匹配算法研究
纳米材料在水基钻井液中的应用
50种认知性偏差
分析钻井液设计对钻井工程和地质录井的影响
加固轰炸机
有机盐钻井液在阳108H1-1井的研究与应用
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
真相
基于曲率局部二值模式的深度图像手势特征提取
新型油基钻井液体系的研究