陈楠+杨燕婷+田地+段忆翔
摘要记录不同井深岩屑元素含量信息的岩屑录井工作是油气勘探开发的必要过程之一。本研究将西南某钻井现场的岩屑样品分为训练集和测试集,使用自行研制的小型台式激光诱导击穿光谱仪(LIBSTrace)采集各岩屑样品谱图,对8种元素(Si、Al、Ca、K、Mg、Mn、Ti、Fe)优化建立基于支持向量机回归(SVR)的元素定量分析模型。将测试集数据用于算法模型评估验证,结果表明,8种元素预测的平均百分比误差(MPE)分别为Si 568%、Al 722%、Ca 745%、K 976%、Mg 879%、Mn 119%、Ti 114%和Fe 104%, 可以满足录井工作的要求。此外,依据录井工作的流程与需求,对仪器软硬件进行修改,将优化确立的定量模型集成于仪器之中,使之成为录井专用型號。在录井工作现场进行测试,结果表明,算法模型结合仪器可快速完成岩屑元素定量分析,在油气勘探开发领域具有潜在的应用价值。
关键词激光诱导击穿光谱; 岩屑录井; 支持向量机回归; 定量分析
1引 言
岩屑录井工作是油气勘探和开发的基本过程之一,取不同井深的岩屑样品,分析其元素组成及含量,可以为油气开采和评估提供第一手的参考信息,对油气勘探具有重要意义[1,2]。激光诱导击穿光谱(LIBS)技术具有实时在线、多元素同时检测、样品无需复杂前处理等优点。与目前岩屑录井中最常用的X射线荧光分析技术(XRF)相比[3],LIBS技术的检测过程更为快速便捷,没有XRF仪的辐射风险,并可分析XRF不能很好识别的轻元素[4,5]。作为近年来迅速发展的元素分析技术,LIBS技术的特点与油气勘探领域的岩屑录井需求十分契合,具有很好的应用前景和推广潜力。但由于LIBS岩屑样品分析中基体效应、谱线干扰和自吸收效应等问题,采用传统的一元定标法和内定标法对样品的元素进行定量分析通常不能满足实际应用的需要。获得更为精准的元素定量分析结果一直是LIBS技术在油气勘探领域应用推广所面临的挑战之一。近年来,在LIBS数据分析研究中,基于多变量统计学习的偏最小二乘回归(PLSR)、遗传算法(GA)、人工神经网络(ANN)、支持向量机回归(SVR)得到更多运用。Sarkar等[6]将PLSR运用于钢铁样品中Co、Mo、Cr、Ni元素定量分析。邹孝恒等[7]将遗传算法与偏最小二乘法结合(GAPLS)用于土壤元素定量分析,结果表明将遗传算法作为一种谱线选择预处理方法可以改善PLS模型的预测能力。Haddad等[8]通过手持式LIBS仪器采集谱图,运用ANN算法对土壤进行分类和元素含量定量分析,也取得了较好的效果。张莹等[9]在标样较少的情况下,将SVR算法运用于钢铁样品中的Cr和Ni元素定量分析,对比了以峰强度和峰面积作为模型输入变量的模型效果,发现以峰面积作为变量获得的模型效果更好。胡丽等[10]将SVR算法结合LIBS技术运用于水中Pb元素预测,测试集的相对标准偏差和相对误差平均值分别为45%和121%。
目前,LIBS技术已广泛应用于铝合金[11]、钢铁[6, 12]、土壤[7]、水体[10]、食品[13]和煤炭[14]等元素的定量分析,而针对钻井岩屑的元素定量研究还较少。本研究选择在小样本、非线性学习方面具有优势独特的SVR算法[12],建立优化8种元素(Si、Al、Ca、K、Mg、Mn、Ti、Fe)定量模型。针对实际应用需求开发专用型仪器,并用于实践工作,是LIBS技术推广的关键。本研究中的算法模型基于定型的LIBSTrace建立,在完成仪器校正的情况下,可以保证装置参数的一致性,使算法模型可以推广应用于其它同型号仪器。
2实验部分
21仪器
图1是LIBSTrace结构示意图及实物图。仪器整体尺寸为465 mm × 370 mm × 448 mm,净重25 kg, 便于车载运输。采用Nd:YAG激光器,激光波长1064 nm,最大发射频率1 Hz,最大脉冲能量为100 mJ。 光谱检测范围为200~800 nm,分辨率为01 nm。仪器内集成的延时器模块可以为光谱仪提供05~200 μs的外触发延时信号。激光束通过平凸透镜聚焦于岩屑样品表面,产生的等离子体发出包含元素特性的原子发射谱线,经过合适的延时时间后通过光纤探头收集由光谱仪光电转换完成数据采集。样品置于仪器三维样品台上,依据软件提供的参考图像,通过旋转三维平移台改变样品的检测位置。经过优化,本研究采用的延时时间为4 μs,激光能量为100 mJ,激光频率为1 Hz。
22样品及样品制备
18个岩屑样品来自西南某油气录井现场,基本覆盖应用现象的岩性种类,编号为YW1~YW18。将样品送至国家地质实验测试中心,样品玻璃熔片制样法处理后,采用XRF技术进行检测,得到各个样品中Si、Al、Ca、K、Mg、Mn、Ti、Fe元素浓度及岩性信息(表1)。由于PDC钻头广泛应用,钻井取出的岩屑样品十分细碎,甚至呈粉末状,处于较为一致状态。为了使样品处于更为一致的状态,减少或消除环境及基体差异的影响,取15 g各干燥的岩屑样品,置于玛瑙钵中研磨,利用HGY15型压片机在20 MPa压强下保持20 s,压制成直径约30 mm薄厚均匀的块状压片样品,用于谱图采集。考虑到更大的样品量所获得的模型更为可靠,在YW1~YW18中随机选择两种样品,按一定比例混合,经过称量、搅拌、研磨和压片后,另外配制了42个样品,编号为A1~C42,按比例计算的成分含量见表1。表1中样品编号标有号的样品为测试集,其余样品作为训练集。由于每个样品重复采集6次,训练集和测试集分别包含240和120张LIBS谱图。
3结果与讨论
31SVR建模简介
支持向量机(SVM)最早作为一种二分类算法由贝尔实验室的Vapnik等[15]在1995年提出,而后逐步运用于回归分析(SVR)[16]。选取合适的训练集和测试集样本数据,确立输入变量和因变量后,寻找最佳参数的SVR回归模型,可以归纳为以下步骤:endprint
(1)归一化对训练集和测试集数据进行归一化处理。(2)选择核函数依据数据特点选择核函数,在本研究中选用径向基核函数(RBF),其表达式为[17]:
K(xi, xj)=exp(
Symbolm@@ γ||xi-xj||2),式中,xj为核函数中心点在高维空间的位置,xi为输入输入变量;xi-xj绝对值为高维空间两点间的欧式距离。γ为标准高斯方程中的参数。(3)参数优化在训练集内,通过网格搜寻(Grid search)的方式,寻找模型最佳的关键参数惩罚因子C及RBF核的关键参数γ。评估指标为十折交叉验证方式得到的平方相关系数R2和交叉验证均方根误差(RMSECV)。(4)验证将确立的最佳参数建立的模型用于测试集数据预测,并评估其预测效果。评估指标为预测均方根误差(RMSEP)和平均百分比误差(MPE)。
考虑到算法与仪器的集成,算法采用C#语言编写,用开源的LIBSVM算法库(Library)二次开发,更为详尽算法推导过程以及参数寻优过程介绍可以参见文献[17]。
32仪器光谱数据评估和预处理
由典型的岩屑样品LIBS谱图(图2)可见,LIBSTrace获得的岩屑样品光谱具有丰富的元素特征谱线,且具有较好的信噪比。为进一步评估LIBSTrace仪器的重复性和稳定性,以相对标准差(RSD)为指标,对YW3、YW4、YW8、YW16样品分别采集12张谱图,考察对Si I 28816、Fe II 27557、K I 76649谱线的峰强度。由表2可知,通过LIBSTrace获得的数据重复性和稳定性较好。此外,为建立更稳定的模型,对原始谱图各个光谱强度变量减去相应基线值进行基线校正,随后对谱图进行五点平滑滤波降低噪声,33SVR模型输入变量的选择
岩屑样品元素组成丰富,特征谱线丰富,同时也包含了交叠干扰、无用冗余的信息。输入变量的合理选择,是模型预测效果的关键因素。分别以全部光谱数据、特征谱线聚集数据段、部分优选特征谱线峰面积和峰强度分别作为输入变量,建立模型,考察获得的模型效果。
在获取样品LIBS谱图后,通过谱图与NIST原子光谱数据库对比,选择信号强且干扰较少的一些特征谱线,分别以峰强度与峰面积作为变量,建立模型,所选择的特征谱线见表3。考虑到选择部分信号强、干扰少的谱线,不可避免地忽略一些其它相关信息,选择所需分析元素特征谱线富集的8个光谱数据段(238~239 nm、250~253 nm、256~276 nm、278~290 nm、308~310 nm、390~399 nm、402~404 nm、 765~770 nm)作为输入变量,建立模型。此外,将200~800 nm范围内所有波长的信号强度数据作为输入变量,建立了相应对比模型。以Si、Mn、Fe为例,最终各SVR模型输入变量与训练结果见表4,以光譜数据段及全谱所有数据作为变量,虽然包含了更多特征信息,但由于无法很好地排除冗余无用信息干扰,整体效果较差,尤其对于含量较少、特征谱线强度较弱的元素效果尤为明显。以部分优选特征谱线峰面积作为输入变量的效果最好,包含了峰高、峰宽、形状等更全面信息,优于峰强度作为输入变量的模型效果。
34定量分析结果
根据33节的分析,以表3中的特征光谱峰面积为输入变量。依照31节的步骤,以RBF为核函数,交叉验证、网格搜索方式得到最优的参数C和γ后,建立相应模型对测试集中8种元素的含量进行预测。以横坐标为预测值,纵坐标为样品XRF检测值,各元素模型的最佳参数及预测效果见图3,8种元素预测的平均百分比误差(MPE)分别为Si 568%、Al 722%、Ca 745%、K 976%、Mg 879%、Mn 119%、Ti 114%和Fe 104%,满足录井工作的要求。
35应用测试
依据录井工作实际需求,将建立并优化好的各元素SVR定量模型集成于软件中,并对仪器硬件参数、软件功能及操作界面进行修改,将仪器改造成为录井专用型号。在录井现场按照岩屑录井现场工作流程,对岩屑样品研磨压片、采集谱图、预测定量结果,最后仪器软件以报表形式进行存档。整个过程中,研磨压片过程耗时1~2 min,可考虑多样品同时压片,提高效率,而从采集谱图到计算定量结果耗时仅为数秒。测试结果表明,集成了算法的整套仪器系统可以满足岩屑录井工作需求。
4结 论
将自行研制的LIBSTrace仪器结合SVR算法应用于岩屑样品中Si、Al、Ca、K、Mg、Mn、Ti、Fe的LIBS定量分析,对LIBS谱图数据进行基线扣除、平滑滤波及归一化处理后,考察了不同输入变量情况下SVR模型的训练效果。结果表明,以峰面积为输入变量,得到的训练效果最好,各元素的平均百分比误差在568%~119%之间。本研究针对岩屑录井工作的实际应用需求,优化仪器硬件参数,并将研究确立的定量模型集成于仪器中,使算法结合仪器成为专用型仪器,可用于应用现场。此外,本研究中岩屑标样岩性种类、元素种类仍不全面,且对于含量较低的元素预测效果还有提升空间,提高LIBS信号的稳定性、信噪比,建立更大岩屑样本数据库及优化建立基于此数据库的更多元素种类的定量模型将是下一步研究的重点。
References
1ZHANG ShaoHuai Mud Logging Engineering, 2008, 19(4): 26-31
张绍槐 录井工程, 2008, 1(4): 26-31
2TIAN Ye, WANG ZhenNan, HOU HuaMing, ZHAI XiaoWei, CI XingHua, ZHENG RongEr Spectroscopy and Sepctral Anaysis, 2012, 32(8): 2027-2031endprint
田 野, 王振南, 侯华明, 翟晓微, 慈兴华, 郑荣儿 光谱学与光谱分析, 2012, 32(8): 2027-2031
3LI YiChao, LI ChunShan, LIU DeLun Mud Logging Engineering, 2008, 19(1): 1-8
李一超, 李春山, 刘德伦 录井工程, 2008, 19(1): 1-8
4GUO HongLi, LIN QingYu, WANG Shuai, XU Tao, GUO GuangMeng, TIAN Di, DUAN YiXiang Chinese J Anal Chem, 2016, 44(11): 1639-1645
郭红丽, 林庆宇, 王 帅, 许 涛, 郭广盟, 田 地, 段忆翔 分析化学, 2016, 44(11): 1639-1645
5Hughes J D Nature, 2013, 494(7437): 307-308
6Sarkar A, Karki V, Aggarwal S K, Maurya G S, Kumar R, Rai A K, Mao X, Russo R E Spectrochim Acta B, 2015, 108: 8-14
7ZOU XiaoHeng, HAO ZhongJi,YI RongXing, GUO LianBo, SHEN Meng, LI XiangYou, WANG ZeMin, ZENG XiaoYan, LU YongFeng Chinese J Anal Chem, 2015, 43(2): 181-186
邹孝恒, 郝中骐, 易荣兴, 郭连波, 沈 萌, 李祥友, 王泽敏, 曾晓雁, 陆永枫 分析化学, 2015, 43(2): 181-186
8Haddad J E, Bruyere D, Ismael A, Gallou G, Laperche V, Michel K, Canioni L, Bousquet B Spectrochim Acta B, 2014, 97(7): 57-64
9ZHANG Ying, LI Ying, GU YanHong, GUO Hao, LI Na Spectroscopy and Sepctral Anaysis, 2016, 36(7): 2244-2248
张 莹, 李 颖, 谷艳红, 郭 豪, 黎 娜 光譜学与光谱分析, 2016, 36(7): 2244-2248
10HU Li, ZHAO NanJing, LIU WenQing, FANG Li, WANG Yin, MENG DeShuo, YU Yang, GU YanHong, WANG YuanYuan, MA MingJun Acta Optica Sinica, 2015, 36(6): 314-320
胡 丽, 赵南京, 刘文清, 方 丽, 王 寅, 孟德硕, 余 洋, 谷艳红, 王园园, 马明俊 光学学报, 2015, 36(6): 314-320
11Cristoforetti G, Legnaioli S, Palleschi V J Anal At Spectrom, 2006, 21(7): 697-702
12Zhang T, Liang L, Wang K,Tang H,Yang X,Duan Y,Li H J Anal At Spectrom, 2014, 29(12): 2323-2329
13Multari R A, Cremers D A, Dupre J A, Gustafson J E J Agri Food Chem, 2013, 61(36): 8687-8694
14Li X, Wang Z, Fu Y Appl Spectrosc, 2014, 68(9): 955-963
15Vapnik V, Chapelle O Neural Comput, 2000, 12(9): 2013-2036
16Gandhi A B, Joshi J B, Jayaraman V K Chem Eng Sci, 2007, 62(24): 7078-7089
17Chang C C, Lin C J Acm Trans Intel Syst Tec, 2011, 2(3): 1-27
AbstractIt is one of the necessary work in oil and gas exploration and development to record the logging of different depth cuttings In this study, a laser induced breakdown spectrometer (LIBSTrace) developed by our research group was used for the lithology logging in the field of oil and gas exploration and development A total of 60 samples from a drilling site in the Southwest China were divided into training set and test set, and then element quantitative analysis model of eight elements of Si, Al, Ca, K, Mg, Mn, Ti and Fe was established based on support vector machine regression (SVR) The results showed that the mean percentage prediction errors (MPE) predicted by this method were Si 568%, Al 722%, Ca 745%, K 976%, Mg 879%, Mn 119%, Ti 114% and Fe 104%, which met the requirements of logging work In addition, according to the logging process and demand, the instrument hardware and software were modified, and the quantitative model integrated in the instrument was optimized The results showed that the algorithm model combined with the instrument could quickly complete the quantitative analysis of rock debris samples, and exhibited potential application value and broad application prospect in oil and gas exploration and development
KeywordsLaser induced breakdown spectrometer; Cutting; Support vector machine regression; Quantitative analysisendprint