房大志,马伟竣,阎续,毛峥,高杨
(1.中石化重庆页岩气有限公司,重庆 408400;2.长江大学石油工程学院,湖北 武汉 430100;3.湖北省油气钻采工程重点实验室,湖北 武汉 430100)
岩性识别可以帮助确定储层的岩性、孔隙结构和渗透性,为油气勘探和开发提供关键信息,并指导井位选择、钻井设计和油气生产管理。目前传统的岩性识别方法主要为直接法和间接法。直接法是通过直接观察岩心来确定岩性,不同地质工程人员做出的解释不同导致这种方法不够准确。间接法是通过测井曲线来定量研究地质构造的物理特征,采用层析成像技术直接获得并观察井壁图片。测井曲线解释需要对多条测井曲线进行人工识别并标注岩性,工作繁重且耗时长,甚至需要借助交会图等图形技术[1],技术要求高。而层析成像技术又受成像深度等因素限制无法广泛应用。总而言之,传统识别方法精度低、效率慢并且人为因素影响大,因此,需要将储层表征过程自动化,研究出一种高精度自动识别岩性的方法。
近年来,计算机技术逐渐被引入岩性识别工作中,其中机器学习法可实现岩性识别自动化[2],能使岩层识别过程更加高效。目前学者对不同机器学习模型在岩性自动识别方面的应用进行研究。CRACKNELL M J等[3]使用大量地球物理数据,比较5种机器学习在岩性分类中的性能。XIE Y等[4]使用测井数据,采用5种机器学习方法进行岩性识别。LUO H等[5]使用神经网络根据岩性敏感曲线预测陆相页岩油气藏的岩性。AO Y L等[6]提出将2种机器学习算法结合在一起的混合算法,用于识别相似空间中的岩性。GONG K等[7]使用单一分类算法来识别地下复杂沉积环境的岩性。尽管机器学习方法在岩性识别方面已取得诸多成果,但该方法对数据质量要求较高,为进一步提升岩性识别精度,需要对数据进行优化处理。
小波降噪多用于信号处理领域,旨在通过短波实现噪音消除。在油气领域,小波降噪主要应用于测井曲线降噪[8-11]。小波降噪后,测井曲线表现出高保真、高信噪比的特点,有利于油气水层的进一步解释识别。但小波降噪后的测井曲线,在基于机器学习的岩性识别方面应用较少,还需要进一步研究。
本文从信号处理角度出发,对测井曲线进行降噪处理,突出测井曲线有效信号特征,进而建立并训练随机森林、XGBoost、支持向量机等人工智能模型。通过小波降噪与人工智能模型联合使用,提升岩性识别准确率。
针对测井曲线信噪比低的特点,引入小波变换方法对测井数据进行降噪处理,利用不同类型的机器学习方法对降噪后的测井数据进行分类。下文对小波降噪技术,以及随机森林模型、支持向量机模型、XGBoost模型这3种机器学习方法的原理进行概述。
小波变换是傅里叶分析的一般形式。由于傅里叶变换要求信号是平稳信号,且对数据信号中高频特征存在过滤效应,使得傅里叶变换应用受到局限。小波变换将傅里叶变换中的三角函数基转换为有限长度且会衰减的基小波,从而获得时域与频域处理效果的提升。
实际应用中,通过对尺度因子与平移因子离散化,实现小波变换的离散化应用,离散小波变换表达式见式 (1)。
式中,Wf(m,n)为小波系数,m,n为整数;a0为常数,且a0≠1;φ*(t) 为基小波的共轭运算。
信号降噪处理后,需对分解后的信号进行逆变换,离散小波变换的逆变换为
式中,c为常数。
本文采用Daubechies3小波对数据进行降噪。对于Daubechies小波的阶数,虽然高阶小波会过滤低频噪音,但同时也会过滤有效信息[12]。在利用Daubechies3小波将测井数据降噪后,用3种类型的机器学习方法对降噪后的测井数据分类。
随机森林模型是由多棵决策树组成的集成模型,通过构建大量决策树,对所有决策树结果进行投票,进而给出最终结果。随机森林中的每棵决策树并不是对全部样本进行学习,而是在构成决策树前,对原始样本集进行有放回的抽样,形成M份子样本集,进而构建M棵决策树。
XGBoost模型的主要思路是对残差进行学习,求每棵树预测结果之和作为最终预测值[13]。XGBoost采用泰勒级数对损失函数进行近似估计,近似估计见式 (3)。
式中,Lt为损失函数;gi、hi为前(k–1)棵树的残差,在模型训练时为已知项,仅需对第k棵树的残差项f k(xi) 以及第k棵树的复杂度Ω(fk)进行优化。
对于支持向量机模型,无论分类任务,还是回归任务,其核心思路在于将输入数据通过核函数映射至更高维空间,目的是在高维空间对数据进行更精准分类/拟合[14]。在原始输入空间中,通过曲线难以将样本点分类,在核函数映射后,样本点可由单一超平面分隔开来。
由于本研究为分类预测问题,故采用精准度P、召回率R、F1评分来评估模型效果[15]。
式中,Tp为目标岩性预测正确个数;Fp为将非目标岩性误认为目标岩性的个数;FN为目标岩性预测错误的个数;F1为F1评分的值。精准度评估模型预测能力,表示其给出的预测值的可信度;召回率评估模型识别性能,表示可以从总样本集中准确挑出相应岩性的能力;F1评分为精准度与召回率的调和平均,是模型识别能力的综合体现。
建立小波降噪与人工智能岩性识别模型的主要研究流程:①进行数据收集整理工作,主要对随钻测井数据进行收集,并整理汇总至Excel表格中以备程序读取。②对数据进行预处理,并删除缺失数据,进而对数据进行小波降噪处理,提取有效信息。③对降噪后的数据归一化处理,并进行Kendall相关性分析。④数据预处理与分析完成后,将数据导入不同机器学习模型进行训练,并对有无小波降噪的模型表现进行对比。
本文采用某区块2口水平井,15 764条、5种不同岩性的测井数据,其中泥岩数据6 770条,泥质灰岩数据5 074条,灰岩数据1 438条,碳质灰岩数据2 352条,白云质灰岩数据130条。这些数据比例相差较大,因此,模型对于白云质灰岩的识别能力,反映出模型对数据特征的学习效果。该数据集包括补偿中子测井、声波测井、自然伽马测井、密度测井、光电测井、钍含量、铀含量这7种特征。
A井小波降噪前的测井曲线见图1。各测井曲线震荡强烈,数据特征被频繁小幅震荡覆盖,特征不明显,表1为A井各测井参数降噪前的统计值。
表1 A 井测井参数降噪前的统计值
图1 A井小波降噪前的测井曲线图
B井小波降噪前的测井曲线见图2。相较于A井,B井密度曲线围绕均值震荡明显,但总体来说,各个曲线均存在大量小幅震荡,覆盖了数据的原有信息。表2为B井各测井参数降噪前的统计值。
表2 B 井测井参数降噪前的统计值
分别对A、B井进行小波降噪处理, Daubechies3作为基小波,硬阈值设定为0.3。
图3为A井小波降噪后的测井曲线图,相较于降噪前,A井测井曲线降噪后更加平滑。光电测井起始位置至2 000 m深度,降噪效果较好;深度大于2 000 m,由于原始数据振幅增大,降噪后,特征得到突出,但仍有较大振幅。补偿中子测井、声波测井、自然伽马测井、密度测井、铀含量曲线降噪效果良好,钍含量曲线降噪后波动降低。从表3可以看出,相较于降噪前,A井测井数据的均值和方差均降低,说明无效信号去除效果理想。
表3 A 井测井参数降噪后的统计值
图3 A井小波降噪后测井曲线
图4为B井小波降噪后的测井曲线图。相较于小波降噪前,B井测井曲线降噪后更加平滑,光电测井仍存在少量波动,数据特征得到加强。补偿中子测井、声波测井、自然伽马测井、密度测井、铀含量曲线降噪效果良好,钍含量曲线降噪后波动降低,但仍存在少量峰值点。从表4可以看出,相较于降噪前,B井测井数据均值和方差均降低,说明无效信号去除效果理想。
表4 B 井测井参数降噪后的统计值
图4 B井小波降噪后测井曲线
综合A、B井数据,对测井曲线与岩性进行相关性分析。由于本任务为岩性识别任务,目标值为非连续分类数值,故采用Kendall相关系数计算测井参数与岩性分类标签的相关性(见表5)。从表5可以看出,降噪前,所有测井参数与岩性分类标签的显著性均接近于0,具有统计学显著性,证明测井曲线与岩性间存在相关性。补偿中子测井与岩性相关性最高,相关系数达0.47,铀含量与岩性相关系数最低。降噪后,光电测井、铀含量与岩性相关性均有所上升。
表5 测井参数降噪前、 后与岩性分类标签Kendall 相关系数
图5为小波降噪前、后随机森林岩性识别混淆矩阵。如图5所示,小波降噪前,随机森林将24个泥岩样本误判为泥质灰岩,将16个泥质灰岩样本误判为泥岩,导致其小波降噪前的精准度相对较低;从另一角度看,降噪前,对于1 393个泥岩样本,模型可精确挑出其中1 376个样本;对于1 005个泥质灰岩样本,模型可精确挑出其中965个样本。小波降噪后,模型对于泥质灰岩与泥岩的误判问题得到改善,总体精准度、召回率、F1评分得到提升,F1评分达0.989(见表6)。
表6 小波降噪前、 后随机森林模型评分
图5 小波降噪前、后随机森林岩性识别混淆矩阵
图6为小波降噪前、后XGBoost岩性识别混淆矩阵。如图6所示,小波降噪前,XGBoost模型在泥岩与泥质灰岩判断上,泥岩预测结果存在17个误判,泥质灰岩预测结果存在18个误判,其精准度为0.96;对于给定真实样本,其降噪前召回率为0.989。
图6 小波降噪前、后XGBoost岩性识别混淆矩阵
小波降噪后,可以看出,尽管XGBoost仍存在微量误判,但其精准度、召回率、F1评分均得到提升,对于岩性特征捕捉能力更优,F1评分达到0.998(见表7)。
表7 小波降噪前、 后XGBoost 模型评分
图7为小波降噪前、后支持向量机岩性识别混淆矩阵。从图7可以看出,小波降噪前,支持向量机模型在泥质灰岩、泥岩和灰岩的判断上存在较大误差。支持向量机模型给出预测结果中,有102个泥岩预测结果错误,77个泥质灰岩预测结果错误,以及35个灰岩预测结果错误,支持向量机模型精准度为0.891(见表8)。对于存在的真实岩性,55个泥岩、134个泥质灰岩和30个灰岩结果未被筛选出,模型召回率为0.854,总体F1评分为0.869。小波降噪后,支持向量机识别能力得到提升,精准度提升至0.953,召回率提升至0.970,综合评分提升至0.961。
表8 小波降噪前、 后支持向量机模型评分
图7 小波降噪前、后支持向量机岩性识别混淆矩阵
表9为各模型降噪前、后表现汇总。从精准度来看,降噪前,支持向量机模型表现最差,精准度只有0.891,其给出的预测结果可信度最低;XGBoost模型的精准度最高,达0.960。降噪后,各模型的精准度均得到提升,XGBoost模型的精准度接近1,其模型预测值可信度最高;支持向量机模型精准度提升效果最明显,提升6.2%。召回率方面,降噪前,支持向量机模型表现最差,召回率仅0.854,其对真实岩性的分辨能力最弱,其他模型召回率均在0.900以上,XGBoost模型的召回率最高,达0.989。降噪后,各模型召回率均得到提升,XGBoost模型召回率接近1,其模型预测值对真实岩性的辨别能力最强。
表9 小波降噪前、 后模型表现汇总
总体效果来看,降噪前,支持向量机模型综合表现最差,F1评分只有0.869,XGBoost模型的F1评分最高,达0.974。降噪后,各模型综合性能均得到提升,XGBoost模型F1评分接近1。支持向量机模型提升效果最明显,F1评分提升9.2%。
(1)本文基于小波降噪技术,对15 764条数据,5种不同岩性进行处理,数据集包含补偿中子测井、声波测井、自然伽马测井、密度测井、光电测井、钍含量、铀含量这7种特征。在提升测井曲线信噪比的基础上构建5种人工智能模型,实现对岩性的识别。
(2)小波降噪技术可有效提升测井曲线信噪比,突出不同岩性特征,各测试模型精准度、召回率、F1评分均得到提升,其中小波降噪对支持向量机模型的提升最高,精准度、召回率、F1评分分别提升6.2%、11.6%、9.2%。
(3)人工智能模型可有效识别岩性,在小波降噪前,XGBoost模型表现最优,其F1评分达0.974,小波降噪后,XGBoost模型仍表现最优,同时,其模型性能得到提升,F1评分达0.998。