基于LSTM循环神经网络的横波预测方法

2021-11-25 06:22周恒武中原张欣张春雷马乔雨
断块油气田 2021年6期
关键词:横波测井储层

周恒 ,武中原 ,张欣 ,张春雷 ,马乔雨

(1.中国地质大学(北京)数理学院,北京 100083;2.北京师范大学统计学院,北京 100875;3.北京中地润德石油科技有限公司,北京 100083)

0 引言

碳酸盐岩储层已探明石油、天然气储量分别占全国石油、天然气储量的8%和28%,是重要的油气勘探目标[1-4]。但该类储层具有岩性多样、非均质性强、孔隙结构复杂的特点,给测井解释带来很大难度[5-7]。横波速度是进行碳酸盐岩储层评价、流体识别和叠前正反演必需的基础资料,将测井参数与纵横波速度资料相结合,可以有效提升储层物理参数预测效果和地震振幅解释效果[8-11]。不同于常规测井,横波速度通常需要通过偶极子声波得到。由于测试价格昂贵、测试结果较差、横波测井解释难度较高等诸多问题,实际生产中往往缺失横波速度资料,因此,开展碳酸盐岩储层的横波预测具有重要的意义[12-13]。

目前常用的横波预测方法主要有3种——经验公式法[14-17]、理论模型法[18-20]、机器学习法[21-22]。 经验公式法往往只适用于某一地区,缺乏泛用性,理论模型法参数众多且预测效果较差,因此近年来机器学习法得到迅速发展,在地质领域逐渐成为研究热点。传统的机器学习法,如决策树、支持向量机、多元线性回归等,是根据特定的学习准则构建测井参数与横波之间的映射关系,但忽略了连续变量的序列特征。循环神经网络(RNN)能够在一定程度上解决序列数据的前后关联问题,但由于梯度爆炸和梯度消失问题而效果不佳[23]。长短时记忆神经网络(LSTM)[24]是一种改进的 RNN,在有效提取序列特征的同时,引入门控单元,实现长短时信息的有效记忆,能够控制长短时信息的遗忘与更新,表达不同测井参数的尺度承载能力和横波的沉积序列特征,挖掘测井参数与横波之间的深层联系。

以鄂尔多斯盆地苏里格气田苏东地区碳酸盐岩储层为例,开展了基于LSTM方法的横波预测方法研究。首先,通过测井资料与测井参数敏感性分析,选择与横波时差相关的16种测井参数;然后,构建基于LSTM的横波时差预测模型,并与多种机器学习方法进行对比,分析LSTM在横波预测中的具体表现。

1 方法原理

1.1 RNN

RNN是一种针对序列数据特征提取的神经网络。传统的BP神经网络没有考虑数据的时序性,因而在处理序列特征时效果较差。RNN引入自循环单元后,不但能够充分考虑当前信息,还能有效学习隐变量传递的历史信息,从而具有一定的“记忆”功能。RNN在每次模型预测时不仅考虑了当前输入信息,也考虑了之前所有的历史信息。RNN的链式结构与序列数据建模契合,使得RNN在序列数据分析中具有较大优势,成为解决序列数据最自然的结构。

为避免复杂的参数学习,RNN在所有时间维度上实现参数共享,在简化网络模型的同时,能够学习任意长度的序列数据。相较于BP神经网络,RNN每个神经元具有 2 个输入信息(xt,ht-1)和 2 个输出信息(ot,ht)。xt为t时刻的输入信息,ht-1为t-1时刻输出(即t时刻输入)的隐状态信息,ht为t时刻输出的隐状态信息,ot为t时刻的输出信息。RNN循环单元的计算公式为

式中:Wih为输入门与隐状态间的权重;bih为输入门与隐状态间的偏置;Whh为隐状态间的权重;bhh为隐状态间的偏置;Wio为输入门与输出门间的权重;bio为输入门与输出门间的偏置。

Wih和Whh对序列长度较为敏感。当序列较长时,循环单元很难依靠隐状态记忆长时序的信息,在反向传播时就会导致RNN梯度爆炸或者梯度消失,使得RNN无法有效学习序列特征。

1.2 LSTM

LSTM 由 Hochreiter等[24]于 1997 年提出,与 RNN对历史信息的简单叠加不同,LSTM通过3个门层对当前信息和历史信息进行选择;同时,LSTM引入细胞状态传递长序列信息,能够综合局部信息和序列信息,实现长短时记忆;LSTM具有类似RNN的循环网络结构,且增加了控制器操作信息的丢弃和增加,从而实现遗忘和记忆功能。门控制器是一种选择信息的结构,包含一个sigmoid函数和一个点乘操作。其中,sigmoid函数将输入值约束在[0,1],从而控制信息的学习承担,0代表完全舍弃,1代表完全学习。

LSTM的基本循环单元(见图1)主要包括3个门层(输入门、输出门、遗忘门)和1个状态更新层。输入门控制信息的输入,遗忘门控制历史信息的保留,输出门控制信息的输出,状态更新层控制状态信息的更新。各门层计算公式见表1。表中:ft为t时刻遗忘门的输出;σ为sigmoid函数;it为t时刻输入门的输出;为t时刻 tanh层的输出;Ct,Ct-1分别为 t,t-1时刻的细胞状态;W 为权重;b 为偏置;下标 f,i,c,o分别表示遗忘门、输入门、状态更新层、输出门。

图1 LSTM循环单元结构

表1 LSTM各门层计算公式

LSTM在进行网络学习时,首先通过遗忘门和输入门对当前的输入信息和前一时刻的隐状态进行学习,去除细胞状态中需要遗忘的历史序列信息,选出有用的当前序列信息加入到细胞状态,然后在输出门根据更新后的细胞状态提供长期序列信息,结合当前输入信息和前一时刻隐状态实现隐状态更新。在每次迭代中,LSTM能够根据当前输入信息更新细胞状态和隐状态,保持序列信息的有效学习。

2 实例分析

2.1 数据背景

研究区位于内蒙古自治区乌审旗境内,南邻陕西省靖边县,东邻陕西省横山县。区域构造位于鄂尔多斯盆地伊陕斜坡北部,下古生界的马家沟组五段碳酸盐岩为其重要的含气储层,岩性主要包括白云岩、泥质白云岩、石灰质白云岩、泥质石灰岩、白云质石灰岩和石灰岩,孔隙类型主要有粒间孔、溶孔、膏模孔和少量微裂缝,孔隙流体为天然气和水。

选取与横波时差(SAC)相关的16个测井参数:纵波时差(AC)、补偿中子(CNL)、密度(DEN)、自然伽马(GR)、自然电位(SP)、光电吸收截面指数(PE)、深侧向电阻率(RLLD)、浅侧向电阻率(RLLS)、阵列感应电阻率(RT10,RT20,RT30,RT60,RT90)、钾的质量分数(w(K))、钍的质量浓度(ρ(TH))、铀的质量浓度(ρ(U))。参数特征如图2所示。

图2 研究区测井参数特征

传统岩石物理模型表明,横波预测过程受岩石矿物、孔隙结构、孔隙流体等因素的影响,因此,不同测井参数对横波速度都有一定指示作用。从所选测井参数与横波时差之间的相关性可以看出,不同测井参数之间具有相关性,且都与横波时差存在一定的联系。不同岩石的孔隙流体、孔隙结构、矿物特征均不同,导致测井参数差异较大,最终表现为横波时差的不同,因此,综合这些测井参数,能够有效表达储层的横波特征。

2.2 模型构建

传统的横波预测方法往往针对某一特定储层,泛化性较差;而深度学习法是一种数据驱动方法,能够自适应地提取相关特征,构建测井参数与横波时差之间的深层次映射,具有较强的泛化性。图3为本研究提出的基于LSTM方法的横波预测流程。构建横波预测模型时,首先需要数据标准化,这样能够有效避免量纲对模型学习的影响,并显著提升模型训练速度(常用的标准化方法是均值方差标准化,转化后的数据服从标准正态分布);然后需要对测井参数进行转换,得到包含局部时序特征的测井参数;最后构建LSTM模型进行网络学习,和多种机器学习方法对比,评估LSTM模型的表现。由于横波预测是回归问题,LSTM使用均方根误差(RMSE)和决定系数(R2)对模型预测结果进行评估,同时使用Adam优化器加速网络学习,为防止网络过拟合,还引入了dropout提升模型的泛化能力。

图3 基于LSTM的横波预测流程

2.3 结果分析

数据总样本数为2 904个,横波预测模型建立过程中随机选取50%的样本集作为训练集,其余50%作为验证集,时间步长为8,dropout设置为0.25,网络使用2个LSTM层和3个全连接层,激活函数为RELU,学习率为0.001。为验证LSTM的稳健性和泛化能力,选择贝叶斯回归(Bayes)、BP 神经网络(BP)、K 近邻回归(KNN)、决策树(DT)、线性回归(LR)、支持向量机(SVM)等机器学习方法,以及传统岩石物理模型方法中的Xu-Payne模型一起进行对比。根据研究区地质背景分析和碳酸盐岩储层特征,将Xu-Payne模型简化为白云石、方解石、泥质3种矿物,少量的粒间孔、溶孔、微裂缝3种孔隙类型,以及天然气和水2种孔隙流体。传统的Xu-Payne模型预测横波时差,首先是通过测井解释得到方解石、白云石和泥质的体积分数、孔隙度、含气饱和度,同时根据已知的纵波速度和密度,采用模型进行横波预测,然后根据文献[25]确定模型计算过程中所用的矿物及流体组分。

2.3.1 定性分析

从定性角度分析不同方法的横波预测结果(见图4)。由图可知:1)机器学习方法的精度明显高于Xu-Payne模型,表明机器学习方法能够更加有效地提取测井参数本身的特征,从而构建精度更高的预测模型。2)基于LSTM的预测结果精度最高,而其他的机器学习方法则在一些层位出现较大的误差。比如在横波波动较大的3 515 m处,多数机器学习方法的预测结果都出现了较大偏差;在横波相对平缓的3 485 m处,Bayes和LR的预测结果波动较大,而LSTM的结果则和实际情况相符。

图4 不同方法的横波预测结果

2.3.2 定量分析

从定量角度分析不同机器学习方法的横波预测结果(见表1)。由表可知,LSTM在不同岩性、流体中均取得最佳预测结果。1)从岩性来看,石灰岩、白云质石灰岩、白云岩和石灰质白云岩结构较为复杂,在实际学习过程中,这几类岩性的横波预测结果相差较大,这是因为不同方法采取的学习策略不同,学习特征不平衡,从而在面对复杂储层结构时,预测精度呈现出较大的差异;而LSTM对不同岩性的横波预测精度均在0.850以上,这也表明LSTM能够通过特有的时序结构,有效提取测井参数序列特征,实现测井参数与横波时差之间的整体匹配,从而对不同岩性都能实现有效识别,具有更强的泛化性。2)从流体来看,BP和SVM能够有效提取干层的横波特征,而在预测气水同层时不能有效学习,精度较低;Bayes和KNN等方法的学习策略较为简单,对2种流体的学习精度都偏低;LSTM则可以有效提取干层和气水同层横波特征,预测精度较高。

表1 不同机器学习方法预测横波时差的决定系数

2.3.3 误差统计

为进一步分析LSTM的横波预测效果,对不同机器学习法预测横波时差的绝对误差(以下简称误差)进行统计。总的来说,LSTM的误差不超过20 μs/m,而其他方法的误差最高达到60 μs/m,这也体现了LSTM方法具有较高的鲁棒性。从局部来看:LSTM的误差分布较为均衡,没有出现较大偏差;Bayes,LR和SVM在横波时差极值附近的误差较大,达到40 μs/m左右,说明这些方法在面对横波剧烈变化时不能有效捕捉序列特征,从而导致预测效果较差。从整体来看:BP和KNN大部分预测结果都与原始数据存在10~20 μs/m的差值;LSTM除了少部分波动点外,绝大部分预测误差都在10 μs/m以内,说明LSTM能够根据数据本身的序列特征,深度挖掘测井参数与横波的整体匹配模式,构造符合实际地质情况的高精度横波预测模型。

2.3.4 特征组合

为分析测井参数对碳酸盐岩储层不同岩性、流体中横波时差预测的影响,按照不同测井参数在地质分析中的相关性与获取的难易程度,确定4种特征组合方案:V6(AC,CNL,DEN,GR,PE,SP),V8(V6 基础上加入 RLLD和 RLLS),V13(V8 基础上加入 RT10,RT20,RT30,RT60,RT90),V16(V13 基础上加入w(K),ρ(TH),ρ(U))。预测结果如表2所示。

表2 不同特征组合方案的横波预测精度

由表2可知:1)和 V6相比,V8加入 RLLD和RLLS后,石灰岩、白云质石灰岩的横波预测精度有所上升,而白云岩、石灰质白云岩、泥质白云岩的横波预测精度下降,从而导致整体横波预测精度较差,这也表明电阻率可以指示部分石灰岩特征。2)V13的精度相比V8有较大的提升,表明加入阵列感应电阻率后,多个电阻率可以有效指示储层孔隙和流体结构,从而提升识别效果。3)V16的精度最高,表明加入伽马能谱后,网络能够联合GR信息,对包含泥质的岩性部分横波特征作进一步的补充,从而提升了整体的预测精度。综合4种方案可以看出:使用8种测井参数的预测效果最差,使用16种测井参数的预测效果最好,R2达到了0.967,RMSE 减小至 3.360 μs/m。

3 结论

1)LSTM能够从测井参数本身出发,有效表达不同测井参数的序列特征。不同于点对点的机器学习方法,基于LSTM的横波预测模型能够有效捕捉到横波时差沉积模式和测井参数承载尺度信息,实现了测井序列和横波序列的整体匹配。

2)和传统的机器学习方法和Xu-Payne模型相比,LSTM的横波时差预测精度更高,绝对误差在20 μs/m以内,决定系数达到0.967,且在不同岩性中均取得最优预测结果,表明LSTM具有较强的泛化性,能够挖掘出测井参数与横波之间的内在联系。

3)在使用6种常规测井参数时,LSTM也能取得较好的精度;只有将侧向电阻率和阵列感应电阻率相结合,才能对地层中的孔隙与流体结构起到良好的指示作用;伽马能谱对自然伽马曲线的补充,能够进一步提升LSTM的预测精度。

4)LSTM是一种高效的数据挖掘模型,通过控制3个门层保证信息的连续性,实现了测井参数序列特征的自动提取,在岩石物理参数的数据挖掘上具有广阔的应用前景。

猜你喜欢
横波测井储层
本期广告索引
横波技术在工程物探中的应用分析
输导层
——北美又一种非常规储层类型
基于边界探测技术的储层识别与追踪
基于储层构型研究的储层平面非均质性表征
海上低渗储层防水锁强封堵钻井液技术
横波演示仪的设计与制作*
基于测井响应评价煤岩结构特征
随钻电阻率测井的固定探测深度合成方法
中石油首个全国测井行业标准发布