翟晓岩,高刚*,李勇根,陈冬,桂志先,王之桢
(1. 油气资源与勘探技术教育部重点实验室(长江大学),湖北武汉 430100;2. 长江大学地球物理与石油资源学院,湖北武汉 430100;3. 中国石油勘探开发研究院,北京 100083;4. 中国石化石油勘探开发研究院,北京 100083)
在地震资料定量解释中,密度(DEN)和声波时差(AC)测井曲线是地震岩石物理学和地震反演技术中的两条关键曲线,能够提供可靠的时深关系,使深度域测井数据与时间域地震数据相互标定,是岩石物理建模技术必不可少的岩石弹性和物性信息曲线。但实际测井中,井径的扩缩对声波和密度测井影响较大,导致部分井段出现畸变、失真,甚至缺失,为后续综合解释带来一定困难,曲线重构技术是测井数据校正和预测的主要方法[1-2]。
传统的测井曲线重构方法主要有三种:经验模型法、多元拟合法、岩石物理建模法。由于经验模型法效率最高、最易推广,因此针对横波速度测井曲线缺失问题,提出了许多纵波和横波之间的线性或非线性经验关系[3-4],但受到地区和岩石类型的限制。黄小平等[5]论述了Gardner 公式不适用于井壁垮塌处DEN 曲线校正,原因在于井壁垮塌对DEN 和AC 曲线都有影响。陈钢花等[6]论证了 Faust 公式需要保证地层电阻率和AC 曲线具有很好相关性,储层中流体对电阻率有较大影响的地层并不满足该公式的假设条件。
虽然不同测井曲线的测量原理不同,但它们都是反映岩石某一方面的特征,因此不同测井曲线一般存在一定相关性。多元拟合法基于曲线相关性特征,采用线性或非线性关系式拟合目标曲线与其他曲线的关系,完成目标曲线重构,该方法精度高于经验模型法,但矿物成分复杂的岩石使目标曲线与其他曲线的非线性关系增强,多元拟合关系式泛化能力不足,拟合的目标曲线精度不高[7-8]。
岩石物理建模法(Xu-White、Cemented、Krief 模型等)假设饱和流体岩石主要由岩石基质、孔隙结构、流体三部分组成,而这三部分的参数是根据受井眼影响较小的测井曲线(自然伽马(GR)、自然电位(SP)、电阻率(RT)、中子孔隙度(CNL)等)解释的孔隙度、泥质含量、含水饱和度由不同岩石物理模型构建,通过迭代调整岩石孔隙纵横比参数,求解纵、横波速度和密度。Yang等[9]针对岩石矿物成分复杂的情况,拓展了Xu-White 模型,形成了考虑石英、黏土、方解石三种矿物的Xu-White 模型,重构的灰质发育区砂泥岩地层的横波速度精度较高。针对页岩、碳酸盐岩等各向异性较强的岩石,桂俊川等[10]提出了考虑包含裂缝等多种孔隙类型的横向各向同性介质的横波速度预测方法。这些岩石物理建模法方法重构的横波速度精度依赖于孔隙度、孔隙类型、矿物成分、含水饱和度等储层地球物理参数的计算精度,然而这些参数难以高精度获取。岩石物理建模法重构的目标曲线精度高于前两类方法,但一般在纵波速度和密度已知情况下重构横波速度,在纵波速度和密度曲线存在误差时,该方法重构的目标曲线精度明显下降。
深度学习具有建立输入与输出之间的复杂非线性映射关系的能力,因此在人脸识别、机器翻译、图像分类等领域得到了广泛的应用[11-13]。近年来,深度学习被引入地学领域[14-15],在岩石物理建模、岩性识别、储层参数反演等领域取得了一定的研究成果。在测井曲线重构方面应用最为广泛的为横波速度重构。有学者提出利用长短时记忆(Long Short-term Memory,LSTM)网络解决横波速度缺失问题[16-17]。该方法充分考虑了测井数据的时序特征,并在碳酸盐岩和砂岩储层中取得了较好的重构效果。为了提高深度学习网络重构横波速度的精度,Chen等[18]提出使用二维卷积神经网络(2DCNN)和门控循环单元(Gated Recurrent Unit,GRU)的混合网络预测横波速度。该方法分别利用2DCNN、GRU 提取输入数据的空间特征(地层的不同属性特征,如自然伽马、自然电位、中子孔隙度、地层电阻率等)和时序特征(测井数据深度方向的变化特征),能够建立输入与输出之间复杂的非线性关系。Han 等[19]将深度学习和机器学习相融合,揭示输入与输出之间更复杂的非线性关系。实验结果表明,与决策树、随机森林和深度学习网络相比,该方法在缺失曲线重构方面更具优势。近年来,融合注意力机制的神经网络可提高网络对重要特征的敏感度,已应用于机器翻译、智能电网、地学等不同领域[20-23]。Kavianpour等[24]开发了融合注意力机制的CNN-BILSTM(双向LSTM)网络并用于地震预测,取得了良好的效果。Bai 等[25]提出了一种基于注意力机制的长短期记忆全卷积网络(LSTM-FCN)模型并用来提取地震数据之间的时序特征,以提高地震事件检测和定位的准确性;马国庆等[26]提出了基于自注意力机制的深度学习网格化方法,实现了高精度重磁数据网格化和滤波处理。
测井是油气开发和勘探行业最重要的观测技术之一。在实际应用中,校正和预测缺失测井曲线是节约油气勘探开发成本的有效途径之一。由于储层的结构复杂性和非均质性,测井曲线之间存在较强的非线性关系[19]。相比于现有的经验模型法、多元拟合法、岩石物理建模法,已成功应用于地震相识别、岩性预测、储层参数反演等地球物理领域的深度学习具有构建输入与输出之间复杂非线性关系的能力。针对测井曲线自相关性和互相关性的不同,本文构建了融合注意力机制的二维卷积深度学习网络(STACNN),该网络主要包括输入层、二维卷积层、空间注意力层、时序注意力层和全连接层。以准噶尔盆地超深层致密砂岩为研究对象,通过试验分析了时、空注意力层权重与测井曲线自相关性和互相关性的关系。然后开展了应用该网络、GRU、2DCNN 和多元拟合重构AC 和DEN 测井曲线试验,并进行参数优化。最后通过井震匹配关系的提升验证了AC 和DEN 测井曲线校正和缺失重构的效果。
卷积神经网络(CNN)是深度学习领域经典的网络之一,随着深度学习网络的快速发展,已广泛应用于图像、医学、地球物理等领域。CNN 通常由输入层、卷积层和全连接层组成,其核心部分为卷积层,当数据输入到卷积层后,卷积核可以挖掘数据局部间的高维空间特征,作为下一层的输入。
式中:Xt是当前层t个d×m维的输入数据;XT代表经过T个卷积核提取的特征向量;WT是当前层尺寸为i×j的权重矩阵;B1是当前层的偏置系数;σ是Relu激活函数,可以提高网络的非线性描述功能。
神经网络借鉴了人类的注意力机制。人们在观察图像时,会专注于图像的目标区域,以挖掘图像的重要信息。虽然各条测井曲线测量机理不同,但它们都反映了同一岩石不同方面的性质,AC、DEN 与其他测井曲线的互相关性及自相关性不同,因此提出将注意力机制融合到2DCNN 中,达到提升深度学习网络捕捉测井数据自相关性和互相关性特征的能力。空间注意力层的输出结果可表示为
时序注意力层的输出结果可表示为
式中:SD为ST在第二层2DCNN 中经过D个卷积核提取的特征向量;是将第二层卷积结果SD经过横向压缩得到的D个d×1维的时序注意力层权重。
由于AC、DEN 测井曲线与其他曲线的互相关性、自相关性不同,且它们之间的非线性关系复杂,因此本文提出了一种基于时空注意力机制的CNN 融合网络。其网络组成(图1)为:
图1 STACNN 的网络结构
(1)输入层,将训练测井数据集输入STACNN;
(2)第一2DCNN 层,卷积核尺寸为3×3,输入通道数为1,输出通道数为16,用于提取测井数据的空间特征;
(3)空间注意力层,用于提高网络对空间特征的敏感性;
(4)第二2DCNN 层,卷积核尺寸为5×3,输入通道数为16,输出通道数为32,用于提取测井数据的时序特征;
(5)时序注意力层,用于提高网络对时序特征的敏感性;
(6)Dropout层,在训练时以一定的概率p使神经元失活;
(7)全连接层,输入通道数为32,输出通道数为1,用于提高输入层和输出层之间的非线性关系拟合能力;
(8)输出层,输出STACNN 的预测结果(AC 或DEN 曲线)。
本文网络训练和预测的过程如下(图2)。
图2 STACNN 的训练和预测流程
(1)数据预处理。使用StandardScaler 和Min-MaxScaler函数对测井数据进行标准化和归一化处理以消除不同数据量纲之间的差距。
(2)将训练测井数据集输入STACNN。
(3)训练STACNN。本文将均方误差(MSE)作为损失函数,同时选用自适应矩(Adam)优化算法进行网络优化,直至损失函数收敛。
(4)将测试集的测井数据输入到STACNN。
(5)网络评估。 本文用可决系数(R2)对STACNN 进行定量评估
式中:M表示样本个数;yi为第i个真实值;代表预测值;为样本均值。
R2用来度量一个统计模型的拟合优度,取值范围为[0,1]。R2越接近1,说明回归直线对观测值的拟合程度越高;R2的值越接近0,说明回归直线对观测值的拟合程度越低。
本文选取准噶尔盆地M 工区gd-1、gd-2、gd-5、gd-13 等井致密砂岩储层为研究对象,且数据集都为白垩系同一目的层段,保证数据集测井曲线横向特征具有一定的相似性。样本集中输入的特征曲线为GR、SP、CNL、RT,标签集为AC 和DEN 曲线。在测井曲线的深度方向采用多对一(多个采样点对应一个标签)的方式对样本集进行划分,既充分保证了测井曲线的自相关性,又体现了地层的连续渐变特征。gd-2井的测井曲线(图3)表明该井在黑框处出现了严重的扩径现象,AC、DEN 曲线存在严重的测量误差,即AC 值周期跳跃、DEN 值偏低。因此在分析目标测井曲线与其他测井曲线相关性时,在井径(Cal)曲线约束下将测井数据分为两类,即非扩径段和扩径段。用非扩径段目标曲线与其他曲线的交会图分析它们之间的互相关性(图4)。与AC 曲线的相关性从高到低依次为CNL、RT、GR、SP 曲线,R2值分别为0.5688、0.4043、0.3594、0.1535。与DEN 曲线的相关性从高到低依次为GR、CNL、RT、SP 曲线,R2值分别为0.6712、0.3511、0.2307、0.0174。虽然AC、DEN 都属于典型的孔隙度解释曲线,但AC、DEN 与其他常规测井曲线相关性是不同的。使用自相关函数(ACF)分析测井数据的自相关性。各曲线的ACF皆随滞后距的增加而不断减小(图5),但各曲线减小的速率不同。当滞后距小于10 个样点时,自相关性都能达到40%以上,说明地下沉积地层是连续渐变的。
图3 gd-2 井的测井曲线
图4 AC、DEN 曲线与其他测井曲线的交会图
图5 测井曲线的自相关系数
上述分析表明,其他测井曲线的时空特征与AC、DEN 曲线有一定的相关性。同时,由于SP 曲线与AC 和DEN 曲线的相关性都较低,因此在重构目标曲线时,选用相关性较高的GR、CNL、RT 曲线作为深度学习网络的输入样本。
为了验证注意力机制能够加强深度学习网络对重要时空特征的敏感性,分别构造了有、无时空注意力机制的两种网络,其中,未加入时空注意力机制的网络结构由一个全连接层(Dense)组成,加入时空注意力机制的网络结构由一个全连接层(Dense)和一个时空注意力层(Attention)组成。图6 为测井数据有、无空间注意力层的权重分布。当标签为AC 时,空间注意力层的权重分布由大到小分别为CNL、RT、GR曲线(图6a),当标签为DEN 曲线时,权重分布由大到小分别为GR、CNL、RT 曲线(图6b),这与图4中的互相关性分析一致。而未加入注意力机制的网络权重分布却无此规律。当标签为AC 曲线时,CNL 曲线被空间注意力层赋予最大的权重,达到0.43,因为CNL、AC 、DEN 曲线都是用于测量岩石的孔隙度;当标签为DEN 曲线时,GR 曲线被空间注意力层赋予最大的权重,达到0.52,因为二者都属于放射性测井,皆可用于岩性解释。
图6 标签为AC(a)和DEN(b)曲线时测井数据的空间特征权重分布
图7为测井数据有、无时序注意力层的权重分布。选取常规测井数据中的15 个采样点作为样本,并将第8 个点的AC 或DEN 值作为标签,在预测AC 或DEN 时,位于标签位置的样本数据被时序注意力层赋予了最大的权重,分别达到了0.1314 和0.1137,说明与标签位置相同的样本对AC 或DEN 值的影响最大。随着与标签的距离增加,注意力权重的总体趋势是减小的,这与图5 中测井数据的自相关性分布相一致。以上这些现象验证了在深度学习网络中加入时空注意力机制的合理性。
图7 标签为AC(a)和DEN(b)曲线时测井数据的时序特征权重分布
为了验证STACNN 的预测性能,分别与2DCNN、GRU 和多元拟合法的结果进行了对比。2DCNN 组成为:两个二维卷积层(卷积核尺寸分别为3×3、5×3,通道数皆为16)、一个Dropout层(丢弃率p=0.25)、一个全连接层(通道数为1);GRU 网络的组成为:两个GRU 层(门控循环单元个数分别为16和32)、一个全连接层(通道数为1)。所有网络都采用Adam 优化算法,结合了AdaGrad 和RMSProp 算法的优点,在处理大规模数据、参数优化和非稳态目标方面具有较强的优势。同时,添加舍弃层,随机丢弃神经元,以增加网络的泛化性。
选取gd-13 井测井数据对2DCNN、GRU 网络和本文的STACNN 进行训练。整体上本文网络的AC、DEN 曲线预测结果都优于其他两个网络,更优于多元拟合的预测结果(图8 黑虚线框所示),这表明在捕捉目标曲线与其他曲线复杂的非线性关系方面,深度学习网络具有明显的优势。三个网络预测AC、DEN 曲线的损失函数如图9 所示,都随训练次数的增加而不断减小,最终达到一个稳定的值,即网络达到最优状态。本文网络训练一次后的损失函数值明显低于其他两个网络,而且达到稳定状态时的损失函数值也最小。原因在于STACNN 可以更好地挖掘其他测井曲线的时、空特征与AC、DEN 曲线之间的相关性,提高了网络对时、空特征的敏感度。GRU、CNN、本文网络AC 曲线预测结果的R2值分别0.7199、0.8192、0.8940,DEN 曲线预测结果的R2值分别为0.7528、0.8396、0.9570,同样验证了注意力机制能够提升深度学习网络的预测性能。
图8 gd-13 井四种方法AC(a)、DEN(b)曲线的预测结果(红色点线)与真实曲线(黑色实线)的对比
图9 预测AC(a)、DEN(b)曲线时STACNN、CNN 和GRU 网络的损失函数曲线对比
为了更好地用本文网络完成目标曲线校正和缺失重构,分别将样本划分时窗长度,即采样点数设为5、15、25,采用同样的训练参数,网络的预测结果如图10所示。AC 曲线预测结果的R2值分别为0.7305、0.9128、0.8945,DEN 曲线预测结果的R2值分别为0.8834、0.9674、0.9469。可见,样本划分时窗长度为15时,本文网络预测性能最佳。
图10 时窗长度为5(左)、15(中)、25(右)时AC(a)、DEN(b)的预测结果(红色点线)与真实曲线(黑色实线)的对比
在钻井过程中受地层岩性的影响,有些井段产生了扩径或缩径现象,导致AC、DEN 测井曲线存在测量误差。由图11 中gd-2 井的井径曲线可以看出,该井段井孔质量较差,其中大段扩径有一段(5520~5530 m,黑框所示),还有一些小范围扩径段。
图11 gd-2 井AC、DEN 曲线校正分析
使用井径曲线作为约束条件将gd-2 井测井曲线划分为扩径段和非扩径段两部分,用非扩径段样本集训练本文网络,并预测了所有样本的AC 和DEN 曲线(校正结果),预测结果与真实曲线的R2值分别为0.8472、0.8755。AC、DEN 测井曲线校正前、后在小范围的扩径井段的数值略有差异,而在大范围的扩径井段的数值差异较大(黑框区域)。根据地层的沉积演变规律,同一块具有相同沉积背景的岩性段,其物理性质基本相近,校正后的曲线形态变化比较平缓,而校正前的声波受井径扩径的影响具有明显的周期跳跃现象。
将扩径段与非扩径段同时参加网络训练的预测结果,AC、DEN 曲线校正前、后在扩径井段的数值基本吻合,产生这种现象的原因在于扩径段的数据参与了网络的训练和监督。
与校正前的合成记录相比,校正后的合成记录与真实的地震记录吻合度更高,尤其在5490~5540 m(图11c 黑框区域)内,校正后的合成记录的振幅相对关系与真实地震记录基本一致。因此在AC、DEN 曲线同时存在测量误差时本文网络的重构效果明显。
由于井孔条件的限制,有些情况会出现AC、DEN 曲线都缺失。选取准噶尔盆地gd-1、gd-2、gd-5、gd-13 等井致密砂岩储层测井曲线为研究对象,其中gd-2、gd-5、gd-13 井作为训练集,gd-1 井作为测试集,且数据集都为白垩系同一目的层段,保证数据集测井曲线横向特征具有一定的相似性。为减少扩径对AC、DEN 的影响,选用前三口井非扩径段样本进行训练,建立了两个网络分别预测gd-1 井的AC、DEN 曲线(图12)。预测结果与真实曲线的R2值分别为0.8446、0.8598,略低于图11 的预测结果,原因在于图12 验证数据完全没有参与网络训练,而图11 是用同一口井非扩径段进行训练。由图12可见,本文网络的AC、DEN 预测值与真实值相关性要强于多元拟合预测的结果。此外,受扩径的影响,AC、DEN 曲线的预测结果与真实值略有差异,校正前、后的合成记录与实际记录基本一致,但校正后的合成记录与真实值的相关系数略高于校正前的合成记录。而多元拟合预测结果的合成记录与实际地震记录相关性较差的原因在于多元拟合得到的声波速度与真值差异较大,造成井震时深转换及计算的反射系数都出现了较大的误差。
图12 gd-1 井AC、DEN 曲线校正预测分析
由于准噶尔盆地致密砂岩储层的孔隙结构复杂,且常规的测井曲线重构方法难以捕捉测井曲线之间的较强的非线性关系,因此本文提出了一种基于时空注意力机制的CNN 网络重构AC 和DEN 测井曲线,得出以下几点结论。
(1)测井曲线的交会分析表明不同测井曲线之间的相关性不同,AC 与CNL 曲线相关系数达到了0.57,DEN 与GR 曲线相关系数达到了0.67,证明了利用其他测井曲线重构AC 和DEN 测井曲线的可行性。
(2)基于AC、DEN 测井曲线与其他测井曲线相关性不同,提出在2DCNN 提取特征的基础上增加注意力层,达到提高网络对重要时空特征的敏感性。深度学习网络的权重分析表明注意力层权重分布与测井曲线自相关、互相关特征规律一致。
(3)GRU、CNN 及本文的STACNN 的AC、DEN测井曲线重构效果优于多元拟合法,合成记录时深标定效果验证了本文网络在AC、DEN 测井曲线校正、缺失重构方面的效果最优。