王婷婷,孙振轩,戴金龙,姜基露,赵万春
1.东北石油大学电气信息工程学院,黑龙江 大庆 163318
2.东北石油大学非常规油气研究院,黑龙江 大庆 163318
岩性信息的识别分类对油气储层分类评价具有重要意义[1]。常规方法通过钻井或岩屑录井等方式获取岩心,根据岩心分析岩性信息[2-5]。这些方式存在价格高昂、误差较大、后续实验分析复杂等问题,使得根据测井资料识别岩性信息备受关注[6-7]。
油气勘探开发的物理测井资料能够充分展示地层信息,具有全方位、高分辨率、信息量大、复杂程度高的特点[8]。研究人员尝试将交会图技术作为分析测井曲线的主要方法[9-10]。随着油气勘探开发规模的扩大和储层复杂度的提高,研究发现交会图技术无法完全揭示测井数据中可能存在的关系,测井解释同样依靠测井分析专家的经验[11-12]。近年来随着计算机算力的增强以及人工智能的发展,机器学习在分析复杂数据中表现出巨大的优势,可以最大程度地减少人为干扰所导致的偏差[13-14]。机器学习应用于岩性分类的常见算法包括支持向量机(support vector machine, SVM)、决策树、人工神经网络(ANN)、朴素贝叶斯统计方法等[15-18]。传统机器学习算法对数据量要求巨大,而常规测井数据珍贵,无法满足机器学习的大规模训练,导致训练效果不佳[19]。机器学习在训练时,任何新的数据或经验都可能导致错误结果输出。在岩性识别方面,由于测井数据变化多样以及每组数据包含众多的类,机器学习在训练单组测井数据时,无法实现多种分类输出,且在识别分类时容易忽略岩石沉积演化过程中岩石类型转移阶次的问题,无法提取深度方向上数据与数据之间的信息,导致无法准确分类岩石序列或出现储层中不存在的岩石序列。
相对其他机器学习算法而言,深度学习作为机器学习的一个全新领域,经过近几年的快速发展,在算法和理论上日趋成熟,同时也融合了部分其他机器学习算法,使深度学习应用更加广泛,效果更加优秀。随着AlexNet、Visual Geometry Group、GoogleNet、ResNet等深度学习网络的崛起[20-23],单组测井数据实现多分类问题得以解决,同时在深度方向加强了数据与数据之间的联系。
本文采用深度学习网络中的U-Net。U-Net具有良好的去噪性能,且对数据量小、数据信息丰富的数据,表现出较好的分类效果[24]。基于测井数据和U-Net的自身特点,研究发现测井数据分类存在以下问题:1)常规测井数据量少,无法满足机器学习大规模训练;2)机器学习算法忽略了测井数据在深度方向的联系;3)U-Net在自上而下特征提取的过程中,忽略高级通道对低级通道的影响,而导致岩性分类性能较差;4)U-Net在特征提取过程中因为最大池化等问题会造成特征“退化”;5)测井数据变化复杂,而U-Net结构简单,容易忽略数据所包含的关键信息。
针对以上问题,本文基于U-Net提出一种适用于测井数据的网络结构:特征注意力融合网络(feature attention fusion Unet, FAF-Unet),分别从通道方向和卷积方向添加残差块与通道注意力机制。FAF-Unet针对U-Net处理测井数据时的问题拟做如下改善:1)在下采样过程中添加残差块来减少“退化”现象;2)将特征提取的高级通道信息与低级特征结合,增加部分低级特征通道的权重,提高岩性分类性能;3)为了提高网络对关键信息的提取,特别提出特征注意力融合(FAF)模块。
U-Net具有分类以及分割的作用,相比于普通分类网络,它是一种可以进行多分类的语义分割网络。由于测井曲线数据的特点,U-Net成为本文基础网络。本文特征提取网络处理的数据为一维测井数据。在处理曲线类数据时,Oh等[25]用U-Net处理一维Electrocardiogram(ECG)数据。U-Net网络主要采用卷积神经网络(CNN),CNN对噪声具有鲁棒性,因此即使在数据嘈杂的情况下也能够提取有用的预测变量[26]。U-Net最初应用于生物医学领域,可以用少量的数据集训练达到较为理想的分类结果,这在数据量相对有限的领域作用巨大。
U-Net产生于FCN(fully convolutional networks)[27]。与FCN相比,U-Net具有更加完善的解码器以及跳跃结构。其主要框架由特征提取网络、特征融合网络和跳跃连接构成。特征提取网络主要作用为得到抽象语义特征。在特征提取过程中,数据特征具有从低级特征到高级特征的特点。而特征融合过程与特征提取过程相反,数据特征具有从高级特征到低级特征的特点,原因是在上采样过程中融合了下采样所产生的数据特征。由于上采样部分与下采样部分对称,形成了U型结构,故称为U-Net。U-Net具有较强的抗干扰能力,但在特征提取过程中存在信息丢失的情况[28]。
众多研究表明,在深度卷积神经网络中,添加注意力机制能够显著提高CNN的性能[29],且注意力机制可以更好地解决上下文特征关联度差的问题[30]。在U-Net模型中添加注意力机制,可以筛选出与分类结果相关程度大的信息。注意力机制可以在特征提取时自动获取与分类结果相关的特征并抑制不重要的特征,从而有效提高岩性分类效果。注意力机制类似于专家分析数据,从大量因素中筛选出决定性因素。注意力机制主要包括通道注意力机制和空间注意力机制,本文采用数据格式为一维数据,主要采用通道注意力机制。
通道注意力机制更注重通道间的信息,本文的输入数据为一维8通道输入数据,包括声波(AC)、自然伽马(GR)、井径(CAL)、自然电位(SP)、深侧向电阻率(RLLD)、浅侧向电阻率(RLLS),密度(DEN)、光电吸收截面指数(PEF)。有效通道注意力网络(efficient channel attention net, ECA-Net)(图1)是SE-Net(squeeze-and-excitation net)的一种改进形式,可以说是通道注意力机制的一种实现形式。其核心思想是卷积操作具有良好的跨通道获取信息的能力,能够在一定程度上弥补SE-Net降维所带来的缺陷。
传统U-Net在跳跃连接中直接将低级特征与上采样进行融合。低级特征通道所包含的权重并不相同,在直接与上采样融合的过程中忽视了对分类产生作用的关键通道。本文一维8通道输入数据,数据与数据之间的联系决定了分类效果,通过特征注意力融合网络帮助提升关键通道权重。
本文基于U-Net提出了FAF-Unet,其是基于测井数据识别储层岩性的网络,结构如图2所示。FAF-Unet模型集成了残差卷积和注意力机制,残差块可以更好地保留深度方向低级特征的数据,而通道注意力机制可以弥补竖向卷积时忽略横向通道之间联系的问题。具体为,首先,为了减少更多特征信息的损失,在网络模型编码器部分采用残差卷积模块,能够避免模型“退化”带来的问题。其次,在卷积的过程中,根据测井数据深度方向进行卷积(图3)。最后,在模型跳跃连接部分添加ECA机制,有效获取通道之间的特征信息。
图2 FAF-Unet模型
图3 卷积方向结构图
本文分析U-Net模型的缺陷,设计FAF模块,将高级特征获取的通道信息与低级特征融合,弥补低级通道对重要信息关注度不够的缺陷,使网络的高级特征通道指导网络的低级特征通道,从而达到获取更多语义和细节特征信息的目的。将深层通道特征的细节信息和浅层通道特征的语义信息拼接融合可以有效缓解网络模型错检、漏检等问题。在整个模型中,使用通道注意力机制的特征提取层,将输出特征使用全局平均池化,保持1×1×C通道,使用大小为k的卷积核在1×1×C的全局描述特征图上做一维卷积,并调整通道数与低级特征通道数相等,以捕获跨通道局部交互信息。对以上得到的结果,通过Sigmoid函数将其映射到0~1之间。k个近邻通道共享权重,以及通过一维卷积实现卷积操作。
(1)
w=σ[C1Dk(y)]。
(2)
令Fl为下采样过程中第l层的特征,使用通道注意力机制得到特征向量VC,高级特征通道注意力机制以及与低级特征输出Hout特征融合过程如下:
(3)
(4)
FAF-Unet模型(式(4))等号右侧为上采样过程,主要进行网络的特征融合。将数据恢复成原来的数据尺寸,并通过归一化指数函数给输出类别进行打分。图4中左侧每行为类别,颜色越深代表相应类别的分值更高,右侧为分数最高的分类结果。
图4 模型输出示意图
数据集采为松辽盆地中央坳陷区龙虎泡油田地层的测井数据。龙虎泡油田位于黑龙江省大庆市杜尔伯特蒙古族自治县境内[31-32],西邻敖古拉油田,东邻哈尔温油田,北为金腾油田,南接龙南油田。区内地势平坦,海拔在140~160 m之间。龙虎泡地带(图5)位于中央坳陷区的龙虎泡阶地,东部、南部紧邻齐家—古龙凹陷,总体为一东高西低的单斜构造[32],东部、西部以及东北部为单斜构造,北部构造比较简单。
图5 松辽盆地中央坳陷区龙虎泡油田A区块高三组顶面构造
本实验的实验配置及实验参数设置包括:计算机硬件配置为NVIDIA GeForce RTX 2080 Ti(GPU),Intel(R) Xeon(R) CPU E5-2678 v3@2.50 GHz处理器,软件试验环境配置为Ubuntu18.04操作系统,深度学习框架采用Tensorflow2.6,编程语言为python3.7以及numpy1.17.0等库。
本文特征提取网络改为处理一维测井数据,数据集包含20口井测数据,共160 000个分类数据。从井口数据中将8种选中的数据排列成二维矩阵,初步形成160张尺寸为8×1 000的原始测井数据,数据集均采用有效储层数据。根据专家分析以及实际岩柱分析,将测井数据制作成与之对应的实际标签。总共分为5类:粉砂岩、泥质粉砂岩、粉砂质泥岩、泥岩、油页岩。由于储层岩性沉积演化和测井数据的形态特征具有特殊意义,在对测井数据进行处理时需要对测井资料进行深度校正、数据增强和降噪处理,以保证每组数据处在同一深度。训练时采用单GPU,利用Adam网络优化算法,一共训练100次迭代次数,网络训练每批次为2,衰减底数设置为0.92,初始学习率设置为10-4,采用迁移学习策略获得网络预训练权重,根据不同对比实验超参数设置略有调整。
数据集经过校正处理,在很大程度上消除了外部因素所产生的噪声影响。通过对储层岩性和测井资料的分析[31],筛选出8项测井参数(SP、PEF、DEN、AC、CAL、RLLD、RLLS、GR)进行敏感性分析,这8项测井资料对不同岩性均表现出不同的敏感性。此外,深感应电阻率测井(RILD)与中感应电阻率测井(RILM)更多应用于划分渗透层,能够快速直观地判断油、水层,但与本文划分储层岩性不具有相关性,因此没有考虑在内。本文采用的是深度学习算法,如果在现场实测中有更多关于储层岩性分类的测井曲线,将更加有利于深度学习算法的训练。
以龙虎泡油田龙-26井为例,对5种岩性做箱形图进行分析,结果如图6所示:1)密度测井对泥岩敏感程度高,与其他岩性没有重叠部分,在识别其他岩性时效果较差(图6b),而浅侧向电阻率对识别泥岩与粉砂质泥岩效果较好(图6f),因此泥岩和粉砂质泥岩可以用密度-浅侧向电阻率来划分;2)声波时差测井与自然伽马测井对油页岩识别效果较好,且自然伽马测井对泥岩类与砂岩类分类效果较好(图6c、g);3)自然电位测井能够区分粉砂岩(图6a),同时粉砂岩中泥质含量较低,自然伽马测井值较低,因此自然电位测井与自然伽马测井在划分粉砂岩时具有良好的效果。由于测井数据的复杂性,箱形图展示的测井数据会出现部分异常值,异常值的出现主要对极值范围产生影响,对整体的敏感性分析影响较小。
ft(英尺)、in(英寸)为非法定计量单位,1 ft=0.3048 m,1 in=0.0254 m,下同。
根据真实测井数据,对不同测井数据与不同岩性之间进行敏感性分析,并统计敏感性分布在20%~80%之间的测井数据,结果如表1与表2所示。分析图6、表1、表2可以得出:1)常规测井数据在解释储层岩石岩性上具有重要的参考作用;2)由于岩石沉积演化,以及岩性与岩性间的相互影响,每组测井数据在箱形图分析上都表现出不同程度的重叠情况,需要多组特征的测井数据协同分析;3)不同岩性对不同测井参数敏感性不同,单一测井数据只能对岩性大类进行初步划分,只有通过更多通道特征的测井数据综合分析,才能实现对岩性进行精细划分。
表1 松辽盆地中央坳陷区龙虎泡油田不同岩性参数响应特征对比(敏感性为20%~80%)
本文通过召回率和准确率两个方面评价FAF-Unet的性能。
1)召回率指分类过程中真阳性在实际标签为阳性样本中的占比:
(5)
式中:R为召回率;NTP和NFN分别为真阳性和假阴性样本的数量。
2)准确率指分类过程中真阳性在判断为阳性样本中的占比:
(6)
式中:P为准确率;NFP为假阳性样本的数量。
本文通过混淆矩阵分别对比了SVM、决策树、U-Net、添加ECA机制的U-Net(ECA-Unet)、添加残差块的U-Net(Res-Unet)以及同时添加ECA机制和残差块的FAF-Unet 等6种方法的岩性识别情况,结果如图7所示。表3、表4以表格形式对比了6种方法的准确率和召回率。
表4 松辽盆地中央坳陷区龙虎泡油田不同方法的岩性识别召回率
SVM方法结果受数据噪声影响较大,因此该实验数据集经过平滑去噪处理以确保实验结果的可靠性。决策树方法纯叶节点会导致模型复杂,容易引起过拟合而影响实验结果,本文训练中主要采用提前终止的方法来防止过拟合情况的发生,保证实验结果的可靠性。控制卷积核的大小对实验结果至关重要,卷积核的大小可以直接影响网络特征提取能力,U-Net采用的卷积核大小为3×1,而Res-Unet、ECA-Unet、FAF-Unet均在U-Net基础上改进创新。
SVM方法在测井数据预测识别时,对特征较为明显的油页岩效果较好,预测准确率为70.01%(图7a、表3),召回率为78.65%(表4),召回效果强于准确率。决策树方法对泥岩预测效果较好,预测准确率为76.03%(图7b、表3),召回率为68.47%(表4)。SVM方法和决策树方法准确率在55.10%~76.03%之间(表3),召回率在56.52%~78.65%之间(表4),波动范围较大,而且对岩性变化不明显的储层岩性识别效果较差,不适合识别粉砂质泥岩、粉砂岩和泥质粉砂岩。
U-Net方法对于测井数据识别分类效果相比于SVM方法与决策树方法有所提升,U-Net具有与机器学习不同的特征提取方式和特征融合方式,可以最大程度地提取数据间的内在信息。U-Net方法对5种岩性识别的准确率、召回率均在70.00%以上(分别为71.13%~78.06%(表3)和73.20%~76.60%(表4))。相比于SVM方法和决策树方法,U-Net方法鲁棒性更强,但在准确率与召回率方面并没有表现出突出的优势,这是由于下采样过程中的池化、dropout等步骤导致部分特征丧失。Res-Unet方法和ECA-Unet方法在识别5种岩性时准确率和召回率比U-Net方法有所提升,FAF-Unet方法提升效果更显著,其准确率和召回率均达到89.00%以上。相比于U-Net方法,FAF-Unet方法对5种岩性的识别准确率分别提升了13.92%、19.97%、11.99%、18.90%、14.29%(表3),召回率分别提升了17.40%、13.60%、16.06%、18.64%、14.32%(表4)。FAF-Unet方法的准确率和召回率均高于其他方法,其中,与SVM、决策树、U-Net相比,FAF-Unet识别岩性的平均准确率分别提高了24.65%、27.79%、16.01%,平均召回率分别提高了24.25%、27.46%、16.00%。
不同方法的岩性识别结果对比如图8所示。可以看出,FAF-Unet与真实标签匹配程度更高,预测的准确率更高。
图8 松辽盆地中央坳陷区龙虎泡油田测井数据及不同方法岩性识别结果对比
1)FAF-Unet方法能够有效识别岩石沉积序列,有助于提升储层岩性识别效果。通过添加特征注意力融合模块与残差模块,解决了普通模型在特征提取时造成特征信息丢失的问题,使网络能够有效捕捉岩性与测井数据之间的内在关系,增加模型鲁棒性。
2)FAF-Unet具有良好的泛化能力,通过引入残差模块与通道注意力机制,自动提取测井数据序列间的信息,提升岩性识别精度,保证了特征信息传递的完整性。
3)与SVM、决策树、U-Net相比,FAF-Unet识别岩性的平均准确率分别提高了24.65%、27.79%、16.01%,平均召回率分别提高了24.25%、27.46%、16.00%,准确率与召回率均达到89.00%以上,能够在实际油藏生产中得到更好的应用。