基于胶囊网络的砂岩储层流体识别方法
——以黄河口凹陷为例

2022-04-14 02:39姬建飞袁胜斌郭明宇李战奎
石油地质与工程 2022年2期
关键词:录井流体储层

姬建飞,毛 敏,杨 毅,袁胜斌,郭明宇,李战奎

(1.中法渤海地质服务有限公司,天津 300457;2.中海石油(中国)有限公司天津分公司,天津 300459;3.中海油能源发展股份有限公司工程技术分公司,天津 300459)

胶囊网络是一种深度学习方法,原理是使用两层向量间的动态路由机制算法代替传统卷积神经网络的池化层,能够较好地表征待识别对象的空间结构关系[1]。胶囊网络深度学习方法主要应用于计算机科学、医学、图像识别等方面,地质学方面的应用极少,尤其是针对储层流体快速评价方面的应用尚未发现。目前,已有专家及学者基于录井资料采用多种数学方法在储层流体性质识别方面开展研究,包括Fisher 判别分析、贝叶斯、支持向量机及神经网络等方法[2-4],取得了一定的应用效果,同时也面临一些难题,其最主要原因为对于录井资料及其评价参数在不同储层流体的关系挖掘不够,流体识别准确率有待提高。胶囊网络深度学习方法在地质领域已有应用,与其他学习方法的最大不同在于胶囊网络能够提取局部序列结构特征,依靠向量表达特征信息,运用胶囊向量表达不同目标的不变性与共变性特征,这些特征提取与分类方式与储层流体识别思路有着共同点,这些优点可以精细地表征储层流体与录井资料评价参数之间的关系,最终形成高精度胶囊网络识别模型,并实现高精度流体识别[5-6]。

以渤海海域黄河口凹陷新近系油田群为研究对象,在储层流体类型识别中引入胶囊网络方法,录井资料特征选取岩屑荧光面积、气测全量绝对值、气测组分C1绝对值、气测全量绝对值与气测背景值之比、气测组分C1绝对值与气测组分C1背景值之比和气测组分C1占比六种录井评价参数,构建基于胶囊网络的储层流体识别模型,与Fisher 向量距离法进行深入的对比分析,探讨基于胶囊网络的储层流体识别方法的可行性及有效性,进一步提高传统储层流体识别方法的准确率。

1 方法原理

1.1 胶囊网络的原理

胶囊网络结构由普通卷积层、初级胶囊层、数字胶囊层三个部分组成。根据胶囊网络结构所示流程,输入数据通过卷积层提取特征图后被划分为多个初级胶囊,再运用动态路由器的算法将初级胶囊再次组合为数字胶囊,最后将数字胶囊通过映射的方式进行结果的分类(图1)。

图1 胶囊网络结构

如图1 胶囊网络结构所示,胶囊网络使用两层卷积结构提取数据的浅层特征后将特征图传入初级胶囊层进行初级胶囊划分,划分后的初级胶囊内部包含相同维度的向量,这些胶囊向量代表数据的通道间信息和局部特征。这些初级胶囊运用动态路由器算法获取初级胶囊与数字胶囊的权重,进而聚合为数字胶囊,主要用来表达低级胶囊特征的一致性。胶囊向量进行非线性映射能够提升模型的表达能力,因此需要运用激活函数来将每个节点的数据进行非线性映射,这种对胶囊向量使用的激活函数称为Squash(v)激活函数。将Squash(v)激活函数用于胶囊的输入向量映射到输出向量,并有效地压缩胶囊向量的长度,压缩后的胶囊向量长度标为胶囊的特殊性。Squash(v)激活函数对于胶囊向量的处理尤其重要。Squash(v)激活函数公式为:

数字胶囊层中不同的初级胶囊的特征向量通过动态路由器算法聚合后形成数字胶囊特征向量,因此使用高维度的高级胶囊能够更好地表现低维度的低级胶囊的共性。动态路由算法将I个初级胶囊聚合成J个数字胶囊层。首先使用仿射矩阵Wji对初级胶囊的向量做仿射变换得到子胶囊:

每个初级胶囊通过不同的Wji仿射变换得到J个子胶囊。初级胶囊层的I个胶囊经过仿射变换后的结果分组,得到J组(每组I个胶囊),每组初级胶囊组合成一个数字胶囊。

胶囊层的结构和原理决定了胶囊网络具有更强的泛化性。胶囊网络的胶囊层中的参数能够动态变化,对于特征的提取有针对性,所形成的模型为动态模型,始终对数据保持高敏感度。其优点为当同类数据存在不同结构时,运用每个数字胶囊代表每一种不同的结构,将特征图分为胶囊并组成数字胶囊的过程等于将所有样本按特征划分成不同的子空间。最终数字胶囊映射到分类结果,相当于对不同特征的子空间进行结果分类。胶囊网络的这些特点使其在多个领域得到广泛应用并取得较好的应用效果[9-10]。

1.2 胶囊网络评价标准

行业内对于训练模型的评价参数主要包括:Accuracy、Precision、Recall、F1-measure,分别代表准确率、精确率、召回率、F1 得分。所计算的样本数据为以下几类样品数据:第一类样本(TP),被分类器判断为正样本实际标签为正样本;第二类样品(FP),被分类器判定为正样本实际标签为负样本;第三类样品(FN),被分类器判定为负样本实际标签为正样本;第四类样品(TN),被分类器判定为负样本实际标签为负样本。

准确率(Accuracy)为被分类器确定为正样本数所占样品总数的比率,公式为:

2 流体类型识别

2.1 研究区背景

渤海海域黄河口凹陷油气资源极为丰富,已钻井资料揭示,新近系、古近系均发现了大中型油气田,油气藏种类多种多样,稠油油藏、轻质油气藏均有发现。以黄河口凹陷新近系为例,油气时空分布特征复杂,储层油气水关系的准确评价难度日趋增大。基于录井资料的流体识别方法难以解决储层流体评价难题,油气水层快速识别准确率偏低(低于70%);而基于录井资料以Fisher 判别分析法构造储层流体评价模型,符合率得到进一步提升,整体符合率接近80%。流体识别分类主要为油层、含油水层、水层三类,其主要问题为多变量构成的多维空间重叠现场,造成部分井准确率较低,难以满足实际生产需求[11-16]。

2.2 数据样本及数据集特征分析

训练数据是对研究区37 口井的录井、测井、测试等资料进行统计分析与数据处理以满足胶囊网络训练样本点的数据量要求。对于37 口井中的每个样品点,分别选取相邻垂向上下各5 个样品点作为区域序列数据,所形成的数据集作为输入特征向量,经过录井、测井及测试取样资料的精细分析及标定,形成381 个样本数据,其中气层21 个样本,油层140 个样本,含油水层107 个样本,水层113个样本,样本分布较均衡且具有代表性。选取研究区二级构造带X 井区21 口累计132 个样本为测试数据,对该数据集进行流体类型预测。通过对不同流体类型录井参数解析,录井参数及其衍生参数较多,与流体类型识别有一定程度相关性,通过录井参数建立的散点图对流体识别的不确定性较高。

在基于胶囊网络的流体类型识别模型设计中,由数字胶囊代表不同流体样本在空间中的结构特征,数据的特征图被依次提取、组合、划分为不同胶囊的过程中,完成不同流体样本的分类。而数字胶囊最终得到的分类结果就是其特征空间的分类结果。胶囊网络中子胶囊代表不同时序空间结构和不同垂向空间结构,让模型保持不同特征的高度敏感,在基于录井资料的不同流体类型识别中可有效解决由时序特征与空间结构造成的精度低的问题。每种流体类型对应不同的结构,为了提高模型精度,需针对不同流体类型的特征设计模型。

2.3 网络结构

为了准确提取数据的有效信息,胶囊网络结构设计至关重要,需结合录井数据特征并设计相应的结构。在流体识别的录井数据集中部分数据具备结构多样性,主要为同类流体的不同垂向录井参数特征以及不同流体类型交界处的录井参数特征基于录井数据集的多样性特征,在时序特征的特区应与不同通道的参数特征相结合来完成。最大程度地保留样本点的浅层信息,保证网络能够准确地识别数据中的不同结构。在相邻流体类型的多样性结构设计中,主要利用胶囊网络的数据胶囊完成,每种数据胶囊代表数据的不同结构。在胶囊网络的结构模型中,数据经左侧进入卷积层后再通过胶囊层到达分类器完成分类(图2)。卷积层的目的是提取样本垂向空间特征,工具为多尺度卷积核,利用卷积层内3、5、7 卷积核来提取数据时序特征。数据由卷积核1 经过到2 组多尺度卷积后保留下特征图,并由卷积核提取其多样性特征,再次跳跃连接后逐次保留数据原始特征,经过不同大小的卷积核就留下不同的特征,大大缩减了结构产生的平均化效应。为了减小特征的冗繁信息并降低特征的维度,对提取的特征在通过卷积核1 时进行通道间的压缩及融合。根据初级胶囊与数字胶囊的动态路由算法,当特征进入初级胶囊层时会被再次重新聚合为分别代表着不同录井参数结构的高级胶囊。通过全连接层完成数字胶囊与识别结果的映射,得到最终的分类结果。

图2 储层流体识别的胶囊网络结构

2.4 识别效果对比分析

选取研究区37 口井的录井资料共计381 个样本数据作为试验数据进行流体类型识别,分析模型为Fisher 判别分析法及胶囊网络法。黄河口凹陷流体录井识别方法正确率如表1 所示,表中正确率为符合样本数与样本总数比值。

表1 黄河口凹陷流体录井识别方法正确率

如表2 所示,胶囊网络法与Fisher 向量距离法识别的混淆矩阵中各项评价标准参数差异明显,可以准确地呈现出模型的识别分类与真实分类的差异。由表2 识别结果可知,基于胶囊网络法提取时序和垂向结构特征的精准度更高。线性Fisher 判别分析法模型未能提炼录井评价参数的差异特征,正确率识别较低,尤其是对样本数量较少的气层流体类型,识别能力较差,该类识别效果不能应用于实际生产(图3)。胶囊网络法正确率较Fisher 判别分析法提高10.23%,表明胶囊网络能够较为精确地识别储层流体类型,胶囊网络法各种流体类型的F1 得分良好,高于Fisher 判别分析法,证明该方法受样本不均衡影响较小,能够保证在不同类别的分类结果中均为精确的识别结果。

表2 黄河口凹陷胶囊网络法与Fisher 判别分析法的混淆矩阵

3 应用效果

选取二级构造带X 井区21 口井累计132 个样本的录井评价参数,分别使用Fisher 判别分析法与胶囊网络法进行流体类型识别,进一步证明模型的泛化能力,识别的正确率见表3,表中正确率为符合样本数与样本总数比值。Fisher 判别分析法没有考虑录井参数的时序特征,且受样本不均衡影响,对样本数量较少的气层,识别能力较差(图3);由表4可知,基于胶囊网络的录井流体识别结果优于Fisher判别分析法。卷积神经网以神经元的形式将特征一个一个地展开,并高效地通过连接层映射到最终的流体类型中,X1 井的实际应用示例可以直观地反映出两种评价方法的识别差异(图4),不同方法识别错误的样品区域主要为位于不同流体类型交界处和同种流体类型录井参数变化异常的区域。以深度为2 590 m 和2 630 m 附近流体垂向结构为例,录井评价参数纵向结构发生变化,流体类型需要考虑录井评价参数的时序特征,胶囊网络法在气层、油层、含油水层交界处识别能力明显强于Fisher 向量距离判别法。胶囊网络法通过数字胶囊表达不同录井参数的时序特征,在改善流体类型交界处复杂结构的多样性识别具有一定的优势。

图3 黄河口凹陷Fisher 判别分析法的应用效果

图4 胶囊网络法与Fisher 判别分析法对X1 井流体识别结果的流体解释

表3 二级构造带X 流体录井识别方法正确率

表4 二级构造带X 胶囊网络法与Fisher 判别分析法的混淆矩阵

4 结论

(1)胶囊网络的卷积结构能够有效提取录井参数的局部特征,优于常规的砂泥岩储层录井流体识别方法,传统线性向量距离模型局限于点对点的学习模式,无法有效提取录井评价参数的局部特征。因此,胶囊网络识别流体类型具有一定的优势。

(2)胶囊网络法能够精准且高效地利用子胶囊划分不同流体类型,其快速提取录井评价参数序列信息的特点对于流体类型交界处的识别效果更好。与Fisher 判别分析法相比较,基于胶囊网络的流体识别模型的正确率提高约10%,均高于85%。

(3)基于二级构造带X 井区中数据样本预测结果表明,基于胶囊网络的流体识别模型能够有效挖掘录井各评价参数和流体类型之间的关系,识别正确率较高且具有较强的泛化性,对于胶囊网络方法在其他地质方面的研究具有一定的借鉴价值。

猜你喜欢
录井流体储层
大牛地气田奥陶系碳酸盐岩元素录井特征分析
纳米流体研究进展
冷冻断裂带储层预测研究
流体压强知多少
对如何提高录井工程经济效益的思考
“深层页岩气储层”专辑征稿启事
“深层页岩气储层”专辑征稿启事
山雨欲来风满楼之流体压强与流速
浅谈录井技术现状及发展方向
低孔低渗地层损害原因与油层保护应用