张 鑫, 雷德文, 李献民, 阎建国, 黄闻露
(1.中国石油新疆油田分公司勘探事业部, 新疆 克拉玛依 834000; 2.成都理工大学 地球物理学院, 成都 610059)
地震相分析方法已经成为地震资料解释和储层预测的常用方法之一[1]。近年来,利用深度学习算法更好的挖掘地震数据中的隐蔽和有用信息,帮助研究确定地震相的地质意义,引起人们的广泛关注,成为地震资料解释及储层预测的方法和应用研究的热点之一[2-6];另外,地下地质目标十分复杂,地震响应特征和地质目标并不是一一对应[7-9],并且判断地震相的地质意义受到人为因素影响从而具有很强的主观性。因此,利用多种深度学习算法是否有利于提高地震相分析结果的可靠性,成为基于深度学习算法的地震相分析方法和应用研究的重要研究方向[10]。
Marroquín等[11]系统介绍了利用自组织映射网络图(self-organizing map,SOM)进行波形分类地震相分析的方法技术和应用效果。SOM强大的聚类能力及其可以将高维数据映射低维数据,使其逐渐成为无监督波形聚类地震相分析的主流方法。在深度学习方法的发展下,于海鹏[12]在将近一百张地震剖面中,通过人工识别的方式,划分出了5种不同的地震相结构。张军华[13]提取6种地震属性,将支持向量机(support vector machines,SVM)应用到储层预测中。乔英汉[14]提出了一种基于半监督生成对抗网络(semi-supervised generative adversarial network,SGAN)的半监督地震相分析方法,利用生成对抗网络(generative adversarial networks,GAN)更有效地提取地震数据中的隐藏信息。半监督网络能够有效地利用有限标签,对没有标签的训练数据进行特征提取,改善训练结果[15]。
机器学习算法在提高地震相分析的效率以及减少地震相预测中的不确定性方面也发挥了重要作用,Thilo等[16]介绍了相关的最新成果,Kaur[17]利用GAN对地震数据进行分割,同时在网络框架中加入不确定性分析,以此反映网络预测结果的置信度。
基于上述的国内外相关研究方向及研究成果,围绕进一步提高地震相分析结果的精度和可靠性等问题,本文提出和研究了一种从标签训练到数据挖掘再到结果优化的全过程深度学习地震相分析的方法和流程。首先用无监督的神经网络算法SOM进行波形分类,制作标签数据;然后利用卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)等有监督的深度学习算法进行地震相分析,最后结合GAN对抗的思想实现各种算法的优化及结果的不确定性分析并结合实际资料分析给出最优结果。通过新疆阜东河道砂体油气储层预测的实际应用,取得了符合实际情况的良好效果,为研究区的储层综合研究提供了支撑。
本文提出的SOM+CNN/RNN+GAN监督和非监督联合的深度学习地震相分析方法和流程,实现了从标签训练到数据挖掘再到结果优化的全过程深度学习算法的应用,提高了地震相分析的智能化程度。
深度学习算法可以概括为监督与非监督两种主要类型,两者的区别主要体现在训练时是否需要为其提供标签数据。有监督深度学习算法主要优点是更强大的数据挖掘或特征提取能力;无监督深度学习算法主要优点是无须标签数据,通过自主学习样本数据中的内在关系,完成数据挖掘。一般而言,地震相分析采用是一种“模式识别”的思想,因此有监督的深度学习算法对于深度挖掘地震相特征更有力[18-20],但标签及训练数据集的产生方法、类型和质量等,直接影响有监督深度学习算法的效果。无监督学习不再需要大量的标签数据,利用聚类的思想,将属性本身作为训练数据。采用有监督和无监督联合的方法,完成了从标签制作,数据挖掘或特征提取,再到算法优化及结果优选的全过程的深度学习。经过实验对比分析,最终选用了波形作为地震反射特征参数进行波形分类的地震相分析方法。
由于SOM、CNN、RNN的一般网络结构已被人们熟知,接下来重点介绍算法的数学表达和这些算法在地震相分析中的实现方法。
SOM[21]是一种应用较广泛的无监督型深度学习算法,模型由且仅由输入层和输出层组成。SOM训练过程不同于一般神经网络基于损失函数的反向传递,它运用竞争学习策略,依靠神经元式之间相互竞争,来选取最优匹配神经元(式1)逐步优化网络,并且按照临近关系函数(式2)维持输入空间的拓扑结构。
yi=argmindiff(x,wi)
(1)
式中:x为输入数据;wi为权重系数;输出节点yi被称为“胜者节点”。
(2)
式中,θ为尺度因子;d为权重w与输入属性向量x的拓扑距离。
SOM方法原理及其在波形分类的地震相分析中的应用效果,Chopra和Marfurt[22]做过较系统的介绍。本文利用SOM方法原理,一方面进行地震相的无监督划分,提供一种地震相分析结果作为参考;另一方面,将该地震相分析结果作为标签和训练数据集的选择基础。从而可以得到一种快速自动的标签制作方法,为下一步的有监督深度学习算法创造条件。
CNN卷积神经网络通过多层卷积核的卷积运算,按照标签“模式”能够提取到样本的细节特征。卷积运算的基本数学表达如式(3)所示。卷积神经网络最重要的几个网络层分别为卷积层、激活层、池化层及全连接层。
(3)
本文实现的地震相波形分类中,是将每个5×5×d的小三维数据体标注为一类,最终的输入数据为N个5×5×d的小的三维数据体。N为小三维数据体的个数;d在这里表示的选取的时窗长度。
考虑到地震信号属于一种时间序列信号,而RNN循环神经网络适用于时间序列信号的分析,因此研究了RNN的地震相分析适用性问题。采用对传统RNN改进的长短时记忆网络(long short-term memory,LSTM)实现波形分类的地震相分析。
LSTM引入了遗忘门和记忆门的概念。可以根据前一时刻的记忆xt-1和当前的输入xt,决定修改输入的内容,也就是选择遗忘部分记忆。记忆门根据xt-1的记忆和当前的输入xt,决定增加哪些内容。
生成对抗网络GAN采用一种“对抗”的思想进行机器学习。虽然没有标签数据,但通过对训练抗,使GAN学习到真实数据的特征。GAN主要由生成模块和判别模块组成(图1)。生成模块又叫作生成器(generator,G),负责依据输入向量产生判别内容。判别模块又叫作判别器(discriminator,D),主要用来分辨输入的信息是“真实”的数据,还是生成模块生成的“假”数据,输出一个概率值,代表着内容的真实程度。
图1 GAN网络结构
GAN的数学表达式为
GAN(G,D)=Ex,y[lnD(x,y)]+
Ex,z[ln{1-D[x,G(x,z)]}]
(4)
式中:E为熵;x为输入;y为真实数据的分布;z为生成器的生成数据的分布;D(x,y)为鉴别器的值;G(x,z)为生成器的值。
利用GAN算法,实现了一种二维图像间的“对抗”分析,用于CNN和RNN地震相分析结果的对抗以及CNN不同标签下的地震相分析结果的对抗,进行了不确定性分析,实现了各种地震相分析方法的优化,提升了深度学习算法的地震相分析效果和可靠性。基于GAN网络进行的算法优化和不确定性分析,总体上有以下三种模式。
1)同一种算法结果的自身对抗:将CNN的训练结果为“真”,用相同CNN训练的结果去“对抗”。
2)不同算法之间对抗优化:用CNN的训练结果为“真”,RNN的训练结果去对抗和用RNN的训练结果为“真”,CNN的训练结果去对抗。
3)同一种算法不同参数所得结果之间的对抗优化:用CNN不同标签下所得结果的对抗优化。
实际资料应用中采用了SOM+CNN/RNN+GAN的监督与非监督联合的地震相分析方法,方法流程如图2所示。
图2 监督与非监督地震相分析方法流程
以新疆阜东某三维工区的河道砂体储层预测为例,说明所提出方法的应用效果。
新疆阜东5井区构造位置上属准噶尔盆地阜康凹陷的阜东斜坡区,东邻北三台凸起,北接白家海凸起,南接阜康断裂带,工区北部以沙漠为主,南部以农田为主,工区地势较为平坦,北高南低。
研究工区为阜东5三维工区的一部分(图3)。图3中的红框部分为研究的工区范围,图中的红白区域展示了河道砂体的分布。研究区主要目的层为侏罗系头屯河组二段的河道砂体储层。由图3和卞保力[23]的研究可知,研究区河道发育,且分流河道网状交织,叠加样式多样,河道边界识别难度大,河道空间展布形态不清楚;由于阜东斜坡沉积环境与相带不同,河道砂体在储层评价的各方面都会表现出差异,包括砂体含油的流体饱和度等。
图3 研究区目的层段平均振幅属性
按照方法流程,首先利用SOM进行波形分类,并用这个分类结果作为标签制作和训练数据集选择的参考。虽然最后的地震相分析只分了7类,但考虑到应从尽可能多的分类中选择具有代表性的7类数据,首先利用SOM“大数据”分类,进行了21类分类,得到21类标签数据[图4(a)]及对应的训练数据集。根据已知信息挑选出7种具有代表典型模板波形[图4(b)]作为最后的标签数据。
图4 模板波形
按照目的层段视窗厚度,最终构建出了7个(5×5×目的层段时窗)大小的3维地震标签数据体及与之对应的7个训练数据体。
我们将挑选出7种具有代表性的模板波形作为监督学习的标签数据,利用CNN和RNN网络结构进行地震相分析,得到地震相分析结果如图5和图6所示。
图5 研究区目的层段CNN波形地震相分析结果
图6 研究区目的层段RNN波形地震相分析结果
由图5和图6并对比图3可知,CNN和RNN的地震相结果都能刻画研究区的河道分布,但两种方法所刻画的河道数量和分布形态不完全一样,地震相分析结果存在不确定性。
由于实际地下地质条件的复杂多变,地震相分析结果与地质目标不是一一对应;用于监督算法的标签数据的不同也带来同一种算法不同的结果,即不确定性。针对不确定性选用GAN(生成对抗网络),利用“对抗”的思想来实现不同算法之间、不同结果之间的“对抗”优化和不确定性分析。
实际资料应用中,将CNN的结果作为较为确定的数据,RNN的结果作为不太确定的数据,输入到GAN网络中进行对抗,结果如图7示。由图7可知,相比于用GAN优化前的RNN地震相结果(图6),优化后的地震相分析结果(图7)对河道的反映更为清晰;对比CNN结果(图5),优化后的地震相分析结果在河道形态反映上也有改进。基于GAN网络的地震相分析结果,在河道展布形态的识别上,给出更确定的河道分布。这些河道分布(图7中的黑色虚线框出区域)与工区内已知井的河道砂体地震反射特征分析结果相对应(表1):平面上的河道特征与剖面上目的层段间的“透镜体”反射及地质上的认识对应,可以确定这些分类结果指示了河道,地震相平面图则展示河道的分布情况。综上分析,GAN通过“对抗”,在优化了RNN结果的同时,也看到了CNN结果中的不确定性,使最后得到地震相分析结果更具有可靠性。
表1 头屯河组二段地质地震特征
图7 研究区目的层基于GAN网络得到的地震相分析结果
在确定了研究区目的层的河道分布后,结合研究区的已钻井和已知信息,进一步分析不同河道砂体的物性分布及含油气情况。图8为过FD_05井和FD_051井的地震剖面图,其上标注了已钻井的含油气情况。由图7可知,FD_05井和FD_051井之间被另一条河道分割(图7中的白色框区域),结合图8已知钻井结果,由于另一条河道的叠置,造成原本处于同一条河道上的FD_05井和FD_051井处的砂体物性发生了变化,从而其砂体储层的含油气性也不相同。FD_05井处为含油气有利砂体,FD_051井砂体为含油气不利砂体。结合研究区内的已钻井和已知信息,完成了有利河道砂体的分布预测,预测了I~IV类有利储层(图9)。FD_05井所在河道为一类有利河道砂体;FD_052井所在河道砂体为二类有利河道砂体;FD_10井北部的河道为三类河道砂体;FD_051井的河道为四类河道砂体。本次研究中所提供的有利河道砂体的预测结果,为后期的井位部署提供了依据。
图8 过FD_05井和FD_051井的地震剖面
利用无监督SOM方法,提供一种地震相分析的参考结果,并为监督学习算法提供有意义的标签数据,从而发挥了“模式识别”算法的优势,可以得到更精确的地震相分析结果。
基于GAN网络的“对抗”思想,进一步优化了不同算法地震相分析的效果,在一定程度上解决了不确定性问题。
本文提出的SOM+CNN/RNN+GAN的地震相分析方法及流程提高了地震相分析的精度和可靠度。实际资料应用表明,其结果能得到更加符合已知情况的砂体识别结果,为研究区的含油气有利砂体识别的综合研究提供了支撑。