段太忠,张文彪,何治亮,刘彦锋,马琦琦,李 蒙,廉培庆,黄 渊
(1.中国石化 石油勘探开发研究院,北京 102206;2.中国石油化工股份有限公司,北京 100728)
深层-超深层断控缝洞型储集体受到较为广泛关注,尤其在近几年,中国塔里木盆地接续发现大型断控缝洞型油气藏[1-2],为支撑其高效开发,储层的精细表征工作更加受到重视。不同学者针对断控缝洞型油气藏的分类、形态特征、预测技术、产能特征等做了较多的研究工作[3-11],揭示了断控缝洞型储集体具有纵向分层、平面分段的特点,并摸索出了一系列断溶体三维地震刻画的技术方法[12-15]。同时,断控缝洞型油气藏地质建模工作已处于传统的确定性建模与地质统计学建模相结合的应用阶段[16-18],通过建模-数模一体化支撑着开发过程调整。然而,随着塔里木盆地顺北超深断控缝洞型油藏开发节奏的加快,传统的地质建模技术在应用过程中呈现如下问题:①开发早期可用于标定的井数据数量极少,地质统计学建模的不确定性较大;②传统的分层次地质建模效率较低,难以支撑快速的模型建立和更新。
深度学习地质建模技术具有信息综合性强、模拟效率高的优势,目前在河流相地质建模应用中已取得了良好的效果,表现出了较好的发展潜力。为探索更准确、更高效的断溶体油气藏地质建模技术,本研究以塔里木盆地顺北地区为例,通过建立大量训练样本,引入深度学习算法,搭建了深层断溶体分布预测的训练网络,初步形成了一套适用于顺北地区的断溶体深度学习地质建模方法,并基于实例分析了其应用效果,以期为断溶体油气藏勘探开发提供更高效的技术支撑。
顺北地区构造位于塔里木盆地顺托果勒低隆起西北部,沙雅隆起的西南倾没端,东西分别紧邻满加尔坳陷和阿瓦提坳陷,南北分别邻近卡塔克隆起和沙雅隆起,构造特征北高南低、东高西低,构造平缓。该地区经历多阶段构造演化活动,主要含油气层位为奥陶系一间房组和鹰山组,岩性为碳酸盐岩,受大型走滑断裂活动及溶蚀作用双重控制,主要的储集体类型为断裂/裂缝、溶孔及溶洞。研究区为顺北5号断裂带南段(图1),该断裂带全长约55 km,目标储层埋深超过8 000 m,目前沿断裂带已钻各类井7口,录取了多种动静态资料,分析发现在断裂带不同位置的钻井所揭示的流体性质、压力变化和产能特征存在巨大差异,反映了断控缝洞型储集体内部极强的非均质性。建立更加准确的断溶体三维构型模型,是指导断控缝洞型油藏高效开发的重要基础。
图1 塔里木盆地顺北油田顺北5号断裂带南段位置Fig.1 Map showing the location of the No.5 fault zone in Shunbei oilfield,Shunbei area,Tarim Basin
近些年,以大数据和深度学习为基础的人工智能技术在油气领域得到了快速发展[19-25],在测井资料解释、地震储层预测以及非常规油气藏产能预测中均取得了较好的应用效果。油气藏地质建模属于多学科集成式研究范畴,传统的两点地质统计学、多点地质统计学和基于沉积过程的建模技术已形成较为成熟的多学科研究流程,而人工智能地质建模技术就是要深度挖掘多学科之间的复杂耦合关系,关键是要构建适应于多学科、多维度和多尺度数据的多层神经网络框架,解决面向复杂地质对象的生成式问题。
以深度学习为基础的人工智能地质建模主要采用生成对抗网络(GAN)。生成对抗网络建模包括非条件化模拟和条件化模拟。非条件化模拟不要求模拟结果与观测数据吻合,只需要训练后的网络可以生成与训练样本类似的地质模式即可;条件化深度学习建模则要求模拟结果与观测数据吻合。油气藏地质建模的最终结果需要与已知井数据吻合,因此,条件化模拟是人工智能地质建模的重要攻关内容。
2.1.1 生成对抗网络
生成对抗网络由 Goodfellow 等[26]于2014 年提出,指从图像的潜在空间中采样,并创建全新图像,是目前最流行的生成式人工智能网络。生成对抗网络由生成网络(G)和鉴别网络(D)组成,生成网络尽量生成逼真的图像结果,鉴别网络尽量提高自身对真假图像的鉴别能力,损失函数同时对这两种网络的参数进行优化(图2)。
图2 生成对抗网络的基本结构Fig.2 Sketch diagram showing the basic structure of generative adversarial network(GAN)
生成对抗网络已经被证明可以生成高质量的二维和三维图像,该训练框架中,生成网络将从先验分布p(z)采样的随机向量z映射到图像空间,鉴别网络将输入图像映射到似然概率(判断真假的概率)。生成网络的作用是生成大量认为“真实”的图像,而鉴别网络起着对抗的作用,即从生成网络生成的数据分布Pdata中区分出真实图像,其公式如下:
式中:V是散度;G是生成网络;D是判别网络;h是来自全部的训练图像(Pdata)分布的样本;x表示随机样本;Pdata(x)表示随机样本分布;D(h)是对样本的判别;E是期望;z是潜在空间上的随机编码;Pz表示随机编码分布;G(z)是生成的模型;D(G(z))是判别器对生成器的判别。
根据地质建模输入数据的特点,为了突出训练网络模型的生成能力,降低参数量和训练难度,整个网络均由卷积单元和转置卷积单元组成,不包含全连接层,每个单元配套一个批量标准化层和非线性化层。
2.1.2 条件化生成对抗网络
条件化生成对抗网络通常包括两类,分别为二次条件化和直接条件化。二次条件化方法是指在非条件化生成对抗网络计算结果的基础上,通过优化算法进行反复迭代,直至其与条件数据相吻合;直接条件化方法则是在构建网络的过程中,把条件数据作为输入参数,训练过程中通过正则化的方法进行条件化,直接实现条件化生成对抗网络模型的构建。由于二次条件化方法需要大量的迭代运算,计算量大、耗时长,本研究采用了直接条件化深度学习地质建模方法。
直接条件化深度学习地质建模方法需要对网络结构进行正则化改进,也就是将地质建模问题视为图像恢复问题。基于图像语义恢复技术[27-30],以卷积对抗网络(DCGAN)为基础,通过定义损失函数,实现了油藏尺度和岩心尺度基于生成对抗网络的地质建模方法,取得了较好效果。但该方法定义的损失函数仅考虑以井点数据为中心的固定影响半径,且仅能模拟二维空间的油藏模型。针对以上问题,Zhang 等[31]进一步改进了损失函数正则化方法,将生成对抗网络地质建模扩展应用到三维,实现了少量且随机分布的条件数据约束,在河流相储层模拟中得到了初步验证。
生成对抗网络具有强大的模式再现能力及条件化能力,但生成网络仅能满足当前训练时给定的输入条件,一旦变换已知条件,如随着油气田开发过程,钻井数量、井位分布、相比例认识等都会变化,此时,已训练的模型则无法继续使用,还要重新进行网络训练,耗时耗力,因此有必要开发具有更强条件化适应能力的生成对抗网络。Song等[32-33]尝试了将模拟器直接条件化的地质建模方法应用于河道相模拟,通过基于目标算法生产的案例作为训练样本,并把河道宽度和弯曲度、砂岩与泥岩的含量比、概率分布图等作为约束条件加入到模拟器中,取得了较好的测试效果。
目前深度学习地质建模技术已经从二维走向三维、从非条件化进步到条件化。油气藏地质建模的输入参数往往是平面稀疏、纵向高精度的井点数据和平面稠密、纵向低精度的地震数据,对于深层断溶体油气藏,更是面临可用于标定的井数据极少的难题,充分挖掘并利用好三维地震信息,是本研究断溶体深度学习建模的关键。
2.2.1 断溶体地质建模深度学习网络搭建
条件化生成对抗网络(CGAN)可以实现从语义/标签到真实图像的直接转换,且支持多种条件生成,例如分类条件图像自动生成,图像到图像(Pix2Pix,P2P)转换或图像自动修复。目前的条件化地质建模多采用随机向量、井点数据、地震预测数据作为网络输入,同步实现条件化。断溶体油藏往往井数据少,且大部分井仅钻遇储层的顶部,统计意义不强,因此,本研究主要考虑地震数据作为建模的输入,选择图像到图像转换的网络[34-36]作为断溶体深度学习建模的主要方法。
图像转换网络的目标是把一幅图像转换为另一幅图像,本质上是像素到像素的映射问题,该网络可以表达地球物理数据与地质现象之间的复杂映射关系,是条件化生成对抗网络中的典型代表。本研究建模的思路就是把地震反射剖面和地质结构剖面分别作为两个图像,通过条件化生成对抗网络建立两个剖面之间的映射关系,实现深度学习建模。
条件化生成对抗网络将学习观察到的地震图像(x)与地质模型(y)之间形成映射关系:G:{x}→y,其中,生成网络产生大量包含“真伪”的地质模型图像库,鉴别网络尽可能检测出生成器中的“伪”地质模型图像(图3)。
图3 基于P2P网络的断溶体地质建模主要框架Fig.3 Sketch diagram showing the main framework of fault-karst geological modeling based on P2P network
条件化生成对抗网络(CGAN)的目标函数可以表示为:
式中:L表示损失函数。通过在对地质图像“去伪存真”的过程中不断优化生成器网络和判别器网络,得到最优的适用于断溶体预测的网络。
与传统条件化对抗生成网络不同的是,生成网络采用了类似U-Net 网络的跨层连接结构,它能更好地模拟地质体的多尺度特征(图4)。图像转换问题的一个特征就是将高分辨率的输入网格映射到一个高分辨率的输出网格。输入和输出在表象上虽然不一样,但是在底层结构上却是一致的,反映了相同的地质规律。为了使生成器避开信息瓶颈问题,模仿“U-Net”增加了跳线连接,在第i层和第n-i层之间添加跳线,其中n是网络的总层数。每根跳线将第i层和第n-i层的特征通道连接在一起。
图4 U-Net型网络结构的生成网络Fig.4 Sketch diagram showing the generative network of U-Net type
2.2.2 断溶体地质建模训练样本构建
训练样本获取难度大是深度学习地质建模面临的另一个关键问题。地下地质体的真实样本获取难度大且费用高,目前研究中普遍采用基于目标或基于地质过程的方法生成大量符合地质认识的合成样本,但该做法仅能满足算法的一般性测试。基于目标的方法只能模拟预设的几种简单几何形态的地质体;基于地质过程或地质事件的模拟方法可以一定程度上体现地质规律的约束,但前提条件是对于地质规律的把握较为清晰,且可通过一定的数学方程进行表达,目前对于沉积型储层较为适用。断溶体属于强改造型储集体,储集体的形态不规则,基于目标的方法和沉积过程模拟方法均不适用。本研究主要基于井数据、地震数据和动态数据,首先通过多学科综合建立既符合静态特征又反映动态规律的断溶体油藏模型,然后将符合多维度数据特征的该油藏模型与三维地震数据进行匹配,建立具有映射关系的训练样本。
基于前期研究认识,断溶体的构型要素按照规模依次包括外部轮廓、缝洞组合和大型溶洞,且三者之间由外向内属于包含关系,外部轮廓代表断溶体的整体发育规模,轮廓内部发育不同的缝洞组合,缝洞组合内部最主要的储集空间为大型溶洞。通过单井标定及地震多参数分析,采用地震结构纹理属性预测断溶体外部轮廓,轮廓约束下采用包络能量属性预测缝洞组合,最后采用剩余阻抗属性得到内部大型溶洞分布。多级构型要素组合,初步得到断溶储集体模型,再通过单井生产动态信息的校正,得到当前状态下较为准确的三维模型。将该三维地质模型与三维地震数据进行匹配,每个地震剖面和对应的地质模型剖面作为一个训练样本对,训练样本a1—n1表示断溶体三维构型模型剖面,b2—n2表示对应的原始地震数据,训练样本具有“原位等尺度”特点,更加适合深度学习网络的训练。从随机抽取的4组样本(图5)可以看出,断溶体结构与地震数据有基本的对应关系,但难以用简单的数学语言直接表述,只有通过生成对抗网络进行训练,才可以建立两者之间复杂的映射关系。
图5 断溶体深度学习训练样本Fig.5 Training dataset for deep learning of fault-karst reservoirs
2.2.3 断溶体深度学习网络训练
本研究构建的训练样本数据位于顺北5 号带南段的中部,其中地震训练样本的尺寸要求尽量保持一致,且训练的结果也不会超越地震资料本身的分辨率。另外,训练过程中样本的数量也不是越多越好,样本尽量要精准、代表性强,涵盖所要预测储层的各类特征,过多具有无效信息的样本反而会影响训练的速度,而且容易造成过拟合现象。本研究选取了256 组剖面作为样本,基于上述建立的断溶体生成对抗网络进行训练,其中生成网络以地震数据作为输入,地质模型作为输出;判别网络以地质模型和地震数据作为输入,输出是取值为0~ 1 的概率。将256 组样本训练一遍为一轮,观察测试集中同一个剖面的不同训练阶段的模拟效果。第1 轮训练结束后,生成网络的预测结果仅能模拟断溶体的大致轮廓,准确度不高;第3 轮训练结束后,已可以模拟断溶体内部的初步结构;待第8轮迭代完成后,已经基本能模拟断溶体内部的构型要素,不同剖面训练结果展示了不同的结构样式(图6a1,a2,a3—c1,c2,c3),说明该模型没有发生模式坍塌效应。此外,判别网络和生成网络的训练误差也在不断下降(图6d),并逐步停止变化,进一步体现了该训练网络的可靠性。
图6 针对断溶体的P2P生成对抗网络训练过程Fig.6 The training process of P2P GAN for fault-karst reservoirs
基于以上建立的深度学习网络,对顺北5 号断裂带南段断溶体内部结构进行深度学习建模应用。采用滚动训练预测的研究思路,首先,将研究区中部的训练网络迁移应用到北部(图7a),以检测该深度学习网络的预测效果。从建模测试结果来看(图7b1—b3,c1—c3),断溶体的分布与地震反射异常具有较好的对应关系,测试结果与检验标签之间整体形态较为相似,内部的缝洞结构分布也较为合理,体现了断溶体构型要素之间的约束关系。
图7 塔里木盆地顺北5号断裂带南段深度学习建模方法测试效果Fig.7 Test results of deep learning-based geological modeling in the south segment of the No.5 fault zone in Shunbei area,Tarim Basin
进一步将该训练网络快速应用到整条断裂带,预测不同类型断溶体结构的空间分布以及与钻井之间的吻合度。从三维建模结果来看(图8),断溶体沿着走滑断裂带呈现纵深发育,且宽窄不一、断续分布,平面上不同位置处的发育宽度以及溶洞的发育密度不同,均表现出走滑断裂的分段性特征,说明断溶体深度学习建模结果的地质意义较为明确。
图8 塔里木盆地顺北5号断裂带南段断溶体深度学习地质建模结果Fig.8 Deep learning-based geological modeling of fault-karst reservoirs in the south segment of the No.5 fault zone in Shunbei area,Tarim Basin
另外,从顺北5 号断裂带南段的发育结构来看(图9),虽然该断裂带整体为走滑拉分性质,但局部特征不同,空间变化特征明显。缝洞结构具有受断溶体形态约束的特点,从底部到顶部裂缝密度逐渐变小、孔洞密度逐渐变大,这与断溶体储层沿纵深发育的规律相一致,即溶蚀强度沿顶部界面向下呈现逐步减弱的趋势,展示出大型断裂对断溶体整体形态的主要控制作用。把该断裂带建模结果与单井钻遇的放空漏失结果对比发现,溶洞带建模结果吻合率78 %,缝洞带建模吻合率83 %,断溶体轮廓带吻合率超过90 %。
图9 塔里木盆地顺北5号断裂带深度学习建模结果与三维地震叠合效果Fig.9 Deep learning-based modeling results overlying the 3D seismic data of the No.5 fault zone in Shunbei area,Tarim Basin
深度学习在油气藏地质建模领域具有较大的应用前景,本研究以深层断溶体为例,初步探索了一套以地震驱动为基础的三维储层建模方法,并取得了一定效果,但从建模方法的实现过程及结果来看,仍存在一些关键问题需要进一步攻关和探索。
1)需要大规模训练样本的难题仍难以克服。目前的深度学习网络具有很强的模式再现能力,但前提是需要提供大规模高信息量、低冗余度的训练样本,而在地质学领域,往往很难获取足量的样本,尤其是符合地质学规律的三维训练样本。本研究应用的图像到图像网络在训练过程中,也受到了训练样本是否足量的限制,因此,有必要进一步开发基于小样本的深度学习地质建模方法,或以测井相、生产动态作为半监督的分类方法等,以专家知识的优势弥补训练样本的不足。
2)深度学习地质建模过程的条件化仍任重道远。目前在河流、三角洲沉积储层的深度学习建模研究中,已有相关学者加入了多种约束条件,进行了建模结果的条件化尝试。而对于深层断溶体储层,其形成过程和发育规律与河流、三角洲储层有本质区别,约束条件也存在差异,因此难以直接借鉴其相应做法。本研究所应用的深度学习网络,在样本制作过程中力求达到井震标定和多数据吻合,并基于此迁移应用到其他区块,虽然取得了一定效果,但从条件化深度学习建模方法的要求来看,尚未真正实现将条件约束数据加入到深度学习网络中,如将井点标定的放空漏失段作为一种硬数据约束,或将断溶体不同构型要素的比例作为约束条件加入到训练网络中,人工智能的条件化方法仍需进一步探索。
3)深度学习地质建模的精度仍受基础资料的限制。地质模型的精度和准确度是评价其优劣的重要标准之一,在确保模型准确的前提下,总是希望地质模型能够在精度上更加逼近地质家所描述的储层非均质性。地质模型的精度取决于输入数据的分辨率及所采用的方法,传统的地质统计学方法可以比较容易实现尊重井数据的统计规律,且根据研究需求甚至可以实现与单井分辨率基本一致的模型结果。而深度学习地质建模的精度受到训练样本以及迁移数据资料的精度限制,本研究针对的深层断溶体储层,训练和预测的基础均主要来自于三维地震资料,因此,建模结果也难以突破地震分辨率的限制。未来深度学习网络如果具备了更好的自学习能力,在加入井数据作为约束条件下,实现从地震分辨率到测井分辨率的逐步提升,对于深度学习地质建模方法将是巨大的提升。
1)形成了一种基于深度学习的断溶体地质建模方法。图像到图像网络是条件化生成对抗网络的典型代表,在大数据样本构建及网络训练基础上,可以实现从地震数据到地质模型的快速转化。
2)深度学习建模方法在顺北地区的应用取得了初步效果。通过“原位等尺度”训练样本的构建及网络迁移,塔里木盆地顺北5 号断裂带南段断溶体的三维建模结果具有分布模式合理、钻井吻合度较高的特点,但本次建模精度仍难以超越地震的分辨率。
3)深度学习地质建模仍存在样本需求量大、条件化程度低、建模精度难提升等诸多难题,积极探索基于小样本的、具有自学习能力的新的深度学习网络是今后努力的方向之一。