一种用于深度学习断层识别的高分辨率地震图像合成方法*

2023-12-09 08:51江穗华段友祥孙歧峰
计算机与数字工程 2023年9期
关键词:断层标签卷积

江穗华 段友祥 孙歧峰

(中国石油大学(华东)计算机科学与技术学院 青岛 266580)

1 引言

在油气勘探活动中,断层识别是研究断层构造的基础,也是地震资料解释的关键环节之一。断层本身的形态规模,位置与展布对探究地壳构造变化,确定油井定位,了解油气运移通道及盖层封堵性等意义重大。

早期的断层解释是由专业地质人员根据多年的解释经验,联合地震、地质、测井等资料,进行人工分析,再对三维地震数据体进行手工标记,效率低,准确性不高,且受限于解释人员的专业知识和能力。传统计算机智能识别的主要研究思路是以地震反射波形同相轴的不连续为断层特征[1],通过地震属性增强或图像分析、图像处理等方法来检测断层。如相干体分析[2]、方差分析[3]、蚂蚁体算法[4]等,但是这些方法存在参数选择困难、计算流程复杂的不足。

近几年,以深度学习为代表的人工智能新技术的迅猛发展和在很多领域的成功应用,为油藏地质领域的智能解释提供了新的解决思路。2019 年,X.M.Wu 提出以Unet 为基础的faultSeg3D 神经网络模型[5],通过学习大量的理论数据样本实现了对实际工区断层分布的预测,并对比了多种断层识别方法,识别准确率达到了业界较高水平。2021 年,芦凤明等将UNet++网络和迁移学习相结合[6],用于识别复杂断层,大大减少断层漏识别和错误识别的情况,提升了断层识别的准确性。

目前用于断层识别的机器学习模型大都属于有监督学习的学习模型,模型需要用样本标签数据进行训练,即需要通过多轮次的迭代从标记数据中学习断层的地震响应特征,从而使模型最终具有识别断层的能力。影响识别模型能力的一个重要因素是训练数据的建立,一方面模型训练通常需要数万甚至数十万有标记的地震数据,另一方面要保证训练用地震数据的质量,较好地体现断层地震特征。但是人工地震与人工断层解释耗时长、效率低,解释人员的专业水平也影响解释的准确性,因此获得高质量的训练数据集的工作等成本巨大。为了解决这一突出问题,本文提出一种基于CGAN的断层识别训练地震图像生成模型,可以批量生成包含准确断层标签的训练用地震数据集。

2 相关基础

2.1 GAN网络与CGAN网络

Goodfellow 等2014 年在Generative Adversarial Networks[7]一文中提出GAN 网络,GAN 模型由生成器G 和判别器D 两部分组成。生成器G 的作用是学习真实样本,产生新的数据样本,判别器D 负责判断输入样本来自真实数据还是来自生成数据。

原始GAN 输入的是随机噪音向量,不能生成特定属性的图像,为了解决这一问题,Mehdi Mirza等提出了条件生成对抗网络[8](Conditional Generative Adversarial Networks,CGAN)。CGAN结构如图1 所示,CGAN 生成器和判别器的输入多了一个额外信息y,通过额外信息y来约束模型。

图1 CGAN结构

增加的额外信息可以是类标签、文本、边界框、关键点等,它们能够给生成器一些约束,优化了GAN 过于自由的问题,使网络可以根据给定的条件约束生成数据。

2.2 Pix2pixHD

Pix2pixHD 是由英伟达NVIDIA 团队提出的一个CGAN 框架[9],具备输出高分辨率图像的能力,例如可以从语义标签贴图转换为逼真的图像,如图2。

图2 Pix2pixHD示例图

3 本文方法

本章节首先使用断层位置信息对地震记录这种具备自身特殊性的数据建立一种合适的标签映射。然后从生成器网络结构、判别器网络结构以及损失函数三个方面改进Pix2pixHD 模型以适应生成地震记录的任务。

3.1 地震记录标签映射

建立有效有意义的地震记录的标签映射是使用pix2pixHD生成高质量高分辨率的地震记录的第一步,也是关键。

Pix2pixHD原模型采用了语义映射与实例映射两种输入信息,来生成真实世界的图像。在语义映射标签中,每种像素值都代表了一种语义,有相对应的类别值。实例映射则是用来区分同类对象的边界,使得模型能更好地处理有大量同类对象重合情况。

由于地震记录数据的特殊性,所有地震记录都是地层反射地震波后得到的记录。其中,断层是地层发生错动的现象,断层位置即地层不连续的位置,断层不是作为一个单独实例存在,整个地震记录数据中的所有实例都是地层,所以不能将标签设置为地层这一实例的语义值。同时考虑到本方法的目标是生成有标签的断层地震记录图像,这种标签即是断层位置。

所以选取断层位置信息作为CGAN 模型的输入标签用来约束生成模型,在得到生成图像后,可与输入标签配对,成为有标签数据。

本文采用Wu 等在文献[10]中提出的一套生成三维地震记录的算法作为基础,该方法被大量其他学者引用[11~12]。并应用验证了该方法合成地震数据的可用性。算法的基本步骤如下,见图3(a)~(e)。

图3 三维地震记录合成流程图

1)生成水平反射模型如图3(a)所示,其中反射系数为随机在[-1,1]区间中;

2)在水平反射模型中添加地层褶皱操作,并对地层做垂直方向的扭曲,得到图3(b);

3)在模型中加入平移断层,得到图3(c);

4)将Ricker子波与反射模型进行褶积,得到最终的三维地震记录,如图3(d)所示;

5)在Wu 等方法的基础上,添加断层时记录断层位置,对地层进行移动等操作时计算断层位置的偏移,更新断层位置信息,最终可以得到断层标签图3(e)。断层标签0即黑色区域代表非断层位置,断层标签1即白色区域代表为断层位置。

本方法选择断层位置信息作为标签的优势还在于,在有效约束生成器生成空间的前提下,允许地层的不确定性与多样性的存在,即同要素(走向、倾向、倾角)断层可能对应不同地震响应记录。

如图4(a)所示,同样的一条单断层,可以对应如图4(b)、4(c)两张地层扭曲程度不同的地震记录图像,与CGAN 模型对应同一输入给出多种输出的特性相吻合。

图4 单断层标签对应不同地震记录

此外,为了拟合整体地震记录特征,同时也为了更好地约束生成器的潜在生成空间大小,受传统GAN 模型用噪音输入的启发,本文在标签中加入大量的噪点,如图5 所示,作为地震背景的映射,可以更好地体现地震记录特征。

图5 加入噪音的断层标签

3.2 生成器网络

本文设计使用的Pix2pixHD 生成器结构如图6所示,采用了两个生成器网络来实现coarse-to-fine由粗到精的图像生成,分别为G1 全局生成网络global generator network 和G2 局部增强网络local enhancer network。

图6 本文Pix2pixHD生成器结构

全局生成网络的分辨率为512×256,而局部增强网络的分辨率为1024×512,沿着每个维度为之前的两倍。

全局生成网络与局部增强网络结构类似,但是输入输出的规模不同。以全局生成网络为例,其结构由三部分组成:卷积前端G1-F,残差块集G1-R和转置卷积后端G1-B,其输入是512×256 的语义标签映射向量。

G1-F 首先对输入向量进行边界填充,再通过一个64 卷积核的卷积层以及四层步长为2 的卷积层,实现多次下采样的效果。最终输入到残差网络G1-R 的大小为32×16,在高度抽象的情况下,全局生成网络学习到能在全局规模上体现出的特征。G1-R残差块集中残差块的数量根据试验效果进行调整,本文设定G1-R中的残差块数量为4。

在经过残差网络后,512 层的32×16 的语义向量会被输入到由四层反卷积层组成的G1-B 网络,逐层减少维度,提升大小,最终恢复为512×256 的大小。

在全局生成网络单独训练的过程中,会将G1-B的输出通过一个卷积层和Tanh 激活函数转化为三通道的512×256的图片,作为最终生成结果输出。

局部增强网络G2 也存在相应的结构,分为G2-F,G2-R和G2-B。

G2 网络的训练过程在全局生成网络的训练之后,将G1网络作为组成部分,插入到G2-F和G2-R中间,G2-R 的输入是G2-F 与G1-B 两者输出的综合。G2 网络的输入是1024×512 大小的语义标签映射向量,为了满足上述的网络结构,G2-F的下采样只有一层,来保证输出给其嵌套的G1 网络的向量大小为512×256。

在G2-B 的最后,通过一个卷积层和Tanh 激活函数转化为三通道的1024×1024 的图像,作为最终结果输出。

3.3 判别器网络

高分辨大尺度的图像对判别器来是一个挑战,为了有足够的判别能力,判别器需要足够大的感受野,而这就要求网络结构更深和使用更多层的卷积,这又会带来潜在overfit风险。

Pix2pixhd 模型采用了多判别器思想,对图像分层处理。如图7 所示,用3 个结构完全相同的判别器D1、D2和D3分别去负责不同尺度上的判别任务,不同尺度的实现是通过对图像降采样出一个1x,2x,4x 的图像金字塔(image pyramid)。由于图像的尺寸不同,等效于每个子判别器的感受野不同,D3的感受野最大。

图7 多级判别器结构

每个判别器D 都是一个马尔可夫判别器PatchGAN,其网络结构如图8 所示,由5 个卷积层组成。卷积层使用4×4 大小的卷积核配合2 步长,来避免发生棋盘效应。

图8 本文Pix2pixHD判别器结构

与生成器不同,在判别器中使用了LeakyReLU函数作为激活函数,相较于ReLU 函数,LeakyReLU在输入为负值的情况下,依然有输出,避免了神经元“死亡”现象的发生。最后一层卷积层会将维度降到1,输出一个N×N的patch矩阵。

一般GAN 判别器的输出为一个数字,即输入样本为真样本的概率。PatchGAN 的输出是一个N×N的patch 矩阵X,这个矩阵中每个Xij的值代表某个patch 为真样本的概率。最后会将patch 矩阵进行加权平均,得到一个loss值,三个判别器的loss值再取均值,得到一个最终的loss值。

相较于一般图像,地震记录数据图像的一个特征就是局部强相关,全局弱相关。为了拟合地震数据的特点,每层判别器乘以一个影响因子α,随着抽象程度的增大,α快速衰减。通过α因子,实现对局部细节的强化,同时弱化对全局一致性的约束。

3.4 损失函数

本文的损失函数由GAN loss 和Feature matching loss[13]两部分构成。条件生成对抗网络CGAN的损失函数可以表示为式(1):

本文采用了多判别器,同时使用影响因子α来实现鼓励细节强化,弱化全局一致性。优化目标可以表示为式(2):

将判别器D网络中除了输出层的所有层的特征图都用来做feature matching。表示第k个判别器中的第i层特征提取器。ℒF,M(G,Dk)可以用式(3)计算:

其中T为网络总层数,Ni为每层的特征数,(s,x) 为真实图像在中的输出向量,(s,G(s))为生成图像在中的输出向量。

将GAN 目标函数和特征匹配损失函数结合,可以得到最终的目标函数,见式(4):

其中λ用于控制特征匹配损失在整个目标函数的权重,本文研究中设置为5.0。尤其在计算特征匹配损失的过程中,D只用来做特征提取,不会用于最大化ℒFM(G,Dk)。

4 实验及结果分析

4.1 定量评价指标

本文使用FID,SSMI 以及PSRN 对合成图像和真实图像进行定量评估。

FID 分数通过对比生成图像与真实图像的“距离”来产生评估分数。较低的FID 意味着生成器的分布与真实图片分布之间更接近,在真实图像有效的情况下,也就说明生成图像的有效性。

PSNR峰值信噪比是基于真实图像与生成图像之间的可视误差的定量评价指标,计算的是峰值信号的能量与噪声的平均能量之比。PSNR 值越大,代表图像的失真越小,也就是生成图像与真实图像的差距越小。

SSIM 结构相似度是一种用来衡量图片相似度的指标,由亮度对比、对比度对比、结构对比三部分组成。SSIM 取值范围在0~1 之间,越接近1,说明真实图像与生成图像的差距越小。

4.2 实验设置

将本文改进Pix2pixHD 模型与三种其他基于GAN 的模型DCGAN[14]、ProGAN[15]、Pix2pix[16]在进行断层地震图像合成对比实验。

DCGAN 和ProGAN 属于传统GAN 框架,Pix2pix和Pix2pixHD属于CGAN框架,同时DCGAN和Pix2pix 输出分辨率较低,ProGAN 和Pix2pixHD输出分辨率较高。本实验使用DCGAN 输出128×128,ProGAN 输出1024×1024,Pix2pix 输出256×256,Pix2pixHD输出1024×1024分辨率图像。

所有实验采用的训练集地震源数据相同,采用地震记录标签映射一节中提到的三维地震数据生成算法合成三维地震记录与相应的断层标签映射,最终得到多个尺寸大小为256×256×306 的三维地震记录数据块与相应的断层标签数据。

从三维数据体中切片二维地震图像,作为本文的实验数据集,总计切片了200 对(标签与地震记录)的训练数据和100 对验证数据,而且验证数据集中的数据均没有用于模型训练。

由于分辨率的限制,在训练DCGAN时,缩放到了128×128 分辨率。只有Pix2pix 与Pix2pixHD 属于CGAN 模型,所以断层标签数据只在此两个模型上启用。

4.3 实验结果及分析

对四个训练好的模型,进行了60 组合成生成断层地震图像实验,从定性和定量两个方面进行结果分析。图9~图11 给出了3 组各对比模型合成生成的断层地震图像。

图9 第一组模型合成断层地震图像对比

图10 第二组模型合成断层地震图像对比

图11 第三组模型合成断层地震图像对比

DCGAN 与ProGAN 由于是传统GAN 模型,输入为随机噪音,不受约束,所以在评价其生成图像质量时,不从约束条件断层标签的角度出发。

从图9~图11可以看出:

1)DCGAN 模型基本未学到任何图像特征,只是一层模糊的像素堆积,可能与地震图像的特点有关,不同于现实图片的多彩,特征明显,更易于学习。地震图像整体只有黑白两色,除了地层,没有明显特征。对于无约束GAN 模型,学习难度过大。DCGAN 模型的结果基本不可用,视觉感知效果很差。

2)将真实图像和本文的Pix2pixHD 生成的图像对比,地层清晰,没有地层模糊的情况。同时断层位置与断层标签相符合,也与真实图像的断层位置基本一致。

3)将Pix2pix 的图像与Pix2pixHD 以及真实图像对比,可以看到pix2pix 在结构方面学习到了部分特征,地层明显,断层位置与目标位置相差不多。不过由于其缺乏多级判别器结构,在细节方面不够清晰,整体有点模糊,类似有一层噪音。

4)将ProGAN 的生成图像和Pix2pixHD 以及Pix2pix 图像对比,可以看到ProGAN 勉强学到了地层特征,有地层的雏形。从视觉效果上,ProGAN没有像Pix2pix 那样模糊的感觉,也体现了ProGAN 在高分辨率方面的能力。

同时,对60 组的实验结果进行了定量FID、PSNR、SSIM三个指标的统计和分析,结果见表1。

表1 不同方法地震合成图像统计结果

从表1可以看出:

1)DCGAN 的FID 高达273,说明图像与真实图像差距巨大;PSNR 只有14,由于地震图像只有黑白两色,决定了PSNR 不会有太大差距;SSIM 为0.092,与视觉感知相符合。

2)本文模型的FID只有20左右,相比其他模型结果低了一个数量级,PSNR 大于40,而SSIM 为0.902,十分接近1。三个指标数值大小与视觉感知效果相匹配,说明模型同时学习到了细节特征与宏观特征,效果优异。

3)Pix2pix 的SSIM 为0.313,明显高于ProGAN与DCGAN,但远低于Pix2pixHD。其FID 与PSNR不理想,与其在细节方面学习能力不足有关,也与视觉感知效果相一致。

4)ProGAN 的定量指标都相对较差,考虑到ProGAN 与DCGAN 都属于传统GAN,输入为随机噪声,这种表现可以理解,对于地震图像这种特征不明显的数据,在没有约束条件的情况下,想优化到一个局部最优解的难度很大。

综上实验结果分析表明,本文模型的生成断层地震图像在视觉感知效果和定量评价指标上都明显优于其他三种方法。

5 结语

机器学习特别是深度学习在油气资源领域中的识别、预测、解释等方面有广阔的应用前景,也越来越受到重视。本文针对有监督机器学习模型研究中断层地震图像训练数据不足、数据质量差、标注困难等问题,提出了一种基于Pix2pixHD 框架的地震图像合成方法,通过对Pix2pixHD 模型的进行改进,使得其更适应地震响应的“局部强相关,全局弱相关”的特性,提高了地震图像中的地层细节。实验结果表明,本文改进的Pix2pixHD 模型在合成地震数据图像方面,有着更良好的真实特征表现,以及更优的定量评价指标,实现了高分辨率的地震图像生成,从而可高效地获得高质量的训练数据集。深度学习的领域应用提供了基础支持。

猜你喜欢
断层标签卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
基于傅里叶域卷积表示的目标跟踪算法
标签化伤害了谁
基于多进制查询树的多标签识别方法
一种基于卷积神经网络的性别识别方法
断层破碎带压裂注浆加固技术
关于锚注技术在煤巷掘进过断层的应用思考