张 浩,冯兴强,付 昌,孙 辉,王晓毅,芦永明
(1.中国地质科学院地质力学研究所,北京100081;2.自然资源部古地磁与古构造重建重点实验室,北京100081;3.中国石油集团东方地球物理公司辽河物探处,辽宁盘锦124010;4.中国科学院地质与地球物理研究所,北京100029;5.南方科技大学地球与空间科学系,广东深圳518055)
随着油气地震勘探技术的发展,基于双程波方程的逆时偏移技术(RTM)成为对日益复杂的地质构造进行准确成像的有力工具[1-6]。近年来,随着多分量采集技术和计算能力的进步,叠前弹性逆时偏移(ERTM)越来越受到重视。与常规声波成像相比,ERTM在储层监测、油气检测和岩性识别方面具有很大优势,是近年来地震成像的研究热点[7-11]。
然而,由于弹性波场中P波和S波在垂直和水平方向的不解耦性和波场分离的不彻底性导致成像过程中往往伴随着串扰噪声等非物理噪声,使得成像分辨率显著降低[12-15]。近年来,为了减轻这种噪声的影响,提高ERTM的成像质量,许多学者讨论了在倾角域压制噪声的应用。如KLOKOV等[16]提出了在倾角域利用反射波和绕射波在形态上的差异将两者进行分离;XU等[17]直接在倾角域将不平的部分从道集中去掉,在菲涅尔带内叠加完成反射波成像;ZHANG等[18]在各向异性叠前时间偏移中输出倾角道集,并在其上解析地近似估计菲涅尔带,完成最优叠加,提高成像的信噪比。以上这些应用都是在Kirchhoff型积分偏移中完成的,在弹性波逆时偏移(ERTM)领域还没有相关研究。
深度学习是一种人工智能(AI)技术,它可以让计算机像人类一样从经验中学习,并模拟人类处理数据的方式[19-21]。近年来,深度学习的应用也成为地震学研究的一个活跃领域。在勘探地球物理领域中,学者们提出了一些基于深度神经网络的方法,如层析成像、数据插值、盐丘边界识别等[22-24]。深度学习方法的一个显著特点在于能发现隐藏在高维数据中的特征,并且具有一定泛化能力,能够让机器自动大批量地完成很多复杂的工作[25]。前人研究了通过在倾角域生成偏移道集,并利用手动拾取倾角范围来控制成像叠加的方式压制偏移过程中的噪声,但这类方法主要是通过手动拾取来实现这一过程[26-27]。本文介绍了在ERTM生成的倾角道集上利用一种深度学习方法——卷积神经网络(CNN)[28-30]实现自动拾取该倾角叠加范围,从而实现压制偏移噪声的方法,即,基于CNN的倾角域弹性波逆时偏移噪声压制方法,可以节约大规模三维成像的人工拾取工作量。最后给出数值算例,验证了该方法的可行性和实用性。
本文方法对弹性波矢量逆时偏移成像结果进行噪声压制的思路简要概括为:在具备准确的速度模型等参数模型前提下,采用弹性波逆时偏移方法对弹性波数据进行成像,这一过程中关键技术是利用波印廷矢量进行波场分离并计算角度,实现弹性波逆时偏移生成多套以地层倾角为索引的成像道集(矢量道集)。在倾角道集上,可以清楚观察到对成像贡献最大的有效部分和噪声部分,各自按照倾角范围分布在道集上,所以可以通过在倾角道集上拾取适当的倾角范围,即叠加孔径,然后在叠加孔径内对有效信号进行叠加成像,从而实现噪声压制。由于成像点处构造情况变化剧烈,单一参数无法满足去噪要求,因此逐点进行倾角范围手动拾取的工作量非常大。基于此,本文应用CNN算法,将部分道集手动拾取的叠加孔径函数作为目标输出,即标签数据,使用CNN来实现自动预测,从而实现噪声压制的同时节约大量手动拾取的工作量,该方法适用于大规模的道集倾角范围拾取。
二维弹性波方程[10-12]如下:
(1)
式中:i,j,k=1,2;ρ表示密度;vi表示x方向上的质点速度;vj表示y方向上的质点速度;τij表示应力张量;δij表示Delta函数;λ,μ表示拉梅常数。我们采用了基于非结构网格的格子法求解方程(1)[29],在输出倾角道集时,本文使用坡印廷矢量[30-31]计算倾角,波印廷矢量表示为:
si=-τijvj
(2)
式中:i和j分别表示弹性波波印廷矢量的水平和垂直分量。我们使用波印廷矢量来计算倾角(图1)[32-33],公式如下:
β=α-γ
(3)
式中:α表示入射波与z方向的夹角;γ表示反射波与z方向之间的夹角;β表示倾角。在波场外推过程中,α可由炮点的波印廷矢量计算得到,γ可由检波点的波印廷矢量计算得到。对于每个成像点,在每个时间步长内用公式(3)计算倾角。然后,存储每个成像点每个时间步的倾角总和。在获得每个炮点的倾角后,在每个成像点处叠加所有炮的结果,生成倾角道集。这一过程可表示为:
(4)
式中:I表示倾角道集;D表示倾角;Psrc,Srec分别表示炮点和检波点的波场,nshot表示参与成像的总炮数。
1.2.1 CNN介绍
CNN是一类特殊的人工神经网络,区别于神经网络的其它模型,其主要特点是卷积运算操作[19-21]。卷积是一种特殊的线性运算。卷积网络是指那些至少在网络中的一层中使用卷积运算替代一般的矩阵乘法的神经网络。CNN在诸多领域特别是图像相关任务处理的应用中表现优异,如图像分类、图像语义分割、图像检索、物体检测等计算机视觉问题[25,28,30]。此外,随着CNN研究的深入,如自然语言处理中的文本分类,软件工程数据挖掘中的软件缺陷预测等问题都在尝试利用CNN解决,并取得了相比于传统方法甚至其它深度网络模型更优的预测效果[25]。
1.2.2 用于倾角道集自动拾取的网络结构
对于弹性波逆时偏移方法生成的倾角道集,我们选择拾取每个深度切片的倾角值作为CNN的输入,范围为-90°~90°,间隔为3°。因此CNN网络的输入层节点数为61。对于CNN的输出,采用归一化处理,使输出在(0,1)范围内变化。CNN用卷积和汇聚层代替了传统的全连接神经网络。此外,CNN使用共享权值和稀疏连接,因此可以显著降低需要训练的参数个数。
在本文研究中,倾角拾取可概括为一个一维目标检测问题。考虑到CNN的输出值是连续的,此处的CNN架构应该是回归型网络。我们遵循Alexnet架构,构建了一个8层的CNN。该CNN的网络架构如图2所示。对于前4层,使用卷积核大小为3的卷积层和大小为2的池化层。卷积层的通道数分别为64,128,256,512。之后,对最后4层使用全连接输出。致密层的深度分别为64,32,16和2。注意,最后一层深度为2,输出标准化倾角的预测值。该网络可训练参数为620402,输出文件大小约7.6MB。
图2 本文采用的CNN结构
1.2.3 目标函数与优化方法选择
神经网络可看作一种反演问题求解器,因此训练神经网络需要定义一个目标函数,它代表了预测值和真实期望值之间的差异[34-35]。我们认为过切和选取不足的倾角拾取结果是不同的。一方面,如果拾取的预测孔径过窄(过切),则会削弱反射波成像的贡献,降低最终叠加结果的成像分辨率,甚至丢失成像信息。另一方面,过大的预测孔径(欠切)会将串扰噪声包括进来。过窄孔径的损失大于过宽孔径估计的损失。因此,对过切情况进行额外处理,目标函数可表示为:
(5)
如果超参数α太大,基于CNN的方法将给出太宽泛的拾取结果。为了获得合适的参数,需经过测试选择适当的超参数,测试结果表明α应该小于1。在本文中,α的值是0.8。
有了目标函数之后,选择恰当的优化方法对于成功拾取至关重要[36],我们选用了小批量梯度下降方法(MBGD)[37],通过一小批训练样本计算梯度。在MBGD方法里选择的批处理量参数值为64。
利用BGP盐丘模型数据来验证基于CNN的倾角域成像孔径自动拾取方法的有效性。图3为P波速度、S波速度与密度的模型数据。使用准确的速度模型进行偏移输出倾角道集。输出倾角道集后,使用的带标记的CDP倾角道集的总数为837个。将它们随机地分成训练集、验证集和测试集,其大小分别为600,138和99。CDP号的范围为70~1200,倾角变化范围为-80°~80°,倾角间隔为1°。每个道集时间方向的采样点数为4051个,采样间隔为0.002s。首先将训练集输入到搭建好的训练集数据上对网络进行训练,获得合适的网络权值系数和偏置,然后输入测试集数据,输出预测结果,将由网络预测出的倾角域成像孔径结果与倾角道集叠合显示,如图4所示。图中,白线是手工拾取结果;绿线是自动拾取结果;黄线是自动拾取结果平滑后作为CNN自动拾取的最终结果。
图3 BGP盐丘弹性波模型a P波速度; b S波速度; c 密度
由图4可以看出,经过训练的CNN对倾角叠加范围(孔径)函数具有良好的估计。首先,对于数据大部分区域,使用CNN得出的倾角叠加范围比手动选取的倾角叠加范围紧凑,这表明所设计的损失函数符合初衷。第二,我们认为CNN拣选和手动拣选之间的差异是由标签的差异引起的。标注工作受人为因素影响较大。第三,相邻时间片之间的波动较小,表明CNN预测的结果具有一定的稳定性。最后,采用CNN方法拾取倾角叠加范围,对于大数据量特别是三维情况下,比手动拾取要节约许多时间,这是该方法最主要的优势。实际操作中,在没有反射波同相轴等异常情况的道集上做一个很宽松的标注或者不拾取。采用这样的标签数据训练网络后,一旦验证集数据是没有反射波同相轴的情况,将不做拾取或者给一个很宽的拾取结果,相当于全孔径叠加。图5显示了原始未经倾角叠加范围切除得到的成像结果,可以观察到明显的串扰噪声等。图6显示了在经过成像孔径切除后的PP波和PS波逆时偏移叠加成像结果,与图5对比可以看出,有效部分得到了加强,并且消除了一些成像噪声,而主要的同相轴没有被损伤。
图4 CNN在弹性波倾角道集上的叠加倾角范围拾取结果a 倾角道集1; b 倾角道集2
图5 原始未经倾角叠加范围切除得到的成像结果a PP波; b PS波
图6 基于自动拾取倾角叠加范围进行叠加的弹性波成像结果a PP波; b PS波
深度学习类方法的一个特点是在一类数据上训练好的网络参数,可以很快地应用到其它类似的数据上,即泛化能力。在本节中,我们使用SEG起伏地表模型来进一步检测本文方法的泛化能力。图7为SEG起伏地表P波速度模型。该模型在x方向上包含1668个样点,在z方向上包含1000个样点。网格间距:x方向为15m,z方向为10m,时间步长为0.5ms,记录时间长度为6s,采用主频20Hz的Ricker子波激发。沿着崎岖的地形表面共设计277炮,震源间隔为90m。每次激发由480个检波器以15m的间隔进行记录。
图7 SEG起伏地表速度模型
为了获得更高质量的成像结果,采用前文训练好的网络参数,对基于CNN自动拾取的倾角域限定函数进行约束。在该数据成像道集上直接使用训练好的CNN网络来预测倾角道集约束函数的左右边界。随机抽取一些倾角道集和网络预测的结果叠加,结果如图8所示,图中绿线是原始自动拾取结果;黄线是自动拾取结果平滑后的曲线,将其作为CNN自动拾取最终结果。对比了图9的成像细节,图9a和图9c是复杂构造不同位置处未加叠加倾角范围成像结果,可见偏移噪声对成像细节的影响;图9b和图9d是经自动拾取叠加孔径的叠加成像结果,偏移噪声得到较好压制,成像质量明显提升。在SEG起伏地表模型上的数值算例表明,本文方法很容易泛化并推广应用到不同的数据集上。
图8 CNN在SEG起伏地表数据倾角道集上的自动拾取结果a 倾角道集1; b 倾角道集2
图9 起伏地表模型数据成像结果细节对比a 复杂构造位置1处未加倾角叠加范围成像结果; b 位置1处经自动拾取倾角叠加范围叠加成像结果; c 复杂构造位置2处未加倾角叠加范围成像结果; d 位置2处经自动拾取倾角叠加范围叠加成像结果
弹性波逆时偏移(ERTM)是地震成像研究的前沿领域。本文通过偏移输出倾角道集,在倾角域可以有效地分离反射信号和成像噪声,进而可对噪声进行压制从而提高成像质量。为了有效地输出倾角道集,本文采用了在波场外推过程中使用坡印廷矢量的方法实现波场有效分离。然后,采用一种基于卷积神经网络(CNN)的倾角域自动拾取方法拾取有效倾角叠加范围,在该范围内实现反射波最优叠加,从而抑制串扰噪声的影响。数值算例验证结果表明,该方法可以实现海量道集的自动拾取,通常从成像道集中随机挑选出约10%的道集进行人工标注,即可训练出对整体有效的神经网络;并且该方法除了极大降低手动拾取工作量外,其拾取质量不受道集信噪比的影响,而仅仅与人工标注质量与网络训练参数有关,这对于低信噪比数据很有意义。相比于传统方法,该方法计算主要集中在使用标签数据对神经网络训练上,由于目标函数是两个一维的孔径函数,训练的时间相比于成像运算时间较短。一旦网络模型训练完成,就可以对数据进行快速预测,这个特点对于三维情况下海量道集的拾取很有意义,虽然训练需要花费一部分时间,但对海量道集进行快速自动拾取,反而能节约计算时间。最后,该方法若使用较典型的数据进行训练,可以用小规模理论数据训练,对大规模实际数据进行预测,从而解决同一类型拾取问题,具有一定的泛化能力,可较容易应用到其它类似的数据体上。文中数值算例证明了本文方法的有效性和实用性。接下来的工作是将本文方法拓展到散射成像领域。