范承祥,郭宏伟,苑益军
(1.中国地质大学(北京)地球物理与信息技术学院,北京 100083; 2.潍柴动力股份有限公司,山东潍坊 261061; 3.中国石油勘探开发研究院,北京 100083)
在野外地震数据采集过程中,由于受复杂地下地质条件、施工环境、仪器设备等因素的影响,地震仪接收到的地震数据中经常包含大量的异常振幅噪声。异常振幅噪声不仅会干扰有效信号、降低资料的信噪比,还会对地表一致性振幅补偿、叠前随机噪声衰减(RNA)和叠前偏移等地震数据处理带来不良影响[1],具体表现为:①影响振幅的衰减规律,导致补偿系数难以准确求取;②减弱地震反射信号在f-x域的可预测性,限制了叠前RNA 作用的有效发挥;③大量强能量异常振幅会造成地震道空间能量不均,导致叠前偏移出现严重的画弧现象,从而干扰地震成像,给地震解释工作带来困难。长期以来,压制异常振幅、避免叠前偏移处理中出现画弧现象一直是地震数据处理中的一项重要工作。
现有针对异常振幅压制的方法,如人工道编辑[2-3]、分频压制法[4-6]、中值滤波法[7-9]等,虽然在一定程度上能够衰减异常振幅能量,但由于前提条件的限制,经上述方法去噪后的数据中仍残留大量的异常振幅,而且对有效信号产生了不同程度的损害,难以达到保真去噪的效果。因此,亟需一种既能有效压制异常振幅,又能保护有效信号的处理方法。
人工智能去噪是目前地震勘探领域研究的热点,它通过制作标签数据和网络训练提取地震信号特征,实现信噪分离。近年来,人工智能在随机噪声衰减[10-12]和面波压制[13]方面已取得了初步成效。相较于在随机噪声和面波压制方面的应用,利用人工智能对异常振幅压制的研究起步更早。1990 年,McCormack[14]提出了一种基于反向传播神经网络的异常道编辑方法,通过整道切除去除异常振幅,因此,在压制异常振幅的同时也损失了大量的有效信号。随后,张学工等[15]基于人工神经网络实现了对异常道的自动切除,该方法选用了一种称为新奇滤波器的人工神经网络模型,采用非监督的学习方式训练网络,使其能够识别地震资料中的废道并加以切除,然而新奇滤波器训练需要使用数量庞大的正常道样本,严重限制了该方法的实用性。朱广生等[16]利用双层感知器识别地震数据中的坏道,测试结果表明该网络具有一定的推理能力和适应性,能够从训练集中识别出不包含坏道的样本。但是该方法存在两点不足:一是训练模型缺少泛化能力;二是采用了“黑匣子”的求解问题方式,参数难以确定。庄东海等[17]利用神经网络的自主学习能力进行废道检测,提出了“两步法”自动道编辑方法。周振晓等[18]将改进后的神经网络应用于异常地震道的识别,有效地提高了异常道的识别准确度,但由于不同样本间需要重新学习,因此计算效率较低。王文强等[19]采用一种基于监督学习的CNN 学习方式,利用One-hot 编码对5 种异常道进行识别和分类。该方法在网络收敛速度和异常道识别精度方面均有较大提高,但是只实现了对异常道的识别检测,未能实现对异常道的自动保真去噪处理。
本文针对传统方法存在的不足,提出了一种基于去噪卷积神经网络(DnCNN)的地震异常振幅压制方法。根据地震记录中异常振幅的分布特点,通过网络改进与优化,搭建了DnCNN 结构;采用人工合成和实际数据提取的方法制作了大量的训练集数据,通过网络训练获得了可压制异常振幅的网络训练模型; 最后,利用模型数据和实际数据对训练模型进行了测试及应用,并与传统方法进行了对比。
地震数据中的异常振幅通常具有如下特征[2]:①在地震道纵向分布上,异常振幅主要在整道或局部出现;②在地震道横向分布上,异常振幅以单道或连续多道形式出现;③异常振幅表现为高能量振幅特性,是反射信号能量的几倍到几十倍,甚至更高;④异常振幅表现为频带范围广;⑤含异常振幅的道集空间相关性较差。
图1 是含异常振幅的原始单炮地震记录及其频率扫描结果。从图1c~图1f 可以看出,第21 道上的异常振幅在10~120 Hz 频带范围的扫描结果中均明显可见,说明异常振幅具有分布频带宽、能量强的特点。
图1 原始单炮记录及其分频扫描结果
地震数据的去噪过程可以看成是信号与噪声的分离过程,即采用数学物理方法将原始地震数据中的有效信号(干净数据)与噪声分离,并从原始地震数据中剔除分离出的噪声,从而获得干净数据。
若地震信号为S,噪声为N,含噪地震数据为Y,则含噪地震数据可表示为
噪声压制即从含噪数据Y中剔除噪声N,从而还原地震信号S[20]。噪声压制过程可表示为
本文采用的异常振幅压制方法步骤是:①建立去噪卷积神经网络结构并制作训练集数据;②将包含异常振幅的地震数据及相应的标签(即干净数据)输入网络,对含异常振幅的地震数据进行一系列处理,得到网络预测值,并与相应的标签进行损失函数计算;③依据误差结果指导网络参数的反向传递,以调整参数权重的方式优化网络模型,使预测值逐渐接近标签数据。通过迭代训练获得的网络训练模型能够准确提取标签数据中的有效信号特征,在含异常振幅的地震数据中只保留干净数据,从而达到去噪的目的。
根据地震数据中异常振幅的特点,通过网络改进与优化,搭建图2 所示的去噪卷积神经网络结构。该网络结构共由17 层构成,可划分为三种不同类型层:第1 层为卷积层(Conv)+激活函数(ReLU);第2~第16 层为Conv 层 + 批归一化(BN)[21]+ ReLU;第17 层只包含一个Conv 层。其中,批归一化可持续加速深层网络的收敛速度;所用的激活函数ReLU 能够避免出现使用Sigmoid函数或tanh函数时产生的梯度消失问题。
图2 DnCNN 结构
为了使网络更好地适应地震异常振幅特点,本文对传统的卷积网络结构进行了改进:①去除了传统卷积神经网络结构中的池化层和全连接层,并对每一层进行零填充,使每层的输入、输出数据的尺寸保持不变;②使用了小尺寸卷积串联方式,以降低卷积计算过程的复杂度;③采用非对称卷积块替代传统的方形卷积核,以增强网络的特征提取能力[22]。
网络中每层卷积核的个数决定网络的宽度,影响网络的性能。如果卷积核个数太少,会影响网络对数据特征的提取精度,导致欠拟合;反之,则会由于样本稀疏导致过拟合。因此,需要选取合适的卷积核数目。本文通过试验为每层设置了128个卷积核。
损失函数是用来计算目标值与网络预测数据之间的差异。目标值与网络预测数据差异越大,损失函数值就越大;反之,损失函数值越小,说明两者之间的拟合程度越接近。网络优化的目标就是减小损失函数值。目前可供选择的损失函数有很多,神经网络通常以均方误差和交叉熵为主。本文使用的损失函数为
式中:N为样本数量;‖·‖F代表矩阵Frobenius范数,表示矩阵元素的平方和的平方根;R(xi;w,b,γ,β)表示去噪卷积神经网络的预测值,其中w、b、γ、β分别为卷积核权重、偏置、偏移参数和缩放参数,xi为输入网络的含噪地震数据;为输入网络的干净数据,即不含异常振幅的地震数据。通过损失函数L(w,b,γ,β)计算网络输出值与标签的均方误差。
学习率作为监督学习中的一个关键超参数,在一定程度上决定着损失函数值是否能收敛到全局最小值,而不是局部最优点或者鞍点,同时决定了损失函数值的收敛速度。选择合适的学习率能够使损失函数在最优时间内实现收敛,如果网络初始学习率设置过大,会使网络无法完全收敛;设置过小,则会使网络收敛过慢,并且极易陷入局部最小值。因此,本文通过实验将网络训练阶段的初始学习率设置为0.001,然后在100次迭代周期内,网络每完成20次迭代则将学习率降至当前的0.9倍,即当网络开始训练时,学习率(步长)相对较大,随着训练迭代过程的不断推进,学习率也不断降低,直至最终完成收敛。当损失函数收敛到最小值时,网络训练优化完成。
基于已知地质模型,利用声波方程正演模拟得到一组220 炮合成地震记录,记录长度为2 s,采样间隔为4 ms。合成地震记录为纯反射数据,不包含异常振幅。之后,采用人工合成和从实际地震数据中提取的方式得到异常振幅,并将异常振幅随机添加到纯信号数据中,从而得到另一组220 炮含异常振幅的地震记录。然后从这两组地震记录中随机选取180 对地震记录作为训练集供网络训练,其余的40 对数据集则作为测试集用于模型测试。考虑到合成数据的振幅较大,且训练集的数据量较多,为了提高网络计算效率,在网络训练之前对训练集数据进行了振幅归一化处理。
图3 为从测试集中随机抽取的一对含和不含异常振幅的地震记录及其去噪结果。可见,在纯信号数据(图3a)中加入异常振幅后的地震记录中,第17、第18、第55道存在尖脉冲噪声,第87道局部存在异常振幅,第24 道、第108~第113 整道存在异常振幅(图3b)。图3c为应用去噪卷积神经网络的处理结果,由图可见,尖脉冲噪声及异常振幅已全部消失,同时被异常振幅湮没的反射信号得到较好恢复,且与图3a 中的反射特征一致。图3d 为图3b 与图3c 的差值剖面,剖面中完全看不到反射信号,表明本文方法在压制异常振幅的同时,基本不损害有效信号。为了验证改进网络的性能,应用传统去噪卷积神经网络对图3b 的数据进行测试。由图3e 可见,传统去噪卷积神经网络虽然压制了图3b中的异常振幅,但在图3f的噪声剖面中出现了一些有效信号(红色箭头所示),说明传统去噪卷积神经网络对有效信号产生了一定的损害。
图3 模型数据不同方法异常振幅噪声压制效果对比
此外,为进一步展示本文方法的有效性,还与行业中常用的中值滤波和分频异常振幅压制方法的应用效果进行了比较。
图3g、图3h 分别为中值滤波方法处理结果及去除的异常振幅。可见图3g中仍残留大量异常振幅(橙色箭头所示),同时图3h中还出现了很多反射信号(蓝色箭头所示)。图3i、图3j 分别为采用分频压制方法处理后的结果及去除的噪声。可见,图3i中存在少量的异常振幅残留(黄色箭头所示),图3j中也出现了一些有效信号。因此,与中值滤波和分频压制方法相比,本文方法有效压制了模拟数据中的异常振幅噪声,而且基本不损害有效信号。
图4 是图3a~图3c、图3g、图3i 中第108~第113道数据的振幅谱。其中红色曲线代表含噪数据的振幅谱,可以看出,地震记录中的异常振幅能量很强; 在有效频带范围内,中值滤波(黄色)和分频压制(紫色)数据的振幅普遍低于无噪数据(蓝线)的振幅,说明这两种传统方法在压制异常振幅的同时,对有效信号能量均有不同程度的衰减。而采用本文方法压制异常振幅后的振幅谱(绿色曲线)与无噪数据的振幅谱基本吻合。
图4 不同方法异常振幅噪声压制前、后数据振幅谱对比
从图3a~图3c、图3g、图3i数据中分别提取第18道数据并绘制了波形对比图(图5),可以更直观地对比本文方法与传统方法的去噪效果。可以看出,中值滤波和分频压制方法的去噪结果与干净数据的波形吻合度较差,而应用本文方法后的数据与无噪数据的波形吻合度较高,说明本文方法在保持有效信号特征方面具有明显优势。
图5 不同方法异常振幅压制前、后第18 道波形对比
分别应用不同地区的实际地震资料验证本文方法的有效性,并与传统方法进行对比。
实例一为中国东部某工区三维实际地震资料,地震记录长度为6 s,采样率为4 ms。首先,从三维数据体中选取了150个不含异常振幅的地震记录作为标签数据;然后,从其他含有异常振幅的地震记录中提取出了不同类型的异常振幅,并随机添加到不含异常振幅的地震记录中,从而得到150 个含异常振幅的地震记录,将标签数据和含异常振幅数据全部作为训练集输入网络,对网络进行训练;最后,又从三维数据体中抽取20个含有异常振幅的单炮记录作为测试集,用以测试网络模型,待网络训练完成后,将测试集输入网络,利用获得的训练模型识别并压制地震数据中异常振幅。
图6 是由实际地震数据制作的一组训练集数据,包括含有异常振幅的地震记录(图6a)和不含异常振幅的标签数据(图6b)。
图6 实际数据训练集
图7a 是从测试集中随机抽取的一张原始地震记录,可以看到原始数据中存在大量异常振幅(红色箭头处),其中第10~第35 道的强能量异常振幅淹没了1.2 s以下的反射信号,严重降低了资料的信噪比。
图7 实例一不同方法异常振幅噪声压制效果对比
图7b 是应用本文方法压制异常振幅后的结果,图中已看不到异常振幅,原来被异常振幅掩盖的反射信号得到较好恢复。图7c 为图7a 与图7b 数据的差值剖面,几乎看不到有效信号。图7d、图7e 为应用传统去噪卷积神经网络的处理结果及获得的差值剖面,可以看到,传统去噪卷积神经网络虽然压制了图7a 中的异常振幅,但在图7e 中出现了大量有效反射信号(黄色箭头所示)。与传统去噪卷积神经网络相比,本文方法对有效信号具有保护作用。
图7f、图7g是中值滤波方法压制异常振幅的应用结果和获得的差值剖面。由图可见,中值滤波不仅没有完全去除图7a中的异常振幅(图7f蓝色箭头所示),而且衰减了大量的有效信号(图7g橙色箭头所示)。图7h、图7i为应用分频压制方法后的结果和差值剖面,可见图7h中仍有大量异常振幅残留(绿色箭头所示),而且与中值滤波方法类似,分频压制方法在压制噪声的同时也衰减了有效反射信号的能量(图7i紫色箭头所示)。综上可见,本文方法在实际数据应用中的压制效果最好。
提取图7a、图7b、图7f、图7h 中第20~第25 道数据的振幅谱(图8),对比可见:原始数据(蓝色曲线)的异常振幅能量很强,主要集中在30~60 Hz;本文方法衰减的主要是含异常振幅频带范围的异常振幅能量,其他频带范围的信号能量与原始数据能量基本一致(红色曲线);与原始数据振幅谱相比,中值滤波(紫色曲线)和分频压制(绿色曲线)方法不仅没有完全压制异常振幅,而且还衰减了其他频段的有效信号能量。振幅谱对比结果进一步表明,本文方法能够有效压制异常振幅,且基本不会损害到有效信号。
图8 实例一不同方法异常振幅噪声压制前、后数据振幅谱对比
将实例一数据训练好的网络模型应用在其他地区的实际数据中,以检验本文方法的泛化能力。
实例二为某三维工区实际地震资料,原始记录长度为5 s,采样间隔为2 ms。从三维数据体中抽取一张原始地震记录(图9a),可以看到,地震记录中的第54道和第111道存在局部和整道异常振幅(红色箭头所示)。图9b是应用本文方法后的处理结果。由图可见,图9a中的异常振幅已完全消失。差值剖面(图9c)除了被压制的异常振幅和少量初至信号外,没有出现其他有效信号。图9d是应用中值滤波后的结果,图中第54道还有明显的噪声残留(蓝色箭头所示)。获得的差值剖面(图9e)中除了被压制的异常振幅外,还存在其他信号(黄色箭头所示)。图9f和图9g分别为应用分频压制方法后的结果及差值剖面。从图中可以看出,分频压制方法虽然有效压制了图9a中的异常振幅噪声,但同时也衰减了部分有效信号(图9g绿色箭头所示)。由此可见,本文方法训练模型在其他地区实际资料中的应用也获得了好于传统方法的效果。因此,本文方法具有一定的泛化能力。
图9 实例二不同方法异常振幅噪声压制效果对比
本文提出了一种基于去噪卷积神经网络的异常振幅压制方法,通过搭建网络结构、制作训练集和训练网络,得到能够压制异常振幅的训练模型。采用人工合成和实际数据提取的训练集制作方法,有效解决了深度学习方法缺乏训练样本的问题。与传统卷积神经网络结构相比,改进的网络结构能够提高异常振幅特征的提取精度。
模型数据测试和实际地震数据应用结果表明,本文方法有效地压制了地震数据中的异常振幅,较好地保护了有效反射信号,获得了优于传统方法的处理效果。此外,获得的训练模型在其他地区实际资料中应用,也取得了较好的压制效果,从而验证了方法的适用性。