徐彦凯 刘曾梅* 薛亚茹 曹思远
(①中国石油大学(北京)信息科学与工程学院,北京 102249;②中国石油大学(北京)地球物理学院,北京 102249)
地震资料不可避免地受到不同类型噪声的影响,严重影响有效信号的识别,因此压制随机噪声是地震资料处理的重要步骤之一[1]。地震资料噪声压制方法主要分为三类:第一类是空间域滤波方法,如中值滤波[2]和均值滤波[3];第二类是变换域滤波方法,包括小波变换[4-6]、Curvelet变换[7-8]、FX域反褶积[9]等,其主要思想是对地震数据进行变换,然后在变换域设置阈值分离信号与噪声,最后通过反变换将地震数据转换到原始空间域,以此实现噪声的去除;第三类是基于矩阵降秩的稀疏表示去噪方法,如奇异值分解(SVD)[10-11],是对地震数据进行稀疏表示,将较大的系数视为有效信号,较小的系数视为噪声,通过抑制较小的系数可以有效去除噪声,提高地震资料的信噪比。
上述方法虽然在随机噪声压制上均能取得一定的效果,但难以保证在去噪的同时不损伤有效信号,且效率低。为此,需要将其他领域的新方法引入地震资料的噪声压制。
近年来,深度学习方法在图像去噪领域得到了快速发展,其中卷积神经网络(CNN)[12]是目前最流行并被广泛使用的算法之一。Jain等[13]使用CNN抑制图像噪声,该方法采用逐层训练的方式,收敛较快,去噪效果优于小波变换。Burger等[14]将多层感知器(MLP)应用于图像噪声压制,对特定噪声水平的图像去噪效果较好。王琪琪等[15]将MLP用于去除地震数据中的随机噪声,相比曲波方法能更充分地保护细节信息。Xie等[16]首次运用编解码技术和堆叠式自动编码器(SSDA)去除高斯噪声,达到了学习稀疏特征的目的,具有较高的训练精度。Zhang等[17]提出了去噪卷积神经网络(DnCNN),对于一般图像具有较好的去噪效果。韩卫雪等[18]和Wang等[19]将DnCNN应用于地震数据的随机噪声压制,去噪后的同相轴清晰连贯,克服了传统去噪方法导致的伪影问题;Dong等[20]引入高阶统计量优化DnCNN的参数,使之适用于压制沙漠地震资料中的低频噪声。针对ReLU函数导致有效信息丢失的问题,Yang等[21]在迭代过程中使用ELU激活函数增强网络的鲁棒性,有效抑制了地震数据中各种强度的随机噪声。Zheng等[22]应用基于DnCNN的去噪方法衰减一维微地震数据的随机噪声;李海山等[23]借鉴深度残差网络原理设计了一种深层网络,有效压制了叠前地震记录中的随机噪声;Yang等[24]提出自适应CNN,更加有效地衰减随机噪声并重建地震波形。
但是地震资料中包含地质结构和岩性信息,而以上网络均采用单一的卷积核尺寸,不能充分有效地利用地震信号邻域信息,仅能够提取数据中有限的局部特征信息,容易造成边缘部分纹理细节的损失。针对这一问题,本文提出一种双通道卷积神经网络压制地震资料中的随机噪声。该网络通过两个不同结构的子网络提取更丰富的特征,同时通过引入空洞卷积(Dilated Convolution,DConv)的方式,增大感受野,从而捕捉到更丰富的地震信号邻域信息,在去噪的同时不损伤有效信号。
一般来说,不同的网络结构可以提取到不同的特征[25],若能将不同网络提取的不同特征应用于噪声压制,能够提升最终去噪效果。Tian[26]等采用双通道策略在图像去噪方面取得了不错的效果。因此,本文设计了一种包含两个不同子网络的双通道卷积神经网络(SDC-CNN),如图1所示。
图1 双通道卷积神经网络结构
SDC-CNN中的两个子网络均包含卷积(Conv)、批量归一化(BN)和Swish激活函数单元。其中,BN单元可以有效解决内部协变量偏移问题,有效防止网络深而导致的梯度消失或梯度爆炸。Swish激活函数单元用于向神经网络中加入非线性因素,提高模型的表达能力。上通道子网络的深度为8层,第1层由Conv和Swish单元组成。第2~第6层在Conv与Swish单元间加入了BN单元。第7层和第8层只包含Conv单元。该子网络每一层的卷积核尺寸都是3×3。下通道子网络的深度也为8层,与上通道子网络不同的是,该子网络引入了DConv。由于简单叠加相同扩张率的DConv会带来棋盘效应,本文将不同扩张率的DConv组合使用,从而学习到更多的邻域信息。该子网络每一层的卷积核尺寸也都为3×3,第1层由1-DConv(扩张率为1的DConv)和Swish单元组成。第2~第6层分别由扩张率为2、3、4、3、2的DConv(相当于尺寸分别为5×5、7×7、9×9、7×7、5×5的卷积核)、BN和Swish单元组成。第7层和第8层与上通道子网络一样,只包含卷积单元,且扩张率为1,相当于尺寸为3×3的标准卷积。
此外,在本文所提出的SDC-CNN网络中,使用残差学习的思想学习原始含噪地震数据与经过网络处理后的“干净”数据之间的残差,将两个子网络的输出进行特征融合(Concatenate),即图1中的Concat层,然后将原始输入减去融合后的残差,从而得到压制噪声后的地震数据。这种残差学习策略可以解决网络深度增加导致的训练精度下降问题,并能加快网络的收敛。
使用标准卷积时,第l层感受野尺寸的计算公式为
Rl=(Rl-1-1)Sl+kl
(1)
式中:Rl为第l层的感受野尺寸;Sl为第l层卷积核的移动步长;kl表示第l层的卷积核尺寸。与标准卷积有所区别,DConv多了一个超参数——“扩张率(Dilation Rate)”,该参数表示卷积核处理数据时各值的间距。DConv扩大感受野的本质是它在原始卷积核中使用了零填充操作,而这些零元素并不参与卷积运算。因此,引入DConv后第l层等效的普通卷积核尺寸Kl与原始卷积核尺寸kl之间的关系为
Kl=(kl-1)(d-1)+kl
(2)
(3)
图2 卷积核尺寸与感受野的关系示意图
图2a和图2b分别是扩张率为1的标准卷积和扩张率为2的DConv感受野的关系示意图,其中图2b的红色部分为DConv参与计算的像素。根据式(2),当d=1时,原始卷积核的尺寸为3×3(图2a黑色矩形框),相当于标准卷积。当d=2时,等效的普通卷积核尺寸为5×5(图2b黑色矩形框),根据式(3)可得到对应的感受野尺寸为7×7(图2b蓝色区域)。由式(1)可知,在第三层才能得到7×7的感受野。因此,DConv可以在不增加参数的情况下扩大感受野,捕获上下文的多尺度信息。而且地震资料中道与道之间的有效信号具有相似性,若能够充分利用邻域信息,神经网络则可以更精确地区分地震资料中的有效信号与噪声,有利于保护有效信号。
在一定程度上,网络的表达能力与其深度成正比,而随着网络深度的增加,网络训练的效率会降低,带来梯度弥散、梯度爆炸等与网络优化相关的问题。为此,He等[27]提出了残差网络。
含有随机噪声的地震数据可表示为
d=s+n
(4)
(5)
式中:N为含噪地震图像块的数量;θ为网络模型参数集;r(·)表示网络预测的残差;d-s为期望的残差。在本文的双通道卷积神经网络中,将两个子网络的输出进行特征融合,然后将原始输入减去融合后的残差,从而得到压制噪声后的地震数据。
Swish[28]是一种新的激活函数,定义为
g(z)=zσ(βz)
(6)
式中:σ(z)=(1+e-z)-1为Sigmoid函数,其中z为Swish激活函数的输入;β是一个可训练的参数。ReLU激活函数具有稀疏性的特点,能够解决反向传播过程中可能出现的梯度消失问题,被多次使用在深度学习中。但是,ReLU函数的输出值和梯度值在z<0的区域内恒等于0(图3a),可能导致权重无法更新,即出现神经元“死亡”现象。而Swish激活函数在负半轴的输出值无限逼近零但不会等于零(图3b),并且 Swish激活函数具有平滑和非单调的特点,可以有效克服网络训练时产生的神经元“死亡”现象,提高网络的性能。
图3 RelU激活函数(a)和Swish激活函数(b)的对比
分别对加入不同强度高斯随机噪声的地震数据进行训练,保存训练好的网络模型,并对含有不同噪声强度的地震数据进行测试。采用自适应矩估计(Adam)优化模型参数,初始学习率设置为0.001,迭代30次。
将本文提出的SDC-CNN应用于模拟地震数据和实际地震资料,并与FX域反褶积、Curvelet变换、U-Net方法、DnCNN方法以及本文网络模型中的下通道子网络进行对比。使用信噪比(SNR)、峰值信噪比(PSNR)以及均方根误差(RMSE)三个指标评估不同方法去噪效果。SNR和PSNR的表达式为
(7)
(8)
式中:MAX2(s)表示无噪图像最大值的平方;MSE为原始数据与处理后的数据的均方误差
(9)
式中I、J分别为地震数据的道数和样点数。则均方根误差为
(10)
应用Ricker子波通过Matlab平台模拟四个反射界面的CMP道集,每个道集200道,时间采样间隔为4ms。四个界面的初始零炮检距双程旅行时分别为0.10、0.40、0.65、0.90s,对应的均方根速度分别为950、1000、1100、1200m/s。各界面零炮检距双程旅行时的最大浮动量为0.1s,均方根速度的最大浮动量为100m/s,Ricker子波峰值频率在20~35Hz变化,共合成500个道集,其中400个道集作为训练集,其余100个道集作为测试集。为提取更丰富的细节特征,将训练集中的地震数据进行随机翻转、任意角度旋转等操作,按照尺寸为40×40、移动步长为10的方式进行裁剪,最终得到71.04万个40×40的数据块。
对于图4a所示的合成CMP道集,加入强度为15的高斯随机噪声后如图4b所示。图5为图4b数据不同方法的噪声压制结果,图6为对应的残差剖面。FX域反褶积在压制随机噪声的同时,衰减了同相轴的能量(图5a、图6a);Curvelet变换的去噪结果的同相轴附近出现较多伪影,其残差含部分有效信号(图5b、图6b);与传统算法相比,U-Net卷积神经网络滤波效果较好,但同相轴的能量有较大损失(图5c、图6c)。DnCNN方法(图5d)、本文的下通道子网络(图5e)以及本文方法(图5f)对噪声的压制更彻底,由残差剖面可以看出,本文方法比DnCNN方法保留了更多的有效信息(图6d、图6f)。由表1可以看出,本文方法噪声压制结果的PSNR、SNR和RMSE均优于其他方法。
图4 合成原始数据(a)及其加噪结果(b)
图5 合成数据不同算法去噪结果
图6 合成数据不同算法去噪结果与原始数据的残差对比
表1 不同算法对加入噪声强度为15的CMP道集噪声压制结果统计
对于噪声强度分别为15、25、35、45和55的CMP道集,上述六种算法压制结果的信噪比统计如表2所示。可以看出,无论噪声强度大小,本文方法的信噪比最高、压制效果最好。
表2 不同算法对加入不同噪声强度的CMP道集噪声压制后信噪比 dB
2.2.1 预处理后的实际地震资料
为进一步验证本文算法的适用性,将以上去噪算法应用到SEG官网公开的实际地震资料。将该数据进行裁剪得到1001个切片数据,每个切片数据有120道,时间采样间隔为4ms,样点数为240。将其中801个切片数据以相同方式进行翻转、旋转等操作,再裁剪得到38.1276万个40×40的数据块作为训练集,将剩下的200个切片数据作为测试集。
图7a为不含噪声的原始道集,图7b为加入强度为15的高斯随机噪声后的结果,可见弱信号几乎被噪声淹没。图8为上述六种方法对图7b数据的噪声压制结果,图9为对应的残差剖面。由图可见:FX域反褶积(图8a)和Curvelet变换方法(图8b)去噪结果中出现明显的伪影,去除噪声不充分,且丢失了较多的有效信息(图9a、图9b);U-Net卷积神经网络对随机噪声的压制更彻底(图8c),但在一定程度上损伤了有效信号(图9c);DnCNN方法更具优势(图8d),但在残差剖面仍可以看见部分有效信息(图9d);而本文方法的去噪结果更加接近原始地震资料,且残差剖面中几乎不包含有效信号,从图8f和图9f中的红色矩形框区域可以看出本文方法对弱信号恢复得较好;本文的下通道子网络也取得不错的去噪效果,但是在部分微弱信号区域(图8e和图9e红色矩形框区域),从去噪结果和去噪残差可见丢失了一些有效信息,说明双通道卷积神经网络(本文方法)可以学习到更充分的有效信息。
图7 预处理后实际地震数据(a)及其加噪结果(b)
图8 预处理后实际地震数据不同算法去噪结果对比
图9 预处理后实际地震数据不同算法去噪结果与原始数据的残差对比
表3列出了不同算法对加入强度为15的噪声的实际地震资料去噪结果的指标对比,可见本文方法去噪结果的PSNR、SNR和RMSE三个指标均优于其他算法。与传统算法和DnCNN方法相比,本文方法在压制地震资料随机噪声和保护微弱有效信号方面均展现出更好的效果。
表3 不同算法对加入强度为15噪声的实际地震资料去噪结果统计
对加入强度分别为15、25、35、45和55的高斯随机噪声后的实际地震资料,不同算法噪声压制后的SNR统计如表4所示,可见:无论噪声强度大小,本文方法噪声压制结果的SNR均最高;与仅使用下通道子网络去噪相比,本文双通道网络改善了去噪效果。
表4 不同算法对加入不同强度噪声的实际资料噪声压制后信噪比 dB
2.2.2 实际原始叠前地震资料
截取的部分实际地震资料(图10)共128道,每道128个样点,采样间隔为4ms。受到随机噪声的干扰,原始道集同相轴不清晰、不连续,能量较弱的有效信号难以识别。图11为上述六种方法的去噪结果,图12为对应的残差剖面。
图10 实际原始叠前地震道集
从图11、图12可以看出:FX域反褶积法去噪结果中仍包含较多噪声,噪声压制不明显,且丢失了较多有效信息(图11a、图12b);经Curvelet变换处理后,去除了大部分噪声,但残差剖面含有较多有效信号(图11b、图12b);U-Net卷积神经网络对随机噪声的压制相对传统方法更好,但在一定程度上损伤有效信号尤其是红色方框内的弱信号(图11c、图12c);经DnCNN方法压制噪声后,随机噪声得到有效去除,有效信号也得到了更充分保留,但从去噪结果和残差剖面可观察到,红色框内的弱有效信号与随机噪声一同被压制(图11d、图12d);本文下通道子网络方法和本文方法对随机噪声去除得更彻底,纹理细节部分也得到保护,但在红色标记区域内,本文方法结果的同相轴更连续(图11e、图11f),残差道集上有效信息更少,有利于对弱信号的保护(图12e、图12f)。
图11 实际原始叠前地震资料不同算法去噪结果对比
图12 实际原始叠前地震资料不同算法去噪残差对比
因此,与其他方法相比,本文方法在对地震资料随机噪声的压制和有效细节信息的保护方面更具优势。
本文提出了一种双通道卷积神经网络用于地震资料随机噪声压制。该网络采用增加宽度的策略,构造两个不同的子网络学习数据中的互补信息;在下通道子网络中引入空洞卷积,使特征图中包含更多的邻域信息,并结合残差学习的优势,在去除噪声的同时保留了更丰富的细节信息,提高了信、噪有效分离能力。模型CMP数据和实际地震资料处理结果均表明,本文提出的双通道卷积神经网络方法对随机噪声的压制更彻底,保留的细节信息更丰富。