LSTM神经网络在地震资料初至拾取中的应用❋

2022-01-13 09:27:32李林伟童思友王忠成尚新民赵胜天

中国海洋大学学报(自然科学版) 2022年2期

李林伟，彭崯，童思友，2❋❋，王忠成，尚新民，赵胜天

(1.中国海洋大学海底科学与探测技术教育部重点实验室，山东青岛 266100； 2.青岛海洋科学与技术试点国家实验室海洋矿产资源评价与探测技术功能实验室，山东青岛 266237； 3.中国石化胜利油田物探研究院，山东东营 257022)

地震勘探资料初至拾取的准确性直接影响后续静校正、层析成像等处理的精度[1]。在山地、滩浅海等复杂区勘探，由于各类噪音发育，地震资料初至不明显，高精度的初至拾取受到一定影响。“宽方位、宽频带、高密度”勘探技术的发展使炮、检密度成倍增加，地震数据量可达PB级别， “大数据”时代地震资料初至拾取对效率提出更高要求[2]。人工拾取耗时、耗力，需要具有经验的专业人士处理，容易引入人为误差，难以实现工业化[3]。因此研究高精度、高效率、高自动化的海量数据初至拾取方法势在必行。

迄今为止，国内外学者已经提出多种初至波拾取方法，如长短时均值比法(STA/LTA)[4]、相关法[5]、统计学方法(Akaike Information Criterion, AIC)[6]、图像处理法[7]、分形法[8]、神经网络法[9-11]等。这些方法大多基于地震信号的振幅、能量、频率或相位的变化以及相邻道之间的相关特征确定地震波初至时间。其通常仅考虑地震信号单一特征，当地震信号与背景噪音信号特征差异较大时，拾取精度较高，当背景噪音复杂、信号强度弱或出现空道、废道时，拾取精度难以满足后续处理的需求。

神经网络是机器学习中一种基于对海量数据进行表征学习的方法，当前已经成为机器学习领域极具竞争力的研究方向，在图像处理、文本处理和语音识别等方面取得了成功的应用[12]。国内外专家也将神经网络成功引入地震资料处理中来，并取得许多成果。BP神经网络技术在21世纪初就应用于地震资料的初至拾取以及震相识别[11]。随着深度学习架构的发展，这类方法逐渐被更具活力的卷积神经网络取代(Convolutional Neural Network, CNN)。Yuan等采用CNN方法实现初至拾取，设置全连接层将地震记录分类为初至以及非初至[13]。刘佳楠等引入全卷积神经网络(Fully Convolutional Networks, FCN)，将全连接层替换为反卷积与反池化层将输出结果恢复至输入数据尺寸，实现像素级别的标签划分[10]。丁建群等采用FCN的改进版本U-NET实现基于图像训练的初至波拾取[14]。陈德武等结合U-NET、SegNeT的优势提出混合网络U-SegNet地震数据初至拾取，并优化了样本制作流程，提高了计算效率[15]。以上这些基于CNN的方法，都将地震记录作为一种灰度图像进行处理，并没有考虑到地震信号是时间序列这一特征。实际上背景噪音具有很强的延续性，例如陆地环境干扰，海洋勘探的船干扰、涌浪干扰等，这些时序特征并没有在神经网络中得到体现。而循环神经网络(RNN)的出现将时序分析得以实现。

借鉴RNN在语音识别中的成功应用[16]，本文提出利用RNN的改进方法长短期记忆神经网络(Long Short-Term Memory, LSTM)进行初至拾取，为实现“高精度、高效率、高自动化”的初至拾取提供一种全新的思路。应用本文方法分别在海洋OBC地震资料、西部山地地震资料进行拾取试验，取得较好的效果，证明了本文方法的应用价值。

1 基本原理

地震信号实质上是一种时间序列，初至拾取与语音识别具有高度相似性，同时地震数据也具有空间特征，共炮集数据在横向上具有很强的连续性。相比于CNN类图像分割方法，RNN在学习空间特征的基础上，能够学习时间特征，非常适合用于地震数据初至拾取。根据任务目标即输入输出的不同，RNN有多种结构，包括One to One、One to Many、Many to One、Many to Many等，初至拾取问题可以看作一个二分类问题，在时序上将初至时刻分为一类，非初至时刻归为另一类，Many to One结构符合初至拾取任务的需求，即输入为二维地震数据矩阵，输出为标签值0或1。

图1 RNN的Many to one单隐藏层结构

RNN中典型的Many to one单层结构(见图1)，由输入层(Input Layer)、隐藏层(Hidden Layer)、输出层(Output Layer)、各层相应的权重、时间步长(Time Step)等组成。X1,X2,X3,X4…XT是1,2,3,4…T时刻的输入值，h1,h2,h3,h4…hT为对应的隐藏层状态，YT是最终输出结果，箭头代表对向量进行一次变换。计算从左向右进行，可以看出随着Time Step移动，上一时刻的计算结果随时间传入下一时刻的计算，这就是循环神经网络的记忆功能。每一时刻的隐藏层hT计算公式(1)，U和W是参数矩阵，b是偏置项参数，f是激活函数。输出值是将在最后一个时间点的隐藏层hT变换后输出，如公式(2)，这里使用的矩阵参数V与偏执项参数c与公式(1)中的不同，此输出受到整个时间段数据的影响。深层RNN结构即是在单层结构的基础上添加多个隐藏层。

ht=f(U·Xt+W·ht-1+b) 。

(1)

YT=Softmax(V·hT+c) 。

(2)

在式(1)中，RNN前一层的隐藏状态经过变换和激活函数得到下一层隐藏状态，使得反向传播求导结果包含所有梯度的连乘，从而导致梯度消失或梯度爆炸，因此RNN处理“长程依赖”问题能力不足，通俗的讲就是忘事儿。为了解决这个问题，LSTM应运而生。LSTM在隐藏态计算时，使用加法替换了原本的迭代变换，可以避免梯度消失的问题，能够学到长程的规律。LSTM通过对RNN的隐藏层计算单元的优化改造，用细化的具有不同功能的网络结构替代简单线性结构，这样的网络结构可以看作成一个细胞。与其说LSTM是一种RNN结构，倒不如说LSTM是RNN的单元升级组件，因此RNN中可以使用的每一结构都可以无缝切换到LSTM。LSTM的网络细胞结构见图2，内部具有若干神经网络层分别负责不同的功能。

图2 LSTM 网络细胞结构

LSTM神经网络的关键是细胞状态，其数据流向见图2中顶部的直线所示，用Ct表示。LSTM细胞状态具有删除或者添加信息的能力，该能力是门(Gate)结构赋予的。门结构由一个Sigmoid神经网络层和一个点乘运算组成。

计算第一步见图2中左侧部分I(灰色框标识)，该部分决定从细胞状态中丢弃哪些信息，称为遗忘门(Forget Gate)。它查看ht-1和Xt，并为细胞状态中的每个元素输出0到1之间的值，1代表完全保留，0代表彻底删除。计算过程如公式(3)，(4)。ft为遗忘门的输出，Wt为当前层权重系数，bt为当前层偏置项参数，[ht-1,Xt]为上一层传过来的隐藏层状态与当前时刻输入值的合并矩阵，σ为Sigmoid激活函数。

ft=σ(Wf·[ht-1,Xt]+bf) 。

(3)

(4)

it=σ(Wi·[ht-1,Xt]+bi)。

(5)

(6)

(7)

完成以上两个步骤的结果，就可以实现当前时刻细胞状态的更新，如公式(8)，Ct为当前时间节点计算所得细胞状态，将输入下一时间节点来参与运算。

(8)

最后需要确定输出的部分，见图2中部分III。公式(9)、(10)中Sigmoid层ot决定输出细胞状态的哪个部分，再将其乘以tanh规则化后的当前细胞状态，就得到输入下层计算的隐藏层状态。

ot=σ(Wo·[ht-1,Xt]+bo)。

(9)

ht=ot·tanh(Ct)。

(10)

2 处理流程

LSTM神经网络地震初至拾取流程包括样本集制作、LSTM神经网络模型设计及训练。

2.1 样本集制作

样本集制作是神经网络效果好坏的基础，针对地震资料初至拾取任务的特殊性，本文采用以下几个步骤制作样本集。

(1) 原始地震数据预处理，并使用已有软件拾取若干炮集数据的初至，人工调整未能正常拾取以及偏差较大的初至值，保证初至拾取的准确性。

(2) 根据人工拾取的初至截取地震记录制作样本，并手工分类标注。在地震记录上以初至点为中心截取51×51的矩形时窗数据作为初至类别，标签设为1，截取初至点前同样大小的时窗，作为初至前类别，标签设为0。其中训练样本与测试样本的比例为7∶3，初至类样本与非初至类别样本比例为1∶1。初至样本应涵盖全部偏移距范围的数据，非初至样本应包含地震数据中各类别的背景噪音，以提高模型泛化能力。

(3) 样本数据归一化处理。对于不同炮，不同接收地形所测得的地震数据差别非常大，甚至会相差几个数量级。对数据进行训练时，保证数据相近尺度能够有效地帮助梯度下降算法更快收敛。本文采取逐道归一化的方式，先获得每一道的最大值，然后将每一道的数据除以相应最大值，将数据映射到-1到1之间。归一化公式如下：

(11)

式中：x*为每一道样本归一化的数据值；xj为每个时间点的值；xmax为每一道的最大值。

以模拟数据为例，模拟地震剖面的地震道数在100～500不等，基于数据增广的思想加入了均值为0、方差为0.1～0.5的高斯随机噪音，并人工添加静校正量模拟复杂地形资料，制作包含13 525个样本的样本集，9 467个样本作为训练集，4 058个样本作为测试集。部分初至样本见图3。

图3 模拟数据初至样本

2.2 LSTM神经网络模型设计及训练

本文基于LSTM基本原理搭建LSTM神经网络架构用于地震数据初至拾取，其实质上是解决一个二分类问题，因此隐藏层不宜过深，本文方法设置2层隐藏层，隐藏层状态维数160。最终网络输出为数据分类的标签，即1或0。

训练过程一共重复训练样本数据10次，单次训练采用小批量梯度下降算法，每批次喂入量为64个样本。训练学习率LR设置为0.001，损失函数采用二元交叉熵函数(Binary Cross-Entropy)，对于包含n个训练样本的批次，损失函数为：

(12)

评价网络性能的指标为分类的准确率，即输入网络的测试样本正确分类的数量与总数量的比值：

(13)

以模拟地震资料为例， 9 467个样本参与训练并对模型进行测试，训练正确率及Loss函数随训练进度变化见图4，经过100次训练正确率就能达到99%及以上，Loss函数收敛迅速。图5为模拟数据LSTM神经网络初至波拾取的结果，模型具有较强的抗噪能力，在背景随机噪音较强且具有较大静校正量的情况下，依然能够准确的识别初至时刻。

图4 训练正确率及Loss函数

((a)初至拾取结果剖面； (b)初至拾取结果。(a) The profile with the first break picking results； (b) The first break picking results.)图5 含噪模拟剖面拾取试验(0.45噪音方差)

3 实际资料应用

采用本文方法分别对胜利油田海洋地震勘探资料和西部复杂地形陆地勘探资料进行初至拾取试验，取得较为满意的结果。每种资料各制作6 960个样本，按照7∶3比例划分训练集和测试集，将训练好的模型用于实际地震资料初至拾取。

3.1 海洋OBC地震资料初至拾取试验

胜利油田OBC地震勘探资料整体信噪比较高，探区海底地形平坦，无明显静校正量存在，但是存在少量异常道现象，LSTM神经网络初至拾取结果见图6。图6(a)展示波形初至拾取点与波形吻合度高，曲线平滑，无跳点出现，LSTM神经网络对于信噪比较高的海洋资料拾取效果非常好；图6(b)异常道部分局部放大，异常道虽然初至信息不清晰，但是本文方法依然能够利用横向空间特征正确预测初至位置，证明方法受数据完整度的影响小，稳定性高。

((a) 初至拾取结果剖面； (b)异常道附近拾取结果。(a) The profile with the first break picking results; (b) The first break picking results near the abnormal traces.)

与目前应用广泛的能量比法拾取初至进行对比，能量比法利用初至前后时窗内能量特征的差异来判断初至时间，在工业生产实践中取得良好的效果，但仍存在复杂地表条件下拾取精度不高的问题。图7(a)是本文LSTM神经网络拾取结果，图7(b)是能量比法的拾取结果。能量比法拾取结果存在明显跳点，见图7(b)中红圈，并且整体波形不够平滑，吻合度较低，LSTM神经网络方法拾取精确度更高，结果更加可靠。

((a)LSTM神经网络初至拾取结果； (b)能量比法拾取结果。(a) The first break picking results using LSTM network； (b) The first break picking results using commercial software.)

3.2 西部山地地震资料试验

我国西部地区地形崎岖、地貌复杂，野外采集地震资料初至特征复杂。本文所用胜利油田西部地区复杂山地地震资料由可控震源激发，地震勘探资料存在信噪比低、初至不明显以及静校正问题严重等特点。采用本文方法流程训练模型并对实际资料进行处理，拾取的结果见图8。图8(a)是实际资料初至拾取结果，图8(b)是实际资料局部放大图，拾取的初至时刻曲线较为平滑，无跳点出现，吻合度较高，抗噪能力强。在初至拾取的基础上进行初至波层析静校正处理并形成叠加剖面，静校正方法采用Fresnel层析静校正技术，与能量比法拾取初至的成像剖面对比如图9。相比于使用能量比法初至拾取结果的层析静校正叠加剖面(见图9(a))，使用LSTM神经网络方法拾取初至的叠加剖面(见图9(b))高速层顶部起伏更加稳定可靠，同相轴连续性更强，层位信息更丰富，构造特征更明显，本文的LSTM神经网络初始拾取方法对于复杂山地资料同样具有很好的适用性。

((a)初至拾取结果剖面； (b)红框位置局部放大剖面。(a) The profile with the first break picking results； (b) Locally enlarge the profile at the red box position.)

((a)使用能量比法拾取初至的叠加剖面； (b)使用本文LSTM神经网络方法拾取初至的叠加剖面。(a) The stacked profile using the first break picked by commercial software； (b) The stacked profile using the first break picked by LSTM network.)

4 结论

本文提出了利用LSTM神经网络来拾取地震勘探资料的初至，这为实现“高精度、高效率、高自动化”的初至拾取提供一种全新的思路。通过模拟资料和实际生产资料拾取试验，并与目前应用广泛的能量比法拾取结果进行对比分析，表明LSTM神经网络对于海洋和陆地资料的拾取精度都很高，并且能够胜任信噪比不高、数据量巨大的地震资料的初至自动拾取工作。通过研究得出以下结论与认识：

(1) 基于LSTM神经网络建立一套海量数据、高精度的人工地震自动初至拾取流程。对原始地震数据进行裁剪、标签化和归一化处理，设计合适的LSTM网络结构与参数进行训练建模，通过模拟资料优化并验证模型的可靠性。

(2) LSTM神经网络初至拾取适用于各种类型的实际地震资料处理，不但适用于高信噪比的OBC资料，而且对于像胜利油田西部这种强干扰、静校正问题严重的地震资料的初至拾取的应用效果良好，证明其具有很好的抗噪性能和良好的适用性。

(3) LSTM神经网络能够提取数据的时序特征，贴合地震数据是时间序列这一特点。通过成功解决地震信号初至拾取二分类问题，证明了该方法在地震信号处理方面具有良好的应用前景。