基于多尺度注意残差网络的地震波形分类研究

2024-06-01 07:32:50王梦琪黄汉明吴业正王鹏飞
地震工程学报 2024年3期
关键词:池化残差准确率

王梦琪 黄汉明 吴业正 王鹏飞

摘要:選用2010年2月—2016年12月发生在北京顺义及河北三河等首都圈邻近区域的117个地震事件(包括54个天然地震事件和63个非天然地震事件——爆炸事件)作为研究对象,利用文章所提出的多尺度注意残差网络对其中的天然地震事件和爆炸事件波形进行二分类。首先,对原始地震波形进行简单预处理并截取成相同长度的地震时序数据,直接将其作为网络模型的输入;其次,选用含有残差模块的深度神经网络作为基础网络,利用深度神经网络对特征的自动提取能力,省略了传统波形分类需要提前提取时域波形的特征作为分类算法输入的步骤;然后,融合通道注意力机制(ECA)并对其进行改进,将空间维度的信息融入通道信息,优化了网络对关键信息的关注,更好地聚焦重要特征;最后,使用空间金字塔池化代替最大池化进行多尺度特征融合,得到更多的特征信息,构成多尺度注意残差网络。实验结果表明,最高分类准确率为97.11%,平均分类准确率为96.53%,证明了多尺度注意残差网络在地震波形分类任务中的有效性,为震源类型识别工作提供了一种新的方法。

关键词:

天然地震; 人工爆炸; 残差模块; 注意力机制; 空间金字塔池化

中图分类号: P315      文献标志码:A   文章编号: 1000-0844(2024)03-0724-10

DOI:10.20000/j.1000-0844.20220605001

Seismic waveform classification based on a multiscale attention residual network

WANG Mengqi, HUANG Hanming, WU Yezheng, WANG Pengfei

(College of Computer Science and Engineering & College of Software, Guangxi Normal University, Guilin 541004, Guangxi, China)

Abstract: A total of 117 seismic events (54 natural earthquakes and 63 explosions) that occurred in the Capital Circle Region (Shunyi, Beijing, Sanhe, and Hebei) from February 2010 to December 2016 were selected in this paper. The multiscale attention residual network was proposed and used to classify the waveforms of earthquakes and explosions. The original seismic waveform was simply preprocessed and intercepted into seismic time series data with the same length, which was directly used as the input of the network model. Then, the deep neural network with the residual module was selected as the basic network. The step of advanced extraction of time-domain waveform features as the input of classification algorithm in traditional waveform classification can be omitted by using the automatic feature extraction ability of the deep neural network. Next, the efficient channel attention mechanism was integrated and improved, after which information from the spatial dimension was integrated into the channel information, thus optimizing the network's attention to key information and resulting in better concentration on essential features. Finally, the multiscale feature fusion was performed using spatial pyramid pooling instead of maximum pooling to obtain more feature information. Ultimately, a multiscale attention residual network was formed. Experimental results show that the highest classification accuracy of the multiscale attention residual network is 97.11%, and the average classification accuracy is 96.53%. The results demonstrate the effectiveness of this approach in seismic waveform classification and provide a new optional approach for seismic-source type identification.

Keywords:earthquakes; explosion; residual module; attention mechanism; spatial pyramid pooling

0 引言

随着全球范围大规模部署地震观测仪器,人类已进入了地震大数据时代。地震台站网络持续不断地收集着大量地震观测波形数据,但不同台站的连续波形记录质量参差不齐,如何对不同来源的震动信号进行及时识别并分类,是一个非常棘手的问题。因此,高效、高精度、普适性强的波形分类算法研究在地震大数据时代愈加重要和必要。

传统地震波形分类常选择一个明显的地球物理特征当作判据,比如P/S震幅比、震源深度、P波初至时刻等,提取出待识别波形的相关特征,与判据特征进行匹配,然后用匹配算法或机器学习算法计算相关性,再根据结果确定波形类别[1-6]。Baker[7]提出利用小波分析,从已发生的地面运动中提取最大速度脉冲,结合脉冲最早到达时与绝对振幅作为分类的依据。Shahi等[8]以此为基础,提出使用两个正交分量的连续小波变换来识别最有可能包含脉冲的方向,然后利用小波变换的结果,从选定的方向中提取脉冲,最后利用支持向量机(Support Vector Machine,SVM)进行识别分类。冯雪玲等[9]在特定尺度上对地震波形信号使用复Morlet小波变换,进行微地震信号自动检测。随着科学技术的发展,机器学习也被应用到地震波形识别和分类中,大大提高了地震波形的识别速度和分类准确率。Bauer等[10]使用连续小波变换沿水平方向计算信号属性,然后根据小波变换特征的相似性进行聚类分析,通过地震相分类和建模得到三种不同的小波变换模式。近年来,深度学习的发展方兴未艾,随着深度神经网络(Deep Neural Networks,DNN)的发展,其在地震波形分类模式中进行分类的可行性已逐步得到论证。赵明等[11]将8 900个汶川余震事件作为检测数据,证明了卷积神经网络(Convolutional Neural Networks,CNN)在地震波形自动分类与识别方面的可行性。蔡涵鹏等[12]采用半监督算法,在降低待分类样本维数的同时增强了相同类别样本的相似性,并在此基础上采用K均值获得地震相图,显著提高了分类速度与精确率。陈润航等[13]在三分量地震波形的垂直分量中提取出梅尔频率倒谱系数图,将其作为卷积神经网络的输入对地震波形进行分类,最终取得了良好的效果。黎炳君等[14]利用短时傅里叶变换(Short-Time Fourier Transform,STFT)对地震信号进行处理,生成时频图谱,再将其转化为灰度图像作为CNN的输入,有效提升了地震分类的准确率。Liao等[15]利用了连续小波变换提取地震波形的特征,将其输入卷积神经网络进行微调,达到了自动识别地震初至时的目的。

目前大多数地震波形分类方法往往需要提前进行波形特征提取,再将提取出的特征作为分类算法的输入。然而提前提取特征这一步骤耗时较多,并且在选择合适特征时也会掺杂较多的人为主观因素。为了解决以上问题,同时提升深度神经网络对于地震波形重要特征的聚焦和分析能力,本文提出一种基于多尺度注意残差网络的地震波形分类算法。选用2010年2月—2016年12月发生在北京顺义及河北三河等首都圈临近区域的117件地震事件作为研究对象,对其中54件天然地震事件与63件人工爆炸事件的波形进行二分类,通过五折交叉验证方法进行测试,验证本文所提出的多尺度注意残差网络的分类效果,同时使用查准率(Precision)、查全率(Recall)以及综合评价指标F1值(F1-Measure)对其进行评估。

1 网络模型介绍

1.1 深度残差神经网络

He等[16]提出的深度残差神经网络(Residual Neural Network,ResNet)继承了卷积神经网络局部连接、权值共享和下采样这三大优点。通过引入残差模块(Residual Block)、使用短路连接(Shortcut)和恒等映射(Identify)的方法,解决了网络收敛速度慢以及加深层数导致网络性能降低的问题。残差网络模型的基本结构如图1所示。

网络模型中的一层可以看作y=G(x),残差网络的一个残差块可以描述为G(x)=x+H(x)。传统的神经网络很难拟合为G(x)=x,因此通过短路连接将问题转化为拟合残差函数H(x)=G(x)-x。在单位映射中,y=x是观测值,而G(x)是預测值,则用来描述预测值与观测值之间差距的H(x)就是残差。令H(x)=0,即可得到最优映射G(x)。

卷积层是残差网络的关键组件,通过卷积运算提取特征。卷积运算最关键的就是滤波器。滤波器本质上就是一个由数值参数构成且大小固定的数组。卷积层的工作过程可以由式(1)表示:

y=δ(W*x+b) (1)

式中:y为卷积层的输出;δ为激活函数;W为权重矩阵;*为卷积操作;x为卷积层的输入;b为偏置项。

激活函数选用ReLU函数。ReLU函数有着收敛速度快、计算成本相对低的优点。其运算公式为:

f(x)=max(0,x) (2)

Softmax函数多用在输出层,计算公式如式(3)所示。由于其输出结果是0~1之间的概率值,因此多用于多分类模型中。

f(yi)=eyi∑ni=0eyi (3)

式中:y为输出向量;yi为y中第i个输出;n表示网络的多个输出。

损失函数选择交叉熵损失函数(Cross-Entropy Loss Function)。交叉熵可以测量同一随机变量中概率分布的不同程度,也可以衡量真实与预测概率分布之间的差异。交叉熵的值越小意味着模型预测的效果越好,与Softmax结合可以更好地发挥作用。交叉熵的计算公式为:

L(x)=-∑nk=1pk(x)lg[qk(x)] (4)

式中:n为分类问题中的类别个数;pk(x)为真实类别值;qk(x)为预测类别值;k表示第k种类型。

1.2 注意力机制

注意力机制可以帮助模型更好地关注重要信息,更好地识别地震波形特征,一般可以分为软注意力和硬注意力。其中软注意力更为常用,主要包括通道域注意力、空间域注意力与混合域注意力。通道域注意力可以理解为让神经网络更关注“什么”,较经典的有挤压和激励网络[17](Squeeze-and-Excitation Networks,SENet)的有效通道注意力[18](Efficient Channel Attention,ECA)。ECA相比于SENet减少了参数量,提升了速度和精确度。Cao等[19]对SENet进行了改进,结合简易非局部模块(Simplified Non-Local Block),提出了GCNet(Global Context Network)。简易非局部模块的主要作用是从其他位置聚焦信息,从而增强当前位置的特征。本文在分析了多数模型优缺点的基础上,受GCNet的启发对ECA模块进行改进,使用简易非局部模块提取空间特征,并与通道特征相结合,提出一种非局部有效通道注意力(Non-local Efficient Channel Attention,NECA)模块。

ECA模块通过考虑每个通道以及k个近邻来捕获局部跨通道交互信息,结构如图2(a)所示。ECA通过不降维的逐通道全局平均池化(Global Average Pooling,GAP)以及卷积核大小为k的卷积操作来实现特征提取,其中卷积核k的大小代表了局部跨信道交互的覆盖率。ECA仅通过通道域来聚焦需要重点关注的区域,但地震波形数据存在噪音干扰多且不同种类波形相似度过高的问题,ECA会将部分干扰信息当作重要信息去关注,从而导致网络识别精确度下降、推理退化等问题。为了解决上述问题,本文提出了NECA注意力模块,其结构如图2(b)所示。该模块使用简易非局部模块替代ECA注意力模块中的全局平均池化操作,通过引入特征映射之间的关联信息,来获取更多的整体特征。在原本仅关注通道域信息的基础上,增加了空间特征信息,从而使网络模型能够更好地聚焦到需要重点关注的区域,并且模型复杂度没有大幅增加。

简易非局部模块结构如图3(a)所示。其中,上分支展示了简易非局部模块融合特征映射的空间维度信息,并将其压缩为包含所有特征映射对应位置信息相关度的单张特征图的过程,借此可以实现全局上下文信息的联合响应,其结果与下分支结果相乘,可得到每个特征映射的权值之和,计算公式如下:

σ(x)=∑w,hi=1,j=1exp(Lxij)∑w,hk=1,l=1exp(Lxkl)xij (5)

式中:x表示输入数据;w表示宽度;h表示高度;L表示线性变换矩阵。

全局平均池化的结构如图3(b)所示。GAP将全局N个特征图进行池化操作,将每个特征图转化成一个值,计算公式如下:

g(x)=1w×h∑w,hi=1,j=1xij (6)

二者相比,GAP操作根据每个特征图独立提取信息,不能有效利用不同特征映射之间的位置相关信息。简易非局部模块则是重点关注各个特征映射的空间位置信息,并且获取某个重要位置对于全局位置的影响,在通道信息的基础上结合空间信息。

NECA模块后续使用可自适应确定的卷积核大小为k的卷积完成跨通道信息交互,k可以通过通道数C来确定,如式(7)所示。

k=ψ(C)=log2(C)γ+bγodd (7)

式中:C表示通道数的数量;- -odd表示k只能取奇数;γ和b分别取2和1。

与ECA模块相比,NECA模块能够关注到空间维度的信息,可以更大规模地获取全局上下文信息,并且能够长距离获取相关性,进一步提升对于地震波形信号的分类能力。

1.3 空间金字塔池化

2014年He等[20]提出空间金字塔池化(Spatial Pyramid Pooling,SPP),不仅解决了网络对输入尺寸的限制,并且可以固定输出的大小,方便输入后续的网络层。空间金字塔池化的基本思想就是使用不同尺度的池化获得不同大小的感受野,从而提取多尺度的特征。多尺度本质上是对信号不同粒度的采样,通常不同尺度的特征提取可以获得不同的特征,从而得到更强大的特征表达。

由于某同一事件對应地震波形数据样本量有限,无法为网络模型训练提供大量的数据样本,因此网络模型在训练时所能学习到的特征是有限的。为了缓解以上问题,本文使用空间金字塔池化模块作为多尺度模块替代原网络模型中的全局最大池化,以获得更多的特征。

空间金字塔模块的运算过程如下所示。首先,根据输入数据的大小和池化数量,通过公式(8)、(9)计算池化层中核的宽度kw和高度kh。

kw=wn (8)

kh=hn (9)

式中:w表示输入数据的宽度;h表示输入数据的高度;n表示池化数量。

其次,根据得到的核的宽度与核的高度,计算步长大小。

sw=kwwn (10)

sh=khhn (11)

式中:sw表示宽度方向的步长;sh表示高度方向的步长。

然后,计算填充数量。

pw=kw×n-w+12 (12)

ph=kh×n-h+12 (13)

式中:pw表示宽度方向的填充数量;ph表示高度方向的填充数量。

然后,通过池化层输出尺寸公式,计算输出尺寸。

wout=w+kw+2×pwsw+1 (14)

wout=h+kh+2×phsh+1 (15)

最后,将空间金字塔模块中各个池化层的输出数据展开并进行拼接,即可得到最终输出。

1.4 网络模型构建

本文选用深度残差神经网络作为基础网络。在实际应用中,网络模型卷积核的大小、输入数据的形式以及通道数量均可以根据实际效果进行调整,以求得更好的结果。另外,过深的网络可能会放大误差,从而影响训练效果,因此需要选择合适的层数。本文按照Tian等[21]提出的有关注意力机制的插入建议,将注意力机制嵌入每个残差模块中,组成注意残差模块。注意残差模块的结构如图4所示,其包含2个卷积层、1个注意力模块和1个短路连接。其中,图4(b)中n的取值由具体网络层数而定。

本文使用空间金字塔池化替代全局最大池化,构成多尺度注意残差网络,其结构如图5所示。

本文所采用的网络模型中4个残差模块的卷积层参数各不相同,具体参数如表1所列。注意残差模块中所使用的卷积核大小均为3,不同之处在于步长与通道数量。步长为2的卷积核将输入数据的边长减少了一半,为了使其能与原始输入数据直接相加,需要在短路连接中加入一个卷积核大小为1、步长为2的卷积操作,使得二者的张量维数相等。

多尺度注意残差网络以地震时序信号作为输入,输入大小为4 096×1,经过第一层卷积核大小为7、步长为4的卷积操作后,得到1 024点一维向量的输出。将其输入空间金字塔池化模块,经过三个不同的最大池化层,分别得到4×4×1 024、2×2×1 024、1×1×1 024的特征向量。将这些向量拼接起来可以得到21 504维度的特征向量,也就是空间金字塔池化模块的输出。将该向量输入注意残差模块1,经过两层卷积核大小为3的卷积层将会生成通道数为64的512点一维向量,第2至第4个的注意残差模块通道数依次为128、256和512,经过该模块中的两个卷积核大小为3的卷积层后,由于步长的变化,将会依次生成通道数为128的256点一维向量、通道数为256的128点一维向量,以及通道数为512的64点一维向量。将注意残差模块4所输出的特征向量作为全局平均池化层的输入,经过Softmax函数,输出0表示信号类型为人工爆炸波形,输出1表示信号类型为天然地震波形。

2 数据处理与实验

2.1 数据选取与预处理

本文数据来源于中国地震局地球物理研究所“国家数字测震台网数据备份中心”[22],是发生在2010年2月—2016年12月北京顺义及河北三河等首都圈临近区域的地震事件,震级在1.5~2.8范围内,包含天然地震事件54个和人工爆炸事件63个,共117个。本文所使用的数据为三分量地震波形,三分量即南北分量、东西分量和垂直分量,一般垂直分量用于接受纵波,两个水平分量用于接受横波,不同的传播方向蕴含了不同维度的特征。

原始地震数据往往存在数据不稳定及数据过于离散等问题。为使得数据更加稳定,首先使用差分法对数据进行去趋势化处理。

为了解决波形持续时间不相等的问题,提升网络学习地震波形特征的能力,将地震波形重采样长度统一为采样点个数为4 096的数据系列(采样率保持不变,仍为100 Hz)进行截取,并且截取的波段中一定包含一次确定事件,最终共得到2 440条天然地震波形数据、2 061条人工爆炸波形数据。传统的地震信号分类识别过程中往往需要提前对地震波形进行特征提取操作,不仅耗费大量资源且在此过程中容易受到人为因素影响。本文对数据进行上述预处理操作后,直接将其作为网络训练模型的输入,既能最大程度的保留信息,又可簡化地震波形分类步骤。

由于可用的样本相对较少,为了防止样本信息太少导致网络模型过拟合现象的出现,本文采用5折交叉验证法,将2 440个天然地震样本、2 061个人工爆炸样本划分为5个独立等量的子集,每个数据子集约包含488个天然地震样本、412个人工爆炸样本。其中80%的数据作为训练数据,用于模型训练,余下的20%作为测试集,用于模型测试。数据集划分情况如表2所列。

2.2 实验设置与评估指标

本文使用Python 3.7.4语言,通过Tensorflow-GPU 2.4.1深度学习框架搭建网络模型,使用的硬件环境为:Intel(R) Core(TM) i7-10700KF@3.80 GHz 3.79 GHz的CPU;NVIDIA GeForce RTX 3080的GPU,GPU加速软件为CUDA11.1和CUDNN8.0.5,运行内存为32 G,显存为10 G。

选用大小为4 096×1的实验数据作为输入,Batch size定为64,使用Adam优化器优化网络模型,初始学习率定为0.001,每5 000步发生一次衰减,使用Keras框架中的“ExponentialDecay”函数对学习率进行衰减,迭代循环训练次数(epoch)定为1 000轮。

为评估本文方法在地震信号分类任务上的性能,选择传统机器学习模型支持向量机和多层感知机作为两种对比模型,分别选用SKLearn库中的LinearSVC和MLPClassifier算法作为实验对比算法。对LinearSVC使用网格搜索进行超参数选择,其中惩罚系数C的取值范围为[0.001,10],核函数类型kernel取值范围为[“rbf”,“linear”,“poly”,“sigmoid”],最终确定C为7.315,kernel为sigmoid。MLPClassifier的激活函数选用ReLU函数,正则化参数alpha选择0,隐藏层层数选择两层,分别含有30个和20个神经元。

为了更好地评估网络模型的性能,本文选用查准率、查全率以及综合评价指标F1值作为性能指标对模型进行评价。查准率是指检测出的某类特征数量与检测出的所有特征数量的比率,计算公式如下:

P(%)=TPTP+FP (16)

式中:P表示查准率;TP(True Positive)表示被模型预测为正的样本数量,即正确分类的天然地震信号数量;FP(False Positive)表示被模型预测为正的负样本数量,即错误分类的天然地震信号数量。

查全率是指检测出的某类特征数量和数据集中所有的该类特征数量的比率,计算公式如下:

R(%)=TPTP+FN (17)

式中:R表示查全率;FN(False Negative)表示被模型预测为负的正样本,即错误分类的人工爆炸信号数量。

F1值是准确率和召回率的调和平均值,计算公式如下:

F1(%)=2×P×RP+R (18)

式中:F1表示F1值;P表示查准率;R表示查全率。

2.3 消融实验与有效性实验

本文使用方法主要包含NECA注意力模块与SPP模块两个模块。采用五折交叉验证法对本文方法进行测试,得到最高分类准确率为97.11%,平均分类准确率为96.53%。为了进一步验证每个模块的有效性,对上述两个模块进行消融实验,并分为三种情况:(1) 所有模块均不采用;(2) 仅采用NECA模块;(3) 采用NECA模块+SPP模块。以上三种变体实验均在本文处理的地震波形数据集上进行五折交叉验证实验,结果如表3所列。

从表3中可以看到,仅采用NECA模块的情况下,地震信号识别分类的平均准确率可达95.96%,相比于所有模块都不采用的情况,平均准确率提升了3.41%;同时采用NECA模块和SPP模块的情况下,最高准确率可达97.11%,平均准确率可达96.53%,比所有模块都不采用的情况分别提升了3.83%和3.98%,相比于仅采用NECA模块的情况,分别提升了0.55%和0.57%。

除了比较三种不同情况下的地震信号分类准确率,本文采用上述三种评估指标对模型进行评估,结果如图6所示。从图6中可以看出,加入NECA模块和SPP模块后,查准率、查全率以及F1值都有了明显的提升。仅采用NECA模块的情况下,查准率、查全率以及F1值的平均得分均可达到96%以上,相比于所有模块均不采用的情况下三个指标的平均得分提升较多。同时采用NECA模块和SPP模块的情况下,三个评估指标的最高得分均高于97%,其中平均查全率相比于所有模块都不采用的情况有大幅度提升,相比于仅采用NECA模块的情况也有小幅提升。

图6 不同变体网络模型评估指标结果对比

Fig.6 Comparison between results of different evaluationindicators for different network models

为进一步证明本文所设计的NECA模块的有效性,选用ECA注意力模块、CBAM(Convolutional Block Attention Module)注意力模块、GCNet注意力模块与NECA注意力模块进行对比实验(表4)。在五次测试中,NECA模块的分类准确率最高可达96.56%,平均准确率达到了95.96%,比ECA模块分别提升了0.95%和1.08%。相比于CBAM模块和GCNet模块,NECA模块也都有着更优的分类表现。

使用三种评估指标对不同注意力模块进行评估,评估结果如图7所示。从图7中可以看出,NECA模块的平均查准率、平均查全率和平均F1值均优于其他三个模块。虽然GCNet模块的最高查准率和最高F1值优于NECA模块,但GCNet模块的平均查准率和平均F1值略低于NECA模块,说明NECA模块的性能比GCNet模块更加稳定。

2.4 與其他分类网络对比

为测试本文方法与其他方法在准确率上的差异,选用传统的SVM、多层感知器(Multilayer Perceptron,MLP),以及黎炳君等[13]提出的使用STFT处理波形得到时频谱灰度图并输入进卷积神经网络的方法(STFT+CNN)作为对比目标,分别进行五折交叉实验。SVM与MLP分别选用SKLearn库中的LinearSVC和MLPClassifier算法作为实验对比算法。STFT+CNN方法首先需要对本文预处理后的数据进行加窗处理,然后对每个窗内信号进行傅里叶变换,并生成32×32的时频谱图,提取其灰度图像特征作为CNN的输入,其中CNN由3个卷积核大小都为5×5的卷积层、3个池化层的池化窗口都为2×2的最大池化,以及神经元个数为1 024个的全连接层组成。相关实验结果如表5所列。

从表5中可以看出,使用SVM所得到的平均分类准确率为78.40%,使用MLP所得到的平均分类准确率为83.67%。本文方法相比二者,平均分类准确率分别提升了18.13%和12.86%。由于本文没有对波形数据提前进行特征提取,而是将波形数据直接输入进网络进行训练,传统的分类网络不能自主学习到波形的特征,所以使用SVM和MLP得到的分类准确率较低。与传统机器学习算法的分类结果对比,证明了本文网络模型可以更好地在较复杂的信息中提取到有效信息,并且其对特征的刻画能力更强。同时,将本文所用波形数据按照STFT+CNN分类网络的方法进行处理与分类测试,虽然最高分类准确率可达97.13%,比本文方法的最高准确率高出0.02%,但是STFT+CNN方法的平均分类准确率仅为93.97%,本文方法提升了2.76%,证明了在分类方面本文方法的泛化性更强,在地震波形分类任务中有着良好的表现。

使用查准率、查全率和F1值对本文方法以及上述三种方法进行评估,评估结果如图8所示。

从图8中可以看出,本文方法与SVM、MLP两种传统机器学习方法相比,查准率、查全率、F1值的得分均有大幅度提升;与同样是采用深度学习的STFT+CNN方法相比,这三个指标的最高得分相差不大,但是STFT+CNN方法的F1值最低得分和平均得分与本文方法相比落后较多,说明了本文方法在地震信号分类上更为稳定。总的来说,本文方法的查全率、查准率和F1值的平均得分均高于其他三种网络模型,进一步证明了其在地震分类任务方面的有效性。

3 结论

本文将2010年2月—2016年12月发生在北京顺义及河北三河等首都圈临近区域的地震事件作为研究对象,提出了一种基于多尺度注意残差网络方法对其中的天然地震与人工爆炸波形进行二分类,分析其分类效果,得出的主要结论如下:

(1) 利用深度学习方法可以自动提取特征的优点,将简单预处理后的地震波形数据直接输入网络模型,省略了传统地震信号分类方法依赖的提前特征提取步骤,优化了地震信号分类流程;

(2) 提出了NECA注意力模块,将空间域信息融入后续的通道信息交互中,解决了通道域聚焦重点区域而将部分干扰信息当作重要信息导致的识别精确度下降、推理退化等问题。加入NECA的网络模型分类准确率平均可达95.96%,与其他注意力模块效果相比有一定提升。

(3) 使用空间金字塔池化对特征进行了不同尺寸的多尺度池化,解决了由于某一事件对应地震波形数据样本量有限的问题。使用空间金字塔池化,分类平均准确率提升了0.57%。

本文方法对于天然地震和人工爆炸地震波形分类的准确率最高可达97.11%,平均分类准确率为96.53%。与传统机器学习方法相比,本文方法的分类准确率至少提升了12.86%,证明了该方法对特征的刻画能力更强;与其他深度学习方法相比,本文方法无需提前提取特征,步骤简单,耗时较少,并且分类准确率平均提升了2.76%,证明了其在天然地震与人工爆炸波形分类问题上的有效性和实用性。

致谢:感谢中国地震局地球物理研究所“国家数字测震台网数据备份中心”为本研究提供地震波形数据。

参考文献(References)

[1] 黄汉明,边银菊,卢世军,等.V-SVC算法在地震与爆破识别及窗长度选取中的应用[J].地震地磁观测与研究,2010,31(3):24-31.

HUANG Hanming,BIAN Yinju,LU Shijun,et al.V-SVC algorithm applied in earthquake and explosion recognition and the choice of window length[J].Seismological and Geomagnetic Observation and Research,2010,31(3):24-31.

[2] 潘常周,靳平,肖卫国.利用克里金技术标定新疆及附近地区P/S震相幅值比及其在地震事件识别中的应用[J].地震学报,2007,29(6):625-634.

PAN Changzhou,JIN Ping,XIAO Weiguo.Calibration of P/S amplitude ratios for seismic events in Xinjiang and adjacent areas based on a Bayesian Kriging method[J].Acta Seismologica Sinica,2007,29(6):625-634.

[3] 王婷婷,边银菊.振幅衰减特性在地震与爆破识别中的应用[J].地震学报,2015,37(1):169-179.

WANG Tingting,BIAN Yinju.Amplitude attenuation and its application to earthquake and explosion discrimination[J].Acta Seismologica Sinica,2015,37(1):169-179.

[4] LU Y,PANAGIOTOU M.Characterization and representation of near-fault ground motions using cumulative pulse extraction with wavelet analysis[J].Bulletin of the Seismological Society of America,2014,104(1):410-426.

[5] ZHAO D H,WANG H W,WANG D,et al.Quantitative classification of near-fault ground motions selected by energy indicators[J].Structures,2022,35:780-791.

[6] GHAFFARZADEH H.A classification method for pulse-like ground motions based on S-transform[J].Natural Hazards,2016,84(1):335-350.

[7] BAKER J W.Quantitative classification of near-fault ground motions using wavelet analysis[J].Bulletin of the Seismological Society of America,2007,97(5):1486-1501.

[8] SHAHI S K,BAKER J W.An efficient algorithm to identify strong-velocity pulses in multicomponent ground motions[J].Bulletin of the Seismological Society of America,2014,104(5):2456-2466.

[9] 馮雪玲,刘东亚,李志海.基于小波互相关的微地震信号检测方法研究[J].大地测量与地球动力学,2019,39(9):982-986.

FENG Xueling,LIU Dongya,LI Zhihai.Research on microseismic signal detection method based on wavelet cross-correlation[J].Journal of Geodesy and Geodynamics,2019,39(9):982-986.

[10] BAUER K,NORDEN B,IVANOVA A,et al.Wavelet transform-based seismic facies classification and modelling:application to a geothermal target horizon in the NE German Basin[J].Geophysical Prospecting,2020,68(2):466-482.

[11] 趙明,陈石,Dave Yuen.基于深度学习卷积神经网络的地震波形自动分类与识别[J].地球物理学报,2019,62(1):374-382.

ZHAO Ming,CHEN Shi,DAVE Y.Waveform classification and seismic recognition by convolution neural network[J].Chinese Journal of Geophysics,2019,62(1):374-382.

[12] 蔡涵鹏,任海洋,吴庆平,等.基于半监督算法的快速地震波形分类[C]//CPS/SEG北京2018国际地球物理会议暨展览电子论文集.北京:中国石油学会石油物探专业委员会,2018:1060-1063.

CAI Hanpeng,REN Ocean,WU Qingping,et al.Fast seismic waveform classification based on semi-supervised algorithm[C]//CPS/SEG.Proceedings of Beijing 2018 International Geophysical Conference and Exhibition Electronic.Beijing:Petroleum Geophysical Exploration Professional Committee of the Chinese Petroleum Society,2018:1060-1063.

[13] 陈润航,黄汉明,柴慧敏.地震和爆破事件源波形信号的卷积神经网络分类研究[J].地球物理学进展,2018,33(4):1331-1338.

CHEN Runhang,HUANG Hanming,CHAI Huimin.Study on the discrimination of seismic waveform signals between earthquake and explosion events by convolutional neural network[J].Progress in Geophysics,2018,33(4):1331-1338.

[14] 黎炳君,黄汉明,王婷婷,等.基于STFT和CNN的地震信号分类识别研究[J].地球物理学进展,2021,36(4):1404-1411.

LI Bingjun,HUANG Hanming,WANG Tingting,et al.Research on seismic signal classification and recognition based on STFT and CNN[J].Progress in Geophysics,2021,36(4):1404-1411.

[15] LIAO X F,CAO J X,HU J T,et al.First arrival time identification using transfer learning with continuous wavelet transform feature images[J].IEEE Geoscience and Remote Sensing Letters,2020,17(11):2002-2006.

[16] HE K M,ZHANG X Y,REN S Q,et al.Deep residual learning for image recognition[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition.Las Vegas,NV,USA:IEEE,2016:770-778.

[17] HU J E,SHEN L,SUN G.Squeeze-and-excitation networks[C]//IEEE.Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City,UT:IEEE,2018:7132-7141.

[18] WANG Q L,WU B G,ZHU P F,et al.ECA-net:efficient channel attention for deep convolutional neural networks[C]//IEEE.Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).Seattle,WA,USA:IEEE,2020:11534-11542.

[19] CAO Y E,XU J R,LIN S,et al.GCNet:non-local networks meet squeeze-excitation networks and beyond[C]//IEEE.Proceedings of 2019 IEEE/CVF International Conference on Computer Vision Workshop.Seoul,Korea (South):IEEE,2019:1971-1980.

[20] HE K M,ZHANG X Y,REN S Q,et al.Spatial pyramid pooling in deep convolutional networks for visual recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,37(9):1904-1916.

[21] TIAN Y L,SUN C,POOLE B,et al.What makes for good views for contrastive learning?[C]//NeurIPS.Proceedings of the 34th International Conference on Neural Information Processing Systems.Vancouver,BC,Canada:ACM,2020:6827-6839.

[22] 鄭秀芬,欧阳飚,张东宁,等.“国家数字测震台网数据备份中心”技术系统建设及其对汶川大地震研究的数据支撑[J].地球物理学报,2009,52(5):1412-1417.

ZHENG Xiufen,OUYANG Biao,ZHANG Dongning,et al.Technical system construction of Data Backup Centre for China Seismograph Network and the data support to researches on the Wenchuan earthquake[J].Chinese Journal of Geophysics,2009,52(5):1412-1417.

(本文编辑:贾源源)

基金项目:国家自然科学基金(41264001);专项资金(075440);广西重点研发计划(桂科AB18126045)

第一作者简介:王梦琪(1996-),女,硕士研究生,研究方向为深度学习与信号处理。E-mail:clearlovecw@163.com。

通信作者:黄汉明(1966-),男,博士,教授,研究方向为信号处理和模式识别。E-mail:huanghm@gxnu.edu.cn。

王梦琪,黄汉明,吴业正,等.基于多尺度注意残差网络的地震波形分类研究[J].地震工程学报,2024,46(3):724-733.DOI:10.20000/j.1000-0844.20220605001

WANG Mengqi,HUANG Hanming,WU Yezheng,et al.Seismic waveform classification based on a multiscale attention residual network[J].China Earthquake Engineering Journal,2024,46(3):724-733.DOI:10.20000/j.1000-0844.20220605001

猜你喜欢
池化残差准确率
面向神经网络池化层的灵活高效硬件设计
基于Sobel算子的池化算法设计
基于双向GRU与残差拟合的车辆跟驰建模
卷积神经网络中的自适应加权池化
软件导刊(2022年3期)2022-03-25 04:45:04
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
自动化学报(2019年6期)2019-07-23 01:18:32
基于卷积神经网络和池化算法的表情识别研究