基于LSTM神经网络的地震事件分类

2023-05-08 03:01杨晓忠王树波
计算机应用与软件 2023年4期
关键词:尺度准确率神经网络

张 帆 杨晓忠 王树波

1(华北电力大学控制与计算机工程学院 北京 102206) 2(华北电力大学数理学院 北京 102206) 3(内蒙古自治区地震局 内蒙古 呼和浩特 010051)

0 引 言

天然地震的活动性是统计地震学的主要研究对象,也是地震预测工作的重要依据。地震台网除了记录到天然地震,还能记录到非天然地震,非天然地震包括爆破、塌陷和采动影响的岩层破断等。地震类型的识别错误会影响地震目录的质量,并对地震学的相关研究产生影响[1]。在地震监测工作中,地震事件类型的区分主要依靠人工完成,依赖分析人员的知识和经验[2]。随着地震资料数量的增多,地震分析工作量也不断增加,这增加了分析人员的负担,受到经验的限制和主观性的影响,地震事件分类也会出现误判。因此,实现地震的自动事件分类尤为重要。

不同事件类型在时域、频域等方面的差异可以作为识别判据[3-5],这些研究成果为机器学习技术的应用建立了基础。传统的机器学习技术,如支持向量机和神经网络等,可以以数据驱动的方式训练模型参数,在地震事件分类上取得较好效果[6-9],这些方法需要大量的特征工程工作,可能丢失原始数据蕴含的有效信息。

近年来,深度学习在图像和语音识别、自然语言处理等领域取得巨大进步。深度学习通过和人脑相似的自下而上的层级结构,将输入端的数据逐层次提取[10],建立了底层数据到高层语义结构的映射。与传统机器学习技术相比,深度学习对原始数据人工加工较少,较好利用有效信息,较复杂的模型结构和较多的模型参数能够对复杂的非线性问题建模。深度学习技术在地震事件分类问题中获得一定成功[11-12]。

内蒙古地区的爆破事件记录较丰富,为地震事件分类算法的研究提供了一定数据基础。本文将地震事件记录经过短时傅里叶变换,转换为对数时频谱,并拆分为多维时间序列,使用了LSTM循环神经网络实现地震事件分类。

1 数 据

内蒙古地震台网自2008年网数字化以来,记录了大量爆破事件,为地震分类研究提供了数据基础。本文采用的原始数据选自2016年3月至2020年7月内蒙古地震台网记录的事件波形,包含420个爆破和480条天然地震事件,每个事件包含多个台站的三分向记录,本文选取了震中距在200 km范围内的1 800条单台垂直向记录(包含天然地震事件和爆破事件各900条),图1给出这些事件的射线,图1显示了天然地震、爆破和台站的分布,并且每条记录的台站和事件位置连线,每一条连线对应一个数据样本,黑色线为爆破记录,灰色线对应天然地震记录。天然地震事件在空间上分布比较均匀,爆破空间分布相对集中,天然地震的震级分布在0级到5级,爆破的震级一般在3级以下。

图1 事件和台站的连线

在数据预处理中,对每条记录截取100 s记录,截取起始点为初至震相前1 s。原始数据的采样率为100 Hz,对信号进行高通滤波,保留1 Hz以上的信号,过滤掉了低频的噪声,之后进行了去倾斜和归一化,为了同时提取事件记录在频域和时域的特征,我们对经过处理的波形记录进行短时傅里叶变换,转换为时频谱,并进行取对数,使数据分布均匀,转换后的数据为50×100的矩阵,对应频域1~50 Hz、时域0~100 s的对数振幅谱。短时傅里叶变换使用窗函数将时域信号截取为多段,对每一段做傅里叶变换,本文使用汉宁窗,窗长2 s,重叠1 s,按时间拆分后得到特征数为50(对应1~50 Hz)、长度为100(对应1~100 s)的多维时间序列。图2为数据处理的流程,图3为拆分过程的图示。

图2 数据预处理流程

图3 数据拆分过程

为了比较不同类型事件在时域和频域的差异,对比了爆破和天然地震的原始记录和功率谱曲线。图4给出天然地震和爆破的波形对比,爆破的P波较发育,频率成分较简单[13],有面波成分。天然地震和人工爆破可以看作随机信号,频率分布服从一定的统计规律,功率谱密度可以作为识别判据放大地震和爆炸的频域差异[12],图5给出天然地震和爆破的功率谱曲线,两类事件的曲线形态相似但略有差异。爆破在低频能量分布多,随着频率增加功率谱逐渐衰减。天然地震在低频部分的功率谱略低于爆破,随着频率升高逐渐升高,在5 Hz左右达到峰值,随后平缓衰减。天然地震能量随频率升高而衰减的速度比爆破更平缓。

图4 地震和爆破的波形对比

图5 地震和爆破的功率谱曲线对比

2 原 理

将经过预处理的多通道时间序列作为输入,选用的模型是序列处理中效果较好的LSTM神经网络。

神经网络由神经元构成,神经元的数学结构是对输入经过线性变换后加上一个偏置项,再使用一个非线性的激活函数后输出,从而模拟了生物神经元的激活过程。多层的神经网络可以以任意精度逼近任意函数[14]。

LSTM神经网络是常用的深度学习网络结构之一,可以有效地对序列建模。长短期记忆(LSTM)网络[15]解决了RNN网络训练中梯度爆炸和梯度消失等问题,LSTM包含相互作用的四个神经网络层(图6)。LSTM的遗忘门、输入门和输出门三个门控结构控制单元的输入和输出。遗忘门决定上一个时刻的状态Ct-1有多少保留到当前时刻状态Ct中。输入门决定当前输入xt有多少保存到Ct中,并更新单元状态。输出门通过运行一个Sigmoid层来确定单元状态的哪个部分将输出,接着把单元状态通过tanh函数进行处理,得到一个在-1到1之间的值,最终确定输出。将时序相反的两个LSTM模型相结合构成双向LSTM网络(BiLSTM),在某些任务中效果更好。

图6 LSTM单元结构

3 训练和检验

将处理后的数据随机划分为训练集(1 500条)和测试集(300条),训练集用于模型调参和训练,测试集用于测试模型的泛化能力。

使用的模型前半部分由LSTM层构成,用于时间序列的特征提取,后半部分由全连接层组成,用于实现分类功能。为了确定最优的模型结构,从训练集随机分出一部分作为验证集进行实验,对比了四种网络结构的准确率,四种结构前半部分如表1所示,后半部分为相同的两个全连接层,迭代次数为1 000,根据测试的结果,选用了准确率最高的双层双向LSTM的网络结构。

表1 不同模型的准确率对比

为了优化输入数据的尺度,对比使用不同尺度数据的输入时的准确率。经过预处理的数据为特征维度为50、长度100的时间序列,对应频率0~50 Hz,事件100 s,每个特征对应带宽1 Hz的频段,序列每个时间点的间隔为1 s。我们对数据进行不同尺度的裁剪,分别减少特征维度和序列长度,保留较低频段部分的时间序列前面的部分,设置训练次数1 000,从训练集随机划分20%的数据用于检验。图7显示了准确率随输入数据尺度的变化,横坐标表示保留的时间序列长度,纵坐标表示保留的特征数,颜色表示最终准确率。图6显示,准确率随着输入数据的尺度增加而增高,但输入数据达到一定尺度后,增加输入的尺度对准确率影响不明显。当输入数据为40个通道、序列长度为40时(对应1~40 Hz、1~40 s的信息)准确率最高(98.33%),将该尺度作为最终选取的输入尺度。

图7 准确率随输入数据尺度的变化

为了避免过拟合,在每个BiLSTM层之后使用了dropout层,达到正则化的效果,在训练阶段,为了防止深层神经网络过度拟合,随机丢弃了一些网络权值[16-17]。为了选取最优的丢弃比例,从训练集随机划分出20%用于检验,图8为准确率随丢弃比例的变化,当丢弃比例为40%时,准确率达到最高98.3%,最终确定丢弃比例为40%。第一个dropout层忽略了从第一个BiLSTM层接收到的40%输入,数据被输入下一个BiLSTM层,第二个dropout层忽略了第二个从BiLSTM层接收到的40%输入,并传入全连接层,把全连接层的部分神经隐藏,提高模型的泛化能力。

图8 准确率随丢弃比例变化

最终选定的输入为40个特征、长度40的多通道时间序列,模型包含两个双向LSTM层和两个全连接层,每个双向LSTM层含有100个隐藏单元,第一个双向LSTM层是多对多数出,输出每个时刻的状态;第二个双向LSTM层是多对单的输出,将最后一步前向和后向流的输出连接起来并馈送到分类层。每个双向LSTM层后连接一个dropout层,比例为40%。第一个全连接层使用ReLU激活函数,第二个全连接层使用Softmax激活函数,实现分类功能。图9给出模型的结构,表2给出模型各项参数。

图9 模型结构

表2 模型的超参数设置

为了评估算法的性能和稳定性,用5折交叉验证检验方法,将1 500个样本均分为5组,每组300个样本,每轮选取一组作为验证集,将留下的4组作为训练集,迭代次数为1 200。结果显示(图10)5轮训练的验证集准确率在96.00%~99.67%之间,验证集平均准确率为98.36%。使用全部训练集数据训练后,经过测试集检验,准确率达到97.5%,表明模型有较好的泛化能力。

图10 5折交叉验证

4 结 语

使用内蒙古地震台网记录的天然地震和爆破事件资料,选取地震事件和爆破事件的单台垂直向记录,经过短时傅里叶变换后,拆分为多通道时间序列,作为输入数据。经过在验证集上的多次实验调参,选取最优的输入数据尺度和模型超参数,最后确定使用包含两个双向LSTM层的神经网络作为分类器,实现天然地震和爆破的分类。经过5折交叉验证,最终在验证集的平均准确率达到98.36%。使用全部训练集数据训练模型,经测试集检测,准确率达到97.5%。实验结果表明,模型具有较好的稳定性、准确率和泛化能力。

猜你喜欢
尺度准确率神经网络
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
财产的五大尺度和五重应对
神经网络抑制无线通信干扰探究
高速公路车牌识别标识站准确率验证法
宇宙的尺度
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定