基于机器学习算法的2023年土耳其地震显著持时预测模型

2023-08-16 05:08公茂盛赵一男
世界地震工程 2023年3期
关键词:震动残差土耳其

贾 佳,公茂盛,赵一男

(1. 中国地震局工程力学研究所, 地震工程与工程振动重点实验室, 黑龙江 哈尔滨 150080;2. 地震灾害防治应急管理部重点实验室, 黑龙江 哈尔滨150080)

0 引言

准确高效地预测地震动持时对工程抗震至关重要,目前常用的预测地震动持时的方法是建立持时预测方程。BOMMER等[1]基于NGA(next generation attenuation)数据库建立了持时预测方程,该方程考虑了震源项、距离项和场地项参数以及断裂机制等。徐培彬等[2]基于我国强震动台网地震动数据,对BOMMER等[1]提出的预测模型做了简化,建立了适用于我国的显著持时预测公式。DU等[3]基于NGA-West2地震动数据库建立了显著持时预测公式,该方程考虑了矩震级、断层距、VS30和断层破裂面顶部深度。AFSHARI等[4]考虑震级、断层距、VS30和盆地效应建立了适用于浅地壳地震的显著持时预测公式。BAHRAMPOURI等[5]基于日本的KiK-net(Kiban Kyoshin net)地震动数据库,考虑震源项、距离项、场地项和震源类型等因素,分别建立了适用于浅地壳、俯冲带板间和俯冲带板内三类地震的显著持时预测公式。上述研究均为事先设定一个数学公式或模型,然后根据数据集回归得到公式或模型系数。

近年来,随着强震动观测数据数量和质量的提升,基于数据驱动的机器学习方法在地震动参数预测、结构损伤识别等方面得到了重要应用[6-8]。JI等[9]基于NGA-West2地震动数据库,考虑震源项、距离项和场地项参数,建立了地震动累积绝对速度的RSO-DNN(deep neural network with refined second-order neuron)神经网络预测模型。ZHU等[10]基于日本K-NET(Kyoshin net)地震动数据库中震级3~7.5级的地震事件,建立了用于震级估算的深度卷积神经网络DCNN-M(deep convolutional neural network for earthquake magnitude estimation)模型,能够实时对震级进行估算。且在2021年2月13日日本福岛近海Mj7.3级地震发生后对震级进行了估算,验证了其模型的有效性[11]。靳超越等[12]筛选并处理了2021年云南漾濞地震的地震动记录,基于机器学习算法对前震和余震下地震动记录进行特征提取,并根据提取得到的特征母波时程来模拟主震的强震动记录。王自法等[13]基于日本和智利的大量地震动记录训练深层卷积神经网络(CNN, convolutional neural network),该模型能够直接从初至地震波中自动提取特征,输入参数为单台站初至竖向地震波,且震中距、震源深度以及VS30作为辅助输入,输出参数为震级,结果表明用CNN方法对震级进行估算具有准确性和时效性。综上所述,采用机器学习方法建立地震动参数预测模型,成为当前地震工程领域的热门课题。

2023年2月6日土耳其发生两次7级以上地震(表1中第11次地震与第13次地震可算作一次地震)及多次余震,震源深度在20 km以内,本次土耳其地震为双主震型地震,地震动持时较长,且多次发生强烈余震,造成大量建筑物倒塌且人员伤亡惨重。本文对土耳其地震主震及其余震共计13次地震中获得的地震动记录进行了处理和筛选,共得到660组地震动记录(一个竖向分量,两个水平分量共1980条,计算持时取两个水平分量的算数平均值),然后基于机器学习算法对土耳其地震的地震动持时进行预测,建立了适用于该区域的显著持时预测模型,对预测结果进行误差分析和残差分析,并将预测模型与传统持时预测公式预测结果进行了对比,验证了所建立模型预测结果的可靠性。

表1 地震事件详细信息(AFAD)Table 1 Detailed information of earthquake events (AFAD)

1 地震动持时选取及数据处理

1.1 地震动持时定义

建立持时预测模型需要选取合适的持时指标,目前地震动持时的定义大致分为四类:括号持时(bracketed duration)、一致持时(uniform duration)、显著持时(significant duration)、有效持时(effective duration)。相关研究表明,显著持时对结构抗倒塌能力、累计损伤指标等有重要影响,能够用来评价持时对结构地震反应的影响[14-16]。显著持时的具体计算公式如(1)、(2),图1给出了其定义的示意图。

图1 显著持时定义示意图Fig. 1 Schematic diagram of the definition of significant duration

(1)

DS=t2-t1

(2)

式中,IA为Arias强度,t为总持时,a(t)为地震动加速度记录,g为重力加速度,DS为显著持时。公式(1)中,当t1为地震动5%IA对应时刻点、t2为地震动75%或95%IA强度对应时刻点时,分别定义为70%显著持时(DS5-75)[17]和90%显著持时(DS5-95)[18],如图1所示,本文选取二者作为持时预测模型的指标。

1.2 地震动数据处理

选取震级在5.0级以上的地震动记录进行基线矫正和滤波处理,并获取震源深度Dh、断层距Rrup、场地VS30、70%显著持时DS5-75和90%显著持时DS5-95等参数,其中DS5-75和DS5-95取两个水平方向的算数平均值。经过筛选总共得到660组地震动记录,DS5-75随各地震动参数的分布情况如图2所示,DS5-95随各地震动参数的分布情况如图3所示。本次地震长持时地震动记录较多,Dh最小值为6.20 km,最大值为16.82 km,离散性较大,Rrup最小值为16.27 km,最大值为538.32 km,VS30最小值为186.00 m/s,最大值为1510.00 m/s。从图2(c)和图3(c)可以看出Rrup对持时的影响最为明显,随着Rrup增大,DS5-75和DS5-95呈不断增大的趋势,从图2(a)、(b)和图3(a)、(b)可以看出Mw、Dh对持时的影响并不明显,可能是由于本文模型所用数据全部来自于

图2 DS5-75随Mw、Dh、Rrup和VS30的变化Fig. 2 Trend of DS5-75 versus Mw, Dh, Rrup and VS30

图3 DS5-95随Mw、Dh、Rrup和VS30的变化Fig.3 Trend of DS5-95 versus Mw, Dh, Rrup and VS30

2023年土耳其地震的几次主震和余震,数据集Mw和Dh离散性较大,从图2(d)和图3(d)可以看出VS30对DS5-75和DS5-95有一定影响,当VS30小于300 m/s和大于900 m/s时短持时地震动较少。表1给出了所用的地震事件,从表中可以看出,所用的地震动记录中震级较大地震的地震动记录较多,本文所用记录及其信息全部来自于土耳其灾害和应急管理局(Turkish Prime Ministry-Disaster and Emergency Management Presidency,AFAD),不同网站提供的Mw和Dh等信息有所不同,如本文最大Mw为7.7级,对应Dh为8.60 km,美国地质勘探局USGS(United States Geological Survey)给出的最大Mw为7.8级,对应Dh为17.60 km,欧洲-地中海地震中心EMSC(European-Mediterranean Seismological Centre)给出的最大Mw为7.7级,对应Dh为10 km,本文以AFAD数据为准。

本文模型是基于2023年土耳其地震建立的显著持时预测模型,适用于土耳其地区,如用于其他地区,预测结果需要考虑区域特点。此外,本文模型适用于Mw在5~7.7之间,Dh在7~16.82 km之间,Rrup在16.27~538.32 km之间,VS30在168~1510 m/s之间的地震,需要注意Mw和Dh分布具有离散性可能会对预测结果产生影响,尤其Dh大于10 km时只有Dh为16.82 km的数据,故当Dh大于10 km时不建议应用,且当Rrup在50 km以内时,数据量较少误差将增大,预测结果的准确性也会下降。

2 持时预测模型及预测结果分析

2.1 神经网络模型

常用的神经网络有深度神经网络(DNN)、卷积神经网络(CNN)和循环神经网络(RNN)等,其中CNN可以通过卷积和池化层来降低特征维度,在图像识别领域应用广泛,RNN会对前面的信息进行记忆并应用于当前输出计算中,适用于时间序列预测[19]。本文所研究问题输入参数数量及维度较少且各输入参数之间并非时间序列,故本文采用DNN形式如图4所示。该模型考虑了Mw、Dh、Rrup和VS304个输入参数,以DS5-75和DS5-95为输出参数,将660组地震动记录的参数按照8∶2的比例划分训练集和测试集,训练集用于神经网络的学习训练,测试集用于检验模型的泛化能力,该模型在Python的TensorFlow框架中完成训练[20]。损失函数是用来衡量实际值与预测值之间差异的函数,是用来评价神经网络的性能指标,本文选用均方误差MSE为损失函数,具体计算公式如(3)所示。激活函数是输入值经过神经元输出时在神经元上运行的函数,本文选择sigmoid为激活函数,该函数可以将原始数值和输出预测值缩放至0到1之间,输出范围有限,优化稳定。除此之外,本文还选用了自适应学习率的Adam梯度下降优化算法,以减小输出误差[21]。

图4 神经网络结构图

一般来说,增加隐藏层的个数能够使神经网络解决更复杂的问题,但层数过多会出现过拟合现象。对于神经元来说,个数太少会使神经网络学习能力不足,无法充分学习参数之间的非线性关系,但个数太多会使计算时间较长,也会出现过拟合问题,目前并无公认的神经网络节点个数计算公式,本文对测试集的MSE进行对比分析,最终选定隐藏层层数为2,每层30个神经元,神经网络的结构如图4所示,具体对比分析过程如表2所示。

表2 不同隐藏层层数和神经元个数均方误差对比

(3)

本文所用模型属于含多个隐藏层的多层感知器,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。在设计过程中通过反复对比试验确立适量的神经元计算节点和多层运算层次结构,选择合适的输入层和输出层并进行调优,基于2023年土耳其地震中获得的地震动记录建立数据集并对神经网络模型进行训练,模型通过学习虽不能100%找到显著持时与各参数的函数关系但会尽可能地逼近显著持时与各参数之间的关联关系。相比于传统的浅层学习,深度学习算法明确了特征学习的重要性,通过特征变换将样本在原空间的特征表示变换到一个新特征空间,使预测任务更容易,利用大数据来学习特征,更能刻画数据丰富的内在信息[19]。

2.2 预测结果分析

将土耳其地震中660组地震动记录的Mw、Dh、Rrup和VS30作为输入,然后用上述的机器学习模型对DS5-75和DS5-95进行预测,将预测得到的持时与计算得到的持时进行对比,结果如图5所示,图中黑色虚线为45度基准线,表示预测值与计算得到的值相等,红色三角形为测试集的样本,蓝色圆圈为训练集的样本,当数据点位于黑色虚线上方时,说明预测值大于实际值,当数据点位于黑色虚线下方时,说明预测值小于实际值。从图中可以看出,训练集和测试集绝大多数数据点在45度基准线区域内且均匀分布在两侧,证明该持时预测模型能够较为准确地预测土耳其地震的持时且具有泛化能力。当DS5-75在10 s以内时,数据点多位于45度基准线的上方,说明预测结果偏大;当DS5-75超过75 s时,数据点多位于45度基准线的下方,预测结果偏小。当DS5-95在20 s以内时,数据点多位于45度基准线的上方,说明预测结果偏大;当DS5-95超过120 s,数据点多位于45度基准线的下方,预测结果偏小。从1.2节的数据分布来看,DS5-75小于10 s或大于75 s的地震动数目较少,DS5-95小于20 s或大于120 s的地震动数目也较少,可能是出现这一现象的主要原因。通过建立持时预测模型能够尽可能地逼近显著持时与各参数之间的关联关系,但会存在一定的误差,而且预测对象为DS5-75和DS5-95,其本身具有一定离散性,预测区间在0~120左右,区间较大,容易产生误差。

图5 DS5-75和DS5-95预测值和实际值对比Fig. 5 Comparison of the predicted and measured values of DS5-75 and DS5-95

2.3 残差分析

模型的预测性能一般可通过残差分析来评估[22],残差表示的是预测结果的相对误差,分为事件内残差和事件间残差,事件内残差是指所有记录预测结果的残差,事件间残差是指一次地震预测结果的残差,具体计算公式如(4)所示。

(4)

为了进一步验证模型对土耳其地震持时预测的准确性,本文对预测结果进行了残差分析,事件内和事件间残差随Mw、Rrup和VS30分布如图6和图7所示,图中实线表示残差的局部平均值,虚线表示其95%置信区间。从图中可以看出,随着Rrup增大,事件内残差略微偏向于大于0的一侧,但其随着Mw和VS30均无显著变化。此外,事件间残差随Mw增大无明显变化,在震级为5-7级时略微偏向于小于0的一侧,可能是由于所用的地震动记录基本来自于2023年土耳其地震的几次地震动事件,事件间残差受到影响。总体来说事件内残差均分布在[-3,3]范围内,事件间残差主要集中在[-1,1]范围内,且在0基准线两边分布较为均匀,持时预测结果具有合理性和可靠性,预测误差在一定程度上会受Mw的影响,但仍在可接受的范围内。

图6 DS5-75事件内残差和事件间残差Fig. 6 Within-event residuals and between-event residuals of DS5-75

图7 DS5-95事件内残差和事件间残差Fig. 7 Within-event residuals and between-event residuals of DS5-95

3 与其他模型对比

3.1 拟合效果对比

将本文建立模型与其他持时预测公式的预测结果相比较,结果如图8和图9所示,其中公式DW17[3]是基于美国NGA数据库建立的,适用于Mw在3到7.9级之间且Rrup在300 km以内的浅地壳地震,公式AS16[4]基于全球数据库建立,对于走滑型和逆断层型地震震级应在3-8级之间,对于正断层型地震震级应在3-7级之间,且Rrup应在0到300 km,VS30应在150到1500 m/s,盆地深度应在0到3.0 km,该公式仅适用于浅地壳地震,公式BRG21[5]基于日本KiK-net数据库建立,考虑了浅地壳、俯冲带板间和俯冲带板内3种地震类型,该公式适用于Mw为4到7.5,Rrup在200 km以内的浅地壳地震,Mw为4到9,Dh在10 km以内,Rrup在500 km以内的俯冲带板间和俯冲带板内地震,且VS30应在150到1500 m/s的范围内,Z1应在0到400 km范围内。

图8 DS5-75拟合效果对比Fig. 8 Comparison of the fitting results of DS5-75

图9 DS5-95拟合效果对比Fig. 9 Comparison of the fitting results of DS5-95

图8与图9中红色点表示震级为5-7级的土耳其地震动记录持时随Rrup的变化,蓝色的点表示震级为7-8级的土耳其地震动记录持时随Rrup的变化,左侧直线表示当Mw为6级,震源深度为7 km,VS30为525 m/s时由持时预测公式得到的DS5-75和DS5-95随断层距的变化,右侧直线表示当Mw为7.5级,震源深度为7 km,VS30为525 m/s时由持时预测公式得到的DS5-75和DS5-95随断层距的变化。从图8(a)和(b)可以看出,本文模型的预测结果小于预测公式的结果,能够较好地拟合2023年土耳其地震动记录的DS5-75,而三种预测公式预测结果偏大。从图9(a)可以看出,当Rrup在100 km以内时,本文模型的预测结果要略大于预测公式的结果,随着Rrup增大,本文模型预测结果与DW17和BRG21 shallow crustal的预测结果非常接近,都能够较好的拟合土耳其地震动记录的DS5-75,AS16结果偏小。从图9(b)可以看出,当Rrup小于100 km时,本文模型预测结果与DW17结果较为接近而AS16略大,之后本文模型的预测结果略大于预测公式。综上所述,本文模型拟合效果较好,DW17和BRG21 shallow crustal也能较好的预测DS5-95,但在预测DS5-75时结果偏大,AS16则不能很好的拟合远场地震的DS5-95且在预测DS5-75时结果偏大。因此,上述预测公式都不能很好的预测土耳其地区的显著持时,建立土耳其地区的持时预测模型很有必要,预测公式依赖于特定的形式,而机器学习模型没有特定的形式,能更好地随数据集的变化而变化。

虽然由机器学习算法能够方便快捷的建立持时预测模型并能较好地对本次土耳其地震的显著持时进行预测,但该方法也存在很多问题。首先,机器学习模型主要是从大量数据集中学习各参数的变化规律,没有特定形式,依赖于分布均匀且覆盖广泛的数据集,更容易受到数据集数量和质量的影响,效果不如预测公式稳定,在应用于其他区域或超出其适用范围时,泛化能力可能没有持时预测公式好。其次,在建立神经网络模型的过程中,超参数的设定、隐藏层层数和神经元个数的选取并无公认的计算公式,可能需要根据经验反复尝试、对比效果等,会受到一定主观因素的干扰。最后,神经网络模型自动地从数据集中学习各参数变化规律及非线性关系,虽然方便但无法观察其学习过程,输出结果难以解释,在应用时可能会影响结果的可接受程度。

3.2 残差对比

为了进一步对比本文模型与预测公式对本次土耳其地震显著持时的预测效果,分别用本文模型和上一节中的预测公式对本次土耳其地震中Rrup300 km以内地震动的DS5-75和DS5-95进行预测(未超过预测公式的适用范围),然后进行残差分析,图10和11以上一节中拟合效果相对较好的预测公式DW17为例展示残差对比的结果。从图中可以看出,两者的事件内残差分布范围大体一致,但对于事件间残差,DW17在0基准线两侧分布更不均匀,在震级较小时其事件间残差偏向于大于0的一侧,在震级较大时则偏向小于0的一侧。为了进一步对比其预测效果,对本文预测模型和各类预测公式事件内、事件间残差的标准差和总标准差进行计算,结果如表3所示。总标准差结合了事件间项和事件内项[3],计算公式如(5)所示。一般来说,残差应当均匀的分布在0基准线的左右两侧,标准差越小残差在0基准线附近分布更集中,预测效果越好。从表2可以看出本文模型的事件内、事件间残差的标准差和总标准差均小于持时预测公式,残差离散性较小,预测效果相对更好,此外DW17的预测效果优于其他两类预测公式,AS16事件内、事件间残差的标准差和总标准差最大,残差离散性最大,预测效果相对较差。

图10 DS5-75事件内残差和事件间残差对比Fig. 10 Comparing the Within-event residuals and Between-event residual of DS5-75

表3 本文模型和持时预测公式的标准差Table 3 Standard deviations of this study and the traditional prediction equations

(5)

图11 DS5-95事件内残差和事件间残差对比Fig. 11 Comparing the Within-event residuals and Between-event residual of DS5-95

有部分数据预测误差稍大大,可能是因为本文是根据2023年土耳其地震建立的显著持时预测模型,震级、断层距和VS30等参数分布不均匀,在部分区间内较稀疏,对模型的预测效果有一定影响,未来可以收集更多土耳其地区的数据或采用模拟地震动的方式对数据集进行扩充。

4 结论与讨论

本文基于土耳其地震中获得的660组地震动记录,选取Mw、Dh、Rrup和VS30作为输入参数,DS5-75和DS5-95作为输出参数,采用机器学习算法,建立了地震动显著持时预测模型,然后对预测结果进行拟合效果分析和残差分析,并将本文模型的预测结果与其他预测公式对比,验证了本文模型的预测结果具有合理性、准确性与可靠性,所得结论如下:

1)随着Rrup增大,事件内残差略微偏向于大于0的一侧,但其随着Mw和VS30均无显著变化。此外,事件间残差随Mw增大无明显变化,但略微偏向于小于0的一侧,总体来说事件内残差均分布在[-3,3]范围内,事件间残差主要集中在[-1,1]范围内,且在0基准线两边分布较为均匀,误差始终在可接受的范围内,说明基于机器学习算法对土耳其地震进行持时预测的结果具有合理性和准确性。

2)与传统预测公式预测结果对比表明,本文持时预测模型与传统预测方程的预测结果趋势相同,地震动持时随Rrup的增大而增大,但总体来看几种预测公式都不能很好的预测土耳其地区的显著持时,本文模型预测结果更加接近实际,且本文模型预测结果的残差离散性更小预测效果相对较好,说明建立适用于土耳其地区的持时预测模型很有必要且基于机器学习算法能够建立可靠的持时预测模型。

3)相比于传统的持时预测公式,基于机器学习算法建立持时预测模型更加简单高效,不用事先设定公式也不用进行回归,由模型自动从数据集中学习各参数的变化规律,且能够更好地拟合土耳其地区显著持时。

4)预测结果的准确性受数据集参数分布范围的影响较大,随着地震动记录数量增加和质量提升,可以收集更多地震动记录或采用模拟地震动记录的方法对数据集进行补充。此外,随着机器学习算法的不断发展,在数据驱动的同时可以自定义损失函数加以物理驱动,可能会取得更好的预测效果。

致谢:本文所用地震动记录全部来自于土耳其灾害和应急管理局(AFAD)。

猜你喜欢
震动残差土耳其
土耳其T-129攻击直升机
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
震动减脂仪可以减肥?
基于递归残差网络的图像超分辨率重建
我也叫“土耳其”
水电工程场地地震动确定方法
振动搅拌 震动创新
土耳其政变为何以失败告终
土耳其医改后来居上