地震自动编目处理系统在2023年广东河源M4.3地震序列中的应用

2023-02-19 02:48洪玉清林庆西姜喜姣
华南地震 2023年4期
关键词:余震编目偏差

梁 明,刘 军,洪玉清,林庆西,姜喜姣,田 平

(1.广东省地震局,广州 510070;2.中国地震局地震监测与减灾技术重点实验室,广州 510070)

0 引言

大震发生后,通常在震中一定范围内会伴随着密集的余震序列。快速准确地产出余震序列目录可为震后趋势判定、地震应急及救援等工作提供重要参考。同时,余震序列目录还可以为震源机制快速测定、地震破裂过程反演、余震精定位以及发震构造研究等[1-5]提供基础资料。因此,大震过后的余震序列产出至关重要,如何快速准确地产出余震目录是地震监测工作的重要内容之一。

目前,大震后的余震序列目录以及日常地震目录的产出主要还是依靠地震编目人员人工完成。就广东台网来说,每年需人工分析地震平均达4 千多个,震相数十万余条。近年来,随着台网密度的不断加大,尤其是国家地震烈度速报与预警工程广东子项目以及粤港澳大湾区与粤西地区地震监测能力提升工程项目建设完成之后,广东省测震台数量将从原来的112 个增加至178 个[6-7],可编目的地震数量和记录的台站数将会越来越多,依靠现有的人工处理模式完成地震编目工作将面临重大挑战,迫切需要一套能够替代人工分析的地震数据自动处理系统。为了解决上述问题,广东省地震局地震监测技术及软件研发创新团队基于深度学习研发了两套地震自动编目处理系统,均使用的是基于本地波形数据重新训练的深度神经网络模型。目前两套系统已经在广东台网部署安装,处于试运行阶段。

据中国地震台网中心正式测定,北京时间2023年2月11日10时41分42秒,广东河源市源城区发生了M4.3 地震,震中位于北纬23.76°,东经114.64°,震源深度11 km。截至2023 年2 月18 日24 时,广东地震台网编目余震239 条,其中ML0.0~0.9 有206 条,ML1.0~1.9 有28 条,ML2.0~2.9 有4 条,ML3.0~3.9 有1 条,最大余震为2 月11 日14时的ML3.4 地震。此次地震短期内余震较密集,以微小地震为主,并且有很多叠加地震,波形重叠交错,分析难度较大,对自动编目系统是一次严峻的考验。因此,本文利用两套地震自动编目系统检测的河源地震序列结果,通过与人工编目结果对比,从震相拾取精度、定位参数精度等维度分析讨论自动编目系统的实际运行效果,为进一步完善系统提供参考依据,从而加快推进地震自动编目系统的业务化运行。

1 地震自动编目系统简介

广东省地震局地震监测技术及软件研发创新团队于2021 年创建,其中一个研究方向就是基于机器学习的事件自动检测、定位等相关算法及软件的研发。在广东省地震局的支持以及团队成员的努力下,研发了两套地震自动编目处理系统(以下简称系统1 和系统2)。其中,系统1 是在前期工作的基础上[8],选取PhaseNet 模型[9],使用2008 年至2021年广东省地震数据对其进行重训练,利用重新训练后的深度神经网络模型进行震相到时拾取,然后采用GaMMA算法[10]进行震相关联及定位。因GaMMA算法定位时不产出震级,因此在本研究中并未就两套地震自动编目系统在震级方面的表现进行评估。系统2 是基于Mask R-CNN 模型[11],使用2007 年至2020 年广东省地震数据对其进行重新训练,然后利用重新训练后的模型进行震相到时拾取,采用自研算法进行震相关联,最后调用MSDP 软件中的Hyposat定位程序进行定位。

2 数据选取及处理

本文是选取2023年2月10日0时至2023年2月18 日24 时广东台网记录到的连续地震波形数据进行处理分析,在该时段内,两套地震自动编目处理系统与广东台网人工编目系统使用的台站分布完全一致。广东河源M4.3地震震中周边50 km范围内包含14 个测震台站,距离震中最近的是LVY 台,震中距约为2 km,100 km范围内包含18个测震台站,150 km范围内包含27个测震台站(图1)。因为此次地震余震相对集中,因此本文研究区域范围是23.68°~23.84°N,114.56°~114.72°E。在上述研究时段及研究区域内,广东地震台网人工编目地震共241 条(以下简称人工目录),系统1 共产出地震目录643 条(以下简称自动目录1),系统2 共产出地震目录136条(以下简称自动目录2)。

图1 地震台站分布图(五角星为主震震中,三角形为地震台站)Fig.1 Distribution map of seismic stations(the pentagram is the epicenter of main shock and the triangle is the seismic station)

本文将以人工目录为准,如果自动目录与其发震时刻偏差在3 s 以内,震中位置偏差在15 km 以内,则认为匹配成功,视为同一地震事件;如果有多条事件符合匹配条件,则以发震时刻差值最小为依据优先选择匹配事件;如果自动目录中的事件无法在人工目录中找到,则认为是系统多检测的事件;如果人工目录中的事件无法在自动目录中找到,则认为是系统漏检测的事件。

3 结果分析

图2给出的是自动目录与人工目录震中分布情况。从图中可以看出,系统1产出的自动编目地震数量明显多于人工编目地震数量。基于观测报告统计,在研究时段以及研究范围内,人工编目共产出地震目录241 条,系统1 共产出地震目录643条,比人工目录多出402条,自动目录数量是人工目录的2.67 倍。自动目录1 中有213 个地震与人工目录匹配成功,其中ML3.0 及以上地震事件匹配率为100%,ML2.0~2.9 地震事件匹配率为100%,ML1.0~1.9 地震事件匹配率为92.9%,ML0.0~0.9地震事件匹配率为87.4%。系统多检测出430 个地震事件,漏检测28个地震事件。相较于系统1,系统2 产出的自动编目地震数量要少很多,系统2 共产出地震目录136 条,比人工目录少105 条。自动目录2 中有127 个地震与人工目录匹配成功,其中ML3.0 及以上地震事件匹配率为100%,ML2.0~2.9地震事件匹配率为100%,ML1.0~1.9 地震事件匹配率为76.9%,ML0.0~0.9 地震事件匹配率为48.8%。系统多检测出9 个地震事件,漏检测114个地震事件。

图2 自动目录与人工目录震中分布图Fig.2 The epicenter distribution of the automatic catalog and manual catalog

为了更明显的看出两套系统产出自动目录随时间的变化情况,我们给出了自动目录与人工目录余震累积数量变化图(图3)。由图3 可见,对于系统1,在主震发生后的前1 个小时,其产出的自动目录中的余震数量比人工目录中的余震数量略少;在这之后,自动目录中余震数量明显多于人工目录中的余震数量。而对于系统2,在研究时段内,其产出的自动目录中的余震数量一直少于人工目录中的余震数量,尤其是在12 日之前;而12日之后,其余震数量与人工目录中的余震数量相差不大。

图3 自动目录与人工目录余震累积数量变化图Fig.3 The cumulative number diagram of aftershocks in automatic catalog and manual catalog

图4 给出了自动目录与人工目录Pg、Sg 震相到时拾取差异统计情况,其中震相到时偏差为自动目录减去人工目录。统计表明,系统1自动拾取的震相中有2340 个Pg 震相和2539 个Sg 震相与人工拾取震相匹配,震相检出率分别为89.9%和84.7%。Pg震相平均到时差异为0.020 s,Pg震相拾取偏差小于±0.1 s 占98.4%,小于±0.2 s 占99.0%,小于±0.5 s占99.7%。Sg震相平均到时差异为0.024 s,Sg震相拾取偏差小于±0.1 s占97.1%,小于±0.2 s占99.1%,小于±0.5 s 占99.6%。系统2 自动拾取的震相中有1258 个Pg 震相和1306 个Sg 震相与人工拾取震相匹配,震相检出率分别为48.3%和43.5%。Pg 震相平均到时差异为0.052 s,Pg 震相拾取偏差小于±0.1 s 占89.7%,小于±0.2 s 占91.6%,小于±0.5 s占98.4%。Sg震相平均到时差异为0.077 s,Sg震相拾取偏差小于±0.1 s 占86.9%,小于±0.2 s 占92.8%,小于±0.5 s占97.4%。

图4 自动目录与人工目录Pg、Sg震相到时偏差统计图Fig.4 The statistical diagram of arrival time deviation of Pg-phase and Sg-phase between automatic catalog and manual catalog

图5分别给出了自动目录与人工目录匹配成功地震事件在发震时刻、震中位置以及震源深度方面的偏差统计情况,其中偏差值为自动目录减去人工目录。对于系统1,发震时刻偏差基本在±1.0 s 以内,共有206 个地震,占比96.7%(图5(a));震中位置偏差整体在3 km 以内,极个别在3~8 km之间,偏差小于3 km 的地震有208 个,占比97.7%(图5(b));震源深度偏差整体在±4 km以内,共有208 个地震,占比97.7%(图5(c))。对于系统2,发震时刻偏差基本在±0.5 s以内,共有125个地震,占比98.4%(图5(d));震中位置偏差整体都在2 km 以内,偏差小于1 km 的地震有122 个,占比96.1%(图5(e));震源深度偏差整体在±1 km以内,共有124个地震,占比97.6%(图5(f))。

图5 自动目录与人工目录多参数对比图Fig.5 Multi-parameter comparison between automatic catalog and manual catalog

4 讨论

从图2、图3 中我们已经看到,系统1 产出的自动目录数量远远多于人工目录数量,而系统2产出的自动目录数量要少于人工目录数量。为了分析两套系统多检测地震事件的可信度以及漏检测地震事件的原因,我们对其逐一进行了人工确认。

经过确认,我们发现系统1 多检测出的430 个事件和系统2 多检测出的9 个事件均含有地震信号,无误触发事件。此次河源M4.3 地震震中附近台站较多,并且均匀分布在震中周围(图1),对于震级较小,甚至震级为负的地震都有多个台站记录到较清晰的事件波形(图6a)。两套系统多检测出的地震事件震级均为负,一般情况下,台网编目人员不会将负震级的地震编入目录,因此没有与人工目录匹配上。

图6 多检测和漏检测事件波形图Fig.6 Waveform of multiple detection and missed detection events

对于系统1 漏检测的28 个地震事件,经过查看人工目录和自动目录的详细数据,发现漏检测的地震主要分成两种情况。一种是漏检测地震事件前后有多个事件,且发震时间间隔很短,近台未叠加在一起。这种情况会出现同一检测窗口包含多个地震,而PhaseNet方法在处理这种情况时存在一定的缺陷,即对于同一检测窗口内包含多个地震,且振幅相近或相差较大时,较小的地震概率值会显著偏低,从而被遗漏[8]。本次河源地震短期内余震较密集(图3,图6b),出现这种情况较多,这也是该系统漏检测地震的主要原因之一。而另外一种是事件波形叠加在一起,从而造成叠加地震中信噪比较小的地震信号被遗漏(图6c)。

因系统2 漏检测的地震事件较多,所以我们从人工和自动目录详细数据、震相检测策略等多方面进行了分析,发现造成系统2漏检测地震的主要原因是震相检测策略问题。该系统设置检测窗口长度为60 s,并且没有设置滑动窗口,当该地震被分割在两个检测窗口时,该地震会被遗漏。因为Mask R-CNN 模型是拾取事件波形轮廓,然后再将起始像素信息转换成初至震相信息。当同一检测窗口中包含多个地震且振幅相差较大时,做归一化处理后,小的地震事件波形轮廓就拾取不到,从而造成地震事件被遗漏。又因该系统设置了较长检测窗口,大大增加了其发生的概率。Mask RCNN 模型在拾取出事件波形轮廓的同时会给出一个分类分数,该系统对于分数较低的轮廓信息直接去掉不用,这样大概率会造成波形叠加在一起的地震事件被遗漏。

针对自动目录与人工目录匹配成功的地震事件,我们做了进一步的分析。两套系统自动拾取的Pg、Sg 震相到时偏差均呈正态分布,且主要分布在±0.5s以内(图4),震相拾取精度较高。两套系统自动拾取的Sg 震相都要比Pg 震相多,这也符合本次河源地震特点,即余震较密集,很多地震事件波形叠加在一起,Pg 震相拾取难度大大增加(图6)。Pg 震相的平均到时差要小于Sg 震相的平均到时差,说明Pg 震相拾取精度要高于Sg 震相。这一点从图4(b)中也可以明显看到,系统2 中,Pg 震相到时偏差正负数量均匀分布,收敛性更好,而Sg 震相到时偏差整体在零轴左侧,存在早于人工识别Sg波震相到时的情况。这可能是由于Mask RCNN 模型是拾取事件波形轮廓,为了兼顾计算速度等因素设置1 个像素点代表0.1 秒,而Sg 震相属于续至震相,不像Pg 震相那样边界相对清晰,在像素信息转换成震相信息时造成了上述情况发生。两套系统产出的自动目录与人工目录在发震时刻、震中位置以及震源深度方面偏差均较小(图5)。系统1中有个别地震事件偏差较大,经过分析发现主要原因是在拾取和关联震相时混淆了相邻地震的Pg、Sg震相。

5 结语

为了更好的评估两套地震自动编目处理系统在广东台网的试用情况,促进系统的改进和完善,本文利用2023 年2 月11 日广东河源M4.3 地震主震前1 天以及后7 天广东台网记录的连续波形数据,结合人工编目结果,从震中分布、震相拾取精度、定位精度等维度分析讨论了两套地震自动编目系统的优缺点,得出如下结论:

(1)在研究时段和研究范围内,系统1 检测出643 条地震,是人工目录的2.67 倍,事件匹配率较高;系统2 检测出136 条地震,约为人工目录的二分之一,ML1.0 以下地震事件匹配率较低。2 套系统自动检测结果均为真实事件,无误触发,事件真实率为100%。

(2)两套系统产出的自动目录在发震时刻、震中位置以及震源深度方面均与人工目录偏差较小;自动拾取的Pg、Sg 震相到时精度较高,Pg 震相拾取精度要高于Sg 震相,系统2 存在早于人工识别Sg波震相到时的情况。

(3)两套系统产出的地震目录可靠度较高,都具备地震自动编目的能力;两套系统相比,系统1处理大震后较密集余震的能力较强,可以产出完备性较好的地震目录,而系统2处理余震能力还有待加强。

(4)两套系统在处理同一检测窗口包含多个地震的能力还需进一步加强,尤其是系统2。

因系统1 暂未产出震级,本文未对两套系统在震级方面的表现进行评估;同时在笔者撰写论文期间,研发团队就系统2中的问题进行了修复,待后续系统不断改进完善后,再做细致分析。

致谢:本文部分图件使用GMT 软件绘制,得到了审稿专家对于改善论文质量的宝贵建议和意见,在此一并表示感谢。

猜你喜欢
余震编目偏差
“超长待机”的余震
国家图书馆藏四种古籍编目志疑
如何走出文章立意偏差的误区
两矩形上的全偏差
生死之间的灵魂救赎——《余震》和《云中记》的伦理问题
粤剧编目整理之回顾与展望
关于均数与偏差
CALIS联机合作编目中的授权影印书规范著录
三次8级以上大地震的余震活动特征分析*
图书馆编目业务外包发展探讨