按照数量、时间、空间和震级对地震预报的综合及分项评估

2015-12-24 10:56YosihikoOgataKoichiKatsuraGiuseppeFalconeKazuyoshiNanjoJiancangZhuang
关键词:余震震级对数

Yosihiko Ogata Koichi Katsura Giuseppe Falcone Kazuyoshi Nanjo Jiancang Zhuang

0 引言

采用对数似然函数的地震发生概率预测评估方法先前已提出、讨论并实施(比较Kagan and Jackson,1995;Ogata,1995;Ogata et al,1996; Vere-Jones,1998;Harte and Vere-Jones,2005;Schorlemmer etal,2007)。在类似的研究中,评估得分被称为熵,与对数似然得分基本相近。当前,通过对预报性能的比较,地震预报评估已能促进创建更好的地震活动性模型。地震可预测性研究合作实验室(CSEP;Jordan,2006;Zechar et al,2010)对提交的各区域预报模型的性能进行了评估。该项目的框架与加利福尼亚区域地震似然模型项目类似(Field,2007)。

似然比检验用来比较两个预报模型的评估,是地震可预测性研究合作实验室检验中心常用的主要方法。评估得分的统计显著性基于通过预报模型(Schorlemmer etal,2007;Zechar et al,2010)或 其 近 似 性(Imoto and Rhoades,2010;Imoto et al,2011;Rhoades et al,2011)在模拟实验中产生的不确定性分布来评估。采用类似的方式可对其他模型参数,如震级和空间进行检验。

然而,由于检验程序复杂,对含时间的预报的评估需要高度密集的计算。研究显示,为了检验别的模型,这些似然比检验假设了每个模型都是真的。因此,由于受非嵌套情况的影响,传统的对数似然比检验理论不适用。事实上,任何模型都可能是错的或不正确的,但可以被假定为真模型的近似。

全球性的气候问题以及极端天气、自然灾害的频繁发生常常导致我国部门农产品供应不足的现象,影响着我国农业持续健康发展。此外,我国的城市化、工业化进程的不断深化导致农业耕地的减少也一定程度上影响着农产品供应。经济的快速发展、人民生活水平的提高拉动了国内市场对农产品的需求。因此,由于国内外投资机构蓄意炒作而导致的农产品价格大幅度提升的现象时有发生,这一状况也在一定程度上影响着物价的持续走高。对此,政府必须要加大对我国农业生产的支持力度,在政策上,经济上都给予一定程度的扶持,保证我国市场农副产品的充足供应。

表1 概率的预测和实现

在这项研究中,我们假设预报模型一般不正确。然后通过比较预报性能的对数似然分数来衡量模型的质量。对数似然得分确定预测性能的方法源自下文所解释的相对熵的原始概念 (Boltzmann,1877,1878)。同样,分别评估了在空间、时间和震级各成分的预测性能。比较了各成分的边缘似然函数。这些分数被作为 Werner等(2010)和Zechar等(2010)提出的统计检验程序的一种替代方法来应用。

为了说明所提出的评分方法,我们首先使用了已经提交给正在进行的地震可预测性研究合作实验室日本实验(Nanjo et al,2011)的一些前瞻性单日预报结果。继地震可预测性研究合作实验室评估程序后,Nanjo等(2012)又评估了9级地震前后20天期间的部分结果。按照地震可预测性研究合作实验室日本方案的要求,我们对整个日本地区M≥4地震给出了所有的单日预报。然而,由于M9主震后余震的检测不完全,类似于Nanjo等(2012)所做的,我们限制了对M≥5地震预报的评估。

我们评估了2011年3月1日至31日的前瞻性预报以及同一时期两种类型的回顾性预报。检查了前瞻性预报中看起来明显意外结果的原因。在M9地震前观察到了显著的活跃前震。此外,利用点过程对数似然方法,提出并论证了连续时间段内基于条件强度的预报方法及其评估。在涉及到含时间的预报和评估的情况下,这些可以替代地震可预测性研究合作实验室的方案。

1 预测能力评估

我国大众旅游时代的到来,催生了各种各样的新型旅游者,为学术研究提供了丰富的典型素材,实现了学术贡献的实用价值。在实用主义观念的影响下,应用性或实践性研究发展步伐加快,逐步占据了相对的主导地位。其中,对大数据的挖掘是旅游者行为应用性研究中的重要组成部分。

某个模型的似然性与该模型的模拟样本分布将实现观测频度的概率成正比。Boltzmann(1878)计算了观察到的相对频度通过预测概率实现的概率。设L(p/ν)为模型p=(p1,p2,p3,…,pK)实现频度数据ν=(ν1,ν2,ν3,…,νK)的概率。则,

信息化背景下的高校思政教育协同管理,要想实现教育管理的目标,还需要建立长效的健全的协同管理机制,使高校的思政教育建设逐渐规范化、科学化。通过对大学生进行思想政治教育使他们形成正确的三观。同时高校还应对舆情进行汇集、分析和干预,及时准确的处理舆情。家庭要与学校配合,对大学生进行教育和管理。不但对大学生生活进行及时的干预,同时还要关注学生的情感,参与讨论、协商。同时还要严格监控上网信息,及时发现和消除错误信息,不断完善相关的制度。建立协同管理监管机制有利于促进大学生健康成长,培养社会发展需要的高素质人才。

表2 预报概率和误差方差得分汇总

其中利用了de Moivre-Stirling近似进行阶乘,

ERS和 ETES模型 (Falcone et al,2010)都是ETAS模型的时空扩展模型。ERS模型有一个基于Dieterich(1994)速率/状态摩擦定律的空间响应函数,在此假定应力变化和触发地震震级为正相关。ETES模型有一个随距离反幂率衰减的更简单的空间响应函数。由于第一个模型基于Dieterich的状态和速率定律,第二个基于大森-宇津(Omori-Utsu)定律,ERS和ETES模型的另一个差异便是触发活动的时间分布。ETASZH1和 ETASZH2模 型 (Zhuang,2011)还处理与位置无关的模型参数。ETASZH1模型和ETASZH2都被Nanjo等(2012)称为ETAS模型。然而,ETASZH2包含了为本研究修订了的参数值,特别是为通过平滑模拟地震活动评估预测的核函数的较窄带宽参数。与上述模型相比,研制了多层次空时传染型余震序列(HISTETAS)模型(HISTETAS5pa和 HISTETAS7pa)的两个变体来处理空间上各向异性的丛集,并使用位置相关模型参数(Ogata,2011)。这两个变体的区别在于HISTETAS7pa模型只有两个位置相关参数——背景参数μ和余震发生率参数K——而 HISTETAS5pa模型还具有位置依赖参数α,p和q。模型之间的差异汇总于表3。

Drug dose-response curve was fitted with Hill Eq 2.

一般来说,通过直接比较对数似然得分即对数L(x|y)来对比预报性能。这里,y是模型评估和预报数据,x是输出数据。对数似然得分是相对熵Ex[logL(x|y)]的估计,其中取值的期望值和基本的或真实的实现数据x的随机发生定律有关。有趣的是,我们注意到,赤池信息准则(AIC;Akaike,1973,1974,1985)衍生了同样的概念,它从预测角度在未来数据不可用的情况下利用现有数据y选择了更好的模型,模型m=1,2,…,M 的似然通过似然exp{-AICk/2}的归一化被同样诠释。

从地缘政治的视角来看,中亚位于亚欧大陆的心脏地带,北接俄罗斯,西邻北约,南与土耳其和伊朗相邻,在东部与中国新疆隔山相望,是我国西北地区安全的重要战略缓冲地带。中亚也是“丝绸之路经济带”的必经区域,是连接中国与欧洲的重要陆路通道和油气管道运输的重要走廊。此外,加强并深化同中亚国家的互信与合作,对于打击恐怖主义与境外“三股势力”,维护中国西北边疆的社会稳定意义重大。[2]

因此,在本研究中,我们使用实现数据通过直接比较综合的和分项的得分对预报性能进行了比较,并使用了对数似然、条件似然及边际似然。

2 分数及其误差估计

本研究中考虑到的所有模型都是历史相关的点过程,包括各种时空传染型余震序列(ETAS)模型,其似然函数可以在一个连续的空间内描述,如附录B(本文有附录A,B,译稿从略——译注)中给出的。然而,地震可预测性研究合作实验室检验中心认为在大小为1日×0.01平方度×0.1震级单位的离散时间-空间-震级箱Δ内,地震数目为泊松随机变量。因此,它们的综合评分是基于泊松对数似然,其误差估计可以通过使用箱与箱之间的独立性假设来给定。下文对这些作了简要介绍,并在表2中用不确定性的方差列出,细节和推导见附录A。

3 泊松似然综合预报评估

假设δk是时间-空间-震级箱k中发生的地震次数。地震可预测性研究合作实验室检验中心认为,对于地震而言,这样的结果是由独立的泊松分布给出的,发生率为λk时第k个箱的预期地震数量pk=λkΔ。如果pk<1,则pk可以被认为是地震发生的概率。假设于某时间段观察到了地震总数为N,其在时间 -空 间-震 级坐标为 (tn,xn,yn,Mn),n=1,2,…,N,此时,给出了对数似然:

式中p(t,x,y,M)表示地震(t,x,y,M)的时间-空间-震级坐标落在箱k内的概率。得分lnL(p)的不确定性可以近似为:

化学气相沉积法具有工艺流程短、产品纯度高、经济性好等优点,因此是MoS2纳米微球的制备的较为常用的一种方法。曾一等[5]以硫粉与三氧化钼粉为原料,以高纯氩气为载气,用化学气相沉积法在900 ℃下保温8 h,制备出平均粒径在250 nm左右的高纯富勒烯结构MoS2纳米粒子。Hua[6]等通过快速化学气相沉淀法制备出了MoS2纳米微球,并将其添加在聚甲醛基复合层中,制备出了减磨性能优异的耐磨复合材料。虽然化学气相沉积法具有一系列优点,但该方法在制备过程中容易产生硫化氢,因此需要对尾气进行处理以防止对环境的污染,且在制备过程中当气相流量或者压力改变时,产品的形貌难以保证。

这里忽略了在同一箱中发生多个地震的极小概率。

4 分项分数及其误差估计

地震总数在整个体积中为n的概率可以表示为πn=Λne-Λ/n!,其中Λ=(pk)代表地震总数的期望值。因此,其方差为Λ,标准误差为。

以下讨论的分数集中在地震的预测位置、发生时间和震级的评估,忽略地震预报数量。假设我们已经于某期间在(tn,xn,yn,Mn),n=1,2,…,N,观察到了总数N个地震。那么,在每个箱k=(l,i,j,m)中的地震预测数量pk通过~pk=p(l,i,j,m)/Λ×N 补偿,并使所有箱测量数~pk的总和为N。设箱中地震坐标(t,x,y,M)处的补偿概率为(t,x,y,M),此时可得到对数似然得分和误差估计,如表2所示。同样,对时间-空间、空间及时间的边际箱中定义了补偿概率。从而在表2中给出了它们的对数似然得分和误差估计。更多细节,参见附录A。

由于舍入值,在大多数震源目录中地震的震级是用震级的离散单元定义的。虽然它们可以用一般概率分布来表示,但如果假设震级分布遵从古登堡-里克特(G-R)定律,则系数b值可能取决于位置(如,Ogata and Katsura,1993)或地震历史(Ogata,1989)。

5 预报模型

在这里,除了将UNIFORM作为参考模型之外,我们考虑了6个已提交的预报模型。这6个模型是时间-空间ETAS(传染型余震序列)模型的变体(Ogata,1998),且由时间独立背景和触发元件组成,通过条件函数具体化为:

指数L(p/ν)是众所周知的与对数似然相关的相对熵。因此,我们把L(p/ν)当作模型p在给定数据集ν时的似然。似然得分L(p/ν)衡量通过数据ν实现预报p的概率。也就是说,如果一个预报的似然得分是另一个预报的两倍,就意味着这个预报正确猜中地震发生可能是另一个预报的两倍。如果我们有 一 些 竞 争 模 型 p(1),p(2),…,p(M),那么为了诠释概率,它们的似然归一化为

在这样一种严峻的地理环境下,长期以来,民勤县委、县政府致力于治沙防沙,建设绿色生态文明。这次“2018首届中国·民勤沙漠雕塑国际创作营”的呈现,便是民勤文化建设又一新的有力举措。

所有模型都使用古登堡-里克特定律(Gutenberg and Richter,1944)来预测震级。HIST-ETAS模型采用条件概率π(M/x,y)=β(x,y)e-β(x,y)~M, M~=M-Mcutoff且β(x,y)=b(x,y)ln10。但 E TES,ERS,ETASZH1和ETASZH2模型采用位置独立b值。也就是说,它们在整个日本地区采用了相同的最大似然估计值。

除了上述模型,稳态的空间-时间泊松模型(UNIFORM)被作为参考预报。至于震级-频度的分布,采用了古登堡-里克特分布和最大似然估计的位置-独立b值。

6 结果及其解释和建议

在这里,我们评估和研究了前瞻性预报和2011年3月期间两种类型的回顾性预报。在M9地震前观察到了明显活跃的前震。2011年3月9日的MW7.3地震是最大的。3次M≥7的余震发生在M9主震的同一天。余震的空间分布分散在一个前所未有的广阔区域,长约500km,宽200km。日本东北地区和中部以及这些区域周边许多强烈的地震也被触发。

6.1 前瞻性预报的评估

我们也计算出了每一天的对数似然如下:

陶瓷是一种古老的塑造艺术形式,从我国仰韶文化时期陶器大量制造和使用开始,陶瓷就进入了人们的生活,并且随着社会生活的变化和人类历史的发展,不断进化和创新,从生活器皿逐渐转变为极具应用价值的生活艺术制品,深受人们的喜爱。如何展示陶瓷装饰艺术的美感,提升人们的审美感受性以及使用便利性,值得我们进行思考和探索。

表3 模型差异汇总

图1a显示了完整的对数似然得分,是单日预报在当月数量-空间-时间-震级的综合性能。考虑到评分误差,HIST-ETAS7pa模型的单日预报性能似乎比别的模型要差一些。

在这些前瞻性预报中,HISTETAS5pa和HISTETAS7pa的学习时间是从1997年10月到2009年10月,而ETASZH1,ETASZH2,ERS和ETES模型的学习时间明显较长——从1965年到2009年10月。然后,2009年11月后就不允许对参数进行更新。图1a-g显示了2011年3月6个预报相对于UNIFORM预报的评估得分。

各预报的分项性能如下。除了ETES模型,所有的模型都大大低估了该期间发生的地震总数(433次,参见图1b)。相反,ETES模型对空间-时间-震级分布(参见图1c)和空间-时间分布(参见图1d)的预测最差。图1e显示,与其他模型相比,HISTETAS7pa和HIST-ETAS5pa模型在当月提供了一个在边缘空间分布有显著优势的预报。相比之下,Nanjo等(2012)得到的单日S检验结果,相当于表2中每日空间得分,提供了一个完全相反的评估。不一致的评估归因于地震可预测性研究合作实验室单日预报方案,下面对这些问题进行讨论。图1f表明HIST-ETAS7pa和 HIST-ETAS5pa模型提供的在全日本地区的边际时间分布预报优于其他模型所提供的。有趣的是,在这里我们注意到图1f表明在边际分布中4个模型在时间上的预报比均匀模型更差。这主要是由于它们对M9主震和M7前震当天极低发生率的预报。正是由于地震可预测性研究合作实验室单日预报方案,从而不可避免地忽视了同一天被即刻触发的余震,进而影响那些发生在M9地震、大余震和前震日期内的地震。最后,图1g表明由于都采用古登堡-里克特定律,所有模型的震级分布预测是类似的。

图2a,b显示了2011年3月每天的单日预报性能。图2a显示了每天的预报数量。图2b显示了相对于每天UNIFORM预报的每个地震的平均对数似然比。图2a表明除ETES以外其他模型的预报都大大低估了发生在前震期间、主震和余震活动早期的部分地震的数量。图2a还表明,ETES对地震数量的预报在当月的后半个月期间被高估了,余震数量的低估原因将在下一节作检查。

由图6、7可见,右幅裂缝中有水泥浆充填,左幅存在较为明显的剪切裂缝特征,裂面平直光滑,无任何充填,且两侧发育剪切节理。

图2a中所观察到的地震的时间序列似乎是成比例地相似于 HIST-ETAS7pa和HIST-ETAS5pa模型的预报,这意味着存在类似的余震衰减p值;这就是为什么它们的预报在时间分布上表现得最好,如图1f所示。从图2b可以看出,ETASZH1和ETASZH2模型在M9事件前后几天的每日预报似乎略优于其他模型。

从上述评估可以看出,我们无法确定到底是哪个模型提供了比其他模型完全优越的预报,我们猜想这可能是有一些原因的。因此,我们也做了以下的诊断分析和回顾性预报试验。

6.2 前瞻性预报的诊断分析

上一节中数量预报的不一致导致了M9地震的余震发生参数是否显著不同于学习时间地震活动的余震发生参数的问题。在上一小节,我们指出HIST-ETAS和其他模型有不同的学习时间。为了澄清这个问题,我们使用时间ETAS模型来拟合建模人员使用的1997年10月至2009年10月M≥5的数据。得出M9地震的余震预测数量小于实际案例的一半,如图3b所示。然而,如果用同样的ETAS模型拟合日本气象厅(JMA)一段较长时间段内的数据(参见图3a,b),预报更加接近实际的余震累计数。估计参数之间的主要区别是表示余震发生的参数K0值。这表明参数值,包括较大的K0值,可以充分预报余震活动的时间。比较1997年10月到2009年10月累积曲线的斜率,表明地震平静期大致发生在M9地震前的10年期间。更详细的结果参见Ogata和Kumazawa(2011),这引出了下一小节的回顾性实验。

那么,什么样的性状能使小麦变得更好呢?炎热气候条件下的生长能力是一种优势,还要有较强的抗病性。但是种植者还关心其他方面。安德森说:“在选择品种时,他们首先考虑的是产量,其次是耐倒伏性,再次是蛋白质含量。”育种者必须谨慎地把握这些特征,并和其他特征进行平衡,比方营养。

让我们忽略数量规模的预报,考虑空间和时间分布的问题。图4b,c显示了在整个2011年3月各向同性和各向异性两类空间预报的叠加强度。图4d,e显示了余震相对转换时间的投影位置(参见图4a的坐标轴)。3月11日发生的余震主要在主震西侧朝海岸的区域,但在那之后,它们向东延伸超出太平洋板块的海沟。虽然HIST-ETAS模型很好地预测了第一天发生的余震的空间范围,但它们没能预测出第二天起向东偏离断层的余震。相反,其他ETAS模型对主震周围空间各向同性方向进行了预报,包括从下一天开始的余震延伸区。这个观察引出了在下一节为实时预报方案和相关的评估分数所提出的建议。

图1 2011年3月前瞻性单日预报评估的完整及边缘似然得分。得分误差棒表示了一倍和两倍标准差。(a)综合评估;(b)地震总预报数,M≥5共计433次;(c)空间-时间-震级的预报评估;(d)空间-时间预报评估;(e)空间预报评估;(f)时间预报评估以及(g)震级预报评估。对7个预报模型(UNIFORM,HIST-ETAS7pa,HIST-ETAS5pa,ETASZH1,ETASZH2,ERS和ETES)的解释见正文。表2列出了得分。此图的彩色版仅适应于电子版本

6.3 回顾性预报及其评估

需要注意的是上述前瞻性预报(以下简称0型预报)是基于日本气象厅从1997年11月到2009年11月的M≥4的数据而估计得出的模型进行预报。此后,我们检查了学习时间这个问题。不同的数据集,如在图3a中使用的,被应用到了HIST-ETAS7pa和HISTETAS5pa模型。现在,我们的第一个回顾性预报(简称1型预报)是通过将模型应用到日本气象厅目录中1926年1月至2009年11月这个较长时间段内M≥5的地震数据中而实现的。我们把它们相应的预报分别称为HE7-1型和HE5-1型。对这个较长学习时间的评估得分是否不同于以往的前瞻性预报的评估得分进行了检查。

图2 2011年3月前瞻性单日预报的评估及其标准误差。从左至右预测第二天的依次是:HIST-ETAS7pa(空心正 方 形)、HIST-ETAS5pa(实 心 正 方 形)、ETASZH1(空心圆)、ETASZH2(实心正方形)、ERS(空心三角形)以及ETES(实心三角形)。(a)地震的预测数量和所观察到的数目(直方图)均为对数尺度;(b)相对于稳态空间-时间泊松模型(UNIFORM)预报天的预报平均对数似然比。此图的彩色版仅适应于电子版本

图3 图(a)表示1型的数据,即日本气象厅(JMA)1926年以来M≥5的数据以及UtsuM≥6前兆期的数据。图(b)表示0型的数据,即日本气象厅统一的1997年10月以来M≥5的数据,对应于图(a)中的长方形。每个图中的上曲线是地震的经验累积函数。每个图中的细曲线是时间ETAS模型拟合1型数据集的理论累积函数。图(b)中的粗曲线是ETAS通过拟合0型数据得到的理论累积函数。此图的彩色版仅适应于电子版本

此外,还使用M≥5地震数据集检查了HIST-ETAS两个模型,从1926年1月到2011年9月这个延长了的时间段,包括2011年3月这个焦点段。然后我们尝试进行回顾性预报(称为2型预报)来检查该回顾性预报是否会在M9事件前后地震活动图像不同的情况下表现是最佳的。我们把HIST-ETAS7pa和 HIST-ETAS5pa模型的预报分别称为HE7-2型和 HE5-2型。下面比较了相同模型采用不同数据集的预报性能。表4汇总给出了前面提及的各时间段的数据集。

图5a-g表示了整个2011年3月预报的评估。图5a显示了关于整月在数量-空间-时间-震级的预报的综合评估完整的对数似然得分。图中可见,HISTETAS7pa和HIST-ETAS5pa模型的分数按照0型、1型及2型预报的顺序都有所增加。

图5b显示了整月的地震数量预报。该图表明0型、1型和2型预报以这个顺序改进,虽然与前面提到的所有事件相比,它们还是被大大低估了。相反,根据图5f,2型预报在时间分布有最差的预报,比均匀时间分布模型更差。再次,我们注意到,正是因为基于地震可预测性研究合作实验室方案的单日概率预报,必定忽视了大地震后即刻被引发的、特别是发生在M9地震以及大余震和大前震前后几天的余震。事实上,图6a表明2型预报似乎高估了余震活动后半期的发生率,以补偿余震活动前期的低发生率。我们已经在前瞻性和回顾性预报中观察到,当将单日预报应用到高度活跃的地震活动时,数量和时间预报的性能是彼此相反的。

考虑到所有类型的预报性能的不确定性,它们的空间-时间-震级(图5c)、空间-时间(图5d)和空间(图5e)有类似的得分值。图5f显示了HIST-ETAS7pa模型的1型对时间分布的预报优于其他模型的时间分布。在这里,我们注意到,均匀分布时间模型(UNIFORM预报)优于2型预报。这也是由于单日预报方案在很大地震发生的日子里是无所作为的。

图4 余震区内及周边的空间和时间分布。图(a)显示了直到2012年4月M≥5地震的震中。图(b)和(c)分别表示日本东北近海MW9.0地震(即2011年3月12日)的第二天预报的HIST-ETAS7pa和ETES模型的空间概率地图。图(d)和(e)显示了与ETAS模型得到的转换时间相对的余震投影位置。投影轴在图(a)中显示。此图的彩色版仅适应于电子版本

最后,图5g表明2型预报的震级分布略优于其他类型。顺便说一句,2011年3月发生于沿太平洋海岸的日本东北近海MW9.0地震前后余震范围的b值分别为0.87±0.02和0.78±0.03,图中有标准误差棒。这表明,b值的时间变化是极其重要的。因此,我们在图5g中为UNIFORM的3型预报采用改善后的b值来检查它们是否得到了改进。实际上,这个预报优于UNIFORM的0型预报(见图5g),但比基于位置相关的b值的 HIST-ETAS的2型预报差。

图5 用于评估2011年3月期间回顾性预报的HIST-ETAS7pa和HIST-ETAS5pa的完整及边缘对数似然得分。这些模型是从0型、1型和2型的数据集估计得来的,其中0型是与图1中相同的数据集。这些数据集在表4中列出并在正文中作了描述。图(a)—(f)是与图1中描述的相同的分数。此图的彩色版仅适应于电子版本

图6 a,b显示了2011年3月每一天预报的得分。我们看到了每个单日预报性能的更多细节。图6a表明1型模型预报的地震数量仍被显著低估了。相反,当月实际地震数在2型预报数的(2倍标准误差棒)95%以内,虽然该2型的地震发生率在余震活动的后半期似乎已经被系统地高估了。根据图6b中相对于UNIFORM每日预报的每一地震的平均对数似然比,1型每日空间-震级预报系统地优于0型预报。2型预报比1型好得多,因为2型模型的学习时间包括了预报期。

图6a,b中1型预报相对于0型预报表现出的较好性能,阐释了图2a,b中的HIST-ETAS模型的每日预报显示出比其他模型性能差的原因。

建模人员还可以通过在空间-时间-震级域(S,T)×A× 的子集Θ中的边缘积分(式5)为分项得分计算提供单独的子程序:

6.4 实时预报

在这一点上,根据地震可预测性研究合作实验室实验方案,本项研究设计在独立的预报和观察空间-时间-震级箱中切入一个连续时间-空间-相关的点过程。同时,每日预报利用了直至其前几天的地震数据。然而,这样的预报方案将偏差引入了个别的地震可预测性研究合作实验室检验(Werner and Sornette,2008;Lombardi and Marzocchi,2010;Werner et al,2010)。同样,我们在建议得分中观察到了一些不一致的地方。特别是地震可预测性研究合作实验室的单日预报不可避免地漏掉了在大地震发生时所引起的触发地震发生率。

表4 数据使用的时间区间总览

因此,我们需要点过程预报(例如,Vere-Jones,1995)及其评估。我们建议建模人员提供在时间-空间-震级域(S,T)×A× 的点过程的条件强度率λ(t,x,y,M|Ht)的计算子程序,其中Ht是直至时间t的发生历史。事实上,目前所有的建模人员已经使用了条件强度函数来计算规定箱的概率。此外,给定一个在空间-时间-震级域(S,T)×A× 内已知地震发生记录数据集(tn,xn,yn,Mn),n=1,2,…,N,作为综合得分全对数似然可以表示为:

这个计算子程序也可由建模人员提供,因为他们已经在参数优化算法中使用了它,可作为一个综合评分。表5列出了方程(3)中的原始点过程模型的综合得分。

(1)施工单位仍然将成本作为工程建设中管理的重点,这主要因为其与施工单位能够获取的经济利益有着直接联系。在给水管道和排水管道建设路径的选择期间,部分施工单位会将成本放在首要位置,这看上去会提高工程的经济效益,但是,会造成线路的选择上与工程基础建设存在不符情况,一方面会对给排水工程质量造成影响,另一方面,也不利于维护工作的开展[2]。

表5列出了在附录B中导出的分项得分。例如,每日的数量得分是由子集乘以Θ=(l-1,l)×A× ;l=1,2,…,31得到的。图7a显示了每一天预报地震的数量。相对于图2a和6a中相应的预报,概率预报有所提高,尤其是在M9地震、大余震和前震发生的日子。特别提到,2型回顾性预报与每日地震的累计数完全符合。

统一身份认证中的关键技术,即为单点登录技术SSO(Single Sign On)。利用单点登录技术进行统一身份认证,实现一次登录,整网漫游,是目前比较常用的企业业务整合、一键登录的方法之一[5]。用户登录企业门户时注册一次,即可完成全网身份认证识别,获得其他信息系统或应用平台的授权,从而在多个应用系统间自由穿梭[6]。

地震可预测性研究合作实验室方案需要所有规定的时间、空间和震级离散箱中(三维空间范围内)地震的预报概率。因此,建模人员使用他们提出的预报模型计算了每个箱中地震的概率。当地震发生时,地震可预测性研究合作实验室检验中心在相应的箱对数据加1来评估预测性能。因为地震可预测性研究合作实验室评估方案假定了不同的空间-时间-震级箱之间的独立性,我们还假设了在计算目前的预报模型的对数似然误差估计时该箱也是独立的。表1列出了推导所提出的分数的参数。设在各箱 {k=1,2,…,K}中预测概率分别为 {p1,p2,…,pK},其中∑kpk=1。然后,设各自的结果为 {δ1,δ2,…,δK},其中δk=0,1,2,…,表示每个箱k中发生的地震的数量。

然而,M9地震余震1型的预报强度仍然非常低。我们首先回顾了图3中的结果,显示了时间ETAS模型很好地预报了3月的余震活动。然后,通过比较从1型和2型数据集估计得出的公式(3)中的空间-时间模型g(t;x,y;M)的参数值,过多的余震可以归因于不同的d值(空间尺度参数;见Ogata,1998)。

按日本地震可预测性研究合作实验室单日预报实验方案(Nanjo et al,2011)的所有预报都被应用于日本试验区。也就是说,模型用于预报每个空间-时间-震级箱中地震的概率。在这里,对于任何一个箱,空间区域用0.1°的间隔离散,单日时间窗从午夜开始,5≤M≤9.9范围内的震级被离散为0.1单位级。单日预报时间窗开始于2009年11月1日的午夜。

图7b的得分显示了每个事件的每日平均对数似然比,也即相对于UNIFORM的每日对数似然得分除以2011年3月每天的地震数量。根据图7b,2型每日空间-震级预报系统地优于1型预报。这里2型预报甚至比图6b和图2b中所有前瞻性预报都好。

图6 2011年3月的回顾性单日预报评估及其标准误差。从左至右预报下一天,被评估模型分别为 HE7-Type0(空心正方形)、HE5-Type0(实心正方形)、HE7-Type1(空心圆)、HE5-Type1(实心圆)、HE7-Type2(空心三角)以及 HE5-Type2(实心三角)。这些预报模型在正文中描述。图(a)和(b)分别代表与图2a和图2b中所描述的相同的得分。此图的彩色版仅适应于电子版本

表5 条件强度和误差方差得分的汇总

图7 2011年3月的回顾性实时预报评估及其标准误差。从左至右,被评估模型为HE7-Type1(空心圆)、HE5-Type1(实心圆)、HE7-Type2(空心三角)以及 HE5-Type2(实心三角);(a)和(b)分别与图2a和图2b中所描述的得分相同。这些预报模型在正文中描述。此图的彩色版仅适应于电子版本

7 结论

似然得分代表随机地震发生的预测能力。它的变异是通过假设按地震可预测性研究合作实验室方案在各箱中的事件数是互相独立的情况下估计得到的。此外,代替在地震可预测性研究合作实验室检验中心中使用的各种分项测试,我们比较了边际似然得分来评估分项预测能力,如空间、时间和震级,它们的变异是用一个类似的方式计算的。这些得分对于通过明确其强和弱的部分从而改善预报模型和方案是有用的。

本文评估了2011年3月异常活跃期的前瞻性单日预报,包括M9事件、其前震和余震。我们的综合和分项的评估表明,所提交的预报没有一个提供对于其他预报完全优越的性能。一些模型的分项得分甚至比空间-时间均匀模型预报更糟。前瞻性预报性能的不理想的原因随后受到了后续的回顾性预报检查的约束。

首先,前瞻性预报的模型,特别是HIST-ETAS模型,是通过一段时期的数据估算得到,其中包括相当一部分异常低的地震活动时期,即M9事件发生前的10年期间的平静期。这个问题是通过应用较长的学习时间数据(1型数据)来解决的。

其次,单日预报的地震可预测性研究合作实验室方案不可避免地漏掉了第二天被即刻触发的地震发生率;因此,它们为当天提供了显著较低的预报率。事实上,一些预报甚至比时间均匀一致预报更糟。该技术的难点建议我们应采用在连续的时间域内的实时强度预报以及点过程似然性的评估,可以提高包括即刻触发地震的得分。

最后,即使使用较长数据(1类数据)的HIST-ETAS模型,M9地震的余震预报数量仍然很低。这可能是由于空间-时间ETAS模型中日本东北近海MW9.0地震空间尺度参数d的变化导致的。

在空间和时间的分项预报满足的情况下,数量的预报可以在一次大地震后被立即修正。需要这样的更新来实现更好的可操作的预报(也见Vere-Jones,1998)。例如,通过利用主震后即时的短期数据,我们可以改变相对于公式(3)中空间-时间ETAS模型的g(t;x,y;M)中的震级M 的余震发生率(即K0参数;见Ogata,1998)。这在实时余震概率预报中是非常重要的(例如,Ogata and Katsura,2006)。

数据与来源

本文使用了1926年1月1日至2012年3月31日整个日本地区(20°~50°N 和120°~150°E)日本气象厅(JMA)的数据。也使用了 Utsu(1982)编辑的从1885年到1925年的地震目录。

Akaike,H.(1973).Information theory and an extension of the maximum likelihood principle,in Proc.2nd International Symposium on Information Theory,B.N.Petrov and F.Csaki(Editors),Akademiai Kiado,Budapest,267-281.

Akaike,H.(1974).A new look at the statistical model identification,IEEE Trans.Automat.Contr.19,716-723.

Akaike,H.(1985).Prediction and entropy,in A Celebration of Statistics,The ISI Centenary Volume,A.C.Atkinson and S.E.Fienberg(Editors),Springer-Varlag,New York,1-24.

Boltzmann,L.(1877).Uber die Beziehung zwischen dem zweiten Hauptsatz der mechanischen Warmetheorie und der Wahrscheinlichkeitrechung respective den Satzen uber das Warmegleichgewicht,Wiener Berichte 76,373-435.

Boltzmann,L.(1878).Weitere Bemerkungen ube reinige Plobleme der mechanischen Warmetheorie,Wiener Berichte 78,7-46.

Dieterich,J.(1994).A constitutive law for rate of earthquake production and its application to earthquake clustering,J.Geophys.Res.99,2601-2618.

Falcone,G.,R.Console,and M.Murru(2010).Short-term and long-term earthquake occurrence models for Italy:ETES,ERS,and LTST,Ann.Geophys.53,no.3,41-50,doi:10.4401/ag-4760.

Field,E.H.(2007).Overview on the working group for the development of Regional Earthquake Likelihood Models(RELM),Seismol.Res.Lett.78,7-16.

Gutenberg,B.,and C.F.Richter(1944).Frequency of earthquakes in California,Bull.Seism.Soc.Am.34,185-188.

Harte,D.,and D.Vere-Jones(2005).The entropy score and its uses in earthquake forecasting,Pure Appl.Geophys.162,1229-1253.

Imoto,M.,and D.A.Rhoades(2010).Seismicity models of moderate earthquakes in Kanto,Japan utilizing multiple predictive parameters,Pure Appl.Geophys.167,831-843,doi:10.1007/s00024-010-0066-4.

Imoto,M.,D.A.Rhoades,H.Fujiwara,and N.Yamamoto(2011).Conventional N-,L-,and R-tests of earthquake forecasting models without simulated catalogs,Earth Planets Space 63,no.3,275-287.

Jordan,T.H.(2006).Earthquake predictability,brick by brick,Seismol.Res.Lett.77,no.1,3-6,doi:10.1785/gssrl.77.1.3.

Kagan,Y.Y.,and D.D.Jackson (1995).New seismic gap hypothesis—5years after,J.Geophys.Res.100,3943-3959.

Lombardi,A.M.,and W.Marzocchi(2010).The assumption of Poisson seismic-rate variability in CSEP/RELM experiments,Bull.Seismol.Soc.Am.100, 2293 - 2300, doi: 10.1785/0120100012.

Nanjo,K.Z.,H.Tsuruoka,N.Hirata,and T.H.Jordan(2011).Overview of the first earthquake forecast testing experiment in Japan,Earth Planets Space 63,no.3,159-169,doi:10.5047/eps.2010.10.003.

Nanjo,K.,H.Tsuruoka,S.Yokoi,Y.Ogata,G.Falcone,N.Hirata,Y.Ishigaki,T.H.Jordan,K.Kasahara,K.Obara,D.Schorlemmer,K.Shiomi,and J.Zhuang(2012).Predictability study on the aftershock sequence following the 2011 Off the Pacific Coast of Tohoku,Japan,earthquake:First results,Geophys.J.Int.191,653-658,doi:10.1111/j.1365 - 2 46X.2012.05626.x.

Ogata,Y.(1978).The asymptotic behavior of maximum likelihood estimators for stationary point processes,Ann.Inst.Stat.Math.30,243-261.

Ogata,Y.(1988).Statistical models for earthquake occurrences and residual analysis for point processes,J.Am.Stat.Assoc.83,9-27.

Ogata,Y.(1989).Statistical model for standard seismicity and detection of anomalies by residual analysis,Tectonophysics 169,159-174.

Ogata,Y.(1995).Evaluation of probability forecasts of events,invited discussion as a commentary on“Forecasting Earthquakes and Earthquake Risk”by Prof.D.Vere-Jones,Int.J.Forecasting 11,539-541.

Ogata,Y.(1998).Space-time point-process models for earthquake occurrences,Ann.Inst.Stat.Math.50,379-402.

Ogata,Y.(2011).Significant improvements of the space-time ETAS model for forecasting of accurate baseline seismicity,Earth Planets Space 63,no.3,217-229,doi:10.5047/eps.2010.09.001.

Ogata,Y.,and K.Katsura(1993).Analysis of temporal and spatial heterogeneity of magnitude frequency distribution inferred from earthquake catalogs,Geophys.J.Int.113,727-738.

Ogata,Y.,and K.Katsura(2006).Immediate and updated forecasting of aftershock hazard,Geophys.Res.Lett.33, L10305,doi:10.1029/2006GL025888.

Ogata,Y.,and T.Kumazawa(2011).Tohoku earthquake:Aftershock activity and triggered activi-ties in the eastern Honshu area,Rep.Coord.Comm.Earthq.Predict.86,126-133.

Ogata,Y.,T.Utsu,and K.Katsura(1996).Statistical discrimination of foreshocks from other earthquake clusters,Geophys.J.Int.127,17-30.

Rhoades,D.A.,D.Schorlemmer,M.C.Gestenberger,A.Christophersen,J.D.Zechar,and M.Imoto(2011).Efficient testing of earthquake forecasting models,Acta Geophys.59,728-747,doi:10.2478/s11600-011-0013-5.

Schorlemmer,D.,M.C.Gerstenberger,S.Wiemer,D.D.Jackson,and D.A.Rhoades(2007).Earthquake likelihood model testing,Seismol.Res.Lett.78,17-29,doi:10.1785/gssrl.78.1.17.

Utsu,T.(1982).Catalog of large earthquakes in the region of Japan from 1885through 1980,Bull.Earthq.Res.Inst.57,401-463.

Vere-Jones,D.(1995).Forecasting earthquakes and earthquake risk,Int.J.Forecasting 11,503-538.

Vere-Jones,D.(1998).Probabilities and information gain for earthquake forecasting,Comput.Seismol.30,248-263.

Werner,M.J.,and D.Sornette (2008).Magnitude uncertainties impact seismic rate estimates,forecasts and predictability experiments,J.Geophys.Res.,doi:10.1029/2007JB005427.

Werner,M.J.,J.D.Zechar,W.Marzocchi,S.Wiemer,and CSEP-Italy Working Group(2010).Retrospective evaluation of the five-year and ten-year CSEP-Italy earthquake forecasts,Ann.Geophys.53,no.3,11-30.

Zechar,J.D.,M.C.Gerstenberger,and D.A.Rhoades(2010).Likelihood-based tests for evaluating space-rate-magnitude earthquake forecasts,Bull.Seismol.Soc.Am.100,no.3,1184-1195,doi:10.1785/0120090192.

Zhuang,J.(2011).Next-day earthquake forecasts for the Japan region generated by the ETAS model,Earth Planets Space 63,no.3,207-216,doi:10.5047/eps.2010.12.010.

猜你喜欢
余震震级对数
多种震级及其巧妙之处*
“超长待机”的余震
基于累积绝对位移值的震级估算方法
含有对数非线性项Kirchhoff方程多解的存在性
指数与对数
地震后各国发布的震级可能不一样?
指数与对数
新震级国家标准在大同台的应用与评估
生死之间的灵魂救赎——《余震》和《云中记》的伦理问题
对数简史