李拴虎 高立新 丁风和 陈立峰 杨红樱
(中国呼和浩特010010内蒙古自治区地震局)
用于地震参数估算的两种贝叶斯概率算法分析*
李拴虎*高立新 丁风和 陈立峰 杨红樱
(中国呼和浩特010010内蒙古自治区地震局)
概率估算 贝叶斯概率 先验概率 似然概率
贝叶斯概率算法(Beyesian probability algorithm)是一种通用的框架, 整合了先验概率和似然概率各自的优点, 并能根据数据的具体情况作出相应调整, 确保计算结果的合理性. 该算法除了用于河流溶解氧含量的估算(Patil, Deng, 2011)、 桩基础的可靠性评估(Zhangetal, 2006)、 合成孔径雷达图像的重建(Vuetal, 2013)和海上钻井风险性的量化评价(Khakzadetal, 2013)以外, 也被应用于诸如地震边坡失稳的评估(Songetal, 2012)、 地震对结构脆弱性的影响分析(Koutsourelakis, 2010)以及活断层的参数估算(Amighpeyetal, 2014)等方面的地震研究.
相对于贝叶斯概率算法, 先验概率和似然概率方法具有一定的局限性. 基于“理论”的先验概率(prior probability)是在缺乏统计数据的情况下描述一个事件, 具有较强的假设性. 先验概率可以分为两类: 利用历史资料计算得到的先验概率, 称为客观先验概率; 当历史资料无从获取或资料不完全时, 仅凭主观经验判断而得到的先验概率, 称为主观先验概率. 基于“真实”数据的似然概率(likelihood probability)是对事件的真实统计, 要求大量的实测数据支撑. 贝叶斯概率算法是一种简单有效的算法, 通常被用来描述一个随机变量, 特别是在样本有限的情况下. 不同于仅取决于样本数量的经典统计方法, 贝叶斯概率算法是结合先验信息(经验, 判断等)和样品数量得到估算结果, 其评价结果值同样也不是一个事件“真实”的计算结果, 而是一个概率值. 本文重点研究用于地震参数估算的两种贝叶斯概率算法, 即震源到站点的距离概率和区域发震概率, 并通过两个实例验证其合理性.
在概率地震危险性分析(probabilistic seismic hazard analysis, 简写为PSHA)中用到的震源到站点的距离函数, 通常使用假定地震在研究区域内“均匀分布”的模式(Kramer, 1996), 在目前的震源距离函数计算中广为使用(Chengetal, 2007; Wangetal, 2013). 虽然“非均匀分布”模式如平滑算法, 也经常被推荐使用(Frankel, 1995), 但同质化假设仍然是震源模型的现行标准之一, 而且并不是每个模型的开发均能满足平滑算法的要求. 一般情况下, 地震并不会均匀地分布在研究区域, 均匀假设显然不符合实际情况. 图1a为内蒙古河套断陷带区域的震源和地震台站的分布示意图, 图1b为该研究区的“理论”震源分布, 可以看出其具有离散性和网格化的特征.
图1 研究区的实际震源(a)与理论震源(b)的分布特征
“均匀分布”的理论算法和“非均匀分布”的平滑算法在实际应用中均有涉及, 其优缺点均比较明显, 理论距离算法的均匀分布假设并未得到有效的验证, 平滑距离算法的缺点是没有足够的实际观测数据支撑. 在这种情况下, 引入贝叶斯概率算法, 不仅能表示震源到站点的距离, 也能表示各种源到点的距离, 最常用于破裂距离等参数的计算(Chengetal, 2007; Kaklamanosetal, 2011). 参考Ang和Tang(2007)提出的理论公式, 根据P(A|B)·P(B)=P(B|A)P(A)建立在条件假设概率基础上的基本准则, 推导出贝叶斯概率f(Di|O)为
(1)
式中,f(Di)为理论距离概率函数的先验信息,f(O|Di)为基于实际观测值O和距离Di基础上的似然概率,f(Di|O)为后验概率. 已知f(O)=∑f(O|Di)f(Di)(Ang, Tang, 2007), 式(1)可以改写为
(2)
图2 先验概率、 似然概率和贝叶斯概率的计算值比较Fig.2 Comparison of the calculated values of the prior probability (squares), likelihood probability (circles) and Beyesian probability (triangles)
图2给出了内蒙古河套断陷带区域地震数据的先验概率、 似然概率和贝叶斯后验距离概率的计算值. 由于同质假设或理论分布并不能真实地反映实际情况, 因此使用似然概率和先验概率两种方法得到的计算结果具有不同程度的差异. 需要注意的是, 贝叶斯后验概率值不一定处于先验概率值与似然概率值之间; 在40 km和180 km处, 利用贝叶斯概率算法得到的概率值更大, 但其总体趋势与似然概率接近, 可靠性优于先验概率的计算结果.
ML≥6.0大地震的发生概率是评价区域地震危险性的重要参数, 而该参数的计算需要具有百年时间尺度的数据, 但是在当前条件下, 仪器记录的可靠地震数据只有几十年, 这使得没有足够的数据来计算大地震发生的真实概率. 例如, 在常规统计和有限数量观测值的情况下, 假设过去50年内没有记录到大地震的相关数据, 则发震概率估算值为0, 这显然会直接导致计算结果产生较大误差, 甚至出现错误的结果. 因此, 在观测数据有限的条件下引入计算地震发生概率的贝叶斯算法, 可以减小由于时间尺度过短和数据量不足等方面带来的误差. 这是一个计算区域地震发生概率平滑函数的方法, 其关键是利用邻区的地震信息作为先验信息, 重新分配目标区域的观测数据. 图3a给出了内蒙古—宁夏—甘肃交界带地震数据的分区统计, 9个区块分别表示1900年以来各区块内所发生的ML≥6.0地震事件个数, 其中5个区块(E2,E3,E4,E6,E8)的数值为0, 表示研究时段内该区块未记录到地震事件; 但是, 地震发生概率计算应当是一个长周期的统计结果, 显然0事件的记录不符合实际情况.
图3 各区块内ML≥6.0地震事件的分布(a)和贝叶斯算法平滑之后得到的发震概率(b)
针对似然概率和先验概率的不足, 贝叶斯概率算法可以解决该问题. 对于不连续及非规律性事件, 贝叶斯概率算法的公式为
(3)
式中:A为概率质量函数的计算参数,A=0或A=1;n为A的数量, 本例中n=2;B为观测值, 本例中B=0或B=1;P′(Ai)和P″(Ai)分别为先验和后验概率(平滑率). 若不把周围区块的事件作为先验信息, 单独考虑E3一个区块, 则基于E3和相邻3个区块(E2,E5和E6)的信息, 当A=1时,E3内的发震概率只有0.25, 因为E3及相邻3个区块中仅在E2一个区块内记录到1900年以来的一次地震; 当A=0时,E3块体内的发震概率为0.75, 因为在E3周边有两个区块未记录到地震. 假设地震的复发性符合泊松分布, 则E3区块内的似然概率计算如下:
(4)
(5)
式(4)和(5)是泊松概率计算, 其概率质量模型可表示为
(6)
式中,y为泊松随机变量X的平均值. 将似然概率和先验概率代入式(3)计算后验概率, 当A=1时, 根据
(7)
即可计算出E3区块的发震概率为0.11, 相比简单的似然概率计算值0.37, 该值相对符合实际情况.
发震概率计算中的贝叶斯方法是一种典型的后验算法, 由似然概率衍生而来, 通过对每个区块的类似计算即可得到如图3b所示的平滑结果. 由此可见, 这种贝叶斯算法提供了一个区块发震概率的平滑计算方法, 在数据有限的情况下, 可以得到更加有意义的估算值, 而不是简单的0或1概率事件.
综上所述, 在数据量严重不足的情况下, 根据实测数据计算的似然概率方法是最不准确的, 而先验概率方法更具有适用性; 但是偏“理论”性的先验算法也不具有普遍适用性, 该算法基于各种稳态分布的概率模型, 在非规律性(连续性)事件概率计算中有时与实际情况偏离较大. 而贝叶斯概率算法作为一种估算概率, 并非事件的“真实”计算结果, 其实质是组合了先验信息与似然概率各自的优点, 在实测数据量不足和事件离散性较大的情况下, 具有更好的适用性.
Amighpey M, Voosoghi B, Motagh M. 2014. Deformation and fault parameters of the 2005 Qeshe earthquake in Iran revisited: A Bayesian simulated annealing approach applied to the inversion of space geodetic data[J].IntJApplEarthObservGeoinf, 26(1): 184--192.
Ang A H S, Tang W H. 2007.ProbabilityConceptsinEngineering:EmphasisonApplicationstoCivilandEnvironmentalEngineering[M]. New York: John Wiley & Sons: 1--420.
Cheng C T, Chiou S J, Lee C T, Tsai Y B. 2007. Study on probabilistic seismic hazard maps of Taiwan after Chi-Chi earthquake[J].JGeoEng, 2(1): 19--28.
Frankel A. 1995. Mapping seismic hazard in the central and eastern United States[J].SeismolResLett, 66(4): 8--21.
Kaklamanos J, Baise L G, Boore D M. 2011. Estimating unknown input parameters when implementing the NGA ground-motion prediction equations in engineering practice[J].EarthqSpectra, 27(4): 1219--1235.
Khakzad N, Khan F, Amyotte P. 2013. Quantitative risk analysis of offshore drilling operations: A Bayesian approach[J].SafetySci, 57: 108--117.
Koutsourelakis P S. 2010. Assessing structural vulnerability against earthquakes using multidimensional fragility surfaces: A Bayesian framework[J].ProbEngMech, 25(1): 49--60.
Kramer S L. 1996.GeotechnicalEarthquakeEngineering[M].Upper Saddle River, NJ: Prentice Hall: 1--653.
Patil A, Deng Z Q. 2011. Bayesian approach to estimating margin of safety for total maximum daily load development[J].JEnvironManage, 92(3): 910--918.
Song Y Q, Gong J H, Gao S, Wang D C, Cui T J, Li Y, Wei B Q. 2012. Susceptibility assessment of earthquake-induced landslides using Bayesian network: A case study in Beichuan, China[J].CompGeosci, 42(5): 189--199.
Vu D, Xue M, Tan X, Li J. 2013. A Bayesian approach to SAR imaging[J].DigSignalProc, 23(3): 852--858.
Wang J P, Huang D, Cheng C T, Shao K S, Wu Y C, Chang C W. 2013. Seismic hazard analysis for Taipei City including deaggregation, design spectra, and time history with Excel applications[J].CompGeosci, 52(1): 146--154.
Zhang L M, Li D Q, Tang W H. 2006. Impact of routine quality assurance on reliability of bored piles[J].JGeotechnGeoenvironEng, 132(5): 622--630.
Application of two Bayesian probability algorithms to the estimation of earthquake parameters
Li Shuanhu*Gao Lixin Ding Fenghe Chen Lifeng Yang Hongying
(EarthquakeAdministrationofInnerMongoliaAutonomousRegion,Hohhot010010,China)
probability estimation; Bayesian probability; priori probability; likelihood probability
研究简报
内蒙古自治区地震局局长基金课题(2016YC01)资助.
2016-03-22收到初稿, 2016-06-13决定采用修改稿.
10.11939/jass.2016.06.015
P315.08
A
李拴虎, 高立新, 丁风和, 陈立峰, 杨红樱. 2016. 用于地震参数估算的两种贝叶斯概率算法分析. 地震学报, 38(6): 952--955. doi:10.11939/jass.2016.06.015.
Li S H, Gao L X, Ding F H, Chen L F, Yang H Y. 2016. Application of two Bayesian probability algorithms to the estimation of earthquake parameters.ActaSeismologicaSinica, 38(6): 952--955. doi:10.11939/jass.2016.06.015.
*通讯作者 e-mail: lizhengke06@126.com