广义极值分布参数估计方法的对比分析*

2010-06-05 08:52陈子燊刘曾美路剑飞
关键词:马口参数估计广义

陈子燊 ,刘曾美,2,路剑飞

(1.中山大学水资源与环境系,广东 广州 510275;2. 华南理工大学水利水电工程系,广东 广州 510640)

政府间气候变化专门委员会(IPCC)第一工作组2007年编写的第四份评估报告指出,全球暖化愈趋明显,水文气象极端事件发生的频率可能会增大[1]。准确地度量极值事件发生的概率及其分位数,预测极值事件可能造成的危害,已经成为工程风险管理、控制和决策研究的重要问题。通常对水文气象极端事件频率分析采用两种方法:一是选用某些统计分布函数拟合水文气象要素的累积概率及其相应的重现水平,如显示了较大实用性并得到广泛应用的皮尔逊Ⅲ型分布[2-4],但其是根据一定代表性的经验得出的分布曲线,缺乏严格的概率理论依据;另一种方法是应用极值分布理论,分别使用Weibull、Gumbel、Frechet三种极值分布函数之一对水文气象极值序列加以拟合计算[5-9]。近年来,许多研究人员采用了适用性更强的广义极值分布(generalized extreme-value distribution,简称GEV)理论,解决了只能用一种极值分布函数类型的局限性,广义极值(GEV)分布已经在水文气象极端事件研究领域得到了较多的应用[10-15]。

频率分析统计推断的精度除了取决于样本和选用的概率分布模型外,参数估计方法对计算结果具有重要影响。因此,概率分布模型的参数估计是极值统计理论研究的核心内容之一。参数估计的常用方法有极大似然(ML)、矩法(MOM)、概率权值矩(PWM)、线性矩(LM)、最小二乘(LS)和较新提出的间隔最大积(MPS)等估计方法。本文拟采用广义极值分布的极大似然法、线性矩法和间隔最大积3种参数估计法,对降水和径流极值序列做实证分析,并通过拟合优度检验加以对比。

1 广义极值分布

20世纪30年代,Fisher和Tippett[16]对独立同分布的极大值渐近分布进行理论研究时提出了3种极值分布:

极值Ⅰ型(Gumbel)分布:

-∞

极值Ⅱ型(Fréchet)分布:

极值Ⅲ型(Weibull)分布:

式中,ξ,μ,σ分别为形状参数、位置参数和尺度参数。

Jenkinson[17]、Coles[18]根据极值分布理论,证明当极值的渐近分布存在且为非退化时可以将3种类型的经典极值分布发展为一种统一的具有3参数的极值分布函数——广义极值分布(简记为GEV)。设X1,…,Xm是服从GEV分布的独立随机变量,则分布函数FX为:

FX(x)=P(X

当ξ→0为极值Ⅰ型,即Gumbel分布;ξ<0为极值Ⅱ型,即Fréchet分布,ξ>0,为极值Ⅲ型,即Weibull分布。在计算得到分布函数参数后,即可对给定的频率F求解其对应的分位数xF:

2 参数估计

2.1 极大似然估计(MLE)

极大似然估计法是Fisher于1922年提出的一种点估计方法。由于极大似然估计法使得参数估计结果在总体上反映样本的统计信息,具有良好的统计性质,因此得到了广泛重视与普遍应用[12-15]。

式中,θ=(μ,σ,ξ),yi=[1-(ξ/σ)(x-μ)]。

2.2 线性矩估计(LME)

Hosking等[19]指出,小样本参数的极大似然估计量是很不稳定的,推荐使用线性矩估计法。线性矩估计法同传统矩估计法基本原理一样,都是令样本矩与总体矩相等,得到总体参数的估计。Hosking[20]曾就线性矩法在P-Ⅲ分布的参数估计算法与传统矩参数估计方法在统计性能方面的差异进行了对比分析计算,统计试验结果表明,线性矩法确实具有良好性能,明显优于传统矩法。

参数估计:设随机变量X的分布函数为F=(x,θ),xn,n≤…≤x1,n,n是样本的次序统计量,称

为r阶L矩。前3阶样本L矩的无偏估计为:

2.3 间隔最大积估计(MPSE)

间隔最大积估计(Maximum Product of Spacing Estimation)方法是Cheng和Amin[21]提出并由Ranneby[22]推荐的一个新的参数估计方法。Cheng和Amin[21]证明了MPS和ML估计都同样具有渐近充分性、一致性和有效性,但极大似然参数估计方法在许多情况下由于似然函数的无界性或不存在局部极大值而失效,间隔最大积估计可适用于任何连续的单变量分布的参数估计,因而具更好的可辨识性。与包括极大似然估计在内的其它参数估计方法相比较,MPS特别适合于三参数分布函数,如广义极值分布、广义Pareto分布、威布尔分布、对数正态分布、3参数的Γ分布曲线的参数估计,并能提供更好的稳健性、一致性、有效性等统计估计量[23]。

参数估计:设{xi}为服从GEV分布的独立同分布集合,其递增排列的n个观测{x1,x2,…,xn}的累积分布函数为:F(x;θ0):θ0∈Θ,Θ⊆Rk(k≥1)

Di(θ)=F(xi;θ)-F(xi-1;θ),

D1(θ)=F(x1;θ),Dn+1(θ)=1-F(xn;θ)

式中,规定附加的数据点x0=-∞,xn+1=∞,因此,F(x0;θ)=0;F(xn+1;θ)=1

设Gn(θ)为Di(θ)的几何平均,Sn(θ)为Gn(θ)的自然对数,即

类似于极大似然估计方法,MPS法通过似然函数可得到参数θ的估计值。

3 实证分析

3.1 实例

实例1:马口水文站为珠江三角洲西江进入河网区的国家重点监测站。马口站多年平均径流量2 277亿m3,占珠江径流总量的77.1%;年内径流十分集中,汛期(4-9月)的径流量占全年径流总量的77.14%。枯期的径流量占全年径流总量的22.86%。样本序列为1959-2007年历年的月最大径流量。

实例2:广州位于珠江三角洲中部,多年平均年降水量约1 736 mm,近年来强降水过程引发的内涝趋于严重。样本序列为1951-2008年历年的日最大降水量。

3.2 参数估计结果

两极值序列的广义极值分布3种参数估计方法与参数估计的结果值见表1,广义极值分布的不同重现水平的分位数与标准误差计算结果见表2。

表1 广义极值分布的参数估计结果

表1显示,广州日最大降水序列和马口月最大径流序列的广义极值分布的3种参数估计方法推算参数值比较接近。广州日最大降水序列的广义极值分布的形态参数为负值表明,日最大降水序列属于极值Ⅱ型分布,即Frechet分布,属于负偏右长尾,分布形态同皮尔逊Ⅲ型密度曲线。

2014年,经过半年试点,住院患者的B超、CT检查集中预约运行比较顺利。预约中心助理完全能够胜任检查的宣教、预约工作;患者也没有不习惯,反而觉得更方便。

马口月最大径流序列的广义极值分布的形态参数为正值。序列属于极值Ⅲ型分布,即Weibull分布,属于右短尾分布。理论分析表明,极值序列上限为:x≤μ+σ/ξ。由参数估计推算的马口月最大径流序列的上界极限值介于1036.5亿~1163.7亿m3。

三种参数估计推算的设计频率分位值说明,广州日最大降水和马口月最大径流序列的相同重现期由MPS法推算的分位值最大,线性矩法推算结果最小,而极大似然法介于二者之间。

3.3 拟合优度检验

采用了以下几个拟合优度检验方法:

(1)PPCC检验法

表2 广义极值分布的设计频率分位值

(2)均方根误差

均方根误差计算公式:

(3)χ2拟合检验

(4)柯尔莫哥洛夫拟合检验

原检验假设,H0:X~F0(x,μ,σ,ξ)。计算柯尔莫哥洛夫统计量:

|Fn(x(i+1))-F0(x(i))|}

Fn(x):样本经验分布;F0(x):广义极值分布。取显著水平α=0.05,若Dn>Dn,α,则拒绝H0。

广州日最大降水和马口月最大径流广义极值分布累积频率曲线(图1)显示,各种参数估计结果的累积分布与经验分布符合良好,尤其是作为概率分布曲线的上尾部由MPS参数估计法推算的马口月最大径流更符合实测数据。各种拟合优度检验结果见表3。从表3可看出,柯尔莫哥洛夫检验、χ2检验和PPCC相关系数计算结果表明广州日最大降水和马口月最大径流序列均完全服从广义极值分布。不同参数估计结果对比表明,MPS参数估计方法计算的RMSE明显小于其余二者估计结果,说明拟合最优,可以作为广州日最大降水和马口月最大径流序列广义极值分布推算的最佳设计值。

图1 广州日最大降水与马口月最大径流广义极值分布三种参数估计

表3 拟合优度检验结果

Table 3 The results of goodness-fit test

实例参数估计法柯尔莫哥洛夫检验Dn,αDnχ2检验χ21-αχ2RMSEPPCC广州日最大降水线性矩1.0000.05218.2651.00013.6 0.993极大似然1.0000.05220.3771.00012.20.992MPS0.9990.06913.9971.0001.60.992马口月最大径流线性矩0.9950.08326.4790.9937.70.992极大似然0.9950.08328.6240.9845.60.991MPS0.9460.10425.1210.9965.60.992

4 结 论

本文分析了广义极值分布理论的3种参数估计方法的特点和计算方法,采用马口月最大径流量和广州日最大降水量作为广义极值分布不同参数估计方法的两个实例,对分析结果有以下结论:

1)三种参数估计方法的3个参数值较为接近,广州日最大降水的形态参数为负值,属于极值Ⅱ型分布。马口月最大径流的形态参数为正值,属于极值Ⅲ型分布;

2)拟合优度检验结果表明两实例均服从广义极值分布,均可选择作为统计推断的分布函数类型;

3)MPS参数估计推算的设计值与观测值拟合更好。

参考文献:

[1] IPCC. IPCC Fourth Assessment Report (AR4) [M]. Cambridge: Cambridge University Press,2007.

[2] 杨远东,王辉,杨树佳,等.皮尔逊Ⅲ型分布三参数估计新方法[J]. 水资源研究,2007,28(3):18-28.

[3] 周芬,郭生练,肖义,等. P-Ⅲ型分布参数估计方法的比较研究[J]. 水电能源科学,2003,21(3):10-13.

[4] 黄振平,王春霞,马军建.P-Ⅲ型分布的适应性与水文设计值的误差分析[J]. 水文, 2002,22(5):21-24.

[5] 张秀芝. Weibull分布参数估计方法及其应用[J].气象学报,1996,54(1):108-116.

[6] 蔡敏,丁裕国,江志红. L-矩估计方法在极端降水研究中的应用[J]. 气象科学,2007,27(6):597-603.

[7] 段忠东,周道成. 极值概率分布参数估计方法的比较研究[J]. 哈尔滨工业大学学报,2004,36 (12) :1605-1609.

[8] 曹兵,王义刚, YOU Zaijin. 三种计算设计波高方法的比较[J]. 海洋工程,2006,24(4):75-80.

[9] 赵伟,杨永增,于卫东,等.长期极值统计理论及其在海洋环境参数统计分析中的应用[J].海洋科学进展,2003,21(4):471-476.

[10] 金光炎.广义极值分布及其在水文中的应用[J].水文,1998(2):9-15.

[11] 陈元芳,李兴凯,陈民,等.可考虑历史洪水信息的广义极值分布线性矩法的研究[J].水文,2008,28(3):8-13.

[12] PRESCOTT P, WALDEN A T. Maximum-likelihood estimation of the parameters of the three-parameter generalized extreme-value distribution from censored samples[J]. J Stat Comput Simul,1983,(6):241-250.

[13] MARTINS E S. Generalized maximum-likelihood generalized extreme-value quantile estimators for hydrologic data[J]. Water Resources Research, 2000,36(3):737-744.

[14] 刘聪,秦伟良,江志红. 基于广义极值分布的设计基本风速及其置信限计算[J]. 东南大学学报:自然科学版,2006,36(2):331-334.

[15] 陈兴旺.广义极值分布理论在重现期计算的应用[J].气象与减灾研究,2008,31(4):52-54.

[16] FISHER R A, TIPPETT L H. Limiting forms of the frequency distribution of the largest or smallest member of a sample[J]. Proc Cambridge Philos Soc,1928, 24: 180-190.

[17] JENKINSON A F. The frequency distribution of the annual maximum (or minimum)values of meteorological elements[J]. Q J R Meteorol Soc, 1955, 81: 158-171.

[18] COLES S. An introduction to statistical modeling of extreme values [M]. New York: Springer Verlag, 2001: 36-78.

[19] HOSKING J R M, WALLIS J R, WOOD E F. Estimation of the generalized extreme value distribution by the method of probability-weighted moments[J].Technometrics,1985,27(3):251-261.

[20] HOSKING J R M.L-moments: Analysis and estimation of distributions using linear combinations of order statistics[J].J Roy Statist Soc:Ser B,1990,52: 105-124.

[21] CHENG R C H, AMIN N A K. Estimating parameters in continuous univariate distributions with a shifted origin[J].J Roy Statist Soc:Ser B,1983, 45(3):394-403.

[22] RANNEBY B. The maximum spacing method: an estimation method related to the maximum likelihood method[J]. Scand J Statist,1984, 11: 93-112.

[23] MAGNUS E. Alternatives to maximum likelihood estimation based on spacings and the Kullback-Leibler divergence[J]. Journal of Statistical Planning and Inference, 2008,138:1778-1791.

猜你喜欢
马口参数估计广义
Rn中的广义逆Bonnesen型不等式
基于新型DFrFT的LFM信号参数估计算法
误差分布未知下时空模型的自适应非参数估计
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
非遗视野下湖北马口窑的保护、继承与开发
从广义心肾不交论治慢性心力衰竭
王夫之《说文广义》考订《说文》析论
浅谈死亡力函数的非参数估计方法
浅谈死亡力函数的非参数估计方法
春钓马口正当时