韩明
(宁波工程学院理学院,浙江 宁波 315211)
Pareto分布形状参数的E-Bayes估计和多层Bayes估计及其应用
韩明
(宁波工程学院理学院,浙江 宁波 315211)
给出了参数的E-Bayes估计的定义,对Pareto分布在尺度参数已知时,在平方损失下给出了形状参数的E-Bayes估计和多层Bayes估计,并且用Monte Carlo方法给出了模拟算例.最后,结合高尔夫球手收入数据的实际问题进行了计算,结果表明本文提出的方法可行且便于应用.
Pareto分布;E-Bayes估计;多层Bayes估计;尺度参数;形状参数
1972年,文献[1]中提出了多层先验分布的想法、1997年,文献[2]中提出了多层先验分布的构造方法以来,多层Bayes方法在参数估计方面取得了一些进展(见文献 [3]).但用多层Bayes方法得到的结果一般都要涉及复杂积分的计算,有时甚至是一些高维的复杂积分,虽然有MCMC(Markov Chain Monte Carlo)等计算方法(见文献[4]),但在有些问题的应用上还是不太方便,这在一定程度上制约了多层Bayes方法的应用.在本文中我们将会看到,参数的E-Bayes估计与多层Bayes估计相比,在表达式上简单,在应用上更方便一些.
Pareto分布是收入分配理论中的一种重要的统计分布,最初是由意大利人Pareto作为收入分布于1897年提出来的.Pareto是意大利工程师,社会学家,经济学家,其中以经济学家的身份最为著名.通过对有关收入分配的研究,Pareto发现一国之内人们的收入在高于某个值时的分布与社会经济结构和“收入”的定义无关,具有普适性,大部分财富是集中在少数人手里的(20%的人占有80%的财富).此后,人们广泛地将其用来描述自然和社会现象.1963年,曼德布罗特使用Pareto分布描述投机市场收益率的分布,1965年法玛用Pareto分布研究过投资组合问题.这之后的很长时间,Pareto分布在主流金融领域默默无闻,直到1990年后,随着对风险管理的重视,Pareto分布重新登上金融舞台.例如,城市人口容量,股票价格的波动,保险风险等,都可以用Pareto分布来描述,因此对Pareto分布的研究具有重要的理论和实际应用价值.
Arnold在文献[5]中,比较全面地研究了 Pareto分布的有关问题.在文献[6]中,介绍了 Pareto分布 (特别是 Pareto分布与金融中的厚尾分布),并对 Pareto分布的参数给出了Bayes估计及其应用.在文献[7]中,对Pareto分布的参数,讨论了LINEX损失下参数的经验Bayes估计.在文献[8]中,对Pareto分布的参数,根据文献[9]中提出的E-Bayes估计法,在复合LINEX对称损失下给出了参数的Bayes估计和E-Bayes估计及其应用.
本文将在第二节中,给出参数的E-Bayes估计的定义,并在此基础上给出Pareto分布形状参数的E-Bayes估计;在第三节中,给出Pareto分布形状参数的多层Bayes估计;在第四节中,给出模拟算例;在第五节中,给出应用实例.
以下首先给出参数的 E-Bayes估计的定义,然后在此基础上给出 Pareto分布参数的E-Bayes估计.
2.1 E-Bayes估计的定义
对0<a<1,b越大,Gamma分布密度函数的尾部越细.根据Bayes估计的稳健性(见文献[10]),尾部越细的先验分布常会造成Bayes估计的稳健性越差,因此b不宜过大,应该有一个界限.设b的上界为c,其中c>0为常数.这样可以确定超参数a和b的范围为0<a<1,0<b<c(常数c的具体确定,见后面的应用实例).
2.2 λ的E-Bayes估计
定理2.2.1 设x1,x2,···,xn为来自Pareto分布(1)的样本观察值,在尺度参数α已知时,若λ的先验分布为Gamma分布,其密度函数由(3)式给出,超参数a和b的先验分布分别为(0,1)和(0,c)上的均匀分布,在a和b独立时,则有如下结论:
若λ的先验分布为Gamma分布,其密度函数由(3)式给出,超参数a和b的先验分布分别为(0,1)和(0,c)上的均匀分布,在a和b独立时,则λ的多层先验密度函数为
定理3.1 设x1,x2,···,xn为来自Pareto分布(1)的样本观察值,在尺度参数α已知时,若λ的多层先验密度函数由(4)式给出,则在平方损失下λ的多层Bayes估计为
以下采用Monte Carlo方法进行模拟计算.在模拟计算中参数估计的精度采用指标––参数估计的平均偏差,其定义如下:
在Pareto分布中,给定尺度参数α=100和形状参数λ=3时,对n=10,30,50,100和c=0.1,0.5,1,用R软件并采用Monte Carlo方法进行模拟计算,每种情况均进行1000次模拟计算,其计算结果如表1所示.
从表 1的计算结果来看,对相同的 n(n=10,30,50,100)和不同的 c(c=0.1,0.5,1),和的计算结果都是比较稳健的;对相同的n(n=10,30,50,100)和相同的c(c= 0.1,0.5,1),和的计算结果比较接近.
表1 △EB和△HB的模拟计算结果
表1 △EB和△HB的模拟计算结果
nc △λEB△λHBn c △λEB△λHB0.1 0.166 927 288 0.167 027 543 0.1 0.110 346 873 0.110 333 778 10 0.5 0.168 414 045 0.169 209 135 50 0.5 0.110 880 019 0.110 893 966 1.0 0.178 816 928 0.179 310 887 1.0 0.111 883 383 0.111 884 211 0.1 0.130 214 005 0.130 338 976 0.1 0.076 230 148 0.076 240 283 30 0.5 0.133 002 473 0.132 932 032 100 0.5 0.076 492 109 0.076 488 513 1.0 0.131 759 074 0.131 676 551 1.0 0.076 542 861 0.076 550 125
文献[5]中给出了 50名收入超过 70000美元的高尔夫球手,他们到1980年为止的收入的数据如表2所示(单位:1000美元),并且这些数据服从尺度参数为 α=703,形状参数为λ=2.23的Pareto分布.
表2 表高尔夫球手收入的数据
根据表2、定理2.2.1和定理3.1,λ的E-Bayes和多层Bayes估计的计算结果,如表3所示(c=0.1,0.3,0.5,1,1.5,2).
表3EB和HB的计算结果
表3EB和HB的计算结果
c 0.1 0.3 0.5 1 1.5 2︿λEB2.294 2 2.304 7 2.315 2 2.268 8 2.244 0 2.220 0︿λHB2.297 7 2.306 9 2.315 7 2.278 8 2.266 3 2.258 8︿λ-B0.003 5 0.002 2 0.000 5 0.010 0 0.022 3 0.038 8
从表3可以看出,对不同的c(c=0.1,0.3,0.5,1,1.5,2),和都是稳健的;对相同的c(c=0.1,0.3,0.5,1,1.5,2),和比较接近.
由于对不同的c(c=0.1,0.3,0.5,1,1.5,2),和都是稳健的,因此在应用中,作者建议:c在0.1,0.3,0.5,1,1.5,2居中附近取值,如取c=1.
根据文献[5],表2的数据来自尺度参数为α=703和形状参数为λ=2.23的Pareto分布.根据表3可以得到与λ=2.23的偏差:
其计算结果如表4所示.
表4△EB和△HB的计算结果
表4△EB和△HB的计算结果
c 0.1 0.3 0.5 1 1.5 2△︿λEB0.064 2 0.074 7 0.085 2 0.038 8 0.014 0 0.010 0△︿λHB0.067 7 0.076 9 0.085 7 0.048 8 0.036 3 0.028 8
从表4可以看出,
因此在c(c=0.1,0.3,0.5,1,1.5,2)时,EB、HB与λ=2.23的偏差都很小,并且EB的偏差比HB的偏差小,所以从这个意义上说E-Bayes估计比多层Bayes估计的精度更高.
从表 3可以看出,本文的计算结果与文献 [8]中在复合 LINEX对称损失下给出的 λ的Bayes估计和E-Bayes估计的计算结果比较接近.
本文对Pareto分布在尺度参数为已知时,在平方损失下给出了形状参数的E-Bayes估计(定理2.2.1)和多层Bayes估计(定理3.1),并且给出了模拟算例和应用实例.
作者认为,提出一种新的参数估计方法,必须回答两个问题:第一个问题,新的估计方法与已有估计方法(计算)结果的差异有多大;第二个问题,新的估计方法与已有估计方法相比,有哪些优点.
至于第二个问题——E-Bayes估计法的优点,从定理2.2.1和定理3.1的表达式上看,显然λ的E-Bayes估计比多层Bayes估计简单.另外,从模拟算例和应用实例的具体计算中,我们也可以体验到E-Bayes估计比多层Bayes估计简单,E-Bayes估计法在应用上更方便一些.
关于E-Bayes估计法的其它优点,还有待进一步研究.关于E-Bayes估计法的其他研究,见文献[11-12]等.
[1]Lindley D V,Smith A F M.Bayes estimaters for the linear model[J].Journal of the Royal Statistical Society,Series B,1972,34:1-41.
[2]韩明.多层先验分布的构造及其应用[J].运筹与管理,1997,6(3):31-40.
[3]Ando T,Zellner A.Hierarchical Bayesian analysis of the seemingly unrelated regression and simultaneous equations models using a combination of direct monte Carlo and importance sampling techniques[J]. Bayesian Analysis,2010,5(1):65-96.
[4]Andrieu C,Thoms J.A tutorial on adaptive MCMC[J].Statistics and Computing,2008,18(4):343-373.
[5]Arnold B C.Pareto Distributions[M].2nd ed.London/Boca Raton:Chapman and Hall/CRC,2015.
[6]韩明.贝叶斯统计学及其应用[M].上海:同济大学出版社,2015.
[7]康会光,师义民.LINEX损失下Pareto分布参数的经验Bayes估计[J].纯粹数学与应用数学,2001,17(2):169-171.
[8]韦程东,韦师,苏韩.复合LINEX对称损失下Pareto分布形状参数的E-Bayes估计及其应用[J].统计与决策,2009,17:7-9.
[9]韩明.Pascal分布的参数估计[J].纯粹数学与应用数学,2006,22(4):510-515.
[10]Berger J O.Statistical Decision Theory and Bayesian Analysis[M].2nd ed.New York:Springer-Verlag,1985.
[11]Han M.E-Bayesian estimation of failure probability and its application[J].Mathematical and Computer Modelling,2007,45:1272-1279.
[12]Han M.E-Bayesian estimation of the reliability derived from binomial distribution[J].Applied Mathematical Modelling,2011,35:2419-2424.
The E-Bayesian estimation and hierarchical Bayesian estimation of shape parameter for Pareto distribution and its applications
Han Ming
(School of Science,Ningbo University of Technology,Ningbo 315211,China)
In this paper,the definition of E-Bayesian estimation of the parameter is provided;moreover,for Pareto distribution,under the condition of the scale parameter is known,based on the square error loss function,formulas of E-Bayesian estimation and hierarchical Bayesian estimation for the shape parameter are also provided,and using the Monte Carlo method simulation example is given.Finally,combined with the golfer income data practical problem are calculated,the results show that the proposed method is feasible and convenient for application.
Pareto distribution,E-Bayesian estimation,hierarchical Bayesian estimation,scale parameter,shape parameter
O213.2
A
1008-5513(2016)03-0235-08
10.3969/j.issn.1008-5513.2016.03.002
2015-11-21.
宁波市自然科学基金(2013A610108).
韩明(1961-),博士,教授,研究方向:数理统计与可靠性理论.
2010 MSC:62F15