顾蓓青,王蓉华,徐晓岭
(1.上海对外经贸大学 统计与信息学院,上海 201620;2.上海师范大学 数理学院,上海200234)
设随机变量X服从位置参数μ、刻度参数λ的两参数Cauchy分布(记为C(μ,λ)),其密度函数f(x)和分布函数F(x)分别为:
Cauchy分布因其期望和方差都不存在而受到广泛关注,其在物理学等众多领域也有着十分重要的应用价值。关于Cauchy分布的一些特别性质,可查阅文献[1-3]。同时,也有很多文献对Cauchy分布的参数估计问题进行了一些研究。文献[4]讨论了矩估计和极大似然估计等一些常用的点估计方法对Cauchy分布C(μ,1)并不适用,从而提出了利用中位数的方法得到参数μ的估计。文献[5]通过局部矩估计的方法得到Cauchy分布C(0,λ)的参数λ的点估计与区间估计,同时也说明了该方法的局限性。文献[6]给出了Cauchy分布C(μ,λ)的两个参数的分位数估计。文献[7]在全样本场合下研究了两参数Cauchy分布C(μ,λ)的点估计与区间估计。
本文给出了两参数Cauchy分布C(μ,λ)在全样本场合下参数的区间估计和定数截尾场合下参数的点估计与区间估计方法,并通过Monte-Carlo模拟考察了点估计与区间估计的精度。
设X1,X2,…,Xn为来自总体X~C(μ,λ)的一个容量为n的简单随机样本,其样本观察值记为x1,x2,…,xn,次序统 计 量 记 为X(1)≤X(2)≤ … ≤X(n),其 次 序 观 察 值 记 为则Y~C(0,1),而Y1,Y2,…,Yn与来自标准 Cauchy 分布C(0,1)总体的容量为n的一个简单随机样本同分布,将其从小到大排序记为:Y(1),Y(2),…,Y(n)。
令μ的函数
其中,若n为偶数若n为奇数时,
于是ℱ(μ)是仅含有参数μ的枢轴量,又ℱ(μ)为μ的严格单调增函数,且:
由此,给定显著性水平α,枢轴量)的上侧1-α/2,α/2分位数记为和,通过Monte-Carlo模拟可以得到不同样本容量所对应的枢轴量)的上侧分位数值。从而,参数μ的置信水平1-α的区间估计为:
构造如下仅含有参数λ的枢轴量:
又:
于是T(λ)是仅含有参数λ的枢轴量,又T(λ)是λ的严格单调减函数。
给定显著性水平α,枢轴量T(λ)的上侧1-α/2,α/2分位数分别记为T1-α/2和,通过Monte-Carlo模拟可以得到不同样本容量所对应的枢轴量T(λ)的上侧分位数值。从而,参数λ的置信水平1-α的区间估计为:
给定置信水平1-α=0.90 ,取样本容量n=10(5)30 ,参数真值取为μ=-5,0,5,λ=0.5,通过1000次Monte-Carlo模拟得参数μ,λ的区间估计的平均下限、平均上限和平均区间长度,同时统计1000次模拟所得的区间估计包含参数真值的次数,结果如表1所示,从中可以看到上述所给出的求区间估计的方法是可行的。
表1 参数μ,λ的区间估计
设X(1),X(2),…,X(r)为来自总体X~C(μ,λ)的一个容量为n的前r个次序统计量,其次序观察值记为则Y~C(0,1),而Y(1),Y(2),…,Y(r)与来自标准 Cauchy分布C(0,1)总体的容量为n的前r个次序统计量同分布。
注意到,如给定0<p<1,由文献[8]可知样本的p分位数X*(p)可定义为:
其中,<pn>为pn的整数部分。
进而参数μ的点估计为:
则参数λ的点估计为:
进而参数μ的点估计为:
其中[]表示取整函数。
由于该情况下的样本量较少,估计的效果不甚理想,会受到样本值的影响,在此仅举一模拟算例说明该方法的应用:取n=20,r=4,参数真值取μ=0,λ=1,通过Monte-Carlo模拟产生的一组截尾样本为-4.2946,-4.2491,-1.9168,-0.92,则̂=0.0207 ,̂=0.6835 。
取样本容量n=10(5)30以及定数截尾数r,参数真值取μ=0,λ=1,通过10000次模拟得到参数μ,λ的点估计的均值与均方差,结果列于表2。
表2 参数μ,λ的点估计
2.2.1 参数μ的区间估计
令μ的函数
其中,若r为偶数若n为奇数时,
于是ℱ(μ)是仅含有参数μ的枢轴量,又ℱ(μ)为μ的严格单调增函数,且:
由此,给定显著性水平α,枢轴量)的上侧1-α/2,α/2分位数记为和,通过Monte-Carlo模拟可以得到不同样本容量n和定数截尾数r所对应的枢轴量ℱ(μ)的上侧分位数值。从而,参数μ的置信水平1-α的区间估计为:
2.2.2 参数λ的区间估计
构造如下仅含有参数λ的枢轴量:
又:
于是T(λ)是仅含有参数λ的枢轴量,又T(λ)是λ的严格单调减函数。
给定显著性水平α,枢轴量T(λ)的上侧1-α/2,α/2的分位数分别记为和,通过Monte-Carlo模拟可以得到不同样本容量n和定数截尾数r所对应的枢轴量T(λ)的上侧分位数值。从而,参数λ的置信水平1-α的区间估计为:
2.2.3 模拟分析
给定置信水平1-α=0.90,取样本容量n和定数截尾数r,参数真值取为μ=1,λ=1,通过1000次Monte-Carlo模拟得参数μ,λ的区间估计的平均下限、平均上限和平均长度,同时统计1000次模拟所得的区间估计包含参数真值的次数,结果如表3所示。
例1:文献[5]提供了如下算例,取样本容量n=10,刻度参数λ的真值取为5,通过Monte-Carlo模拟产生10个服从C(0,λ)分布的随机数如下:
2.3008 ,3.9756,-6.4165,11.9341,16.4812,-0.2428,-7.9044,-6.3136,14.5784,-1.9155
文献[5]得到了参数λ的局部矩估计为:̂=5.0953;利用文献[7]的方法可以得到:μ的点估计为̂=X*(0.5)=1.029 ,λ的点估计为=X*(0.5)-X*(0.25)=7.3426 ,=X*(0.75)-X*(0.5)=10.9051,=5.6939;利用本文方法可以得到:在置信水平1-α=0.90下,μ的区间估计为[- 4.4215,9.0711] ,λ的区间估计为[0 . 1705,6.5199] 。
例2:取样本容量n=30,定数截尾数r=26,通过Monte-Carlo模拟产生一组服从C(3,2)分布的随机数如下:
-3.71106,-2.40515,-1.21566,-0.424847,0.296015,0.518243,0.744813,1.49002,1.90678,1.98354,1.99277,2.27703,2.47186,2.86832,2.8724,3.02303,3.27706,3.3678,3.69184,4.29,4.54302,4.63784,4.91429,5.53984,7.47502,8.44948
利用本文方法可以得到:μ的点估计为̂=X*(0.5)=2.9477 ,λ的点估计为̂=X*(0.75)-X*(0.5)=1.9666 ,在置信水平1-α=0.90下,μ的区间估计为[2 . 2743,4.4547] ,λ的区间估计为[0 .0383,2.0716] 。
针对两参数Cauchy分布C(μ,λ),在全样本场合下通过构造枢轴量分别得到参数μ和λ的区间估计,通过Monte-Carlo模拟考察了区间估计的精度,从模拟结果来看,该区间估计方法具有可行性。此外,在定数截尾场合下,通过分位数得到参数μ和λ的点估计,并利用枢轴量法得到参数μ和λ的区间估计,同时通过Monte-Carlo模拟分别考察了点估计与区间估计的精度,从模拟结果来看,点估计和区间估计的方法都是可行的。最后,通过两个模拟算例说明了本文方法的应用。