白 雪,龙 兵
(荆楚理工学院 数理学院,湖北 荆门 448000)
幂分布是贝塔分布的一种特殊情形,在贝叶斯统计分析中常被用于产品合格率的先验分布。幂分布的概率密度函数和累积分布函数分别为
其中参数θ>0,0<x<1。
在文献[1-4]中取幂分布作为几何分布参数的先验分布,讨论了未知参数的贝叶斯估计问题。文献[5]在抽样总体服从幂分布的情况下,研究了次序统计量的性质。文献[6-7]在部分缺失数据样本下讨论了两个幂分布总体参数的极大似然估计、参数之差的置信区间和假设检验,并通过随机模拟验证估计的精度。
在许多情况下,我们需要估计概率密度函数和累积分布函数。例如,我们使用概率密度函数来估计微分熵、Kullback-Leibler散度和Fisher信息量;我们使用分布函数估计分位数函数和累积剩余熵等。因此文献[8-14]讨论了多个总体分布的概率密度函数和分布函数的估计,计算了估计的均方误差并对多种估计进行比较。然而,对幂分布的概率密度函数和分布函数进行统计分析的文献到目前为止还没有见到,本文将对这一问题进行探讨。
假设X1,X2,…,X n是从幂分布(1)和(2)中抽取的独立同分布随机样本,由极大似然法可以得到参数θ的极大似然估计(MLE)为
根据极大似然估计的不变性,可以得到密度函数和分布函数的极大似然估计分别为
由于-2θlnX i~χ2(2),因此,则Y的概率密度函数为
定理1概率密度函数和累积分布函数极大似然估计的r阶矩分别为
其中K v(·)表示第二类v的修正贝塞尔函数。
证明:根据(4)式,可以得到
利用文献[15]中的公式(3.471.9),则
因此
注记:从定理1可以看到,当取r=1时因此分别是f(x),F(x)的有偏估计。
定理2和的均方误差分别为
证明:根据均方误差公式可得
在定理1中分别取r=2和r=1,可以得到
下面将得到f(x)和F(x)的一致最小方差无偏估计(UMVUE),进而得到这些估计的均方误差。
设X1,X2,…,X n是从幂分布(1)中抽取的独立同分布随机样本,则是关于θ的一个完备充分统计量。设f·(x)是f(x)的一致最小方差无偏估计,根据Lehmann-Scheffe定理
其中f·(t)=f X1|T(x1|t)是当给定T=t时X1的条件概率密度函数,f X1,T(x1,t)是X1和T的联合概率密度函数。
定理3当给定T=t时X1的条件概率密度函数为
证明:设Z i=-lnX i,i=1,2,…,n,则,根据(3)式可以得到T的概率密度函数为
因此当给定T=t时X1的条件概率密度函数为
因此
定理4当T=t时,f(x)和F(x)的一致最小方差无偏估计分别为
其中-lnx<t<+∞。
证明:根据(8)式和定理3,我们立即可以得到(x)是f(x)的一致最小方差无偏估计。对~(x)积分就可以得到F(x)的一致最小方差无偏估计(x)。
定理5和的均方误差分别为
利用(9)式,可得
由于
因此
令θt=u,则
因此
由于
因此
利用均方误差的公式则定理5得证。
基于分位数的估计由Kao[16]在1958年提出,当某个概率分布的分位数函数具有较简单的形式时可以考虑使用这种方法来估计分布的未知参数。
设X1,X2,…,X n是从幂分布(1)中抽取的独立同分布随机样本,又设X(1),X(2),…,X(n)为次序统计量。记θ~PC为参数θ基于分位数的估计。通过极小化
利用最小二乘法,可得
因此f(x)和F(x)的估计分别为
在这一部分通过Mathematica和Matlab软件进行模拟计算。当未知参数θ的值分别取1.5,2,2.5,3时,利用逆变换法X i=(i=1,2,…,n),其中U i是(0,1)上独立均匀分布随机数,则X i就是服从参数θ的幂分布随机数,样本量分别取n=10,20,30,40。对于产生的每一个随机样本计算出估计量的值,经过1000次重复模拟计算出各种估计的均方误差。
从表1中的数据可以看出,随着样本量n的增大,估计量的均方误差变小。基于分位数的估计的均方误差比极大似然估计和一致最小方差无偏估计的均方误差都要大。概率密度函数的极大似然估计的均方误差要小于一致最小方差无偏估计的均方误差,对于分布函数而言两者的均方误差比较接近。