近似P-范分布的渐近正态性及柯尔莫哥洛夫检验

2021-11-19 07:56胡宏昌王佳琪
关键词:均匀分布四阶正态分布

胡宏昌,王佳琪

(湖北师范大学 数学与统计学院,湖北 黄石 435002)

0 引言

由于在测量数据的采集、录入及处理过程中,不可避免地受到外界条件、人为因素等的影响,导致观测误差不是正态分布,而采用P-范分布描述更为合理。尽管P-范分布描述观测误差时具有明显的优越性,但其概率密度函数的表达式较为复杂,在对其进行理论分析和实际应用研究时,具有一定的困难。因此找到一个形式比较简单的函数来近似地代替P-范分布的密度函数是很有必要的。为了使P-范分布的相关问题得到简化,文献[1]利用密度函数较为简单的正态分布、拉普拉斯分布以及均匀分布的线性组合来近似地表示P-范分布,这种表示方法能够近似到四阶矩,那么可以认为f1(x)与f2(x)近似相等。虽然这种近似对其理论分析和实际应用的研究都是十分有利的,然而在理论上这种观点存在明显的缺陷(由两种分布的前四阶矩相同不能推出这两种分布相同)。

尽管对于P-范分布的深入研究成果有很多(如文献[1~6]等),然而涉及其检验问题的研究不多(只有文献[5]涉及P-范分布的参数假设检验问题)。为了弥补文献[1]的不足和拓宽P-范分布的研究范围,本文采用柯尔莫哥洛夫检验方法对近似P-范分布进行非参数假设检验,以此来验证近似P-范分布的拟合效果。

1 P-范分布的密度函数及近似表示

1.1 P-范分布的密度函数

定义1[4]若随机向量X的密度函数为

(1)

注1 易得一元P-范分布的密度函数的数学期望为μ,方差为σ2,偏态系数为0,峰态系数为

注2 拉普拉斯分布(p=1)、正态分布(p=2)、均匀分布(p→∞)和退化分布(p→0)均为P-范分布的特例。

1.2 P-范分布的近似表示

设有两个随机变量X1和X2,其密度函数分别为f1(x)和f2(x).如果它们的数学期望、方差、偏态系数及峰态系数均相等,那么可以近似地认为X1和X2具有相同的统计性质,而且f1(x)与f2(x)近似相等(参见文献[1].虽然这种观点存在明显的缺陷,但本文还是采用这种近似)。

当1≤p≤2时,有0≤γ2≤3,因此可以用

f(x)=(1-ε)fN(x)+εfL(x)

(2)

来近似地表示fp(x),其中fN(x)与fL(x)分别为正态分布与拉普拉斯分布的密度函数,表达式分别为

显然,f(x)、fN(x)、fL(x)具有相同的数学期望μ和方差σ2,且偏态系数均为0.而f(x)的峰态系数为

因此只要令

则fp(x)与f(x)具有相同的数学期望、方差、偏态系数、峰态系数。即用f(x)代替fp(x)可以准确到四阶矩。

当2≤p<∞时,fp(x)的峰态系数介于正态分布与均匀分布的峰态系数之间,因此可以用正态分布与均匀分布的组合来近似地表示,即

f(x)=(1-ε)fN(x)+εfR(x)

(3)

其中

由于分布f(x)的峰态系数为

所以令

则fp(x)与f(x)具有相同的数学期望、方差、偏态系数和峰态系数,即用f(x)代替fp(x)也可以准确到四阶矩。

2 近似P-范分布的极限分布

下面利用特征函数来讨论上文两种近似P-范分布的随机变量序列和的极限分布。

定理1 若ξ服从近似P-范分布(1≤p≤2), 其简单随机子样序列ξ1,ξ2,…,ξn,且nε→0,则

证明 当1≤p≤2时,P-范分布可由正态分布与拉普拉斯分布的密度函数近似表示。易知正态分布与拉普拉斯分布的特征函数分别为

因此近似P-范分布的特征函数为

下证当nε→0时,上述二项式的展开式中第二项到第n项均为第一项的无穷小量。事实上,由于

所以

即为N(nμ,nσ2)的特征函数。

定理2 若ξ服从近似P-范分布(2≤p≤∞),其简单随机子样序列ξ1,ξ2,…,ξn,且nε→0,则

证明 当2≤p≤∞时,P-范分布可由正态分布与均匀分布的密度函数近似表示。类似于定理1,在此略。

3 近似P-范分布的柯尔莫哥洛夫检验

情形一 当p=1.5时,随机生成120个服从P-范分布的随机数,这里检验假设为

H0∶F(x)=F0(x)=(1-ε)Fn(x)+εFL(x)⟺H1∶F(x)≠F0(x)

为了根据子样观测值得到统计量Dn的值,把必要的计算结果列入表1中。

表1 当p=1.5时,统计量Dn及其相关值

续表1

从表1中|F(xi)-Fn(xi)|和|F(xi)-Fn(xi+1)|两列可以得到统计量D120=0.110176,查柯尔莫哥洛夫检验临界值表(严格地来说是极限分布函数数值表)得到

由此可推断不能拒绝原假设,因此认为原假设H0成立。

情形二 当p=3时,生成120个服从P-范分布的随机数,这里检验假设为

H0∶F(x)=F0(x)=(1-ε)Fn(x)+εFR(x)⟺H1∶F(x)≠F0(x)

类似于情形一的计算可得

D120,0.10=0.11137>D120=0.102373

因此认为原假设H0成立。

综上,通过运用柯尔莫哥洛夫拟合检验的方法,分别对两个近似P-范分布进行非参数假设检验。结果显示,两个近似P-范分布均通过检验,从而从分布的角度说明了近似P-范分布能够替代P-范分布。

猜你喜欢
均匀分布四阶正态分布
关于n维正态分布线性函数服从正态分布的证明*
一类带参数的四阶两点边值问题的多解性*
生活常态模式
带有完全非线性项的四阶边值问题的多正解性
一种新的四阶行列式计算方法
电磁感应综合应用检测题
可逆随机数生成器的设计
正态分布及其应用
尼龙纤维分布情况对砂浆性能的影响研究
魔法幻方