摘 要:以定理形式给出了常见概率分布间的6种极限关系,包括超几何分布的二项近似、二项分布的泊松近似、二项分布的正态近似、泊松分布的正态近似、t分布的正态近似和分布的正态近似。除了比较熟悉的泊松定理和棣莫佛—拉普拉斯中心极限定理外,其他定理一般文献较少提及,或只给出结论而未加以证明,该文对这些定理均给出了证明,同时对定理的适用条件及应用进行了说明。了解以上常见概率分布间的极限关系,有助于系统理解常见分布间的联系,同时为概率的近似计算及统计推断提供了依据。
关键词:概率分布 极限关系 二项分布 泊松分布 正态分布
中图分类号:O211.4 文献标识码:A 文章编号:1672-3791(2019)03(b)-0221-02
Abstract: In the form of theorems, six kinds of limit relations among common probability distributions are given, including binomial approximation of hypergeometric distribution, Poisson approximation of binomial distribution, normal approximation of binomial distribution, normal approximation of Poisson distribution, normal approximation of t distribution and normal approximation of distribution. Except for the familiar Poisson theorem and Dimov-Laplace central limit theorem, other theorems are seldom mentioned in general literature, or only conclusions are given without proof. These theorems are proved in this paper. These theorems are proved in this paper, and the applicable conditions and applications of these theorems are explained. Understanding the limit relationship between the above common probability distributions is helpful for the system to understand the relationship between the common distributions, and provides a basis for approximate calculation of probability and statistical inference.
Key Words: Probability Distribution; Limit Relation; Binomial Distribution; Poisson Distribution; Normal Distribution
在概率論与数理统计这门学科中,一些常用概率分布间存在着极限关系[1],从而将两个随机变量通过渐近分布联系起来。目前多数文献在介绍常见的概率分布时对分布间的极限关系介绍得不够系统,而了解它们之间的这种极限关系,一方面有助于理解常见概率分布间的联系,另一方面在概率的近似计算及参数估计、假设检验等统计推断问题中有着广泛的应用价值。以下主要讨论常见概率分布间的6种极限关系。
1 超几何分布的二项近似
定理1 设随机变量,(P为常数),则n,k固定的条件下,有
证明
在实际应用中,一般地,若N较大,n相对较小(n< 以上结论也可从超几何分布的背景来理解。设总体容量为N,其中具有某属性的个体数为M,从总体中无放回地随机抽取一个容量为n的样本,则样本中具有该属性的样品数服从h(n,N,M)。若总体容量N较大,而样本容量n相对较小时,无放回抽样可近似看作有放回抽样,即构成一个n重的伯努利试验,从而样本中具有该属性的样品数近似服从B(n,p)。 2 二项分布的泊松近似 定理2(泊松定理) 设在n重伯努利试验中,每次试验中事件A发生的概率为Pn(与n有关),且,则有: 大多文献都给出了该定理的证明[4],此处不再赘述。 二项分布的计算有时候是非常繁琐的,该定理表明,若二项分布B(n,p)中的参数n较大,p较小,而np适中(一般地0.1≤np≤10)时,则可用泊松分布来近似,其中参数。 3 二项分布的正态近似 定理3(棣莫佛—拉普拉斯中心极限定理) 设μn为n重伯努利试验中事件A发生的次数,且每次试验中事件A发生的概率为p(0
大多文献也都给出了证明[5],该定理的证明只需利用林德伯格—勒维中心极限定理即可容易得出。
棣莫佛—拉普拉斯中心极限定理是历史上第一个中心极限定理,定理中的μn-B(n,p),而当n充分大时,二项分布B(n,p)可用正态分布N(np,np(1-p))来近似。
由于二项分布是离散分布,正态分布是连续分布,故在应用该定理进行近似计算时,往往需要做一些修正,从而提高计算的精度。
例如计算P(m≤μn≤n)时,先做修正P(m≤μn≤n)=P(m-0.5<μn 泊松定理表明了在一定的条件下,二项分布也可利用泊松分布来近似,那么需要考虑二项分布的泊松近似和正态近似的不同适用场合。一般而言,在P较小时用泊松分布近似的精度较高,而在np>5和n(1-p)>5时用正态分布近似效果较好。 4 泊松分布的正态近似 定理4表明,若泊松分布的P(λ)参数λ较大时,可用正态分布N(λ,λ)来近似泊松分布。但由于是用连续分布来近似离散分布,故在计算时可能需要做适当的修正。 t分布的概率密度圖像关于纵轴对称,与标准正态分布的概率密度图像形状上相似,但t分布的图像峰要低一些,两侧的尾部要大一些。而当自由度n较大(一般地n≥30)时,t分布可用标准正态分布来近似。 6 分布的正态近似 7 结语 以上讨论了常见概率分布间的6种极限关系,其中第1、2种情况都是用离散分布来近似离散分布,第5、6种情况都是用连续分布来近似连续分布,而第3、4两种情况是用连续分布来近似离散分布,在应用过程中可能需要做一些修正,从而提高近似计算的精度。同时注意到后4种情况的极限分布均为正态分布,这也从一个侧面说明了在自然界及社会现象中为什么大量的随机变量都服从或近似服从正态分布。 参考文献 [1] 侯文.常见概率分布间的关系[J].辽宁师范大学学报:自然科学版,2005,28(4):503-505. [2] 付安民.超几何分布与二项分布的有机联系[J].岳阳师范学院学报:自然科学版,2003,16(1):46-48. [3] 聂凡皓.与二项分布相关的极限定理[J].课程教育研究,2018(30):119-120. [4] 茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].2版.北京:高等教育出版社,2011:98-99. [5] 盛骤,谢式千,潘承毅.概率论与数理统计[M].4版.北京:高等教育出版社,2008:123-124.①作者简介:李玲(1980—),女,汉族,安徽庐江人,硕士,讲师,研究方向:可靠性统计。