超几何概率教学探讨

2014-06-27 05:53:52赵永祥
重庆三峡学院学报 2014年3期
关键词:件产品三峡学院二项分布

赵永祥 李 丽

(重庆三峡学院数学与统计学院,重庆万州 404100)

超几何概率教学探讨

赵永祥 李 丽

(重庆三峡学院数学与统计学院,重庆万州 404100)

超几何分布是产品计数抽样检验、可靠性计算中经常遇到的一类重要的数理统计模型.在求解实际问题时,首先要根据超几何分布问题的特点判断所求问题是否为超几何概率问题,然后才能确定是否用超几何概率公式.同时,探讨了学生在求超几何概率问题时的一个误解.

随机变量;超几何分布;排列

1 超几何分布

超几何分布是统计学上一种离散概率分布,它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不放回).上述问题是产品质量的不放回抽样检查中经常遇到一类实际问题,假设有N件产品,其中有M件为不合格品,从N件产品中随机抽取n件,其中恰好有k件是不合格品,则事件{X=k}发生的概率为:

其中,m=min{n,M},n≤N,M≤N.称对应的分布列为超几何分布列.如果随机变量X的分布列为超几何分布列,则称随机变量X服从超几何分布(Hypergeometric distribution),记作X~H(N,M,n).

上述这种类型的概率称为超几何概率.对应的超几何分布列如下:

x 0 1 … m P 0n MNM C C C -----11n MNM …C C C nN nN C C C mn m MNM nN

超几何分布概型通常具有以下特点:

a:超几何分布的模型所进行的是不放回抽样;

b:超几何分布中的基本事件都是等可能事件;

c:超几何分布中必定有“正品”和“次品”之分;

在实际解题求概率的时候,首先要做的事情就是判断所求的问题是否为超几何分布的问题,因此,我们可以根据上面的特点进行判断.

比如,我们判断如下的问题是否为超几何分布问题:

(1)一篮球运动员罚球命中率为70%,求他在投篮时命中次数x的分布列.

(2)一个盒子中装有20只红球,5只白球,现在从中无放回抽取3只球,问:抽到白球的概率.

问题(1)显然不是超几何分布问题,因为问题根本不存在“正品”和“次品”之分,更加不存在选多选少的问题.

问题(2)是超几何分布的问题,原因是该问题进行的是不放回抽样,基本事件是等可能事件,并且我们可以将红球看成“正品”,将白球看成“次品”.

2 超几何分布的概率的求解

浙大版的概率论与数理统计书中第一章习题第8题:

在1 500件产品中有400件次品、1 100件正品,任取200件.

(1)求恰好有90件次品的概率.

(2)求至少有2件次品的概率.

解:该问题很显然为超几何分布的问题,因此,可以利用超几何概率的计算公式.

当然,如果利用对立事件的概率计算公式,则我们可以得到简单很多的结论

有部分学生经过思考后得出了P{ X≥2}的如下结论:

他们的解释是,要使得取到的产品中至少有两件为次品只需要在400件次品中先选出两件,这样就可以保证至少取到两件次品,其余198件只需在剩余的1 498件中任意选取即可.

事实上,上面的分析存在如下的问题:

(1)该问题为典型的超几何分布问题,但是,(4)式完全不符合超几何概率的计算公式,完全不能体现“正品”和“次品”之分.

(2)按照上面的思路,我们首先从400件次品中取2件,然后从1 498件中任选198件,可以这样认为,这198件产品中同样可能包含0件,1件,……,198件次品.

现假设这198件产品中有一件次品,因此,我们总共取得了3件次品.但是,这三件次品是首先从400件次品中任取两件,然后再从剩下的398件次品中任取1件,这样的选取方法总共有种,而事实上,从400件次品中任意选取3件的选取方法为种.很显然这两个值不相等,问题就在于为一排列组合问题,而仅仅是组合问题.

因此,可得结论:198件产品中只要包含了次品,则(4)式就说明所选取的次品是包含排列的,是有顺序之分的.

于是有

当然,超几何概率的最终结果的计算不是一件很简单的事情,因为超几何概率公式中包含了阶乘的计算,而整数较大时的阶乘计算超出了一般计算工具的计算范围.所以,通常计算时会按二项分布计算,但是,这会带来较大误差.

另外,我们也可以引入Γ-函数,并利用Matlab,可以较轻松地计算超几何分布的有关参数并能画出设定的曲线,使超几何分布的计算不再麻烦和困难.

3 超几何分布和二项分布的联系和区别

在教学过程中,我们还发现学生不能准确地辨别所要解决的问题是属于超几何分布还是二项分布,学生对这两模型的定义不能很好的理解,一遇到“取”或“摸”的题型,就认为是超几何分布,不加分析,随便滥用公式.

事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别.

超几何分布中必须满足两个条件:

(1)无放回抽样;

(2)产品总数有限.当其中一个条件发生改变,则不再是超几何分布.

当抽取的方式从无放回变为有放回,超几何分布变为二项分布;当产品总数N很大时,超几何分布变为二项分布.

例,在一个口袋中装有10个红球、20个白球,这些球除颜色外完全相同,一次从中摸出5个球,摸到4个红球1个白球就是一等奖,求获一等奖的概率.

本题采用的解法是摸出球中的红球个数X服从超几何分布,但是如果将“一次从中摸出5个球”改为“摸出一球记下颜色,放回后再摸一球,反复5次”,则摸出球中的红球个数X将不再服从超几何分布,而是服从二项分布,我们分别来计算两种分布所对应的概率:

X 0 1 2超几何分布P 0.108759 0.339986 0.339985二项分布P 0.131687 0.329218 0.329218 X 3 4 5超几何分布P 0.159993 0.029472 0.001768二项分布P 0.164609 0.041152 0.004115

从概率分布表中发现,两种分布对应的概率相差不大,现将问题数据改为100个红球、200个白球,其他条件不变,我们获得下面的概率:

X 0 1 2超几何分布P0.129483 0.330314 0.331991二项分布P 0.131687 0.329218 0.329218 X 3 4 5超几何分布P0.164319 0.040048 0.003845二项分布P 0.164609 0.041152 0.004115

这时发现两种不同的分布其对应的概率之间的差距进一步缩小了,我们猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之,超几何分布的极限就是二项分布.

[1]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008.

[2]韩丽娜.超几何分布解读[J].中学生数理化,2010(5)∶6.

[3]邹凤玲.例谈超几何概率和伯努利概型的区别[J].中学教学参考,2010(12)∶52-53.

(责任编辑:于开红)

A Discussion on Teaching of Hypergeometric Probability

ZHAO Yongxiang LI Li
(School of Mathematics and Statistics, Chongqing Three Gorges University, Wanzhou, 404100)

Hypergeometric distribution is an important class of mathematical statistical model which often arises in sampling inspection and the reliability calculation. In solving practical problems, we should first judge whether it is a hypergeometric probability problem based on the characteristics of hypergeometric distribution problems, and then determine whether to use the hypergeometric probability formula. Meanwhile we discuss a misunderstanding on solving hypergeometric probability problem.

random variables; hypergeometric distribution; permutations

O211.1

A

1009-8135(2014)03-0032-03

2014-02-13

赵永祥(1980-),男,湖南衡阳人,重庆三峡学院副教授,主要研究常微分方程数值方法.

重庆三峡学院重点项目(项目编号:11ZD-12)阶段性成果

猜你喜欢
件产品三峡学院二项分布
二项分布与超几何分布的区别与联系
Dose-Dependent,Frequency-Dependent,and Cumulative Effects on Cardiomyocyte Injury and Autophagy of 2.856 GHz and 1.5 GHz Microwave in Wistar Rats
深度剖析超几何分布和二项分布
概率与统计(1)——二项分布与超几何分布
Bone marrow mesenchymal stem cells induce M2 microglia polarization through PDGF-AA/MANF signaling
中国画作品选
艺术大观(2019年33期)2019-10-12 10:38:24
仇强、李雪蓓作品
李雪蓓、关杰作品
二项分布参数的E-Bayes估计及其应用
青葱岁月