马少龙
超几何分布与二项分布模型是人教版选修2—3概率问题的重要模型,教材通过实例,要让学生认识模型所刻画的随机变量的共同特点,并能运用两个模型解决一些实际问题。然而在教学过程中却经常发现学生不能准确辨别是何种概率模型,根源在于学生不能准确地理解概念,超几何分布和二项分布虽然有着密切的联系,但也有明显的区别,事实上,在超几何分布模型上只要稍作改变,超几何分布就可能变为二项分布。其中超几何分布必须同时满足两个条件:一是抽取的产品不再放回;二是产品数目为有限个,当这两个条件中任何一个发生改变,则不再是超几何分布,下面结合例题对这类问题作阐述。
一、准确理解概念
超几何分布的概念是:一般的,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=,k=0,1,2,…,m,其中m=minM,n,且n≤N,M≤N,n,M,N∈N?鄢,如果随机变量X的分布列具有上述形式,则称随机变量X服从超几何分布。而二项分布的概念为:一般的,在n次独立重复试验中,设每次试验中事件A发生的概率为p,用X表示事件A发生的次数,则P(X=k)=Cknpk(1-p)n-k,k=0,1,2,…,n,如果随机变量X的分布列具有上述形式,则称随机变量X服从二项分布。
由以上概念可知,超几何分布与二项分布模型的最主要区别是有放回抽样还是无放回抽样,一般来说,有放回抽样与无放回抽样计算的概率是不一样的,学生在解题时要仔细阅读题意,不要滥用公式。
二、注意超几何分布和二项分布的区别
例1:(1)袋中有大小相同的8个白球、2个黑球,有放回的从中随机地连续抽取3次,每次取1个球。求取到黑球的次数X的分布列;
(2)袋中有大小相同的8个白球、2个黑球,从中随机地取3个球。求取到黑球的个数Y的分布列。
分析:(1)有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型,取到的黑球次数X可能的取值为0,1,2,3。又由于每次取到黑球的概率均为,3次取球可以看成3次独立重复试验,则X~B3。
例2:某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验。现在在总共8小块地中,随机选4小块地种植品种甲,另外4小块种植品种乙。种植完成后随机选出4块地,其中种植品种甲的小地块的数量记为X,求X的分布列与数学期望。
分析:本题容易错误的得到X服从二项分布,即X~B(4,)。错误的根源在于每块地种植甲或种植乙不是相互独立的,它们之间相互制约,无论怎样种植都要保证8块地中有4块种植甲,4块种植乙,事实上X是服从超几何分布。若将例2改为:在8块地中,每块地要么种植甲,要么种植乙,那么在选出的4块地中种植甲的数量为ξ,则ξ服从二项分布,即ξ~B(4,)。二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。所以,在解有关二项分布和超几何分布问题时,要仔细阅读、辨析题目条件。
三、注意超几何分布和二项分布的联系
事实上,超几何分布和二项分布有着密切的联系,样本个数越大,超几何分布和二项分布的对应概率相差越小,也就是说:样本数量较大时,不放回抽样与放回抽样的差别不大,一般认为是独立重复试验。
例3:随机观测生产某种零件的某特大型工厂的25名工人日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36。
(1)确定样本频率分布表中n1,n2,f1和f2的值;
(2)根据上述频率分布表,画出样本频率分布直方图;
(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.
分析:(3)题意是:“某特大型工厂”,即工人很多,根据样本频率分布表,每人的日加工零件数落在区间(30,35]的概率为■,设所取的4人中,日加工零件数落在区间(30,35]的人数为随机变量ξ,则ξ~B(4,),故4人中,至少有1人的日加工零件数落在区间(30,35]的概率为:P(ξ≥1)=1-P(ξ=0)=1-1-4=1-0.4096=0.5904。
所以4人中,至少有人的日加工零件数落在区间(30,35]的概率约为0.5904。
点评:当总体的容量非常大时,超几何分布近似于二项分布。所以,在处理超几何分布与二项分布相关问题时一定要仔细阅读题目,辨析概念,准确区分。
(作者单位:广东省汕头市实验学校)