二项分布与超几何分布释疑

2020-05-11 05:55王洪军
中学数学杂志(高中版) 2020年2期

[摘要]文章以一个典例的解答所产生的疑惑为起点,对二项分布与超几何分布的区别与联系进行深入剖析,并给出较为详尽的解释,对教师的教学起到积极的促进作用,最后简单阐述了概率统计中总体分布教学的若干思考,

[关键词]二项分布;超几何分布;总体分布;释疑

1呈现题目并阐述疑问的由来

题目为了解甲、乙两厂的产品质量,抽检人员采用分层抽样的方法从甲、乙两厂生产的产品中分别抽取14件和5件,测量产品中微量元素x,y的含量(单位:毫克),当产品中的微量元素含量满足x≥175且y≥75时,该产品为优等品,下表是乙厂的

5件产品的测量数据:

(1)已知甲厂生产的产品共98件,求乙厂生产的产品数量:

(2)用上述样本数据估计乙厂生产的优等品的数量:

(3)从乙厂抽出的上述5件产品中再随机抽取2件,求抽取的2件产品中优等品数x的分布列与数学期望。

分析這道题目的前两问是容易得到的,本文仅探讨第(3)问,下面给出学生解决问题的过程中常见的两种解答。

解法1由题意可知,抽取的5件产品中有2件优等品,则x的可能取值为0.1.2。

产生上述两种解法的原因是好多学生混淆了超几何分布与二项分布,但是学生们还有一个疑惑:为什么两种做法所得到的数学期望是一样的?好多一线教师对此也不甚了解,这难道是巧合吗?

我们不妨设产品中优等品的件数为m,不是优等品的件数为n,则在不放回和有放回的情况下,随机变量x的分布列为

从上述定义中我们可以清楚地看到二者的本质区别:首先,超几何分布描述的是不放回抽样的问题,而二项分布描述的是有放回抽样的问题:其次,超几何分布中的概率计算实质上是古典概型问题,而二项分布实质上是相互独立事件的概率计算问题。

基于上述本质区别,结合篇首题目的情境,我们容易知道解法一是正确的,在教学过程中,教师可以利用教材中的例题及习题引导学生进行深入探究,以便于他们更好地理解和区分这两种分布,我们可以以人教A版教材59页的习题为例作进一步的探讨。

典例某批N件产品的次品率为2%,现从中任意地依次抽取3件进行检验,试问:当Ⅳ=500.5000.50000时,分别以放回和不放回的方式抽取,求恰好抽到1件次品的概率各是多少?

解析任意抽取3件产品,次品的件数记为随机变量x

通过上述问题所得结果我们可以看到,当产品的数量N很大时,通过不放回抽样所得结果与有放回抽样所得结果非常接近(随着Ⅳ的增大,近似的精度也在增大),可以认为超几何分布近似为二项分布,这也与我们的主观感受相符,因为当产品的总数很大而抽出的产品较少时,每次不放回的抽取1件产品后,次品率近似不变,这样就可以近似看成每次抽样的结果是相互独立的,抽出产品中的次品件数近似服从二项分布,这也可以看作是两种分布之问的内在联系。

3概率统计中总体分布教学的若干思考

总体分布教学中的难点之一就是如何辨认合适的模型,所谓分布,它描述的是随机变量的可能取值以及取相应值的概率,现行高中教材中共给出四种分布,其中两点分布、超几何分布和二项分布均属于离散型随机变量服从的分布,它们所对应的模型中都与两种可能结果有关(如掷硬币的“正面”与“反面”,抽取产品的“次品”与“正品”等),因此学生对上述模型认识模糊的话,就会混淆分布类型,教学过程中可以给出具体的情境以便于分清各分布之间的区别与联系,这样会更好地帮助学生做出正确的选择,比如,我们在前面借助典例中提供的情境阐述超几何分布与二项分布的根本区别是抽样的过程中是否有放回,二者的联系是如果产品数量很大,超几何分布近似为二项分布,如果一共就取1件,那么结果不是“正品”就是“次品”,这时二者就是两点分布了,同时,超几何分布的概率计算涉及三个参数和三次的组合运算,而二项分布的概率计算仅含两个参数和一次的组合数计算,所以在计算机技术尚未发展时,利用这两种分布的近似关系可以大大简化运算量,教学过程中要跟学生说清楚这么做的原因,说理充分才会使他们信服。

实际教学中,鉴于学生的认知水平,教师可以免去形式化的推导,适时借助信息技术让学生有更为直观的感受,比如,借助GeoGebra数学软件通过改变产品总数N和次品个数等参数的数值就可以方便快捷地让学生感受到超几何分布与二项分布之间的近似,又如,正态分布属于连续型随机变量服从的分布,学生在理解上难度很大,教学过程中可以运用GeoGebra软件让学生感受它与熟悉的二项分布之间的联系,使得正态分布的引入不是很唐突,并可以组织学生在课外利用软件粗略地验证结论(图1):“当n很大(通常n>50),p不是太小,np>5.且n(1-p)>5时,可以用正态分布N(np,np(1-p))近似二项分布B(n,p)。”

概率统计学家Kapadia和Borovcnik曾经说过:“概率是一个难教又难学的内容,…,在概率统计中,无论是其非常核心的部分,还是它的概念及其比较简单的应用,到处都有似是而非和违背直觉的说法,”正因为如此,在高中阶段的教学过程中,教师需要不断地挖掘合适的情境来讲解相关内容,让学生真实地感受和合理地应用概率统计知识,真正做到以培养学生的数学素养为目的,为学生今后的可持续发展奠定良好的基础。

作者简介王洪军(1983),男,山东省德州市人,中教一级,呼和浩特市名师工作室成员,呼和浩特市教研室数学中心组成员,高中新版教材核心编委(人教B版),获全国、自治区、市教学基本功大赛奖项,参与国家级课题一项,省级课题两项;主要从事中学数学教学研究,在《中学数学教学参考》《中学数学杂志》《中国数学教育》等期刊发表论文37篇,并有多篇论文获国家级、省级一等奖。