新疆维吾尔自治区乌鲁木齐市第八中学(830002) 李昌成
普通高中课程标准实验教科书A 版数学选修2-3 的第2.1 节介绍了超几何分布,第2.2 节介绍了二项分布.这两个内容分节学习时,学生掌握得还行,但是混合出题就有少数学生难以分辨.近期乌鲁木齐地区按照《普通高中课程标准》和2019年版《考试大纲》的要求,进行了规范的高三年级质量检测考试,概率统计方面的解答题就是关于二项分布方向的.在学校网络数据平台上我们发现了严峻的问题.
题目某调查机构对某校学生做了一个是否同意父母生“二孩”的抽样调查,该调查机构从该校随机抽查了100 名不同性别的学生,调查统计他们是否同意父母生“二孩”,现已得知100 人中同意父母生“二孩”的占60%,统计情况如下表:
同意不同意合计男生a 50女生40 d合计100
(I) 求a,d 的值,根据以上数据,能否有97.5%的把握认为是否同意父母生“二孩”与性别有关? 请说明理由;
(II) 将上述调查所得的频率视为概率,现在从所有学生中, 采取随机抽样的方法抽取4 位学生进行长期跟踪调查,记被抽取的4 位学生中持“同意”态度的人数为X,求X 的分布列及数学期望.
P(K2 ≥k0)0.15 0.100 0.050 0.025 0.010 k0 2.072 2.706 3.841 5.024 6.635
分析本题以近年来有关人口方面的热门话题为背景,考查概率统计部分的独立性检验和二项分布,同时考查学生的数学建模、数据分析、数学运算等核心素养.这个背景学生并不陌生,甚至是亲历者.题目出得不偏不倚,学生上手容易,数据也不复杂,得分率应该在0.85 以上.
《普通高中课程标准》和2019 版《考试大纲》对二项分布要求达到“理解”水平.我们在教学中也予以了高度重视.拿到考题,我还有一种窃喜——押中考题了! 但是阅卷结束后,在学校网络数据平台上一浏览才发现,第二问居然得分率低于0.5,仅仅0.46,我有些失望,比期望值低了不少.知道这个结果后,我就在思考学生的问题在哪里呢?
与此同时,没得分的学生也很忧郁,甚至怀疑老师阅卷不认真.答案明明是对的,为什么不给分呢? 几个胆大的学生到办公室找我论过理,听起来还是蛮有道理的,思维是“缜密”的,运算是仔细的,最终结果也是“正确”的.在和一个一个学生交流过程中,我发现学生最大的困难是不知道如何判断一个随机变量的分布列是二项分布还是超几何分布? 为了给困惑的学生们一个完整、及时、正确、全面的答复,我重温了教科书,查阅了近十年高考题,翻阅了数学专业杂志等资料,希望能帮助学生明白数据背后的真相——二项分布和超几何分布的联系和区别以及如何辨认两个分布列.现整理如下,以飨读者.
(I) 因为100 人中同意父母生“二孩”的占60%,所以a = 60 - 40 = 20, d = 40 - 5 = 35.易得而所以有97.5 % 的把握认为是否同意父母生“二孩”与性别有关.
X 0 1 2 3 4 P 16 625 96 625 216 625 216 625 81 625
(I) 同上.
(II) 随机变量X 的所有可能取值为0,1,2,3,4.P(X =所以随机变量X 的分布列为
X 0 1 2 3 4 P 54834 2352735 71136 470547 55224 156849 54752 156849 97527 784245
这个解答仅从数值方面看没问题,但是没得分.下面对疑问进行剖析.
细究学生的解答过程发现,虽然答案相同,但是模型的判断截然不同,命题专家设置是二项分布,学生误判为超几何分布了.下面谈谈二项分布与超几何分布的关系,将问题彻底地弄明白.
1.定义不同:
人民教育出版社A 版《数学》选修2-3 给出的二项分布和超几何分布定义分别是:
一般地, 在n 次独立重复试验中, 用X 表示事件A发生的次数, 设每次试验中事件A 发生的概率为p, 则此时称随机变量X 服从二项分布,记作X ~B(n,p),并称p 为成功概率.
一般地, 在含有M 件次品的N 件产品中, 任取n 件,其中恰好有X 件次品, 则0,1,2··· ,m, 其中m = min{M,n} 且n ≤ N,M ≤N,n,M,N ∈N∗则称随机变量X 服从超几何分布.
2.随机试验不同:二项分布中的试验是重复试验;超几何分布中的试验是古典概型的随机试验.
3.抽样方法不同:二项分布中用的是有放回抽样;超几何分布中用的是不放回抽样.
4.随机变量X 含义不同:二项分布中X 表示n 次独立重复试验成功的次数;超几何分布中X 表示从N 件产品中抽取n 件产品,其中次品件数.
5.随机变量X 的概率计算公式不同:
6.随机变量X 的期望表示形式不同,本质相同:二项分布中E(X) = np;超几何分布中(此式教材未做要求,下文给出证明).
7.二项分布中有概率常数(成功概率p);超几何分布中没有概率常数.本题中有两次二项分布暗示:一是“100 人中同意父母生“二孩”的占60%”,即p = 0.6;二是“将上述调查所得的频率视为概率”.
事实上,当样本的容量越大(参考答案提到了),二项分布和超几何分布对应的概率就越接近,当样本的个数无穷大时,二项分布和超几何分布对应的概率就相等,也就是说,超几何分布的极限就是二项分布.假设产品个数N 无穷大,且次品率为p,即这说明,当样本个数无限多时,有放回抽样与无放回抽样没有本质区别,都可以看成n 次独立重复试验,所以超几何分布在一定条件下可以转换成二项分布,转换条件为:产品数量无限多,否则不放回抽样不能看成n 次独立重复试验;在产品个数N 无限增加的过程中,次品数也应该按照相应的比例增大,即次品率p 保持相对稳定.
结论超几何分布的数学期望和二项分布的数学期望相等.
注意到,
为了使学生不再犯类似错误,非常有必要研究如何判断一个随机试验是服从超几何分布还是二项分布.
1.在每一次试验中,事件发生的概率相同.
2.各次试验中的事件是相互独立的.
3.在每一次试验中,试验的结果只有两个,即发生不发生.
1.每次试验是在“两”类元素中取元素.
2.不放回抽样.
例1(2017年全国II 卷理科第13 题)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100 次.X 表示抽到的二等品件数,则DX =____.
分析依据题设中“一批产品”“二等品率”“有放回”“二等品率为0.02”等信息可以准确判断随机变量X服从二项分布.
例2(2015年湖南卷理科第18 题)某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖,每次抽奖都是从装有4 个红球、6 个白球的甲箱和装有5 个红球、5 个白球的乙箱中,各随机摸出1 个球,在摸出的2 个球中,若都是红球,则获一等奖;若只有1 个红球,则获二等奖;若没有红球,则不获奖.
(I) 求顾客抽奖1 次能获奖的概率.
(II) 若某顾客有3 次抽奖机会,记该顾客在3 次抽奖中获一等奖的次数为X,求X 的分布列和数学期望.
分析依据已知中“每次抽奖都是从装有4 个红球、6 个白球的甲箱和装有5 个红球、5 个白球的乙箱中,各随机摸出1 个球”可以得出成功概率由此可以判断X 服从二项分布.
例3(2015年四川高考卷理科第17 题)某市A,B 两所中学的学生组队参加辩论赛,A 中学推荐了3 名男生、2 名女生,B 中学推荐了3 名男生、4 名女生,两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3 人、女生中随机抽取3 人组成代表队.
(I) 求A 中学至少有1 名学生入选代表队的概率;
(II) 某场比赛前,从代表队的6 名队员中随机抽取4 人参赛.设X 表示参赛的男生人数,求X 的分布列和数学期望.
分析本题中针对“男女参赛队员”“男生人数”表明问题是在“两”类元素中取元素,且为不放回抽样,可以判断X服从超几何分布.
例4(2017年山东卷理科第18 题)在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响, 具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示.通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6 名男志愿者A1,A2,A3,A4,A5,A6和4 名女自愿者B1,B2,B3,B4,从中随机抽取5 人接受甲种心理暗示,另外5 人接受乙种心理暗示.
(I) 求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率.
(II) 用X 表示接受乙种心理暗示的女志愿者人数,求X的分布列和数学期望E(X).
分析本题与例3 比较,有较强相似性,只是问题背景不同而已.题中“两种心理暗示”“女志愿者人数”都表明问题是在“两”类元素中取元素,且为不放回抽样,可以判断X 服从超几何分布.
认真学习教材给出的定义,尤其要理解每一个字母的含义,每一个符号的作用.牢牢把握定义的精髓.
人民教育出版社A 版《数学》选修2-3 第59 页B 组第3题以及对应的教师教学用书第63 页内容.尤其是“说明”非常重要,内容如下:由于数字比较大,可以利用计算机或计算器进行数值计算.另外,本题目也可以帮助学生了解超几何分布和二项分布之间的关系:
第一,n 次试验中,某一事件A 出现的次数X 可能服从超几何分布或二项分布.当这n 次试验是独立重复试验时,X 服从二项分布;当这n 次试验是不放回摸球问题,事件A为摸到某种特性(如某种颜色)的球时,X 服从超几何分布.
第二,在不放回n 次摸球试验中,摸到某种顔色球的次数X 服从超几何分布.但是当袋子中的球的数目N 很大时,X 的分布列近似于二项分布,并且随着N 的增加,这种近似的精度也增加.
从教学实战经验看,概率统计问题具有较强的创新性和应用性,是数学建模核心素养的实际考查点位.对学生来说,这是一个复杂而艰巨的问题,必须静待“顿悟”从“渐悟”中来,不可急于求成.分类训练是一个行之有效的办法,首先训练超几何分布,再训练二项分布,再混合训练.教学中务必做好三件事:一是读懂题,即应花相当的时间去阅读、处理文字图表信息、准确把握题意;二是选择模型,确保审题无误,方向正确.在概念的指导下慢慢地“悟”,何为二项分布,何为超几何分布;三是算对数值,这是学生的一个痛,经常是认认真真地算出一个错误答案.在教学中,我们要敢于在课堂上给学生时间,现场限时训练,提高速度和准确率.最终达到提高学生核心素养的目的.
练习1(2015年天津卷理科第16 题)为推动乒乓球运动的发展, 某乒乓球比赛允许不同协会的运动员组队参加.现有来自甲协会的运动员3 名,其中种子选手2 名;乙协会的运动员5 名,其中种子选手3 名.从这8 名运动员中随机选择4 人参加比赛.
(I) 略;(II) 设X 为选出的4 人中种子选手的人数,求随机变量X 的分布列和数学期望E(X).(提示:超几何分布.)
练习2(2014年福建高考卷理科第18 题)为回馈顾客,某商场拟通过摸球兑奖的方式对1000 位顾客进行奖励,规定:每位顾客从一个装有4 个标有面值的球的袋中一次性随机摸出2 个球,球上所标面值之和为顾客所获的奖励额.
(I) 若袋中所装的4 个球中有1 个所标的面值为50 元,其余3 个均为10 元,求:①略; ②顾客所获的奖励额的分布列及数学期望.(提示:超几何分布.)
练习3(2012 四川卷理科第17 题)某居民小区有两个相互独立的安全防范系统(简称系统)A 和B,系统A 和系统B 在任意时刻发生故障的概率分别为和p.
(I) 略;(II) 设系统A 在三次相互独立的检测中不发生故障的次数为随机变量ξ,求随机变量ξ 的分布列和数学期望Eξ.(提示:二项分布.)
练习4(2019年新疆自治区二模理科第19 题)今年学雷锋日,乌鲁木齐市某中学计划从高中三个年级选派4 名教师和若干名学生去当学雷锋文明交通宣传志愿者,用分层抽样法从高中三个年级的相关人员中抽取若干人组成文明交通宣传小组,学生的选派情况如下:
年级相关人数抽取人数高一99 x高二27 y高三18 2
(I) 略;(II) 略;(III) 若4 名教师可去A、B、C 三个学雷锋文明交通宣传点进行文明交通宣传,其中每名教师去A、B、C 三个文明交通宣传点是等可能的,且各位教师的选择相互独立.记到文明交通宣传点A 的人数为X,求随机变量X的分布列和数学期望.(提示:二项分布.)
在老师的指导下,让学生掌握二项分布和超几何分布的概念,理清二者的区别和联系,真正掌握二者的本质,学懂弄通,再在练习中提高认识,强化概念,可谓是“授之以渔”,我们可以杜绝“授之以鱼”,就题讲题,真正提高复习备考的实效性.
统计发现,近几年来,地方卷多次反复考查了二项分布和超几何分布.在解答题层面全国卷已经考查了函数背景下的统计概率问题(连续3年);回归方程(两次);独立性检验;茎叶图背景下的概率统计; 不计算的论述题(两次); 相关系数;正态分布.但全国卷还未考查二项分布和超几何分布,这值得我们在教学中留心注意.