袁海军 徐诗佳
概率统计知识应用广泛,它不仅是高中数学占有课时最多的一个知识板块,更是高考考查学生应用意识和应用能力经久不衰的一大热点. 最近几年全国卷将概率与统计视为一个有机联系的整体,以当前社会热点应用问题为切入点,与其它知识紧密联系组织试题素材,重点考查考生的数学运算、数据分析、逻辑推理、数学建模等数学核心素养. 该部分的命题点多,命题背景广阔,概率统计在全国卷高考考查中一般有如下情形:一道选择题和一道解答题,共2道题,分值为17分. 近5年来全国卷(理科)考题如下表:
■
可见高考对这一部分的考查难度相对稳定,考选择题时, 难度偏易;解答题通常在第18、19题的位置,难度适中,只有在2019年全国?玉卷将它作为解答题的压轴题,加大难度,需要引起重视. 高考对概率统计的考查主要是基本概念、基本公式的理解和应用以及运算求解能力和数据处理能力. 考点主要有两类:一类是以排列组合、二项式定理,古典概型和几何概型,离散型随机变量的分布列及数学期望的概率计算问题. 另一类是以抽樣方法、样本的频率分布、样本数字特征,统计图表,回归方程,独立性检验为主的统计案例问题. 那么在2020年高考中,有关概率与统计的哪些考点最值得关注呢?本文预测如下,仅供考生们参考.
考点一、考查以排列、组合运算为主的古典概型
预测题1.1 一个袋中装有10个不同的球,其中有2个红球,8个白球,从中任取2球,问取到1红1白的两个球的概率为( )
A. ■ B. ■ C. ■ D. ■
解析:方法1:记A=“取到1红1白的两个球”,则P(A)=■=■.
方法2: 记B=“取到1红1白的两个球”,则P(B)=■=■,故选B.
预测题1.2 袋子里有3颗白球,4颗黑球,5颗红球,由甲,乙,丙三人依次各抽取一个球,抽取后不放回,若每颗球被抽到的机会都相等,则甲,乙,丙三人所得之球颜色互异的概率是( )
A. ■ B. ■ C. ■ D. ■
解析:方法1:事件?赘为“不放回地抽取3个球”,则n(?赘)=■,基本事件为甲,乙,丙拿球的各种情况,且将这些球均视为不同元素. 设所求事件“甲,乙,丙三人所得之球颜色互异”为事件A,则先要从白球黑球红球中各取一个(■·■·■),再分给三个人(三个元素全排列),所以n(A)=■·■·■·■,从而P(A)=■=■,故选D.
点评:解答有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件个数,这里常用到计数原理与排列、组合的相关知识. 此类题需对“分次取球”与“一次取球”的概念要搞清楚,在同一题中要按照统一有序或统一无序的方法求解,切不可模棱两可,相互混淆,如预测题1.1很容易错选A.
考点二、考查以传统数学文化为载体的概率问题
预测题2.1 “石头、剪刀、布”,又称“猜丁壳”,是一种流传多年的猜拳游戏,起源于中国,然后传到日本、朝鲜等地,随着亚欧贸易的不断发展,它传到了欧洲,到了近代逐渐风靡世界. 其游戏规则是:“石头”胜“剪刀”、“剪刀”胜“布”、而“布”又胜过“石头”. 若所出的拳相同,则为和局. 小明和小华两位同学进行“五局三胜制”的“石头、剪刀、布”游戏比赛,则小华获胜的概率是( )
A. ■ B. ■ C. ■ D. ■
解析:根据“石头”胜“剪刀”,“剪刀”胜“布”,而“布”又胜“石头”,可得每局比赛中小华胜小明、小华与小明和局和小华输给小明的概率都为■,小华获胜有三种情况:
①小华连胜三局,概率为P1=(■)3=■,
②小华前三局中两胜另一局不胜,第三局小华胜,概率为:
P2=■·(■)2(■)1(■)1=■,
②小华前四局中两胜,另两局不胜,第五局小华胜,概率为:
P3=■·(■)2(■)2(■)1=■,
∴小华获胜的概率是P=P1+P2+P3=■+■+■=■, 故选D.
预测题2.2 赵爽是我国古代数学家、天文学家,大约在公元222年,赵爽为《周碑算经》一书作序时,介绍了“勾股圆方图”,亦称“赵爽弦图”(以弦为边长得到的正方形是由4个全等的直角三角形再加上中间的一个小正方形组成的). 类比“赵爽弦图”,可类似地构造如图所示的图形,它是由3个全等的三角形与中间的一个小等边三角形拼成的一个大等边三角形,设AD=2BD,若在大等边三角形中随机取一点,则此点取自小等边三角形的概率是( )
A. ■ B. ■ C. ■ D. ■
解析:设BD=x,根据余弦定理表示出AB,分别求得SABC·SDEF,根据几何概型中概率计算公式可求.
设BD=x,因为△ABC是由3个全等的三角形与中间的等边三角形构成.
所以AD=2x,∠ADB=120°.
由余弦定理可知AB2=AD2+BD2-2AD·BDcos120°.
代入可得AB2=(2x)2+x2-2×2x·xcos120°,化简得AB2=7x2.
由三角形面积公式可得S△ABC=■AB2=■同理S△DEF=■BD2=■.
所以由几何概型面积类型的概率可得■=■=■,所以选A.
点评:纵观近几年高考,以数学文化为背景的概率统计题,层出不穷,让人耳目一新. 以上两道预测题均以此为情境各设计了一道关于古典概型和几何概型方面的试题,此类题需要考生认真审题,重视阅读,快速抓住解决问题的关键,提升考生数据分析处理能力. 同时也引导师生重视我国传统文化的学习,进而加深对传统数学文化的理解,关注生活中的数学问题,增强数学的应用意识,发展数学核心素养.
考点三、考查总体特征的估计、离散型随机变量的分布列和数学期望
预测题3.1 某市为准备参加省中学生运动会,对本市甲,乙两个田径队的所有跳高运动员进行了测试,用茎叶图表示出甲,乙两队运动员本次测试的成绩(单位:cm,且均为整数),同时对全体运动员的成绩绘制了频率分布直方图,跳高成绩在185cm以上(包括185cm)定义为“优秀”,由于某些原因,茎叶图中乙队的部分数据丢失,但已知所有运动员中成绩在190cm以上(包括190cm)的只有两个人,且均在甲队.
(1)求甲,乙两队运动员的总人数a及乙队中成绩在[160, 170)(单位:cm)内的运动员人数b.
(2)在甲,乙两队所有成绩在180cm以上的运动员中随机选取2人,已知至少有1人成绩为“优秀”,求两人成绩均“优秀”的概率.
(3)在甲,乙两队中所有的成绩为“优秀”的运动员中随机选取2人参加省中学生运动会正式比赛,求所选取运动员中来自甲隊的人数的分布列及期望.
解析:(1)分析:本小问抓好入手点的关键是明确两个统计图的作用,茎叶图所给的数据为甲,乙两队的成绩,但乙队有残缺,所以很难从茎叶图上得到全体运动员的人数. 在频率分布直方图中,所呈现的是所有运动员成绩的分布(但不区分甲,乙队),由此可明确要确定全体运动员的人数,需要通过直方图,要确定各队的情况,则需要茎叶图. 要补齐乙队的数据,则两个图要结合着看. 在第(1)问中,可以以190cm以上的人数为突破口,通过频率直方图可知190cm以上所占的频率为0.005×10=0.05,而190cm以上只有2人,从而得到全体人数,然后再根据频率直方图得到[160,170)的人数,减去甲队的人数即为b.
解:由频率直方图可知:
成绩在以190cm以上的运动员的频率为0.005×10=0.05,
所以全体运动馆总人数a=■=40(人).
∴成绩位于[160,170)中运动员的频率为0.03×10=0.3,人数为40×0.3=12.
由茎叶图可知:甲队成绩在[160,170)的运动员有3名,
∴ b=12-3=9(人).
(2)分析:通过频率直方图可知180cm以上运动员总数为:(0.020+0.005)×10×40=10(人),结合茎叶图可知乙在180cm以上不缺数据. 题目所求的是条件概率,所以可想到公式P(B|A)=■,分别求出“至少有1人成绩为‘优秀”和“两人成绩均‘优秀”的概率,然后再代入计算即可.
解:由频率直方图可得:180cm以上运动员总数为:(0.020+0.005)×10×40=10.
由茎叶图可得,甲乙队180cm以上人数恰好10人,且优秀的人数为6人,
∴乙在这部分数据不缺失.
设事件A为“至少有1人成绩优秀”,事件B为“两人成绩均优秀”,
∴ P(A)=1-P(■)=1-■=■.
P(AB)=■=■,∴ P(B|A)=■=■·■=■.
(3)分析:由(2)及茎叶图可得:在优秀的6名运动员中,甲占了4名,乙占了2名,依题意可知X的取值为0, 1, 2,且X符合超几何分布,进而可按公式进行概率的计算.
解:由(2)可得:甲有4名优秀队员,乙有2名优秀队员X可取的值为0,1,2,
∴P(X=0)=■=■,P(X=1)=■=■,
P(X=2)=■=■=■.
X的分布列为:
∴ EX=0×■+1×■+2×■=■.
点评:本题“一题两图”,难度虽然不大,综合性却很强,将茎叶图、频率分布直方图相结合,综合考查样本估计总体的应用,以及条件概率的计算和离散型随机变量的分布列和数学期望,重点考查考生读图识图及应用意识,强化学生的阅读理解及数据处理能力.
考点四、借助频率分布直方图,考查样本数字特征的计算,正态分布的概念和性质,以及它在决策中的应用
预测题4.1 某市提出教育强市,为了了解高三数学复习备考情况,该市教育局组织了一次检测考试,并随机抽取了部分高三理科学生数学成绩绘制如图1所示的频率分布直方图.
(Ⅰ)根据频率分布直方图,估计该市此次检测理科数学的平均成绩u0;(精确到个位)
(Ⅱ)研究发现,本次检测的理科数学成绩X近似服从正态分布X~N(u,?滓2)(u=u0,?滓约为19.3).
①按以往的统计数据,理科数学成绩能达到升一本分数要求的同学约占46%,据此估计本次检测成绩达到升一本的理科数学成绩大约是多少分?(精确到个位)
②已知该市理科考生约有10000名,某理科学生此次检测数学成绩为107分,则该学生在全市排名大约是多少名?
(说明:P(x>x1)=1-?覬(■)表示x>x1的概率,?覬(■)用来将非标准正态分布化为标准正态分布,即X~N(0,1),从而利用标准正态分布表?覬(x0),求x>x1时的概率P(x>x1),这里x0=■. 相应于x0 的值?覬(x0)是指总体取值小于x0 的概率,即?覬(x0)=P(x 参考数据:?覬(0.7045)=0.54,?覬(0.6772)=0.46,?覬(0.2072)=0.5832). 解析:(Ⅰ)该市此次检测理科数学成绩平均成绩约为: u0=65×0.05+75×0.08+85×0.12+95×0.15+105×0.24+115×0.18+125×0.1+135×0.05+145×0.03=103.2≈103. (Ⅱ)①记本次考试成绩达到升一本的理科数学成绩约为x1, 根據题意,P(x>x1)=1-?覬(■)=1-?覬(■)=0.46, 即?覬(■)=0.54. 由?覬(0.7045)=0.54,得■=0.7054?圯x1=116.6≈117, 所以,本次考试成绩达到升一本的理科数学成绩约为117分. ②P(x>107)=1-?覬(■)=1-?覬(0.2072)≈1-0.5832=0.4168, 所以,理科数学成绩为107分,大约排在10000×0.4168=4168名. 点评:本题将必修3的用样本估计总体和选修2-3的正态分布“融为一体”,着力考查考生的运算求解能力和分析问题解决问题的能力. 解决正态分布问题有三个关键点:(1)对称轴x=μ;(2)标准差σ;(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率. 注意只有在标准正态分布下对称轴才为x=0. 考点五、考查独立性检验思想的理解和应用 预测题5.1 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表: ■ 附: ■ 已知在全部105人中随机抽取1人,成绩优秀的概率为■,则下列说法正确的是( ) A. 列联表中c的值为30,b的值为35 B. 列联表中c的值为15,b的值为50 C. 根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系” D. 根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系” 解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误. 根据列联表中的数据,得到K2=■≈6.109>5.024, 因此有97.5%的把握认为“成绩与班级有关系”,故选C. 点评:在统计案例的独立性检验应用时需重点掌握以下几个知识点: (1)比较几个分类变量有关联的可能性大小的方法 ①通过计算K2的大小判断:K2越大,两变量有关联的可能性越大. ②通过计算 | ad-bc | 的大小判断:| ad-bc | 越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤: ①根据样本数据制成2×2列联表. ②根据公式K2=■计算K2的观测值k. ③比较k与临界值的大小关系,作统计推断. 考点六、考查线性回归分析思想的理解和应用 预测题6.1 某市农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温度与实验室每天每100颗种子中的发芽数,得到如下数据: ■ 由表中根据12月2日至12月4日的数据,求的线性回归方程■=■x+■中的■=3,则■为______,若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过1颗,则认为得到的线性回归方程是可靠的,则求得的线性回归方程_________.(填“可靠”或“不可靠”) 解析:(1)由题得■=■=12,■=■=28, 可得:样本中心点为(12,28),所以28=3×12+■, 所以 ■=-8. 所以 ■=3x-8. (2)由题得■=3x-8. 分别将以上数据代入,得其差值均没有超过1,所以求得的线性回归方程可靠. 故答案为:(1) ■=-8.(2)可靠. 点评:线性回归分析问题的类型及解题方法 (1)求线性回归方程:①利用公式,求出回归系数b, a. ②待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b. (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强. 预测题6.2 某重点中学最近十年录取985大学的学生人数逐年上升,下表是部分统计数据: ■ (1)利用所给数据求年录取人数与年份之间的线性回归方程■=■x+■; (2)利用(1)中所求出的线性回归方程预测该校2020年的录取985大学的学生人数. 解析:(1)由所给数据看出,年录取人数与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表. ■ 对处理的数据,容易算得■=0,■=3.2,则代入公式可得: b=■=6.5,a=■-b■=3.2, 由上述计算结果,知所求线性回归方程为:y=6.5(x-2014)+260.2. (2)利用所求得的线性回归方程,可预测2020年的录取人数大约为: y=6.5(2020-2014)+260.2=299.2≈299. 点评:回归分析是处理变量相关关系的一种数学方法. 主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程并进行预测. 例如此题在求回归直线方程时进行了适当的转化,优化计算,这都需要考生在平时做题认真总结,积累方法技巧. 总之,在高考复习中,要切实掌握概率统计的知识脉络,理清概率统计公式定理的来龙去脉,重视文字阅读和数据处理方面的训练,关注数学思想方法的渗透,增强学生的数学应用意识.在解答时要强调认真审题,书写规范,减少粗心与疏漏,不断提高计算能力,考前还要重视对新题型的研究,在高考中以不变应万变. (本文系福建省第三批高中数学课程基地校建设项目“‘三教教学培育数学核心素养的探索与实践”(立项批准号:MJYKT2018-054)研究成果之一) 责任编辑 徐国坚