鲁和平 孙洪梅
【摘要】本文对2022年高考数学的“概率统计”试题作出了全面深入的分析,对2023年高考数学的“概率统计”试题命题趋势作了初步的估计和预测.按照考思维考素养的原则出发,深刻领会“无情境不出题”“无创新不成题”的精神,编拟了“概率统计”题目,供大家专题复习选用.
【关键词】高考试题;概率统计;情境;创新
12022年高考回顾和2023年高考分析
1.12022年“概率统计”试题特点分析
(1)题型稳定,题量稳定.选填题1—2道,解答题1道,分值17—22分.重点考查了古典概型、排列组合(相邻问题)、正态分布、条件概率、频率直方图、期望、对立事件.
(2)情境真实,立德树人.概率统计融合真实情境,是立德树人的重要考查载体.如全国甲卷第2题的“垃圾分类”;全国乙卷第19题“荒山改造成绿水青山”;新高考Ⅰ卷的“地方性疾病防治与卫生习惯”.
(3)信息量大,综合性强.概率统计试题阅读量大,需要提取信息再对信息加工分析,对学生的综合能力要求高.
1.22022年“概率统计”试题考查问题分析
(1)样本估计总体的思想.主要以频率分布直方图、折线图、雷达图、条形图、饼图等图表为载体,考查学生数据处理、数学运算素养.
(2)随机事件的概率.主要考查的知识点:用频率估计概率,古典概型,条件概率和全概率公式,互斥事件,对立事件,相互独立事件.
(3)随机事件及其分布列.主要考查二项分布、超几何分布、正态分布.
(4)成对数据的统计分析.主要考查成对数据的统计习惯性,一元线性回归模型及其应用,列联表与独立性检验.
1.32022年“概率统计”试题立意分析
(1)立德树人,五育并举,渗透社会主义核心价值观.
(2)考查概率统计的基本思想方法和学科核心素养.
(3)注重生活背景,体现科技创新、中外优秀文化、经济建设成果、跨学科整合,突出数学的应用价值.
1.4结合《中国高考报告2023》[1],2023年“概率统计”命题趋势分析
预计选填题(1—2道)和解答题(1道),总分值为17—22分.
(1)加强基本概念和基本的概率统计思想的考查.
(2)重视学生在复杂情境下,提取数据、分析数据及分析问题与解决问题的能力.
(3)高度重视数学建模、读图识图能力的考查.
(4)注重与函数、导数、不等式、数列等知识的密切融合.
1.52023年高考(重点、难点、热点)透视
重点:(1)古典概率;事件的相互独立性;对立事件、条件概率;全概率公式.
(2)离散型随机变量的分布列;期望与方差.
(3)二项分布;超几何分布;正态分布.
(4)各种统计图表的数据分析.
(5)2×2列联表;独立性检验.
难点:(1)条件概率.
(2)超几何分布与二项分布的关系.
(3)数据分析中平均数、众数、中位数、百分位数的含义及区别.
(3)递推数列型概率;建立函数模型用导数法求解概率问题
热点:(1)古典概率;对立事件;事件和的概率 .
(2)条件概率.
(3)独立性检验.
(4)在复杂情境中分析数据,提出决策依据和风险评估.
22023年高考知识点复习试题
一、选择(1—12为单选,13—18为多选)
1.(本题考查古典概型概率的计算)《周易》是我国古代汉民族思想与智慧的结晶,被誉为“大道之源”.其中的八卦(即乾卦、坤卦、震卦、巽卦、坎卦、离卦、艮卦、兑卦)蕴含深奥的哲理,所谓“太极生两仪(即阴阳),两仪生四象(即少阳,太阳,少阴,太阴),四象演八卦.每卦由3爻自下而上组成,称为3爻卦,爻分阳爻和阴爻,分别用基本符号“”和“”表示:每两卦自下而上叠加为六十四重卦,如由坤卦:和乾卦:自下而上叠加为一重卦:.现从所有的重卦中任取一卦,则其上卦为乾卦且下卦中至多含有一个阴爻的概率是().
A.12B. 18C. 116D. 364
2.(本题考查频率分布直方图的应用)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是().
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B. 该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C. 估计该地农户家庭年收入的平均值不超过6.5万元
D. 估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
3.(本题考查条件概率的计算,二项分布的方差,超几何分布的概率计算)已知袋子中有a個红球和b个蓝球,现从袋子中随机摸球,则下列说法正确的是().
A.每次摸1个球,摸出的球观察颜色后不放回,则第2次摸到红球的概率为ba+b
B. 每次摸1个球,摸出的球观察颜色后不放回,则第1次摸到红球的条件下,第2次摸到红球的概率为a(a-1)(a+b)(a+b-1)
C. 每次摸出1个球,摸出的球观察颜色后放回,连续摸n次后,摸到红球的次数X的方差为naa+b
D. 从中不放回摸n(n≤a)个球,摸到红球的个数x=k的概率是P(X=k)=CkaCn-kbCna+b
4.(本题考查二项分布、正态分布的有关知识)下列命题中,不正确的命题是().
A.已知随机变量X服从二项分布B(n,p),若E(X)=30,D(X)=20,则p=23
B. 已知P(BA)=0.34,P(B)=0.71,则P(BA)=0.37
C. 设随机变量ξ服从正态分布N(0,1),若P(ξ>1)=p,则P(-1<ξ<0)=12-p
D. 某人在10次射击中,击中目标的次数为X,X~B(10,0.8),则当X=8时概率最大
5.(本题考查平均数、方差的性质以及样本数据中的最大值的求法)水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高一年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最大值是().
A.11B.10C.8D. 9
y1y2x1acx2bd6.(本题考查独立性检验)为直观判断两个分类变量X和Y之间是否有关系,若它们的取值分别为{x1,x2}和{y1,y2},通过抽样得到如右表,则下列哪两个比值相差越大,可判断两个分类变量之间的关系应该越强().
A.ab+d与ba+c B. aa+b与cc+d
C. ac+d与ba+bD. aa+d与bb+c
7.(本题考查独立性检验的应用)在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的序号是().
(参考数据:p(χ2≥6.635)=0.01)
A.若χ2的观测值满足χ2≥6.635,我们有99%的把握认为吸烟与患肺病没有关系
B. 若χ2的观测值满足χ2≥6.635,那么在100个吸烟的人中约有99人患有肺病
C. 从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病
D. 从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误
8.(本题考查相关系数、线性回归直线方程等)下列命题中不正确的是().
A.在回归分析中,相关系数r的绝对值越大,两个变量的线性相关性越强
B.对分类变量X与Y,它们的随机变量K2的观测值k越小,说明“X与Y有关系”的把握越大
C.线性回归直线=x+恒过样本中心,
D.在回归分析中,残差平方和越小,模型的拟合效果越好
9.(本题考查超几何分布、古典概型)袋中有6个大小相同的黑球,编号为1,2,3,4,5,6,还有4个同样大小的白球,编号为7,8,9,10,现从中任取4个球,则下列结论中正确的是().
①取出的最大号码X服从超几何分布;
②取出的黑球个数Y服从超几何分布;
③取出2个白球的概率为114;
④若取出一个黑球记2分,取出一个白球记1分,则总得分最大的概率为114.
A.①②B.②④C.③④D.①③④
10.(本题考查条件概率、全概率公式)甲箱中有4个红球,2个白球和3个黑球,乙箱中有3个红球,3个白球和3个黑球,先从甲箱中随机取出一球放入乙箱,分别以A1,A2和A3分别表示由甲箱取出的球是红球、白球和黑球的事件;再从乙箱中随机取出一球,以B表示由乙箱取出的球是红球的事件,则下列结论正确的是().
A.事件B与事件Ai(i=1,2,3)相互独立
B.P(A1B)=845
C.P(B)=13
D.P(A2|B)=431
11.(本题考查数据的数字特征)根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:
①平均数<4;
②平均数<4且极差小于或等于3;
③平均数<4且标准差s≤4;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有().
A.1组B.2组C.3组D.4组
12.(本题考查中位数和方差的定义与应用)第24届冬季奥运会于2022年2月4日至20日在北京举行,中国代表团取得了9枚金牌,4枚银牌,2枚铜牌的历史最好成绩.已知六个裁判为某一运动员这一跳的打分分别为95,95,95,93,94,94,评分规则为去掉六个原始分中的一个最高分和一个最低分,剩下四个有效分的平均数即为该选手的本轮得分.设这六个原始分的中位数为a,方差为s2;四个有效分的中位数为a1,方差为s21.则下列结论正确的是().
A.a≠a1,s21 C.a=a1,s2 13.(本題考查数据的离散程度)下列统计量中,能度量样本x1,x2,…,xn的离散程度的是(). A.样本x1,x2,…,xn的极差 B.样本x1,x2,…,xn的中位数 C.样本x1,x2,…,xn的标准差 D.样本x1+1,x2+1,x3+1,…,xn+1的方差 14.(本题考查线性回归方程的应用)已知由样本数据点集合{(xi,yi)|i=1,2,…,n},求得回归直线方程为=2x-1,且=3,现发现两个数据点(2.2,3.3)和(3.8,6.7)误差较大,去除后重新求得的回归直线l的斜率为1.2,则(). A.变量x与y具有正相关关系 B.去除后的回归方程为=1.2x+1.4 C.去除后y的估计值增加速度变慢 D.去除后相应于样本点(2.5,4)的残差为0.4 15.(本题考查概率的性质)已知事件A,B,C,且P(A)=0.5,P(B)=0.3,则下列结论正确的是(). A.如果P(A∪B∪C)=1,那么P(C)=0.2 B.如果A与B互斥,那么P(A∪B)=0.8,P(AB)=0 C.如果BA,那么P(A∪B)=0.5,P(B|A)=0.6 D.如果A与B相互独立,那么P(A∪B)=0.65,P()=0.35 16.(本题考查独立事件和二项分布)在某独立重复实验中,事件A,B相互独立,且在一次实验中,事件A发生的概率为p,事件B发生的概率为1-p,其中p∈(0,1).若进行n次实验,记事件A发生的次数为X,事件B发生的次数为Y,事件AB发生的次数为Z.则下列说法正确的是(). A.E(X)=E(Y)B.D(X)=D(Y) C.E(Z)=D(X) D.n·D(Z)=D(X)·D(Y) 17.(本题考查均值和方差的计算)已知两组样本数据x1,x2,x3,x4,x5和y1,y2,y3,y4,y5的均值和方差分別为,和s21,s22,若xi+yi=100且xi>yi(i=1,2,3,4,5),则(). A.> B.+=100 C.s21>s22D.s21=s22 18.(本题考查正态分布)已知ξ~N(μ,σ2),则ξ-μσ~N(0,1).某次数学考试满分150分,甲、乙两校各有1000人参加考试,其中甲校成绩X~N(90,302),乙校成绩Y~N(95,202),则(). A.甲校成绩在80分及以下的人数多于乙校 B.乙校成绩在110分及以上的人数少于甲校 C.甲、乙两校成绩在90~95分的人数占比相同 D.甲校成绩在85~95分与乙校成绩在90~100分的人数占比相同 二、填空(1—11为单空,12—16为双空) 1. (本题考查古典概型和排列组合)新冠疫情期间,网上购物成为主流.因保管不善,五个快递ABCDE上送货地址模糊不清,但快递小哥记得这五个快递应分别送去甲乙丙丁戊五个地方,全部送错的概率是. 2. (本题考查分类加法计数原理) 十二生肖是中国特有的文化符号,有着丰富的内涵,它们是成对出现的,分别为鼠和牛、虎和兔、龙和蛇、马和羊、猴和鸡、狗和猪六对.现有十二生肖的吉祥物各一个,按照上面的配对分成六组.甲、乙、丙三位同学依次选一组作为礼物,甲同学喜欢龙和马,乙同学喜欢牛、羊和猴,丙同学喜欢兔、马、狗.如果甲、乙、丙三位同学选取的礼物中均包含自己喜欢的生肖,则不同的选法种数为. 3.(本题考查百分位数和平均数的计算)以下为甲、乙两组按从小到大顺序排列的数据: 甲组:14,30,37,a,41,52,53,55,58,80; 乙组:17,22,32,43,45,49,b,56. 若甲组数据的第40百分位数和乙组数据的平均数相等,则8a-2b=. 4.(本题考查二项式定理)设整数n>4,(x+2y-1)n的展开式中xn-4与xy两项的系数相等,则n的值为 . 5. (本题考查回归直线方程的应用)已知x与y之间的一组数据如表所示: 当m变化时,回归直线=x+必经过定点. 6.(本题考查正态分布曲线的特点以及曲线所表示的意义)现实世界中的很多随机变量遵循正态分布.例如反复测量某一个物理量,其测量误差X通常被认为服从正态分布.若某物理量做n次测量,最后结果的误差,Xn ~N0,2n,则为使|Xn|≥14的概率控制在0.0456以下,至少要测量的次数为. (附:随机变量X~N(μ,σ2),则P(μ-σ<X<μ+σ)=0.6826,P(μ-2σ<X<μ+2σ)=0.9544,P(u-3σ<X<μ+3σ)=0.9974) 7.(本题考查离散型随机变量的分布列、二项分布等)一次抛掷两颗质地均匀的正方体骰子,若出现的点数是2倍关系,则称这次抛掷“漂亮”.规定一次抛掷“漂亮”得分为3,否则得分为-1.若抛掷30次,记累计得分为ξ,则E(ξ)=. 8.(本题考查回归直线方程的应用)某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据(x,y),如下表所示.(残差=观测值-预测值) 根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为. 9.(本题考查正态分布曲线的应用)已知随机变量X服从正态分布N(μ,σ2),有下列四个命题: 甲:P(X>m+1)>P(X 乙:P(X>m)=0.5; 丙:P(X≤m)=0.5; 丁:P(m-1 如果只有一个假命题,则该命题为. 10.(本题考查均值与方差的关系和性质)已知变量X,Y满足回归模型Y=aX2+b+e, E(e)=0,D(e)=σ2,令Z=X2,利用=11,=15的样本数据得到经验回归直线方程=16Z-9,则根据样本数据估计变量X的方差为. 11. (本题考查平均数和方差的公式的运用)已知样本数据x1,x2,…,xn的平均数与方差s2满足如下关系式: s2=∑ni=1(xi-)2n=∑ni=1(x2i)-n·2n. 若已知15个数x1,x2,…,x15的平均数为6,方差为9;现从原15个数中剔除x1,x2,x3,x4,x5这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数x6,x7,…,x15的方差为. 12. (本题考查回归直线方程)在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系) 现已知其线性回归方程为=0.36x+,则=,根据此线性回归方程估计数学得90分的同学的物理成绩为. 13. (本题考查利用频率分布直方图求中位数、平均数)某校从参加学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图2所示,这次测试数学成绩的中位数为(精确到(0.1),这次测试数学成绩的平均数为. 14.(本题考查数据的中位数与标准差的应用问题)已知总体的各个个体的值由小到大依次为3,7,a,b,12,20,且总体的中位数为12,若要使该总体的标准差最小,则a=,b=. 15.(本题考查分层抽样的平均数和方差的计算)某学校为了了解教师职称的年龄分布情况,对全校中级教师和高级教师采用分层抽样的方法进行抽样分析,抽得中级教师的人数为50人,其平均年龄为36岁,方差是2;抽得高級教师的人数为10人,其平均年龄为48岁,方差是8,则估计该校全体中级教师和高级教师年龄的平均数为,方差为. 16.(本题考查全概率和条件概率)有3台车床加工同一型号的零件,第1台加工的次品率为6%,第2,3台加工的次品率均为5%;加工出来的零件混放在一起,且第1,2,3台车床加工的零件数分别占总数的25%,30%,45%.现从加工出来的零件中任取一个零件,则取到的零件是次品的概率为,取到的零件是次品,且是第3台车床加工的概率为. 3解答题 1.(本题考查独立重复事件概率、数学期望、概率中的函数模型、导数法解决概率问题、通过概率计算指导决策)某工厂的某种产品成箱包装,每箱200件,每一件产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中取出20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p(0 (1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0. (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (ⅰ)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX; (ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否对这箱余下的所有产品检验? 2.(本题考查互斥事件的概率、递推数列、数列型概率)棋盘上标有第0,1,2,…,100站,棋子开始时位于第0站,棋手抛掷均匀硬币走跳棋游戏.若抛掷出正面,棋子向前跳出一站;若抛掷出反面,棋子向前跳出两站,直到跳到第99站(胜利大本营)或第100站(失败大本营)时,游戏结束.设棋子跳到第n站的概率为Pn. (1)求P3的值;(2)证明:Pn+1-Pn=-12(Pn-Pn-1)(2≤n≤99);(3)求P99,P100的值. 3.(本题考查独立重复事件的概率、二项分布换元法、基本不等式和二次函数在概率中的运用)某中学为宣传未成年人保护法,特举行一次未成年人保护法知识竞赛,比赛规则是:两人一组,每一轮竞赛中,小组两人分别答两题,若答对题数不少于3题,被称为“优秀小组”,已知甲、乙两位同学组成一组,且同学甲和同学乙答对每道题的概率分别为p1,p2,若p1+p2=65,且每轮竞赛互不影响,如果甲、乙同学在此次竞赛活动中要想获得“优秀小组”的次数为9次,那么理论上至少要进行多少轮竞赛? 4.(本题考查条件概率、二项分布、概率中的不等式模型)某电台举办有奖知识竞赛,选手答题规则相同.选手甲每道题自己有把握独立答对的概率为12,若甲自己没有把握答对,则在规定时间内连线亲友团寻求帮助,其亲友团每道题能答对的概率为p,假设每道题答对与否互不影响. (1)当p=15时, ①若甲答对了某道题,求该题是甲自己答对的概率; ②甲答了4道题,计甲答对题目的个数为随机变量X,求随机变量X的分布列和数学期望E(X). (2)选手乙答对每道题的概率为23(含亲友团),现甲、乙两人各答两个问题,若甲答对题目的个数比乙答对题目的个数多的概率不低于1536,求甲的亲友团每道题答对的概率p的最小值. 5.(本题考查古典概型、分布列、期望、条件概率、概率证明问题)某大学有A,B两个餐厅为学生提供午餐与晚餐服务,甲、乙两位学生每天午餐和晚餐都在学校就餐,近100天选择餐厅就餐情况统计如下: 假设甲、乙选择餐厅相互独立,用频率估计概率. (1)分别估计一天中甲午餐和晚餐都选择A餐厅就餐的概率和乙午餐和晚餐都选择B餐厅就餐的概率; (2)记X为甲、乙在一天中就餐餐厅的个数,求X的分布列和数学期望E(X); (3)假设M表示事件“A餐厅推出优惠套餐”,N表示事件“某学生去A餐厅就餐”,P(M)>0,一般来说在推出优惠套餐的情况下学生去该餐厅的概率会比不推出优惠套餐的情况下去该餐厅就餐的概率要大,证明:P(M|N)>P(M|). 6.(本题考查随机抽样2×2列联表、独立性检验、概率最值问题)我市为了解学生体育运动的时间长度是否与性别因素有关,从某几所学校中随机调查了男、女各100名的平均每天体育运动时间,得到如下数据: 根据学生课余体育运动要求,平均每天体育运动时间在(60,120]内认定为“合格”,否则被认定为“不合格”,其中,平均每天体育运动时间在(90,120]内认定为“良好”. (1)完成下列2×2列联表,并依据α=0.005的独立性检验,分析学生体育运动时间与性别因素无关联: (2)从上述100个女生平均每天体育运动时间在(0,40],(40,60],(60,90],(90,120]的人中用分层抽样的方法抽取20人,再从这20人中随机抽取2人,记X为2人中平均每天体育运动时间为“良好”的人数,求X的分布列及数学期望; (3)从全市学生中随机抽取100人,其中平均每天体育运动时间为“良好”的人数设为ξ,记“平均每天体育运动时间为‘良好的人数为k”的概率为P(ξ=k),视频率为概率,用样本估计总体,求P(ξ=k)的表达式,并求P(ξ=k)取最大值时对应的k的值. 7.(本题考查回归分析、最小二乘法、回归方程、拟合效果)为调查某地区植被覆盖面积x(单位:公顷)和野生动物数量y的关系,某研究小组将该地区等面积划分为200个区块,从中随机抽取20个区块,得到样本数据(xi,yi)(i=1,2,…,20),部分数据如下: 经计算得∑20i=1xi=60,∑20i=1yi=1200, ∑20i=1(xi-)2=80,∑20i=1(xi-)(yi-)=640. (1)利用最小二乘法估计建立y关于x的线性回归方程; (2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系xoy下,横坐标x、纵坐标y的意义与植被覆盖面积x和野生动物数量y一致. (ⅰ)比较前者与后者的斜率大小,并证明; (ⅱ)求这两条直线的公共点坐标. (附:y关于x的回归方程=+x中,斜率和截距的最小二乘估計公式分别为: =∑ni=1(xi-)(yi-)∑ni=1(xi-)2,=-.) 参考答案 一、选择题 1.C;2.C;3.D;4.A;5.B;6.B;7.D;8.B;9.B;10.B;11.B;12.D;13.ACD;14.ABC;15.BCD;16.BC;17.ABD;18.AB. 二、填空题 1. 1130 ;2. 12;3.200;4.51;5.32,5;6.128; 7.-10;8.4.5;9.丁;10.23;11.8;12.40.8,73.2; 13.73.3,72;14.12,12;15.38,23;16.0.0525,37. 三、解答题 略. 参考文献 [1]中国高考报告学术委员会.中国高考报告2023[M].北京:新华出版社,2023. 作者简介 鲁和平(1964—),男,湖北天门人,湖北省特级教师;主要研究高中数学解题方法;主持浙江省教科研规划课题1项,市级教科研规划课题2项;发表论文80余篇. 孙洪梅(1983—),女,山东曲阜人,中学高级教师;主要研究数学课堂教学艺术;发表论文4篇.