概率统计问题是近几年高考的重点和热点之一.概率统计试题作为解答题之一的出现,已经成为高考命题的共识.对于概率与统计在考查要求上有所提高,反映在试卷中,对其的考查是趋于逐年加强和深化的,并且考查方式也不断推新.高考对排列组合以及二项式定理的考查,往往以填空题或者选择题为主,题小而灵活;高考对概率的考查,往往以实际应用题出现,它既考查逻辑思维能力,又考查运算能力,也符合高考发展的方向;有关统计的实际应用问题,主要考查对一些基本概念、基本方法的理解和掌握,属于基础题.
■
随机抽样
【考纲要求】 理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.
【考纲解读】 考纲中尽管对“分层抽样方法与系统抽样方法”是了解的层面,但是分层抽样一直是高考试题中的一个重要考点,年年必考,因此应定位在理解.
【经典例题】 1. 某学校有教师150人,其中高级教师15人,中级教师45人,初级教师90人. 现按职称分层抽样选出30名教师参加教工代表大会,则选出的高级、中级、初级教师的人数分别为( )
A. 5,10,15?摇?摇 B. 3,9,18
C. 3,10,17?摇?摇?摇?摇D. 5,9,16
2. 高三(1)班共有56人,学生编号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知编号为6,34,48的同学在样本中,那么还有一位同学的编号应为_______.
命题意图 简单随机抽样、分层抽样、系统抽样是比较典型与常用的方法,虽然它们在高考中要求不高,但要明确这三种基本抽样方法的特点,并能熟练掌握其操作方法. 本例主要考查我们对抽样方法掌握的程度,考查实际应用能力.
思路分析 1. 根据分层抽样的意义,将总体分成几个部分,然后按各部分所占的比例进行抽样,因此本题可以根据抽样比,得到所要抽取的人数.
2. 由系统抽样的意义知,它是一种等距抽样,确定初始号后,样本的编号组成等差数列.
完美解答 1. 因为抽样比为■=■,所以选出的高及、中级、初级教师的人数分别为15×■=3,45×■=9,90×■=18,故选B.
2. 由系统抽样的意义及题意可知,6就是初始号,公差为48-34=14,所以还有一位同的编号为6+14=20.
【命题趋势】 预计高考主要仍以应用题为背景,题型以选择题、填空题呈现为主,难度不大,主要考查简单随机抽样、分层抽样、系统抽样的计算以及这三种抽样的区别,由于分层抽样相对来说比较显性,因此在高考命题中会特别加以关注.
用样本估计总体
【考纲要求】 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释;会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
【考纲解读】 考纲中明确要求:考生能对数据进行整理、分析,并解决给定的实际问题. 这说明了对样本估计总体的要求已提升到能力的高度. 但是,由于高中学生的认知水平和生活经历还相对不是很高,故所命制的样本估计总体相关问题一般来说都相对比较简单,主要考查其中的统计图表和数字特征.
【经典例题】 1. 图1是样本容量为200的频率分布直方图,根据样本的频率分布直方图估计,下列说法正确的是( )
■
图1
A. 样本数据落在[6,10)内的频数为64,数据落在[2,10)内的概率约为0.4
B. 样本数据落在[6,10)内的频数为16,数据落在[2,10)内的概率约为0.1
C. 样本数据落在[10,14)内的频数为18,数据落在[6,14)内的概率约为0.68
D. 样本数据落在[14,22)内的频数为48,数据落在[10,18)内的概率约为0.12
2. 某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,分别测出它们的高度如下(单位:cm),
甲:19?摇20?摇21?摇23?摇25?摇29?摇32?摇33?摇37?摇41
乙:10?摇26?摇30?摇30?摇34?摇37?摇44?摇46?摇46?摇47
(1)用茎叶图表示上述两组数据,并对两块地抽取树苗的高度的平均数和中位数进行比较,写出两个统计结论;
■
(2)绿化部门分配这20株树苗的栽种任务,小王在株高大于40 cm的5株树苗中随机选种2株,则小王没有选到甲苗圃树苗的概率是多少?
命题意图 1. 本题考查了统计中的基本方法思想,要求从直方图中对样本进行估计,考查识图、用图的有关技能.
2. 本题要求能从所给的数据进行整理,并用图表进行处理,提取信息,以及处理统计中的平均数、方差(或标准差)等特征数据,并做出判断.
思路分析 1. 根据样本频率直方图中的矩形的纵轴表示■,得到小矩形的面积即为数据落在区间范围内的频率,并用频率对其相应的概率进行估计;又因为频数=样本容量×频率,所以可得相应区间范围内的频数,然后对总估频率进行估计.
2. 根据所给数据,画出茎叶图,可以通过样本的特征数进行比较,然后根据特征数的意义写出相应的结论. 第2问可以用列举法,根据古典概型的计算公式来求解.
完美解答 1. 由样本的频率分布直方图知数据落在[6,10)内的频率为0.08×(10-6)=0.32,所以可以估计样本数据落在[6,10)内的频数为0.32×200=64,同理可估计样本数据落在[10,14)内的频数为200×0.09×4=72,样本数据落在[14,22)内的频数为200×(0.03×4+0.03×4)=48,可以排除B、C.
数据落在[2,10)内的概率约0.02×4+0.08×4=0.40,A正确.
数据落在[10,18)内的概率约为0.09×4+0.03×4=0.48,D不正确.
所以选A.
2. (1)画出茎叶图如图2所示:
甲 乙
9 1 0
9 5 3 1 0 2 6
7 3 2 3 0 0 4 7
1 4 4 6 6 7
图2
①甲地树苗高度的平均数为28 cm,乙地树苗高度的平均数为35 cm,所以甲地树苗高度的平均数小于乙地树苗的高度的平均数;
②甲地树苗高度的中位数为27 cm,乙地树苗高度的中位数为35.5 cm,所以甲地树苗高度的中位数小于乙地树苗的高度的中位数.
(2)在5株树苗中,记甲苗圃这株苗为a,乙苗圃中4株苗分别为b,c,d,e,则任取两株共有ab,ac,ad,ae,bc,bd,be,cd,ce,de共10种情形.
不含a的有6种bc,bd,be,cd,ce,de,所以小王没有选择甲苗圃树苗的概率为■=■.
【命题趋势】 这部分涉及的知识点较多,概念性的内容也较多,但从高考的实际来看,这部分内容是统计考查的重心. 预计以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解,单纯以方差计算为考查目的的考题也并不鲜见. 高考题型多以选择题和填空题的形式出现,有时也会有解答题,但难度不大.
随机事件的概率与古典概型
【考纲要求】 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别,了解两个互斥事件的概率加法公式;理解古典概型及其概率计算公式;会(用列举法)计算一些随机事件所含的基本事件数及事件发生的概率.
【考纲解读】 从内容要求上看,有几个关键:事件与概率要求中,均是以“了解”为主,古典概型中则是一个“理解”,一个“会”,其中的互斥事件的概率加法公式成为概率考查纵深的表现. 频率与概率的区别与联系是基础,古典概型的概率计算是核心,文科生对于事件概率的获得均是以列举法描述发生事件和基本事件的比来获取的,而理科生则侧重于与排列、组合、随机变量的分布列与期望等知识进行综合考查.
【经典例题】 1. 甲、乙、丙三名同学按任意次序站成一排,则甲站在两端的概率是( )
A. ■ B. ■ C. ■ D. ■
2. 将A,B,C,D,E五种不同的文件随机地放入编号依次为1,2,3,4,5,6,7的七个抽屉内,每个抽屉至多放一种文件,则文件A,B被放在相邻的抽屉内且文件C,D被放在不相邻的抽屉内的概率是( )
A. ■ B. ■ C. ■ D. ■
3.
■
图3
《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~80 mg/100 ml(不含80)之间,属于酒后驾车;在80 mg/100 ml(含80)以上时,属醉酒驾车,对于酒后驾车和醉酒驾车的驾驶员公安机关将给予不同程度的处罚.
据《法制晚报》报道,2010年8月1日至8月28日,某市交管部门共抽查了1000辆车,查出酒后驾车和醉酒驾车的驾驶员80人,图3是对这80人血液中酒精含量进行检测所得结果的频率分布直方图.
(1)根据频率分布直方图完成表1:
(2)根据上述数据,求此次抽查的1000人中属于醉酒驾车的概率;
(3)若用分层抽样的方法从血液酒精浓度在[70,90)范围内的驾驶员中抽取一个容量为5的样本,并将该样本看成一个总体,从中任取2人,求恰有1人属于醉酒驾车的概率.
命题意图 1. 本题主要考查古典概型的概率的计算,灵活运用列举法或排列组合求事件的概率;
2. 本题主要考查排列组合知识的应用及古典概型的概率的计算.
3. 本题主要考查频率分布表、频率分布直方图、抽样方法中的分层抽样、古典概型概率的计算等知识, 考查或然与必然的数学思想方法,以及数据处理能力、运算求解能力和应用意识.?摇
思路分析 1. 由于甲、乙、丙三名同学按任意次序站成一排,因此它属于古典概型,可以用列举法求出所有的基本事件数及所求事件所含的基本事件数,也可以用排列组合公式计算.
3. 求一个随机事件的概率的基本方法是通过大量的重复试验,可以用事件发生的频率近似值作为它的概率. 根据分层抽样确定在[70,90)范围内的驾驶员的人数抽样比,再确定5人这一样本中有几个,利用列举法及古典概型的概率计算公式求出恰有1人属于醉酒驾车的概率.
完美解答 1. (1)(法1)甲、乙、丙三名同学按任意次序站成一排,画树状图:
■
由图可知,共有6种不同的结果,而甲站在两端的有(甲-乙-丙,甲-丙-乙,乙-丙-甲, 丙-乙-甲)4种,所以所求概率为P=■=■.
(法2)由于甲站左端、中间、右端中的任何一个位置是等可能的,甲共有3种不同的站法,而甲站在两端共有2种站法,所以所求概率为P=■.
(法3)甲、乙、丙三名同学按任意次序站成一排,不同的排法共有A■■=6种. 而甲站在两端的排法有(C■■A■■)A■■=4,所以所求概率为P=■=■.
2. 将A,B,C,D,E五种不同的文件随机地放入编号依次为1,2,3,4,5,6,7的七个抽屉内,共有A■■种不同的放法. 而文件A,B被放在相邻的抽屉内且文件C,D被放在不相邻的抽屉内可用排除法. 文件A,B被放在相邻的抽屉内且不考虑文件C,D是否被放在相邻的抽屉内,有A■■·A■■种不同的放法;文件A,B被放在相邻的抽屉内且文件C,D也被放在相邻的抽屉内,有A■■·A■■·A■■,故所求的概率为P=■=■. 选B.
3. (1)见表2
(2)P=■=0.012.
(3)因为血液酒精浓度在[70,80)范围内有12人,[80,90)范围内有8人,要抽取一个容量为5的样本,[70,80)内范围内应抽3人,记为a,b,c,[80,90)范围内应抽2人,记为d,e,则从总体中任取2人的所有情况为(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),恰有一人的血液酒精浓度在[80,90)范围内的情况有(a,d),(a,e),(b,d),(b,e),(c,d),(c,e),共6种,设“恰有1人属于醉酒驾车”为事件A,则P(A)=■=■.
【命题趋势】 概率试题通常是通过对课本原题进行改编,通过对基础知识的重新组合、变式和拓展,从而加工为立意高、情境新、设问巧、并赋予时代气息、贴近学生实际的问题.这样的试题体现了数学试卷新的设计理念,尊重不同考生群体思维的差异,贴近考生的实际. 预计古典概型的概率问题仍将作为高考的重点来考查,多为解答题,可能会综合随机抽样、统计图表与数字特征等进行考查,而理科类试题还可能会与独立事件、互斥事件等相关知识结合起来命题.
分类加法计数原理、分步乘法计数原理与排列与组合
【考纲要求】 理解分类加法计数原理和分步乘法计数原理;会用分类加法计数原理或分步乘法计数原理分析和解决一些简单的实际问题;理解排列、组合的概念;能利用计数原理推导排列数公式、组合数公式;能用排列、组合知识解决简单的实际问题.
【考纲解读】 考纲中聚焦“两个原理”是两种重要的计算方法,重在会用两个计数原理、排列组合知识分析、解决一些简单的实际问题.
【经典例题】 1. 三位老师和三位学生站成一排,要求任何两位学生都不相邻,则不同的排法总数为( )
A. 720 B. 144 C. 36 D. 12
2. 用0,1,2,3,4,5组成没有重复数字的六位数中,相邻两位数字的奇偶性都不同的有( )
A. 24个 B. 36个
C. 60个?摇?摇D. 72个
3. 3位教师分配到4个贫困村调查义务教育实施情况,若每个村最多去2人,则不同的分配方法种数是____.(用数字作答)?摇
命题意图 两个计数基本原理、排列与组合应用问题,是高考理科数学试题中的一个重要考点,考查分析问题、解决问题的能力.
思路分析 1. 本题是一个限制条件的排列问题,可以先分两步进行,即先安排没有限制条件的三位老师站好,然后再将三位学生安排到已站好的三位老师形成的空当.
2. 本题是一个数字排列问题,考虑到数字“0”的特殊性,先确定“0”的位置,然后根据相邻两位数字的奇偶性都不同确定其他位置.
3. 本题是一个分配问题,常先分组,然后到“位”,即先将3位教师分成三组或两组,然后再分配到4个贫困村.
完美解答 1. 先安排三位老师站好,有A■■种排法;然后,再将三位学生分别安排到已安排好的三位老师形成的4个空当,有A■■种排法. 故根据分步计数原理,得不同的排法共有A■■·A■■=144种,故选B.
2. 利用特殊元素法是解本题的关键,考虑到特殊元素“0”,将“0”分别置于个、十、百、千、万位考虑,得5×C■■C■■C■■C■■C■■=5×12=60个. 故选C.
3. 分两类,第一类是3位教师分配到4个贫困村,每个村最多去1人,则不同的分配方法种数有A■■=24种;第二类是3位教师分配到4个贫困村,有一个村是2人,一个村为1人,则不同的分配方法种数有(C■■·C■■)·A■■=36种.
故不同的分配方法种数共有24+36=60种,答案填60.
【命题趋势】 从近几年高考试题与模拟试题来看,仍然会注重两个基本原理,多以现实生活中的实际问题、经济问题为背景,考查分析问题、解决问题的能力与分类讨论的思想.预计题目仍多以选择题或填空题形式出现,题小而灵活,若出现在解答题里,多与概率综合在一起,常用来计算随机事件的概率. 从形式上看,以下几种类型最为常见:数字问题、人或物的排列问题、几何问题、选代表或选样品的问题、集合的子集个数问题,试题的难度与教材习题相当,多为“较易”到“中等”的程度.
二项式定理
【考纲要求】 能用计数原理证明二项式定理;会用二项式定理解决与二项展开式有关的简单问题.
【考纲解读】 《考纲说明》中要求考生会用二项式定理解决与二项展开式有关的简单问题,会用二项式定理求某项系数或展开式系数,会用赋值法求系数和.
【经典例题】 1. 二项式2x-■■的展开式中的常数项为15,则实数a的值为_______.
2. 设(2x-3)10=a0+a1(x-1)+a2(x-1)2+…+a10(x-1)10,则a1+a2+…+a10的值为( )
A. 1-310B. -310-1
C. 310-1?摇?摇?摇 D. 0
命题意图 1. 本题考查应用二项式定理解决与二项式系数有关的系数问题;
2. 本题考查对二项式定理的理解及赋值法.
思路分析 1. 根据已知指定项的特点,确定r为4,写出通项公式,再确定所求的系数.
2. 本题与各项的系数有关,可考虑用“赋值法”.
完美解答 1. Tr+1=C■■(2x)6-r·-■■=(-a)r·26-rC■■x■,由6-3r=0得r=2,即T3为展开式的常数项,所以(-a)2·24C■■=15,解得a=±■.
2. 令x=1,得(2×1-3)10=a0,所以a0=1;再令x=2,得(2×2-3)10=a0+a1(2-1)+a2(2-1)2+…+a10(2-1)10,得a1+a2+…+a10=1-a0=1-1=0,所以选D.
【命题趋势】 二项式定理的试题是多年来最缺少变化的试题,历年高考二项式定理的试题以客观题的形式出现,多为课本例题、习题迁移的改编题,难度不大,重点考查运用二项式定理去解决问题的能力和逻辑划分、化归转化等思想方法.
预计多项式系数求和、求某项系数、求二项式中的参数值、求常数项、求幂指数n仍然是考查的重点,对于三项式转化成二项式问题也有一定的考查趋势.
离散型随机变量的分布列、期望与方差
【考纲要求】 理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性. 理解超几何分布及其导出过程,并能进行简单的应用. 了解两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题. 理解取有限个值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题.
【考纲解读】 理科的概率要求显然是从随机变量及其分布列着手的,即从统计分布的角度进入的. 从行为动词“理解”的角度看,重点应关注离散型随机变量及其分布列、超几何分布、二项分布(含n次独立重复试验模型),“会”计算离散型随机变量的均值与方差,并且在上述基础上解决简单的实际问题,考查阅读分析、运用数学知识解决问题的能力.
【经典例题】 1. 某中学选派40名同学参加北京市高中生技术设计创意大赛的培训,他们参加培训的次数统计如表3所示:
表3
■
(1)从这40人中任意选3名学生,求这3名同学中至少有2名同学参加培训次数恰好相等的概率;
(2)从40人中任选两名学生,用X表示这两人参加培训次数之差的绝对值,求随机变量X的分布列及数学期望EX.
2. 已知武汉某公司2007年—2011年的产品抽检情况如表4:
由于受到欧债危机的影响,2012年计划生产8500件该产品,若生产一件合格产品赢利0.5万元,生产一件次品亏损0.3万元.
(1)完成题中表格,并指出该工厂生产的该产品的合格率最接近于哪个数值p(精确到0.1);
(2)以(1)中的数值p作为该产品的合格率,请你帮该工厂作出经营利润方面的预测.
命题意图 1. 本题主要考查组合、古典概型、互斥事件、离散型随机变量的分布列及数学期望等知识,考查运算求解能力以及应用概率知识分析解决问题的能力,考查必然与或然思想及分类讨论的数学思想.
2. 本题主要考查相互独立事件、离散型随机变量的分布列、二项分布的识别,考查综合运用所学知识分析、解决实际问题的能力
思路分析 1. 从这40人中任意选3名学生,求这3名同学中至少有2名同学参加培训次数恰好相等的概率,可以先求出3名学生参加培训次数都不相等的概率,然后运用对立事件的概率公式求得. 又由于学生参加培训次数为1,2,3,所以两人参加培训次数之差的绝对值X可能为0,1,2,然后求出相应的概率,列出分布列,根据数学期望的公式求得结果.
2. 由于每次抽取该工厂生产的产品是相互独立的,因此合格产品的数量ξ服从二项分布,求Eξ可用公式Eξ=np求解,然后计算经营利润.
完美解答 1. (1)这3名同学中至少有2名同学参加培训次数恰好相等的概率为P=1-■=■.
■
所以的数学期望EX=0×■+1×■+2×■=■.
2. (1)合格率分别为0.798,0.801,0.803,0.798,0.800.
该产品的合格率最接近于数值0.8,即p=0.8.
(2)设8500件产品中合格产品的数量为ξ,则ξ为随机变量,且ξ~B8500,■,故E(ξ)=8500×■=6800(件),即预测2012年该产品的合格产品数量为6800件,从而经营利润为6800×0.5-(8500-6800)×0.3=3400-510=2890(万元).
【命题趋势】 由于离散型随机变量的分布列、均值与方差与现实生活联系密切,能充分体现数学的应用价值,也符合高考发展的方向,是近几年高考的热点与重点内容. 预计在今后的高考中,它仍然是考查的重点,题型有选择题和填空题,但不同的地区,在命题设计上不尽相同,依然是以解答题为主.
■
随机数与几何概型
【考纲要求】 了解随机数的意义,能运用模拟方法估计概率. 了解几何概型的意义.
【考纲解读】 《考试说明》要求“了解随机数的意义,了解几何概型的意义”,所以应在了解的基础上,还要理解,会运用模拟方法估计概率,会解决一些几何概型的求解问题. 由于几何概型具有无限性和等可能性这两个特点,因此几何概型的求解与古典概型的求解思路是一样的,都属于比例解法.
【经典例题】 1. 如图4,矩形的长为6,宽为4,在矩形内随机地撒300颗黄豆,落在椭圆外的黄豆数为96颗,以此实验数据为依据可以估计出椭圆的面积约为( )
■
图4
A. 7.68B. 8.68
C. 16.32D. 17.32
2. 若A是圆C:x2+y2+4y=0上的定点,B是圆C上不同于A的动点,则△CAB的周长小于6的概率是______.
命题意图 1. 本题直接以考纲中的“了解随机数的意义,能运用模拟方法估计概率”来设计考题,并解决实际问题.
2. 本题把几何概型的计算方法用于角度上,考查对几何概型的掌握程度和事件转化的能力.
思路分析 1. 统计落在椭圆内部的随机点的个数与落在正方形中的随机点的个数,根据比例关系求得椭圆面积的近似值.
2. 根据△CAB的周长找出只需要求弦AB的长小于2的概率,由B是圆C上的动点,再将概率问题转化为圆心角来求解.
完美解答 1. 由于矩形的面积为6×4=24,设椭圆的面积约为S,则■=■,解得S=16.32,所以选C.
2. 由圆C:x2+y2+4y=0知圆的半径为2,所以△CAB的周长为AC+CB+AB=2+2+AB=4+AB,且B是圆C上的动点,所以求△CAB的周长小于6的概率即求弦AB的长小于2的概率,进而求∠ACB≤■的概率.
故所求的概率为■=■.
【命题趋势】 随机数与几何概型在高考中所占比较轻,近几年的高考对概率要求有所降低,且它是新增内容,考试涉及的可能性会较大. 预测题目类型多以客观题的形式出现,重点内容是几何概型的求值问题,要善于将实际问题转化为概率模型来处理.
变量的相关性、回归分析、独立性检验
【考纲要求】 变量的相关性:①会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立性检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. ②回归分析:了解回归的基本思想、方法及其简单应用.
【考纲解读】 在《说明》中明确提出不要求记忆线性回归方程系数公式、独立性检验随机变量K2值的计算公式. 从考纲中“变量相关性”的要求来看,有两个“会”、一个“了解”、一个“能”,是一个完整的作散点图、求回归方程,并给出回归分析的统计过程,试题常体现在“会”、“能”两个行为动词上. 而对两种统计方法说是了解,实际上是要在“能”字上下工夫.
【经典例题】 1. 某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如表5的资料.
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程,并预报当温差为9℃时的种子发芽数.
2. 某中学举办安全法规知识竞赛,从参赛的高一、高二学生中各抽出100人的成绩作为样本. 对高一年级的100名学生的成绩进行统计,并按[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到成绩分布的频率分布直方图(如图5).
(1)若规定60分以上(包括60分)为合格,计算高一年级这次知识竞赛的合格率;
■
图5
(2)若高二年级这次知识竞赛的合格率为60%,由以上统计数据填写下面2×2列联表,并问是否有99%的把握认为“这次知识竞赛的成绩与年级有关系”.
■
参考数据与公式:
由列联表中数据计算K2=■
临界值表
■
命题意图 1. 本题主要考查古典概率的计算、线性回归直线方程的理解及回归分析方法的简单应用,考查运算能力、处理数据和分析问题、解决问题的能力.
2. 本题重点考查了古典概型概率的计算与统计中独立性检验的相关知识,要求我们能够熟练地利用图表中的数据来进行分析,进而得出相应的结论.
思路分析 1. 第1问可以用列举法,计算基本事件总数与所求随机事件所包含基本事件的总数,运算公式计算;第2问由线性回归直线方程可知,它必过点(■,■),据此求出回归系数,再令x=9,代入回归方程预测种子发芽数.
2. 第1问由样本对总体进行估计,通过样本的频率及互斥事件的概率公式计算高一年级在这次知识赛的合格率;第2问将关联表的有关数据代入独立性检验随机变量K2值的计算公式算出K2,然后再通过独立性检验临界值表求解.
完美解答 1. (1)设抽到不相邻的两组数据为事件A,从5组数据中选取2组数据共有10种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),其中数据为12月份的日期数. 每种情况都是等可能出现的,事件A包括的基本事件有6种,所以P(A)=■.
所以选取的2组数据恰好是不相邻2天数据的概率是■
(2)由数据,求得■=12,■=27. 由公式■=■求得■=■,■=■-■■=-3,所以y关于x的线性回归方程为■=■x-3. 由此可以预报当温差为9℃时的种子发芽数为19或20颗.
2. (1)高一在这次知识竞赛的合格率为0.02×10+0.03×10+0.02×10+0.01×10=80%.
(2)列联表如下:
■
所以K2=■≈9.5>6.635,所以有99%的把握认为“这次知识竞赛的成绩与年级有关系”.
【命题趋势】 统计案例内容主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用,是教材新增内容,估计高考中比重不会过大. 随着新课程标准的全面推行,高考对概率与统计的考查要求与命题背景在不断地变化着,高考对文科考生的概率知识要求降低,必然加大对统计知识的考查力度,目的是提高我们的统计判断能力,预计2012年高考试题考查用独立性检验判断A与B间的关系及2×2列联表的趋势有所加强.
■
条件概率
【考纲要求】 了解条件概率的概念.
【考纲解读】 考纲中对条件概率的要求较低,事实上它只是相互独立事件概念的一个过渡. 条件概率的计算可以用定义法,但要做辅助计算;也可以通过缩小基本事件的个数的取值范围,用古典概型计算求得.
【经典例题】 一个盒子里有6只好晶体管,4只坏晶体管,任取两次,每次取一只,每次取后不放回,则若已知第一只是好的,则第二只也是好的概率为( )
A. ■?摇?摇 B. ■?摇?摇 C. ■?摇?摇?摇 D. ■
命题意图 本题主要考查条件概率的计算.
思路分析 根据条件概率的计算公式P(AB)=■,分别计算出P(B),P(A∩B)即可获解.
完美解答 设Ai={第i只是好的}(i=1,2),由题意知要求P(A2A1),因为,P(A1)=■=■,P(A1∩A2)=■=■,所以P(A2A1)=■=■,选C.
【命题趋势】 从近几年高考命题来看,各地区对条件概率知识的考查较少,仅在2011年辽宁高考试题中出现了. 预计在今后的高考题目设置时,条件概率作为新增内容,仍以选择题、填空题的形式出现,也可与其他的概率问题综合考查.
正态分布
【考纲要求】 利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.
【考纲解读】 从考纲中可以看出,正态分布这一考点要求较低,只需要“了解”,对概率的计算要正确运用正态分布曲线的对称性.
【经典例题】 已知随机变量x服从正态分布N(μ,σ2),且P(μ-2σ<x≤μ+2σ)=0.9544,P(μ-σ<x≤μ+σ)=0.6826,若μ=4,σ=1,则P(5<x<6)等于( )
A. 0.1358?摇?摇B. 0.1359
C. 0.2716?摇?摇D. 0.2718
命题意图 本题主要考查利用正态分布曲线的性质求某特定区间的概率的计算能力与转化能力.
■
图6
思路分析 根据标准正态分布曲线是关于y轴对称的,可以将区间进行合理转化求得结果.
完美解答 由题知x~N(4,1),作出相应的正态曲线,如图6,依题意P(2 【命题趋势】 高考中对正态分布的考查主要体现在对正态分布曲线性质的考查,标准正态分布与一般正态分布间的转化,以及利用正态分布曲线的性质求某特定事件的概率.虽然考纲对其要求很低,但是正态分布广泛应用于实践之中,随着新课改的深入,预计2012年正态分布这个考点还会出现在少数地区的高考试卷中. ■ 一、选择题 1. 图7是某社区工会对当地企业工人月收入情况进行一次抽样调查后画出的频率分布直方图,其中第二组月收入在[1.5,2)千元的频数为300,则此次抽样的样本容量为( ) ■ 图7 A. 1000?摇?摇?摇?摇 B. 2000 C. 3000?摇?摇?摇?摇?摇D. 4000 2. 某地为了调查职业满意度,决定用分层抽样的方法从公务员、教师、自由职业者三个群体的相关人员中抽取若干人组成调查小组,相关数据见表6: 表6 ■ 则调查小组的总人数为( ) A. 84?摇?摇?摇?摇 B. 12?摇?摇?摇?摇 C. 81?摇?摇?摇?摇?摇D. 14 3. 表7是某机电设备的广告费用x与销售额y的统计数据: 表7 ■ 据此模型预报广告费用为6万元时的销售额为( ) A. 63.6万元 B. 65.5万元 C. 67.7万元 D. 72.0万元 二、填空题 6. 从4名男生和3名女生中选出4人参加市中学生知识竞赛活动,若这4人中必须既有男生又有女生,不同的选法共有_______种. 7. 某市派出甲、乙两支球队参加全省足球冠军赛,甲、乙两队夺取冠军的概率分别是■和■,则该市足球队夺得全省足球冠军的概率是_____. 三、解答题 8. 文科班某同学参加某省学业水平测试,物理、化学、生物获得等级A和获得等级不是A的机会相等,物理、化学、生物获得等级A的事件分别记为W1,W2,W3,物理、化学、生物获得等级不是A的事件分别记为W1,W2,W3. (1)试列举该同学这次水平测试中物理、化学、生物成绩是否为A的所有可能结果(如三科成绩均为A记为(W1,W2,W3)); (2)求该同学参加这次水平测试获得两个A的概率; (3)试设计一个关于该同学参加这次水平测试物理、化学、生物成绩情况的事件,使该事件的概率大于85%,并说明理由. 9. 某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品. 图8是甲流水线样本的频率分布直方图,表8是乙流水线样本频数分布表. (1)若以频率作为概率,试估计从甲流水线上任取5件产品,求其中合格品的件数X的数学期望; (2)从乙流水线样本的不合格品中任意取2件,求其中超过合格品重量的件数Y的分布列; (3)由以上统计数据完成下面2×2列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”. 10. 3月是植树造林的最佳时节,公园打算在3·12植树节前后引种一批名优树种. 现有甲、乙两家苗木场各送来一批同种树苗.公园园林部分别各抽取100棵测量其高度,得到如表11的频率分布表. (1)分别算出甲、乙两家苗木场树苗样本高度的平均值■甲,■乙;(样本数据第i组的频率为pi,中间值为xi(i=1,2,…,n),则平均值为■=x1p1+x2p2+…+xnpn) (2)根据样本数据可算得两个方差:S■■=120.16,S■■=105.0,结合(1)中算出的数据,如果你是公园园林部主管,你将选择哪家苗木场的树苗?说明你的观点; (3)用分层抽样方法从乙苗木场的样本中抽取10棵,小林同学从这10棵中挑选2棵试种,其中高度在[90,100]范围的有X棵,求X的分布列和数学期望. 11. 甲、乙两同学进行下棋比赛,约定每局胜者得1分,负者得0分(无平局),比赛进行到有一个人比对方多2分或比满8局时停止,设甲在每局中获胜的概率为pp>■,且各局胜负相互独立.已知第二局比赛结束时比赛停止的概率为■. (1)图9为统计这次比赛的局数n和甲、乙的总得分S,T的程序框图. 其中如果甲获胜,输入a=1,b=0;如果乙获胜,则输入a=0,b=1. 请问在①②两个判断框中应分别填写什么条件; (2)求p的值; (3)设ξ表示比赛停止时已比赛的局数,求随机变量ξ的分布列和Eξ.