■李传翔
统计学研究的对象是客观事物的数量特征和数量关系,它是关于数据的搜集、整理、归纳分析和解释的科学,其基本思想是用样本估计总体,用样本的某种数字特征(平均数、方差)去估计总体的相应数字特征。下面借助于高考题,与大家一起探究高考中的样本特征数问题。
例1演讲比赛共有11位评委分别给出某选手的原始评分,评定该选手的成绩时,从11个原始评分中去掉1个最高分、1个最低分,得到9个有效评分。9个有效评分与11个原始评分相比,不变的数字特征是( )。
A.中位数 B.平均数
C.标准差 D.极差
解:根据题意可知,从11个原始评分中去掉1个最高分、1个最低分,得到9个有效评分,9个有效评分与11个原始评分相比,最中间的一个数不变,即中位数不变。应选A。
本题考查数据的数字特征,解题的关键是掌握数据的平均数、中位数、方差、极差的定义以及计算方法。
例2某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式。为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式。根据工人完成生产任务的工作时间(单位:min)绘制了如图1所示的茎叶图。
图1
根据茎叶图判断哪种生产方式的效率更高,并说明理由。
解:第一种生产方式的平均数为=84,第二种生产方式的平均数为=74.7,可知,所以第一种生产方式完成任务的平均时间大于第二种生产方式完成任务的平均时间,即第二种生产方式的效率更高。
图表是信息的良好载体,具有直观通俗的特点,在现代社会中,人们必须具备从各种传媒的图表中及时收取信息,加工处理为我所用的能力,这是社会的要求,也是素质教育的要求。
例3甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图2所示,则( )。
图2
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解:甲的平均数是中位数 是 6,极 差 是 4,方 差 是
所以甲的成绩的方差小于乙的成绩的方差,应选C。
高考对方差的考查仍是以熟练运用公式为前提,重点考查公式的具体运用。方差公式为s2=当一组数据较大时,将各个数据同时减去一个与它们的平均数接近的常数,则新数据的方差等于原数据的方差。
例4(2018年高考天津卷)已知某校甲,乙,丙三个年级的学生志愿者人数分别为240,160,160。现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动。
(1)应从甲,乙,丙三个年级的学生志愿者中分别抽取多少人?
(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作。
①试用所给字母列举出所有可能的抽取结果。
②设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率。
解:(1)由题意可知,甲,乙,丙三个年级的学生志愿者人数之比为3∶2∶2。由于采用分层抽样的方法从中抽取7名同学,因此应从甲,乙,丙三个年级的学生志愿者中分别抽取的人数为7=2。
(2)①从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种情况。
②不妨设抽出的7名同学中,来自甲年级的是A,B,C,来自乙年级的是D,E,来自丙年级的是F,G,则从抽出的7名同学中随机抽取2名同学来自同一年级的所有可能结果为{A,B},{A,C},{B,C},{D,E},{F,G},共5种情况。所以事件M发生的概率为P(M)=
本题主要考查概率与样本特征数的应用。解答本题的关键是正确理解分层抽样的意义。
1.为评估一种农作物的种植效果,选了n块地作为试验田。这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )。
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
提示:评估这种农作物亩产量稳定程度的指标是标准差或方差。应选B。
2.已知一组数据6,7,8,9,10,则该组数据的方差是
提示:一组数据6,7,8,9,10的平均数为=8,所以该组数据的方差为8)2+(9-8)2+(10-8)2]=2。
3.在一次马拉松比赛中,35名运动员的成绩(单位:min)如图3所示。
图3
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[130,151]上的运动员人数为( )。
A.3 B.4 C.5 D.6
提示:根据茎叶图中的数据,可知成绩在区间[130,151]上的运动员人数为30。用系统抽样方法从35人中抽取7人,成绩在区间[130,151]上的运动员应抽取的人数为7×,应选D。