李琳
统计是高中数学的重要内容,每年的高考中都有涉及,统计解题中由于审题不严,考虑不周,忽视甚至挖掘不出题目的隐含条件,常会使解题感觉困难或产生错误.下面就一些常见的错误加以剖析,以帮助同学们避免出现同样的错误.
一、不能正确区分总体、样本、样本容量
例1 为了了解2019年参加市运动会的240名运动员的身高情况,从中抽取40名运动员进行测量.下列说法正确的是( )
A.总体是240名运动员
B.个体是每一名运动员
C.40名运动员的身高是一个个体
D.样本容量是40
错解:选择A、B、C中的一个.
剖析:对于选项A、B,对总体、个体、样本的概念把握不准,误将考察的对象当作运动员;对于选项C,把个体和样本混淆致误.
正解:选D.根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项A,B表达的对象都是运动员,选项C未将个体和样本理解透彻.在这个问题中,总体是240名运动员的身高,个体是每名运动员的身高,样本是40名运动员的身高,样本容量是40.因此选D.
应对策略:
1.明确相关概念
对总体、个体、样本、样本容量的概念要熟练把握,要明确总体与样本的包含关系及样本与样本容量的区别,如本例选项C,是对概念把握不准.
2.注意考察对象
解决考查总体、个体、样本、样本容量的概念问题时,关键是明确考察对象,根据相关的概念可知总体、个体与样本的考察对象是相同的,如本例中选项A,B表达的对象都是运动员的身高而不是运动员.
二、对随机抽样的概念理解不透彻
例2 对于下列抽样方法:①运动员从8个跑道中随机抽取1个跑道;②从20个零件中一次性拿出3个来检验质量;③某班50名学生,指定其中成绩优异的2名学生参加一次学科竞赛;④为了保证食品安全,从某厂提供的一批月饼中,拿出一个检查后放回,再拿一个检查,反复5次,拿了5个月饼进行检查.其中,属于简单随机抽样的是______.(把正确的序号都填上)
错解:②③④
剖析:对简单随机抽样的概念理解不透彻.
正解:对于②,一次性拿出3个来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于③,指定其中成绩优异的2名学生,不满足等可能抽样的要求;对于④,不满足不放回抽样的要求.故填①.答案:①
点睛:要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:有限性、逐一性、不放回性、等可能性.
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平性.
应对策略:
1.简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等.
2.应用简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;
二是号签是否易搅匀.
一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
(3)简单随机抽样需满足:
①被抽取的样本总体的个体数有限;
②逐个抽取;
③是不放回抽取;
④是等可能抽取.
三、对系统抽样的特点理解不到位
例3 从2003名学生中抽取一个容量为40的样本,应如何抽取?
错解:将2003名学生按0001到2003编上号;将号码随机分成40份,每一份再用抽签法随机抽取一名学生,即得到了一个容量为40的样本.
剖析:由于2003不能被40整除,误以为只能用简单随机抽样进行抽取,对两种抽样方法的特点理解不到位.
正解:先将2003名学生按0001到2003编上号,利用随机数表法从中剔除3名学生,再对剩余的2000名学生重新从0001到2000编号,按编号顺序分成40组,每组50人,先在第一组中用抽签法抽出某一号,如0006,依次在其他组抽取0056,0106,…,1956,這样就得到了一个容量为40的样本.
应对策略:
1.当总体容量较大,总体可以分为均匀的几个部分时,用系统抽样较为合理,但当总体容量除以样本容量不是整数时,要先在总体中剔除部分个体.
2.系统抽样的操作步骤
第一步编号:先将总体的N个个体编号;
第二步分段:确定分段间隔k,对编号进行分段,当Nn(n是样本容量)是整数时,取k=Nn;
第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);
第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.
四、对个体的入样可能性与抽样间隔理解不透
________________________
例4 中央电视台动画城节目为了对本周的热心观众给予奖励,要从2014名小观众中抽取50名幸运小观众.先用简单随机抽样从2014人中剔除14人,剩下的2000人再按系统抽样方法抽取50人,则在2014人中,每个人被抽取的可能性( )
A.均不相等 B.不全相等
C.都相等,且为251007 D.都相等,且为140
错解:选A或D.
剖析:对于选项A,误认为剔除14人,被抽取到的机会就不相等了,错选A;对于选项D,认为被抽取的机会相等,但利用了剔除后的数据计算,错选D.
正解:选C.因为在系统抽样中,若所给的总体个数不能被样本容量整除,则应先剔除几个个体,本题先剔除14人,然后再分组,在剔除过程中,每个个体被剔除的机会相等.所以,每个个体被抽到的机会都相等,均为502014=251007.答案:C.
应对策略:
1.明确系统抽样的操作要领
系统抽样操作要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先指定的规则,从每一部分中抽取一个个体,得到所需样本.系统抽样是等距离抽样,每个个体被抽到的机会是相等的,如本题中2000人要分为50段.
2.对系统抽样合理分段
在系统抽样过程中,为将整个编号分段,要确定分段间隔,当在系统抽样过程中比值不是整数时,要从总体中剔除一些个体(用简单随机抽样),但每一个个体入样的机会仍然相等.如本题中剔除14人后,每个人被抽取的可能性不变.
五、忽略分层抽样的特点
例5 某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是( )
A.简单随机抽样
B.系统抽样
C.直接运用分层抽样
D.先从老年人中剔除1人,再用分层抽样
错解:因为总体由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为28+54+81=163,样本容量为36,由于按36163抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为36162=29.若从老年人中随机地剔除1人,则老年人应抽取27×29=6(人),中年人应抽取54×29=12(人),青年人应抽取81×29=18(人),从而组成容量为36的样本.故选D.
剖析:如果用简单随机抽样先从老年人中剔除1人的话,老年人被抽到的概率显然比其他人群小了,这不符合随机抽样的特征——每个个体入样的几率相等.注意题干明确地说“先从老年人中剔除1人”,这和以前做的从总体中随机剔除1人是不一样的.
正解:直接运用分层抽样,老年人、中年人和青年人中应抽取的人数分别为36163×28≈6,36163×54≈12,36163×81≈18,故选C.
点睛:分层抽样的一个很重要的特点是每个个体被抽到的概率是一样的.当按照比例计算出的值不是整数时,一般是采用四舍五入的方法取值,若四舍五入后得到的样本容量与要求的不尽相同,则可根据问题的实际意义适当处理,使之相同,这只是细节性问题,并未改变分层抽样的本质.
应对策略:
1.分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
2.与分层抽样有关问题的常见类型及解题策略
(1)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.
(2)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.
六、误将频率分布直方图的纵坐标当作频率
例6 中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人?
错解:由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5×56=512.
所以该市6万名高一學生中视力在[3.95,4.25)范围内的学生约有60000×512=25000(人).
剖析:表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分布直方图中的数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)看成了频率,从而导致问题的解答出错.
正解:由图可知,第五小组的频率为0.5×0.3=0.15,
所以第一小组的频率为0.15×56=0.125.
所以该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60000×0.125=7500(人).
答案:7500.
应对策略:
1.画频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);