文 封霞霖
(作者单位:江南大学附属实验中学)
统计学是通过收集、整理、描述、分析数据等手段,推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计研究的是数据和随机现象。在本章,同学们在学习时要注重数据分析,学会提取有用的数据,正确运用数据做决策,而不是单纯地学习名词、计算公式等。
例1某市从不同学校随机抽取100名初中生,对“学校统一使用数学教辅用书的册数”进行调查,统计结果如下:
23册数人数0 1 2 3 13 35 29
关于这组数据,下列说法正确的是( )。
A.众数是2册 B.中位数是2册
C.极差是2册 D.平均数是2册
【分析】平均数、中位数、众数反映数据的集中程度,极差和方差反映数据的离散程度。
解:出现次数最多的数据是1册,出现了35次,所以众数是1册;100名学生,排序后处于中间位置的有两个数,第50个数和第51个数,由于这两个数都是2册,那么平均数是2册,所以中位数是2册;最大值是3册,最小值是0册,所以极差为3-0=3册;平均数=(0×13+1×35+2×29+3×23)÷100=1.62册。故选B。
【点评】平均数是所有数据的平均值。将一组数据按大小排序,如果数据的个数是奇数,处于中间位置的数叫作中位数;如果数据的个数是偶数,那么中间位置的两个数的平均数叫作中位数。众数是出现次数最多的数据。平均数很重要,应用也很广泛,但是容易受到极端数据的影响。如果数据中有差异较大的数据,用中位数和众数反映数据的集中程度就比较客观一些。极差反映了一组数据的变化范围,在一定程度上描述了这组数据的离散程度,极差=最大值-最小值。
例2某公司需招聘一名员工,对应聘者甲、乙、丙从笔试、面试、体能三个方面进行量化考核。甲、乙、丙各项得分如下表:
体能90 75 73甲乙丙笔试83 85 80面试79 80 90
(1)根据三项得分的平均分,从高到低确定三名应聘者的排名顺序。
(2)该公司规定:笔试、面试、体能得分分别不得低于80分、80分、70分,并按60%、30%、10%的比例计入总分。根据规定,请你说明谁将被录用。
【分析】(1)根据三人各项成绩求出它们的平均分,然后按照平均成绩从高到低进行排序。(2)根据要求判断甲不符合规定,然后按照分数的比例求出乙和丙的分数,再按照分数的高低录取分数较高的人。
解:(1)甲、乙、丙三人的平均分分别是84、80、81。所以三人的平均分从高到低是:甲、丙、乙。
(2)因为甲的面试分不合格,所以甲首先被淘汰。
乙的加权平均分是:85×60%+80×30%+75×10%=82.5。
丙的加权平均分是:80×60%+90×30%+73×10%=82.3。
因为乙的加权平均分较高,所以乙将被录用。
【点评】一组数据的平均数,不仅与这组数据中各个数据的值有关,而且与各个数据的“重要程度”有关。我们把衡量各个数据的“重要程度”的数值叫作权。
例3某校要从甲、乙两名跳高运动员中挑选一人参加一项校际比赛,在最近的8次选拔赛中,他们的成绩(单位:m)如下:
甲 :1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67;
乙 :1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75。
(1)他们的平均成绩分别是多少?
(2)哪个人的成绩更为稳定?
(3)经预测,跳过1.65m就很可能获得冠军,该校为了获取跳高比赛冠军,选哪位运动员参赛更好?若预测跳过1.70m方可获得冠军选谁更好?
【分析】第(1)问求平均数比较简单,直接代入公式就可以。第(2)问可用方差来解释,方差越小越稳定。第(3)问是做决策,可以利用第一问和第二问的计算结果做出判断。
解:(1)甲的平均成绩是1.69m,乙的平均成绩是1.68m。
(2)甲、乙两名运动员8次比赛成绩的方差分别是0.0006和0.00315,因此甲的成绩较稳定。
(3)可以选甲运动员参赛,因为甲运动员8次的比赛成绩都超过1.65m,而乙运动员有3次成绩低于1.65m,所以甲得冠军的可能性更大。若预测跳过1.70m可获冠军,因乙有5次在1.70m以上,故选乙。
【点评】若跳过1.65m就可能获得冠军,相比之下选甲比较可靠;但需跳过1.70m方可获得冠军,则选乙较好,因为甲运动员仅有3次成绩超过1.70m,而乙运动员有5次成绩超过1.70m,乙获得冠军的机会更大。统计学对结果的判断是“好坏”,而不是“对错”。决策要有科学依据,要会用数据来说话。