李红
平均数、中位数和众数从不同侧面给我们提供了同一组数据的面貌,都是描述数据的集中趋势的“特征数”.三者都可以作为一组数据的代表,但是它们反映数据的特征有所不同.学习这部分内容的难点是理解这三个量之间的区别,主要表现在以下几个方面.
1. 意义和求法不同
平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数.
中位数:将一组数据按从大到小(或从小到大)排列,处在最中间位置的一个数或最中间的两个数的平均数叫做这组数据的中位数.
众数:在一组数据中出现次数最多的数叫做这组数据的众数.只要找,不必计算就可求出.
例1 若五个正整数的中位数是3,唯一的众数是7,则这五个数的平均数是_______.
【分析】首先根据众数与中位数的定义,得出这五个数据中的三个数,再根据一组数据由五个正整数组成,得出其它两个数,最后由平均数的意义得出结果.
解:∵五个正整数的中位数是3,唯一的众数是7,
∴知道的三个数是3,7,7.
∵一组数据由五个正整数组成,
∴另两个为1,2.
∴这五个正整数的平均数是(1+2+3+7+7)÷5=4.
故答案为:4.
【点评】本题考查了平均数、众数与中位数的意义,掌握平均数、众数与中位数的计算公式是解题的关键.
2. 个数不同
在一组数据中,平均数和中位数都具有惟一性,但众数有时不具有唯一性.在一组数据中,可能不止一个众数,也可能没有众数.
3. 呈现形式不同
平均数:是一个“虚拟”的数,是通过计算得到的,它不是数据中的原始数据,它可能与原数据中的某一个相同,也可能与原数据中的任何一个都不同.
中位数:是一个不完全“虚拟”的数.当一组数据是奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,只有当中间的两个数相同时,它才与这组数据中的两个或两个以上数据相同,是数据中的一个真实的数,如果正中间的两个数不同,此时的中位数就是一个“虚拟”的数.
众数:是一组数据中出现次数最多的原数据,它是真实存在的.但当一组数据中的每一个数据都出现相同次数时,这组数据就没有众数了.
例2 公园里有甲、乙两群游客正在做团体游戏,两群游客的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:3,4,4,5,5,6,6,6,54,57.
解答下列问题(直接填在横线上):
(1) 甲群游客的平均年龄是_______岁,中位数是_______岁,众数是_______岁,其中能较好反映甲群游客年龄特征的是_______.
(2) 乙群游客的平均年龄是_______岁,中位数是_______岁,众数是_______岁,其中能较好反映乙群游客年龄特征的是_______.
【分析】平均数、中位数及众数都是反映数据集中趋势的量,当一组数据的大小比较接近时(如甲群游客),三个量也比较接近;当一组数据中有个别数特别大或特别小时(如乙群游客),它就会影响平均数的大小,但不影响中位数、众数,此时可由中位数或众数反映这组数据的集中趋势.
【答案】(1) 15,15,15,平均数、中位数、众数;
(2) 15,5.5,6,中位数、众数.
4. 代表不同
平均数:反映了一组数据的平均大小,常用来代表数据的总体 “平均水平”.
中位数:像一条分界线,将数据分成前后两部分,因此用来代表一组数据的“中等水平”.
众数:反映了出现次数最多的数据,用来代表一组数据的“多数水平”.
这三个统计量虽然有所不同,但都可以反映一组数据的集中趋势,都可以作为一组数据一般水平的代表.
例3 某车间准备采取每月任务定额,超产有奖的措施提高工作效率,为制定一个恰当的生产定额,从该车间200名工人中随机抽取20人统计其某月产量如下:
(1) 请应用所学的统计知识,为制定生产定额的管理者提供有用的参考数据;
(2) 你认为管理者将每月每人的生产定额定为多少最合适?为什么?
(3) 估计该车间全年可生产零件多少个?
【分析】在确定生产定额时,需参考的数据应当有:平均数、众数、中位数. 合理的生产定额应确定在使多数人经过努力能够完成或超额完成的基础上. 如果将众数280定为生产定额,则绝大多数工人不需太努力就可完成任务,这就不利于提高工作效率;若将平均数305定为生产定额,则多数工人不可能超产,甚至完不成定额,会挫伤工人的积极性.
解:(1) 平均数305,中位数290,众数280;
(2) 取中位数290作为生产定额较合适,原因是这个定额使多数工人经过努力能完成或超额完成;
(3) 305×12×200=7.32×105(个),估计全年总产量约为7.32×105个.
5. 特点不同
平均数的计算中要用到每一个数据,因而它反映的是一组数据的总体水平,选择特征数表示一组数据的集中趋势时,我们用得最多的是平均数,用它作为一组数据的代表,比较可靠和稳定, 但容易受到极端数据的影响.
中位数是一组数据的中间量,代表了中等水平.中位数在一组数据的数值排序中处于中间位置,在统计学分析中扮演着“分水岭”的角色,由中位数可以对事物的大体趋势进行判断和掌控.如果在一组相差较大的数据中,用中位数作为这组数据特征的统计量往往更有意义.
众数代表的是一组数据的多数水平,若一组数据中众数的频数比较大,并且与其他数据的频数相差较大时,我们一般选用众数.还要特别注意如下例题:某班42名同学,年龄11岁的有24个人,年龄10岁的有8个人,年龄12岁的有6个人,年龄超过12岁的有4个人.则该班同学年龄分布的众数为11岁,它表明该班年龄为11岁的同学最多(注意众数不是24人).
例4 某班7个合作学习小组人数如下:4、5、5、x、6、7、8,已知这组数据的平均数是6,则这组数据的中位数是( ).
A. 5 B. 5.5 C. 6 D. 7
【分析】根据平均数的定义先求出这组数据中的x,再将这组数据从小到大排列,然后找出最中间的数即可.
解:∵4、5、5、x、6、7、8的平均数是6,
∴(4+5+5+x+6+7+8)÷7=6, 解得:x=7,
将这组数据从小到大排列为4、5、5、6、7、7、8, 最中间的数是6.
则这组数据的中位数是6,故选C.
【点评】此题考查了中位数,掌握中位数的概念是解题的关键,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数).
这三种特征数都可以作为一组数据的代表,但它们所表示的意义是不同的.选用它们表示一组数据的集中趋势时,一般是遵循“多数原则”,即哪种特征数能代表这组数据的绝大多数.我们解题时要正确选用合适的特征数来说明、评价、分析实际问题,避免误用和滥用.
6. 作用不同
平均数:是统计中最常用的数据代表值,平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准.因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等.
中位数:作为一组数据的代表,可靠性比较差,因为它只利用了部分数据.但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适.
众数:作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据.在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合.
例5 某校为举行百年校庆,决定从高二年级300名男生中挑选80人组成仪仗方队,现随机抽测10名高二男生的身高如下(单位:米):1.69,1.75,1.70,1.65,1.72,1.69,
1.71,1.68,1.71,1.69. 试确定参加仪仗方队学生的最佳身高值.
【分析】理想的仪仗方队应由身材较高,且高矮一致的人组成,因此身高的挑选标准应由身高中出现次数最多的数值所确定.
解:上面10个数据中的众数为1.69米,说明全年级身高为1.69米的男生最多,估计约有90人,因此将挑选标准定在1.69米,便于组成身高整齐的仪仗方队.
例6 甲、乙两名运动员在6次百米跑训练中成绩如下(单位:秒):
请你比较这两组数据的众数、平均数和中位数,谈谈你的看法.
【分析】本题需比较两人成绩的平均数、中位数和众数来衡量两人成绩水平情况.
解:甲运动员的成绩的众数是10.8,中位数是10.85,平均数为10.9;
乙运动员成绩的众数是10.9,中位数是10.85,平均数为10.8.
从两人成绩的众数看,甲的成绩好于乙的成绩;
从两人成绩的中位数看,两人的成绩相同;
从两人成绩的平均数看,乙的成绩好于甲的成绩.
(作者单位:江苏省宿迁市宿豫区实验初级中学)