【摘 要】统计可分为描述统计与推断统计。平均数是小学生最早接触的统计量,是描述一组数据集中趋势的良好代表量,可以利用所有数据的信息。在平均数的教学中,相比计算方法,更应该强调对其作为描述一组数据集中趋势的“代表量”的理解。首先,需要建立起“代表”的意识,理解平均数是描述数据整体集中水平的良好代表量。其次,在理解平均数的“代表量”意义的时候,应体现出层次性。
【关键词】平均数;统计量;代表量
进入新世纪以来,在《义务教育数学课程标准》(以下简称《课标》)实验稿[1]和2011年版[2]中,“统计与概率”作为一个单独的知识领域,得到了前所未有的重视。然而,“由于这些内容(统计与概率)是一种‘不确定性数学内容,与传统的‘确定性数学内容有较大区别,这使得数学教育工作者以及教学一线的广大教师普遍感到不适应”。[3]
在一个小学数学教师的QQ群里,曾经讨论过如图1这样的题目,在投掷5次铅球其中有1次犯规的情况下,对于平均成绩到底应该将总成绩除以4还是除以5有争议。有人认为要除以4,因为犯规这次不能反映水平,如果算进去会明显拉低其水平,这不合理。也有人坚持认为要除以5,因为既然是平均数那就应当按照总数除以次数的公式来做。而且如果犯规的可以不算的话,知道自己某次表现不好,那不如故意犯规,这样似乎更加荒唐。
那么,这里的平均成绩该怎样计算才合理?或者说,这里使用平均成绩是否合适?对于小学生而言,像平均数这样的统计量教学的关键是什么?我们应该对相关概念进行梳理,进而对教学有进一步的思考。
一、平均数到底要教什么?
如果仅就数学计算而言,平均数只是一个包含了加法和除法的算式,对数学计算来说实在是无足轻重,但平均数在统计学中是一个非常重要的概念。[4]平均数是小学生接触到的第一个统计量。“随着对统计教学的不断探索和实践,人们逐渐认识到对于统计学习而言,重要的不是画统计图、求平均数等技能的学习,而是发展学生的数据分析观念。”[5] 显然,对统计量的理解应该成为平均数教学的重要内容。那么,统计量的教学最关键的是什么?
从大的方面来说,统计有两个内容,一是描述统计,二是推断统计。[6]所谓描述统计,一般是指通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间的关系进行估计和描述的方法。描述统计分为集中趋势分析、离中趋势分析和相关分析三大部分。而推断统计,是研究如何利用样本数据来推断总体特征的统计方法。比如,要了解一个地区的人口特征,不可能对每个人的特征一一进行测量;对产品的质量进行检验,往往是破坏性的,也不可能对每个产品进行测量。这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。
对于平均数而言,其实在描述和推断中都有重要作用。平均数在描述统计中的重要作用,无须赘言,就是以一个数据代表一个群体的数据,体现的是集中趋势的分析。此外,平均数还有推断的作用。比如我们经常说的平均寿命(Life Expectancy),也就是寿命预期,体现的更多的是其推断预期的功能,而不是对现实状况的描述功能。
体现数据集中趋势的代表量一般用平均数、中位数与众数。其中平均数易受极端数据影响,但与中位数和众数相比,平均数能更多地利用所有数据的信息。[7]同时,平均数在误差模型中有很重要的作用,是真值的无偏估计。[8]平均数有算术平均数、加权平均数、几何平均数和调和平均数等,其中算术平均数的算法最简单,也最容易理解,小学阶段所学的平均数一般是指算术平均数。
统计量有描述和推断这两大功能,由于推断统计的难度较大,而且通常需要有描述统计的相关知识作为基础,因此,小学阶段在初次接触统计量的学习时,应体现其描述性更为恰当。因此,学生在学习平均数时,最需要的应该是理解平均数是描述一组数据的一个比较理想的统计量。
在教材中,对此也有体现。譬如,北师大版小学数学教材明确提出了“平均数是一组数据平均水平的代表”。[9]但需要指出的是,这里采用的是一个个体的多次水平,而非一个群体的整体数据。事实上,在体现描述功能的时候,可能用代表一组数据的情境会更合适。而一个样本的多次水平的情境在推断统计时更合适,如推测下一次可能有几个。而在人教版小学数学教材中,非常强调求平均数的两种方法:移多补少以及总数除以人数。[10]但在平均数作为一组数据平均水平的代表上似乎体现不足。
统计量的描述功能主要体现在“代表”上,而最能直观感受到“代表”的是以某一个数据的“代表”来描述一个群体。
二、如何选择合适的代表量?
要想体现统计量的描述功能,需要建立起“代表”的观念。也就是说,学生需要明白,当有多个数据量出现的时候,我们通常无法逐个描述,而需要用一些数据去代表。事实上,学生在生活中对“代表”并不陌生。比如,班级里有课代表,而且经常会有同学被选中去代表班级或者学校做什么事情,这是学生已有的经验基础。选择具有代表性的数据,在本质上其实并没有太大的区别。因此,需要让学生经历在生活中的“代表”的经验基础上认識数据的“代表”这一概念。正如国际知名统计教学专家本兹威(Dani Ben-zvi)所言:“对学生而言,最先考虑的其实是代表性,而不是平均数,所以应该先让学生思考代表性的相关问题。如你会选择谁来代表班级里女生的身高?学生会给出很多他们自己的理由,比如她的数学最好,她是我的好朋友,她是班级里最漂亮的女生,等等。这就是人们思考统计的代表量的起点,这也是人们最先接触统计时的思考方式。”[11]
而在确立了代表量这个概念之后,再来进一步考虑怎样的数据作为代表量在这里是最合适的。如前文所述,统计量有描述集中趋势和离中趋势的,其中最重要的三个描述集中趋势的代表量是平均数、中位数和众数。代表离中趋势的代表量有方差、标准差等。事实上,并不是任何情境都需要描述集中趋势,更不是任何情境都适合用平均数作为代表量。
因此,学生首先要具有选一个量去“代表”的意识,再来思考用哪个量去代表最合适。还是以代表班级身高为例,学生可以体会到在代表身高这件事情上,可能数学最好、我的好朋友、最漂亮等等都不是值得考虑的要素。而如果用最高身高或者最低身高作为班级整体身高的代表似乎也不合适。 “基于这样的目的,有些学生可能逐渐会想到一些不同的方法,比如说用‘中距量(Mid Range),将所有男生的身高从低到高进行排列,然后取数值的正中间。请注意,中距量跟中位数是不同的,中距量是指数值正好在中间,中位数的数值则很可能不是在正中间的,是偏向一边的。这是学生对集中量认识的开端。进而,有些学生会选择使用平均数,因为在电视上,在体育比赛中,他们看到很多的平均数。最终,学生可能会选择使用平均数,但是我们不应该从一开始就让学生用平均数来表示数据。学生应该有更多的理解数据的机会。”[12]
理解如何选择合适的代表量非常重要,却并不容易。回到本文开头图1的题目,之所以对应该如何计算平均成绩出现比较大的争议,其根本原因在于,在这个情境中,以平均数作为代表量来描述投掷水平是不恰当的。在投掷比赛中,作为个人成绩,显然最大值是更好的代表量,而平均数更适合做代表量的当然是一个群体的水准。比如,可以选择像跳水、滑雪等需要有多个裁判共同打分的项目。
针对图1的问题,理想的体现代表量的教学可以给出两种情境,一种是两个人的成绩,甲只有两次成绩,一次很好,一次很差,还有三次犯规。而乙五次都有,但都很平均。从个人水平而言,一般还是会认为甲获胜。另一种情境是团体赛,其中A组五人中有一人成绩很好,其他成员都很差,还有犯规,而B组五人水平比较平均。那从整体水平而言,可能会认为B组的水平会更高。
事实上,选择不合适的代表量的例子在教学中经常出现。比如,在平均数的教学中有一个非常典型的例子,出现一条河,旁边立个牌子,写着“平均水深1.2米”,然后问,小明身高1.4米,请问可以安全过河吗?题目的意图当然是明确的,学生需要明白,平均水深1.2米,但最深的地方是不知道的,很可能超过1.4米,所以是不安全的。这样一个看起来很精妙的设计,其实更多的只是关注了平均数的计算方法,却没有考虑平均水深的意义和价值。首先,准确的“平均水深”很难通过计算得到,这里所说的河流的平均水深并不是本文所讨论的“算术平均数”,而是“积分中值”,其计算的方法应该是河中所有水的体积除以水面面积所得的商。[13]更重要的是,用平均数作为一条河流深度的代表量,是没有意义的。相比而言,当去衡量一条河的深度时,用最深水深或者某个区域水深显然是更合适的代表量。
此外,如今关于平均数的教学,通常会特别强调平均数是一个虚拟的数。事实上,这样的强调并不合适。虽然计算出的平均数通常并不是具体某个样本的数值。但数学上并没有“虚拟数”这样一个概念。而且,“虚拟”并不应该作为理解平均数最重要的性质。相比而言,更重要的是理解用某个数据去“代表”一组数据的必要性,以及在怎样的情境下用哪个量去代表最合适。
三、两点教学建议
通过统计教学发展学生的统计素养和数据分析观念已经成为共识。在平均数的教学中,需要清楚平均数作为统计量,其最重要的价值在哪里,应该如何实现。
第一,学生在学习平均数的时候,需要建立起“代表”的意识,理解平均数是描述数据整体集中水平的良好代表量。小学阶段学生初次接触平均数时,最需要体会其作为代表量的描述功能。因此,在教学中,选用代表一个群组的整体水平的情境比较理想,这比用单个个体的多次数据更合适。
第二,在理解平均数的“代表量”意义的时候,应体现出层次性。第一个层次是以一个实际存在的样本来代表整体水平。在学生充分理解了这个层次的“代表”之后,再去理解实际存在的样本都不是整体水平的平均数的情况,需要以一个计算出来的数值来代表平均水平。此外,还应创造机会,让学生体会到平均数并不是唯一的代表量,在有些情境下,还有比平均数更合适的代表量。
参考文献:
[1]中华人民共和国教育部.义务教育数学课程标准(实验稿)[M].北京:北京师范大学出版社,2001.
[2]中华人民共和国教育部.义务教育数学课程标准(2011年版)[M].北京:北京师范大学出版社,2012.
[3]史宁中,孔凡哲,秦德生,等.中小学统计及其课程教学设计[J].课程·教材·教法,2005,25(6):45-50.
[4][8]史宁中.基本概念与运算法则——小学数学教学中的核心问题[M].北京:高等教育出版社,2013:70;71.
[5]史宁中,张丹,赵迪.“数据分析观念”的内涵及教学建议[J].课程·教材·教法,2008,28(6):40-44.
[6]赵焕光,章勤琼,王迪.真理相遇统计[M]. 北京:科学出版社,2015.
[7]吴正宪,刘劲苓,刘克臣.小學数学教学基本概念解读[M].北京:教育科学出版社,2014:379.
[9]刘坚,孔企平,张丹,主编.义务教育教科书:数学(四年级下册)[M].北京:北京师范大学出版社,2014:90.
[10]人民教育出版社课程教材研究所小学数学课程教材研究中心.义务教育教科书:数学(四年级下册)[M].北京:人民教育出版社,2012:91.
[11]章勤琼,达尼·本兹威.统计素养:小学阶段“统计教学”关注的重点[J].小学教学(数学版),2016,(12):4–7.
[12]金成梁.小学数学疑难问题研究[M].南京:江苏教育出版社,2010:151.
(温州大学 325035)