数据意识是小学阶段数学课程要培养的学生核心素养的主要表现之一,其培育载体主要是“统计与概率”领域的内容。虽然培养学生的数据意识离不开相应的统计知识与技能,但数据意识不等同于统计知识与技能。例如,“会求一组数据的平均数”不代表学生知道平均数的统计意义、具有数据意识,数据意识主要体现在运用平均数解释与解决问题中。厘清数据意识的行为表现,尤其是针对特定统计内容的具体表现,即“学生能够解决哪些问题”,是培养学生数据意识的关键。
那么,教师如何掌握数据意识的行为表现以便于在实践中有效落实呢?本文结合“平均数”单元,描述数据意识在该单元的具体表现、调研学生的数据意识现状、描述该单元学习目标的不同进阶层级,以便有效落实素养目标。
一、基于2022年版课标确定“平均数”单元中数据意识的具体表现
平均数是小学阶段唯一一个正式学习的统计量,有的教材将其与复式条形统计图编排在同一个单元。认识平均数及解决实际问题一般需要2~3个课时,本文中的单元指由这2~3个课时组成的小单元。如何确定数据意识在“平均数”这一单元的具体表现呢?我们需要研读2022年版课标中相应内容并掌握平均数的本质。
2022年版课标明确提出数据意识的内涵(“主要是指对数据的意义和随机性的感悟”)及三个方面的行为表现:“知道在现实生活中,有许多问题应当先做调查研究,收集数据,感悟数据蕴含的信息;知道同样的事情每次收集到的数据可能不同,而只要有足够的数据就可能从中发现规律;知道同一组数据可以用不同方式表达,需要根据问题的背景选择合适的方式。”这三个方面的行为表现较为抽象、笼统,例如,“感悟数据蕴含的信息”指什么呢?“感悟到的信息”有何作用?学习不同的统计知识、技能过程中所培育的数据意识在这三个方面可以各有侧重,要“具体问题具体分析”,结合具体的统计知识将其行为化、可操作化。“平均数”单元主要侧重前两个方面。
一组数据的平均水平是这组数据蕴含的重要信息,是对不同组数据做比较、做推断、得出结论的重要依据。平均数(小学阶段指算术平均数)的本质是能够刻画一组数据的整体水平(或称为平均水平),反映这组数据的集中趋势。大多数生活情境中都可以用平均数代表一组数据的整体水平,可以说,认识平均数的代表性是数据意识或“知道平均数的统计意义”的本质体现。
基于2022年版课标及平均数的本质,数据意识(或平均数的统计意义)在该单元的具体表现如下:
第一个方面,知道平均数可以代表一组数据的整体水平(简称代表性),与中位数、众数相比较而言,平均数具有虚拟性。例如,基于学生的生活经验,与“中间数(中位数)”“出现次数最多的数(众数)”对比后,学生认可平均数代表一组数据平均水平的合理性、适用性。
第二个方面,知道平均数的简单特征(简称有界性、敏感性),能根据特征解释或解决生活中有关平均数的简单问题。例如,知道平均数小于或等于这组数据的最大值,大于或等于这组数据的最小值;平均数易受极端数据影响,增加或减少某个极端数据会显著影响平均数的大小。
第三个方面,关注到数据来源或数据类型,知道运用平均数解决实际问题时应尽可能获得具有随机性的数据,初步了解求得随机数据的平均数、运用平均数推断所得到的结论更公平与合理(简称随机性)。例如,通过随机取样获得的数据更公平、合理;去掉评委的最高分、最低分,是为了尽可能去除人为因素、减少极端数据的影响;正确、合理取样非常重要,否则就可能出现被平均的现象。
其中,第三个方面的表现是数据意识的最高水平,但它贯穿学习平均数的全过程,所以第三个方面的调研可以在学前、学后都做。对于第一个方面,学生在正式学习平均数概念前就有一定的经验基础,可以通过前测分析不同学生的表现水平,也可以通过后测评价学生的学习效果。第二个方面则反映在平均数概念学习后的问题解决行为中,可以采用后测分析不同学生的表现水平。基于以上认识,我们对浙江省宁波市鄞州区、海曙区、奉化区、慈溪市的200名四年级学生进行前测、后测,并对不同表现水平进行简要分析。
二、学生数据意识表现水平的测评任务及相关学情分析
(一)关于平均数代表性维度的测评任务与学情分析。
针对平均数代表性维度的测评,设计了“选取全班同学身高的代表”“选取套圈比赛中小组整体水平的代表”这两项任务。在身高情境中,学生基于自己班级实际收集数据;在套圈比赛情境中,教师提供数据。利用这两项任务对学生进行前测,要求他们以纸笔作答的形式完成,教师选取部分学生进行访谈。
任务1:选取全班同学身高的代表。设计“你会选哪位男(女)生代表全班男(女)生的身高?请说明你选择的理由”等一系列问题。该任务侧重考查学生对代表量的认知经验和理解水平。
统计显示,学生选取的代表数据主要为最值、中位数和平均数这三类。第一类,最值,即选择最高(最低)的学生的身高作为代表数据。其中,选取最高的学生的身高作为代表数据的占35%,选取最低的学生的身高作为代表数据的占2%。第二类,中位数,即选择班级里身高居中的学生个体数据作为代表,选择的理由包括“中等”“不高不低”“比较均匀”“和很多人(大多数)差不多高”等。选取中位数作为代表数据的占34.5%。第三类,平均数,即选择全班学生身高的平均数作为代表数据。选取平均数作为代表数据的占12.5%。可以发现,三类数据中,选取最值作为代表数据的学生最多,选取中位数的次之,选取平均数的最少。
通过访谈发现,学生对“代表”一词的认识带有较浓的主观色彩,受社会生活层面“课代表”“人民代表”等已有经验的影响,把“代表”理解为“群体中最高水平”,如选取最高的学生的身高作为代表数据,甚至不少学生流露出“选最高的学生的身高作为代表数据全班比较有光彩”等情绪。近三分之一的学生能够基于“中等”“不高不低”等理解,选择中位数作为代表数据,说明较多学生对中位数有朴素又比较准确的经验基础。而平均数是经过“加工(匀乎匀乎,先合再分)”后得到的数据,不直观、不一定出现在原始数据中,具有虚拟性,所以选择平均数作为代表数据的学生较少。当然,也有可能问题“你会选哪位……”影响了调研结果,导致选平均数的学生最少。
任务2:选取套圈比赛中小组整体水平的代表。以条形统计图呈现“套圈比赛,每人套15次。男生4人,套中个数分别为6、9、7、6;女生5人,套中个数分别为10、4、7、5、4”等情境信息,问题为“用哪个数代表男(女)生套圈的整体水平比较合适?你是怎么想的”。该任务侧重考查平均数与这组数据中某个数据重合情况(如男生小组的平均数为7,与这组数据中的7重合;女生小组的平均数为6,与这组数据中的数均不重合)对代表量选取产生的影响。该任务在课堂教学中完成。
数据显示,男生小组的代表量选取占比从高到低依次为:9个,占27%,理由是“最多”;7个,占26%,理由是“中间数”“比较平均”;6个,占16.5%,理由是“出现次数最多”。女生小组的代表量选取占比从高到低依次为:10个,占28%,理由是“最多”;7个,占16%,理由是“(4和10的)中间数”;6个,占12%,理由是“平均数”;4个,占9.5%,理由是“最少”。可以发现,学生在选取代表量时,最值数据仍然是占比最高的选项,中位数、众数是重要选项,学生对平均数相对陌生。当平均数出现在原始数据中时,学生容易想到用平均数作为代表数据;否则,学生不容易想到用平均数作为代表数据。
(二)关于平均数虚拟性、敏感性维度的测评任务与学情分析。
针对平均数虚拟性、敏感性维度的测评,设计了“居民人均收入辨析”问题,采用纸笔作答的形式进行后测。测评任务如下:
统计数据显示,2021年,宁波全市居民人均收入65000元,居全国第8位。聪聪看到后说:“骗人!我还是小学生,哪里来的65000元收入?”你同意聪聪的观点吗?请说明理由。
本任务主要透过被平均现象(调研对象中存在极端数据),侧重考查学生对平均数虚拟性、敏感性特点的理解程度。6%的学生同意聪聪的观点,主要原因是对“人均收入”概念的认识出现偏差,认为“小学生没有收入”“这个收入是大人的平均收入”;91%的学生不同意聪聪的观点,其中68.5%的学生能围绕平均数的虚拟性、平均数容易受极端数据影响等特点展开说理,观点包括“人均收入不代表每个人的收入”“老板收入很高,人均收入会被老板的收入拉高”“小学生收入是0元,其他人会补上拉平”等。这说明多数学生对平均数的虚拟性、敏感性等特点的理解较为充分、准确。
(三)关于“关注数据来源、初步感悟随机性”维度的测评任务与学情分析。
“关注数据来源”维度的测评包括“班级学生身高整体情况介绍的数据收集与统计”“免票线提高背后的数据收集与统计”这两项任务,分别采用前测与后测方式进行,以了解学生对相关任务的数据来源的关注情况。
任务1:班级学生身高整体情况介绍的数据收集与统计。采用学生熟悉的身高情境,前测内容为“如果要向外地的朋友介绍你班男(女)生身高的整体情况,你会收集什么信息”。问题相对开放,指向“关注数据来源,用合适的方法收集恰当的数据来解决问题”,该任务要求学生以纸笔作答的形式完成。
调研结果显示,学生主要有“问同学”“查资料”“现场统计”等收集信息的方式,知道获得数据的不同途径和方式。在读懂题意、设计统计内容方面,8%的学生对问题的理解不合题意、与统计问题无直接关联;17.5%的学生认为收集全班男(女)生的身高和体重这两方面的信息;其余学生均认为收集身高方面的信息。在明确提出统计内容与统计对象方面,学生的答案多样化,其中,40%的学生提出“统计全班男(女)生的身高”,17.5%的学生提出“统计全班男(女)生的身高和体重”,11.5%的学生认为“统计最高的学生的身高、最低的学生的身高及中等身高”,12.5%的学生直接提出“统计平均身高”,6%的学生认为“统计某个人的身高”,4.5%的学生认为“统计区间人数”。
面对“介绍自己班级男(女)生身高的整体情况”这一实际问题,绝大多数学生能针对问题展开数据调查、数据收集。不过在获得数据的途径和方式上存在一定的差异,近60%的学生认为要收集和统计全班学生的身高数据,少量学生采用了抽样数据,选取对象涉及对代表量的思考,如区间、中位数(中等身高)、平均数等概念,对平均数概念的学习具有积极意义。当然,“收集某个人的身高”“收集最高的学生的身高、最低的学生的身高”等相关经验对认识平均数的代表性带来一定干扰,教学时教师要合理引导。
任务2:免票线提高背后的数据收集与统计。后测内容为“杭州市公交车儿童身高免票线从原来的1.0米提高到1.3米。你认为免票线提高的主要原因是什么?1.3米这个数据可能是怎样得到的”。本任务主要结合公交车儿童身高免票线提高的事实,侧重考查学生对平均数统计意义(关涉用抽样数据的平均数推断总体的平均数)的理解情况,该任务要求学生以纸笔作答的形式完成。
虽然有62.5%的学生认为“杭州市儿童平均身高上升了,1.3米可能是杭州市儿童身高的平均数”“大多数杭州市儿童身高都已经1.3米了”,但没有提及1.3米这个数据是怎样得到的。17.5%的学生没有回答或其答案是无效的,如“根据小学一年级学生的身高得来的”“根据公交车的高度、公交车司机的身高得出的”“其他地区都是1.3米”“乘公交车的人变少了”等。尽管有学生涉及诸如“通过调查统计下决定”的数据统计决策,但比例仅有2%,且对数据来源、抽样和数量都没有关注。
上述调研数据显示,学生对平均数的上述统计意义理解不完整、不充分,无法从实际问题解决中对统计背景、数据收集、数据处理和统计决策有清晰的认识,也无法从抽样、大数据和随机等角度对平均数的统计意义做出解释[1],所以前述第三个方面的表现是最高水平,从统计角度解释该类问题对大多数学生来说有难度,数据意识这个素养目标在该单元有不同的进阶层级。
三、基于调研结论划定数据意识目标的进阶层级
基于以上分析,就第二学段“平均数”单元中数据意识的表现水平可以得到以下基本结论。
第一,在熟悉的情境中,学生对数据调查和收集有较为丰富的生活经验基础,但在确定收集数据的对象和数量上存在差异,对一组数据容易以偏概全。例如,面对“向外地的朋友介绍你班男(女)生身高的整体情况”任务,学生有较强的数据调查、收集意识,但收集数据的数量容易受“数据代表”的主观影响,如事先确定收集最高的学生的身高。
第二,在选取数据代表的前概念经验中,学生容易把“一组数据整体水平的代表”理解为“群体中最高水平”。作为数据代表,中位数、众数更容易让学生看得见,是不可回避的重要数据代表选项,在数据代表选取时要明显优于平均数。学生对平均数的代表性比较陌生,选择平均数的学生中,很多学生前期就对平均数有所了解甚至已经学习过。在提供的一组数据中,平均数是否与其中某个数据重合,影响着学生对平均数的直观理解程度。
第三,从对平均数的虚拟性、敏感性、随机性等特征的后测来看,学生对平均数的虚拟性的理解较为充分,但对平均数的统计意义的理解不到位。
基于前述分析,“平均数”单元的学习目标为“在具体情境中探索平均数的意义,理解并体会平均数具有代表性,知道平均数的统计意义”。其中,“知道平均数的统计意义”即培养学生的数据意识这一素养目标主要体现在如下五个进阶层级[2]。2022年版课标没有具体细化“平均数”单元中数据意识的不同表现水平,也没有规定达到各个水平的学生人数百分比,我们只能根据教学实际情况凭借教学经验确定各层级人数的百分比。百分比到底多少合适,还需要在实践中进一步调研。
层级1:具有选择代表量的意识。从个人意愿出发,能在一组数据中选取一个数据代表整体水平,但作为代表的数据与这组数据的整体水平之间没有密切关联。(5%)
层级2:具有选择合适代表量的意识。能够从实际问题出发,从一组数据中选取中间数(中位数或接近中位数的数据)、众数(出现次数最多的数据)、平均数代表整体水平,并能给出一定的解释或说明。(85%)
层级3:理解平均数作为代表量的合理性。根据问题情境需求,能选择平均数作为代表量代表整体水平,知道平均数反映一组数据的集中趋势,体会一组数据的平均数与实际个体数据的联系和区别。(70%)
层级4:认识平均数作为代表量的适用性。知道平均数容易受极端数据影响,不是所有情境中都采用平均数作为代表量,能对实际生活中“去掉最低分和最高分再取平均数”的数据处理方法进行解释。(60%)
层级5:了解获取并利用随机数据的平均数进行比较、推断的必要性。知道生活常见情境中的平均数是通过抽样调查得到的,样本数据越多,去掉极端数据后所得到的平均数越有代表性,推断越合理。(40%)
总之,理解平均数的代表性是形成数据意识的前提和基础,感悟随机性是最高水平。课堂教学时,一定要让学生经历如下过程:对比分析原始数据中已经存在的“中间数”“出现次数最多的数”和经过运算才能得到的“平均数”,明确将谁作为代表。在对比分析、辩论与研讨过程中,学生能够初步感悟统计结论没有对错之分,只有好不好、合理不合理之分,这是统计学的精髓。我们应尊重并改造学生的数据代表选取的前概念经验,拉长“平均数刻画一组数据的集中趋势”“理解平均数作为一组数据代表的必要性与适用性”过程,通过单元整体教学帮助学生形成初步的数据意识。
参考文献:
[1]鲍建生.打造经典:观摩吴正宪老师“平均数”一课的几点感想[J].小学数学教师,2018(7/8).
[2]宋煜阳,刘加霞,沙国祥.求实达理,不断推进“学习进阶”研究[J].教育视界(智慧教学),2022(10).