【摘要】通过内涵分析获得一般性行为表现,并促使教师经历数字特征意义溯源、理解深入、实践应用等过程,提高“用数据”发现与提出、分析与解决问题的能力,发展教师数据观念,惠及学生核心素养培养.
【关键词】统计与概率;数据观念;学科实践
2022年颁布的《义务教育数学课程标准(2022年版)》(以下简称《课标(2022年版)》)在“统计与概率”领域发生了较大变化,提出了更高的要求,旨在进一步发展学生“数据观念”.然而,由于部分教师本体知识的欠缺,以及对“数据观念”认识的不到位,导致在课程实施过程中出现了一定偏差,统计课逐渐失去了“统计味”.要发展学生“数据观念”,前提是提升教师的统计素养.教师应加强学科实践,通过经历学生学习的“三个过程”,提高“用数据”发现与提出、分析与解决问题的能力.
1数据观念的内涵与表现
《课标(2022年版)》对初中阶段“数据观念”作如下界定:数据观念主要是指对数据的意义和随机性有比较清晰的认识[1].首先,具备用数据分析问题的意识.数据蕴含着信息,但数据是否具有统计意义则取决于现实的问题,不同问题往往需要收集不同的数据;其次,掌握用数据分析问题的方法.数据分析方法多样,需要根据问题背景选择适切的方法,要抓“主要因素”;第三,建立数据随机的观念.一方面,对于同样的事情,每次收集到的数据可能会不同.另一方面,只要有足够的数据就可能从中发现规律[2].然而,现在的教学更注重学生统计方法的掌握,对数据意识和随机观念有所偏失.
考虑到“数据观念”的内涵以及它在培育“三会”过程中的作用,再结合相关文献[3],我们将其行为表现概括为:在观察时能“看到数据”,在思考时能“用好数据”,在表达时能“借助数据”.归根到底,就是将“数据”融入于问题发现与提出、分析与解决的全过程,从现实世界中感受“数据”的普遍存在与广泛价值.
“数据观念”绝不仅仅是计算某个统计量、画一些统计图表等技能,而是一种需要在亲身实践中培养出来的感觉,这种“经历、体验、感受”应是初中阶段统计与概率学习的关键.
2数据观念的培养与实践
发展学生数据观念素养前提是转变教师的观念,提升教师的素养.而通过“灌输”的方式试图让教师“像科学家一样思考”从而形成“科学头脑”显然行不通,教师必须像学生一样去经历“理解—关联—创新”这个完整过程,尝试对数字特征意义溯源,搞清来龙去脉;理解深入,厘清纵横联系;创新应用,加强学科实践,逐渐学会“用数据”观察、思考和表达.
2.1在追本溯源中理解统计量的意义
若把统计考题简单地理解为一道计算题,从而认为代入公式进行程序化地计算就是全部,忽略其背后丰富的统计思想,这显然是舍本逐末.计算一个统计量并不是真正目的,开发、选择适合的统计量来解决一个实际问题才有价值.对于一些新的数字特征,教师理应主动尝试意义溯源,去体会其发生过程,以2022年浙江省衢州市中考数学第21题所提出的“五天滑动平均气温”为例.
由于对相关领域的不熟悉,教师在做完这道统计题之后,会很自然地萌生出一系列问题:命题人是怎么想到利用这样的背景来命制试题的?一年四季究竟如何划分?怎么定义春天?为什么要提出5天滑动平均气温这个概念?它的优势是什么?还是现在主流的判断方法吗?是否需要改进?……
永葆好奇心、求知欲,主动参与数学探究活动,敢于创新,这都是用数学的眼光观察现实世界的具体表现.教师应主动查阅资料,促使学习真正发生.事实上,原题中第3小问“某媒体报道:‘夏天姗姗来迟,衢州2022年的春天比去年长.’”可能是命题的“源”,真正体现了数学源于生活,更展现了命题人的“数学眼光”.划分四季方法很多,例如天文划分法、气象划分法、节气划分法等,但它们共同的缺点就是全国各地都在同一天进入同一个季节.为了使季节的划分更加符合当地的气候以及生产生活的需要,张宝堃于1934年提出了“候平均气温法”.又为了不人为割裂天气过程的现象,钟保粦于1995年提出了试题中所呈现的“5天滑动平均气温”的方法,一直沿用至今.
每个统计量都有其内在的价值与意义,绝非空穴来风,这种刨根问底,追本溯源的精神,可以促使教师更加深入地去理解这些数字特征,是统计与概率学习应有的态度.
2.2在纵横联系中形成结构化的体系
知识学习不可能一蹴而就,所以往往是螺旋上升,具有层次性、阶段性.但作为教师,应站在更高的视角来审视、理解数学问题,理清知识发生发展的结构,只有观点高了,事物才能显得简单而明了.以平均数结构化体系的探究为例.
2.2.1本源性探究
算术平均数x=1n(x1+x2+…+xn),是将一组数据之间的差异抹平后得到的这组数据的代表值,因而具有性质①:(x1-x)+(x2-x)+…+(xn-x)=0,反映了这组数据的集中程度.
“形”的理解[HTSS]亚里斯多德根据“截长补短”的思想率先尝试给出平均数的几何定义.对于长度分别为a和c(a>c>0)的线段,所谓“平均”就是寻找线段b,使得a-b=b-c.
“数”的意义[HTSS]算术平均数还具有如下性质②:
∑ni=1(xi-a)2≥∑ni=1(xi-x)2,当且仅当a=x时,等号成立.
这一性质揭示了算术平均数是与一组数据偏差平方和最小的代表值,即离差平方和最小,同时也说明方差的特殊性.证明过程中用到的平方和分解的方法,在统计分析中应用广泛.若从应用的角度看,性质②也是最小二乘法估计参数的原理.由此可见,在义务教育阶段更加重视平均数的教学也有道理.
2.2.2加权性理解
小学阶段的平均数考察的是“数据的大小”对平均数的影响,那么初中阶段的加权平均数就是从“数据的(相对)多少”这个角度去诠释平均数的影响因素.
随着学习的不断深入,引入随机变量之后又会出现“数学期望”.对于一组离散型随机变量X1,X2,…,Xn,p(X1),p(X2),…,p(Xn)为Xi所对应的概率密度函数,数学期望则被定义为E(X)=∑ni=1xipi.若把p(Xi)看成是数据Xi出现的频率f(Xi),则E(X)就可被理解为这组数据的加权平均数.教师只有理清了平均数发展的结构,才能在课堂教学时更好地突出重点,突破难点.
2.2.3随机性渗透
再者,由于现实世界中许多随机现象人们无法掌握全部信息,不能直接进行分析,因而需要进行随机抽样,故在初中、高中阶段,对样本数据的意义和随机性的理解,以及统计推断显得愈发重要,要求学生能利用样本平均数去估计总体平均数.有时还需要根据频率分布表或直方图近似计算平均数,等等.后期通过概率论的系统学习,将进一步探索统计背后的机理,例如大数定律就严格地描述了样本均值与总体均值(数学期望)的关系,说明频率最终会稳定到概率.
从本源性探究,到加权性理解,再到随机性渗透,对平均数这个数字特征的理解贯穿统计与概率学习始终.正如著名统计学家陈希孺所说,如果我们从理论的角度走一点极端,则可以说,一部数理统计学的历史,就是从纵横两个方向对算术平均数进行不断深入研究的历史[4].反复迭代,逐步深入,建构结构化的知识体系,这也是教师专业发展的必经之路.
2.3在创新应用中提升“用数据”的能力
“数据观念”是用数学的语言表达现实世界的一种具体表现,因此需将新知的学习融入于问题解决的过程,在联系中尝试应用.教师应葆有学科实践的精神,用数学家的思维理解、发现、学习数学知识,以“数据分组”为例.
《课标(2022年版)》新增“经历数据分类的活动,知道按照组内离差平方和最小的原则进行分类的方法”,指向“数据的分类与整理”,并以把我国10个省份依据人均GDP的多少分为两组(例85)为例进行说明,还建议设计成一个跨学科主题式学习.那么,教师是否可以先做尝试呢?
创设情境:有5个样品,它们的某个指标对应的数据分别是1,2,4.5,6,8.
聚类是一种最常见的分类分组方式.所谓聚类,就是将研究对象进行分类,其核心思想就是每次都把“最接近”的对象聚成一类,依次归类.若要将5个样品分为4类,即选择“最接近”两个样品进行合并.在一般观念下,常常会把“绝对值之差(距离)最小”作为度量“远近”的标准,于是先将1和2聚成一类{1,2}.
当要将样品分成3类时,教师会产生困惑,因为不知如何去度量类{1,2}与其它样品之间距离,即如何刻画类Gi与类Gj之间距离Dij.查阅文献,不难发现很多定义类间距离的方法:最短距离法、最长距离法、类平均法,等等.由于篇幅,本文仅以“最短距离法:两类最近样品(指标)的距离,即Dij=min{dkl|k∈Gi,l∈Gj}”为例说明.
定义了类与类距离后,则可以逐步进行归类.
第一步,各自成一类,计算类间(单个样品之间)的距离,如表2所示:
并记G1={1},G2={2},G3={4.5},G4={6},G5={8}.
第二步,将距离最近的G1={1}和G2={2}合并得到G6={1,2}.重新计算类间距离,如表3所示:
第三步,将距离最近的G3={4.5}和G4={6}合并得到G7={4.5,6}.重新计算类间距离,如表4所示:
第四步,将距离最近的G7={4.5,6}与G5={8}合并得到G8={4.5,6,8}.重新计算类间距离,如表5所示:
第五步,将G6={1,2}和G8={4.5,6,8}合并成一组.
需要指出的是,计算新类与其它类的距离并不需要每一步都重头开始,可由产生新类前的距离表方便地递推得到,于是这个相对繁杂的计算过程就可以通过编程实现.
在此基础上,教师就能获得系统聚类分析的基本思想与步骤:首先定义样品(指标)之间的距离和类与类之间的距离.一开始各自成一类,此时类与类的距离等于样品之间的距离;然后选择距离最近的两类合并,重新计算新类与其它类的距离;重复上述操作,每次缩小一类,直至所有样品归为一类.这个归类过程可用聚类图(或称谱系图)直观呈现.
回到《课标(2022年版)》中提出的“离差平方和法”,也称Ward法.若把两类归类所增加的离差平方和看成类之间的平方距离,即Dij=S2i+j-S2i-S2j,就可以和上述方法统一起来.如前所述,算术平均数具有离差平方和最小性,《课标(2022年版)》重点突出这个方法也是顺理成章.
定义类与类之间距离的方法很多,不同的方法就会产生不同的聚类分析,也可能会得到不同的分类.在统计的世界里,没有对和错,只有好与坏、合适还是不合适,实践才是检验真理的唯一标准.教师在理解、学习、探索的过程中,不仅实现新知的再创造,而且真正提升了“用数据”的能力.
3几点思考
著名统计学家C.R.Rao曾说:“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的世界里,所有的判断都是统计学.”这表明“数据观念”在现代社会的重要性,它从根本上改变了人们的思维方式.在促使教师形成结构化数学知识体系和数据观念的过程中,最重要的是转变教师的观念和提升教师的能力.教师不仅要拥有用数据解决问题的能力,更要有主动尝试用数据解决问题的意识.通过不断的学科实践,教师能真正理解知识与思想方法的产生与来源、结构与关联、价值与意义.
3.1加强相关领域的重视程度
“统计与概率”是初中数学课程四大领域之一,是发展学生数据观念的主要载体.然而,教学现状显示师生对此领域的重视程度与其重要性不匹配.调研发现,学生对某些概念的理解并不到位,数据观念水平也较低.一部分教师认为统计与概率的内容相对简单,尤其在评价考试内容和形式基本固定的情况下,学生只需投入较少时间和精力就能取得高分.另一部分教师认为统计与概率“高深莫测”,自身对某些知识的理解存在困难,因此在课堂教学中只能浅尝辄止.实际上,对于统计与概率的教学,最亟需转变的是教师的观念.教师应在核心素养导向的课程目标下重新审视相关内容,更深入地理解数据观念的内涵,探究本领域的核心知识与基本思想方法,以更有效地促进学生学习和培养学生的数据观念.
3.2加强实践活动的创新体验
数据观念的核心是在现实情境中“看到数据”“用好数据”,然后“借助数据”理解并表达随机事件发生的规律.因此,统计与概率的学习需要融入丰富多彩的实践活动之中.然而,由于教学时间和空间的限制,教师在实际教学中往往采用讲授法来代替学生的动手实践,且即使组织活动,也常创设与学生生活脱节的问题情境.教师应先身体力行,言传身教,率先经历学生的学习过程.在素材选择上,可以尝试对具有现实意义的数字特征进行溯源,如2022年浙江省衢州市中考数学第21题所提出的“五天滑动平均气温”,这不仅能巩固和补充现有知识,还能激发学习兴趣,提升教师“看到数据”的意识.在知识理解上,教师可以聚焦于某一个或几个统计量进行深入探究,从统计与概率整个领域的视角出发,在纵横联系中体会核心知识和基本思想方法,“理解数据”并能“用好数据”.在方法应用上,根据《课标(2022年版)》提出的要求,创设相应的项目学习活动,促使学生经历较为完整的探究活动,在创新体验中形成正确的数据观念.
参考文献
[1]中华人民共和国教育部制定.义务教育数学课程标准:2022年版[M].北京:北京师范大学出版社,2022:10.
[2]史宁中,张丹,赵迪.“数据分析观念”的内涵及教学建议:数学教育热点问题系列访谈之五[J].课程·教材·教法,2008(06):44-44.
[3]鲍建生,章建跃.数学核心素养在初中阶段的主要表现之六:数据观念[J].中国数学教育,2022(11):3-11,21.
[4]陈希孺.数理统计学简史[M].长沙:湖南教育出版社,2002.
作者简介
杨灿权(1990—),男,浙江杭州人,中学一级教师,杭州市教坛新秀;多次开设省市级公开课和讲座;主要研究中学数学教学,发表论文多篇.