范文贵
(天津师范大学教育学部 300387)
现代世界需要人们具备理解和解释数据、根据数据进行决策以及批判性地评估涉及数据情况的基本技能.面对不确定性的挑战,人们做出决策的基础是统计素养而不是感情和信念.日常生活充满着许多不确定的因素,如天气变化、经济变动等,而用来处理这些不确定因素的主要工具就是概率与统计.
基于统计工具、相关专业知识和批判性读写技能,人们学会处理现实世界随机事件和数据,自主决策遇到的未知情况.需要学生认识强大的统计概念与实践的关联,有机会解决复杂的社会问题,努力使统计成为普通公民阅读和书写的重要工具.[1]媒体报道等社会背景是统计素养的基础.强调认知技能,语境理解、倾向批判性思维可能对统计教学和评估提出挑战.统计资料越来越多在广告、论述或报告中出现.
学生理解统计变异的基本性质,将其用于STEM环境问题解决,展示他们思考变异和数据使用能力.建立统计理解将增强年轻学生参与STEM问题解决的信心.[2]掌握社会统计数据可以帮助公民处理一系列复杂的问题,积极参与公开辩论并维护自己的权利.[3]对数据信息消费者来说,了解误差范围非常重要.记者观点与点估计结果争论的倾向忽略了一个事实,即民意调查是针对感兴趣的人群样本进行的,这种调查存在不确定性.[4]统计数字是「有依据的猜测」的基础,读者自身需要具备批判性思考能力,才不致有误读数据的危机.
统计(Statistics)这个名词的英文字源自印欧语系字根(standing,status,state,understand)等,这几个字根的意义都是在描述事物的现象.统计就是基于问题解决需要搜集有用的数据、整理及分析数据,呈现并解释数据,最后希望可以预测未来的现象.因此要探讨如何收集数据、整理数据及如何由数据解释现象、推断发展趋势.统计包括「描述统计」与「推断统计」两部份,「描述统计」是只描述资料的性质,而「推断统计」则是依照资料的性质进一步去推测、预估整体的特性.
统计的目的是透过分析和整理数据,找出数据中所隐含的有用信息,用以解释某一现象或用来作预测、推断.统计是用来处理数据的,而数据由数字组成,但它不只是单纯的数字,它是有内容的数字,因此统计就是从数据中找出信息,形成结论.
统计概念由易至难的发展可以分为四个层次:(1)阅读与简易解读统计图表;(2)深度解读统计图表、完成相关统计量的计算;(3)理解基础统计训练或经验的统计概念,例如平均数的意义、样本和总体的关系、不同统计量如平均与总和的适用时机等;(4)完成直觉无法判读的统计,例如非整数平均数的意义、折线图的预测等.
Shaughnessy给出四个统计概念发展期的特性:(1)非统计性(Non-Statistical):未经过统计性的思考,对事件以信念、意志、因果关系或「别无选择」地作出反应.(2)初始统计性(Naive-Statistical):利用启发式的判断,例如代表性(Representativeness)、可使用性(Availability)等,透过经验或非正式的统计模式作反应,通常指略俱统计概念者.(3)再现统计性(Emergent-Statistical):具有利用正规的统计模式于简单问题解决的能力,理解到直觉反应与数学模式的差异,通常受过一些统计训练,也开始了解“机会”在统计学上的多重表征.(4)实用统计性(Pragmatic-Statistical):对于数学上随机模式有一定程度的了解,能比较不同的模式或提出相对的随机模式,面对问题能选择适当统计模式,并应用在问题解决上.[5]
统计研究工作的首要任务就是收集「有价值的」资料与数据:样本数是否足够代表总体,样本是否具有足够总体代表性.通过分析数据,研究者将一些有系统的型态从无所不在的变异性中抽离出来;也可以做出一些虽不确定、但不确定性很小的结论,更重要的是,依据统计推断,我们可以声明:所得结论的不确定程度到底有多少.著名统计学家Rao认为所谓统计学,是在包含不定性的现实中,研究如何利用信息来思考并给出行动方针的学问.[6]统计学为人们提供一个工具,探索对周围世界的量化信息明智地作出反应.它以现象总体的数量方面为研究对象,阐明统计设计、统计调查、统计整理和统计分析的理论与方法,是一门方法论科学.
2.2.1什么是统计思维
与其他数学相比较,统计需要一种不同的思维.在统计的质量控制和过程促进的范围内,统计思维是“思维的过程”,察觉变异围绕我们所做的每件事情,所有的工作是一系列相互联系的过程,变异的确认、表征、量化、控制、减少等提供改善的机会.[7]统计思维独特的地方是具有将过程视为整体的能力,包括:理解变异在统计过程的关系和意义;有能力使用超出文字描述的方法来探索数据隐藏的规律;产生超出研究者所期望的新问题.
关于统计思维,研究者强调:所有工作由一系列相互关联的过程组成,以完成必须实现的预期目标,为了取得成功,每一个子过程都必须经过检验,来定义机会和改进的区域,以有利于完成整个系统工作.Chance将统计思维定义为,认识统计调查工作为什么和怎样进行以及背后的“想法”,这些想法包括变异无处不在的性质和何时及如何使用适当的方法分析数据.[8]统计思维是一种在解决统计问题时体现特有的思考模式,它包括在数据收集、选取样本、建立模型及解释结论的过程中,不断地探索更好的问题解决方式,了解解题过程步骤,认识到变异存在于解题的每一个环节,能够妥善地处理变异,最后,在形成结论时,还要有批判质疑的能力,这样循环往复的思维过程,会使得问题解决更加完善缜密,趋近于答案的本质.
变异是无所不在的,任何关于统计思维的探讨都必须检验「变异」在其中的角色.变异会对实际问题解决造成严重影响,而统计方法可以让我们了解一个受到变异困扰的世界.统计学研究者将变异模型化,目的是为了预测、解释或控制,透过寻找样式和变量的关系,了解变异的来源.估计变异的程度和与变异共存运作,变异的样式使我们能够预测和测量变异,开启控制变异的选项利于解释因果关系.统计思维是一种创造性思维,这种思维能力通常不能与身俱来.创造性的统计思维必须有数量性、容错性及逆向性的特质;具备不确定性、变异性及置信性的理念;拥有融通能力、观察能力及抽象能力.
研究者认为统计思维是一种在解决统计问题时的思考模式,它包括在数据收集、抽取样本、设计模型及解释结论的过程中,不断地思考更好的解决问题的方式,了解为什么解题过程所进行的步骤,注意到变异存在于解题的每一个角落,并且能够妥善的处理变异,最后,当结论形成时,还要有批判的能力,这样不断的思维过程,会使得问题解决更加完善,趋近于答案的本质.[9]统计思维包括四个层面:描述、组织与简化、表征、分析与解释.学生能发现数据的特性、评断数据的有效性、确认数据的单位;将数据分组与排列、利用特定数值描述数据、判断数据的离散程度;能用特定的形式去展示数据,用不同的表达方式去呈现给予的数据;对组内及组间的数据皆能进行比较,根据所给数据进行统计推论.
2.2.2变异是统计思维的核心元素
统计是为了处理变异性的科学,而概率能帮助我们解决变异性.调查研究过程中,进行抽样时,每次抽出的结果可能不同,而且结果无法预知,这种抽样结果与抽样结果间的变异称为抽样变异性.认识机会变异性恰好让我们思考结果的可预测性,它们是误差界限概念的基础.
变异是统计思维的一部分.在统计调查中,我们必需先检验和讨论资料的变异;设计数据收集时要有考虑变异的态度;意识到有些变异来源无法控制,避免立意取样,坚持以实验研究进行比较,在随机收集资料时考虑预期的变异.[10]认识到变异是广泛存在的,很多不同样本的特征、重复测量同一特征都可能产生变化的.质性和量化的变量都可显示数据的变异性.透过思考和研究变量,我们可以尝试解释变异的多种原因和来源.变异是一个普遍或全面性数据集的特征.将全体数据作为一实体,而不是考虑数据内部个别的数据点或仅是中心点和极端值的组合.
学生能够利用图表描述和表示变异.图表显示事物如何变化,及显示可能的样式,以说明我们专注于整体数据分布特征.不同的图表可以显示同一个数据不同方面的变异,所以这是比单一图表还要更重要的研究.当学生比较两个或多个数据集时,使用同一种量尺的图型,使他们能够比较变异性和猜测数据为何有差异.
人们通常围绕阅读和写作行为来定义素养(Literacy).如果具有素养,他应在其日常生活中,具有读及写一段小文章的双重能力;他应有效率参与合作团体的活动,同时可持续提高运用阅读、写作及计算的能力.
统计素养(Statistical Literacy)是帮助个人评估判断并决定该相信什么的必要技能,不只影响了整个社会的政策和个人的决策,也促使在信息时代的人们能独立地进行批判性思考并顺利运作.在美国统计协会演讲时,Wallman将统计素养定义为:理解和精确地评估出现在我们每日生活中的统计结果的能力,在各类情境中以统计思维做决策的能力.[11]Lajoie、Jacobs及Lavigne认为统计素养是有能力解读出现在报纸、杂志、电视、广告和与工作相关的任何统计论点.[12]人们能够理解统计语言(如字、符号、专有名词),具有解释和理解出现在新闻媒体或民意调查中相关图表和统计信息的能力,阅读和理解量化资料的能力.人们能批判地评估渗透在日常生活中各种统计结果,它也能将统计思维适当用于公众的或个人决策面上.人们具有用数据支持论点的常识、能察觉统计图表的多样性解释、明确清楚地了解“标准差、平均数、p值”等.
Watson(1997)认为是统计素养由三个复杂性渐增的阶层所组成的架构:(1)对概率和统计术语的基本理解;(2)对内含在社会广泛的议题内容中的统计语言和概念的理解;(3)对未采取适当统计基础的结论持有质疑的态度,并应用概念以反驳之.[13]构成“统计素养”的元素正是学校统计课程中的一些关键概念,如数据收集、数据表征、数据精简、可能性以及推理,在对这些关键概念的理解的基础上再结合对变差的认识、对背景的理解、读写能力、一般的数学与统计技巧、对任务类型的理解以及参与任务的动力.[14]理解概率的基本观念,能察觉用来沟通概率或风险估计的多样方式,熟悉“随机”的概念事件变化的特性,如:可预测性、独立;对随机现象的理解(包括对事件做合理判断并选择的认知过程);要弄清可能性估计所依据的来源.[15]
统计素养强调的不仅是统计量、统计图表的初步认知而已,而是人们能从获得的资料中抽取出统计信息并提出想法与评断.Gal提出:统计素养被描述为对统计资料和信息进行解释、批判性评估和沟通的能力.人们能够解释和批判性地评估他们在不同背景下可能遇到的统计信息、相关论证的数据或随机现象;讨论或传达他们对此类统计信息的反应,例如他们对信息含义的理解,对这些信息的含义的看法,或者他们对给定结论的可接受性的关注.[16]统计素养包括理解和使用统计学的基本语言和工具:了解基本统计术语的含义,理解简单统计符号的使用以及识别,能够解释不同的数据表示的意义.[17]人们要理解语言和统计符号系统,评判在不同背景下的统计信息和基于数据的论点,获得对社会系统结构发挥作用的意识.识别和质询基于数据论点形成的社会结构;了解个人的社会定位、主体性、政治背景,了解个人对信息解释的影响.评估、整理和报告统计信息及其来源,了解它们是否受到数据作者的社会地位、社会政治和历史视角的影响.[18]
统计素养是一种复杂的结构,不仅需要一个基本技能(阅读,理解和沟通),而且需要具备解释、预测和批判性思维等高阶认知技能.澳洲学者Watson和Callingham依据分析结果提出统计素养的六个层次:(1)自我的独特理解;(2)非正式的理解(对复杂的情境和术语有初步的概念;可对简单的直接对应表格、图进行计算);(3)不一致的理解(读者会对文章内容作选择性的理解);(4)一致但无批判的理解(能多方面使用统计术语,不具批判性的去理解文章内容);(5)批判性理解(对任何文章具有批判性态度,能解释机会的性质;能察觉变异);(6)批判性数学理解(能在媒体的文章内容中使用推论方法;在作预测时,能察觉到不确性;能诠释语言的微妙应用).[19]
当推理有关以图像形式呈现的信息时,能够讲述特定图像中的语言.透过沟通统计思想的语言,学生认识到各种图像结构的元素,以及与内容相关的信息进行互动.图像阅读者需要明白符号任务和空间任务,以及那些表格和图像能帮助处理这些任务的方法.以理解数据所呈现的图像为解释的目标,避免只依个人主观解读图表.[20]认识图像中的元素、这些元素之间的相互关系,以及这些元素的效用在图像中所呈现的信息.图表是用来使人们明确看到在各种层次细节中的数量和类别信息.数据整理涉及从原始数据的表格和图像转换到已分组的数据.每一种图像都有它们各自的语言,即确认图像结构的元素和它们的相互作用可以用于讨论图像所呈现的数据.
统计素养的发展帮助人们描述、比较和解释隐含在统计图和统计表中的相关信息,以及有能力去评估论述中以统计作为证据的强度.人们能够利用统计调查来传播统计信息和论据,重塑不公正的结构,建立更公正的社会秩序;利用统计调查来解决不公正的社会政治问题;确定解决统计问题、数据收集和分析方法,协商社会辩证关系;突出调查结果中统计的重要性.
Gal提出统计素养框架模型包括五个方面要素.(1)读写技能;(2)统计知识(熟悉与描述性统计、图形和表格相关的基本术语和想法,了解如何达成统计结论或推论);(3)数学知识(掌握影响统计素养的数学知识);(4)语境知识(研究背景或正在讨论的数据的信息中收集到的任何信息);(5)批判质疑(有意识检验媒体中所呈现的统计信息的可靠性).[21]统计素养强调批判思维特性,处理变数与数值,考虑变异数和标准差,读懂图表进行回归诊断,能够辨别两个总体是否具有相等的变异数,辨别实验与非实验的差异.
缺乏统计素养的学生可能无法区分可信和难以置信的信息,并且解释这些信息存在困难,难以批判性评估和交流其他人对此类信息的反应.学生学习统计存在一些误区,关注计算结果,缺少对数据整体认识.[22]似乎很少有人研究人们对误差范围的理解,它意味着什么,它什么时候适用,它在哪些方面不适用.[23]
学生在观察资料集时,注意局部的点、局部的退步,不能看到整体的方向、趋势.分布为整体概念,具有多个特征(如:形状、中心、变异性等),许多学生比较资料集时,仅用其中一个特征作为比较依据.[24]学生倾向认为所有的样本点概率皆相等,忽略以样本空间做为解题思考的依据.[25]Bakker指出:学生倾向看资料值而非注意分布,因为他们可用这些资料计算平均数、中位数、全距与四分位距.许多研究发现学生倾向将资料看作多个单独的点,而不是将统计图形或资料当成一个整体,学生常注意某些特别的值,例如:最高的、最低的数值或极端值.[26]
在文本、表格或图表中,不应该给学生提供解决问题的具体提示.面对要解决的问题,学生应该给出自己建议、判断(意见),而不是以特定数字形式的精确“数学结果”回答问题;提醒学生在回答之前对“方案”进行反思,学生能够解释解决问题的“方案”合理性.[27]从察觉统计图的局部特征到整体的特征,学生最容易受到统计图内容的影响.一个普遍的错误是学生将资料的抽象表征诠释为真实事件的图象表征.学生辨识统计图的构成要素所表示的资料类型、了解统计图中测量单位所代表的意义和分析数据资料的分布等,学生对统计图中未明确显示的内容进行推论、概述资料的变化或辨别资料趋势等面临相当大的挑战性.收集数据非常重要,计算的流畅只是根基于中心测量的一部份知识,平均数、中位数和众数不仅是数学的计算结果,它们也是资料整体的某种方式的代表.统计教学需要围绕关键要素探索其中的发展趋势,而不是按照精熟特定的步骤完成计算.[28]
Saldanha and Thompson指出:学生在做抽样问题时,仍然对了解及区别这些不同层次的统计对象有很大的困难.[29]相对于过去强调技巧、程序和计算的统计教学,学生虽然在统计课程中能取得好成绩,却缺乏作统计推理和思考的能力,因而建议课程应针对发展统计知识、推理和思考来设计.虽然学生读出统计图中的正确数值,但是他们缺乏诠释图形的形状与整体、预测推断的能力.[30]发挥数学批判性在解决问题、创造论证、猜测中质疑他人推理的作用.批判可以使一个人认识世界,揭示构成和塑造社会的隐藏结构和话语,认识日常生活中规则性真理;能够用多种观点来看问题,敢于质疑自己的主体性和所处的环境.人们设法从阅读图表转向解释,但是他们的批判意识并不强,他们根据自己的倾向而不是统计知识来解释现象.[31]人们对统计资料有所「理解」,对于不正确信息能够提出「批判质疑」,还能就观察到的信息与他人进行观点上的「沟通」.人们具有解释和批判性地评估统计信息的能力,讨论或传达他们对统计信息反应的能力.
提供真实情境的数据问题,学生感知复杂、令人惊讶、认知冲突的数据信息,而不仅仅是规范的书籍问题.English, L.强调发展学生统计素养需要很长时间,并且必须从早期的学校教育开始.[32]人们获取有意义的数字资料,并运用统计方法加以解读分析,是信息时代应具备的重要能力,人们能够凭借统计数字进行「有依据的猜测」.
教师培养学生具有数据感(data sense),了解数据不只是数字,它是有内容的数字;统计能让数字转变为信息.学生能够整理原始数据信息,作排序及分组,以不同的表格形式呈现数据,简化相关概念;根据题目的要求正确地绘制出表达该数据的统计图形,从统计图表上阅读所看到数据,作一些简单的运算,透过对概念的理解,判断陈述相关句子的正误.认识数据资源的随机的变差.在统计中人们要使用实验研究中产生的数据,要杜绝根据某种目的需要刻意选择有用的相关数据.
采集数据样本和使用样本来推断未知总体是统计思维和调查的核心.人们对抽样的直觉认识从根本上可能是错误的,数据信息是科学的.M. Meletiou-Mavrotheris认识到对抽样问题思考的评估在很大程度上依赖于所使用的评估任务的类型和它们所处的环境.[33]解决统计问题需要学生理解与运用问题的脉络,去形成调查与导引出结论,且认知与理解整个过程(从问题提出到到数据收集,选择分析方法,验证假设等等),学生能评估问题解决与统计研究的结果.
学生能够使用与抽样变异性相关的领域特定知识(例如,关于样本大小的知识,样本变异性)以进行推断或比较.统计推理是人们以统计思想作推理和理解统计信息的方法,包括能够基于一组数据、图表的呈现形式或数据的统计摘要作出解释和预测.统计推理需要整合相关数据和概率,以形成推论和解释统计结果的依据.认识不同数据的集中和分散情况时,根据所呈现的结果,自己选择适当的工具进行分析,从分析结果预测解释数据所代表的现象,利用统计概念的理解,对数据的集中或分散情况进行推论.
5.3.1透过统计图理解问题情境中数据意义
原始数据常会透过表格或图像的形式来呈现,以显示数据的形态进行比较.若学生能将数据进行有意义的分组,对制作有用的摘要和数据会比较有帮助.把表格形式的数据或呈现原始数据的图像,转换成已分组数据图像的简化过程以及图像的结构,都是影响图像知识的因素.让学生理解由已建构好的表格和图像所表达的意义,以及如何决定使用它们来作最佳的呈现都是重要的统计学习内容.能够绘制图像,透过图像来理解各种问题情境中数据意义.
透过统计图像让读者知道图像中各元素的意义,以图表或图像表示已分组的数据.基于图表信息来推论预测一些现象,以及反过来从统计结果中找寻有效的统计证据或解释数据的意义等,也都是值得教师尝试设计的统计教学活动.[34]统计图的功用是将数据分类及简化,使其便于比较,易于了解,记忆与运算,并显示出数据的特性,以节省文字说明的麻烦.
5.3.2增强学生利用统计图解题知觉
传统的统计教学中,虽然学生有良好的公式记忆力和数学计算能力,但学生缺少真正推理统计信息或应用统计推断的能力.Friel, et al.(2001) 提出的统计图解题知觉为评量目标,分为三个层次说明如下:(1)图像知觉(直观地比较图表里表征物,用视觉解译图表);(2)数值知觉(注意力集中在图中的数据点数值,作比较、趋势分析或预测);(3)文字知觉(阅读统计图时,学生必须察觉到图表中关于情境的叙述与记号,考虑图表两轴的标记等).[35]教师进行统计教学时,必须先从对资料的认识着手,确定资料属性后,再根据资料的性质进行简化、分类、整理,针对问题呈现资料,最后进行分析、预测,才能让学生真正了解统计的意涵.
5.3.3透过统计图科学预测
经过系统化、概念化、符号化的整理程序直接地呈现数据,学生得到简单而明确的信息,进而判断数据内外的相互关系,能够从好的统计图看到预期外的信息.理解统计图包括三个层次:(1)阅读资料(直接从统计图中提取数据资料);(2)比较资料(运用从统计图中所读到的信息,进行比较和计算,找出资料之间的关系);(3)解读资料(将统计图中的数据资料与所属的情境相结合以进行推论、预测或辨别趋势).学生能够以统计图中的资料为基础进行预测推断,分析隐含在统计图中资料之间的关系,激起学生对资料深层架构的理解.
在一系列关于儿童对随机和分布的理解的研究中,研究人员发现:利用专门用于支持其统计推理的软件,有助于学生深刻理解随机性;计算机可视化和程序支架是有助于理解误差范围概念的有用工具.[36]统计学研究人员使用模拟和动态可视化软件,转向利用技术工具来说明重复抽样所涉及的抽象过程,帮助学生发展非正式的统计推理.软件工具允许学生直接参与“建立”抽样分布,并允许他们专注于所涉及的过程,关注其中的关键思想,而不是简单地呈现正式的最终结果.数据可视化有助于人们沟通和理解日常生活中的统计信息.利用图形交互创建信息图表,提供多个变量或分组进行比较;利用适当的数据表示来支持基于证据的思考,旨在传达真实问题的解决方案,这些图形理解技能可以使学生有能力阅读媒体中的信息.[37]
构建有意义知识模式的课程结构(例如,建立概念网,关键概念的可视化,明确相关概念图之间的关系).通过计算机为学生提供真实的数据问题(复杂、令人惊讶、冲突),而不是规范的书籍问题.日本中小学数学教科书几乎没有给学生机会体验统计的实际应用,包括阅读理解算术和数学课程中的统计数据.日本学者Seiji Maki认为,给学生增加阅读和理解算术和数学课程之外的可视化统计数据的机会将有助于解决这一缺陷.[38]提供抽样变异性的动态视觉图像,确定决策标准的非正式量化、重组教学语言可以帮助学生在进行非正式统计推断的背景下理解抽样变异性概念.[39]
面对庞大数据,学生只用数字解释是很难让人理解其背后的涵义.若利用信息技术将数字转化为动态可视化图形的方式呈现,从可视化的角度上有利于使人脑在短时间内找到逻辑含意.将可视化的数据创新排列组合,学生从中探索发现新的信息规律.利用交互性让学生更好地探索、理解和解释数据中的信息,方便学生进行深入研究.