儿童数学能力的动态评价

2011-12-29 00:00:00潘月娟
学前教育研究 2011年2期


  [摘要]本研究编制了一份含有6个题目、各题目包含3个层次的评价任务的标准化动态评价工具,以评估儿童在数、量、形、关系等领域的数学能力。该工具通过改变任务的结构、呈现方式、指导语以及提供操作材料等方式为儿童提供越来越具体和直接的中介支持,以逐渐降低评价任务的难度。根据中介支持的具体程度和直接程度以及任务分数的高低,可以判断儿童学习潜能的大小。本研究采用该工具对235名4岁2个月至6岁1个月的儿童进行数学能力评价的结果表明,标准化动态评价能够提供与静态评价一样有效的关于儿童学习结果的信息;与静态评价相比,动态评价不仅能够了解儿童能否独立解决问题、完成任务,而且能够了解儿童在何种水平上通过怎样的中介支持来解决任务,从而为教育者提供更多有关儿童学习潜能的信息。
  [关键词]动态评价;数学能力;学习潜能;中介支持
  
  《基础教育课程改革(试行)》明确提出,要改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师成长和改进教学实践的功能。这要求教师不仅要了解儿童知道和不知道什么,还要了解儿童可能知道和掌握些什么。然而,如何评价儿童的学习潜能或可能的发展水平却是当前教师普遍感到困惑的问题。本研究的目的即是制定一个评估儿童数学能力发展的动态评价工具,并评价工具本身的信度和效度,以期为教育工作者设计和实施有效适宜的数学学习评价模式和课程提供参考。
  
  一、理论框架
  
  本研究从儿童数学能力的构成、学习潜能与动态评价、数学任务与中介支持三个方面展开理论讨论,以解决评价数学能力的工具要评什么和如何评等问题。
  
  (一)数学能力的构成
  国内外许多学者对个体数学能力的结构进行了广泛且深入的理论探讨和实证研究,形成了不同的意见。如王权通过探索性因素分析归纳出小学生数学能力的四个构成因素分别是:基本演绎推理能力、识别数量关系的能力、空间想像能力、速度能力。林崇德认为数学能力包括传统的三种基本数学能力(运算能力、逻辑思维能力、空间想像能力)以及五种数学思维品质(思维的深刻性、灵活性、独创性、批判性、敏捷性),在三种基本能力与五种思维品质的15个交叉结点上又体现出多种具体的数学能力特点。倪斯杰、张君达通过因素分析概括出小学二年级学生数学能力包括计算能力、归纳推理能力、枚举筛选能力以及对计量单位的理解与推理能力。我国中小学数学教学大纲传统上把数学能力分为运算能力、逻辑思维能力、空间想像能力,随后又补充了分析和解决实际问题的能力。2000年,美国数学教师协会在《数学课程标准》中提出数学能力包括数的运算、问题解决、逻辑推理、数学联系、数学交流、数学表征等方面的能力。
  对数学能力结构的不同界定源于对数学本质的不同认识。当强调数学是一种具有客观性和真理性的严密逻辑体系,数学活动是一种远离现实生活的抽象思维活动时,人们就较少关注儿童的问题解决、数学交流、数学联系等方面的能力。本研究认为,从数学这一学科的起源与发展历史以及儿童个体的数学学习与发展过程来看,数学是对关系与形式的抽象与表征。它既是不断从具体走向抽象的动态过程,又是一种社会约定的表征体系。数学学习涉及问题解决、抽象与推理、表征与交流的基本过程,同时也包含了对作为结果的数与非数的复杂系统的理解和认识过程。由此,数学能力是在对数与非数的学习与应用过程中所体现出来的问题解决能力、抽象与推理能力、表征与交流能力。本研究将从作为结果的内容领域和作为过程的能力结构两个维度来设计评价内容。
  
  (二)学习潜能的动态评价
  以促进发展为目的的评价不仅要了解儿童当前能够做什么、知道什么,还要了解儿童将来在怎样的条件下可以做什么、知道什么,也就是要揭示儿童潜在的学习和发展能力。这种潜能只是一种可能性的存在,尚未转化为现实。因此,需要将其转化为外在可观察的、具有可操作性的指标,才能判断儿童的学习潜能。维果茨基提出的“最近发展区”概念为解决这个问题提供了启示。最近发展区是指儿童独立解决问题的水平与在成人或成熟同伴的帮助下完成的可能水平之间的差距,这一差距就代表了儿童的学习潜能。因此,评价学习潜能就是探寻儿童在成人支持下表现出的可能水平。一方面,这一概念说明了学习潜能是什么,为将学习潜能这一抽象的、潜在的事物转换为可观察、可测量的指标提供了方向;另一方面也说明了学习潜能的性质。成人提供的帮助不同,儿童表现出的可能水平就会有所不同,因此,学习潜能不是先天存在的,而是社会建构和创造的。这提示我们在设计动态评价工具时必须重视成人所提供的中介支持。
  动态评价现已被普遍认为是测量学习潜能的一种重要评价模式,并已在实践中得到了广泛应用。弗斯坦最早提出动态评价的概念。自此之后,动态评价经历了长足发展,而且产生了多种评价模式。凯里夫和福克斯等人(Caffrey,&Fuchs)将动态评价划分为临床取向和研究取向两大类。临床取向的评价产生于非标准化的教育干预,成人的干预和指导可能会持续很长时间;研究取向的评价是标准化的评价工具,在单次评价中完成干预和指导。事实上,这两类模式的根本区别在于前者强调教育干预,而后者强调评价的功能。本研究的目的在于后者,即要制定标准化的评价工具。
  动态评价是在批判和修正静态评价的过程中应运而生的。科恩和斯潘西(Cohen&Spenciner)指出提供中介学习经验是动态评价的核心。格里戈连科和斯滕伯格(Grigorenko&Sternberg)认为动态评价与静态评价的本质区别体现在评价者与学生的关系和提供的反馈内容不同等方面,再者就是动态评价重视过程而非结果。虽然不同学者对动态评价的结构特点的分析和概括有所不同,但都提及了互动(interaction)、干预(intervention)、中介(mediation)等关键词。本研究认为,动态评价不同于静态评价主要体现在评价者在评价过程中通过向被评者提供中介支持而与被评者发生互动,因此,在制定动态评价工具时应重点关注评价过程中评价者提供给儿童的中介支持。
  
  (三)中介与数学任务
  不同的动态评价模式在提供中介支持的方式’、中介点、中介时间、中介强度、标准化等方面都存在较大差异。在弗斯坦的学习潜能评价工具中,中介支持是指评价者根据特定的评价原则、经验和观察结果,以临床方式提供给被评者的中介学习经验。渐进提示模式则要求为被评者提供标准化的提示,提示的具体程度会逐渐提高;提示的数量会考虑被评者的学习速度和学习潜能;提供中介支持的目的是为了增强被试的问题解决和迁移能力。
  本研究在参考坎皮奥内和布朗(Campione&Brown)的渐进提示模式的基础上修改了提供中介支持的方式,主要通过改变任务的结构、呈现方式、指导语以及提供操作材料等来降低评价任务的难度。许多研究表明,任务呈现形式影响个体的数学学习和表现。同样的数学关系以不同的任务形式呈现,其难度将有所不同。例如,“7加2等于几”的问题,可以“7+2=?”这种抽象的算式形式呈现,也可以用文字的方式呈现,如“池塘里有7只鸭子,后来又游来了2只,现在一共有多少只鸭子”,还可以用相应的操作材料来表述。这些任务都是考察儿童对7、2、9之间关系的理解,但是任务理解的难度在逐渐降低。因此,本研究将把改变数学评价任务的呈现方式作为重要的中介支持手段。
  
  二、研究方法
  
  (一)评价任务的设计
  1 步骤。
  首先,确定评价的内容领域和构成儿童数学能力的要素。在本研究中,我们将数学看作是对外部世界的关系与模式的一种抽象表征。因此,我们在传统的数、加减、量、几何形体等评价内容的基础上,增加了对数学关系的考察,并强调对推理、抽象和表征能力的测查。
  其次,确定各评价内容领域所包含的对个体相应数学能力的核心要求(见表1)。例如,由于“数”是对非空等价有限集合中元素个数的抽象,因此“数的守恒”是个体在数这一领域中应掌握的关键能力之一。
  第三,编制评价任务考察儿童对关键能力的掌握。为突出儿童解决真实生活情景中的真实问题的能力,我们参考了发生在儿童生活情景中的数学问题来编制评价任务。例如,在户外游戏活动中,两名儿童帮助教师收拾球回教室,其中一个说自己拣到的球多,筐子都装满了,而另一名儿童则反驳说对方的球大才满,自己的球小,自己拣到的多。两名儿童围绕筐子的满与浅、球的大与小及其与数量的多少之间的关系的对话,既涉及了数量的比较,也涉及了数的守恒。本研究参照这一案例设计了有关“数的守恒”的评价任务:“这里有一些大积木和小积木。你数一数它们一样多吗?我把大积木放在这个盒子里,小积木放在另一个盒子里(盒子是透明、无盖的)。这两个盒子里的积木一样多吗?一个盒子里满,一个盒子里浅,它们为什么一样多?”
  第四,制定评估儿童表现的指标。例如,“数的守恒”要求儿童必须排除其他特征的干扰,只关注数量特征。因此,在这一任务上,如果儿童能够独立判断当物体外在感觉特征改变后,物群中的元素个数没有改变,并且能正确说明数与感觉特征之间的关系,就表明儿童掌握了数的守恒。
  第五,分解任务和指导语,确定不同层次任务应该给予的中介支持。根据儿童的学习特点以及预实验中的儿童表现,本研究通过改变任务结构、呈现方式、指导语以及提供操作材料,将每一评价任务划分为3个层次。从层次3到层次1,提供的中介支持的具体程度和直接程度逐渐提高。与之相应,儿童的表现被划分为4个水平,水平1表明儿童不具备学习该内容的能力。
  2 任务与指导语举例。
  以任务4为例来说明评价任务和指导语的设计。任务4考察的是儿童对面积守恒的理解,该任务要求儿童在一块卡片上所画的四块草地中找出一样大小的两块草地。
  在层次3的任务中,卡片上的草地外面画出了格子线,以提示儿童可以使用格子线作为参考标准来判断草地的大小,并在表征层面上将两块三角形的草地旋转拼成一个正方形。指导语是对问题较为抽象的语言描述,要求儿童自己将问题进行拆解。
  在层次2的任务中,卡片中的草地也被格子线进行了切分,儿童可以通过计算格子的多少来判断草地的大小。指导语是通过几个小问题来提示解决问题的步骤。
  在层次1的任务中,提供了与卡片中的草地图形尺寸相等的1l块正方形和2块等腰直角三角形。儿童可以通过在卡片上拼摆这些图形,进行直接比对。
  如果儿童在上述3个层次的任务上都不能作出正确的判断和解释,就表明儿童还没有为学习这一关键经验做好准备。
  
  (二)赋分系统
  从层次3到层次1,任务的难度逐渐降低,提供的中介支持越来越具体和直接,因此对应的每一层次的儿童表现所得分数也会越来越低,儿童的表现从水平4到水平1分别赋分为3、2、1、0。
  除此之外,如何评价动态评价的信度和效度始终是一个存在较大争议的问题,统计学意义上的显著差异可能并不能说明质性差异的真实含义。一些研究者认为传统的信度和效度类型不适宜于动态评价,不过到目前为止研究者们还未能给出一个较为一致的解决方案。本研究将从两个角度对所设计的工具进行评估:首先,除了对有中介支持的评价任务给予评分之外,还对没有中介支持的评价任务进行静态评价,并计以一定的分数(见表2),如在评价儿童完成层次3的任务时,如果幼儿在没有中介支持的情况下能够独立解决问题,则赋值1分,反之则为0分,通过比较有无中介支持儿童所获得的分数,可以了解动态评价能够提供怎样的信息;其次,对通过动态评价获得的有关儿童数学学习的规律和特点进行分析,并与已有研究结果进行比较,以考察动态评价的有效性和可靠性。
  
  (三)被试的选取
  本研究在北京随机抽取了一级一类幼儿园和二级二类幼儿园各3所,在每所幼儿园随机抽取中班和大班各1个,共抽取12个班级,除了有两个班级各抽取了18名和17名儿童外,剩余10个班级各随机抽取10名男孩和10名女孩,最后共抽取235名幼儿。
  
  (四)研究程序
  首先对两位研究生进行培训,帮助他们理解评价工具的设计原则及实施步骤;然后由两位研究生在幼儿园提供的单独房间中对幼儿实施一对一的个别施测。
  对所有幼儿的施测必须遵循相同步骤,即从评价任务1开始,依序至任务6;每个评价任务从层次3开始,依次为层次2和层次1;在每个层次的任务中,主试说完一遍指导语后,如果幼儿无反应,再重复一遍指导语。如果幼儿对第二遍指导语仍无反应,进入下一个层次的任务。
  
  三、研究结果与分析
  
  (一)在两套分数上的差异
  如果评价停留在层次3的任务上,许多儿童只能得0分,然而事实上,这些得0分的儿童并不是处于同一发展水平的同质组。动态评价的结果表明,在静态评价上得0分的儿童中,无论是男孩还是女孩,无论是中班还是大班,都有相当比例的儿童能够在适宜的中介支持下,以适宜其发展水平的方式解决问题。以“数的守恒”任务为例,在层次2上,主试要求儿童把积木拿出盒子,重新数一数大积木和小积木各有多少块,并询问儿童主试是否拿走或添加了积木。经过重新计数以及有意识地关注操作动作和结果之间的关联,约有1/3的儿童能够判断积木数量是相等的。在层次1上,主试直接向儿童解释“我没有拿走积木,也没有添积木,它们都是10块,所以它们是一样多的”。经过主试此种直接说明,约有10%的儿童能够给出正确判断和正确解释(见表3)。由此可见,没有中介支持的静态评价只能说明儿童能否独立解决问题,而动态评价可以说明儿童能够在什么水平上在什么样的支持下解决问题。
  
  (二)动态评价分数的组间差异
  独立样本T检验结果表明,儿童在动态评价上的得分不存在显著的性别差异,但是儿童的得分存在显著的年龄差异,大班儿童的得分显著优于中班儿童(见表4)。在所有任务上,大班儿童分布在水平4和水平3上的人数比例要高于中班儿童,而在水平2和水平1上的人数比例要低于中班儿童。这与披裘等(Prio et al)研究者的研究结果相一致。她们使用鸟特勒支数感测验(UtrechtTest ofNumber Sense,Van Luit et al.,1994)比较了中国、英国、芬兰儿童的早期数学能力发展水平,结果发现中国儿童的成绩不存在性别差异,但存在显著的年龄差异。
  从儿童独立完成任务和在中介支持的帮助下仍无法完成任务两个方面的人数比例来看,在不同领域的守恒任务中,数的守恒是儿童最先掌握的内容领域。无论在中班还是在大班,能够独立完成数守恒任务的人数比例在各项评价任务中都是最高的;与之相应,在两次中介支持之后,仍然无法完成数守恒任务的人数比例都是最低的(见表3)。这一研究发现与已有的研究结果相一致。守恒概念研究协作组在1985年的研究即表明在数、体积、重量、不连续量的守恒任务中,儿童在数的守恒任务上表现最好,数的守恒是儿童最先掌握的数学能力。
  
  四、结论
  
  基于上述研究结果,我们可以得出以下结论:首先,通过改变任务结构、呈现方式、指导语以及提供操作材料等方式提供中介支持,能够有效地区分不同儿童的能力发展水平,因此,从这四个方面出发设计中介支持,建构动态评价工具是可行的。其次,与没有中介支持的静态评价相比,动态评价不仅能够了解儿童是否能够独立解决问题,完成任务,而且能够了解儿童在何种水平上通过怎样的中介支持来解决任务,从而提供了更多有关儿童学习潜能的信息。第三,动态评价能够提供与静态评价一样有效的关于儿童学习结果的信息。
  
  参考文献:
  
  【1】王权,汤健康,方栋梁,小学生数学能力的因素分析,心理科学,1986,(2)
  [2]林崇德,学习与发展——中小学生心理能力发展与培养,北京:北京师范大学出版社,1991:25
  [3]倪斯杰,张君达,小学二年级学生数学能力的分析,心理发展与教育,1998,(1)
  [4]Vygotsky,L,S,Mind in Soeliety:The development of higher psychologic al processes,Cambridge,MA:Harvard Universiiy Press,1978: