王少非
【主持人的话】前面几期我们讨论了如何收集学生学习信息或如何引出学生学习证据的问题,后面我们将讨论如何运用这些信息或证据来支持教与学的改善。但在此之前,本期我们首先要讨论评价结果的解释问题。
【小明学得好吗】
在生活中,常会看到这样的情境:妈妈知道小明昨天考试了,也知道教师批改试卷很及时,所以小明一进家门,妈妈就问:“考了几分啊?”小明答:“92分。”
妈妈的问题是否到此为止,不再有其他问题了呢?答案是否定的。现实生活中,妈妈一般还有其他问题要问,比如:最高分是多少啊?你的同桌(朋友)考了几分啊?这次考试,你排名第几啊?部分家长甚至还可能会问如下问题:班级平均分是多少啊?你哪里做错了?因为什么才做错的?
妈妈为何会问这些问题?其实几乎所有的人,即使当年并非是一个“好学生”甚至接近于文盲的家长都知道:单一的分数是没有意义的。家长之所以会问那些问题,其实是在尝试对考试得来的这个没有意义的分数进行解释,尝试着让这个本来没有意义的分数变得有意义。这也就阐述了一个道理:若想使评价结果有意义,就必须经过解释。
那么,怎样才能更好地解释评价结果呢?作为教师,从专业性角度出发,该建议家长在这样的情境里问哪些问题,或者从第二段所罗列的问题中明确哪些问法是有意义的。
如果将评价结果的解释理解成为某个结果找个参照系,那么第二段所列的问题大致可以分成两类,用专业的术语来说就是常模参照和标准参照。常模是一个心理测量学概念,指的是常模群体的平均表现水平以及表现状况的离散程度,是一种相对评价。具体解释起来稍稍有些复杂,教师只需要知道,常模参照就是拿一个学生的表现跟其他学生比,是一种相对评价。但标准参照却不同,它是将教育评价从心理测量学中努力分离出来的结果,是将学生的表现与预先确定的某个标准进行比较,是一种绝对评价。举个例子来说,班里的学生春游去爬山,班主任没跟着,但很关心某个学生的情况,打电话给带队老师,结果得到两个回答:一个是“他在队伍中间”,另一个是“他到半山腰了”。前一个回答是常模参照,后一个回答是标准参照。
厘清了问题的分类,再来研究哪些问法更有意义。许多教师可能觉得考试排名是个好办法,有激励作用,常用“你看看人家小红,又是99分”来刺激小明。但证据表明,这些做法的效果是不确定的:首先,常模参照的结果不只取决于当事学生的努力,有时学生做了很大的努力,结果相对表现反而更差了,更何况这种比较能否激发学生的努力还是个未知数。其次,即使这些做法能够激励学生做出努力,但只与他人做比较,即常模参照的解释,无法让学生明确努力的方向,对于改进没有太大的帮助。由此可见,标准参照的解释方式对于改进更有意义,也就是要明确学生表现与预定标准的具体差距。只有这样,学生才能知道自己具体的问题,才有可能回答学习改进的三个必答问题:“我要去哪里?”“我现在在哪里?”“我怎样才能从现在所在之处到达我要去之处?”
如果期望课堂评价能有效促进学生的学习,那就不要将学生与他人做比较,而要将他的表现与确定的标准比较。在这一方面,有很多有价值的做法,如描述性评价、雷达图的应用、进步记录表的运用,等等。
需要说明的是,除了以上这两种结果解释方式之外,还有一种解释方式,即“个体内差参照”,简单地说,就是自己跟自己比。这种解释方式对于那些无须做出太大努力就可以达成目标且能处于班级前列的学生,以及那些尽管做了很大努力但离目标依然遥远的学生特别有效。
【基于目标解释结果的方法】
上文提及,相对于常模参照的结果解释,标准参照的结果解释更有利于改进。标准参照的本质就是关注学生当前表现与学习目标要求之间的吻合度,是要揭示学生当前表现与期望达成的学习目标之间的具体差距,也就是基于目标来解释结果。那么,教师该如何基于目标解释结果呢?
依然以小明这次的考试成绩为例。小明的卷面成绩为92分,与满分差了8分。很凑巧,小明的同桌小强这次考试也得了92分。众所周知,在这次测验所涉及的主题上,小明和小强做对的或者所掌握的知识有很多共同之处,但他们所犯的错误却可能完全不同。假设这次考试检测的是ABCD四种能力(或知识点),小明所犯的错集中在C能力上,而小强所犯的错则集中在A能力上。这里所检测的能力(或知识点)就是评价目标,将学生的测验表现与评价目标直接做比较,就是一种基于目标的结果解释。
基于目标的结果解释不仅仅针对一份试卷,同样也可以针对一道题。以一道小学数学试题为例:“我买了500克香蕉,一些蘋果,以及1千克牛肉。我总共买了6千克水果,那么我买了多少数量的苹果?”A,B,C三个学生的答案分别是4.500千克、5.950千克、5.500克。通常情况下,三个学生每人都会得到一个“×”。但联系这道题的三个检测目标(对问题情境进行正确解读;在问题情境中正确运用数学工具,如加减乘除、单位转换等;答案的正确性)就能发现,这三个学生的错误各不相同:A将牛肉和水果混淆了,属于没有正确解读问题情境;B是将500克换算成了0.05千克,是单位换算出了问题;C是将单位写成了“克”,可能是粗心。用这样的方式来解释学生的表现结果,能针对性地解决学生的问题,对于他们的学习改进也就会更为有利。
基于目标的结果解释还可以借助于不同的结果呈现方式来实现。例如,一位语文教师给出了一个评价任务,要求学生完成15个造句(包含肯定句、否定句、疑问句各五句),正确完成一个句子可以得1分。结果学生甲得了10分,学生乙得了9分。这是常规的结果呈现方式。如果教师换一种呈现方式,结果解释就可能不同(见下表)。
[ 肯定句 否定句 疑问句 学生甲 5 5 0 学生乙 3 3 3 ]
这样的呈现方式可能会改变教师对两个学生的观感:原先只看分数,无论如何都会认为乙不如甲好,但通过表格发现,“学生甲很好地掌握了肯定、否定两种句式,但完全没有掌握疑问句式;而学生乙基本上掌握了这三种句式,学生乙未必会比学生甲差”。更重要的是,这样的呈现方式可以帮助教师和学生更清楚问题之所在。
这样的呈现方式实际是一种描述性评价,即将学生表现与目标之间的差距具体地描述出来,而不是提供笼统的分数、等级,或者简单的对错符号。有很多研究证据表明,相较于提供分数等级,描述性评语对学生的学习改进效果要大得多。关于这一点,将会在后续的专题中继续讨论。
(台州学院 317000)