促进学习的教师自编测试结果的处理

2014-07-18 11:42:56刘辉
当代教育科学 2014年10期
关键词:错误测试标准

●刘辉

促进学习的教师自编测试结果的处理

●刘辉

促进学习的评价应该被视为教师必须具备的一项专业技能,而目前大部分课堂教学活动中,教师促进学习的评价能力不足。在评价取向和技术上,促进学习的教师自编测试结果处理需要由终结性取向转向形成性取向,由常模参照走向标准参照;促进学习的评价要求提高教师自编测试的标准参照属性,运用有效的分析工具,施加合理的改进和干预措施。

促进学习评价;教师自编测试;结果处理;内涵;取向;技术

促进学习的评价作为一种新的评价范式逐渐成为主流。促进学习的评价是以改进为目的和指向的。“促进学习的评价将学生作为评价的主体和评价信息的重要用户。它不仅让教师了解学生的学习,而且让学生也了解自己的学习;不仅要求学生全面参与评价,而且要有效运用评价信息来改善自己的学习;强调运用多种评价方法来收集关于学生学习的信息,持续地向学生、教师和家长提供学生在掌握学习标准上进步的证据。”[1]布莱克和威廉等是从“以形成性评价促进学生学习”的实证研究中,得出多进行形成性评价可以提高学生成绩的结论。他们所研究的课堂评价包括提问、课堂反馈、书面作业评价和教师自编测试等对课堂教学内容进行评价的评价方式。[2]

一、促进学习评价范式下教师自编测试结果处理的内涵

在日常教学中,由教师进行支配的课堂评价尤其是课堂层面的测试,是与学生学习关系最密切的评价。根据波帕姆的分类,在教育评价中存在两类教育测试,这些测试有可能(或不能)帮助教师更好地开展教学活动。第一类是课堂测试,课堂测试是由授课教师编制试题来测试学生对某个单元内容的掌握程度的评价方式。[3]第二类是外界指定的测试,这些测试根据国家或者地区的规定,由专业人员命题,测试学生是否掌握了规定的必备技能。显然,教师对自编测试更有支配权。因此,教师自编测试的结果处理应该指向促进学生学习,教师通过对课堂测试结果的分析、解释,获得学生学习的证据,以改进教学和帮助学生改善学习。

教师自编测试是判断学生学习水平、促进学生掌握学习目标的重要手段,为后续的教与学改进提供科学决策证据。但教师自编测试似乎并未起到有效促进学生学习的作用。时常发生这样的情况:测试结束后,教师向学生返还试卷,学生首先看一下测试的分数,然后就把试卷扔在一边,有些平时成绩就太好的学生,甚至连分数都不愿意去看。由于受传统的应试教育取向和终结性评价方式的影响已久,成绩定向的测试为学生提供的反馈信息主要是测试的分数,很少反馈关于学生学习情况的具体的描述性信息。如果再多花一点时间让学生明白他们究竟什么学得好,什么学得不好,教师自编测试对学生的学习就会有正面影响。

如此频繁发生的教师自编测试,却没有充分发挥促进学生学习的作用。要实现促进学生学习的目的,除了以有效的试卷编制为前提外,教师自编测试结果处理的取向和技术更是非常重要的。如何挖掘教师自编测试数据背后的信息,进而为改进教与学提供科学的依据,自然成为教师自编测试结果处理的关键问题。

二、教师自编测试结果处理:由终结性取向转向形成性取向

实践中,教师往往在单元或模块教学结束后进行一次测试。但测试的目的是什么?很多教师并不明确,仅仅把测试作为学生学习的阶段性总结。在他们看来,测试数据就是用来判断学生学习的一个数据,分数高低代表了学生成绩的高低,得到测试数据后,就可以展开新的一轮教学。至于测试数据分析与学生学习的关系就不去多加追问了。但问题在于,仅仅作为总结性评价,教师自编测试无法回答这些质疑:学生的学习问题到底是什么?又如何分析出原因所在?

教师自编测试给学生提供了一个测量仪来测量自己掌握的知识的深度和广度,正如运动员通过激烈的竞赛来了解自己的优势和劣势一样。同样,教练通过观察运动员在竞赛中的表现了解他们,教师则通过测验了解自己的教学效果。一次精心设计的考试其实也是一种教学,因为它能激发学生用新的思维方式去思考概念、发现概念之间的新关系并达到新的认识。

为了促进学生学习的目的,在教学模块最后进行的测验其效果是微小的,对于学生学习来说,这种终结性取向的测试不能够及时地向学生提供反馈信息,发现他们的学习困难,寻找战胜学习困难的方法和机会。

表1 课堂测验与反馈的时间与效应值的关系

一般而言,教师自编测试结果反馈耽搁的时间越久,成绩改进得就越慢。请注意,在一个测验题目之后立即给予反馈只有相当小的效应值(0.19),而在测验结束后立即给予反馈却有最大的效应值(0.72)。在学习后立即给予测验,它对成绩的效应简直微不足道,而在学习过后一天给予测验,效应似乎最为理想。[4]

因此,要发挥教师自编测试促进学生学习的作用,使得测试结果成为下一步教与学决策的重要依据,或者说教师自编测试要承担起形成性评价角色。测试数据分析要以促进学生学习为指向,对数据背后反映的学生学习情况做深度的分析。测试数据分析不再是为了得到一个判断学生成绩好坏的结论,而是秉持改进教与学的形成性取向。

三、教师自编测试结果解释:由常模参照走向标准参照

由于深受外部大规模考试的影响,当前教师自编测试基本以常模参照为依据,其结果导致了测试的数据仅仅发挥了甄别、排队等有限的功能。常模参照是以个体的成绩与同一团体的平均成绩或常模相互比较,而确定其成绩的适当等级的评价方法。常模参照评价以衡量被试在团体中的相对地位为目的。教师自编测试的常见的分析指标有班级平均分、难度,有时还有标准差或区分度。其目的是要通过这些数据来比较学生差异,并定出学生的分数排名。其数据分析方式成为了外部大规模考试的翻版,是常模参照的结果处理方式。常模参照的测试结果解释无法明确出学生个体学习水平与学习标准要求之间的差距。

教师自编测试是小范围内实施的低风险评价,目的并非计算难度或区分度,而在于诊断学生学习,并加以改进学生学习。要达到促进学生学习的目标,测试数据分析首先就要明确课程标准的要求,并以此作为分析学生学习水平的依据。如果处理合理的话,课程标准的要求应被分解为不同的表现水平。如此一来,测试数据分析时,对照标准,学生的学习水平及与学习目标之间的差距就比较容易明确了。这样的测试数据分析就具有了标准参照(standard-referenced)①的性质。

标准参照测试成绩解释就是在和一组规定明确的能力标准对比之下,对被试的测试成绩做出解释。标准参照评分潜在的原则是学生的成绩反映出学生本人的学习水平,与班里其他学生的表现无关。标准参照解释测试结果是为了将被试的测试结果与既定的标准作比较,被试是否达到标准的要求,还有什么差距,而不在被试之间做比较。在标准参照的测试结果解释中可以关注学生的个体差异,帮助学生反思自己学习中的问题。在对学生的测试结果进行具体解释时,教师可以根据学生具体的表现对其学习情况进行较为具体、有针对性的解释,这种差异化的测试结果解释避免了笼统的、模糊的反馈,能够更有效地促使学生改善学习。

测试对教学和学习产生的作用可称为反拨效应。根据测试对教学和学习产生的积极或消极的影响,测试的反拨效应可分为正面效应和负面效应。正面效应对课程的完善、教材或教法的更新和学生学习的改进会起到积极的推动作用;而负面效应不仅不能对教与学起到推动作用,而且还可能会导致教与学走入歧途。[5]标准参照的教师自编测试结果解释有助于提高测试的正面反拨效应,这是标准参照的测试结果解释模式。

由于标准参照测试与课程目标或事先制定的标准相关联,人们就需要依赖这些标准或目标,来判断学生的学习成就。在这种情况下,分数并不代表某个学生在同一测试群体内的相对位置,而是表示对事先确定的知识或技能的掌握程度。标准参照的教师自编测试结果解释的优点是:第一,标准具体化为“能做什么”和“能做到什么程度”,这样对教师和学生都具有明确的解释意义;第二,这些标准不是因人而异,每次测试的结果都以此为解释依据;第三,这些标准可以促使学生通过努力学习来达到标准的要求。由此可见,当教学目标化作标准并用于测试结果的解释时,它对教学产生的正面反拨效应是显而易见的。学生将自己的测试结果与标准相对照之后,会发现学习问题或不足之处;这对他们明确今后的学习重点或努力方向,有积极的促进作用。对于教师来说,标准参照的解释模式有助于他们了解学生学习状况,以便指导学生反思、改善自己的学习和改进教学,提高教学质量。

四、促进学习的评价要求提高教师自编测试的标准参照属性

人类思维是难以捉摸的,就连心理医生甚至我们自己都会认同这个观点。这个规律对于教师评价学生的过程也不例外。学生的学习目标的掌握是内隐的,教师必须思考如何发现这些隐藏的认知变量。“我们在教育中力求让学生掌握的一切有价值的技能都不是显性的。这些能力是看不见的,只能通过事实推断出来。教育评价实质上就是一个做出判断的过程。也就是我们通过证实渠道从显性的测试成绩中收集证据来准确推断学生们对内隐变量的掌握情况。这些变量对教学的意义重大。”[6]这一推断过程如下图所示:

图1 教师根据测试做出推断的过程

标准参照的测试要依据事先设置的目标等级标准,来解释学生测试分数的实际含义。也就是说,分数提供的信息应表明学生是否达到预先设定的水平,达到的程度如何等。如何提高教师自编测试的标准参照属性呢?

首先,在测试前我们应该根据课程目标设定具体的学习目标,明确界定学生预期达到的能力或“能做什么”和“能做到什么程度”。

其次,要合理解释学生的成绩。换句话说,作文得22分的学生是否达到目标?如果达到目标的话,程度如何确定?解释分数要与事先设置的标准挂钩,才能明确解释学生达标的程度。归根到底,解释学生的成绩牵涉到标准如何制定的问题。标准制定的第一类方法是及格/不及格方法,这种方法根据己定标准,将学生分成两类:掌握课程内容或没有掌握课程内容的。那么,根据这种标准解释学生成绩时,就可以得到相应的反馈信息:学生掌握了课程内容还是没有掌握课程内容。标准制定的第二类方法是连续分类法。这种方法的前提假设是学生的测试分数通常出现在一个分数或等级连续体上。因此,测试分数的解释应该考虑到不同分数所代表的等级或程度。例如,基于学生考试表现的连续分类法,通过分析学生成绩来确定最低通过标准。最低标准以上的分数将赋予各级等级或程度的含义。

最后,只有使教师自编测试的结果具备解释功能,可以表明学生达到标准的程度,才能使教师和学生从中得到有效的信息反馈,了解实际能力水准或问题所在,标准参照的教师自编测试才能在考试反拨效应中产生积极的推动作用。

五、运用有效的分析工具,施加合理的改进和干预措施

教师自编测试是促进学生学习的重要途径之一,对学生学习有着直接而深远的影响。在促进学习的评价范式的理念指导下,测试的目的是通过激励学生根据反馈信息改进学习,以促进他们的学习,而且如果教师能给予具体的指导和训练,测试还能使学生更加集中精力学习、学习目标更明确。

(一)学生跟踪自己的进步

学生是评价信息的使用者,需要理解学习目标,更需要全程参与评价,并监控自己的学习进步以及与教师交流自己的学习情况。教师应懂得如何帮助学生有效地利用每一个阶段的评价信息,跟踪学生的学习进步,作为自己教学决策的依据。同时,教师应懂得如何运用评价结果反思自己的教学与评价,了解教学中的问题与评价的质量,及时改进存在的不足。

学生运用图表(表2)来展示自己的学习进步情况。[7]该折线图中的各栏呈现出对学生学习测量主题——“概率”的6次不同评价。第一栏呈现该生第一次评价的得分,第二栏呈现第二次评价的得分,如此类推。这一方法可以给学生提供一个可视的成绩表述,让学生看见自己的进步。它还可以给学生提供一个确定自己的学习目标,不用在班上进行成绩排名就可以判断自己的学习是否成功的手段。这种跟踪学生进步有助于促进学生的学习,在整个评价打分阶段让学生看见他们“学习知识的收获”,可以激发他们的“内在动机”。

(二)运用错误分析策略

研究表明,考试这种评价手段不仅能检测学生知识的掌握程度,还能改善学习。有研究对比了参加了考前预考的学生和未参加预考的学生在考试中的表现。结果表明前者的成绩要优于后者,这说明学生可以从考试经验中学到知识。[8]

表2 学生进步图表

1.什么是错误分析

这是运用评价从元认知角度改善学生今后表现的一种系统方法。它包括两个步骤,首先获得关于错误的策略性元认知知识,然后循环运用该知识达到自我改善的目的。

2.在什么时候、出于什么原因使用该策略

错误分析有如下几个好处。第一,它赋予学生掌握重要材料的第二次机会。第二,在学生评价考试表现、找出错误和潜在的错误模式、设计今后的改正路线时,该策略能帮助学生发展元认知能力,这样,学生既掌握了策略性知识,又锻炼了独立的自我管理能力。例如,它能帮助学生预测今后可能发生的错误并及时改正,不让错误出现在考试中。第三,它能让学生用内因,也就是自身原因来解释学习中的得失成败。这样,他们会认识到学习成果是来自自己的勤奋努力,来自所采取的行动,来自恰当的策略以及其他一些因素,总之一切尽在自己掌握之中。

3.如何运用错误分析策略

错误分析要求识别正确的信息、答案和方法,同时辨别错误、疏漏和其他问题,还要判断它们发生的原因,计划今后如何避免同类错误。运用错误分析时,学生应找出自己的错误答案以及正确答案(陈述性知识);判断他们做错题的原因(因果知识);拟定行动计划,思考目前已对材料了解了多少、学会了多少,计划今后如何记住信息(程序性知识)。在分析过程中,学生应始终把焦点放在涉及错误的具体内容上,而不应该关注导致错误的一般原因。下面的例子是生物考试中一道多项选择题的错误分析。[9]

错误分析法旨在帮助学生从更广的角度分析试卷问题,不仅仅是就题论题。教师要引导学生向自己提出诸如此类的问题:“当时我怎样学习,考试时就会做出正确答案?”“当时我怎样学就会知道什么样的答案是错误的呢?”不要过分看重问题的对与错,要多关注学习内容,这样学生会更深入的理解材料,明白知识之间的相互关系,最终,学生将能掌握正确的思维策略,学会调节自己的学习。

获得测试结果不仅是教与学的终点,而且是新一轮教与学的开始。教师应充分发挥自编测验结果在诊断和改进方面的积极作用,有效利用评价信息来反思教学与评价行为,挖掘这些信息对改善教学与促进学生学习的意义。测试结果的处理不只是简单地发布与告知,更侧重于对结果的解释与反馈,学生对自己学习的改善。教师自编测试其增值作用体现在“学习——评价——获得评价结果——利用评价结果规划再学习……”这一持续发展的过程中。

注释:

①注:对于Criterion-referenced与Standard-referenced,目前学术界基本都把它们翻译为标准参照,但一般意义上,Criterion-referenced与Norm-referenced相对应,Criterion-referenced与Standard-referenced在很大程度上包含的内涵是一样的,主要区别在于Standardreferenced含有多种表现水平,而Standard的含义更具有课程标准的内涵(包括内容标准、表现标准),本文选择了后者,主要原因就在于Standard-referenced所具有多种表现水平的内涵,而且更强调凸显了测试数据分析以课程标准为依据的特点。

[1]Stiggins,Richard J.From Formative Assessment to Assessment for Learning:A Path to Success in Standards-based School[J].Phi Delta Kappan,2005(10).

[2]Black,P.&W iliam,D.(1998).Inside the black box:Raising standards through classroom assessment[J].Phi Delta Kappan,80(2),146.

[3]W.James Popham.(2003).Test Better,TeachBetter-The Instructional Role of Assessment[M].Associantion for Supervision and Curriculum Development(ASCD),3.

[4]Robert J.M arzano,DebraJ.Pickering.有效课堂——提高学生成绩的使用策略[M].张新立译.北京:中国轻工业出版社,2003:122.引用时稍做修改。

[5]Hughes,A.(1989).Testing for Language Teachers[M].Cambbridge:Cambridge University Press,1-2.

[6]W.James Popham.优化测试,优化教学[M].邓小玲译.北京:教育科学出版社,2009:3.

[7]Robert Marzano著.有效的课堂评价手册[M].邓妍妍译.北京:教育科学出版社,2009:96.

[8][9]Neal A.Glasgow,Cathy D.Hichks著.成功教师全攻略[M].梁丽娜译.北京:中国轻工业出版社,2008:85,87.

(责任编辑:张斌)

刘辉/上海市闵行区教育学院

猜你喜欢
错误测试标准
2022 年3 月实施的工程建设标准
在错误中成长
幽默大测试
幽默大师(2020年11期)2020-11-26 06:12:12
忠诚的标准
当代陕西(2019年8期)2019-05-09 02:22:48
“摄问”测试
美还是丑?
“摄问”测试
“摄问”测试
一家之言:新标准将解决快递业“成长中的烦恼”
专用汽车(2016年4期)2016-03-01 04:13:43
不犯同样错误