刘飞
一、尴尬现实
有人说,当前评价驱动着教育,它是一股最为强大的力量,不但控制、主导着学校里的各种行为,而且抵制着任何试图超越标准框架和先前定义的变化。但美国马里兰大学的米斯勒维教授认为:“当今的教育评价已面临着一个危机,这种危机正在威胁着它的基础。根本问题在于隐含在标准化测验理论中的能力观不符合认知和教育心理学中正在出现的观点。”“标准化测验”主要指如今一统天下的“客观纸笔测验”,即我们通常所说的以追求标准答案为旨归的“考试”,设计形式大多为单项或多项选择题、是非判断题、填空题以及少数论述题。“正在出现的观点”概括起来,即“学习是根植于情境中的,而不是像传统认为的那样可以在‘去情境条件下进行;知识也不是一个独立于情境的客观实体,而是学习者建构知识的背景及学习者在建构知识时所从事的活动的一个有机组成部分”。就像机动车驾驶执照考试,一个通过“机考”的人并不能确保他就能通过“路考”,只有将客观事实性的知识运用于真实的生活情境中,并通过一定的行为表现出来,才能代表他真正学会了知识。显然,新型学习观与知识观呼唤别样的评价理念以及评价方式。
美国课程理论专家泰勒认为:“对于评价来说,不是评价客观不客观的问题,而是教育目标是否实现了的问题。在目标之中,有容易考查的部分,也有难以考查的部分。倘若忽略了难以客观地考查的部分,那么,教育本身也就扭曲了。”如今中小学校里的评价已完全被窄化为各种考试,如“月考”“期中考”“期末考”,还有“学考”“会考”“中考”“高考”,等等。学生只要能在这些非对即错的二元对立的考试中取得高的分数,那么,在家长和教师的眼中,他(她)就是个“好学生”。并且像中考、高考这样“高利害”的考试之于教师、学生以及家长,完全成为了赋予分值与名次的竞技场。然而我们不得不正视,这种评价只能检测到客观纸笔考试能检测到的学习结果,并且这些结果多趋向于较低级的“记忆(再认或回忆)”“(知识)理解”等认知能力,而像“思考”“推理”“判断”“评价”“应用”等较高级别的认知领域的目标则难以检测到。所以,单一化的客观纸笔测验并不能全面、客观地考查和评定学生的学业成就,并且这种测验是唯分数是从的,势必会忽视对其他教育目标的关注与培养。这也不难解释如今为何会有这么多的“高分低能”甚至“高分失德”学生的存在。
二、迫切需要
以追求标准答案为旨归的考试只能培养出“解题取分”的人而培养不出“质疑探究”的人,这种客观纸笔式的评价取向已不适应当下学生的学业质量评定。这种“课程—教—学—考试(评价)”的陈旧的线性程式已不能全面、客观、准确地观照学生的真实学习情况,其反应更多的是学生在一段学习过后“知道了什么”,而不能呈现与确认学生在真实情境中的“行为表现”,即“能做什么”。于教师而言,客观纸笔式测验至多只是对学生学习进程的一种追踪,并且大多仅局限于“知识理解情况”的追踪;于学生而言,其更是一个游离于或凌驾于真实学习活动过程外的孤立环节。概言之,传统的纸笔式测验仅是一种“对学生学习的评价”而绝非“促进学生学习的评价”。前者显然简单并窄化了评价的应有效用,后者才是现代教育学所追求的评价本义,即要求评价不再仅限于对教与学之后的判定,而应该成为促进教师教和学生学的工具或手段。将评价有效地内嵌于教与学之中,形成的应该是一种“课程—教—学—评价”一体化的循环互动式教学程式。为此,我们提出一种早已存在但有些被人忽视的评价范式——表现性评价。此种评价范式不仅能够检测客观纸笔测验检测不了的学习结果(既检测学生“知道什么”,还检测学生“能做什么”),还有助于促进“课程—教—学—评价”的一体化,将评价内嵌于整个教学活动之中,伴随教学始末,实现“评价助教学”的本质效用。正如美国学者琳恩等人指出的“多项选择等纸笔测验的价值,主要在于它是作为其它有价值表现的征兆或相关因素。相反,表现性评价则绕过了作为预测或征兆的中间地带,直接对学生‘能做什么的行为表现进行评价”。
就拿语文学科来说,它是一门学习汉语言文字运用的综合性、实践性课程。对它的学习,不仅要注重汉语言的建构与运用、学生思维的发展与提升,还要注重学生在创造性审美鉴赏力以及对中华文化的理解与传承方面的培养。从这几项核心学习内容来看,语文学习更多的是一种情境濡染熏陶式的过程,如“思维发展”“审美鉴赏力的提高”等都不是一蹴而就的,是要经历长期的积累整合、内化养成后才能表现出来的。对这些能力或素养进行评定,绝非仅凭一张白纸黑字的考试卷就能检测了的。比如“口语交际”,《义务教育语文课程标准(2011年版)》在“总目标”中要求学生经过九年的语文学习后,能够“具有日常交际的基本能力,学会倾听、表达与交流,初步学会运用口头语言文明地进行人际沟通和社会交往”。诸如此类的学习领域,学生的学业成就水平定是客观纸笔式的统一测验(如中考、高考等)检测不了的。此种窘状迫使我们呼唤表现性评价的介入与实施。这不仅是完善语文课程评价体系的现实需要,也是彰显语文课程价值的现代追求。但何为表现性评价?其有哪些基本特征?我们需要进一步来认识。
三、内涵阐释
表现性评价的英文原词是“performance assessment”,中文翻译除了有“表现性评价”,还有“表现性评定”“表现评价”“表现性测验”“实验评量”,等等。表现性评价并非是一种全新的教育评价方式,实际上,在日常生活中,我们经常运用到,如钢琴等级考试、驾驶执照路考、医生根据症状推定病人情况,等等。但何为表现性评价,业界众说纷纭、莫衷一是。
美国课程研究专家艾特和麦克泰把表现性评价界定为:“学生建构一个真实存在的成果(书面的、可视的或立体的)或者操作设备(驾驶、演讲、团体合作、演奏乐器)来表现他们对任务的理解和掌握程度。”但也有学者认为:“表现是评价的基础。评价要求学生做出一个反应,而不是去选择一个反应,要求他们整合新旧知识及相关的技能,主动完成复杂的任务。”从这些论断可以看出,表现性评价强调的是被评价者执行一项任务的能力而非回答问题的能力,也即“要求学生创造答案或成品展示他们所知和能做的”。此外,“表现性评价评的是复杂与高层次、历程与结果并重的能力”。英属哥伦比亚大学曾提出表现性评价“这个术语用来描述既评定过程又评定结果的学业评定方式”。可看出,在表现性评价中,过程与结果一样重要,其强调的是“做”而不仅是“知道”。并且这个“做”要在真实情境中或者近乎真实的情境中进行与实施。故有人认为,表现性评价就是“教师让学生在真实或模拟的生活情境中,运用先前所获得的知识解决某个新问题或创造某种东西,以考查学生知识与技能的掌握程度,以及实践、问题解决、交流合作和批判性思考等多种复杂能力的发展状况”。可见,表现性评价应是一种真实性的评价,通过“学生挑战‘真实的课题,来把握他们借助五官的‘表现所表达的种种学习状态的一种评价方法”,评价的内容与真实的或模拟的情境相接近与吻合。正如美国评价专家斯蒂金斯认为的那样:“在表现性评价中,我们常常运用真实的生活或模拟的评价练习来引发最初的反应,而这些反应可直接由高水平的评价者按照一定的标准进行观察、评判。”而其中的“标准”主要就是指“事先设计好的评分规则或评分标准”。从上述的定义阐释来看,表现性评价是一种特别强调“建构性”“过程性”“真实性”以及“标准性”的评价方式,综合起来给其下个尝试性定义的话,即“在尽量合乎真实的情境中,运用评分规则对学生完成复杂任务的过程表现或结果做出判断”。
概言之,素质教育下的学生学业质量已不能仅凭传统的客观纸笔式的考试来评判,这种“唯分数”“唯标准答案”的评价方式容易扭曲教育的价值取向,致使学生沦为“做题取分”的工具,失去了多元发展的机会。为此,我们提倡将表现性评价内涵于学生学业成就评价体系之中,这不仅是现实性呼唤,也是时代性诉求。
(作者单位:山东省邹平县魏桥中学)