李凌艳
摘要在“四个评价”中,相对于结果评价、过程评价和综合评价,“增值评价”这一我国教育实践领域原本不很熟悉的概念引起特别的关注和热议,亟待澄清思想、统一共识。从整体架构而言,“四个评价”是组合拳,增值评价不宜“异军突起”;从实施导向看,增值评价更是一种评价思想而非技术。只有牢牢把握增值评价对教育“关注点”和“参照系”改变的要义,并深耕教育实际发展及需求,才能真正发挥教育评价应有的引领和保障功能。
关键词 增值评价;教育评价;“四个评价”;综合评价改革;学校效能;发展性评估
中图分类号G63
文献标识码B
文章编号1002-2384(2020)10-0008-03
注释:① 本文系国家社会科学基金2020年度项目“基于大数据循证的学校治理现代化研究”的研究成果之一。
2020年6月30日,中央全面深化改革委员会第十四次会议审议通过的《深化新時代教育评价改革总体方案》提出,要改进结果评价,强化过程评价,探索增值评价,健全综合评价,着力破除唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,建立科学的、符合时代要求的教育评价制度和机制。这是继2018年全国教育大会提出“扭转不科学的教育评价导向”后,指导教育评价改革的又一份纲领性文件。其中,明确提出的“四个评价”引起了广泛关注和热议,尤其是需要“探索”的“增值评价”。
增值评价在我国教育实践领域尚未得到充分了解和应用,而且相对于其他三个评价,增值评价在教育评价发展史中出现较晚,本身仍存在一些技术性问题,学界对其争论也相对更多,在我国目前的教育实践中更多处于探讨和探索应用阶段。因此,我们有必要对增值评价的一些价值导向、基本原则和技术思想问题进行梳理澄清并形成基本共识。
在今天的时代背景下探索增值评价,一个根本前提是一定要将“四个评价”融为一体,将增值评价视作综合评价改革有机整体的一个内容,而不是单独就增值评价讲增值评价。否则,教育评价改革很容易落入形式主义的窠臼,陷入被评价技术异化的境地,终将逃脱不了为了评价而数据造假、因为评价而徒增师生和学校负担,甚至因为评价失真或评价不公而背负骂名的命运。
上述不良评价可能带来的负面影响绝非“危言耸听”。因为评价无可避免的导向作用,它对教育实践的发展确实举足轻重,尤其对于一方教育实践而言,每个时期的教育发展或教育变革走向,都会深深地与其教育评价的主张紧密关联。从这个角度看,某个时期的教育评价思想、导向和主张甚至会深深影响一代人的成长—正所谓评价是“龙头”,要什么评什么,评什么发生什么。今天,面对新时代的新需求,为了解决人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾,我们要破“五唯”,落实立德树人根本任务,在教育评价机制上实现四个评价的良性循环,发挥综合效益。
正是由于评价的重要地位和作用,教育实践中常常会出现对教育评价的导向“过于敏感”“说风就是雨”的现象,这从最近20年我国教育管理领域的“监测化”现象中就可见一斑。现在,随着国家纲领性文件的发布,原本在学界一直不温不火的“增值评价”闯入教育实践场域,可能引起很多关注。这时,各级教育管理、教育实践的同仁们和教育研究领域的相关专业人士一定要特别警醒,不要搞增值评价的“异军突起”,不要“一哄而上”地搞“增值评价”。否则,为了“增值”的增值评价或者为了“评价”的增值评价,势必给广大教师、学校带来沉重负担和视听混淆。更有甚者,由于增值评价本身的技术复杂性,会更容易使其披上技术的“噱头”而大行反技术伦理和技术科学之实,扰乱教育评价秩序,最终影响教育的持续、健康发展。
评价改革从来都是系统工程,“四个评价”是国家经过认真研究、反复论证后提出的“组合拳”,是新一轮深化教育综合改革的有力保障和重要举措。评价改革一定要在这个大背景下、在评价的整体话语体系下探索增值评价,切忌求异性创新、剑走偏锋,那将很可能使区域的教育评价改革和教育发展走上歧途。
相对于增值评价在我国实践领域的初始探索,国内外学界对增值评价的研究已有半个世纪的历史。在我国,近二十年来不断有学者对增值评价的功能、导向、方法等进行研讨。从2012年到现在,我国学界对增值评价的研讨开始进入一个小高峰,其中介绍增值评价在国外的发展史、分析其在实践运用中的经验与教训及其对我国的启示是主流。
在这些值得借鉴的国际经验中,美国田纳西州的增值评价系统(Tennessee Value Added Assessment System,简称TVAAS)和英国英格兰地区的基础教育增值评价无疑格外值得研究和注目,而从它们的最新发展不难看出,二者都在增值评价技术不断完善的基础上格外注重与其他评价技术和方法的融合,从而努力突破增值评价本身的技术局限,走向综合发展,实现教育评价制度与机制的升级。比如:从2011~2012学年开始,田纳西州的增值评价系统就与学生成长档案袋评价模式和课堂观察互为补充,以使所有学科教师都能获得基于自身教学实际的个人增值统计结果。[1][2]再比如:与TVAAS坚持用复杂的统计模型及其升级换代技术不同,英格兰的增值评价简化了增值评价的方法,放弃更为高级的统计模型,回归到简单易行的均值计算法。这看起来是一种反其道而行之的“逆行”,但实际上正反映了其在不断探索实施的过程中更注重将增值分数只作为一个重要指标,而远非教育和学校效能的全部的评价理念。在英格兰的教育制度中,信息公开的透明性更提升了增值评价的影响力和权威性,为评价结果受到重视提供了重要保障。[3]
这些重要的国际经验都在启示我们,缘起于统计技术突破的增值评价,其真正的力量恰恰在于技术实现背后的教育思想和主张,它真正的信念在于评价要导向教育公平和每个人都能获得进步与发展,每名教师及每所学校都能实现教育增值。
所以,对于一线教育管理者和广大校长、教师而言,在信任相关专家研制更好的支持增值评价落地实施的统计模型和技术的同时,也大可不必被技术的难题束缚住手脚。各地在教育实践中,更应该探索的是如何运用增值评价的思想让人们更关注教育的增值,而不只是一时的绝对水平表现;更看重教育可能且应该带来的增值,而不止于眼前的暂时差异。
如何在实践探索中把握增值评价的要义,实现其发展性评价的促进功能呢?笔者认为,对于广大一线教育实践工作者而言,这里有两个“诀窍”。
第一,尊重但不神化增值评价的技术“面纱”。简单而言,增值评价缘起于上世纪六七十年代国际上对教育质量的担忧和对学校效能的关注,到了80年代,多水平模型技术的发展和完善,为增值评价提供了更加精确的技术方法。然而,正由于其兴起离不开复杂统计模型的发展,增值评价的实践也一直没有完全摆脱人们对其技术“黑箱”的质疑。但是也正是由于统计模型的不断探索和完善,增值评价可以通过现代统计技术手段,考察学校或教师对学生发展的影响作用,分清随着学生年龄增长和社会变化,究竟学校教育和教师在学生发展中有多大作用,以及究竟在哪些方面发挥了作用。只要认清了这一点,我们就揭开了技术的神秘面纱,理解了增值评价只是教育评价的一种,其根本功用就是更客观地看清学校教育的效用。而就教育本身而言,它并不是一个能完全数量化的过程,不要苛求其统计数据的绝对精准,也不要迷信借助统计技术呈现的每一条精细结果。这样一来,我们就不会被技术细节或细微的数据事实所困,不会陷入统计技术所带来的数据汪洋中而迷失了评价本身的航向。
第二,理解并相信不论统计技术如何臻进,增值评价的要义始终在于“关注点”和“参照系”两个根本变化点,其他则很可能都是附生价值。无论增值评价的统计原理看起来多么复杂、高深,数学统计公式多么巧妙、高级,与传统的用一次性横断统计数据进行结果评价的做法相比,增值评价改变的就是两个基本点:对教育的不同关注点,以及用不同的教育结果参照系进行对比。
所谓对教育的不同关注点,是指与传统的结果评价相比,增值评价关注的不是进行评价时的绝对值,而是在多次评价追踪过程中的增长值。或者说,传统的用一次结果进行的横断评价,无法考虑每个结果之前的起点以及获得这一结果的过程,而增值评价关注点的变化恰恰在于此。也正因如此,增值评价可以考察教育所带来的增值,可以在教育增值中分离出学校和教师的相对净效应。
所谓用不同的教育结果参照系对比,是指当考察增值效应值的大小时,增值评价技术可以选择不同的常模参照系,可以跟全国或其他更大范围的常模参照对比,但是在增值评价实践中,更多、更有效的做法是选择与评价起点相近水平的群体常模进行参照对比,这样更能体现增值的思想和评价的公平。比如:对于学校的增值,评价可以把学生入学时的水平分成不同等级,然后在追踪评价时分别根据原有所属等级水平学生的常模进行进步值的分组对比,这样更能体现学校对不同教育起点学生的教育增值。
基于以上两点,只要在增值评价的实践中紧紧把握“关注点”和“参照系”这两个变化点,就能万变不離其宗,牢牢抓住增值评价的要义,始终体现其根本价值。相反,如果陷于具体评价结果的细枝末节,那么增值评价很可能会陷入复杂统计结果的数据泥沼中无法自拔,就还是举着增值评价的“旗帜”行一次性、结果性绝对评价之实,走的还是以评价进行排名排队的简单粗暴的评价问责之路。
正因为上述增值评价指导思想和实践运用的基本观照点,国际上增值评价研究和实践比较领先的美国以田纳西州为代表的有关州,以及英国基础教育的增值评价系统,都深度体现了结合当地教育实际发展状况和需求,不断精进其具体增值评价技术和实施方案的特点。也正因如此,田纳西州的增值评价系统从诞生到今天三十多年的时间里,不断自我发展、丰富、完善,也不断引领美国基础教育评价的新发展;英国英格兰地区的增值评价系统通过更好地借助国家数据支撑系统,自20世纪90年代开始试点,到2006年在全国范围内实施,实现了教育评价系统与督导制度的良好互补,日益成为本国关于学校问责和学校效能的重要话语。[4]
实际上,笔者在日常工作和研究过程中,通过对我国不同地区教育评价实践的考察,已经发现了很多本土探索和实践增值评价的优秀经验。在我国的一些区县,对于学校的综合评估已经开始尝试渗透和介入增值评价思想和技术,虽然受限于具体复杂统计模型技术的掌握,但是借助对教育增值的关注点变化,并自觉地运用更客观、科学的不同参照系的做法,已经形成了非常有效的促进不同生源水平、不同办学起点学校整体效能提升的生动经验。比如:有些区域对于学校的综合评估不用绝对排名,而用学生入学和毕业时成绩变化值的分区比较,同时在评价的最终结果中考虑起点不同学校的各自等级水平内的纵向比较,而且对于不同指标设计通俗易懂、具有强烈导向性的权重分配(如学生的体质发展进步状况具有比各传统考试学科成绩变化更高的权重等)。这样的学校效能促进性、发展性评估也许没有标上增值评价高大上的技术标签,但实质是很好地运用了增值评价在“四个评价”联动效应中的独到作用。
我们相信,只要坚持正确的评价思想和导向,坚持系统评价改革的方向,既不轻视技术的壁垒又不过分夸大技术的作用,深耕各地的教育实践,一定能锻造出生动、鲜活的教育改革之花!
参考文献:
[1] 岳伟,陈俊源,胡祥恩,莫伦.从TVAAS到Individual Growth:美国田纳西州增值性教师评价发展新趋势[J].现代教育管理,2019(9):69-77.
[2] 胡咏梅,施世珊.相对评价、增值评价与课堂观察评价的融合—美国教师评价的新趋势[J].比较教育研究,2014(8):44-50.
[3][4] 尤铮,王璐.英格兰基础教育增值评价的实施与效用探究[J].外国教育研究,2019(7):42-53.
(编辑 崔若峰)