2020年6月30日,中央全面深化改革委员会第十四次会议审议通过的《深化新时代教育评价改革总体方案》提出:“要改进结果评价,强化过程评价,探索增值评价,健全综合评价,着力破除唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,建立科学的、符合时代要求的教育评价制度和机制。”这是继2018年全国教育大会提出“扭转不科学的教育评价导向”后,指导教育评价改革的又一份纲领性文件。其中,明确提出的“四个评价”引起了大众的广泛关注和热议,尤其是需要“探索”的“增值评价”。
由此可见,探索增值评价新方式,构建“面向全体、尊重差异、关注进步、促进发展”的学生学业增值评价体系,已成为新时代教育评价改革的重大举措和突出亮点。
一、核心要义:增值评价是对“关注点”和“参照系”的改变
李凌艳在2020年10月的《中小学管理》《我们如何用好教育增值评价?》一文中认为:
第一,尊重但不神化增值评价的技术“面纱”。简单而言,增值评价缘起于上世纪六七十年代国际上对教育质量的担忧和对学校效能的关注,到了80年代,多水平模型技术的发展和完善,为增值评价提供了更加精确的技术方法。然而,正由于其兴起离不开复杂统计模型的发展,增值评价的实践也一直没有完全摆脱人们对其技术“黑箱”的质疑。但是也正是由于统计模型的不断探索和完善,增值评价可以通过现代统计技术手段,考察学校或教师对学生发展的影响作用,分清随着学生年龄增长和社会变化,究竟学校教育和教师在学生发展中有多大作用,以及究竟在哪些方面发挥了作用。只要认清了这一点,我们就揭开了技术的神秘面纱,理解了增值评价只是教育评价的一种,其根本功用就是更客观地看清学校教育的效用。而就教育本身而言,它并不是一个能完全数量化的过程,不要苛求其统计数据的绝对精准,也不要迷信借助统计技术呈现的每一条精细结果。这样一来,我们就不会被技术细节或细微的数据事实所困,不会陷入统计技术所带来的数据汪洋中而迷失了评价本身的航向。
第二,理解并相信不论统计技术如何臻进,增值评价的要义始终在于“关注点”和“参照系”两个根本变化点,其他则很可能都是附生价值。无论增值评价的统计原理看起来多么复杂、高深,数学统计公式多么巧妙、高级,与传统的用一次性横断统计数据进行结果评价的做法相比,增值评价改变的就是两个基本点:对教育的不同关注点,以及用不同的教育结果参照系进行对比。
所谓对教育的不同关注点,是指与传统的结果评价相比,增值评价关注的不是进行评价时的绝对值,而是在多次评价追踪过程中的增长值。或者说,传统的用一次结果进行的横断评价,无法考虑每个结果之前的起点以及获得这一结果的过程,而增值评价关注点的变化恰恰在于此。也正因如此,增值评价可以考察教育所带来的增值,可以在教育增值中分离出学校和教师的相对净效应。
所谓用不同的教育结果参照系对比,是指当考察增值效应值的大小时,增值评价技术可以选择不同的常模参照系,可以跟全国或其他更大范围的常模参照对比,但是在增值评价实践中,更多、更有效的做法是选择与评价起点相近水平的群体常模进行参照对比,这样更能体现增值的思想和评价的公平。比如:对于学校的增值,评价可以把学生入学时的水平分成不同等级,然后在追踪评价时分别根据原有所属等级水平学生的常模进行进步值的分组对比,这样更能体现学校对不同教育起点学生的教育增值。
基于以上两点,只要在增值评价的实践中紧紧把握“关注点”和“参照系”这两个变化点,就能万变不离其宗,牢牢抓住增值评价的要义,始终体现其根本价值。相反,如果陷于具体评价结果的细枝末节,那么增值评价很可能会陷入复杂统计结果的数据泥沼中无法自拔,就还是举着增值评价的“旗帜”行一次性、结果性绝对评价之实,走的还是以评价进行排名排队的简单粗暴的评价问责之路。
二、学生学业评价:从“诊断性”转移到“激励性”
刘进球、刘奕在2020年第11期的《湖南教育》《创新增值评价方式,促进学业全面发展》一文中指出:
基于“增值”的学业评价体系将重心转移到“激励”之上。由于坚信所有学生都能实现“增值”,关注的不是分数而是进步,潜藏在成绩背后的每一点付出、每一丝变化都被测量到,并且被尊重、被肯定,学生学业进步的“星星之火”,自然就比较容易因此而形成“燎原之势”。学业评价与医师治病不同,医师治病必须“对症下药”,自然要把病症查清弄透;学业评价旨在“因材施教”,关键是要做通“材”的工作,强化学生的内驱力和自信心。叶圣陶先生主張:“教是为了不教。”要达到“不教”目的,就必须调动学生,让他们明白“努力就能增值、付出就能收获、学习就能成长,进步就能成功”。认可进步、放大优点、传递正能、促进发展,可以说是学业增值评价的最大特色和突出优势。
增值评价是国际上最为前沿的教育评价方式,但普遍只用以评价教师教学和学校办学,只用于促进教育公平、均衡发展,其实,增值评价对于提供适合学生的教育、促进学生全面而有个性发展也意义重大。在开展增值评价时,人们常常讳言学业增值评价,仿佛一谈学业就在搞应试教育、在“以分数论英雄”。其实,“学生以学为主”,探索学业增值评价方式,是正大光明之举,没有必要小心翼翼。笔者认为,学业评价永远是教育评价的重点和焦点,关键是要创新,要将目光锁定在“增值”上,真正做到面向全体、尊重差异、关注进步、促进发展。著名学者马小强说:“寻求学生最大幅度的增值是学校的使命。”教育评价也应该这样,要视“寻求学生最大幅度的增值”为使命追求,为促进学生全面而有个性、主动而生动的发展做出贡献。
三、教师绩效考核:增值性评价从研究到应用
赵德成在2020年10月的《中小学管理》《将增值性评价引入教师绩效考核,如何系统推进?》一文中谈到:
在我国,关于增值性评价的研究尚处于起步阶段,严格意义上在教师人力资源管理实践中应用增值性评价的实践案例几乎没有报道。随着《深化新时代教育评价改革总体方案》的颁布,增值性评价将逐渐从研究和政策文本走向实践,成为教师绩效考核的新趋势。那么,在教师绩效考核实践中做好增值性评价需要注意哪些问题,笔者结合我国实际提出如下建议。
(一)修订有关政策,为增值性评价实施创造数据条件
增值性评价的核心数据是学生参加标准化测验所取得的成绩。这就必然面临一个现实问题:近些年来不少地市为减轻中小学生过重学业负担,明确要求严格规范考试和评价工作。比如:许多省市规定,除组织初中毕业升学考试外,区县不得在初中其他年级和小学组织统一考试。而增值性评价一般不能由学校单独实施,需要在学区乃至区县、地市等更大层面上统筹推动,如果没有跨校的统一考试,那么增值性评价就无法实施。
有人建议将增值性评价与区县教育教学质量监测数据联系起来。但值得注意的是,多数质量监测项目采用概率比例抽样或其他方式抽取一个学生样本参与,而不是针对区域内所有学生;测验内容只覆盖语文、数学、科学等部分学科,且通常情况下为避免学校之间对学生学业成就水平进行比较,参与质量监测的学生只完成若干题组中的部分测验,而不是完整的学科测验;另外,质量监测项目只针对4年级、8年级等少数年级,缺乏逐学年的连续追踪数据,所以质量监测项目也难以为教师增值性评价提供数据支持。有关部门需要对有关政策和工作安排进行系统反思与改进,一方面使收集区域性跨年级学生学科学业成就连续数据成为可能,另一方面又不能因此加剧应试教育倾向,增加学生负担。
(二)做好评价数据库建设,全面收集相关数据
评价数据库建设是增值性评价实施的前提。增值性评价采用追踪测验的研究范式,不仅要保存学生在多次标准化测验中的成绩数据,而且要收集来自学生、家庭、班级、教师、学校等多方面的相关数据。增值模型构建是一个不断探索与完善的过程。已有研究发现,在同一地区针对同一批教师,采用不同的模型,在增值分析中控制不同的变量,可能导致对教师绩效的高估或者低估。有时候,在同一地区,针对不同学科教师的增值性评价也需要采用不同的模型,因为对学生成绩有重要影响的因素具有学科差异。要确保模型能纳入各种影响学生成绩但教师又无法控制的因素,使模型能为管理者和教师广泛接受,我们就需要注意数据的全面性,尤其是在改革初期的探索阶段。当然,这种全面也是有限度的,究竟收集什么数据不仅要充分借鉴已有研究,而且要结合当地实际,广泛听取干部和教师意见,收集各种可能有用的信息。而且在收集过程中要注意减轻师生负担,如果有些数据在其他数据库中已经存在,就不要重复收集,只要开放数据接口和做好链接就可以。
(三)关注教育测验效度,确保数据质量
需要注意的是,在各种教育测验编制与改进过程中,测验效度这个基础性问题尚未受到足够重视。
效度反映了一个测验题目或一整套测验准确测量欲测特质(如口语交际能力、逻辑推理、批判性思考)、针对既定目标做出推论和解释的有用性程度,它是衡量测验质量的首要指标。当前,全球最具影响力的测验质量分析框架——《教育与心理测试标准》,在1999年版及2014年最新版中都强调效度是教育测验最根本的要求,将其放在首要位置进行分析与讨论。如果测验不能有效描述学生在预测特质上的表现,不能准确推论学生达成既定学习目标的程度,比如一项历史测验本意要考查学生对历史知识的掌握程度,但实际考查到的是学生的阅读理解能力,那么即使它的难度、区分度、信度合乎测量学要求,也是不合格的测验。题目参数估计、等值化处理等复杂技术必须在测验效度达标的前提下才有意义。
同样的道理,只有学科测验的效度合乎测量学要求,基于测验成绩及相关因素所进行的增值性评价才是可以接受的,也才能在實践中真正发挥对教师教学行为以及课程改革的积极导向作用。所以,各区县和学区在推动增值性评价过程中,必须高度重视学科测验的效度,改善测验质量,同时也要确保其他数据的真实性、有效性与可靠性。
(四)积极稳妥地推动有关改革,防止急躁冒进
发达国家的教师绩效工资改革能在加大奖惩力度、拉开收入差距的背景下成功推动十多年,不仅是因为他们构建的增值模型控制了多种非教师因素,从细节上保障了评价的公平性,而且更重要的经验是他们在改革中采取积极而谨慎的态度。他们不盲目追求分析技术的复杂性,没有采用多水平模型,而是采取便于理解与实施的多元线性回归分析模型;他们在控制变量选取上不仅参考已有研究,而且积极听取和响应教师的关切;他们没有因为联邦教育部和资助方要求加强教师工资与学生分数增值的联系,就在实践中扩大化应用增值性评价,在他们的教师考核方案中,增值性评价只是教师整体绩效考核的一部分,而且只针对考试学科教师。
总之,在教师绩效考核实践中应用增值性评价,关系到每一位教师的切身利益与专业发展,大而言之更是关系到学校、地区乃至国家的教师队伍建设。政策制定者、管理者和研究者要加强合作沟通,积极稳妥地推动有关改革。
(责任编辑:李晶)