郑方贤
“学习性评价”于1998年在国际教育界首次提出,随后《黑箱内:通过课堂评价来提升标准》发表,国际教育界开始了“学习性评价”的推广应用,掀起一场学校教育的革新。近十来年,“测评与学习”也受到中國教育界关注。但是,相对而言,中文里的测试、考试(或测评)、评价等词的含义,更接近英语单词test、assessment、evaluation。在中国的学校教育中还难以看到“形成性评价”“以学习为导向的评价”等模式的实践,更多的还是各种传统的学科测验,以及被学生戏称为“周周爽”“月月爽”的考试。新高考推行后,逐年形成的大数据,使得测评对教与学的提升成为可能。
竞争性测评
推动应试学习模式
虽说不断进步的技术保证了大规模测评的科学性、客观性,其标准化、集约化的高效率也很好地回应了社会与公众的要求。但是众所周知,这种由一次测试决定结果的终结性评估方式只能反映被测学生过去的积累,而并非全部能力,也无益于学生在学习上的自我完善与能力提升,反而会引起更大的考试焦虑,形成强烈的应试学习模式。
以最近四十多年的高考为例,过去极低的录取率使升学竞争十分激烈。尽管高考是由多门科目的测试所组成,但较之单门科目分数的得失,人们往往更关心总分,对总分的关心也是集中于其在总体中的排名是否达到了大学的录取分数线标准。
虽然命题专家围绕课程标准、教学状况和高校选拔要求对各科试卷进行了精心开发与设计,也对考试过程和评卷质量进行了精确控制,但结果仅仅是各门科目总分的反映,实在令人非常无奈。由此所形成的以模拟考试代替教学的高强度应试局面也是必然的结果。
新高考为测评发挥正向作用提供基础。从1999年起,国家增加高等教育投入,不断扩大大学的招生规模,使得高考的录取率连年提高,各地区普遍在80%左右甚至有超过90%,但是业已形成的应试教育模式难有根本改观,高中学生普遍是早晨7点踏进教室、晚上9点离开学校。
正是在这样的背景下,国家坚决推出了高考综合改革方案。从测评的视角看,新高考被分成了两个部分:即所有学生参加的语文、数学、外语科目的统一考试,与思想政治、历史、地理、物理、化学、生命科学科目的高中学业水平考试。
而高中学业水平考试又根据学习的深入程度分为统一参加的合格性考试和选择其中三门参加的等级性考试。即把一部分科目的测评以常模参照呈现,作为个体学生与其他学生的比较,而另一部分科目的测评以标准参照呈现,以期降低测评整体的竞争性。因为学业水平考试的标准参照还是与得分率分布相联系,依然呈现出高利害性。但是学业水平考试的定位与设计,评价维度与指标体系,使得评价标准的意义得到体现,为测评对教学和学习的正向反拨奠定制度基础。
测评提升高中教育质量
就上海而言,2014年启动新高考,由于政策、环境的稳定,特别是高考总分分布的稳定可期,促使大家越来越关注如何通过测评提升高中培养质量。目前,各考试科目依据不同的定位,兼顾知识学习与能力提升,辅之以系统的学业评价标准,从内容和能力两个维度,通过相应的各分项指标形式得以呈现。因此当学生完成考试以后,他所获得的反馈还包括根据评价维度所描述的各分项指标以及对应的得分情况,学生可以了解自己的学习情况以及在群体中的相对位置。对于各科目的高中学业水平考试,学生更可以通过合格性考试的成绩报告,发现自己在科目学习上的长处与短处,以完善下一步的学习,并争取在等级性考试中取得好成绩。我们通过上述方法所形成的学校和区域的成绩报告,对改善学校的教育教学起到了促进作用。
考试数据表明,上海师范大学附属中学闵行分校在思想政治科目合格性考试上的表现非常突出,他们的学生在内容领域和能力目标评价维度各分项指标上的得分率每年都比前一年有进步。如果以2017年该科目平均成绩的位次为基准,则2018年比2017年在全市提升了23名,2019年又比前一年提升了65名。闵行第三中学,在思想政治、地理、化学、生命科学四门学业水平等级性考试科目上的进步也很显著,各科目的整体成绩排位三年来实现了两位数的增长。闵行区很好地运用了学校和区域的成绩报告信息,区教育学院通过集体分析反馈和分学科到学校指导相结合的办法,对学校的学科教学进行了有效干预,提升了学生的学习质量。
测评的目标指向是学习。在高考综合改革之前,测评的功能是以科目总分的方式实现学生学业的评价与筛选;在新高考的推动下,测评还能够依据所建立的学业评价体系给予多维度多指标的分析评价,实现对教与学的正向反拨;未来还可通过更多分析工具、更多分析视角探索测评与教和学的深度融合,即把测评贯穿于学习过程中或者教学过程中,更有效地促进学习、促进学习质量的提高。
从不同维度分析测评大数据
在前期的工作基础上,我们尝试不同的分析方法与工具,对考试数据进行分析和挖掘,并反馈所获得的有用信息,以促进学校教学质量的提高。我们采用统计中的聚类方法进行评价维度的综合聚类,结果发现,对于学校来说,不同学科从不同维度来分析,可以得出不同的评价结果,而且对于不同的学校都有不同的需要提升之处。
仅以2019年数学科目高考学生的成绩来分析各高中的数学教学情况。数学科目按照内容领域和能力目标两个维度进行评价设计的,150分的试卷试题中——分属内容领域维度的四个分项指标:方程与代数(占40分)、函数与分析(占43分)、数运算数据整理和概率统计(占13分)、图形与几何(占54分);分属能力目标维度的五个分项指标:数学基础知识与基本技能(占61分)、逻辑推理能力(占19分)、运算能力(占19分)、空间想象能力(占19分)、数学应用与探究能力(占32分)。
为保证分析结果的统计意义,我们确定204所高中学校的39000多名学生为分析对象,他们参加了2019年本市的高考数学科目考试且得分都位列前95%,并且每所学校的实际考生人数都大于或等于50。
我们以学校为单位,分析各学校的每位学生在各评价维度相应分项指标上的得分率,寻求他们的共性,以呈现不同学校的类型和特点,希望能为学校的教学提供参考。
根据计算,204所高中学校从内容领域维度得分上被分为了五类。这五类所含学校数目不等,分别是26所,49所,59所,41所和29所。
仅以其中两类为例,我们可以发现,包括上海中学等人们通常所说的“四校八校”在内的29所学校被归为一类,这些学校都是近年来表现突出的优质高中学校。包括天山中学、复旦中学等在内的49所中学被归为另一类,也都是公认的好学校。
从内容维度来分析,可以得出的结论是——学生在试卷上的得分可以反映出这些学校的教师在数学科目内容知识的教学是成功的。
但是,如果对能力目标维度也进行了综合聚类分析,同样将学校分为五类,却发现上述29所学校中有10所学校形成了单独的一类,无疑,单单根据这一年的数据来看,这10所学校是两个维度下综合聚类分析表明最好的一类学校。
上述29所学校中的其他19所学校与49所学校中的22所组成了能力目标维度综合聚类分析结果中的单独一类,这意味着这些学校的学生在高考答题时,在这一维度上有相似性。
虽然不同的分类方法会给出不同的结果,但是通过多元的观察视角,结合具体维度的分项指标,就不难发现教与学改善的空间。