增值评价的概念、原理和运用策略

2022-11-03 09:54孙宏安
大连教育学院学报 2022年3期
关键词:后测学业成绩因素

孙宏安

(大连教育学院 离退休干部处,辽宁 大连 116021)

中共中央、国务院2020年印发的《深化新时代教育评价改革总体方案》提出教育评价改革的主要原则包括“坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”。遵循这些原则实施教育评价改革有利于“完善立德树人体制机制,扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾”。[1]现在增值评价在国内已经得到相当多的研究和具体实施,相应的理论和实施策略不断得到完善。

一、增值评价的概念

理解增值评价概念的关键在于对“什么是增值”这个问题的回答。

文献的一个典型说法是:增值概念的基础是假定学校能为其学生成绩增加“价值”,测试增值的基本思路是测量学生经过一段时间学习后的进步。为了测量进步,需要在一个时间段(例如一个学期、一个学年或者一个学段)的开始和结束测量基线和结果。我们预期学生的成长都会带来进步或者改善,平均成绩也会有所提高,因此所谓“增值”,指的是在学生可预期的正常成长之外,由教育所带来的额外价值。[2]

文献还有其他说法,但是有两个关键点是一致的。其一,增值是什么值的增加?其二,这个成绩的“增加”的增量是针对什么成绩而言的?即计算增量的起点(零点)成绩是什么?

起点成绩可能是增值评价的关键:它不是原来(学习之前)学生成绩,而是经过这段学习之后预计学生可能达到的成绩,即预测成绩。这一点在前引文献中有所说明。对于学生的学习来说,由于学生自身的成长,学生的成绩肯定会有所增长,这个增长是客观存在的。这个增长在需要准确判断教育教学对学生成绩增长的影响时,无疑是应该排除的。由此反观有的学校有的地方运用后一次测试的成绩减去前一次测试的成绩,将所得的结果作为学生学习的增量,并以此对学生的学习努力、对学校和教师的教育教学工作进行评价就存在误差。因为两次测试既不是标准测试又不是关于同样内容的(等值的)测试,这两个测试成绩实际上不能进行比较;特别是这样做无法排除学生自身的发展而提高的成绩,因而以此来评价学生的学习努力和学校教师的教育教学努力不够公正和公平。用学习之后的实测成绩减去预期学生可能得到的成绩(预测成绩)才是学生成绩的增值,利用这个增值评价学生的学习和学校教师的教育教学工作,就叫作增值评价。

从这两个关键来看,增值评价是追踪学生在一个时间段前后的学业成绩,对学业成绩的变化情况进行研判,通过成绩预期来去除学生性别、家庭背景等先赋因素,生源状况等学生特质因素以及学校层次、教师学历、班级条件等学校因素对学生成绩的影响。这使得增值评价的特点主要表现在两方面:一是评价注重的是“增加值”,即联系学生的先前基础和最终结果分析学生成绩的变化情况,而不仅仅关注学生的最终成绩,实现“不比基础比进步”;二是“净效应”,即剔除成绩中学生、教师和学校等无法改变的因素,仅评价其在可以改变的方面做出的努力,实现“不比背景比努力”。

从增值评价研究者的角度看:增值评价这两方面的特点体现了发展性评价的理念,具有如下优势。第一,有助于激活后进学生、教师和学校的积极性。增值评价可以更好地呈现其进步情况,使其不至于在长期的落后状况中自怨自艾、懈怠放弃。第二,有助于提高前端学生、教师和学校的危机意识。增值评价也可以激活这部分学生、教师和学校的潜能,让他们开展良性竞争,百尺竿头,更进一步。第三,对低效能学生、教师和学校的问题剖析,和对高效能学生、教师和学校的经验挖掘,可以为学、教、管等提供更为有效的策略。更本质的是,实施增值评价可以逐渐改变人们对教育的关注点,从过分关注结果转向更关注过程,从过分关注条件转向更关注培养,树立起内生的教育发展观和科学的教育质量观。

从增值评价使用者的角度看:增值评价以起点定终点,考虑学生基础水平对学生学业成绩的影响,以发展的眼光看待学生学业表现,对学生成长是一种激励,也有利于进一步的诊断和精准教学,挖掘高增长水平学生的学习方式方法,从而不断完善教育教学。[3]

具体的运用上,增值评价可用于一个区域内各个子区域(例如省内各市、市内各县区)之间教学效益的评价,可用于一个区域内各个同学段学校教学效益的评价,也可用于一所学校内各个班级教学效益的评价。

二、增值评价的原理

怎样进行增值评价呢?或者说怎样求出增值呢?基本的做法就是测量一段时间内学生学业成就发展。在这段时间的前后在同样的学生范围内各进行一次测试,分别叫作“前测”和“后测”,前测在专门进行的时候也称为“基线测试”,后测可称为“增值测试”。依据前后测成绩运用恰当的算法做出同样范围内学生的后测成绩预测,后测的实际成绩减去预测成绩,就得到学生学业成绩的增值。

增值评价的关键在于对后测成绩的预期。这个预期(或者叫预测)的一个依据是前测成绩,它实际上标识着学生在所测试学科的基本能力;预测的另一个依据则是后测成绩,毫无疑问后测成绩也标识着学生的学科基本能力。怎样由前后测的成绩得出对学生后测成绩的预期是一个重要的教育统计课题。这个预期指的是,按照这一期间学生自身能力的发展学生在前测成绩的基础上应该得到的成绩(注意这里“学生”不是指单个的学生,指的是特定的学生群体,例如全区域的学生或者全校的学生)。也就是按照学生自身的特质,在一般的(平均的)教学条件下,学生能够得到的成绩,所以学生的成绩预期是一个统计分析的结果。通常的做法是在前测成绩的基础上运用某种算法模型,利用统计方法估计出在后测的时候学生自然的发展能得到什么成绩,以此作为学生的预测成绩,后测(增值测试)成绩与预测成绩的差(叫“残差”)就是学生学习的增值。这个预测的成绩越精确,得出的成绩增值也就越可靠。统计计算总是有误差的,怎样最大限度地降低误差,就是增值算法改进的方向。增值评价的实践发展产生了好几种算法模型,例如现在常用的简单回归模型、多层线性模型、增长百分等级模型等。而且不仅各种计算模型正在进行着不断地改进和完善,也不断有新的计算模型涌现出来。

为了说明由前后测成绩计算出预期成绩的原理,我们采用简单回归模型作为例子。现在有一个区域进行增值评价,共有10所学校参加。其数学学科前测和后测的成绩(全校平均成绩)如表1的第2、3两列,运用SPSS系统简单回归模型计算,就得到了预测值(表1第4列),从后测成绩中减去预测值就得到残差(表1最后一列),也就是关于后测成绩的增值——这是增值的原始数据,所以还是叫作残差,增值的具体数据(增值分数)需要标准化统计处理后才能得出来。

表1 某区增值评价数据

比较4、5、6三所学校,它们的前测成绩只有很小的差别,预测成绩非常接近,但后测成绩有较大的差别,所以三校的增值有很大的差别。校5的后测成绩虽然比前测成绩数值上有所提高,但是远低于预测成绩,所以得到较大的负增值。

从表1所列的成绩来看,后测的成绩高于预测成绩得到正增值,低于预测成绩得到负增值,因而也就必然有可能出现后测成绩与预测一致的零增值。需要注意的是,零增值并非表示该校在提升学生学业表现方面没有效益,而是代表效益的提高与预期相当。正增值表示学校在提升学生学习努力的效益超过了预期,负增值则表示这种努力的成效低于预期。换句话说,增值能依据预测成绩估计个别学校的相对教学努力的效益效能表现。增值分数高于预测分数的学校的教学效能相对于增值分数比较低的学校的教学效能要高一些。这就是增值评价的一个结论。

从表1提供的残差的数据来看,正残差数值之和等于负残差数值之和,也就是说所有残差的代数和为0,这是一个很重要的结论。因为所求的预测成绩数值是一种回归均值,一些数值的均值之和当然是0。反映到增值分数上,虽然经过标准化处理并加上了置信区间之后,一个参加增值评价的区域的所有学校的增值分数之和不一定正好是0,但是一定离0不远,换句话说,在置信区间内,所有学校的增值之和有极大的概率是零增值(也叫平均增值)。这说明一个区域内如果有学校的教育教学效益特别突出,相比较而言一定有效益较差的学校存在。这是一个群体内的比较而言。

当然,作为一种统计计算来说,增值的测算有其相对的不确定性,并且一般来说成绩的数据也不能解释某所学校的表现比预期优异或逊色的原因。一次增值只能在个别学校的层面上,作为有关学校的相关资料看待。不过随着之后考试次数的增加(例如每学期的期末考试),就能不断降低这种不确定性,使得增值的测算越来越准确;如果连续计入5次期末考试(后测)成绩的话,增值的判断就会相当准确,在此基础上评价学校的教学效能就有较大的把握。

三、影响学业成绩的相关因素探讨

学业成绩的数据不能解释学生学业表现的原因,但是对成绩相关联的一些因素的探讨可以帮助分析影响成绩的相关因素。

此外,在探讨学生成绩的增值时主要有两种观点。一种观点要求“剥离掉学生性别、家庭背景等先赋因素,和教师学历、班级规模、班级条件等短时间无法改变的外部因素对学生成绩的影响”;还有观点认为增值“追求的是改变传统的学科学业评价中仅仅以作业的对错、考试成绩的高低为指标的片面评价方式,增加学科学习行为、学习态度、学习责任感、自主学习能力等多样化的学业素养,包括学科成绩、知识体系、学科能力和学习态度”。而无论哪种观点,都必须同时了解要去掉或是要增加的影响学生学习的某些外部以及内外结合的因素,所以增值评价基线测试(前测)的同时还需要做学习背景分析(实际上这两种观点并不是矛盾的,因为前者指的主要是学校的生源条件和办学条件,这在分析学生的教学增值时确实是应该去除的影响因素;后者指的则主要是学生自身的学习背景,属于学生的个人学习状况的因素,其对学生的影响属于学校教师和学生的教学努力的一部分,应该是与学习增值有关系的因素)。这一分析通常是以问卷调查的形式进行,因此,在基线测试之后,就能得到这样一些数据分析:基线测试结果分析、学习背景问卷分析、学业成绩相关因素分析。学习背景因素当然应该是对学生的学习有影响的因素,这种影响指的就是这些学习背景因素与学生的学习成就(测试成绩)有相关关系。因此在进行基线测试(起点测试、前测)的时候作学习背景因素调查,除了进行学业成绩相关因素自身的分析外,还可以进一步对学习背景因素与学业成绩的相关关系进行分析,也就是得出每个学习背景因素对学生学业成绩的解释率,从而可以通过改进学生的某些学习背景因素促进学生学业成绩的改善,进而促进学生的全面发展。为此提供的报告称为“起点成绩的差异报告”,此报告分析了各个学习背景因素对学生成绩的相关性和相对的可解释性,为促进学生的各个学科核心素养的全面发展提供一个着眼点。

四、增值评价的流程

进行增值评价需要进行一次前测,可以是专门的基线测试。基线测试一般分学科进行。专门的基线测试,初中有数学、语文、英语三个学科和认知测试;高中加上科学测试。有的地方为了保证测试题的质量,减少考试的次数,高中的基线测试就利用中考成绩;初中的基线测试利用初一年级的全域(区市县等)统一的期末考试。按照教育部办公厅2021年8月30日发布的《关于加强义务教育学校考试管理的通知》要求,在大幅减压考试次数的同时,“地方学业质量监测要加强统筹,防止重复进行,可在小学高年级段或初中起始年级组织一次,作为评价小学阶段教育质量重要依据,同时作为开展初中阶段教育质量增值性、发展性评价的重要基础”。基线测试的同时进行学习背景问卷调查(不进行专门基线测试的可以只进行学习背景调查),由此得出学生学业成绩的起点分析,呈现给教育行政部门和学校的相关文件就叫作“增值评价的起点报告”和“起点成绩差异报告”;经过一段时间的教学之后(这个时间段由教育行政部门或者学校按照自己的教学需要选定,但是至少要间隔一个学期)进行后测,就叫作增值测试,测试参加者应该是参加过基线测试的同一批学生。一般的增值测试就利用全域统一的下一个学年的学年测试。为减少全域考试的次数,初中最终的增值测试可以利用中考成绩,高中则可利用高中学业水平测试或高考测试成绩。

例如,某省某市某高中,基线测试采用学生的中考成绩,增值测试采用学生的高考成绩,其中市级、校级相关数据皆为该市市属高中中高考学生成绩匹配成功的数据,增值计算模型为“增长百分等级模型”,评价分析的内容主要包括以下几个方面。

基本情况分析,主要通过不同角度的数据分析方法对本市及各校不同学科的基本情况进行分析。

高考不同分数线等级情况分析,主要是将不同分数线等级的学生人数百分比进行分类分析。

中考与高考不同分数线等级学生追踪分析,详细分析两次考试中不同分数线等级学生的变化情况。

本市各校增值情况分析,主要呈现本市各校的增值结果。

本市各校不同性别学生增值情况分析,呈现不同性别学生增值表现是否有差异。

本市各校不同等级潜力生变化及增值分析,通过不同分数线对本校学生进行分类,分析本校学生两次考试的变化情况及增值情况。

本市及各校细分等级增值情况分析,将本校学生根据成绩高低排列,分为十个等级(总分为二十等级),分析在这十等级(二十等级)下学生的增值情况。

本市各校学生增值情况分析,以学生个体为准,呈现不同增值表现情况下的学生分布情况。

本市各校各科增值情况概览,主要汇总呈现本市各校的增值结果。

呈现给教育行政部门或者学校的增值分析的文件叫作某年某地某类学校“增值分析报告”或者某年某地某类学校“教育发展报告”。

以上整个过程加上一个整体设计方案就是增值评价的过程,其流程如图1所示。从形式上来看,按照图1所示的流程进行的教学评价就叫作增值评价。

图1 增值评价的流程

五、行动研究在增值评价中的运用

运用增值评价的目的是什么?除了评价本身外还需要充分发挥评价的发展功能、激励功能、导向功能促进教学目标的达成,促进学生的发展。利用增值评价的数据对教育教学提出问题、研究问题、确定方案、实施方案,通过测试增值分析数据提出新的问题、研究新问题,确定新方案,实施新方案;再通过测试增值分析数据提出问题……这是一个依据增值评价的数据分析进行行动研究从而解决问题,提高教学质量的策略。

分析一下“提出问题”这一步骤,即运用增值评价的数据提出问题。例如增值评价报告和差异性分析报告发现学校班级学生的学业成就增值的差异,自然引出“为什么会产生这样的差异”的问题。要解决这个问题,一方面是在基线测试成绩中探讨学生原来的学业基础,探讨“怎样对学业基础不同的学生进行恰当的教育教学促使其提升学业成就”的问题;另一方面是在增值分析中深入探讨学校、班级乃至学生的增值情况,引出“具体的增值差异在学生群体中有怎样的表现”的问题。然后利用后者,提出“学生学业成就的增值差异与学习背景因素有怎样的相关性”这一问题,进而具体分析产生增值差异的重要相关因素。对于负增值的学校,为什么会产生负增值?提出进一步的问题:本校出现负增值的原因是什么?可以进一步在增值分析报告中落实到班级甚至学生,考察一下存在什么问题。于是可以提出进一步的问题:学生基础学业成绩对进一步的成绩增值有什么影响?学生的学习影响因素对学生的学习成绩有什么影响?最后,怎样提高学校的教育教学质量,促使学生的学业成绩不断得到提高?对于正增值学校,为什么会产生正增值?怎样保持学生学业成绩的不断提高,保持住正增值的成果?对于零增值的学校也存在总结经验努力前进的问题。

例如,有的学校探讨增值与基础学习成绩的关联,针对“本校产生负增值的原因是什么”及进一步的问题进行了研究。在本校特殊的入学新生的情况下,发现基础学业成绩参差不齐引起教学中出现一致性要求与学生特点不符合的问题,导致一些学生的发展明显低于预期,因而影响了学生学习成绩的提高。因此考虑通过分层次教学来解决,按照学生的中考成绩总分进行分层次教学,通过不同的教学方式使所有的学生都提高。但是经过校内的实践测试,发现效果并不理想,于是进一步深入研究,对学生进行逐个探讨,很快发现,一个学生一个学科较差而另一个学科学得不错的情况很多,于是修改方案,不是按“生”而定层次,而是按学科成绩而定层次。这样做虽然带来了教学管理上的困难,但是显著提高了教学质量。在下一次增值评价测试中,该校的一些学科就达到了平均增值,最后达到了高增值(这种“问题-研究-方案-实践-再研究-新方案-实践……解决问题”的工作就是行动研究)。这样一种分层次教学与前一时期许多学校具体实施的分层次教学思想方法上一致,不过层次划分的基础更加数据化,更加明确,操作性也更强。虽然随着新高考的实施,学校的教学班显著增多,某一个学科分层次教学的安排确有困难,但是有的学校还是对于负增值比较明显的学科,适当采用了分层次教学的方式,收到了很好的效果。

再如,探讨增值与影响学习的因素的关联,学生的学习影响因素对学生学习成绩的影响也构成一个研究课题。有的学校对学生学习的影响因素进行分类:学校可以控制调节的为一类,其他为另一类。例如,学生的自我期望程度是与学业成就有显著关系的学习影响因素,特别对数学学习成绩影响较大。这本来是学生的自我意识,但是有的老师认为这是可以改变的,那就是通过理想教育使学生树立远大的理想,正确的发展价值观,学生就会自觉地提升自我期望程度。学生的作业时间和课外阅读量也是与成绩有显著关系的影响因素,学校对此也可以调整以达到最有利于学生学习的状态。体育、美育和综合实践课程与学生其他学科的学习成绩有显著的相关性,努力按照课程方案开全、开齐、开好将促进学生学习成绩的提高。有的学校在这些学校可调节的因素上做了有利于学生学习的调整,促进了学生学业的提升。但是增值分析发现,提升并不显著,于是学校继续研究其他重要的学习影响因素,发现学生的学习适应情况、学生的学习策略、学习动机、学习效能感和问题解决能力都是与学业成绩有显著关联的影响因素,这些因素的改善也是提高学业成绩的重要路径。但是很快又发现,并不是每个学生在所有的这些方面都有欠缺,每个学生存在的问题都有自己的个性,要想解决问题就要针对不同的学生采取适合的方式。其实前面说的自我期望、课外阅读、体育美育课程的正向影响也都是具有学生个性特点的因素。因此对学生学习影响因素的调控必须考虑到学生的个体因素。这一研究使学校和教师深刻领悟,从学生学习的影响因素来改进学生的学习提高学业质量的一个关键是根据学生的具体情况进行教育教学,于是提出“班主任与科任教师密切协作,考虑所教的每一个学生由起点报告数据所表现出来的学习影响因素,有计划地逐步改善,这是一个长时间坚持才有效果”的方案。经过长期坚持,有的学校有的班级经过老师们的持续努力,教学质量有了极大的改善,学生的学业成绩有了很大的提高。但是也有的班级有的学科成绩提高不明显,还需要进一步研究。这里“问题-研究-方案1-实施-问题-研究-方案2-实施-问题-研究……”也是一个行动研究过程。可见行动研究确实是运用增值评价提高教育教学质量的一个很有效的策略。

猜你喜欢
后测学业成绩因素
腹部胀气的饮食因素
基于回归分析模型的学生学业成绩差异研究
四大因素致牛肉价小幅回落
大学生成就动机与学业成绩关系的分析
高职生成就目标定向、学习策略与学业成绩关系研究
CBI在大学英语口语教学中的应用
巧用“一课三测”优化数学教学
应根据学生的实际情况选择适合学生发展的教养方式
顺学而教,提高记叙文阅读教学有效性
短道速滑运动员非智力因素的培养