基于学生成长百分等级简易模型的增值评价及应用
——以深圳市盐田区教学质量检测为例

2022-12-23 12:50
教育测量与评价 2022年6期
关键词:比率增长率全区

申 燕

一、引言

长期以来,教育评价的方式相对固定、标准较为单一,用同样的标准和模式对生源不同、特色迥异的学校实施评价,既无法深入了解各个学校的真实情况,也无法科学引导学校按照自己的特色展开办学。学科教学评价常以单次纸笔测试成绩的高低判断学生学科知识、技能的掌握情况,导致教师无法以动态的、发展的视角认识学生的优势和不足。

为了有效体现评价的公平性和精准性,国内外教学评价研究者积极探索更为合理的评价模式。2009 年,Betebenner[1]借助Quantile 软件提出了学生成长百分等级(student growth percentile)模型(文中简称为“SGP模型”)的计算方法,即对相同学生群体前后两次质量检测的成绩进行比较,计算出某学生在群体中的百分等级,以判别该学生学业的增长情况。SGP 模型是通过回归方程计算学生的百分位数[2],但回归统计在一定程度上限制了该模型的使用。于是,笔者将SGP 模型简化后应用于深圳市盐田区先后两次(间隔数月)的教学质量检测(文中简称“质检”,分为“质检一”和“质检二”)成绩分析,以了解学生个体增值、班级及学校的发展情况。

二、百分等级及其应用

1. 百分等级概念

百分等级是把原始分数分为100 个相等单位或100 等,通过公式计算得出某个原始分数对应的百分数,它表示在参加考试的群体中,低于该原始分数的学生占比。[2]如某学生的百分等级为80,即说明在这个学习群体中,有80%的学生的原始成绩低于或等于该学生的原始成绩,或者是20%的学生的原始成绩高于该学生的原始成绩。在实际计算的过程中,可以将学生在前后两次考试中的表现进行比较,以判断学生从第一次考试到第二次考试的进步情况。未经分组的原始数据可利用公式(1)转换为百分等级。

其中,PR(x)(percentile rank)表示某学生的百分等级,fL为低于该学生原始分数的学生人数,fi为等于该学生成绩的学生人数,N为该学生群体的总人数。

2. 百分等级的应用

本文以深圳市盐田区初三化学学科两次质检为例,运用学生成长百分等级简易模型进行增值评价。此次初三化学学科质检一和质检二的满分均为40 分。本研究选取其中参加了两次质检且分数均不为0 分的学生(共1409 人)进行分析,分别计算每名学生在两次质检中的百分等级,具体计算方法见表1。

表1 某生在两次质检中百分等级示例

一般情况下,前后两次考试成绩的分数(S)差(△S)虽然在一定程度上能够反映学生学习的进步情况,但分数差往往会受到试题难度的影响,导致该评价方法存在一定的不合理性。为去除试题难度差异或学科差异造成的干扰,尝试采用百分等级差(△PR)代替原始分数差进行评价分析。如原始成绩差值相同的3 名学生(见表2),其质检二的成绩较质检一的成绩均增加了4.5 分,但从百分等级差值来看,林同学在质检二中是进步的,朱同学基本保持不变,而陈同学却略有退步。

表2 原始成绩差值相同学生的相关情况

百分等级计算方法虽能大体上显示学生的进步程度,但也存在着不足。如百分等级差值相同的两名学生(见表3),李同学的成绩从质检一的32.5 分增至质检二的39 分,其等级排位从82.31增至99.22;而叶同学从8 分增至16 分,其等级排位从8.07 增至24.98。百分等级差均为16.91,表明两名学生的进步程度相当,但处于不同发展水平的学生如若取得程度相当的进步,他们所付出的努力程度及本身所具备的潜在竞争实力明显是存在很大差异的,这可能对更加优秀的学生予以不公平的增值评价。[3]因此,百分等级计算方法虽能表征学生增长程度相对大小,但却无法解决不同层次学生的分类评价问题。

表3 百分等级差值相同学生的相关情况

三、学生成长百分等级简易模型的应用及分析

1. 学生成长百分等级简易模型的基本内容

SGP 模型是以之前一次考试为依据,将其中成绩相似的学生群体视为学术伙伴,对不同群体分类后再进行等级分析的评价方法。这一分析方法包含了复杂的回归分析过程,在理解和应用方面都对分析者有较高的要求。因此,在深刻体现SGP 模型分析思路的基础上将其做简化处理[4],以更加简明且直观的方法呈现[5]是非常必要的。简化后的学生成长百分等级主要以既定的学术伙伴为研究对象,通过百分等级计算公式得出该群体中学生的成长百分等级。

在实际分析过程中,将质检一中成绩相同(或相似)的学生划分为一组学术伙伴,再计算同一组学术伙伴的学生在质检二中的百分等级。质检一中,1409 名学生的成绩分布于1.5~40 分,分数间隔为0.5 分,共分出77 组学术伙伴。为了进一步提升分析的合理性,根据成绩的相近程度,将成绩为40 分的学生(仅1 名)与成绩为39.5 分的学生(共2 名)、成绩为39 分的学生(共3 名)视为一组学术伙伴,也将成绩为1.5 分的学生(共3 名)与成绩为2.5 分的学生(共2 名)视为一组学术伙伴。如此合并后,共分出74 组学术伙伴,且每组学术伙伴的学生人数均不小于5 人。

以质检一成绩均为38.5 分的8 名学生(即N=8)为例(见图1),其中林同学和吕同学在质检二中成绩仍为38.5 分,该组学术伙伴在质检二中成绩低于38.5 分的学生为5 人,即fL=5;相同成绩的学生为2 人,即fi=2,代入公式(1),可算出林同学和吕同学的SGP 值均为75.00,以此类推,便可得出该组8 名学生的成长百分等级。(见表4)按照同样的计算方法分别计算出其他73 组学术伙伴的学生的成长百分等级。

表4 质检一成绩为38.5 分的学术伙伴的SGP值

图1 学生成长百分等级简易模型应用示例

2. 简易模型应用的相关分析

2009 年,美国科罗拉多州教育部门以SGP分数35 分和65 分作为标准来划分学生不同的成长水平。低于35 分,视为成长水平低;高于65 分,视为成长水平高;而介于35 分和65 分之间,则视为成长水平正常。[4]本研究依此标准对全区、各校及各班的化学学科成绩增长情况进行统计分析。

(1)全区及各校3 类成长情况

若平均分配表5 中3 类成长(成长水平低、成长水平高及成长水平正常)的情况,其占比率约为33.33%。从全区整体情况来看,成长水平高(比率)和成长水平低(比率)均高于33.33%。说明学生从质检一到质检二之间经历了系统的补救教学,许多学生将已有知识有效关联整合,形成认知方法和实践技能,能够较为综合地应用知识与技能解决实际问题,其知识结构优于补救教学前的状态;但仍有学生在系统的补救教学中并未获得有效的学习方法,教师也未按照学科补救教学要求准确地填补学生知识断层或缺失所形成的认知沟壑,导致该部分学生学习成长增值效果不佳。其中,甲校中成长水平高的学生在全区中的占比最高,而乙校中成长水平低的学生在全区中的占比最高。

表5 各校及全区3 类成长(人数或比率)情况

(2)增长率情况

如何表征全区及4 所学校的整体增长率呢?很明显,仅借助成长水平高(比率)的大小来说明是不合理的,如乙校的成长水平高(比率)略高于丙校,但其成长水平低(比率)也高于丙校,单凭成长水平高(比率)是无法客观地比较学校的整体增长率的。此外,根据成长水平高(比率)和成长水平低(比率)的差值来表征学校的整体进步情况也是不科学的。

如表6 中所假设的两种可能情况,X 组和Y组数据中的成长水平高(比率)均比其成长水平低(比率)高16 个百分点,而X 组中成长水平正常(比率)低于Y 组,但学生的整体进步情况却是X 组优于Y 组。

表6 全区及各校3 类成长(人数或比率)情况

若要进一步科学描述全区、各校及各班的实际增长率情况,就需协调3 类成长水平比率的关系。在成长水平正常(比率)相同的前提下,比较成长水平高(比率)与成长水平低(比率)的差值,即可得出相对增长情况。因此,得出增长率的计算方法:

①全区、各校及各班的增长率情况

将表5 中相关数据代入公式(2),计算各校及全区的增长率,从表7 可以看出全区化学学科整体水平在质检二中略有提升。其中,甲、丁两校表现为进步状态,且甲校的增长率最高,而乙、丙两校则表现为退步状态。

表7 全区及各校增长率情况

按照公式(2)计算各校各班的增长率情况。(见图2)整体看来,各校各班的发展情况不尽相同。其中,甲校除10 班略有退步外,其他班级均表现出不同程度的提升;乙校、丙校及丁校均有一半左右的班级有所提升。从增长幅度来看,乙校6 班和丁校1 班在质检二中进步最为显著,而乙校2 班在质检二中的退步最为明显。

图2 各校各班增长率情况

将所得到的各校各班增长率与其相应的两次质检均分差进行相关度分析,通过SPSS 19.0 软件,采用皮尔逊相关系数对两组数据进行相关程度的分析。(见表8)笔者发现两组数据的相关性在0.01 水平上显著,这说明两组数据在0.01 水平上是可以互相替代的。

表8 各校各班增长率与两次质检均分差的相关性分析

在相关分析的基础上,对各校各班增长率及其相应均分差两组数据进行差异显著性分析,结果发现p=0.000<0.001,两组数据在0.001 水平上存在显著差异。[6]

由上述分析结果可知,各校各班增长率与两次质检的均分差两组数据相关度很高,具有一定的可替代性,但两组数据又是完全不同的。

②各等级增长率情况

将1409 名学生分数按照5%,20%,25%,25%,20%,5%的比例分为6 个等级,依次为A+,A,B+,B,C+及C 等级,其具体取值情况见表9。(由于存在相同分数的学生,个别等级数目略有变化)

表9 学生在质检一中的等级比例划分情况

应用公式(2)计算出全区、各校及各班6 个等级的增长率情况,结合表7 中全区及各校的整体增长率情况,进行各等级增长率情况的分析。

由表10 可知,从质检一到质检二,全区学生在化学学科方面的整体提升主要表现为:A 等级学生通过系统的补救教学,其化学成绩大幅度提升,与此同时,A+等级学生及C 等级学生的进步也较为明显,仅C+等级学生略有退步。这就说明大部分学生在补救教学中能够在原有学习的基础上提炼方法、总结经验,持续性的积累以及知识网络的立体化促使他们不断丰富学科认识视角和认识思路,其解决问题的能力也逐渐从相似情境的近迁移上升为陌生情境的远迁移。而学习相对薄弱的学生则表现为在较短的补救教学时间内未能补全知识漏洞,散乱的、不良的知识结构致使该类学生在应用知识解决问题的过程中出现捉襟见肘的情况。

表10 全区及各校各等级增长率情况

从各校情况(表见10)看,甲校和丁校的整体进步主要表现为:甲校处于前50%的学生具有较为明显的进步,但该校处于后50%的学生并未提升,甚至呈现出退步状态,其中C 等级学生退步相对明显,在实际教学过程中,甲校需对该类学生群体予以关注;丁校则表现为B 等级学生和C+等级学生有进步,而A 等级学生及C 等级学生均存在较为明显的退步,究其原因,该校的教学更倾向于关注成绩相对薄弱的学生群体的提升,导致成绩优良的学生在已有知识层面上停滞不前,未能获得应有的提升,而知识基础较为薄弱的学生又未能在补救教学中衔接和填补知识,出现学习茫然,因此,丁校除了需要进一步加大对化学学科A+等级学生的培养力度(目前空缺),还要关注C 等级学生群体,做好培优辅差的分层教学。乙校和丙校的整体退步主要表现为:丙校的C+等级学生和C 等级学生有所提升,但其位于前50%的学生在学习过程中并未得到较为合理的引导,特别是A+等级学生的退步最为明显,可见,丙校在教学中需适当提升补救教学的深度、广度和综合度;乙校开展的培优辅差教学较为有效,但也需关注C+等级学生的发展。

由图3~图6 可见,各校各班在6 个等级方面的增长率各不相同。针对图2 中变化显著的班级进行分析,发现乙校6 班A 等级、B+等级及B等级学生整体上均有较为明显的提升,而丁校1班的B 等级学生和C+等级学生也有大幅度进步;尽管乙校2 班的C 等级学生有明显进步,但A 等级、B+等级及B 等级学生却出现了退步现象,导致该班级整体增长率下降。总之,班级教学的整体推进需重点关注成长水平正常学生的提升,并兼顾分层次协调发展。

图3 甲校各班各等级增长率情况(自下而上依次对应1~10 班)

图4 乙校各班各等级增长率情况(自下而上依次对应1~12 班)

图5 丙校各班各等级增长率情况(自下而上依次对应1~12 班)

图6 丁校各班各等级增长率情况(自下而上依次对应1~4 班)

四、反思与建议

根据上述各校各班6 个等级学生在两次质检中增值变化分析,发现了不同班级学生发展的差异,也进一步明确了教学的侧重点和应调整的方向。针对各类学生的实际差异,教师需要有不同的应对策略。

1. 关注知识的全面性——帮助C+和C 等级学生建构知识体系

质检一中,C+和C 等级学生较为突出地表现为知识体系的不完备。下文以两次质检中均涉及基础知识考查的选择题第4 题(见图7)为例进行探讨。

图7 质检一和质检二中考查基础知识的选择题及得分率情况截图

关于基础知识的考查,C+和C 等级学生在质检一中的得分率明显低于全区整体水平,而质检二中的得分率虽低于全区整体水平,但与区均分的差异大幅度缩小。这一方面反映出基础知识的拼盘考查涉及不同主题的知识点,很容易直击C+和C 等级学生的知识缺陷而导致失分;另一方面说明C+和C 等级学生实现基础知识的增补是相对容易的。结合平时听课观课中的实际教学现象,本文提出如下教学建议。

(1)针对学生的知识断层进行个性化补充

学生获取知识的多少以及对知识的接收程度受多种因素影响,这可能导致其知识断层是个性化的。针对学生个性化的差异,教师需分类归因并做有针对性的改进。如同样是基于化学方程式的相关计算,学生个性化的差异可能表现为:化学方程式书写错误、化学方程式书写正确但不能有效建立已知量和未知量的关联、计算步骤书写不完整、计算错误、计算过程不规范等。C+和C等级学生解决基于化学方程式的相关计算问题的认知障碍主要为前两者,他们尤其在正确书写化学方程式方面存在较严重的不足,因此,巩固化学方程式书写并引导此类学生建立分析思路是帮助其提升的有效路径。

(2)减少填空式知识梳理以避免机械记忆

在补救教学中,不少教师会以填空的形式引导学生复习主干知识,这种方式虽能在新授课中有效帮助学生找到概念的重点、问题的核心点和知识的关键点,但在补救教学中频繁地使用填空的形式,可能造成学生以机械式背诵代替知识梳理;与此同时,过于强化对留白内容的记忆也可能导致学生概念的混淆或忽视知识的逻辑关联。在补救教学中,教师尤为需要引导C+和C 等级学生自主梳理、内化知识的过程,帮助他们掌握正确的知识梳理方法,减少孤立零散的输入方式带来的知识空缺,做到以点带面产生知识关联,最终建立系统的知识体系。

2. 加强知识的关联性——引导B+和B 等级学生发展综合思维

知识的综合关联不够是制约B+和B 等级学生发展与提升的瓶颈。在两次质检中,关于知识综合关联的考查,如第10 题,B+和B 等级学生的得分率均低于区整体得分率,但A+和A 等级学生的得分率却显著高于区整体得分率。(见图8)

图8 质检一和质检二中考查知识综合关联的选择题得分率情况截图

从质检一到质检二的补救教学中,B+和B 等级学生并未有效提升知识的综合度和关联度。知识的系统性建构需经历初学阶段的逻辑关联构建及补救教学阶段的修缮加固两个过程。

(1)新授课需重视知识呈现的逻辑关联

在日常听课、观课过程中,笔者发现:教师过于关注课程的完整呈现,导致知识的程序化输出现象较为严重,这可能使得知识被生硬地全盘托出,缺乏必要的衔接和引导。如在“制取氧气”的课堂教学中,教师介绍装置后,首先将制取步骤中的关键词提取并呈现出来,然后按照关键词所代表的操作逐步进行实验,学生虽能通过关键词的记忆完整呈现实验操作过程,但往往忽略了这些步骤的先后关联,也就是所谓的“知其然而不知其所以然”。课后访谈显示,关于操作顺序原因的分析,大多数学生表现比较茫然。因此,在新授课中,课时内知识呈现的逻辑顺序显得尤为重要。此外,教师在教学设计时需有大单元和大概念的整体意识,即关注单元内课时之间的逻辑关联。如人教版教材第四单元“自然界的水”,整个单元的结构为“借用自然资源认识水→采用系列操作净化水→利用实验方法分析水→运用化学符号表征水”,每节内容由宏观到微观、由混合物到纯净物、由实际应用到理论分析,逻辑清晰、关联密切。因此,教学需引导学生建构单元学习整体观,多角度认识水、研究水,对水这种物质形成结构化认识。

(2)补救教学需注重主题内容的外在拓展

在补救教学中进行知识的跨单元关联是非常必要的,有利于实现学生在不同知识背景下的灵活切换。例如,第八单元要求学生系统学习金属Fe 的物理性质和化学性质、含铁合金、铁的金属活动性、铁的冶炼、铁制品的锈蚀条件;第二单元要求学生观察Fe 在O2中燃烧的实验现象;第五单元以Fe 与CuSO4溶液的反应探讨了质量守恒定律;第十二单元介绍了人体内微量元素铁的作用等内容。在补救教学中,教师可尝试以常见物质为主题进行知识的跨单元关联,帮助学生系统建构物质组成、性质及其应用之间的逻辑关系,引导学生基于分类的视角总结物质所具有的通性和特性,实现触类旁通,从而提升学生理解的深度和广度。

3. 重视知识的应用性——推动A+和A 等级学生强化思辨能力

A+和A 等级学生具有良好的知识储备并能综合应用所学知识,但其高阶思维容易出现固化和窄化的现象。因此,适切的思辨有利于增强该类学生思维的弹性及韧性。

(1)增强思维的批判性

识别、分析和评价是批判性思维的关键要素。质检一中涉及批判性思维的试题,如以硫燃烧改进实验为情境的题目,A+和A 等级学生得分率不佳。(见图9)

图9 质检一中涉及批判思维的试题及得分率情况截图

关于“实验结束后,需继续向硬质玻璃管中通入O2一段时间,其主要目的是 ”这一设问,不少学生基于已牢固建立的制取O2时先撤导管后撤酒精灯的模型形成了思维定式,他们认为这一操作的主要目的是防倒吸。其实不然,该实验的主要目的为“将反应生成的有毒气体全部排出吸收”。试想,若该气体无毒,便可直接将盛有NaOH 溶液的洗气瓶与硬质玻璃管分离,从而有效防止倒吸。A+和A 等级学生在这道题的得分率低可归因为:该类学生识别具体问题后,未经历思维的审辨就直接在固有思维模式下将判断得出的结论误认为是主要目的。因此,教师需引导学生在分析解决具体问题时,完成“识别具体问题→分析可能原因(或原理)→思辨主要原因(或原理)”等过程,不能单一、机械地依靠或应用已有的固化模型。

(2)提升思维的发展性

思维的发展是由单一到复杂的过程。对于A+和A 等级学生来说,从单变量的唯一因素分析到多变量的多维因素分析,他们思维的爬坡经历了质的提升。如质检中以铁丝燃烧后固体成分探究为情境考查学生极值思想应用的题目,此类学生不良的得分率亦需引起关注。(见图10)

对A+和A 等级学生而言,若题目设问“黑色固体为Fe3O4(单一成分)”,他们能相对轻松地计算出上述过程中减少的质量;若题目设问“黑色固体为Fe 和Fe3O4(两种成分)”,他们基本上也能得出最大减少质量的答案。但若将该设问方式镶嵌于情境之中,形成类似于图10 中第11 题第(5)③的设问方式,A+和A 等级学生在答题时则往往不知所措。因此,在补救教学中,教师需引导A+和A 等级学生形成将复杂问题剥离拆解为简单问题的逆向发展思维。由单一到复杂的每一步分析过程都将成为学生形成解题思路的脚手架,随着思维的顺势而上,复杂问题便能迎刃而解了。

图10 质检二中应用极值思想的试题及得分率情况截图

猜你喜欢
比率增长率全区
第十届“我是小画家”全区中小学生书画大赛获奖作品选登
一类具有时滞及反馈控制的非自治非线性比率依赖食物链模型
2020年河北省固定资产投资增长率
内蒙古自治区召开全区统战部长会议
全区统战部长会议召开
2019年河北省固定资产投资增长率
比率分析公司财务状况——以步步高及永辉超市为例
国内生产总值及其增长率
南宁市:把握环境保护新常态 担当全区执法排头兵
货币供应量同比增长率