姚春艳+++张勇
应用多项指标,综合评价学校教育质量,是本轮教育评价改革要完成的任务之一。然而,如何应用多项指标综合评价学校的教育质量以及如何对评价结果进行解释?笔者在指导实验区教育质量综合评价改革的过程中,找到了一种较为适用的方法。现通过案例加以说明,仅供各实验区参考借鉴。
案例介绍
某县于2015年年底,选取了本县8年级全体学生作为实验群体,开展了一次教育质量综合评价工作。本次教育质量综合评价采用的评价模型为“学业发展水平评价+综合素质评价+发展潜能评价+学业负担评价”。其中学业发展水平评价包含学科知识、技能和能力3个二级指标,综合素质则包括行为习惯、公民素养、人格品质、实践能力、创新意识、情绪行为调控、好奇心求知欲7个二级指标。发展潜能包括认知能力倾向、认知过程以及认知项目3个二级指标,学业负担则包括负担事实、主观感受、身体影响和心理影响4个二级指标,本次综合评价共使用了17个指标。这意味着,参与测试的每所学校都会获得17个分数,如何通过17个分数对各学校的教育质量作出一个科学、客观的判定,无疑直接考验我们教育评价人员的专业能力。
传统做法,我们会将所有的分数进行简单的相加或者是加权相加,根据总分进行排名,并据此对各学校的教育质量进行评价。之所以说传统评价并不科学,原因在于简单相加或者加权相加只适用于分数所代表的属性为基本同质。如果多个分数所代表的属性并不同质,简单相加会使分数的含义模糊不清,导致结果无法解释,而不能解释的分数是无法做出有效价值判断的。教育质量综合评价的多个指标,有的是指向学生认知的,有的是指向学生情感偏好的,有的是指向学生行为的,还有的是指向外部学习环境的,指标性质差异较大,所获得分数的含义也不尽相同,因此,指标分数简单相加的结果根本无法解释。而统计学中聚类分析是将多变量数据进行分类的有效方法之一,用在教育质量综合评价结果处理上是比较恰当的。按照个体或样品的特征将它们分类,使同一类别内的个体具有尽可能高的同质性,而类别之间则应具有尽可能高的异质性。
该县共有14所学校参与了本次综合评价。按照学业发展水平(知识、技能、能力与总成绩的平均得分率)、综合素质评价(二级指标:人格品质、情绪行为调控、创新意识、实践能力、行为习惯、公民素养的平均得分率)、发展潜能评价(认知能力倾向、认知过程、项目的平均得分率)和学业负担评价(负担事实、主观感受、身体影响、心理影响的平均得分率)分别进行聚类分析。14所学校在不同评价内容上,基本都被分成了3类:高分组、中分组和低分组。根据评价内容的性质以及各组的分数特征,对每组加以命名,得到如下量表:
通过上面的分组表,我们可以对该县各个学校的教育质量情况作出以下判断:
第一,该县高学科成绩组中只有3所学校,而低学科成绩组有6所学校,低学科成绩组的学校数量是高学科成绩组学校数量的2倍,意味着该县整体学科水平不高。
第二,14所学校中,12所学校都属于综合素质低分组,表明该县绝大多数学校对综合素质的重视程度不够。
第三,发展潜能低分组的学校数量达到7所,而高分组只有3所,表明该县生源整体水平欠佳;潜能高分组的学校同时也是学科成绩高分组学校,表明这三所学校是集中了全县优质生源的学校,该县存在明显的择校现象。
第四,学业负担中度超标(高)组有6所学校,表明近一半的学校学生的学业负担是较重的。
如果将每所学校在4类评价内容上的分组情况对比来看,则会发现以下问题:
一是学科成绩位于该县前列的3所学校,位于发展潜能高分组,但同时也是综合素质低分组和学业负担中度超标(高)组,表明这些学校虽然取得了良好的学科成绩,但学科成绩的获得,一方面源于生源好,另一方面也与高学业负担有关,恰恰因为学生的学业负担重,用于发展综合素质的时间少,就导致了综合素质分数偏低,显然,这并非是我们所期待的教育质量。
二是表中“学校13”的学科成绩和发展潜能均位列低分组,但综合素质却是全县唯一的一所位列高分组的学校,学业负担也是全县少有的轻学业负担的学校之一,表明该学校在生源和教学均不占优势的情况下,另辟蹊径,将重点放在了学生综合素质的培养与发展上。
三是表中“学校9”的发展潜能位于中分组,但学科成绩,综合素质均位于低分组,且学校学业负担重,学科成绩与学生潜能不匹配,由此可以推断学校的教学形式与方法可能过于机械、呆板,不利于学生的成长,从而导致他们的潜能发挥受到一定限制。
四是表中“学校7、8”的发展潜能位于低分组,但学科成绩位于中分组,且学业负担相对较轻,学校在教学方面应该有其独到之处,教学成效明显。但是对综合素质部分的关注还是不够,导致学校位于综合素质低分组,学科教育质量值得肯定,但综合素质培养方面还需大力加强。
聚类分析方法的其他优势与限制条件
在多指标的教育质量综合评价中,应用聚类分析方法,不仅可以解决多项指标之间相互比较的问题,还可以解决以往根据分数排名,导致学校之间相互竞争的问题。聚类分析得到的结果相对模糊,将相似度高的学校归为一组,而不强调组内各校之间的分数,每组只需要对照本组的平均水平来发现本校的优势与存在的差距,这样既不会导致分分计较的恶性竞争,也可以避免低水平的学校和高水平的学校相比较,进而出现越比越灰心丧气的情况。
使用聚类分析方法需要一个先决条件,即测试工具的信度要达到一定的标准,这对于测试工具的编制提出了较高要求。换言之,若想聚类分析结果比较理想,可明确指导我们改进工作,则需要从源头上把基础性工作做好。