增强“学评教”有效性的一个模型

2012-11-09 05:27熊萧
和田师范专科学校学报 2012年1期
关键词:任课教师班级差异

熊萧

(浙江东方学院经济管理系 浙江温州 325011)

增强“学评教”有效性的一个模型

熊萧

(浙江东方学院经济管理系 浙江温州 325011)

“学评教”是由受教学生对任课教师所进行的业绩评价。由于教育产品的受益具有公共性、效用存在长期性、教学评价具有主观性特点,使得“学评教”信息必须进行恰当的加工才能有效应用。本文以统计学理论为基础,建立“学评教”信息加工模型,以实证方式分析如何增强评教信息的有效性。

学评教;数据加工;评价指标;教育管理;教育产品

“学评教”是根据设定的指标,由学生对任课教师进行的业绩评价。目前,“学评教”已经广泛地运用于学校管理。而且许多高校以“学生为本”为依据,随意扩大“学评教”数据的应用范围,例如他们以“学评教”数据作为教师业绩考核、奖励、惩罚,甚至辞退的依据。

由于教育产品的受益具有公共性、效用存在长期性、教学评价具有主观性,使得“学评教”信息必须进行恰当的加工才能应用。如果不顾教育产品特点,片面强调“学生为本”、滥用“学评教”数据,不仅会挫伤教师的积极性,不利于教育的健康发展,而且可能导致学风糜烂、教风愈下等严重问题。[1][2][3]

正如《国家中长期教育改革和发展规划纲要(2010-2020年)》所指出:“百年大计,教育为本。教育大计,教师为本。”本文以统计学理论为基础,从教育产品角度分析影响“学评教”有效性的因素,建立模型论述增强“学评教”有效性的方法。

一、影响“学评教”有效性的因素分析

“学评教”的有效性不仅取决于评价指标的科学性与评价过程的客观性,而且还受教育产品效用的长期性、受益的公共性、评价的主观性影响。

(一)不能以短期现象来评价教育的长期效果

教育产品是一种准公共产品,教育产品的效用,即教育对受教育者的影响具有长期性。[4]学校教育的内容非常丰富,对受教育者的影响时间很长,甚至是终身的。因此在对施教者进行评价时,我们不能以受教者眼前或短期的效果来评价施教者的水平。同时,如要提高“学评教”的有效性,那么必以长期评价来代替短期评价,以连续评价代替间隔评价,这样才能更真实地反映教师教学业绩。

(二)不能仅凭学生的感受来评价教师

教育产品的“公共性”是指教育质量的提高不仅有利于受教育者,同时也有利于国家与民族。[5]学校及教师应当根据学生的长远利益与国家的整体利益来教育学生,包括严格施教。

同时在评价教学业绩时,学校不能仅仅考虑学生的感受。正如任何一位家长都不会完全根据孩子的好恶来教育自己的孩子一样,学校也不能完全依据学生的观点来评价教师。虽然学生可能因老师的严格而给予老师较低的评价,但学校不能因为教师的低分而惩罚老师。

(三)评价的主观性是影响评教效率的主要因素

与教育产品前述特点相比,教育产品评价的“主观性”对评教的效果影响更大,因为主观性可能导致评价信息不具可比性。学生评教的主观性表现在:

第一,内容不同,评价结果不同。正如《下里》《巴人》与《阳春》《白雪》不能同时被人理解一样,教学内容存在曲高和寡现象。教学内容不同,评价结果差异很大。

第二,评价者不同,评价结果不同。同样的教学内容、同一位老师,由于学生个人的素质,例如认知能力与领悟能力不同,他们对老师的课堂教学所做的评价是不一样的。

第三,评教态度不同,评价结果不同。显然,如果评价者对“学评教”的意义认识不足,或者对评价指标理解不深入,那么他们就不能正确评价他们的老师,甚至起相反的作用。现实中,有的学生甚至认为:“学评教”只是辅导员要求完成的一项任务,他们为完成任务而随意打分,甚至请人代评。[6][7]这样的“学评教”结果不仅失真,而且还会挫伤教师教学积极性。

二、“学评教”数据加工模型

(一)“学评教”数据加工的理论基础

如果老师们所教的是同一个班、同一门课程,那么所有被评价的老师所面对的外部环境是基本一致的,评价数据有可比性。现实中,一个班级、一门课程只有一位老师。也就是说,任何“学评教”数据都会受到教学内容的影响。

只有在不考虑教学内容差异的前提下,如果能够剔除评价者的主观因素,那么评价数据才会具备一定的可比性。在学校范围内,影响学生评教态度的因素主要包括班风与学风。因此如果我们可以剔除班级、专业、年级等差异对评价者造成的影响,那么可以增强评教数据的效率。

(二)“学评教”数据处理模型

1.主要假设

为使模型易于理解,我们假定:

(1)“学评教”所依据的评价指标是科学的,评价过程是客观的;

(2)影响“学评教”效率的主要因素为评价者的主观态度,而影响评价者主观态度的因素主要为专业差异、年级差异与班级差异。不考虑教学内容的影响。

假定某校有m个班、n个年级,h个专业的学生参与评价了 t位教师,学生根据评价指标对 t位教师评价结果的为 aijkl,(i=1,……,m;j=1,……,n;k=1,……,h;l=1,……,t),那么:

2.剔除专业影响

现实中,一些专业,例如会计专业、数学专业等,这些专业学生可能受专业影响,对人、对事都比较严谨,因而对任课教师的评价也比较趋向理性与客观。而另一些专业,例如工商管理、企业管理等,这些专业学生对任课教师的评价可能比较趋向感性与主观。因此,相同的课程、相同的任课教师,不同专业的学生依据同样的评价指标所做出的评价结果是不一样的。这种由于专业的差异而产生的评价结果差异与老师的工作业绩没有关系,应当剔除学生专业差异的影响。剔除方法为:

3.剔除年级影响

一般来说,低年级的学生对“学评教”比较认真,对教师的评价分数更具有参考性。而高年级学生的评分则更具有包容性和人情性,因此在评分时也可能更随意。中间年级学生的评分则可能具有挑剔性,因为与低年级学生相比,他们更关注自己的任课教师的风度与教学水平。总之,不同的年级的学生,面对同样的教师的评价分数存在年级差异。剔除方法如下:

4.剔除班级影响

一般来说,不同班级对相同授课老师所做的评分是不一样的。学风比较好的班级对教师的要求较高,而学风较差的班级,对教师授课的要求较低。对教师要求较高的班级对教师的评分可能较低,而要求较低的班级则评分较高。这种由于班级学风的差异而导致的班级评分差异与教师工作业绩无关,应当剔除班级差异的影响。剔除方法:

三、“学评教”数据加工模型的应用

(一)数据来源

本文“学评教”数据主要取自浙江某大学 2010-2011学年第 1学期的“学评教”统计资料。该校“学生对教师教学工作评价指标”主要由5类12个指标构成。这些指标涵盖了教学态度、教学内容、教学方法与教学效果等教学的各个环节。每位教师的得分为每个班的学生对该位教师每个指标评分的加权平均。

本文选取了该校4个专业(以下简称为 01、02、03、04)、3个年级、31个班级(以下用6位数字进行编号,例如010801指的是01专业2008年级第1个班级)的评价数据,该数据包括了 1500多名学生对 43名教师的原始评分(表 1)。“专业、年级、班级和教师”以下统称为“本部门”,教师姓名已经略去,仅以序号表示。

(二)数据处理

1.剔除专业因素

本部门 4个专业 3个年级的各专业的平均评分存在一定差异。其中,专业平均评分最高的是02专业各个年级的学生,该专业各年级学生给教师的平均评分为 9.6067;专业平均评分最低的是03专业各年级的学生,他们给出的平均评分为9.2767。

以 01专业为例,相对其他专业而言,01专业普遍较低评价任课教师,其中 2008与 2010年级稍高评价任课教师,而2009年级则较低评价任课教师。为剔除不同专业之间的评分差异,可以让各年级的评分根据其专业平均评分差异进行调整,例如让 01专业 2008年级的“学评教”分数减去0.0375,而让01专业2009年级的“学评教”分数加上 0.2425。剔除专业差异后的教师评分与原始评分存在差异(表1)。

2.剔除年级因素

该校本部门各年级平均评分存在如下规律:年级越低,评分越低;年级越高评分越高。其中 2008与 2009年级的平均评分皆为 9.5025,高于 2010年级的平均评分。因此,与 08、09年级相比,2010年级各专业的学生平均较低评价任课教师0.09。

为剔除这种年级差异的影响,我们可以平均差异为基础进行调整。例如,可以让 01专业 2008年级的评价分数减去 0.0867,而让 01专业 2009年级的评价分数加上0.1933。剔除年级差异后的教师评分与原始评分存在较大差异(表1)。

3.剔除班级因素

根据原始评分,可以计算出该校本部门31个班的平均评分为9.49,标准差为0.27。班与班之间的教师平均评分差异较大,高达 1.1887。其中,010905班学生的评分最高,他们给该班任课教师的平均评分为9.8620;031001班学生的评分最低,他们给该班任课教师的平均评分为8.6733。

班级评分差异严重影响了对教师业绩的正确评价。为了剔除班级差异的影响,我们以班级平均评分为基础,让所有教师的评分都在班级平均评分上进行调整。例如,可以让所有任教 010905的教师的评分都减去 0.3750,而让任教031001的老师都加上0.8137。剔除班级差异后的教师评分与原始评分存在较大差异(表1)。

(三)数据汇总及排名变化

经过差异调整的评分及综合评分已经列入“教师评分及差异调整”(表 1)中。本文采用几何法进行综合调整,第l位教师的平均评分为:

四、结论

(一)“学评教”存在很大主观性

“学评教”是评价者基于自身状态的一种感觉,是受教者凭感觉的评价,具有极强的主观性。“学评教”的主观性使评教结果缺乏可比性。只有剔除评价者的主观性,评价数据才具有可比性。

影响评价者主观态度的因素很多,其中,学风与校风是其最为重要的因素。剔除班级因素、年级因素与专业因素,可以减轻“学评教”的主观性,增强可比性。

(二)未经调整的原始“学评教”是不可靠的、学校应当谨慎使用

教育产品效用的长期性、评价的主观性和受益的公共性,使得“学评教”的评价信息不可靠,学校应当谨慎使用“学评教”数据。例如原始评分排在第一名的 2号教师,在班级差异调整后落到了第 9名,而原始评分排名第38名的第40号教师,在班级调整后进入了前15名。

事实上经了解,在该校原始的评分中存在以下问题:第一,参与“学评教”的学生存在很大的差异,影响了评价数据的有效性。例如,有的班级参与评价的学生多,有的很少。极端情形是编号为第10的教师,参加对其评教的学生只有一位。第二,编号为第 36的教师是一位代课教师,学生及学校督导多次反映该教师上课速度偏快、教学方法单一、教学效率欠佳,经常在课堂中余留5至10分钟时间让学生自己看书,但是该教师的平均得分却高达 9.42分,排名靠前。第三,该部门第 33号与第 41号教师为中年教师,他们教学经验非常丰富,但是由于他们对学生比较严格,结果他们的得分仅为9.28与9.33,排名靠后。

(三)在所有调整方法中,按班级差异调整是最有效的方法

根据统计学原理,43位教师的分数应当接近正态分布。然而在表 1中,虽然“原始总分”、“年级调整”、“专业调整”、“综合调整”、“班级调整”的平均值基本相同,但它们的标准差却依次降低,且“班级调整”的标准差最小,说明它们的“有效性”依次提高,“班级调整”的调整是最有效的。也就是说,“班级差异”调整不仅好于其他调整,也好于综合调整。

这一点容易理解,因为年级数、专业数都少于班级数,而且每个专业、每个年级的班级总数还不一样,如 01专业2008年级有7个班级,而03、04专业的2008年级却只有一个班级,这样就降低了年级调整、专业调整的代表性与有效性。与此相比,班级总数为 31,按班级调整具有普遍性与代表性,因而提高了差异调整的有效性。

表1 教师评分及差异调整

[1]孙金文.学生评教的有效性及影响因素研究[J].教育实践与研究,2010(10),P4-6.

[2]贺武华,彭保荣.高校“学评教”制度及教师教学业务发展评议——基于某校H老师的个案经历[J].高教探索,2009(4),P74-79.

[3]闫志明,张光旭,张立新.影响高校学生网上评教的因素研究[J].中国电化教育,2010(10),P45-47.

[4]陈共.财政学[M].中国人民大学出版,2010,P115.

[5]熊萧.基于公共产品特性的教育产出核算[J].统计与决策,2005(10),P32-34.

[6]潘建辉,安世全.高校网络“学评教”中存在的问题及对策[J].重庆邮电大学学报,2010(5),P119-123.

[7]何景春.高校学生评教权的渊源、性质和特征[J].福建论坛(社科教育版),2007(8),P45-48.

本文为 2011年浙江省教育科学规划课题《构建高校和谐校园的教育管理研究》(SCG422)阶段性成果

熊萧(1966-),男,江西赣州人,浙江东方学院经济管理系系主任,副教授,已在核心期刊发表学术论文10余篇,目前主持浙江省教育科学规划课题《构建高校和谐校园的教育管理研究》(SCG422),主研方向:教育管理、财税理论。

2011-10-09

猜你喜欢
任课教师班级差异
相似与差异
班级“四小怪”
如何构建和谐班级
找句子差异
生物为什么会有差异?
班主任与任课教师合作发展的实践与思考
论高职班主任与任课教师的协作与沟通
不称心的新班级
要善于树立任课教师的威信
任课教师在班级管理中发挥的作用