尹志军 陈雨欣 徐晓明
摘 要: 基于某重点高校经济管理学院学生2018年度两个学期的评教数据,利用SPSS和Excel,统计分析教师、年级、课程方面的因素在评教分数上是否存在显著性差异,以及现有评教维度间的相关关系,从而为广大师生和学校管理者更加客观地使用评教结果提供依据,同时弥补我国评教实证分析的不足。结果表明:教师教龄、授课班人数与评教分数呈现负相关;评教分数在学生年级、课程性质上存在显著性差异;任课教师所属专业与学生专业相同与否,对评教分数无显著性影响;教学理念、教学方法、教学内容和课外指导四个评教维度两两正相关且与总体正相关,当前评教维度有效;学生主观评价中还关注了教师性格和教师素质两个新维度。最后提出了三个完善评教体系的建议:加强学生的参与感和使命感,引导学生正确评教;教师和学校管理者对于评教结果应该仔细分析,加强评教反馈机制的建设;完善评价指标体系,将教师性格和教师素质扩充进评教维度,弥补评教维度在教师个人方面的缺失。
关键词:评教;影响因素;评教维度;差异性检验;回归分析
中图分类号:G642 文献标志码:A 文章编号:1674-7356(2020)-01-0073-06
学生评教(student evaluation of teaching,SET)指的是学校在一定理论的指导下,采用一系列的工具与方法组织学生对任课教师的教学工作进行客观评价、分析,最终形成评教报告的过程[1]。韩映雄认为,如何衡量和评价大学教学质量,既是学术界持续讨论的热点问题,也是教育管理界所面临的难题[2]。钱梦岑认为,学生评教可以为学生提供表达自身需求、参与教学质量保障的机会,也可以为教师改进教学表现提供依据,还可以为高校教学管理部门提供便于操作的教学质量监控手段,因此在高校教学质量保障体系的建设中具有重要意义[3]。
在欧美国家高校,学生评教制度经过数十年的发展,已经成为一项十分规范、完善的教學质量保障制度。由选课学生对教师的教学表现进行评价或打分的学生评教制度,诞生于哈佛大学,是美国大学最为认可的教学质量评价的基本制度之一[4]。学生评教自20世纪80年代中期引入我国高校后,成为教学质量保障的重要环节[5]。随着学生评教的广泛应用,我国关于学生评教的理论研究不断深入,主要表现在学生评教的有效性和可靠性的探讨,学生评教方法和量表的设计,中外高校学生评教差异以及影响评教结果的因素和改进措施等方面[6]。
对学生评教指标体系的研究,国外学者主要强调评价过程的公正性与有效性,比较突出指标内容的标准化和普适性,侧重于对学生学习效果的考查。国内学者多是侧重于理论层面的探讨,研究主要集中在指标的筛选、权重的分配、数据分析的方法等等。而基于实证数据分析的研究相对较少[7]。但学生评教分数在哪些因素上有显著性差异尚无定论,因为没有大规模的样本作为支撑,不可避免导致较片面的结论[8]。本文通过对某重点高校经济管理学院2018年度两个学期的学生评教结果进行定量分析,在评教、学生、教师、专业、班级、课程等若干数据表的基础上,开展教师教龄、授课班人数、学生年级、课程性质、本专业教师与非本专业教师、课堂教学质量优秀与其他教师在评教得分上是否存在显著性差异,评教维度之间及其与评教得分之间是否存在相关关系,是否需要增加新的评教维度等方面的研究,以期为广大师生和学校管理者更加客观地运用评教结果提供依据,同时弥补我国评教实证分析的不足。
一、研究对象及方法
(一)研究对象
本文数据来源于某重点高校经济管理学院学生2018年度两个学期的评教结果。评教问卷共9题,包括3道综合评价题目,4道分类评价题目以及2道主观评价题目。样本数量为14 227,包括125门课程,涉及93位任课教师,6个专业,2 647名学生。
主要研究内容包括教师、班级、课程方面的因素在评教得分上是否存在显著性差异,以及现有评教维度间的相关关系,具体是: 1) 教师方面:教师教龄、本专业教师与非本专业教师; 2) 班级方面:授课班人数、学生年级; 3) 课程方面:课程性质; 4) 评教问题:评教维度间的相互关系、课堂教学质量优秀教师与其他教师在评教维度上的得分; 5) 学生主观评价中的高频词语是否超出现有评价维度。
其中,教龄指的是教师的任教年数,课程性质包括选修课和必修课,评教维度包括教学理念、教学方法、教学内容和课外指导。
(二)研究方法
学生评教信息和学生信息从评教系统中导出,学生评教信息中有学生学号、教师工号、教师姓名、学期、课程名称、课程学院、教学班名和评教总分、各评教维度得分等信息,学生信息包括学号、专业、班级信息。人工搜集了其他数据,教师所属专业来源于该校经济管理学院官网,课程性质来源于各个专业的培养计划,课堂教学质量优秀的教师名单来自校字文件。
在原始数据的基础上,首先提取统计出本文研究所需的数据,具体操作如下: 1) 通过对教师工号中入职年份进行提取,计算出其教龄,因个别老师在入职前有在其他机构教学的经历,对其教龄进行了修正; 2) 根据教学班名统计出授课班人数;3) 依据评教学生所在专业和教师所属专业,区分了本专业教师和非本专业教师; 4) 学生年级为2015级至2018级,依据学号中代表入学时间的数字进行计算; 5) 课程性质依据学生所在专业和各专业培养计划进行区分。
利用SPSS和Excel软件,对相关数据做了以下分析: 1) 对于教师教龄、授课班人数两个数值型变量与评教总分之间的关系,采用回归分析,分别将教师教龄、授课班人数作为自变量,评教总分作为因变量; 2) 对本专业教师和非本专业教师、学生年级、课程性质三个分类型变量进行独立样本t检验,本文均取显著性水平为0.05。①对于教师所属专业,以“1”代表本专业教师, “2”代表非本专业教师,分析评教总分在本专业教师和非本专业教师上的显著性差异;②对于学生年级,以“1”代表大一, “2”代表大二, “3”代表大三,“4”代表大四,分析评教总分在这四个年级上的显著性差异;③对于课程性质,以“1”代表必修课, “2”代表选修课,分析评教总分在必修课和选修课上的显著性差异; 3) 由于四个评教维度均为非正态分布,选择斯皮尔曼相关性检验,检验四个评教指标两两之间的相关性及对评教总分的贡献; 4) 对于学生的主观评价,首先提取了关键词,然后利用Excel的COUNTIF函数对其出现次数进行统计。具体做法见表1。
二、统计结果及分析
(一)教师方面
1. 教师教龄对评教得分的影响分析
教师教龄与评教得分的回归分析结果见表2。
从表2中可以看出,教龄对评分有影响,且教师教龄越长,评分反而越低,但评分受到多方面因素的影响,教龄仅影响其中很小一部分,小于0.1%。
其原因可能是,教师的教龄越长,年龄越大,与学生的年龄相差越大,因而价值观差异可能较大,难以和学生产生共鸣。而教龄短的年轻教师大多处于事业上升期,教学更有激情,因此学生更认同年轻教师的教学理念以及教学方法。
2. 本专业教师与非本专业教师在评教得分上的差异性分析
经过数据筛选,93位任课教师中只有19位教师同时对本专业的学生和外专业的学生进行了授课,其中一位教师所上课程只有3名外专业的同学进行了评教,评教样本量小。因此,在分析本专业教师与非本专业教师在评教得分上的差异时,把对18名教师的评教信息作为研究对象,共计21个授课班。
统计分析结果见表3,可以看出15组数据显示本专业教师与非本专业教师对评教得分无显著性影响,6组数据显示有显著影响,且在这6组数据中,有4组显示本专业学生评分高于非本专业学生,2组数据显示本专业学生评分低于非本专业学生。因此,不认为本专业教师和非本专业教师对评教分数有显著性影响。
(二)班级方面
1. 授课班人数对评教得分的影响分析
授课班人数对评教得分的回归分析结果见表4。
从表4中可以看出,授课班人数对评分有影响,且授课班人数越多,评分越低,但评分受到多方面因素的影响,授课班人数仅影响其中很小一部分,仅为0.1%。
分析其原因可能是,授课班人数较多,会被安排在较大的教室上课,后排同学可能会存在听不清、看不见的现象,而且授课班人数较多,教师在上课时难以照顾到每一位学生,使学生的参与感降低,从而影响评教分数。
2. 学生年级在评教得分上的差异性分析
经过统计,大一年级的样本数为1884,评教分数平均值为92.77,标准差为13.80;大二年级样本数为5671,评教分数平均值为92.67,标准差为13.36;大三年级样本数为5 929,评教分数平均值为90.75,标准差为14.71;大四年级样本数为743,评教分数平均值为90.96,标准差为11.59;总样本数为14 227,评教分数平均值为91.79,标准差为13.95。
各个年级在评教得分上的差异性分析结果如表5所示。
由于总体评教差異的显著性为0.000<0.05,表示均值差异显著。
其中,大一年级与大二年级差异的显著性为1.000>0.05,说明其差异不显著。
大一年级与大三年级差异的显著性为0.000<0.05,大一年级与大四年级差异的显著性为0.004<0.05,说明其差异显著。平均值差值为正,说明大一年级评分高于大三年级、大四年级评分。
大二年级与大三年级差异的显著性为0.000<0.05,大二年级与大四年级差异的显著性为0.001<0.05,说明其差异显著。平均值差值为正,说明大二年级评分高于大三年级、大四年级评分。
大三年级与大四年级差异的显著性为0.998>0.05,说明其差异不显著。
通过上述分析得出,一般看来,学生年级对评教结果有显著性影响,年级低的同学评教分数相对较高,大一、大二差异性不显著,大三、大四差异性不显著,但大一、大二的评分高于大三、大四的评分。
另外得出,2015级在大四时评分高于其在大三时评分,2016级在大三评分低于其在大二时评分,2017级在大二时评分高于其在大一时评分,具体结果如表6所示,显示同一批学生在不同年级的评分结果存在显著差异。
分析其原因可能是: 1) 一方面是随着阅历、学识等的增加,学生的评教标准会提高,评教更严格。 2) 另一方面可能是大一、大二的课多为基础课,课程难度较低,而大三、大四时多为专业课,课程难度较高所致。
(三)专业选修课和必修课在评教得分上的差异分析
专业选修课和必修课在评分上的差异分析结果见表7。
由于方差相等的显著性水平为0.000<0.05,选择假定不等方差检验,其显著性水平为0.000<0.05,说明从总体上看,必修课评教得分与选修课评教得分存在显著性差异。必修课评分平均值为92.10,选修课评分平均值为90.49,因此,必修课评教得分高于选修课的评教得分。
但是,通过对经济管理学院6个专业(工程管理、工业工程、经济学、金融学、会计学、工商管理)的分析发现,3个专业的选修课评教得分和必修课评教得分不存在显著差异,3个专业两类课程评教得分有显著差异。工程管理专业和金融学专业的学生对必修课的评分高于对选修课的评分,会计学专业学生对必修课的评分低于选修课的评分,见表8。
分析其原因可能是: 1) 必修课与选修课因素对学生评教影响显著,有可能是因为现阶段的课程性质与学生的利益相关程度不同,目前该校经济管理学院在研究生推免以及奖学金评选时,仅以必修课成绩为依据,不考虑选修课成绩。2) 课程性质在评教分数上的差异性有可能受专业影响。
(四)评教问题分析
1. 评教维度间的关系
1)对四个评教维度进行正态验证后,发现四个指标均为非正态分布,所以选择斯皮尔曼相关性检验作进一步分析,得到教学理念、教学方法、教学内容、课外指导两两之间相关性显著,且相关系数为正,均为正相关。具体分析结果见表9。
2)将教学理念、教学方法、教学内容、课外指导与对老师的总体评价进行回归分析,可以看到其VIF值均<10,所以,可以得出教学理念,教学方法,教学内容,课外指导都对总体评价有影响,且根据标准化系数,与总体评价均为正相关,其影响的贡献度排序:教学理念>教学内容>教学方法>课外指导,这与评价问卷中的分值排序是不一致的。具体分析结果见表10。
2. 课堂教学质量优秀的教师与其他教师的对比分析
课堂教学质量优秀的教师与其他教师的对比分析见表11。
从表11中可以看出,由于方差等同性检验的显著性水平均小于0.05,选择假定不等方差检验,其显著性水平均小于0.05,说明课堂教学质量优秀的教师与其他教师在教学理念、教学方法、教学内容、课外指导的评分上有显著差异。课堂教学质量优秀的教师在四个维度上的得分均高于其他教师,进一步验证了四个指标对评教的意义。
(五)学生主观评价分析
学生的主观评价包括两道题目: 1) 你认为该教师需要改进的地方有哪些?2) 你认为该教师优秀的地方有哪些?通过对学生主观评价关键字的统计,选取出现次数大于25次的词语作为关键字,共筛选出27个关键字,将这27个关键字进行正反归类,如表12所示。
从表12中可以看出,在学生的主观评价中,除了教学理念、教学方法、教学内容、课外指导四个维度之外,还包括教师性格、教师素质两个方面。同时发现,同学在评价老师需要改进的地方时更注重教学方面,在评价老师优秀的地方时更注重老师性格方面。
三、结论与建议
(一)结论
本文研究发现:
1)教师教龄与评教分数负相关,即教师教龄越长评教分数越低;评教分数在教师专业上无显著性差异;
2)授课班人数与评教分数负相关,即授课班人数越多评教分数越低;评教分数在学生年级上存在显著性差异,年级低的同学评教分数相对较高;
3)评教分数在课程性质上存在显著性影响,即必修课的评教分数高于选修课的评教分数,且选修课和必修课对评教分数的影响程度因专业而异;
4)四个评教维度两两之间均存在正相关关系,且四个维度与总体评价均为正相关,其影響的贡献度排序:教学理念>教学内容>教学方法>课外指导。课堂教学质量优秀的教师四个指标分数均高于其他教师,验证了评教四个维度的有效性;
5)学生的主观评价较多地关注了教师性格和教师素质,应考虑将其补充到现有的教学评标维度。
(二)建议
1. 引导学生正确评教
不同年级的学生对评教打分的差异揭示了学生在评教过程中会受主观认知的影响,有些学生受利益驱动,认为选修课不重要,对必修课的评分较高。因此,要做好学生评教宣传工作,使同学们了解评教的重要性,加强学生的参与感和使命感,引导学生正确评教。
2. 加强评教反馈机制的建设
评教结果的有效反馈才能更有效地帮助教师和学校找到需要改进的方面,教师和学校管理者对于评教结果应该仔细分析,找出不足之处,例如,督促年长的教师积极改进教学方法,使其更符合时代的需求;减少授课班上课的人数,为学生提供更好的学习环境等,以最大化“以评促教”的效果。
3. 完善评价指标体系
完善评教维度、设置合理的指标权重可以提升学生评教结果的有效性,将教师性格和教师素质扩充进评教维度,弥补评教维度在教师个人方面的缺失。
[参考文献]
[1] 徐丹,熊艳青. 多元·科学·规范:美国高校学生评教制度管窥[J]. 大学教育科学,2016,7(3): 102-107.
[2] 韩映雄,周林芝. 学生评教的信度、效度、影响因素及应用风险[J].复旦教育论坛,2018,16(6):74-81.
[3] 钱梦岑. 学生评教对高校教师教学行为的影响: 基于国内某高校学生评教结果的实证研究[J]. 中国高教研究,2018(10): 81-86.
[4] 江珊. 哈佛大学教学质量保障体系建设探析: 基于学生评教的视角[J]. 高校教育管理,2016,10(2): 86-91.
[5] 江利. 我国高校学生评教研究综述[J]. 黑龙江教育(高教研究与评估版),2017(10): 57-60.
[6] 常亚平,陈亮,阎俊. 高校 “学生评教” 误差形成机制研究: 基于学生态度的视角[J]. 高教探索,2010(1): 80-86.
[7] 李冲,苏永建,马永驰. 高校改进和完善学生评教制度的实践探索[J]. 现代教育管理,2017(12):69-73.
[8] 戴璨,苗璐,朱恒,等. 非教学因素对高校课堂效果的影响及其启示: 基于学生评教数据的实证分析[J]. 高等教育研究,2017,38(5): 72-80.