对外汉语教师对学生评教制度的认知态度及心理研究*

2019-11-29 06:05:14于佳林

云南师范大学学报（对外汉语教学与研究版） 2019年6期

王军, 于佳林

(山东大学国际教育学院，山东济南 250100)

一、问题的提出

学生评教(SET,student evaluation of teaching)已经成为各类教学机构保障教学质量的主导性评价机制，在国内外高校特别是本科专业中得到大规模应用，并随之成为教育领域的研究热点。与本科专业教学相比，我国高校面向国外汉语进修生的对外汉语教学及其质量控制有其特有属性，一是教师承担着繁重的语言教学工作量，一人分授不同课程类别的情况非常普遍；二是教师队伍由专职教师、兼职教师和实习教师组成，教学质量的稳定性需要得到切实保障；三是学生来自世界各地，跨文化差异明显，评价文化和评价标准不一；四是课堂教学注重师生互动，均为小班化教学，学生评教时参评样本数受限。鉴于上述差异，多数高校的对外汉语教学评估体系都是独立研制、独立实施的，如笔者所在高校的对外汉语教学评估体系研发于2000年，近20年间经过了多次评价指标、结果发布形式及评价结果使用方式的调整与完善，对保障汉语教学质量起到了至关重要的作用。

早在1986年，韩孝平就在《试论对外汉语教学工作的评估》一文中提出了对外汉语教师的知识与技能体系及教学评估的构成要素(1)韩孝平.试论对外汉语教学工作的评估[J].语言教学与研究,1986,(4).，但30年来针对对外汉语教学评估特别是学生评教的专题研究屈指可数。张宝玲从框架层面提出对外汉语教学质量的多元评估模式(2)张宝玲.谈对外汉语教学质量的多元评估模式[J].首都经济贸易大学学报,2003,(3).；刘德联、李海燕就北京大学(3)刘德联,李海燕.对外汉语教学评估偏差分析及纠偏对策[J].语言教学与研究,2004,(5).、张灵芝就厦门大学(4)张灵芝.对外汉语教学效果评估运行机制的实施与反思[J].海外华文教育,2006,(4).的对外汉语教学评估的设计及运行过程分别进行了反思；邵菁等对比了上海外国语大学及美国、日本共3所高校的教学评估问卷，提出了提高评估有效性的建议(5)邵菁,张忻,李黔萍.如何提高对外汉语教学评估的有效性[J].中国大学教学,2007,(11).。但无论是教育领域的宏观研究还是针对对外汉语教学的专项研究，已有研究成果都集中在学生评教的功能、评教指标的确定、评教影响因素的分析、评教结果的公布及使用，以及针对评估存在的问题提出改进意见等方面，且多以教学管理者、教育理论研究者、学生的视角描述与呈现，对教学评价的利益相关方——高校教师的态度及心理的研究成果相对较少，且教师访谈及感受性的论述多于调查及量化研究。尚未发现从对外汉语教师视角对学生评教带来的教师心理影响和行为改变进行的研究。

随着学生评教逐渐日常化、制度化，评价分数膨胀、师生心理倦怠等问题日益凸显，对教师这一评估主体的关切缺位导致学生评估呈现出“见分不见人”的量化与简化趋势。朱建春(2016)曾对高校219名不同专业教师进行调查，结果显示，高校教师对教学评价的认知较为客观和深刻，但在一定程度上不太认同教学评价结果的客观性和处理方式。(6)朱建春,刘艳,李荣华.高校教师对教学评价的认知与期望[J].高教学刊,2016,(4).

在教师分类管理的趋势下，我国高校的对外汉语教师多被定位于教学型教师，构成了一个特殊的教师群体。那么，对外汉语教师如何看待学生评教的作用？教师对自身教学效能感的判断与评价结果是否相符？教师在教学评价中扮演着积极参与者、被动配合者还是消极抵触者的角色？这些问题的深入探讨将有利于对外汉语教学评价的利益3方跳出管理与技术层面的局限，从教育理念和人文关怀视角入手，重新审视与完善学生评教这一制度的目标及实现途径。

本文将研究聚焦于长期从事一线教学的专职对外汉语教师群体，通过问卷调查及访谈，了解教师面对学生评教时的认知态度与心理表现，并通过与实际教学评价结果的对照分析，来验证学生评教客观结果与教师主观判断之间的相符度，为对外汉语教学评价的科学化、人文化改进提供基于实证结论的启示性建议。

二、研究设计

(一)研究对象

本文研究对象是笔者所在学校从事对外汉语教学的专职教师。编制内教师人数为39名。因个别教师在海外长期任教，未参与学院的汉语教学和学生评教，故参与此次调查并反馈问卷的专职教师数量为34名。

从年龄结构上看，各年龄段教师均有分布，40岁以下的教师占64.71%，反映出对外汉语教师的年轻化趋势；从教龄上看，接近80%的教师有5年及以上的对外汉语教学经历；从参评经历来看，64.71%以上的教师至少参与了10学期的学生评教，对教学评价体系有较多的接触和了解。(见表1)

表1 受访者基本信息(单选题)

(二)研究工具

本文研究工具是自制的对外汉语教师对课堂教学质量评估的认知感受调查问卷。除了受访者基本情况外，问卷整体分为4个部分，分别是受访者对自身教学效能的评价预期与评教结果相符度描述、受访者对影响学生评教有效性的几类因素的判断、受访者面对学生评教的心理表现，以及受访者对学生评教的认知态度及建议。问卷共设计22个问题，包括单选题、多选题、排序题和开放式问题。

为保证问卷的效度，设计前期我们通过文献搜集与分析、跟资深教师访谈的方式，对问题及选项进行征集、分类与整理，保证选项的代表性和广泛性；对影响因素类的多项选择题和重要性排序问题，多角度、多层次列举选项，细化问答级数；为最大程度保证选项的覆盖性，大部分选择题都设置了“其他”选项，并要求提供具体描述。最后一题为开放性问题，鼓励受访教师自由发表意见，34名教师全部填写表达了自己的主观感受和具体观点。

在问卷的信度方面，鉴于样本数量因专职教师队伍规模问题而受限，因此尽力保证全体教师的参与率。研究者通过手机网络终端，面向本校全体对外汉语专职教师发布问卷，最终收集到34份答卷，均为有效答卷，回收率和有效率均为100%。考虑到本研究的目的是希望最大程度细化教师心理描述，故大部分为定类选项，而非量表问题，因此在问卷分析过程中以频数分析为主。对问卷中可以量表化的问题(如教师满意度、成绩稳定度、结果相符度和评教认同度等)，根据李克特量表，按程度由大到小分别赋值，对数据编码后运用Spss软件进行量化分析，描述统计最大值、最小值、平均值、标准差和中位数。

三、统计结果与分析

(一)教师的教学评价预期及对评教结果的判断

1.教师自我效能感与教学评价预期

教师个体对自身的教学能力和教学效果通常有其自我信念、感受与体验，在教育心理研究中称为自我教学效能感。(7)徐彩华,程伟民.对外汉语教师自我教学效能感研究初探[J].汉语学习,2007,(2);徐彩华,程伟民.对外汉语教师自我教学效能感研究初探[J].汉语学习,2007,(2)教师自我效能感的高低决定了教师对学生评教的自我预期。(见表2)

表2 教师的教学评价自我预期(单选题)

调查表明，88.24%的教师对自己教学效果的期望值较高，认为理想中的评估成绩应该在90分以上，其中接近三成的教师定位于95分以上，甚至有1位教师自信地认为自己的评估成绩应该不低于98分。可以看出，受访者的自我教学效能感较高，在教学评价方面具有积极自信的自我认知倾向。

2.教师对评教结果的自我描述与判断

围绕评教结果，问卷提出满意度、稳定度和相符度3个相关问题，调查教师对历次个人评教成绩的自我描述和判断。

为了更精确地描述程度差异，我们根据李克特量表规则，按程度由高到低分别赋值5/4/3/2/1，对数据编码后运用Spss软件进行量化分析和描述统计。(见表3)

表3 教师对评教结果的自我描述及判断(单选题)

结果显示，满意度、稳定度和相符度3项的平均值均接近或达到4，说明受访教师对自己的评估结果比较满意，认为自己的评教成绩很稳定，实际评估成绩与个人预期比较相符。

具体来说，三分之二的受访者表示对自己的评估成绩“多数时候很满意”；认为实际评估分值与自我预期“相符”和“多数时候相符”的受访教师分别占到11.76%和70.59%，认为其可以反映自己的真实教学水平；70.59%的受访者认为自己的评估成绩一直很稳定或者从低到高逐渐稳定，50%的受访者评教分值始终处于高位区间。仅有17.65%的教师自述存在成绩上下波动和下滑现象，成绩一直偏低的情况未出现一例。

(二)教师对评教有效性及影响因素的看法

这里的影响因素以教师视角呈现，一类是影响评教有效性和科学性的指标因素，一类是教师对评估结果不理想的自我归因。

1.影响评教有效性的指标因素

来华留学生汉语教学的主要课程模式具有分技能设课、分层次教学和混合国籍编班的特点。对外汉语课程分为精读(综合)、口语、听力、阅读写作等几种课型，不同国籍学生按照汉语水平编入初、中、高级等不同层次班级。不少教师在前期访谈中多次提到对外汉语教学的特殊性，认为课型、教学阶段、学生国籍等都会影响评教结果的一致性。调查中也有教师表示“当你不遗余力、倾己所有地教课，却最后因一些偶然因素评分受挫时，心情好久不能平复，乃至失去信心。”我们希望通过调查首先了解受访者就这些“偶然因素”做出何种主观判断，再通过与评估结果的对照分析，进一步验证其判断是否与实际情况相符。

(1)教师对评教影响因素的主观判断(见表4)

表4 教师对影响评教有效性因素的主观判断(单选题)

从上表可以看出，受访者在这一问题上的看法较为分散，不同观点各执一词。关于课型因素，50%的教师认为影响显著，且多倾向于听力、阅读写作课的评分偏低；而41.18%的教师认为影响不显著，不必过于强调差别。关于学生汉语水平和教学阶段因素，除6位未下结论的受访者外，认为“有影响”和“没影响”的教师也基本各占一半，而强调“有影响”的教师，在具体说明时“各诉各苦”，认为初级、中级、高级更难得高分的比例分别是3:2:8。关于不同国家学生的评价文化，73.53%的受访者认为不同国家学生的评教标准和习惯确有差异，但接近半数的教师认为这种差异不会对学生评教结果构成质的影响。在具体描述国籍评价文化差异时，受访者意见依然不一致。比较普遍的感觉是“欧美学生比较挑剔，很少打全5分”“通常给到第二档(4分)就觉得是很好的”“中亚学生讨好老师”，但也有人有相反的感受，认为“日本和韩国学生对老师要求更高”。

(2)对评教影响因素的数据验证

以上结果显示，课型、教学阶段、学生国籍等因素是否影响评教结果的有效性，在教师群体的主观认知中存在很大争议。为了验证以上因素对评教结果是否存在实际影响，我们对十个学期的评教成绩进行了专项数据分析。鉴于评教时采用匿名形式，无法获得学生国籍信息，下面主要分析课程类型及教学阶段与评估分数的相关性。

验证一：不同课型的评教结果是否存在显著差异

首先调取研究者所在学校对外汉语教学部2014～2018年10个学期的学生评教成绩，得到每个课型所有任课教师的平均分，然后对比分析四种主要课型的分值稳定性及排序。(见图1)

图1 2014～2018年10个学期四种课型平均评估分值曲线图

由上图可以看出，精读和口语课程的平均得分一直相对较高，听力和读写课程的平均得分整体偏低。在稳定性上，精读课相对最稳定，且几乎每个学期都是得分最高。读写课、听力课不同学期分值波动较大，虽然后4个学期这两门课程的分值明显上升，但从平均成绩来看，与其他两个课型相比仍然处于相对低位。

为进一步验证课型之间分值差异的显著性，我们将10个学期的4种课程类型分别作为一个整体，按一定的规律取样进行方差分析，发现四门课程的评估分值存在极显著差异P=0.000 <0.01(见表5)。尤其是精读课(平均值94.69)与读写课(平均值88.79)相差5.9。总的来看，不同课型的评估分值差异十分显著，这与50%受访教师对课型影响评教分值的主观判断基本一致。

表5 4种课程类型的方差分析

差异源SSdfMSFP-valueF-crit组间923.0713.000307.6909.6310.0002.657组内5559.005174.00031.948总计6482.075177.000

不过我们尚无法判定这种差异是课型本身的特点(如课时相对较少、以语言输入为主)造成的？还是教师不够重视、教学方法陈旧或者学生的课程学习动机不强造成的？后续进行影响课程评估分数差异的多因素分析很有必要。

验证二：不同教学层次的评估分值是否有显著差异？

首先调取研究者所在学校对外汉语教学部2014～2018年10个学期学生评教成绩，得到初级、中级、高级三个教学层次的所有任课教师的平均分，然后对比分析不同教学层次的分值稳定性及排序。(见图2)

图2 2014～2018年10个学期3种教学层次的平均评估分值曲线图

通过曲线图可以看出，不同教学层次的评估分值在不同学期之间波动性非常大，无法得出教学层次与评估分值必然相关的结论。

为进一步验证教学层次之间分值差异的显著性，我们将10个学期的初级班、中级班、高级班评估分值分别作为一个整体，按一定的规律取样进行方差分析，发现3个教学层次的评估分值存在差异0.01

表6 初级班、中级班、高级班评估分值方差分析

差异源SSdfMSFP-valueF-crit组间216.1162.000108.0584.1570.0193.093组内2443.45494.00025.994总计2659.57196.000

可见，实际数据分析结果不足以证明教学层次与评教分值之间必然具有相关性。调查中超过40%的教师对不同教学层次明显影响评教分值的判断，可能更多基于主观感受和角色体验。

2.教师个人评教成绩不理想的自我归因

前面提到，教师对自己的评教成绩总体上来说认可度较高，不过大部分教师承认自己有过不理想的评估成绩。为了更加清晰地分析教师在教学反思与归因时的主观倾向性，我们将评教成绩不理想的原因分为外部原因、学生原因、教师原因、特殊原因和原因不明五类。(见表7)

表7 评教成绩不理想的教师自我归因类型分布(多选题)

由表7可以看出，只有19.74%的教师认为成绩不理想是由自身原因造成的，而认为由外部原因和学生原因造成评教结果不佳的却占到了64.52%。“新课”或“新手”是成绩不理想的主要原因，这与对外汉语教学的特点有关：第一，对外汉语师资相对年轻，教学经验不足问题确实存在，第二，语言类课程与专业课不同，不管熟手还是新手教师，课程流动性都较大，同一个教师往往在不同学期根据师资需求被分配到不同层次、不同类型的课程中，教材及教学内容需要重新准备，教学方法需要随时调整，备课工作量大，因此的确存在一个磨合与熟悉的过程。但我们也注意到，有超过三分之一的教师将评教成绩低的原因归结为“个别拧巴学生打分过低”，可见，不少教师认为评教成绩带有偶然成分，遇到“难缠、挑剔、难以沟通、带有敌意”的学生时，教师有一种无力感和无奈感，加上班级体量小，所以感觉一个“问题学生”的低分可能会影响整体成绩。更有10.53%的教师感觉不理想的评教结果莫名其妙、无法归因。总体来说，多数教师并不认为自己的教学态度和教学投入有问题，遇到不理想的评教成绩时，更倾向于从自身之外寻找原因。

(三)教师面对学生评教的心理表现

教师作为教学活动的主导者，一方面其强烈的个人自尊和被认同的需求会体现在面对评教时的个人心态中；另一方面，教师的自我认知离不开同侪参照、互动与激励，教师在面对学生评教结果时，如何看待个人在群体中的排位，如何看待其他同事的评估成绩，也体现出不同的对比心态。

1.教师对学生评教结果持有的个人心态(见表8)

表8 教师对学生评教结果持有的个人心态

79.41%的受访教师表示自己是在意评估结果的，但是除1人焦虑感较重外，都能持平常心看待，20.59%的教师自称“谈不上多在乎”评教结果，但没有人完全不在乎。

对27名表示在意评估结果的教师做进一步的原因调查(多选题)，排序前两位的理由分别是“教学投入后希望看到回报”(88.89%)和“希望得到真实直接的教学反馈”(70.37%)，可见，教师作为教学活动的主体，有强烈的被认可的心理需要，希望获得成就感，也重视教学评价的反馈作用。影响教师心态的另外一个因素是利益相关，40.74%受访者因为“评教成绩与年终奖励挂钩”而在意评估结果。

对7名表示不太在意评估结果的教师做进一步的原因调查(多选题)，所有教师都表示“不想被一个评分绑架”，明显反映出对学生评教的“排斥心理”或“不信任心理”，比如，有的教师认为“评估本身存在很多问题”，不能作为唯一的评价依据，呼应了他们前面提出的各种影响因素存在干扰作用的观点。还有教师表达了“科研评价至上，教学再好没用”的不满心理，有教师写道“因为学校评价体系中教学质量占比很轻，导致教师在辛苦付出对得起学生的同时却无法说服自己平静对待学校评价，教学付出挤占了科研时间和精力，我们对得起学生，可谁对得起我们？”可以看出，教学评价在关涉教师职称、岗级等重要评价指标时权重不够、反拨作用不强，一定程度上影响到教师对评教的认同心理与重视程度。

2.教师在群体中持有的对比心态(见表9)

表9 教师在群体中持有的对比心态(单选题)

有的新手老师在第一次教学评估中就得到98分以上甚至100分的高分，比很多资深指导教师的成绩还要突出。面对这一现象，只有20.59%的教师认为教学能力不分资历，有些年轻老师教学水平确实很高；而35.29%的教师认为新手教师更具有年龄优势，可以跟学生打成一片，“热情与青春可以加分”。还有32.35%的教师认为这恰恰说明 “学生看不出多少教学门道”。可见，超过2/3的教师在评价新手同事评教成绩突出这一事实时，透出“学生评教结果未必等同于教学水平”的心理。

关于同事对比，“希望知道其他同事成绩”和“不想知道其他同事成绩”的教师比例差别不大，正如一位受访者所说，“大家的心理很微妙”。但是超过一半的教师希望知道评估优秀的同事是哪些人？我们可以理解为教师希望找到教学榜样作为学习与努力的目标，实现评教的正向激励作用。

研究问卷同时调查了评教结果发布时教师希望获知的参照性数据。(见图3)

图3 教师希望获知的评教参照数据(多选题)

由图3可以看出，被评估教师最看重的是同质性参照成绩，如同一课型(88.24%)和同一教学层级(67.65%)内的比较被认为更有实质性意义、可比性更高。教师从心理上更接受“全体教师平均成绩” (70.59%)而非位次排名(44.12%)作为定位自己的教学水准的参照标准；另外，希望知道“教师中最高成绩”的受访者是希望知道“教师中最低成绩”的受访者的两倍，这表明教师在将同事评教成绩作为参照时，秉持的是自我定位、寻找差距、向优秀者看齐的积极心理，而非你上我下、孰优孰劣的竞争心理。

(四)教师对学生评教机制的认知态度及建议

1.教师对学生评教的认知态度

我们从受访教师对学生评教必要性的认同度入手提出问题，按不同选项分别赋值并对答卷进行数据编码，统计结果见表10。

表10 教师对学生评教必要性的认同度(单选题)

统计结果显示，受访教师对学生评教这一形式的认同度较高，最小值为3，平均值达4.088，绝大多数教师都有条件地认可学生评教的必要性，但同时强调“单一评价很难完全合理，需多元评价进行补充”。

下面的排序题旨在了解教师对学生评教主要功能的看法。(见图4)

图4 教师对学生评教正面功能的认知判断(排序题)

在被评价者——教师看来，学生评教的主要功能和作用是为教师自我督促自我提升以及关注学生诉求而服务，对学生评教的奖惩功能和外部管理功能认可度不高，一定程度上反映出教师群体抵触因教学评价的奖罚工具化而带来的被动感觉。

研究还调查了受访教师对学生评教可能产生的负面作用的看法。(见表11)

表11 教师对学生评教负面作用的看法(多选题)

结果显示，教师对学生评教产生的负面作用高度担忧，3个高占比因素均来自其对教师行为的消极影响：极可能会助长教师的迎合心理与讨好行为，从另一角度说，严格要求的教师面临学生报复和排挤的隐忧；学生评教压力使得教师产生“输不起”的心理，不愿或不敢大胆地进行教学创新，“维稳”意识强烈。有教师指出“这也导致有的老师会刻意讨好学生，尤其不敢得罪刺儿头学生。另一方面，也不敢轻易创新，而是固守自己熟悉的课程。”另外，认为学生评教会使教师缺失安全感和尊严感，以及教师被评估简单化地贴上了教学能力标签的受访者各占三分之一。

总的来说，教师对学生评教的主观认知呈现出较为复杂的态度与心理。

2.教师对改进学生评教体系的建议

受访教师按照最能体现尊重教师、体现公平合理的原则，对涉及评教程序、结果反馈和结果使用3个方面的改进措施进行了重要度排序。(见表12)

表12 教师对学生评教体系改进措施的重要度排序(排序题)

由上表可以看出，教师对评教程序的合理化改进诉求最为明显，主要体现在减少不可控干扰因素这一焦点上，如，消除极端分数的影响、取消问题学生参评资格等；“不公开个人评教成绩”也是多数人的共识；在评教结果的使用上，教师们依然对教育管理者为主体的奖惩、帮扶等制度响应不热烈，而是更希望通过拉长考核周期、设立优秀教师免检制度等措施，为教师争取更多的解压空间和更具发展性的成长周期。

在开放性回答中，教师们提出的改进建议也集中在做好学生动员与说明工作、减少干扰性因素，以及采用同行评议、师生面对面座谈等多元评价方式这两个方面，与量化统计结论基本一致。

四、结论与启示

(一)结论

1.对外汉语教师自我评价预期高，对评教结果呈正面评价

受访教师个人教学效能感普遍较高，对评教成绩抱有高位期望值，对历次参评成绩的满意度、稳定度和相符度3项指标的平均值都接近或达到4，认为评教结果基本符合个人真实教学水平。绝大多数教师表现出自信与积极的自我认知倾向，对学生评教有效性的正向认可度也相应较高。

2.对外汉语教师关于课型影响评教有效性的判断得到验证；关于教学层次和国籍影响评教有效性的判断未获支持

受访教师认为课型对评教分值的影响最大，且一致认为听力和读写课程得分更低；我们通过对实际评教成绩进行量化分析，发现听力课与读写课的平均分值的确低于其他课程类型，且呈极显著性差异(P=0.000 <0.01)，证明教师们对课型影响因素的主观判断符合实际情况。

教学层次和学生国籍虽然也被认为会带来分值差异，但是教师们对差异的具体描述分歧较大。我们通过对实际评教成绩进行量化分析，发现不同教学层次之间的评教成绩差异不显著(0.01

3.对外汉语教师对个人评教成绩不理想的归因呈现外部因素>学生因素>教师因素>特殊因素的规律

现实环境中对外汉语教师的教学投入非常大，因此，教师在面对不理想成绩时，大多没有归因于自己的教学态度和状态问题，而是更加关注教学安排、磨合时间、刺头学生等外部因素和学生因素带来的干扰；教师认为教学技能之外的年龄优势、性格优势以及学生评价的非专业性等都会影响评教结果，由此可以看出教师对教学评教影响因素复杂性的再次强调。

4.对外汉语教师重视评教结果，但所持心态较为温和与理性，不热衷同事竞争

绝大多数教师既非常在意学生评教，又能对评教结果持平常心，这与笔者所在学校近20年来学生评教系统的制度化及持续的程序改进有关，也与对外汉语专职教师多有教育学背景，教学技能成熟快、教学水平稳定性较高有关。只有少数教师对学生评教流露出“不被信任”和“漠视”心理，主要原因是单一评价方式以及科研评价至上的政策定位带来了教学型教师的身份困惑和情绪抵触。

因担心微妙的竞争心理造成同事之间的尴尬氛围，受访教师普遍不太认可评教成绩的公开与交流，他们更希望在结果反馈中获取可比性较强的参照性数据，以便准确判定自己在同质群体中的水平定位。教师对平均分数的关注度远远高于对个人排名的关注度，对高水平教师的关注度远远高于对低成绩教师的关注度。

5.对外汉语教师能够辩证看待学生评教的利弊，在评教程序科学化及实施人文化两个方面的建议较为集中

总体来说，对外汉语教师普遍认为学生评教很有必要性，学生评教的积极作用主要体现在使教师获得教学反馈、实现教学反思和自我成长等发展性目标上，对其作为教学管理及奖惩工具的作用认同度不高。教师认为“教学评估对教师来说既是一种激励，又是一种束缚。” 对教学评估带来的负面影响也表示了忧虑，主要体现在讨好型教师与严格型教师的角色选择困境，以及作为学习引领者、监督者、评价者的教师权威性、创新性和自由度受到冲击和限制，权利与尊严的让渡成为一些教师的权宜之举。

教师关于改进学生评教的建议主要集中在提高评估程序的科学性、重视各种变量对评估结果的影响、设置同质化的分类评估标准，以及弱化评教的惩戒功能、加强对教师的业务援助和人文关怀等方面。

(二)启示

1.重新审视学生评教制度的价值选择与逻辑定位

学生评教制度的背后体现的是教育价值观。作为评价主体，学生在“消费主义”的教育价值观下被赋予了表达教育消费者需求与好恶的权利；作为被评价者，教师逐渐被弱化成为不断自我调适以顺应学生需求的“教育服务者”；教育行政人员在“标准化、绩效化、奖惩化”的管理理念下，将学生评教看作一种便于操作、易于解释的教育管理手段与评估考核手段。这样的教育观与价值选择使得教学评价制度 “遵循行政治理逻辑定位而非教学学术治理逻辑定位”，(8)周继良,龚放,秦雍.高校学生评教的制度定位逻辑及其纠偏——基于学生评教制度文本的分析[J].中国高教研究,2017,(11).造成某种程度的定位偏差。

调查结果显示，对外汉语教师对学生评估的认知较为理性，而且评估成绩也基本稳定且理想，但即便如此，大家依然对学生评教怀有“爱恨交织”(受访者语)的心情。究其原因，我们认为并非是评估本身不具公正性，而是教师从评估的逻辑定位中读出了“被管理、被监控、被评头论足、被警告”的潜在话语及意味。本研究的受访教师都是高校中怀有理想与热情的一线对外汉语教师，即使面临科研评价等其他压力，仍然将“当一个受人尊敬的好老师”(受访者语)作为追求目标。这启发我们思考一个核心问题：学生评教究竟应该体现何种教育观？

教育是一个文化传承、思想交流、智慧传递、灵魂相通的过程，是教师与学生的共同修为，而不是消费者与服务者的对立关系。学生评教应成为服务师生双方的良性沟通渠道，成为发现教学问题、对接师生感受、提升教学质量的信息平台，而不应让教师在“好评”“差评”的标签化评价中失去尊严、放弃原则与教学风格。只有当教师不再认为学生评教是管理者的“控制手段”，而将其视为教学提升的反馈手段，三方都将关注点放在具体教学行为的调整改善而非分数和排名上，教师的教学尊严、教学自由和教学热情才得以最大限度地保留和发挥，学生也才可从中真正获益。

2.重视复杂变量对评教效度的影响，制定分学科评价模式

“要客观地测评教学技能的效果和各科课程的影响，几乎是不可能的”。(9)杜志宏.系统论指导下的课堂教学质量评价体系创新[J].现代教育科学,2008,(5).多项研究表明，学生评教的效度会受到各种变量的影响，如，选修课评教得分高于必修课；(10)彭湃,周兰兰.高等教育教学评价研究的进展与热点追踪——对AEHE期刊2011～2015年发文的分析[J].高等教育研究,2016,(8).高年级学生评教分数较为宽松；低于20人的班级评教分数偏高等。(11)戴天娇.教师群体对学生评教之认知分歧及其调适[J].盐城工学院学报(社会科学版),2018,(4).尽管此类结论尚需进行重复性验证，但基本指向一致，即影响评价有效性的因素复杂多样。

教育规律与教学原则往往具有普适性，但不同学科的知识与技能目标及教学特点差异很大，教学评价指标的分学科制定非常必要。从学科角度分析，对外汉语教学的内容具有实用性、跨文化性，教学方法具有实践性和互动性，教学规模多为小班化，教学对象体现多元化，课程体系具有互补性，学生水平具有阶段性，这些鲜明特点都需要在教学评价指标设计中得到个性化体现。

从被评者角度分析，教师教学配合度(一课多师)、繁重度(一师多课、课时量大)与熟练度(一课多年)等与教学评价的相关性问题，都需要大数据基础上的实证性研究来获取支撑，管理者只有基于证据才能做出更为科学的决策。从评价者角度分析，学生并不具备教育学知识和足够的社会阅历，他们做出的评价更多基于课堂体验而非专业判断。诸如“教学目标的制定”“教学内容是否充实”等指标完全不适宜由学生来评价(12)李兴琼,秦福利.基于教师视角提升学生评教实效性的策略研究[J].福建教育学院学报,2017,(1).，而应该由专家同行评议、教学档案袋等多元化评价方式来承担。

3.变硬性标准为柔性操作，彰显教师尊严与人文关怀

与高校其他专业教师相比，对外汉语教学师资大多接受过教育理论指导和教学法专业训练，热爱教学、熟悉课堂、乐于互动，师生融洽，因此绝大多数教师都有自律、自省和自我成长的教学信念与能力，需要在学生评教过程中获得尊重与保护。笔者所在学校在近20年的外国留学生评教制度探索过程中，根据教师反馈不断调整改进，在硬性评价标准不变的情况下，尝试实施过程的柔性和弹性处理方式，如增加学生的期中非量化诊断评教，由任课教师自行发放、回收问卷，自主检阅评教意见，便于随时调整教学；连续四次评估优秀的教师可以获得“免检”资格，自行决定是否继续参评；缺勤严重的学生取消评教资格，保证调查的客观性等等。值得一提的是，获得“免检”资格的教师并未如预期那样从此“弃评”，而是在“免检”一两次之后主动参加了学生评教，因为在得到团队认可之后，及时获得教学效果的反馈反而成为他们的一种主动选择。

4.开发评教结果的诊断性报告与数据服务软件，实现教学学术化

有研究证实，得到差评会导致教师显著改善后期教学表现，而教学方法和教学能力是受访教师认为改进最困难也最需投入精力的两个方面。(13)钱梦岑.学生评教对高校教师教学行为的影响——基于国内某高校学生评教结果的实证研究[J].中国高教研究,2018,(10).有意愿改变不等于有能力改变，教师在教学提升过程中非常需要诊断性指导、范例性引导和专业化支持。

目前教学管理者对评教结果的反馈和运用仍然局限在提供原始信息、原始分数以及警示约谈排名靠后的教师这几个方面，并没有做到充分利用评估数据，进行深度分析和诊断，也没有给出更多建议和专业援助。评估设计者与软件开发者可借鉴支付宝的年终账单以及医院体检报告的服务思路，利用数据优势和技术手段，为教师提供个人诊断性教学反馈报告和教师群体的规律性教学研究报告，使学生评教结果的效用最大化，实现教学学术化。

个人诊断性报告包括对每位教师教学特点的总结、对教学优势和弱项的归纳、每项评价指标的成绩分布，以及个人历年成绩的趋势走向等。教学规律性研究包括利用量化分析手段，总结归纳本校、本专业教师教学模式的基本特点，利用词频统计手段，提炼总结学生主观评价中体现出的优秀教师风格特点和教学技巧，勾勒出优秀教师的胜任力模型，等等。

当研究的出发点是教学质量的提高和对学生需求的响应时，会极大地调动学生参与评估、教师关注评估的热情。对外汉语教师也可以在此基础上，利用课例研究、教师行动研究、教学工作坊等形式，开展实质性、针对性的教学业务交流，进一步拓展和实现学生评教的服务性、助推性功能。