谢千池 武 艳 雷丽萍 路孝琴 吴 萍 朱 淼 郭 蕊王 岩 付 斌 赵 颖 王松灵
(1.首都医科大学教务处,北京 100069;2.首都医科大学人事处,北京 100069;3.首都医科大学全科医学与继续教育学院,北京 100069;4.首都医科大学,北京 100069;5.首都医科大学口腔健康北京实验室,北京 100069)
评价教学综合能力是一项复杂的工作,怎样设置评价标准、如何开展客观科学的评价、如何运用评价结果等都是应该考虑的问题。目前,高校教师的评价标准设置存在模糊、过时、有限等问题[1]。大部分医学高等院校对于临床教师教育教学业绩的评价较为虚化,教师的教学业绩优劣无从比较,因此只能诉诸于发表的科研论文及承担的科研课题情况进行权衡筛选。而作为高校教师,需兼顾教学与科研、避免重科研而轻教学的办学理念则成为空谈,“唯论文”的评价机制则成为 “公平角逐”的最后手段[2]。
由于评价机制的滞后,“学术漂移”现象的萌发,使得“重科研轻教学”的问题越来越严重。在现行考核机制的引导下,教师职称晋升、评奖评优等,都要看科研项目、论文数量和质量。教师必然会将科研工作视为“必须完成的任务”,而把教学工作只视为“不得不完成”的应付工作[3],部分热爱教学的临床教师得不到应有的客观评价。由于教学业绩在评聘过程中成为“软性指标”,致使教学管理部门对临床教师个人教学业绩信息的掌握也十分松散,每逢评聘职称或评奖评优的时刻就疲于“填表”。
有研究显示:由于临床教师同时具备临床和教师双重职业属性,更易出现职业倦怠,导致教学意识薄弱、教学能力下降,从而影响医学教育质量[4-5]。由于“医”“教”“研”的三重压力,临床教师很容易在情绪耗竭、去人性化、低成就感的多重因素下产生职业倦怠。如果临床教师得不到科学、客观的评价,那么“躺平”将逐渐成为医学教育阵地的主流思想,从而催生的学术不端现象也将在医学科研领域生根发芽。诚如首都医科大学校长饶毅教授所言:为了纠正这一体制机制问题,首都医科大学于 2020年率先对临床教师按照教学型和教学科研型予以分类评聘,其中教学型临床教师不强制发表论文,只要是好的医生,能为大学做教学工作(可以是上课,也可以是其他,如带临床实习),就符合基本资格,当然做的好也是因素[6]。
鉴于上述现状,破除“五唯”带来的评价困境,强化分类评价导向,开展临床教师教育教学业绩评价体系的研究刻不容缓且势在必行[7]。在评价过程中,教学科研型岗位(以科研业绩为主要评价内容)与教学型岗位(以教学业绩为全部评价内容)的“双轨型”设置可以帮助临床教师选择自己擅长的发展路径[8]。然而,作为临床教学型岗位的评价基础——临床教师教育教学业绩评价体系的研究,目前国内外的构建及应用研究还不甚成熟,大部分研究停留在临床教师胜任力评价或教学绩效考核模式研究的阶段,通过量化评价结果指导教师的岗位分类评聘及评奖评优的实践则更为稀少[9]。
2020年10月,中共中央、国务院印发了《深化新时代教育评价改革总体方案》,强调扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,并提出“到2035年,基本形成富有时代特征、彰显中国特色、体现世界水平的教育评价体系”[10]。为了贯彻落实该方案,我校根据临床教师的教学工作内容及特点,制定了以教育教学业绩为全部内容的评价体系,旨在对教师的教学综合能力开展量化的、科学的评价。通过对教学工作全方位量化,可以鼓励教师潜心教学、致力教学研究,从而真正引导教师走出“重科研、轻教学”的误区[11]。
由于本评价体系适用范围为所有直属医院、附属医院及教学医院,故从医学教育管理专家、督导专家、一线骨干教师、教学行政管理人员4个角度对指标体系进行咨询及调研。其中,医学教育管理专家及督导专家划分在专家组(共计23人),开展两轮基于德尔菲法的专家咨询,构建指标体系;一线骨干教师及教学行政管理人员划分在调研组(共计537人),开展指标体系的适用性研究,并形成最终的临床教师教育教学业绩评价体系。
2.1.1 专家组的选择
专家组内的医学教育管理专家为校级或院级的本科教育、研究生教育及成人学历教育主管领导,督导专家则为在教学一线拥有15年以上教学经验、长年参与督导或同行评价的教师。基本情况如表1所示。
表1 专家组基本情况
2.1.2 研究过程
通过对专家组两轮基于德尔菲法进行的咨询,制定一级指标、二级指标(含量化方法)的基本框架。第一轮,专家组通过文献研究及在线访谈的方法,初步设定12个一级指标及43个二级指标(含量化方法)[12],通过函评或线上讨论对指标进行筛选,剔除了3个一级指标及7个二级指标,并初步按照其重要性赋分,结合对其中7名校级医学教育管理专家及督导专家的框架式访谈结果,拟定《首都医科大学教师教学综合能力水平评价考核量表(临床版)》开放式问卷Ⅰ(简称问卷Ⅰ)。第二轮由专家组对问卷Ⅰ进行作答,对在第一轮咨询中确定的9个一级指标、36个二级指标(含量化方法)及各级指标赋分进行合理性和可行性评价,不合理处和不可行处进行标记及修订,反复讨论直至意见统一为止,形成指标体系的基本框架,并制定了《首都医科大学教师教学综合能力水平评价考核量表(临床版)》调查问卷Ⅱ(简称问卷Ⅱ)。
2.1.3 研究结果
问卷I共发出23份回收21份,问卷回收率为91.30%。通过专家组对评价体系的各项内容进行合理性和可行性评价,研究发现:一级指标及各级指标赋分均达成了共识;4个二级指标及4项量化方法未达成共识,通过在线访谈达成了一致的解决方案(表2)。
表2 专家组未达成共识指标解决方案
2.2.1 调研组的选择
调研组中的一线骨干教师要求为在本教研室至少承担5年以上本科教学任务的临床教师,教学行政管理人员则要求为在教育管理岗位至少服务5年以上的教务管理人员。根据我校高等教育质量监测平台数据显示:截至2020年12月,服务于本科教学的临床师资人数为4 360人。根据学科分布、职业类别及教学经验,本轮调研方便抽样537人,占师资总数的12.32%,男女比例较合理,年龄集中在中青年教师群体,职称分布集中在中高级职称,基本构成情况良好(表3)。
表3 调研组基本情况
(2)问卷回收率
专家参与研究的积极程度用问卷回收率表示,问卷回收率≥75%则视为参评专家积极,对本研究关心程度高[13]。
(3)权威程度
调研组的权威程度采用权威系数(Cr)表示,计算公式为Cr=(Cs+Ca)/2(Cs:熟悉程度系数;Ca:判断依据影响程度)。权威程度可接受的范围为≥0.7[14]。
(4)意见的集中程度
采用变异系数表示对某指标意见的集中程度,变异系数的计算公式为,其中CVj表示第j个指标的变异系数,Sj表示第j个指标的标准差,表示第j个指标的均数。变异系数说明对第j指标相对重要性的波动程度,Vj越小,表明波动程度越小,集中程度越高[14]。设定满足均数≥8分且变异系数≤15%条件的指标为“达成共识”;设定均数<6分或变异系数≥35%条件的指标为“未达成共识”。除了这两种情况,其他指标视为“考虑纳入”[13]。
2.2.4研究结果
(1)调研组的权威程度
调研中发现:调研组对评价指标的熟悉程度系数平均为0.80,判断依据影响程度系数平均为0.87,根据计算公式:Cr=(Cs+Ca)/2(Cs:熟悉程度系数;Ca:判断依据影响程度),调研组的权威程度为0.84,说明本组在行业内具有较高的权威性。
(2)平均分及意见的集中程度
调研组对问卷Ⅱ反馈结果显示,一级指标及二级指标重要性、可行性、敏感性的平均分区间、总体平均分、变异系数区间及总体变异系数情况较为复杂,需进行下一步分析(表4)。
表4 评价指标区间值、平均值及总体值
(3)未达成共识指标解决方案
在本轮调研过程中发现,一级指标中对于教学论文的敏感性变异系数较高为51.4%,说明既往“唯论文”式的评价方式已完全不利于教师的职业发展。二级指标中有4项二级指标的变异系数较高,未达成共识。经专家组随机选取专家代表,通过线下讨论、函评及上报教育教学委员
2.2.2 研究过程
由调研组对问卷Ⅱ进行作答,问卷Ⅱ对每个指标内容及相关量化方法从重要性、可行性、敏感性3个维度来测量,判断的依据则从理论分析、工作经验、国内外同行了解及直觉4个方面来审视,对问卷内容的熟悉情况则用熟悉程度来进行评判。最终根据重要性、可行性及敏感性的平均分及意见的集中程度决定所采纳的指标内容、量化方式及所赋分值。鉴于疫情影响及提升工作效率的需要,未达成共识指标的再次讨论工作,经随机选取专家代表,通过线下讨论、函评及上报教育教学委员会的方式使最终方案达到共识。
2.2.3 质量控制及规则
(1)平均分
即每个一级指标或二级指标得分的平均数。会的方式,一致认为在综合能力评价及评聘过程中,一级指标“教学论文”仅作为代表性成果中的一个选项,不再作硬性要求;二级指标未达成共识情况指标,解决方案如表5所示。
表5 二级指标未达成共识指标解决方案
根据反复调研、讨论、修订,最终形成临床教师教育教学业绩评价体系(表6)。
表6 临床教师教育教学业绩评价体系
2020年9月,由我校教务处牵头,搭建了《首都医科大学教师教学综合能力评价绩效考核系统》,并获得了相应的软件著作权。2020年11月-2021年1月,我校首次对各临床医学院、教学医院(共计34家教学单位)的临床教师开展了教师教学综合能力评价工作。通过评价与分析,最终形成了以教育教学业绩为核心的量化数据库。通过集中评价,服务于临床教学过程的教材数据库、课题数据库、教学实践信息内容更加丰富;临床教学系统发表的教学论文及教学专利信息收集量达到了前所未有的全面,临床学时及教学活动的记录情况得到了进一步的规范及梳理。
通过对7 680名临床教师的集中评价,测量出各层次教学职称教学综合能力的平均水平(表7)。
表7 各层次教学职称教学综合能力评均水平
由于临床教师需在保证医疗工作的前提下开展教学及科研工作,如在规定的时间内定期安
排集中评价困难较大,临床教育处相应的二级审核时间也较为短缺。本轮评价的集中填报时间从预定的10 d延长到30 d,仍然不能满足一些在该时间段,医疗工作繁重的临床教师填报需求。因此,学校拟探索开放式填报方式为临床教师解决此类难题,教师们可以在较长的一段时间内(如3个月)随时填报、补充近5年的教学业绩;临床教育处的审核工作也可以化整为零,提高审核精度,并随时指导每位教师及时调整自身教学工作的侧重点与方向。
由于传统的评价方式对教师承担的学时工作量要求不高,导致临床教师对自己承担过的学时不明确,部分教育处对每名临床教师的工作量记录精度较低。而新型的评价方式则对记录精度要求较高,每1个学时都对最终的综合评价结果起到了极其重要的作用。为此,学校将加大敦促,监督临床教育处对调课、AB角授课以及请假制度的规范;同时学校教务处从教务系统硬件及软件角度也进行了相应的研究,申报了实用新型专利《临床教师教学综合能力评价信息采集系统》,相关转化工作正在进行中。
本评价体系的构建对教师教学工作的态度及认识产生了很大的影响,使临床教师更加注重对自身教学综合能力的提升,这就要求在量化过程中的配套审核文件及标准务必精准、严密,但在本轮评价过程中发现此类文件的制定质量仍有提升和完善的空间,如三级审核制度、教学课题层级划分原则、教材的认定标准等。
基于本轮评价过程中产生的问题及获得的经验,下一步我校拟对教学综合能力评价系统的信息化建设、管理模式及焦点矛盾进行更加深入的研究与改进,细化评价内容、优化评价流程、严控审核标准将是下一阶段工作的重点与难点。所谓“倒洗澡水不能把孩子也倒掉”,我们要反对、要破除的不是论文、帽子、职称、学历、奖项本身,而是“五唯”这种绝对化的评价体系[7]。相信在众多临床教师及教学管理人员的共同努力下,我校必将形成富有时代特征、彰显医学特色、体现符合医学教育规律的高水平教育评价体系。
致谢:评价体系研究及应用过程期间,教务处曾向多位专家及教师进行了全方位的咨询,谨对以下专家及教师予以致谢:感谢公共卫生学院孟开教授、高琦副教授对本研究的调查问卷总体设计及研究过程给予的指导与支持;感谢我校督导专家陈安宇教授及基础医学院陈柏安副教授对本文问卷I和问卷II内容调整及质量控制工作做出的贡献;感谢燕京医学院肖焕波副教授、公共卫生学院杨春老师对本文数据处理过程及统计学方法的指导与建议。
利益冲突所有作者均声明不存在利益冲突
作者贡献声明谢千池:实施研究过程,获取、提供与分析数据,撰写论文;武艳:提出研究命题,设计指标体系,撰写论文,总体把关、审订论文;雷丽萍、路孝琴:提出研究命题,设计指标体系;吴萍、朱淼:指导实施研究过程;郭蕊:指导研究方法的撰写;王岩、付斌:获取、提供数据;赵颖:分析数据;王松灵:提出研究命题,设计研究方案,总体把关、审订论文