□ 单俊豪 闫寒冰
STEM教师是从事STEM跨学科整合教学的专业教师群体(中国教育科学研究院,2018)。STEM教师教学胜任力是保障STEM教育质量的核心要素。评价是诊断与提升STEM教师教学胜任力的关键途径。真正发挥评价支持专业成长的价值,需要专业、精准的标准支持,更需要伴随性、发展性的体系支持,然而我国目前并没有系统、成熟的STEM教师教学胜任力评价体系。教师表现性评价是提升教师专业能力的重要策略,是一种基于真实教学情境、运用评分量规对教师教学行为的过程表现或结果做出判断与反馈的评价形式,是一种可靠、有效的基于证据的教师能力提升项目(周文叶,2014,p.53;周文叶,等,2018;Bastian,Henry,Pan,&Lys,2016)。采用表现性评价更能够客观映射教师教学胜任力,准确把脉教师教学过程中的问题点。2018年发布的《关于全面深化新时代教师队伍建设改革的意见》中提到要建立符合中小学教师岗位特点的考核评价指标体系(国务院,2018)。这一改革意见对于蓬勃发展的STEM学科尤为重要,STEM教师专业化发展呼唤一套系统性STEM教师表现性评价体系的诞生。
能力本位的评价模式是新时代教师评价的重要价值取向。教学胜任力是教师胜任力的重要分支,也是衡量教师专业素质水平的核心指标(何齐宗,等,2018)。教学胜任力可以衡量STEM教师的真实教学表现,是STEM教师专业能力的核心。
对于教学胜任力,国内学者持有两种看法。从广义上说,何齐宗等(2018)认为教学胜任力是教师所具备的有效地完成教学目标所需要的能力特征群,其内容包括知识、能力、价值观、动机、个人特质等。从狭义上说,张祥兰等(2009)认为教学胜任力是教师应具备并在教学情境中体现出的能够有效影响教学设计、教学实施、教学效果的心理和行为特征。两位学者对教学胜任力的界定范围有所不同,前者更全面,涵盖了围绕教师教学所需要的所有知识技能、人格素养和心因要素;后者则更为具象,将视野聚焦到教师在教学全过程中的表现。由于教师教学胜任力都会在教学过程中以可以观测的行为特征或教学成果呈现出来,因此本研究更倾向于张祥兰对教师教学胜任力的狭义定义。本研究认为,STEM教师教学胜任力指在教学过程中STEM教师有效完成教学目标所需要的行为特征群。
1.学理梳理
Danielson在1996年提出了“Framework for Teaching”,该框架指出教师的职责和能力包括计划与准备、课堂环境、课堂教学和专业职责,其中专业职责明确强调教师对教学的反思与改进处于核心地位(Danielson,1996,pp.1-35)。在STEM教育情境中,赵慧臣等(2021)指出中学STEM教师教学能力应包括策划教学活动、开展教学活动和研究教学发展三个维度,这三个维度分别对应STEM教师课前教学设计、课中教学实施和课后教学反思与改革。中国教育科学研究院于2018年发布了《STEM教师能力等级标准(试行)》(以下简称“《标准》”),该能力标准将STEM教师能力分为STEM教育价值理解、学科基础、跨学科理解与实践、STEM课程开发与整合、STEM教学实施与评价五个一级维度,这五个一级维度在STEM教师教学过程中可以分别映射到教学设计、教学实施和教学反思与改革三个维度上。综上所述,本研究认为STEM教师教学胜任力包括教学设计、教学实施和教学反思与改革三个一级维度。
为进一步提炼STEM教师教学胜任力的二级维度,首先需要关注STEM教师与传统学科教师在教学上的差异性。STEM教育的跨学科特性要求STEM教师通过项目将零散的知识转变为探索现实世界的、相互联系的、新的学习体验过程,在学生培养目标层面也更加综合性、前沿化(董艳,等,2020;胡艺龄,等,2021)。因此,在教学设计层面,STEM教师在STEM教学知识选取与整合、教学模式选取、教学活动设计和教学评价设计等方面均有内涵延伸;在教学实施层面,STEM教师的教学内容讲授、教学活动安排、教学环境创设等能力维度也需要在内容跨学科、活动多元性和环境开放性等方面予以关注;在教学反思与改革层面,STEM教育中学生学习表现数据类型和呈现形式更加丰富,STEM教师对学生学习表现数据进行采集与分析成为STEM教师开展教学反思的重要前提,也是支持STEM教师进行教学改革的重要基础,需要重点关注。
综合以上论述,本研究基于国际STEM教师能力标准,同时在充分研究与理解标准的基础上设计完成STEM教师教学胜任力模型初稿。
2.基于两轮德尔菲法的胜任力模型论证
本研究采用两轮德尔菲法对胜任力模型进行修订与论证。在咨询专家构成方面:参与两轮德尔菲法的专家共有19位,包括10位在高校长期从事STEM教育与教师专业发展研究的教授和副教授,3位信息科技学科特级教研员,以及6位拥有5年及以上教学经验的一线资深STEM教师。
第一次德尔菲法共有18位专家参与。研究结果显示:专家在一级维度的认同度(M>4.70)和意见集中度(四分位数差<1.80)均较高。在二级维度,专家对“教学模式选取”“教学资源获取与利用”“教育技术运用”“课堂管理实施”这四个子能力表达出共性意见,其得分平均分均小于4.50分。第一类意见为优化子能力命名方式,如5位专家认为STEM教育中教学模式包括但不仅限于项目式教学模式,因此建议将“项目式教学模式选取”更改为“跨学科教学模式选取”;第二类意见为能力点描述的适切性与重复性问题,如2位专家指出“课堂管理实施”这一能力点的部分描述与教学环境创设这一能力点中的描述存在重复现象。
本研究基于第一轮德尔菲法各位专家的意见,对胜任力模型进行修订,然后进行第二轮德尔菲法专家论证。第二轮德尔菲法共有19位专家参与。研究结果显示,各一级维度和二级维度专家认同度(M>4.50)和意见集中度(四分位数差<1.80)均达到较好水平。各位专家在此轮修订中着重修订了能力点描述,如在教学评价设计中应增加对教师设计与运用评价量规这一子能力的关注。
基于文献梳理和德尔菲法的研究结果,提出STEM教师教学胜任力模型,如表1所示。
表1 STEM教师教学胜任力模型
要让表现性评价真正成为测评STEM教师教学胜任力的工具,需要系统地设计STEM教师教学胜任力表现性评价模型。任何理论模型要想成功付诸实践,都需要经历系统、全面的模型设计阶段、模型实施阶段和模型论证与优化阶段(详见图1)。
图1 STEM教师教学胜任力表现性评价模型设计过程
STEM教师教学胜任力表现性评价模型设计包括表现性评价基本要素设计、表现性评价执行机制设计和表现性评价管理机制设计。基本要素设计旨在为表现性评价模型奠定前期基础;执行机制设计旨在提升评价模型的运行效率,以达到预期成效;管理机制设计旨在帮助评价过程中各利益相关者有效利用评价信息推动后续STEM教师能力提升工作。
1.表现性评价模型的基本要素设计
表现性评价模型的基本要素包括确定评价目标、设计表现性任务和制定评价量规(Kind,1999;周文叶,2014,pp.82-85)。
首先是确定评价目标。在STEM教师评价领域,评价目标是指评价者期待STEM教师通过课堂实践呈现出的教学表现。STEM教师评价目标首先指明STEM教师评价的核心工作,也是后续制定表现性任务和评价量规的准则。为了让评价者和STEM教师更清晰地理解评价目标,评价目标的制定需要基于STEM教师教学胜任力模型,在明确评价能力领域以及每个能力领域核心概念与要点的基础上,制定目标要素描述。
其次是设计表现性任务。表现性任务是为了检测教师在真实教学情境中的教学完成情况而设计的实践任务,是评价教师教学状况的依据(周文叶,等,2021)。由于STEM教师教学胜任力包括教学设计、教学实施和教学反思与改革三个一级维度,因此可以有效表征STEM教师教学胜任力的表现性任务包括三类:教师教学设计文档、教师课堂教学实录视频以及教师教学反思与改进文档。为了让STEM教师准确理解表现性任务,本研究对三类表现性任务都给出了任务提示。
最后是制定评价量规。评价量规的本源是评分量表,量表中会按照从优到劣的级别明确指出每一个等级准则的表现水平(钟志贤,等,2007)。有效制定评价量规首先能够帮助评分者准确把握STEM教师各项能力的现状。同时,STEM教师作为成人学习者,准确清晰的评价量规描述能指引他们开展教学反思,确定后续的教学改进方向。本研究遵循“自上而下”的评价量规设计范式(周文叶,2014,pp.111-128),即从STEM教师教学胜任力模型出发开展评价量规开发。在开发步骤层面,本研究整合了祝智庭(2003)提出的评价量规设计步骤,具体分为:创建评价目标的概念框架;确定表现维度、表现等级;基于具体的表现性任务撰写描述,形成完整评分量规;使用评分量规,修订量规术语以保证规范性。本研究的评价量规以二维表的形式呈现,包含表现维度、表现等级和描述符。表现维度指的是表现性评价所涉及的各个能力点;表现等级分为优秀、良好、一般和待改进四个等级梯度;描述符是用语言描述的可以达到某一等级水平的行为表现。表2以STEM教师教学活动规划子能力中活动丰富性这一能力要素为例,呈现了量规示例。
表2 STEM教师教学胜任力评价量规示例
Striggins(2005,pp.175-178)提出了评价量规质量的四个标准:内容、清晰度、可行性和可信度。本研究以此为基础对STEM教师教学胜任力的三个评价量规进行论证与修订。本研究采用专家论证的方式对量规的内容、可行性和清晰度开展评审和修改工作。对量规可信度则采用不同评分者一致性检验的方式进行论证。经反复修订后,本研究首先设计了评价量规质量专家咨询问卷来验证量规的内容、可行性和清晰度,并邀请上述7名一线资深STEM教师和高校专家对评价量规进行打分与文字修订。数据分析结果(见表3)显示:本研究的三项评价量规在内容、可行性和清晰度等方面得分均超过4.0分,可以认为该量规内容质量较高、内容清晰,具备可行性。本研究也结合专家修订意见对量规的细节描述进行了全面修订。
表3 专家对评价量规的论证结果
量规可信度的验证环节主要采用一致性检验的方式,并通过斯皮尔曼等级相关系数来判断不同评分者打分的一致性情况。本研究随机采集了10项STEM教师教学设计文档,7位STEM教师完整的课堂教学实录视频,以及15位STEM教师的教学反思与改进计划文档,同时邀请两位打分者对这些材料进行背靠背打分。通过对三个评价量规28个条目的一致性分析可知,共有25个条目呈现出显著的一致性(P<0.05)。本研究也结合专家意见对其他3个条目的描述进行修订,修订后的评分一致性达到了显著水平。
2.表现性评价模型的评价执行机制设计
目前我国仍没有正规的STEM教师评价体系,因此在将表现性评价模型应用于STEM教师教学实践之前,应该充分思考如何有效使用与执行评价模型才能够让其发挥应有的作用。本研究所设计的STEM教师教学胜任力表现性评价模型旨在通过评价准确诊断STEM教师教学胜任力现状,并给予STEM教师持续性的评价反馈与改进意见。为实现这一目标,本研究从“如何让STEM教师呈现真实的教学胜任力”“如何让STEM教师获得持续性的反馈与改进信息”为切入点,设计了两种应对性评价执行机制。
第一种是评价无干扰机制。美国edTPA教师表现性评价体系强调评价必须基于真实情境中的教学实践,评价信息必须来源于教师日常教学工作,评价不能独立于教学工作之外(Voto,Olson,&Gottlieb,2020)。目前,我国教师测评普遍存在忽略过程、脱离教学实境的现象(闫寒冰,等,2019)。无干扰的内涵在于所有指向教师评价的数据均诞生于真实教学全过程中,无须刻意增加干预条件。这种数据采集思路的优势在于,能够真实反映出教师教学存在的问题,同时教师无须花费过多时间准备评价材料,极大减轻了教师的负担。评价无干扰的核心是数据采集的无干扰,强调教师所提交的评价材料均来源于教师真实的教学情境,无须教师刻意打磨,强调数据的原始性和真实性。在本研究的评价情境中,STEM教师所提交的材料无须刻意优化和提前准备,教师只需要将日常教学工作中积累的教学实录视频、教学设计文档和过程性的教学反思汇总提交,即可对其开展评价。
第二种是常态化评价机制。传统教师评价往往采用总结性评价的方式开展,教师无法从评价中获得持续提升专业能力的有效信息。本研究所设计的表现性评价模型强调伴随性,即评价伴随着教学全程常态化开展(闫寒冰,等,2020)。评价常态化意味着伴随性采集教师表现性材料。教师数据采集的伴随性强调需要常态化地采集教师的阶段性教学表现数据以供评分者进行点评,使得教师在一个学期或一个学年内能够得到多次针对性的评价反馈。这种情况下,教师将会有多次机会进行反思和教学改进,同时评价次数增多和评价工作常态化开展也让教师的教学改进成为一种常态化工作,教师的教学能力也会有大幅度提升。
3.表现性评价模型的评价管理机制设计
评价管理机制的核心在于有效利用评价信息。表现性评价是面向具体作品或行为表现的评价,优秀的表现性任务具有较大的借鉴和辐射效能,可以作为重要的学习资源进行储备,因此资源管理机制的设计尤为必要。此外,“评价即发展”是表现性评价的价值取向。因此,利用评价反馈信息组织STEM教师开展教研工作是表现性评价后续需要提供的支持服务,在这一过程中教研管理机制至关重要。
在教研管理方面,设计了两种管理机制:一种是建立动态优质资源库生成与管理机制。目前STEM教师普遍存在“手头无资源”的现象(姜浩哲,等,2020)。根据成人学习的“7-2-1”法则,教师70%的教学经验来自于日常教学工作中的学习,学习与利用优秀教学资源是STEM教师专业发展过程中必不可少的环节,因此应着重关注对STEM教师优质表现性材料的开发和再利用工作。在STEM教师表现性评价过程中,STEM教师首先提交表现性材料,汇总生成初步的STEM教师表现性材料“云库”;各地区可采用同行互评、学校/区域统筹把关或举办比赛等形式进一步遴选,构建初步筛选机制;之后,可邀请同行高校或一线专家对初筛后的资源进行进一步筛选、修订与论证,生成优质资源库。各级部门也可以采用培训学分冲抵、职称评定认证等方式对优质资源的贡献者进行奖励。当然,优质资源会随着课程改革和时代进步逐步更替,优质资源库也将迭代优化,为STEM教师学习提供有参考价值的资源。STEM教师优质资源生成与管理机制流程详见图2。另一种是建立开放包容的良性教研管理机制。为充分彰显丰富且真实的表现性评价数据的内在价值,需要建立相对灵活和开放的教研环境,允许教师利用多元评价结果进行反思与教学改进(Wiggins&Mctighe,2007),逐步推广“数据诊断性价值取向”的教师教研管理模式。在教研过程中,师训管理者应注重教师表现性数据分析结果的发展性用途,基于数据分析结果构建教师个体与区域教师群体的能力现状画像,并基于结果面向个人和群体精准定位问题,从而基于问题根源制定个性灵活的能力提升规划,建立自我反思与群智协同的系统性教师专业能力提升机制,实现教研管理制度从“以评定教”转变为“以评促教”。
图2 STEM教师优质资源生成与管理机制流程
评价模型实施的第一步是要求STEM教师按照表现性任务的要求提交文档类材料和多媒体类材料,具体包括教学设计文档、教学实录视频和教学反思与改进文档。这些文档都应来源于真实的教学情境,不需要教师刻意准备。第二步是专家开展评价。专家在收到教师的表现性任务数据后,基于评价量规对每一位教师的材料进行评价。第三步和第四步是数据整合与分析和教师能力画像呈现。对每一位教师在各项教学胜任能力上的得分与教学胜任力总分进行整合与分析后,得到区域性教师群体得分。各级教育部门应遵循个性化与精准化并重的分析策略,基于教师群体画像精准定位群体薄弱能力点,同时也需面向教师个体,关注个体薄弱能力点,实现个性化诊断与施策。最后一步是制定干预策略。教育部门应基于教师共性的薄弱能力点开展学校或区域层面的精准能力提升工作。区域教研员和学校管理者也应了解教师个体的情况,针对教师个体的突出薄弱项进行精准帮扶。可适当采用新老结对带教、优质资源个性化推荐等方式开展教师能力提升工作。
为系统论证评价模型的有效性,保证表现性评价模型在宏观上能够有效运行以支持STEM教师教学胜任力的诊断与提升,本研究采用问卷调研与深度访谈方法萃取学术专家和一线教师的意见。在设计问卷和访谈提纲时采用了方征等(2020)提出的教师评价方案运作效果分析框架(见表4)。
表4 STEM教师教学胜任力表现性评价模型有效性论证框架与问题
本研究邀请了9位专家进行论证,其中6位是STEM教育与教师发展领域的高校专家,3位为信息科技学科的特级教研员。研究人员以PPT和系统原型展示相结合的方式向专家展示表现性评价模型的设计理念、基本要素、机制设计和实施流程。讲解完毕后,向专家发放调查问卷,问卷调查结果如表5所示。
表5 表现性评价模型有效性专家问卷调查结果
问卷分析结果显示,专家们对评价模型的整体满意度较高,在9道题目中有6道题目的得分在4.50分及以上。但有2道题目得分小于4.00分,分别是“该模型实施不会对日常的教学工作产生影响”“该模型不会额外增加教师的工作量”。也就是说,专家们普遍认为该模型可能会对教师日常教学工作产生一定影响,同时也会额外增加教师的工作量。
由于实践空间有限,本研究以探索表现性评价模型的基本要素是否有助于刻画与提升STEM教师教学胜任力为核心问题,在S市内随机选取了6所学校的6位一线STEM教师作为评价对象,对其开展常态化评价数据采集与评价反馈工作。首先,根据表现性任务的设定情况,以教学月为单位,遵循评价无干扰原则,常态化采集6位教师的教学设计文档、日常教学实录视频和教学反思与改进文档。在月末有1位专家按照评价量规统一对6位教师的表现性任务进行评价,并将评价结果和提升策略与建议反馈给STEM教师。在学期末,对6位STEM教师进行了深度访谈,对一个学期中表现性评价结果反馈的有效性进行意见征询,同时也向其展示后续表现性评价模型的设计方案,以了解他们对评价模型的认可程度和其他建设性改进意见。然后对前述9位学术专家也进行了深度访谈。访谈总时长超过500分钟。
通过对访谈材料进行梳理,发现评价模型在评价要素设计、评价反馈机制设计和评价系统性三个方面表现优异,但在两个方面仍有改进空间:
其一是材料采集效率问题。受访者普遍表示STEM教师提交表现性材料存在一定操作上的困难,如现有课堂教学条件无法支持教学视频的常态化录制,需引入更为智能化的视频数据采集设备,应利用技术工具支持多元数据的智能化、伴随性采集。
其二是教师主观能动性问题。两位特级教研员指出,目前教师在使用评价模型时会出现使用意愿和积极性不强等问题,这一问题主要来源于教师的职业倦怠感。两位教研员指出:“教师的职业倦怠感会导致很多学科教师不愿意接受新事物和新的评价体系。教师能够积极地尝试和使用新事物基本都会在晋级期,日常情况下教师使用新技术或尝试新理念基本都以行政驱动为主,很少有教师会主动常态化地使用某个平台或体系。”
本研究以STEM教师教学设计能力为例,对教育部—乐高“创新人才培养计划”在2018—2021年间在全国范围内遴选的30份优秀STEM教学设计案例进行评价。这些教学设计案例均经过多轮实践检验,拥有扎实、系统的教学基础。该项工作旨在发现优秀STEM教师在教学设计中存在的现实问题。本研究基于STEM教师教学设计评价量规对教学设计案例进行评价。STEM教师教学设计能力画像如图3所示。
图3 STEM教师教学设计能力画像
能力画像结果显示:①STEM教师在教学评价设计方面存在不足。具体来说,在评价维度多元性(M=1.90)、评价形式多样性(M=1.90)和评价过程性(M=1.73)三方面表现均较弱。这说明STEM教师在教学评价方面思考和设计较少,能力较差,需要在后续培训过程中着重提升这项能力。②STEM教师在获取与运用教学资源方面也有较大提升空间。在资源选取丰富性上(M=2.33),STEM教师选取的教学资源较为单一,缺乏对多样化数字化学习资源的探索使用。STEM教师需要对教育资源的设计、获取和应用加以重视,才能有效提升STEM课堂的趣味性和有效性。③在STEM知识选取方面,STEM教师所选取的知识在丰富性(M=2.77)和系统性上(M=2.83)存在不足。具体来说,大部分STEM教师在设计教学内容时只停留在对STEM知识的浅层铺陈,并未关注到STEM知识的系统性和彼此之间的关联性。同时,STEM教师在教学设计中过分关注技术的应用,导致STEM知识在平衡性和系统性上有所欠缺。因此,建议在STEM教师培训中融入STEM知识整合方面的内容。
上述研究结果表明,STEM教师教学胜任力表现性评价模型在应用中仍存在两个现实问题,这些问题需要在后续研究工作中加以探索和解决。对此,本研究基于研究结论提出两点展望。
第一是人工智能赋能师生表现性数据采集。在人工智能时代,诸多技术工具已经在支持采集教师过程性表现性数据方面贡献卓越(骆方,等,2021),如智能云端录制每一堂课的教学视频;人脸识别和手势识别技术智能捕捉教师在课堂中的动作、语言和表情,从而动态、智能地记录教师的课堂教学行为表现;听评课系统使得同伴评课和专家评课更加便捷(朱珊珊,2018)。诸多智能技术工具为采集与评价教师表现性数据创造了便利条件。在后续评价模型的发展与优化中,应充分利用并整合不同技术工具的优势,取众家之所长,为模型便捷化、智能化服务,构建智能评价取向的STEM教师表现性评价系统。
第二是以发展性理念重构教师评价生态。本研究对教师表现性评价的价值定位是“发展性的”,而不是“定论性的”,这与目前我国教师评价的实际情况存在一定差距。建议从以下三个方面重构教师评价生态:首先,应让教师评价体系中的利益相关者认识到“评价即发展”的重要性,让一线教师在评价中感受到数据的价值,认同评价对提升自身专业能力的价值,在思想观念上形成转变;其次,建议尝试设立相关试点单位进行重点培育孵化,打造教师表现性评价示范性基地,逐步形成区域性新型教师评价文化生态;最后,随着学校和教师不断地在评价中受益,政府和相关教育部门也应对教师评价的发展性理念给予政策性鼓励与支持,从而逐步建立“评价即发展”的教师评价文化生态。
STEM教师教学胜任力表现性评价模型是诊断与提升STEM教师专业能力的有力工具。本研究所设计的表现性评价模型解决了STEM教师评价内容粗放、形式敷衍、反馈信息欠缺价值等问题。专家论证表明该评价模型能够有效评价STEM教师教学胜任力,同时能够为STEM教师提升教学胜任力提供有深度、有价值的反馈信息。在后续研究工作中,表现性评价系统的智能化建设与评价生态的重构将成为发挥STEM教师教学胜任力表现性评价系统价值潜能的重要工作。