牟智佳 刘珊珊 陈明选
摘要:人工智能和数据科学技术的快速发展以及循证教育理念的逐步深入,促使教学评价从传统的基于感知的评价向现代的基于证据的评价转变,由此催生循证教学评价。它以教育主体进行施教的全过程为聚焦点,分析教学投入及其学习成效,体现了对以人为本的发展性评价的坚守。循证教学评价的主要要素包括个性化教学、教学时空场域、多源异构数据,三者之间互联互通,并随着教学进程的推进相融共生。循证教学评价在理论设计上是以立德树人成效为核心,以课程教学起点与终点为评价周期,以线下教学与线上教学的融合为场景支撑,包含教学投入、教学证据、教学评测、教学优化四个阶段。在评价层级上,设计了教与学的评价层级塔,即教学从低投入到高投入表现为:教学行为、教学认知、教学情感、教学智慧,与之相对应的学习成效从低阶到高阶依次表现为:学生反应、学习成果、学习能力、核心素养。最后,对循证教学评价的证据来源、多源数据融合形式、数据融合的技术路线进行阐释,为教学评测的操作与实施提供可行路径。
关键词:循证教学评价;立德树人;多源数据;教学投入;增值评价
中图分类号:G434 文献标识码:A
本文受江苏省高等教育教改研究重点项目“‘互联网+教育背景下基于设计思维的课程设计与教学实践研究”(课题编号:2019JSJG082)、中央高校基本科研业务费专项资金资助课题“教育信息化2.0背景下信息技术与教学融合创新研究(课题编号:2019JDZD08)资助。
教学评价既是对教师为达成教学目标所开展一系列教学活动而进行的诊断方式,同时也是教师进行自我教学反思和优化教学的重要依据。近年来,党和国家领导人在教育教学评价方面进行了顶层设计和部署,指明了教育教学评价改革方向。2020年10月13日,中共中央、国务院印发了《深化新时代教育评价改革总体方案》,坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性[1]。2019年9月,教育部发布了《关于深化本科教育教学改革全面提高人才培养质量的意见》,意见中指出要建立以本科教学质量报告、学院本科教学评价、专业评价、课程评价、教师评价、学生评价为主体的全链条多维度高校教学质量评价与保障体系[2]。可以看出,新时代教育评价呈现出差异化、重过程、多维度的特征,推进教育评价关键领域改革已经上升为国家意志。
高校教师教学评价是教育评价领域中的重要参评对象,高校学科专业的多样化、教学内容的开放性、教学投入的复杂度使得教学评价很难全面、客观、精确的实施,教师在教学中所体现的显性教学行为和隐性心理特征则进一步增加了教学评价的难度。教学评价从早期百分制的排名式到等级制的分级式,均是以学生作为评价主体,对教师在为人师表、教学设计、教学方式、专业能力等方面进行评判,这种满意度式的评价既带有主观性色彩,又缺少必要的证据支持。如何从基于主观感知的满意度评价转向基于数据的精准教学评价是教学评价研究的一个重要议题。在数字化、智能化的浪潮下,教育大数据、人工智能、5G技术正向教育实践纵深发展,线上线下已双线融合,教育信息化发展逐步从数字化走向数智化,以智能、互联、实时为特征的数智化环境已基本形成。在数智化环境下,线上线下场景融合,数据驱动决策,以核心素养为目标的反向教学成为新形态。此外,智能录播技术、情感分析技术、智能评价技术的逐步成熟为基于数据的教学评价提供了技术支撑,使得教学评价从弹性模糊走向立体精确。
(一)教学评价的现状解析
数智化时代下教学环境的变化引发了教学模式和活动设计的多样化,原有的教学评价模式并不能适应新型教学体系的效果评判。在探索新型评价方案、创新评价工具之前,有必要对现有评价体系进行重新梳理和审视。结合文献分析和访谈调查,对教学评价进行了多维分析比较,结果如表1所示。
在评价思想上,主要包括四种形式:(1)人本主义,该形式建立在教师责任心和自觉性的基础上,关注教师教学任务和教学投入的复杂性,这种柔性的评价思想体现了基于教师自身的人文关怀;(2)经验主义,该形式适用于评价标准缺乏证据的判断阶段,这种主观评价思想体现了基于以往经验的唯心判断;(3)效益主义,该形式通过建立评价层级规范体系达到管理效益最大化,这种评价思想贯穿于以政府为主体的“教育问责制”中;(4)奖惩主义,它是通过奖惩机制来调动教师积极性,增强教师自我效能感,从而达到自我导向的激励作用。
在评价目的上,教学评价的落脚点是提高教育教学质量,但实际落地的侧重点是通过教师的绩效评估为教育管理提供决策依据,忽略了诊断激励的评价功能。在评价主体上,虽然参与评价主体呈现多渠道、多层面、多元化特征,但学生依然是评价主导者。其他评教主体如督导评教、同行评价等,实施范围很小且在教学评价体系中所占比重也较低[10]。
在评价内容上,受既定的规则体系影响,评价内容呈现标准化、一体化的特征,忽视不同学科课程性质的区别和教师个性化的教学风格。评价偏向易于量化、评估的元素,缺少对一些个性化、不易量化因素的评估。在评价方式上,整体采用定性和定量相结合的评价模式,在评价实施过程中以数据量化的总结性评价为主,以定性描述的形成性评价为辅。在评價结果上,主要以名次排序和等级划分为主,该方式虽然能够以简洁直观的形式呈现教学质量梯度,形成教学激励,但缺少具有可操作性的教学改善策略。
基于上述分析,结合教育评价改革方向,当前高校教育评价存在以下主要问题:(1)重管理效益,轻人文关怀;当前教学评价理念倾向于管理效益,评价结果侧重于教育管理服务,忽略了教师教学投入的复杂性、教学模式的多样性等个性特征;(2)重经验判断,轻数据循证;学生在教学评价权重中占比较高,而学生对教学的评价是基于个体对于前期教学的印象回忆,无法直接观察到教师全方面和全过程的教学投入,且评价结果容易被个人兴趣所主导,教学评价倾向基于自身满意度的经验判断,缺乏必要的数据支持;(3)重分等奖惩,轻以评促教;评价结果侧重横向比较,缺乏纵向评估及其教学优化建议。在日益多元化的社会中,主体意识的觉醒要求教学评价回归本真形态,关注促进学生学习、支持教师教学、满足社会多元化人才选拔的功能[11];(4)重总结性评价,轻伴随式评价;当前教学评价多在学期末进行,尽管期中有评价反馈,但整体缺乏对教学过程行为的持续性追踪,教师无法基于动态评估结果进行实时调整,评价存在滞后性。
为解决上述问题,教学评价在理念上要体现以人为本的教学质量观,注重教师的成长和发展,关注教师的身心投入。在评价方式上要通过各项教与学数据还原整个教学过程,形成以立德树人为中心的教学证据链。在评价结果上采用增值评价,一方面关注学生学习成效的涨幅变化,另一方面关注教学投入的分布及其变化,通过师生协同评价实现教与学活动的统一。
(二)教学评价的范式转变
以往评价关注点主要以教为中心,对于教学所引发的学习表现关注较少,教学评价模式需要摒弃教与学的二元对立,树立两者相统一的评价理念。教育评价系统的复杂要素构成及其相互关系引发我们需要站在认识论层面审视系统中的要素关系。主体和客体是认识论的一对基本范畴,在实践中体现为改造与不改造的关系。教育评价的核心构成是评价主体与评价客体,评价即判断评价客体对于评价主体的价值和意义[12]。在教育实践场域中,教师和学生作为教育活动中的两个重要对象,可以被视为主客体相互作用的关系。当前教学评价主要是从客体视角进行,通过主观感受进行直接的评判,能够对教学实效进行激励性评价的同时,也带来了缺乏工具理性、解释张力不足等问题。近年来,数据科学的快速纵深发展和教学活动的科学化演变,促使教学评价需要提供证据支持。教与学活动的主客体参与和相互作用决定了教学评价需要两者相结合,并由主体提供直接证据、客体提供间接证据。在教育科学理念、人本主义价值取向的支持下,教育评价是主客体相结合、共同建构、相互促进的过程。
(三)循证教学评价内涵及其取向
近年来,受大数据技术、数据科学、人工智能技术的影响,循证成为各项教育改革的主要理念,循证教育(Evidence-based Education)重回研究者视野。循证主要指具有客观证据支持的所有学校改革的相关概念或策略,循证研究最早源于医学领域,并逐渐演化成通过科学研究来寻找和确证行为有效性的循证研究基本理念[13]。循证教育的发展经历了从循证医学到循证实践、再到循证教育的演变脉络[14]。循证教育的核心思想是对实践者所采用的教育方法进行系统、严谨的评估,并将分析结果进一步反馈和应用到实践中[15]。循证教育理念作为教育领域的整体改革构想,既是提升教育实践科学化和高质量发展的有效途径,也是促进教育理论与实践迭代转化的重要桥梁。
从方法论层面看,教学评价可以分为两种,一种是传统的基于感知的评价(Opinionbased Evaluation),一种是现代的基于证据的评价(Evidence-based Evaluation)。教学评价作为教学质量监测的主要对象,是循证教育在教学实绩方面的一个重要着陆点。我们认为循证教学评价是以教学评价理论、数据科学技术、教学分析方法为基础,以全教学数据链为抓手,运用绩效技术的理论和方法,对教学的整个过程及其成效进行多维、精确评估测量的一种方法。循证教学评价将评价方式由学生的感知印象转变为基于教学数据的证据评价。它侧重将教学人员的教学投入及其成效与能够获得的评价证据相结合,以全面、精确、有效地帮助教师更好地优化教学。
从结构主义视角看,教学评价具有整体综合性和自身调整性,评价的实施离不开教学主体开展教学活动的相关情境,而基于教学证据的分析对教与学起到调节优化作用。循证教学评价的主要要素包括个性化教学、教学时空场域、多源异构数据,各要素通过相互联系与作用形成结构化的支撑。
(一)个性化教学:评价对象的主体支撑
著名教育家叶圣陶先生讲过:教学有法,教无定法。教学有法体现了不同学科的教学有一定的教学模式与规律可循,而教无定法则表示教师在开展教育教学活动中基于实际情境和学情进行灵活实施,体现的是教学个性。在当前充满多样化技术工具、丰富的学习资源背景下,教学设计具有较大的灵活性和自由度,为更好地培养学生个性发展,个性化教学将成为未来重要的教学方式。因此,以教师为中心所开展的个性化教学评价,不仅要分析教学的共性表现,还要关注教师的个性化教学行为。教师的教学共性和个性共同构成教学评价的主体。
(二)跨时空场域:评价内容的环境支撑
场域是一种具有相对独立自主性的活动空间,人的个体行为能够被行动所发生的场域所影响。在“互联网+”环境下,学与教的时空场域都得到拓展,正式学习和非正式学习成为主流学习方式,与之而来的是线下教学和线上教学的设计与融合。课堂教学和网络教学是相对独立的教学空间,这使得两者之间并不能在时空上进行简单的叠加,两者之间共同构成一个教学网络。基于教学设计的贯一性原则,需要将线上线下进行统筹设计,由此所开展的教学评价也要保持一致性。跨时空场域是教学评价的环境支撑,它包含了教学内容及与之相连的行为因素。
(三)多源异构数据:评价科学的证据支撑
教学环境的跨时空场域、教学行为的个性表现、教学平台与工具的应用矩阵引发了教学数据具有多来源、跨结构、互通性的特征。多源异构教学数据是不同场景下教学外在行为和内在认知心理的数据信息载体,这些数据的存储方式、类型都有差异,基于跨时空、跨模态数据的汇聚与融合可以为教学评价的科学性和客观性提供强有力的支撑。当前,教學评测的数据来源较为单一,数据类型缺乏多样性,数据解释力不足。教学数据的多源性、异构性、多维性,使得评价测量需要对这些数据进行共享集成与交互共享。面向教学评价范式转变、利用人工智能和大数据等信息技术创新评价工具的最新需求,还需要解决不同场景下教学行为和内容的结构重组与语义匹配问题。
(四)教学评价主体、环境与证据的相融共生
从系统论来看,需要把研究和处理的对象看作一个系统,研究系统、要素、环境之间的相互关系和变动规律。教学评价作为一个整体系统,由教学主体、教学环境、教学数据共同构成,三者之间互联互通,并随着教学进程的推进相融共生。在系统要素关系上,教学环境既是教学主体施教及其数据生成的基础,同时也制约教学活动的设计与实施。从优化系统这一目标来看,教学评价不仅是对主体的评价反馈,同时也要对环境、数据进行优化。对教学环境的优化体现为不同时空场域要素的调配与衔接以更好地进行教学设计,对教学数据的优化体现为提取和转换表征有效教学的数据信息,从而对教学评价进行动态建模。
相对于以往的以学生学习体验和感受为主的主观性教学评价,循证教学评价则强调教学投入、教学成效与教学证据的结合,评价内容要基于双边过程和结果,评价结果旨在促进教学优化。循证教学评价体现的是基于证据的教学评价观,依托智能技术、数据科学和教与学理论对评价模式进行设计,使评价有据可依、有迹可循。
(一)循证教学评价的理论框架
循证教育理论与大数据技术是循证教育评价的两大支撑点,是对教学时空、教学个性、教学数据进行有机融合的新型教学评价形态。循证教学评价以科学的教育发展观为精神内核,以立德树人成效为根本标准,紧扣教育评价的科学性、专业性、客观性的研究诉求与主旨。循证教学评价以教育主体进行施教的全过程为聚焦点,分析教学投入及其学习成效,体现了对以人为本的发展性评价的坚守。基于上述分析,我们提出循证教学评价的理论框架,如图1所示。该框架以立德树人成效为核心,以课程教学起点与终点为评价周期,以线下教学与线上教学的融合为场景支撑,包含教学投入、教学证据、教学评测、教学优化四个阶段,形成循环、多元、综合的评价理论设计。
(二)循证教学评价的多维阐释
1.核心目标:立德树人
循证教学评价是循证教育理念在教学评价方面的改革探索,强调基于多维教学证据进行评价。循证教学评价的逻辑起点是教师教学,逻辑终点是教学成效。从教学结构要素视角来看,教学评价结果在学习者身上体现的是立德树人,在教师身上体现的是教学反思与优化。师生作为教学中的主体和客体,两者相互促进和影响,教学评价作为研究教与学价值的活动,通过评教和评学相结合的方式促进教学相长。循证教学评价更多体现的是方法论层面的变革探索,评价的目的要服务于教育的根本任务。
2.评价内容:教学投入与成效
根据评价内容不同,教学评价可分为事实评价和效用评价,前者主要是评教学条件、教学行为等,属于条件性、输入性的评价,后者主要评学习效果、满意度等,属于结果性、输出性的评价[16]。然而,现有评价体系主要以教为中心,事实评价不足,效用评价缺失。教学评价应从单一的评教转变为评教与评学相结合的多维评价。在环节上应包含教学的全过程及其结果,其中在教学设计准备、组织和课堂教学部分体现的是教学投入,在培养学生立德树人部分体现的是教学成效。在教学投入方面,既需要评价教师在整个教学序列活动中所体现的显性行为投入,也需要评价其认知与情感等方面所体现的隐性行为投入,这些身心投入对学习者产生直接或间接影响。在教学成效方面,需要评价学习者是否达成教学目标,学习结果是教学投入效果的直接体现,这里既包含学习者课程学习方面的变化,也包含思想和心理方面的变化。
3.评价依据:全域教学数据链
当前,“互联网+教育”已成为各级各类教育的基本环境,特别是疫情之后,混合式学习成为数智化环境下学习的新常態。在这样的环境下,教师的教学投入也在发生改变,教学不仅停留在教学设计与实施的环节上,教师在网络课程设计、网络教学活动组织、数字化教学资源准备,以及线上与线下教学内容衔接等方面需要投入更多精力。教师分布式教学投入的特征促使教学评价需要对“人-事-场”等关键环节进行融合分析,实现师生、事项与场景的全链路智能化升级,依托整个教学过程数据链,对教学进行分类多维评价。因此,需要将不同情境下的教学行为和心理数据进行提取整合,形成基于数据的教学闭环链路,为后续进行教学评价精确计算提供分析依据。
4.评价结果:增值评价
增值评价是国际上广泛采用的一种评估模式,它是以学校教育活动对学生预期成绩的增值作为教育评价标准[17]。尽管通过学生学业成绩变化可以对教学效果进行评价,但这种结果导向的评价方式并不能全面反映教学的具体投入,在关注学习成效的同时,还需要以教师在课程教学上的起点和教学投入的过程作为增值进行评估。增值评价重视教学过程,关注教学投入变化。增值评价需要基于教学评价模式,应用教学起点和过程性数据链进行测量分析,以学校教育活动对教师预期教学效果的增值为教学评价标准,对教师教学表现进行纵向评价。
5.评价方式:动态生成性评价
已有的教学评价方式主要是总结性评价为主,中期评价为辅,这种方式使得教师既不能实时了解自己教学状态,及时改进和优化教学,又不能对调整后的教学效果进行动态评估,教学评价在操作方面具有滞后性。采用循证教学评价方式,可以基于不断更新的教学投入数据对教学进行实时评估,生成评价结果,并进行动态更新。依托传感器、多源数据融合、智能评价等技术,可以对教学投入进行动态评价,为教师提供可供参考的教学分析仪表盘,使教师能够实时了解个人教学状况。
(三)循证教学评价的层级进阶
教学活动是教学设计与实施中的重要构成部分,教师与学生之间以对话、交流、合作为基础所开展的双向交互和学习境界使得教与学评价要超越单一评价维度,走向多维层级进阶评价。教学效果的体现与转化不仅反映在学习者身上,教师自身的时间、精力、情感等也需要纳入到评价范畴中。结合教学投入的深入程度以及学习成效的多种表征方式,我们设计了循证教学评价层级塔,如图2所示。其中,教学从低投入到高投入表现为:教学行为、教学认知、教学情感、教学智慧。与之相对应的学习成效从低阶到高阶依次表现为:学生反应、学习成果、学习能力、核心素养,即学生由初期的整体学习感知到中期的学习制品与技能应用,再到关键能力与必备品格的养成。教学行为体现为教学时间、教学准备的投入,该层级以特定情境的专业知识掌握为评价依据。教学认知体现为教学设计与方法运用的投入,该层级以实践应用与问题解决能力为评价依据。教学情感体现为教师对教学的态度和感情投入,该层级以高阶思维、创新精神、个性发展为评价依据。教学实践活动的复杂性决定了紧靠教学时间和精力的投入还不足以达成教学目标,还需要促进学生概念转变和素养培育的教学智慧。教学智慧是教师针对教学情境中学习问题的挑战,以贯通的视野回应并帮助学生进行意义建构的持续性行动[18],它是教学投入高级阶段的表现形式。循证教学评价层级塔中的学习表现与教学投入在呈现阶段性特征的同时,还具有承续性特征,即更高一级的行为涵盖上一级行为。在实际操作层面,需要依托多源数据融合技术对教学数据链进行逐层提取,以表征教学评价中的各层级要素。通过分析聚类上述要素形成数据簇,并进行融合处理,实现评价层级与数据的转化计算与关系映射。
多源数据融合是指采用不同方式对不同来源和不同呈现形式的数据进行融合,使其形成具有统一格式并面向多种应用的数据集合的过程[19]。利用多源信息可以弥补单一数据和关系类型在揭示教育评价对象时所出现的片面性。基于多源数据融合的循证教学评价关键特点体现在两个方面:一是教与学评测输入信息的多源性、异质性和关联性;二是基于多种信息处理技术进行融合分析,从而形成教与学的优化反馈应用。通过对系统的教与学信息数据进行样本和变量方向的整合,共同对教学投入和教学效能进行评测,促使评价从外延型转向内涵型。
(一)循证教学评价的证据来源
证据是可以获得的事实或信息的集合,表明一个信念或观点是否真实有效[20]。教学评价证据是对教与学过程和结果信息的集合,因此可以将其分为课程设计证据、教学设计证据、教学实施证据、学习过程证据、学习结果证据。其中课程设计证据是对教师在课程培养目标、课程教学大纲、课程思政融入点、课程成绩评定等方面的信息集合,它是对课程体系在立德树人的宏观评估。教学设计证据是对教师在教学目标设计、学习者特征分析、教学模式与策略选择、学习环境设计等方面的信息集合,它是对教学环节与内容在立德树人的中观评估。教学实施证据是对教师在课堂教学空间和网络教学空间进行教学序列活动中所表现出的身心投入的信息集合,它是对教学行为在立德树人的微观评估。学习过程数据是对学生在课程学习过程中所产生的学习痕迹的信息集合,它是学生成效增幅的间接反映。学习结果证据是对学生在课程学习之后所获得的知、情、意、行的信息集合,是学生成效增幅的直接反映。
(二)循证教学评价的多源数据融合形式
教学评价的多源证据有多种表现形式,在多元表示原理、相关性原理、意义建构等理论的支持下,需要将教学证据转化为机器可读的数据。从融合场景的视角看,主要包含四种融合形式:线上数据与线下数据的融合、传感数据与环境数据的融合、历史数据与实时数据的融合、时域数据与空域数据的融合。
1.线上数据与线下数据的融合。随着信息技术与教学活动的深度融合,高校教师的教学数据逐步向互联网化发展,呈现分布式数据特征。其中,线上数据包含了教师各项教学准备、在线学习活动设计与组织、学习过程等。线下数据包含了课堂教学活动、师生互动、教师情感映射、课后自主学习与辅导等。然而,教学活动与实施是一种线性渐进的行为,线上线下数据并非简单的叠加,需要基于教学活动序列特征进行关联重组,形成具有教学意义的数据闭环。
2.传感数据与环境数据的融合。传感數据是基于传感器、监控器、智能录播系统、网络教学平台等通信设备,将检测和记录到的“硬数据”通过物理形式传到云端服务器上,为后期预处理工作提供数据源。环境数据是教师教学行为的影响辐射到的环境客体所产生的“软数据”,是人为生成的模糊性数据,例如成果外显度、学习投入度、学习坚持性、学习反思力等。智能采集的传感数据所具有的客观性与人为生成的环境数据所具有的灵活性相互弥补,增强了教学证据的科学性。
3.历史数据与实时数据的融合。当前高校教学评估中心积累了丰富的历史教学数据,这类数据多以视频、表格、档案等形式储存,而多传感器又会跟踪检测到教学者实时产生的最新数据,识别其最新的教学状态。基于静态的历史数据可以刻画教师个人的教学风格,基于动态的实时数据可以分析教学动态变化。通过历史与实时数据的融合,发现其整体教学规律,分析其教学质量的增减态势,并对其潜在教学问题进行预测判断。
4.时域数据和空域数据的融合。教与学数据散落分布在不同时间和空间中,时域数据是纵向时间线上累积的教学数据,空域数据是横向空间面上散落的教学数据,它们属于不同坐标系。根据数据融合规则将这些数据拉回到统一参考系中进行数据配准,形成以空间面为基底,时间线为支柱的立体数据网络。时域与空域数据的融合可以对教师在不同场景下的时间关系、空间结构进行评测,挖掘其教学习惯、教学路径等个性特征。
(三)多源数据融合分析的技术路线
循证教学评价注重对教学证据的多源采集,相对于单传感器对识别目标描述的不完全,多传感器能够对教与学数据进行全面采集,具有良好的系统鲁棒性。多源数据融合是利用数学方法和技术手段对多传感器采集到的数据进行综合集成,它强调对教学证据的全区域覆盖和高精度的测量维数,有效降低教学评测的模糊程度,满足循证教学评价的客观性。基于多源数据分析和融合技术,我们设计了具体技术路线,如下页图3所示。该流程以多源数据采集为出发点,通过数据重组、数据归并、数据建模对教学评测的各项数据进行系统化分析,进而形成多维教学评测结果,为教师提供有效反馈和精准决策。
在多源传感信息源阶段,主要采集网络平台类、课堂录像类、教学行为类、学习成效类等含有结构化、半结构化和非结构化特征的数据。为保证教学评价的精准性,在数据基础上,倾向于采集全体数据而不是抽样数据。采集完数据之后,需要对异构数据进行预处理。对于结构化的教学信息数据库处理主要包括数据过滤、数据分类和统计等;对于半结构化的教学行为数据处理包括数据转换、特征提取、数据关联等;对于非结构化的教学视音频、文本类、资源类数据处理包括语言转化与分析、文本处理分析、数据反演分析、情感分析等。
在特征选择阶段,主要是从预处理过的信源数据中抽象出具有充分表示量或充分统计量的特征向量。从教师角度来看,线上提取到的在线活动轨迹详细记录了教师与网络教学平台、学生的交互信息,以及教师所进行的备课、授课、评测、辅导、答疑的活动痕迹。线下提取到的数据主要包括教学事项中的关键行为、课外场景下的教学投入。从教师个体属性中可以抽象出教学个性和风格特征。从学生角度来看,主要抽取教学条件下所产生的一系列学习行为、学习成绩、学习制品等。
在数据关联阶段,主要是将具有代表性的特征向量进行优化组合,形成以相关属性为串联轴心、以特征向量为串联节点的数据簇,它是数据融合前的准备阶段。教学心理与行为关联是通过将教师的内在情感和外在表现相聚合以反映教学特征。教学知能与活动序列关联是通过将教师的教学能力和教学活动相聚合反映教师的教学知识转化力。教学存量与增量关联是以评测前的教学存量为参考点,通过将教师的能力储备和能力跃迁相聚合反映教师的能力进阶度。教学表现与学习反应关联是将师生的互动表现相聚合,反映教师的课堂组织力和教学调控力。学习过程与结果关联是将学生的学习输入和学习输出相聚合,间接映射出教师的教学绩效。
在数据融合阶段,主要是将多种教学信源数据在空间、时间上的冗余与互补的信息联合、相关和组合,产生对评测教师的一致性解释和描述。数据融合最早由美国军方应用于作战目标的跟踪和识别,随着面向众多应用场景的多传感器及其数据系统的大量涌现,这种技术思想逐渐被广泛应用到多个领域。数据级融合是最低层次的融合,先对传感器采集到的数据进行融合处理,再提取特征进行判断决策,这种融合损失的数据量最少,可以提供其它融合层次不能提供的细微信息,该层级主要面向教学行为点的融合。特征级融合是介于数据级融合和决策级融合的一种代价处理的融合级别,考虑到教学事件线不需要类似图像数据融合的高精度,这种融合级别契合事件数据的实时处理需求,因此可以在降低通信宽带的前提下,有效实现可观的数据压缩。决策级融合是在预处理后的数据基础上先作出决策,之后在融合中心将之前作出的局部决策进行融合处理。这种融合直接针对具体教学评测等级,融合结果直接影响教学评测效度。该融合级别虽然数据损失量最大,但通信量小、抗干扰能力强、对传感器依赖小,适合教学价值面的决策融合。
在态势估计阶段,主要是对教师教学过程和教学质量动态变化情况进行评估,从而分析评测结果的深层次原因,进而形成教学效果的综合态势图。态势是一种状态和趋势,是面向教学生态的全局概念。态势估计具有客观性和灵敏度的特征,客观性是指教学评测的结果必须反映教学的真实局势,灵敏度是指评测结果不随教学过程中的微小变化而发生较大偏差。通过对师生在教与学整个生命周期活动中产生的全域数据进行一系列处理,得到关于教学指标的评测态势,最终为后续教学决策提供依据。
基于证据的评价为教学评价的改革与发展带来了新的图景,而多传感技术、自动化数据采集、数据集成与融合等技术则为评价的实施提供了有力的技术支撑,数智化时代下的教学评价需要全方位转型,改变主观体验、管理本位的倾向。循证教学评价的核心价值是基于数据进行教学评测,促进教师专业发展,推进落实立德树人这一根本任务。循证教学评价需要整合多源教与学数据,并进行对准关联和特征提取,通过刻画分析生成具有个性化的教学画像与反馈策略,以提高评价结果的认可度和效果转化的长效性。
参考文献:
[1] 新华社.中共中央、国务院印发《深化新时代教育评价改革总体方案》[EB/OL].http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm,2020-10-13.
[2] 中华人民共和国教育部.教育部关于深化本科教育教学改革全面提高人才培养质量的意见[EB/OL].http://www.moe.gov.cn/srcsite/ A08/s7056/201910/t20191011_402759.html,2019-09-29.
[3] 龔晓林.走出高校课堂教学评价困境的核心问题——基于目标管理视角[J].现代教育管理,2014,(7):93-97.
[4] 杨卫东,张征.探索回归本真的高校教师教学评价[J].教育研究,2016,(12):130-132.
[5] 吴立宝,曹雅楠等.人工智能赋能课堂教学评价改革与技术实现的框架构建[J].中国电化教育,2021,(5):94-101.
[6] 曹燕南.以“学”为中心的高校教学评价实践——英国“教学卓越框架”的特点与启示[J].江苏高教,2019,(3):13-20.
[7] 刘佳.第四代评价理论视阈下高校教学评价制度的反思与重建[J].教育发展研究,2015,(17):56-61.
[8] 于青青,冯菲.构建高校教师教学发展的综合体系——北京大学教师教学档案袋建设初探[J].中国大学教学,2020,(8):65-70.
[9] 陈明学.高校教师教学评价的反思与实践转向[J].黑龙江高教研究,2017,(9):56-59.
[10] 周玉容.大学教学评价标准的双重困境与破解之道[J].高等教育研究,2019,(10):75-81.
[11] 毛刚,周跃良等.教育大数据背景下教学评价理论发展的路向[J].电化教育研究,2020,(10):22-28.
[12] 程天君,张铭凯等.深化新时代教育评价改革的思考与方向[J].中国电化教育,2021,(7):1-12.
[13] 李华,程晋宽.循证学校改革:美国基础教育改革路径探索[J].教育研究,2019,(10):62-73.
[14] 邓敏杰,张一春等.美国循证教育的发展脉络、应用与主要经验[J].比较教育研究,2019,(4):91-97.
[15] 周加仙.走向循证教育决策与实践[J].外国中小学教育,2017,(6):9-16.
[16] 周湘林.以学生学习为核心的高校教师教学评价方法创新研究[J].现代大学教育,2017,(1):93-97.
[17] 边玉芳,林志红.增值评价:一种绿色升学率理念下的学校评价模式[J].北京师范大学学报(社会科学版),2007,(6):11-18.
[18] 陈尚达,吴迪.教学智慧及其生成路径[J].教育科学研究,2017,(8):53-57.
[19] 化柏林,李广建.大数据环境下多源信息融合的理论与应用探讨[J].图书情报工作,2015,(16):5-10.
[20] Bernstein R J.Beyond objectivism and relativism: Science,Herneneutics,and Praxis [M].Philadephia:Uniersity of Pennsylvania Press,1983.
作者简介:
牟智佳:副教授,博士,硕士生导师,研究方向为教育大数据与学习分析。
刘珊珊:在读硕士,研究方向为学习分析与评价。
陈明选:教授,硕士生导师,研究方向为信息化教育、课程与教学设计。
The Evidence-based Teaching Evaluation: A New Orientation of Teaching Evaluation in Colleges and Universities in the Era of Digital Intelligence
Mou Zhijia, Liu Shanshan, Chen Mingxuan(Research Center of “Internet Plus Education”, Jiangnan University, Wuxi 214122, Jiangsu)
Abstract: With the rapid development of Artificial Intelligence and data science, as well as the gradual deepening of evidence-based education concept, teaching evaluation has changed from the traditional perception-based evaluation to the modern evidence-based evaluation, thus giving birth to evidence-based teaching evaluation. It focuses on the whole process of teaching by the educator, analyzes the teaching input and learning effect, and embodies the adherence to the human-oriented developmental evaluation. The main elements of evidence-based teaching evaluation include personalized teaching, teaching space-time field and multi-source heterogeneous data, which are interconnected and symbiotic with the advancement of teaching process. The theoretical design of evidence-based teaching evaluation takes the effect of moral education as the core, the starting point and end point of course teaching as the evaluation cycle, and the integration of offline teaching and online teaching as the scene support. This framework includes four stages, which are teaching input, teaching evidence, teaching evaluation and teaching optimization. On the evaluation level, the evaluation tower of teaching and learning was designed, that is, teaching behavior, teaching cognition, teaching emotion and teaching wisdom are the performance of teaching from low input to high input. The corresponding learning effects from low level to high level are as follows: students reaction, learning achievement, learning ability and core literacy. Finally, the evidence source, multi-source data fusion form and technical roadmap of data fusion are explained to provide a feasible path for the operation and implementation of teaching evaluation.
Keywords: evidence-based teaching evaluation; moral education; multi-source data; teaching input; value-added evaluation
責任编辑:李雅瑄