王冬青 刘欢 邱美玲
摘要:课堂教学行为数据的采集与分析能有效反映教学效果,以往的课堂教学行为分析多采用教学视频打点分析、课堂观察量表等方法对课堂教学进行评价。在云计算与大数据服务支持的背景下,涌现了大量基于云+端应用模式的智慧教学环境,使教学行为数据的自动采集与分析成为可能。该文从教师专业发展的角度,将教育数据挖掘方法应用于智慧课堂环境下教师行为数据的可视化分析与应用,提出一种面向智慧课堂教师教学模式的频繁序列挖掘算法和聚类分析方法,通过教学视频案例的分析验证,发现针对某一具体学科聚类分析得到的优秀教师结果簇与实际教学中的优秀教师表现出较强的一致性,且各学科的智慧课堂教学模式呈现不同的发展特点。该方法对提高课堂教学质量和促进教师专业能力提升具有重要的实践探索意义,为“互联网+”时代下建立教师新型的评价方式提供新思路和新方法。
关键词:智慧课堂;课堂教学行为数据;数据挖掘分析方法;教师专业发展
中图分类号:G434 文献标识码:A
一、问题提出
云计算、大数据和学习分析等新一代信息技术融人教育教学全过程,智慧教育日渐兴起,并日益成为未来教育的发展趋势。智慧课堂是智慧教育的典型教学应用,其迅速发展引发了教学环境的新一轮变革,为教师创新教学模式、转变教与学方式、提升专业发展水平提供更多机会,也因此对教师的专业发展提出了更高的要求和标准。其中,数据素养已成为当下任何教师都必须具备的核心专业能力,具体表现为数据意识、数据处理与分析能力、数据决策能力、数据交流与评价能力等。对于教师而言,采用数据驱动的精准教学模式,对课堂进行全样本、全过程分析,透视隐藏在数据背后的教学特征,能帮助教师对自身教学行为进行有效反思,提升专业发展能力。
智慧课堂常态化应用为收集和分析教学过程中的数据创造了许多机会,实时追踪课堂教学中产生的行为表现数据,全面刻画教师的教学过程与学生的学习过程。相比传统课堂,智慧课堂教学行为丰富且复杂,其影响因素也较多,如:教师的教学时间长短、已有知识结构、教学策略、教学模式以及外部环境和技术等因素的综合作用。采用传统的视频分析法、课堂观察法等质性描述分析智慧课堂的教学行为,通常仅得到师生互动性增强、课堂较活跃等表层信息,缺乏底层有效行为数据的支撑,因而在传统分析方法下进行智慧课堂教学行为的研究面临不少难题。
目前教育数据挖掘与学习分析技术相结合主要针对学生行为进行建模与学习趋势预测,更多关注学生行为数据的采集与分析,较少从教师专业能力提升的角度,采集与分析智慧课堂的教师行为数据。如何借助日益成熟的教育数据挖掘对课堂教学进行量化观察和数据处理,对技术支持的教与学创新应用具有重要实践意义。基于此,本文针对智慧教学环境所采集的跨平台异构、多源、非完整以及动态演化的数据,采用合适的数据挖掘方法及可视化分析技术,全面分析智慧课堂环境下教师行为数据的价值信息,发现教师的教学规律和教学方法特点,为大数据时代下教师专业发展的研究范式提供新思路和新方法。
二、相关研究基础
教育数据挖掘(EDM)是指在教育环境中应用数据挖掘技术分析教育教学活动中产生的数据,用以解决教学实践与教育研究中的问题,旨在改善和提高教学质量。
(一)教育数据挖掘方法的相关研究
教育数据挖掘常用的方法有聚类、关联规则、序列模式挖掘、文本挖掘、Web挖掘等。聚类是在教育数据挖掘中使用较多的方法,是一种无监督的学习算法,不需要对数据进行训练,主要按对象的特性进行相对合理的分类,将一个完整的数据集分成不同的子集,同组的样本具有相似的特征,采用的聚类算法有K-Means、K-medoids等。早期的聚类分析数据来源主要是人为输入数据进行分析,计算量大且冗繁,如通过问卷调查的方法收集教师的信息技术教学应用情况数据,采用K-Means聚类分析教师的信息技术教学应用形态;利用课堂教学行为大数据,运用视频观察法和聚类分析法研究课堂教学的规律。随着数据量的不断丰富和扩大,研究者们开始运用技术实现数据记录、存储和导出,并以此作为聚类分析算法的输入数据进行深透挖掘,如对基于Moodle网络日志进行的聚类分析,发现教育现象之间的相互关联与规则;将在线学习系统的数据做聚类,发现在线数学游戏学生团队协作中的行为规则。
关系挖掘的主要目的是为了找出数据与数据之间隐藏的具有关联性的某种关系,目前关系挖掘在教育方面的应用主要是研究在线学习环境中学生成绩与教学活动之间的内在联系,研究者利用关系挖掘,探索在线学习环境中学习者学习活动和学习成绩的相关关系,进而用于改进学习内容呈现方式和序列,以及在线教学方法。频繁项集和关联规则是关系挖掘中最高效的兩种方法。通常在做关联规则挖掘时的首要步骤是生成频繁项集,随后在频繁项集的基础上生成规则,因此更准确地说,关联规则是关系挖掘领域最主要的算法之一。序列模式挖掘作为与关联规则较为相似的算法,也可用于关系挖掘,但序列模式挖掘更关心数据之间顺序的关联性。
(二)教育数据挖掘应用的相关研究
早先国内外对于教育数据挖掘的应用研究主要聚焦于在线学习或学习结果数据的挖掘,关注学生发展,对学生的行为表现、学习偏好等内容进行评估,因为访问学生日志的数据和学习成绩数据更容易自动获取和分析,如利用数据挖掘工具对在线开放课程学习者的过程和行为数据进行采集与聚类分析,发现不同群体的学习行为与学习效果之间存在密切相关性。而近年来人们越来越意识到教师数据对于改善教学设计的重要价值,教师教学数据挖掘逐渐成为教育数据挖掘领域最新的发展方向。McKenney收集教学过程中的数据进行教学实证研究,表明教学挖掘有利于帮助教学和学习,是一个非常有潜力的领域。更有一部分学者深入探讨了大数据对教师表现的影响研究,关注分析教育系统中的行为数据,以探索课堂教学模式的应用及效果,进一步评估和改进教师表现。陈俊强等人通过定量与定性相结合的分析方法,对大数据背景下科学课教师的教学行为进行了探讨,全面剖析课堂存在的教学问题,有效促进教师改进课堂教学行为。与之不同的是,李淼浩在对教学行为大数据分析的基础上,融入了教学模式和课堂效率的评价,帮助教师清晰审视教学方法的合理性,有益于实现教学能力的自我提高。此外,还有学者针对特定的智慧课堂环境中产生的教学数据进行挖掘分析,包含师生的行为互动数据和表现数据,并以此构建了完整系统的智慧课堂学习行为分析框架;孙曙辉提出了智慧课堂数据挖掘分析的四类应用模式,最后基于真实数据探讨了学生主观行为对成绩的影响分析应用案例;除关注智慧课堂学生群体的行为分析外,有学者还基于智慧课堂教师教学行为数据,寻找不同教师群体及其教学行为的关系。不难发现,现有研究多采用传统的分析方法,关注课堂教学呈现的显性数据,对自动采集的海量教师行为数据分析利用较低,尚不能深入对教学过程性数据进行全面挖掘分析,需要提出一套系统集成的技术方法来挖掘分析过程性的教师行为数据。
三、智慧课堂教师教学行为分析方法
智慧课堂应用规模不断扩大,掀起智慧教学研究热潮,并引发教学环境设计、教学活动个性化编排、教学管理科学决策等方面的变革,使这些过去靠拍脑袋或理念灵感加经验的工作,逐步变成一种数据支撑的行为科学。教学行为分析技术是对教学过程中产生的各种教学行为数据进行解读和分析,以评估教师教学开展情况并指导教师改进教学。
(一)智慧课堂教师教学行为数据采集与处理
精确的数据采集是数据挖掘的前提和基础。智慧课堂教学通常由一系列复杂的教学活动与环节组成,每个活动中生成的动态数据具有与情境紧密结合的特征,本文依托前期研究基础,从直接情境与间接情境两方面对智慧教学情境数据进行分类并筛选其具体指标,重点关注智慧教学活动中的强交互任务和任务执行场景。直接情境能够由终端或者其他手段直接获取。间接情境则主要为教与学活动情境,通过埋点方式进行采集。结合最常用的课堂教学行为分析编码系统,通过调研智慧课堂互动系统功能模块和相关研究基础,将智慧课堂间接教学情境采集数据分为课堂讲授、课堂测试、自主探究、小组协作、总结评价、反思提升6大教学活动模块。具体教育场景采集数据及其结构如表1所示。
(二)智慧课堂教师行为分析挖掘方法
面对智慧课堂教学环境所采集的动态情境数据,需借助交互可视化分析机制进行充分挖掘和应用,构建一套云端结合的数据分析挖掘方法。该方法的实现包括接口模块、预处理模块、分析模块、服务模块、可视化模块共五个模块完成。教师教学行为数据通过接口模块进入预处理模块,经预处理和标准化后进入分析模块,主要采用频繁模式挖掘和聚类算法进行分析,完成后的结果通过服务模块暴露给可视化模块进行交互显示。
1.频繁序列挖掘关键算法与流程
课堂行为序列是一组具有时间维度的活动组合,按照时间与逻辑上的先后顺序进行排列,其中每一个元素都是带有时间属性的活动,对应到某个具体教师就是教师课堂行为序列。智慧课堂中教师课堂行为序列是通过埋点采集的方式进行。序列模式挖掘是指从序列数据库中寻找频繁子序列作为模式的知识发现过程。通过序列模式挖掘算法发现教师的教学频繁序列,发现智慧课堂教师教学活动的极大频繁序列。
(1)数据采集与预处理方法
对确定的目标数据进行采集。由于智慧课堂的用户操作行为种类多且分散,本文将原始课堂行为序列按照6类间接教学情境分类,然后进行标准化,形成特征数据。数据预处理阶段需要对数据进行异常值处理以及简单的数据变换,主要对教师的无效操作数据进行剔除。例如:如果教师教学行为序列中某一活动的驻留时间小于N(0.5min)或者超过N(30min),则代表这不是教师所实施的有效活动,即教师可能在教学操作过程中出错或教师可能离开这个教学操作,需要将该操作从教师教学活动列表中剔除。
(2)数据挖掘算法设计
将MFSGrowth算法应用于极大频繁序列挖掘,算法的具体实现伪代码如图1所示。
2.基于教师教学活动数据的聚类分析实现
频繁序列挖掘给出了教师常用的智慧课堂教学序列,若想深入分析当前智慧课堂教学模式的发展特点,还需借助聚类分析方法找出具有相同教师行为属性的教师,从而形成不同阶段特征的教学共同体,以此帮助学校发现一批在教学方法运用、课堂结构编排、技术工具使用等方面都较为出众的优秀教师,为教育部有关部门制定面向不同教学方法特色的教师专业培训方案提供依据。此外,对于在智慧课堂中较难开展教学的教师来说,聚类分析方法能够对教师特征和行为进行监测与分析,有助于教师认识自己在开展智慧课堂教学过程中的优势和不足,进一步识别教师采用的智慧课堂教学模式特征,及时发现教学有待改进的方面并采取相应的措施来促进自身的专业发展。本文采用优化的K-Means聚类算法,具体实现方法如图2所示。
(1)数据处理
聚类分析的数据处理,首先对样本指标或参量值进行标准化处理。将原始课堂活动数据进行标准化形成特征数据。由于数据中存在一部分极大或者极小数据,采用离群点识别和剔除处理操作,离群点识别主要是基于四分位数箱行图,以6个教学活动为聚类属性,依次建立每个维度的四分位箱形图,从而将教师课堂活动数据中的离群数据(异常值)提取出来,并根据特征属性维护离群数据表,将相同类型的离群数据放人到一个新的聚类结果簇中;经过离群点识别和剔除处理后,对剩下的教师课堂活动数据利用优化的K-Means算法進行聚类分析。
(2)算法设计
聚类分析使用了两层聚类,第一层聚类主要使用DBScan聚类算法,基于教师的访问数据以及访问时间的相似度,对用户会话进行聚类,得到的结果为多个类集;第二层聚类则使用了K-Means聚类算法,在第一层聚类的结果上根据教师在每个类集中的使用比例对教师进行聚类,算法的具体实现伪代码如图3所示。
四、基于智慧课堂教师行为数据频繁序列挖掘和聚类分析的可视化实现
本文所分析的课堂数据源于珠海“粤教云”试验区所实施的“智慧课堂”项目,该项目在珠海市中小学校中基本实现常态化使用,数据覆盖范围包含54所学校,378个班级、419名教师用户数据、4269条课堂数据,其中每条课堂数据包含大量过程性行为数据与学业结果数据。本研究通过对智慧课堂中的课堂教学行为数据进行挖掘,试图通过可视化方式发现在智慧课堂环境下教师教学方法及模式的发展特点。
(一)智慧课堂教学行为序列挖掘的可视化实现
以珠海学校教师课堂行为序列为数据集,采用序列模式挖掘的方法,挖掘出较高频度教学路径,显示教师常用的教学课堂序列,从而发现智慧课堂的极大频繁序列。智慧课堂因其教学内容呈现便利、教学反馈及时、教学互动高效等技术特征,教师的教学活动与课堂教学结构也不同于传统课堂。Jacobson依据学生所获指导的不同,将课堂的结构划分为高结构化教学(教师满堂课都在讲授,即传统的满堂灌)和低结构化教学(教师把课堂交还给学生,让学生进行探究学习和项目学习,教师仅仅一个指导者的角色),并形成SPS(Sequencingof Pedagogical Structure)框架。本文在此基础上对教学结构序列框架(SPS)进一步完善,新增了时序特征,并参考教学方法、教学媒体结构对应的教师指导特征,结合研究的实际应用情况,对教学活动进行高低结构定义,即课堂讲授(H)、课堂测验(H)、自主学习(L)、小组协作(L)、总结评价(L)、反思提升(L),其中字母H代表高课堂结构、字母L表示低结构课堂,详细信息如表2所示。
1.频繁序列挖掘结果分析
为避免频繁序列的重复挖掘,定义如果某个频繁序列不是频繁序列集中其他任一频繁序列的子序列,则称该频繁序列为极大频繁序列。研究以珠海市语文学科教师数据为例,从数据库中抽取语文学科教师行为数据并过滤掉总体时间不足20Min的无意义和不完整的无效数据后,得到序列模式数据库D,采用MFSGrowth算法进行挖掘,最后选择在频繁度阈值为10%情况下挖掘到的频繁序列,得到38条极大频繁序列。此处列出了排名前7的极大频繁序列,如表3所示,并对各条频繁序列进行了深入解读。
挖掘出来的7条极大频繁序列,3条为高低型结构,2条为低高型结构以及2条低低型结构,智慧课堂的课堂结构未出现高高型以教师为中心的教学课堂结构,说明智慧课堂环境中开展的教学已不再是纯粹的高结构实施,这与文献的研究结论相吻合,更多呈现出以低结构教学为主、高结构教学为辅的教学设计趋向。目前教师在智慧课堂中使用最多的为“课堂讲授一小组协作”这一教学结构,属于H→L高低型的教学结构序列,表示该课堂在整个教学过程中同时运用高结构化教学方法和低结构化教学方法,在技术的支撑下,增加了低结构化教学方法的比重。而与其相反的L→H型结构序列是比较典型的低高结构教学,它注重解放学生,先让学生自己体验,教师再提供高结构化的指导,与教师直接进行讲授相比,L→H型结构更注重培养学生的高阶思维和问题解决的能力,这种课堂结构被认为是“主导一主体型”教学结构思想的最佳体现,有利于突破传统课堂的教学方法,给予学生极大的发挥空间,较容易取得良好的教学效果。H→L型和L→H型虽只是时序的不同,但这种差异却体现了不同的教学理念,会带来显著不同的学习效果。与此同时,挖掘结果中还发现L→L型结构序列,即凸显以学生为中心的低低型教学结构,课堂设计指向更高阶认知目标的内容,适用于语文综合性学习的探究课。新技术的使用极大地改变了教育过程的性质,现有的智慧课堂教学已基本摆脱了以单一课堂讲授为主的教学方式,更多采用多种教学方法交替组合的形式开展教学实践,教师在关注高结构课堂的同时,逐渐转向以实现生成性教学为目标的低结构课堂。
2.频繁序列挖掘结果验证
为进一步验证频繁序列挖掘算法的有效性,以珠海市某实验校8节语文课为例,通过对智慧课堂教学视频分析,详细了解智慧课堂的课堂结构及课堂教学目标达成情况。分析发现,语文学科教师课堂教学结构序列主要为H→L型结构(如表4所示),未出现H→H型结构,这一分析结果与频繁序列挖掘结果基本符合。总体表明智慧课堂教学在技术的支撑下,基本已摆脱教师满堂灌型教学方法,正朝着以学生为中心的方向发展,教师开始关注高低结构并重的教学方法,较好符合新课程改革提倡的教育理念。以现阶段的分析情况来看,智慧课堂教学环境的使用仍有较大提升的空间,目前的课堂形态仍然是一种知识控制下的线性关系,即学生的学习更多是教师主导下的线性学习,学生在课堂中的主体地体并未较好体现。参考这一频繁序列挖掘结果,可有效辅助教师快速刻画课堂教学结构全貌,为其改进完善智慧课堂教学结构设计提供更科学化的参考。
(二)智慧课堂教学活动数据聚类分析的可视化实现
智慧课堂作为现代信息技术与教育相融合的产物,适当且有效地运用现代信息技术能够促进教育的个性化发展,促进教育新模式的产生。通过相关文献调研发现,当前智慧课堂发展呈现出阶段性特征,根据智慧课堂智能化技术与智慧化教学的特征,提出智慧课堂教学模式的三个阶段特征,改进型、交互型和理想型,具体发展阶段特征如图4所示。可以发现三类教学模式的判定依据均与技术和教学紧密联系,这为本研究聚类分析得出的教师教学规律和教学方法特点的比较分析提供参照标准,下面研究将分析试验校教师聚类结果反映出的智慧课堂教学模式发展阶段,为推进智慧课堂教学实践的有效应用提供参考。
1.基于优化的K-Means算法的可视化分析
研究以珠海市初中语文学科教师的教学活动数据为数据集,采用聚类分析的方法,挖掘智慧课堂教师的教学模式。以课堂讲授、课堂测试、自主探究、小组协作、总结评价、反思提升为特征属性,经过传统K-Means、DBScan、优化k-Means多次聚类算法核对,发现选择优化的K-Means算法效果更佳。由于不同学科教师的智慧课堂教学行为可能有所差异,所以通常筛选同一学科教师进行聚类分析。本文选取珠海市初中语文学科30位教师478节课的智慧课堂数据进行教学模式可视化实现,结果如图5所示,其中8位教师属于改进型,18位教师属于交互型,4位教师属于理想型,体现了健康持续的智慧课堂教学模式发展态势。
2.聚类结果的验证
为验证聚类结果的准确性,结合文献调研、问卷调查和教师訪谈的相关内容,本文制定了一个优秀教师评定框架,对教师的职称、论文、课例、公开课、教学设计等其他优秀成果进行综合评价,由此判断聚类结果与教师优秀情况是否具有关联。优秀教师评定框架分别对三种类型的智慧课堂教学模式进行了特征分解,并设定相应分值:改进型综合评价得分范围为0-15分,交互型为16-25分,超过25分即达到理想型阶段。通过对上述30位初中语文教师智慧课堂教学优秀成果的评分,将聚类分析结果和实际评价结果进行一一比较,以三种教学模式类型聚类结果准确率的平均数,表征聚类分析方法的整体性能。结果显示,改进型的准确率为77.78%,交互型、智慧型各为85%和80%,聚类计算得到的平均准确率达到80.93%,详情如下页表5所示,发现语文学科教师的挖掘结果与实际评价结果基本吻合,表明该聚类方法的整体性能较为良好。
研究同时发现不区分学科的教师聚类得出的结果与教师实际评价相差甚远,例如以珠海市香洲区的1050条课堂数据为数据集进行聚类分析,可得到平均准确率为75.2%,但如果将筛选条件精确到具体学科,聚类的准确程度得到了较大幅度的提升。初步考虑是因为不同学科的教学标准对教师的要求有所不同,例如,理科教师在智慧课堂进行教学时会有较多的小组探究、问题思考行为,而文科教师在这方面表现出比较弱的水平。总体来说,智慧课堂教学活动数据聚类分析方法与实际教学情况表现出较明显的一致性,分析方法具有一定的有效性。
五、结语
随着技术支持下教学环境的不断改进与发展,教育教学模式也在持续更新融合。本文通过对智慧课堂环境下教师的教学行为进行分析,提出了基于教师行为数据的频繁序列挖掘和聚类分析方法,并结合教学应用实践验证了分析方法的有效性,取得了一定效果,分析发现智慧课堂不仅是教与学环境的改进,更是对课堂教学结构、教学模式等方面产生了深入影响,逐步走向以学生为中心的课堂教学结构。基于大数据的学习分析一直以来都是教育信息化2.0时代研究的热点与难点问题之一,本文选取了教师专业发展的角度,提出了基于智慧课堂的教师行为数据挖掘分析方法和应用案例,通过数据解构智慧课堂,期待能为教师智慧教学能力的发展提供一些数据支撑,为促进智慧课堂的教师专业发展提供研究的新思路和新方法。