刘邦奇 李 鑫
(1.首都师范大学 教育学院,北京 100048;2.讯飞教育 信息化研究院,安徽合肥 230088;3.科大讯飞 大数据研究院,安徽合肥 230088)
教育大数据分析是当前学界关注的热点问题。人们普遍认为,教育大数据具有重要的应用价值,但如何把教育大数据的大价值发挥出来、利用大数据驱动教育变革并非易事[1]。事实上,在教育大数据分析的实际应用中还有许多难题亟待解决,技术运用方面也存在许多局限性,客观上制约了教育大数据挖掘分析的推广应用[2]。
文献分析表明[3],目前教育大数据研究领域的热点主要有 “大数据时代”“学习分析与技术”“数据挖掘”“慕课”“教育教学改革”等。例如,随着互联网和通信技术的进步,在线教育平台飞速发展,面向在线教育分析的大数据技术和应用,也受到越来越多学者的关注,在众多的教育平台,中最具有代表性的就是慕课(Massive Open Online Course,MOOC)。Mi Fei和Faltings[4]通过对MOOC平台论坛的研究,使用上下文树的方法解决了序列预测问题,从而给学生推荐有用的信息。Stewart等[5]对感知学习技术进行了分析和应用,他们通过监督学习的方法,收集学生看书和看视频时的面部表情数据和身体运动特征,并进行了分析。Hutt等[6]收集学生学习时的眼动数据并提取特征,并利用贝叶斯网络模型,研究了学生学习时心不在焉的情况。也有一些学者通过对校园课堂数据的收集,进行相应的教育大数据分析,例如,Liu和Koedinger[7]收集了10个班共196个学生的学习数据,利用个性化附加因子模型 (Individualized-slope Additive Factors Model,iAFM)和个性化贝叶斯知识跟踪模型 (Individualized Bayesian Knowledge Tracing,iBKT),研究了学生能力以及学生的学习率等。
目前,对教育大数据的研究与应用面临着的主要困境有以下几方面:一是在研究对象的聚焦上,是研究教育中的大数据还是研究大数据背景下的教育问题。研究目标不明确、思路不清晰,往往停留在教育大数据的概念、理念层面上,对教育大数据的应用和解决教育中的实际问题聚焦不够,即便是应用方面的研究,也以教育质量监测、教育宏观决策等层面的研究为主[8];二是在教育数据的采集上,大多采取填报式的采集方式,例如,教师需要通过填写学生的社会实践情况、体测情况以及一些涉及学生道德情操等方面的数据,用于学生综合素质的评价。在这种数据采集方式下,无论师生采用纸质或是信息化设备进行填报,用户的主要行为都是为了上报数据而非实际教学,这难以实现教育大数据采集的实时性和常态化;三是在教育数据的建模分析上,目前主要集中在理论模型的建立及质性分析上,缺乏对教育教学过程和教与学行为的具体分析和模型构建,即基于真实数据建立数学模型和进行挖掘分析的研究较为少见;四是在教育数据的价值挖掘上,大多偏重于数据自身的分析,缺乏对教育价值分析的回归。教育大数据分析涉及多个交叉学科领域[9],包括以教育理论、学习理论为主的教育科学,以大数据和人工智能技术为主的计算机科学,除此之外,还有社会学、心理学、语言学等多个学科,任何单一的研究视角或方法,都难以有效发挥教育大数据的价值。
针对上述问题我们可以看到,在教育大数据挖掘分析与应用中,聚焦于某个专业应用领域,紧扣教育教学中的具体问题,采集基于实际使用的真实数据,来构建模型和进行处理分析是十分必要的。基于这一考虑,本研究聚焦信息化条件下的课堂教学领域,依据智慧课堂的常态化应用和真实性数据,围绕智慧课堂教与学关系、教学策略等问题,对基于智慧课堂的教育大数据分析进行应用性研究,以期得出有价值的结论。本研究实际上是对教育大数据分析的一种落地应用研究。
第一,明确的目标指向——研究问题的落地。从概念、理念的研究转向应用层面的研究,从宏观层面的应用转向微观领域的应用,从教育中的数据研究转向基于数据的教育教学问题研究。为此,从教育决策、教育质量监测等宏观层面的教育大数据分析应用,向学校教学、学习等微观层面的具体应用发展,利用数据挖掘算法与学习分析技术,对课堂教学和学习数据进行系统性探究,从而为技术支持的教与学创新应用,提供重要的建议和支持。
第二,多维度建模挖掘——研究方法的落地。采取伴随式方式静默地采集数据,即师生正常使用信息化工具进行教与学的过程不会被打断,数据是伴随着师生的使用自动、实时地被记录下来。结合智慧课堂围绕教与学互动、教学策略改进等进行数据挖掘分析的实际需要,建立平台支持的师生教学互动模型,采取基于学习者行为建模、基于学习内容和结果建模等方式,多视角、多维度地进行设计,采用多元回归分析、分类聚类、关联规则挖掘、文本分析、图挖掘、深度学习等技术和算法,进行挖掘分析。
第三,紧扣应用的分析——研究价值的落地。智慧课堂教育大数据分析的应用,应紧紧围绕教与学的需要、体现在为教与学的服务方面,例如,基于课堂学生学习行为数据、师生互动交流数据,对教学过程、教学质量进行评价反馈;基于作业评测与考试数据,判断学生的学情、预测学生的学业成绩;基于班级空间和学习社区数据进行校园舆情监控;基于学生的兴趣与特长数据为学生制定学习和生涯发展规划等,以发挥课堂数据挖掘分析的实际应用价值。
按照上述研究思路,基于智慧课堂教育大数据的应用研究,在探索性和实践性方面意义凸显:一方面,开拓了教育大数据分析新的研究视角,将信息化课堂教学作为教育大数据挖掘分析的具体研究领域,构建系统的建模与分析框架,形成智慧课堂大数据分析模型与方法;另一方面,紧扣课堂教学应用的数据挖掘和学习分析,也为教与学的优化提供数据支撑,实现了基于数据的教育。
对课堂教学过程中大数据分析应用的关注点,主要集中在课堂的教学、学习和管理三个层面。在课堂教的层面,基于智慧教学环境开展翻转课堂[10]、微课[11]、慕课[12]等新型教学模式,使师生互动的行为数据得以记录下来,结合学习评价反馈信息,教师可以“以学定教”,优化教学设计、改进教学策略,以达到“因材施教”的目的。在学生学的层面,大数据记录了学生学习过程中使用的学习资源、学习路径、学习时间、学习环境以及互动数据,这些数据客观真实地描述了学生的学习规律与认知情况。对于不同的学生来说,可以有针对性地选择学习内容、制定学习计划以及规划学习路径,使“个性化学习”的诉求在大数据条件下得以满足。在教学管理层面,教育大数据涵盖了教师与学生多个维度的信息,有助于对教与学进行全面、客观、动态、直观的评价,通过基于课堂大数据进行精准的决策分析,以提升教学管理的效率和科学化水平。
课堂教学是学校教育中一种最基本、最普遍的教学形式,是学校培养人才的主阵地、主渠道。随着云计算、大数据、人工智能等新一代信息技术与学科教学的融合不断深入,智慧课堂的概念和教学模式应运而生。智慧课堂作为课堂教学的创新形式,承载了信息化教学的主要职责,逐渐成为大数据背景下智慧教育(Smart Education)的核心应用[13]。
在智慧课堂教学中,产生了大量的过程数据、行为数据,基于这些数据的挖掘分析,对于精准掌握学情和教学效果,开展学习影响因素分析,进而采取有针对性的教学改进策略,具有重要的支撑作用。例如,学生接受知识与否,可以通过阶段性的学业测试数据进行度量,而学生的学习行为数据则在智慧课堂的使用过程中得以记录,这使得研究基于课堂大数据分析学习过程中的潜在因素对学业成绩的影响成为可能。因此,智慧课堂作为教育大数据,密集分布和采集、汇聚的“富矿”,无疑是当前学校教育大数据挖掘分析的重点研究对象。
对于智慧课堂概念的理解目前有多种,我们在系统梳理现有概念的基础上,提出了一个较为科学的定义[14],即以建构主义学习理论为依据,利用大数据、云计算和移动互联网等新一代信息技术打造的,实现课前、课中、课后全过程应用的智能、高效的课堂。其实质是基于动态学习数据分析和“云、网、端”的运用,实现教学决策数据化、评价反馈即时化、交流互动立体化、资源推送智能化、教学呈现可视化、科学实验数字化,从而创设有利于协作交流和意义建构的学习环境,通过智慧高效的教与学,促进全体学生的智慧发展[15]。
智慧课堂的教育大数据分析,是对智慧课堂教学中所产生的教育大数据,进行数据挖掘和学习分析的方法与过程。目前,智慧课堂在部分中小学校得到应用,在智慧课堂的全过程、常态化应用中所产生的数据,构成了包括教师、学生、管理者在内,涵盖课前、课中、课后教学全过程的多个环节的多维教育大数据。这些大数据描述了教与学行为和活动过程的状况,反映了教学系统运行的状态、结果情况,为分析和改进教育教学过程,提供了全面的数据基础。
开展智慧课堂大数据分析,就是基于智慧课堂全过程、全方位的多维大数据,利用教育数据挖掘和学习分析技术进行处理、分析和建模,可帮助我们深入理解课堂教学数据所蕴含的价值,做出基于数据的教学决策,从而为开展学情分析、把握学生的学习行为、改进教师教学和优化学习过程提供数据支撑,真正实现基于数据的教育。
教学互动是智慧课堂的核心标志,在智慧课堂的信息化环境下,师生用户通过更有效的教学互动,促进师生之间、生生之间的沟通、交流,创设有利于协作交流的学习环境,来帮助学习者建构知识意义。因此,在智慧课堂产生的教育大数据体系中,师生用户的教学互动行为数据是核心数据。对智慧课堂教育大数据的挖掘分析,既要着眼于对智慧课堂全方位、多维度数据及应用需求的整体设计、建模分析,又要突出重点,聚焦关键性问题,围绕教学互动行为数据,来展开实证性研究。
1.智慧课堂用户“STM三角模型”
智慧课堂用户有两个行为角色,一个是学习者(Student),另一个是教师(Teacher)。 除此之外,学习者围绕学习资源、内容、平台等媒介(Media),在一定的学习环境下进行互动,完成学习与教学的行为和活动。用于分析的数据来源于互动行为,为了更加清晰地分析智慧课堂中产生、收集和汇聚的数据,我们可以借助图1所示的“STM三角模型”,来描述智慧课堂的用户及其教学行为数据关系。
图1 智慧课堂用户“STM三角模型”
在智慧课堂用户“STM三角模型”中,三个顶点与若干条边表示模型的结构关系。三个顶点分别是学习者(S)、教师(T)与资源、内容、平台等媒介(M)。三角模型中顶点与顶点之间的边的关系,表示了人与人、人与媒介的互动行为。
2.教学互动行为及数据关系
智慧课堂师生用户在教学中的互动行为,产生了能够用于分析的数据,这些数据根据互动的关系,大致可以分为以下五种类型:
(1)教师与媒介互动:教师利用资源平台调取云端的学习内容,如,微课视频、试题库以及资讯类文章等,或者在授课场景下讲解学习内容,以及通过平台主动将媒介资源推送给教师。
(2)学生与媒介互动:学生通过智慧课堂平台浏览各种学习资源并与之互动,如,浏览、点评微课,提交作业,发布、分享、收藏资讯等。除此之外,还有平台根据用户的个性化信息,为学生推送定制化的学习资源内容。
(3)教师对学生互动:是由教师主动发起的对学生的互动,师生的互动存在于课上与课下,在课上教师通过发布课堂提问与学生互动,课下则表现为给学生布置作业,为学生答疑,批改学生作业。
(4)学生对教师互动:是由学生主动发起的对教师的互动,如,学生在课上利用智慧课堂设备反馈教师的提问,课下通过在线平台向教师提问、完成教师的作业等互动行为。
(5)学生与学生互动:学生间也存在各种互动关系,如,智慧课堂应用允许学生间相互批改作业、相互评价,也允许学生在自己录制的微课视频中和同学进行分享与讨论。
3.教学互动行为数据分类
智慧课堂中的教学互动行为数据,既采集于课上的课堂互动部分,也来自于课外的作业平台部分,从数据的特点来分析,我们可以根据数据的流向、私密程度、频率以及行为发生时机对数据进行分类。
(1)按数据流向分:数据的流向分为“一对一”与“一对多”两种类型,老师在作业平台上针对个别学生的答疑是一种“一对一”的信息流向;而当老师针对班级进行作业布置或者微课视频发布时,这种信息流向变成了“一对多”的模式。
(2)按数据私密程度分:从私密性的角度来说,可以分为公开信息与私密信息。如,微课视频、作业、咨询类的公告等都是公开的信息,而私信与答疑则是相对私密和封闭的信息,这种信息的分享只存在于两个人之间。
(3)按数据行为发生频次分:不同的行为发生的频次不同,因而使得数据之间的稠密程度不同,行为发生频率高的更容易积累数据,如,教师给学生布置并批改作业的行为、学生观看微课视频的行为等。相对发生频率低的行为有分享、收藏资讯类公告等。
(4)按照数据来源行为发生的时机:可以分为课前、课中与课后三个环节。在课前环节,主要是在教师的备课过程中,教师录制微课视频,并向学生布置相应的预习作业,这些均贡献了数据;在课中环节,数据主要包括教师在课堂上与学生进行互动提问或者讲解教案与习题;在课后环节,主要采集学生对课堂的“脚投票”数据,例如,作业的完成情况,观看微课视频,分享收藏资讯的行为等。
教育数据挖掘分析作为从数据中发现知识的有效技术手段,目的是从海量的教育大数据中挖掘出具有教育价值的信息与知识。然而,在具体进行教育数据挖掘的时候,不同的应用场景、不同的应用需求,却适用不同的方法和路径。因此,需要结合智慧课堂数据挖掘分析的实际需要,多视角、多维度地进行考量和设计,形成科学的思路和方案。从总体上来说,应基于三个维度来分析和设计:
一是通过数据挖掘寻找联系。基于统计学的视角,对各个相互耦合的因素进行整体分析,即使用统计学中的相关性计算等方法,以及统计检验等手段,找出数据集之间的相关关系,并基于此对趋势进行预测。例如,利用回归等方法找出各项学习行为与学业成果之间的关系。
二是通过数据挖掘找出信息。基于计算机科学的视角,综合利用诸如分类、聚类、时序分析、文本挖掘等技术,从海量数据中抽取和挖掘出有价值的信息。例如,利用聚类算法找出学生中具有相似学习特征的一类学生,进行学伴的发现等。
三是通过数据挖掘解决问题。基于专业应用的视角,针对专业领域的特定应用问题,利用数据挖掘作为工具以解决特定问题。例如,针对学习领域来说,利用数据挖掘技术,旨在实现“判断学习者学习状态、评价学习者表现以及给予个性化反馈与指导等”应用目标[16]。
我们按照上述基本思路,针对智慧课堂中海量教学行为数据进行具体的建模与分析,从而发挥课堂教学大数据的价值。2012年,美国教育部发布的《通过教育数据挖掘和学习分析促进教与学》报告中[17],系统分析了当前在各类教育领域应用的数据建模和分析方法。建模与分析,实际上是教育数据挖掘应用的两种基本方式,建模是针对历史的数据进行刻画,分析则是利用模型对现状和未来进行理解与预测。目前,国内也有许多学者对教育领域中的具体建模与分析方法进行了研究。
基于已有研究成果来进一步分析,我们可以从学习者行为建模与分析以及学习内容和结果两个方面,来进行智慧课堂数据的价值建模:(1)基于学习者行为建模与分析,亦称为“3+1”模式。即从学习者行为建模与分析的角度进行价值建模,是一种归纳的方式。“3+1”模式通过学生的知识建模、行为建模、经历建模对用户进行画像与分析;(2)基于学习内容和结果建模与分析,亦称为“1+3”模式。即从学习内容和结果的角度进行价值建模,是一种演绎的模式。“1+3”模式透过对领域进行建模,从而进行组件分析、趋势分析以及自适应和个性化分析。
我们通过上述两个方面进行建模与分析,形成了智慧课堂数据建模与分析的整体框架,具体见表1。
表1 智慧课堂数据建模与分析的整体框架
在大数据分析中,应用数据挖掘技术有一套标准的流程,称为CRISP-DM(Cross-Industry Standard Process for Data Mining,即跨行业数据挖掘标准流程)[18]。该流程于1999年由欧盟机构联合起草完成,其包含了商业理解、数据理解、数据准备、建模、评估以及部署共计六个步骤。对于不同的行业和不同的分析问题,该流程存在一定的差异。我们根据智慧课堂数据挖掘的需求和应用特点,提出了目标理解、数据清洗、数据分析、数据展现等基本步骤 (详见表2)。在以下流程和方法的应用举例中,本文均以“探究学业影响因素”这一数据挖掘目标为例。
表2 智慧课堂数据挖掘的流程
我们认为,在教育数据挖掘任务中,甚至是在学习分析过程中,以上四个步骤都是必不可少的。遵循这样的标准步骤,可以使得挖掘任务更加明确,过程更加清晰,结论更加直观。
教育数据挖掘技术和方法种类繁多,一般来说,在教育领域以及学习分析中,较为常用的有多元回归分析、分类、聚类、关联规则挖掘、图挖掘技术等[19]。本研究基于智慧课堂教育大数据分析的需要,梳理了智慧课堂数据挖掘的常用算法与技术及应用场景,具体见表3。
除了上述常用的算法与技术,目前人们已经开始在教育领域以及学习分析中,探索应用深度学习、知识图谱等一些最新的大数据分析技术与算法。
(1)深度学习(Deep Learning):深度学习是大数据和人工智能领域的一项新技术,其通过神经网络(Neural Network)进行多层的特征变换,可以获得对
表3 智慧课堂数据挖掘常用技术及应用场景
输入数据的深层次表达,深度学习在图像识别[20]、语音识别[21]等领域有广泛的应用。基于深度学习的大数据技术同样能应用于教育领域,比如,深度学习技术可以应用于学习情况追踪[22]、智能助教、智能阅卷等方面,有助于掌握学生的学习情况、减少教师的重复性工作,并给学生及时而准确的反馈。
(2)知识图谱:知识图谱是把应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法,与计量学引文分析、共现分析等方法结合,用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构的多学科融合的一种研究方法[23]。知识图谱在教育方面也有着广泛的应用,不仅能帮助学生建立较为完整的知识体系,而且有助于教师迅速发现学生的学习薄弱点,进行有针对性的授课和答疑,从而提升教学质量。
智慧课堂数据挖掘分析是一项十分复杂的系统工程,涉及海量数据、复杂算法及多种应用,我们已经基于实际应用数据形成了完整的研究报告,因篇幅限制,这里仅以智慧课堂师生互动指数分析为例,来描述一类典型的数据挖掘分析应用场景。
本研究所使用的真实数据,来源于当前中小学使用较广的“科大讯飞”的旗舰产品“智慧课堂”,该产品已形成了理论定义、系统组成、教学模式、应用案例的完整体系[24]。它在安徽某重点中学2014级学生群体中常态化使用,涉及35个教学班共计1973名学生,98位教师。由于该年级使用智慧课堂产品两年有余,积累了大量的过程行为数据与学业结果数据,为本研究数据分析提供了大数据的支撑。出于隐私安全考虑,在进行数据分析时,采用学生匿名编码以保护学生隐私。
师生互动是课堂互动的核心,是智慧课堂教学区别于传统教学的重要标志。增强学生与教师的互动,有助于提升学生对学习的投入程度、提高学习积极性。基于智慧课堂教学行为数据挖掘,对师生互动指数进行分析研究,能够全面客观地展现教师与学生的互动情况,从而为设计和改进课堂教学互动提供基本依据。
师生互动指数分析的基本框架在于:通过针对学生和教师在智慧课堂平台产生的行为数据进行分析,建立师生互动的评价指标,并运用因子分析法计算出互动指标体系的权重;然后,基于互动指标体系及权重模型,运用学生和教师在智课平台的实际行为数据,计算出教师与学生的互动指数;对师生互动指数分布进行可视化展示,并提出相关应用建议。
其中,互动指数评价指标计算采用因子分析法[25-27],即运用统计分析方法,基于大量样本数据的采集来确定各层评价指标的权重。该方法的基本思想就是降维,即用少量的综合指标来替代多个可观测变量,所得到的综合指标(即主因子)是原来指标的线性组合。互动指数评价指标体系及权重构建总体框架,具体见图2。
图2 互动指数评价指标体系及权重构建总体框架图
指标的确立是整个指标体系构建的基础,为了全面客观地展现教师与学生的互动情况,在选取指标时,我们遵循了实用性、发展性、全面性、可行性等原则[28]。据此,通过分析智课平台上学生和教师的行为数据,最终选取了16个教师与学生的互动指标,具体包括:老师上传微课数,平均每个微课被观看次数,平均每个微课观看人数,学生对老师微课的平均评级,平均每个微课被收藏次数,平均每个微课被点赞次数,学生根回复老师微课数,学生非根回复老师微课数,老师发布的通知数,回复通知的学生数,平均每个通知回复次数,老师发送私信数,老师接收私信数,老师被关注次数,老师发送作业数,平均每次作业提交数。
其中,根回复与非根回复指的是这样的场景,当学生在老师发布的微课页面中对微课进行评论,称之为根回复,表现的是老师与学生的互动。当此后其他学生在此微课页面中回复前面学生的留言时则称之为非根回复,其更多反映的是学生与学生之间的互动关系。
上述16个行为指标能在不同方面体现出教师与学生的互动关系,如果直接对这些行为指标进行分析会过于复杂,由于因子分析可以将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,是多元统计中处理降维的一种统计方法。故本研究首先采用因子分析法,将这些指标降维形成综合指标,进而确定每个指标在师生互动指数分析体系中的权重,共分为以下五个步骤(因篇幅所限,这里简要介绍主要步骤和结果):
1.因子分析适用性检验
在因子分析之前,需要对数据进行检验,以确认是否16个数据指标均可采用因子分析的方法进行分析。基于上述数据进行KMO和Bartlett检验[29],得出本数据集适合做因子分析。
2.基于主成分分析的因子提取
运用社会学统计软件SPSS进行因子分析,对原始16个变量采取主成分分析和正交旋转,基于主成分分析的因子提取结果,具体见表4。
表4 基于主成分分析的因子提取
采用统计学中的Kaiser标准提取因子[30],可提取出上述5个因子作为原有16个变量的主因子。5个因子的累计贡献率达到了81.903%,意味着通过这5个主因子,可以反映原有16个初始变量81.903%的信息量,表明该研究具有较高的构建效率。
3.因子载荷矩阵的构建
初始提取的公共因子,并不能得出每个因子所包含的具体指标,从而无法归纳出每个因子的具体含义,故需要对初始的因子载荷矩阵进行旋转,旋转之后的因子载荷矩阵结构更加简化,各个因子所反映的变量信息更加清晰,便于对每个因子进行解释。可根据每个指标在各个因子上的载荷权重,尝试将5个因子分别命名为 “微课行为因子”、“师生互动因子”、“微课回复和作业布置因子”、“微课上传和教师关注因子”以及“微课评价因子”。
4.因子得分矩阵的构建
因子分析所选取的因子,能够反映原始变量之间的相关关系,用因子代表原始变量时,更有利于描述原始变量的特征,因此,需要将因子表示为变量的线性组合,其系数估计即因子得分矩阵。根据因子得分矩阵的输出结果,可以将每个因子表示为原始变量的线性组合。通过将各因子变量的因子得分系数进行归一化处理,可以得到各因子变量包含的指标在各因子上的权重。
5.指标权重的计算
根据该因子分析结果,建立起学生对老师满意度指标体系三级分层结构:一级指标层是目标层,即为评估师生互动指数的目标(y);二级指标层是准则层,即通过数据分析得出的5个主要因子(Fi);三级指标层是措施层,即每个主要因子所包含的具体指标行为(xi)。
在具体评价指标权重的确定过程中,需要考虑二级指标在一级指标上的权重、三级指标在二级指标上的权重和三级指标在一级指标上的权重。
在研究中,二级指标层为运用因子分析法提取出的5个主因子。在统计分析中,“贡献率”表达的含义就是主因子对目标的贡献程度,所以,可以将各主因子相对于一级指标层的贡献率作为二级指标层在一级指标层上的权重。本研究对主因子的贡献率进行了归一化处理,结果即为二级指标在一级指标上的权重,第i个主因子在一级指标上的权重记为Wi。
三级指标是各主因子所包含的具体行为指标。根据因子分析法的基本原理,因子得分系数矩阵是可以将主因子表示为其所包含的各个行为指标的线性组合,从而可以建立主因子与所包含的行为指标的回归方程。其中,回归系数即为因子得分系数,表示自变量的变化对因变量的影响程度,将其进行归一化处理,就可以得到三级指标在二级指标上的权重,行为指标j在主因子i上的权重记为Wij。
通过二级指标在一级指标上的权重以及其所包括的三级指标在该主因子上的权重的乘积,可以确定三级指标在一级指标上的权重,行为指标j在一级指标上的权重为 Wi×Wij。
基于以上因子分析的结果,可以确定教师与学生互动指标体系的权重,具体见表5。
利用上述教师与学生互动指标体系的权重,可以通过(1)式计算出每个教师与学生的互动指数,其中n为行为指标的个数。
表5 教师与学生互动指标权重
计算出教师与学生的互动指数之后,将其归一化在0-100之间,图3显示了某省会城市某重点中学的2014级98位教师与1973名学生的互动指数分布情况。
图3 教师与学生互动指数柱状图
从图3可以看出,教师与学生互动指数服从“L”型分布,只有少部分教师与学生的互动指数高于40,而大部分教师与学生的互动指数低于20。
根据教师与学生互动指数的分位数,来对所得到的指数进行分组,这里采用四分位数进行分类,教师与学生互动指数的分位数见表6。
表6 教师与学生互动指数分位数
我们将教师与学生的互动程度分为三类:低、中、高。教师与学生互动指数小于1/4分位数,即小于6.141的记为互动程度低;大于1/4分位数小于3/4分位数,即大于6.141小于14.171的记为互动程度中;大于3/4分位数,即大于14.171的记为互动程度高。教师与学生的平均分组互动程度柱状图,如图4所示。
图4 教师与学生平均分组互动程度
从图4可以看出,高互动程度分组中互动指数,均值为30.722,中互动程度分组中互动指数均值为8.874,低互动程度分组中互动指数均值为4.299。
本研究中教师与学生的互动指数,是基于学生和教师在智课平台学习和教学行为的实际数据得出的。从探究教师与学生的互动指数出发,基于实用性、发展性、全面性和可行性原则,利用统计学中因子分析法、主成分分析法,通过指标的选取以及相应指标权重的确定,建立了合理的教师与学生互动指数。
“师生互动”不是一种具体的教学行为,而是与讲授式教学、探究性教学或对话教学等共存的一种教学类型,包含了认知成分、情感成分和行为成分[31]。在我国的传统教学模式中,教师有计划地将学科知识传授给学生,学生被动响应教师,构成一系列行为。从表面看,课堂氛围非常活跃,但实质上是属于以教师的教和掌握学科知识为中心的“传统教学论”范式,这种教学模式束缚了学生的创新能力和想象力。在智慧课堂教学中,可以基于智慧课堂信息化平台,通过提升师生互动来打破传统的教学模式,并对师生互动行为进行分析,可以计算师生互动指数并对教师进行评价。
基于以上研究,我们发现,教师与学生互动指数服从“L”型分布。即通过对比原始指标和构建的互动指数发现:在一般情况下,上传微课次数越多并且上传微课的质量越高的教师与学生的互动指数越高。从总体来看,教师与学生的互动指数小于10的占到了总人数的59%,大于30的只占了9%,平均互动指数只有13.28。通过统计老师行为指标,发现平均每个老师上传的微课数只有13个,平均每个微课被观看次数只有8次,平均每个教师发送的通知和私信数分别为7个和14个,说明教师使用智课平台上传微课数、与学生的互动数都较少。因此,教师需要通过上传和分享高质量的微课,并不断改善在线教学的方式,来提高与学生的互动。
当前,对教育大数据的研究正从概念、理念层面走向建模分析与应用层面,而应用层面的研究也从教育质量监测统计、教育决策等宏观层面向学校教学、学生学习等微观层面深入发展。学校信息化聚焦于教与学活动,智慧课堂正成为人们日益关注的焦点。利用教育数据的挖掘分析,可为受教育者量身定制学习目标、计划、方案、资源,有助于实现“因材施教”,为个性化智慧发展提供技术支撑。随着大数据分析、人工智能等新技术与教育教学的融合不断深化,基于技术实现课堂教学结构的重大变革成为可能,“课堂革命”成为新时代的必然选择。
[参考文献]
[1]孟志远,卢潇,胡凡刚.大数据驱动教育变革的理论路径与应用思考[J].远程教育杂志,2017(2):9-18.
[2]胡水星.大数据及其关键技术的教育应用实证分析[J].远程教育杂志,2015(5):46-53.
[3]杨现民,田雪松.互联网+教育:中国基础教育大数据[M].北京:电子工业出版社,2016.
[4]Mi Fei,Faltings B.Adaptive Sequential Recommendation for Discussion Forums on MOOCs using Context Trees[EB/OL].[2018-01-10].http://educationaldatamining.org/EDM2017/proc_files/papers/paper_25.pdf.
[5]Stewart A, Bosch N, D’Mello S K.Generalizability of Face-Based Mind Wandering Detection Across Task Contexts[EB/OL].[2018-01-10].http://educationaldatamining.org/EDM2017/proc_files/papers/paper_74.pdf.
[6]Hutt S, Hardey J, Bixler R, et al.Gaze-based Detection of Mind Wandering during Lecture Viewing[EB/OL].[2018-01-10].http://educationaldatamining.org/EDM2017/proc_files/papers/paper_64.pdf.
[7]Liu R,Koedinger K R.Towards Reliable and Valid Measurement of Individualized Student Parameters[EB/OL].[2018-01-10].http://edu-cationaldatamining.org/EDM2017/proc_files/papers/paper_137.pdf.
[8]杨现民,王榴卉,唐斯斯.教育大数据的应用模式与政策建议[J].电化教育研究,2015(9):54-61.
[9]孙洪涛,郑勤华.教育大数据的核心技术、应用现状与发展趋势[J].远程教育杂志,2016(5):41-49.
[10]周丹,陈丽婷.大数据时代背景下基于翻转课堂的教学改革研究[J].教育与职业,2015(33):90-92.
[11]杨永林,张世蓉,丁韬等.从“慕课”到“小微课”,看大数据在教学中的应用[J].现代教育技术,2014(12):45-51.
[12]李曼丽,黄振中.MOOCs平台大数据的教育实证[J].科学通报,2015(5):570-580.
[13]刘军.智慧课堂:“互联网+”时代未来学校课堂发展新路向[J].中国电化教育,2017(7):14-19.
[14]刘邦奇.当智慧课堂遇到大数据[J].中国教育网络,2015(7):65-67.
[15]刘邦奇.“互联网+”时代智慧课堂教学设计与实施策略研究[J].中国电化教育,2016(10):51-56.
[16]牛瑞敏.数据挖掘在国内教育领域应用的研究综述[J].中山大学研究生学刊:社会科学版,2016(2):193-200.
[17]徐鹏,王以宁,刘艳华等.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013(6):11-17.
[18]李艳华,李施,赵慧琼.教育大数据价值的分析与挖掘研究[J].软件导刊(教育技术),2017(2):43-44.
[19]吴青,罗儒国.学习分析:从源起到实践与研究[J].开放教育研究,2015(1):71-79.
[20]Russakovsky O,Deng J,Su H,et al.ImageNet Large Scale Visual Recognition Challenge[J].International Journal of Computer Vision,2015(3): 211-252.
[21]Dahl G E,Yu D,Deng L,et al.Context-dependent Pre-trained Deep Neural Networks for Large-vocabulary Speech Recognition[J].IEEE Transactions on Audio,Speech,and Language Processing,2012(1): 30-42.
[22]Piech C,Bassen J,Huang J, et al.Deep Knowledge Tracing[C]//Advances in Neural Information Processing Systems,2015: 505-513.
[23]陈池,王宇鹏,李超等.面向在线教育领域的大数据研究及应用[J].计算机研究与发展,2014(s1):67-74.
[24]面向教育领域的大数据发展[EB/OL].[2017-12-12].http://www.jevictek.com/www/home/category/llyj.
[25][29]辛督强,韩国秀.因子分析法在科技期刊综合评价中的应用[J].数理统计与管理,2014(1):116-121.
[26]田水承,薛明月,李广利等.基于因子分析法的矿工不安全行为影响因素权重确定[J].矿业安全与环保,2013(5):113-116.
[27]刘彬.基于因子分析法的绿色供应商评价指标权重的确定[J].中国商论,2011(25):101-102.
[28]刘亚瑜.中小学教师教学专业化评价指标体系的构建[D].西安:陕西师范大学,2008.
[30]任雪松,于秀林.多元统计分析(第2版)[M].北京:中国统计出版社,2011.
[31]张紫屏.师生互动教学的困境与出路[J].教育发展研究,2015(6):44-52.