数据驱动下的在线学习状态分析模型及应用研究*

2019-04-01 05:47刘清堂通讯作者张文超DavidStein
远程教育杂志 2019年2期
关键词:分析模型学习者状态

王 洋 刘清堂[通讯作者]张文超 [美]David Stein

(1.华中师范大学 信息化与基础教育均衡发展协同创新中心,湖北武汉 430079;2.俄亥俄州立大学 教育与人类生态学学院,美国哥伦布 43210)

一、引言

随着信息技术的飞速发展,网络学习作为一种新常态的学习方式得到了长足的发展。网络学习为学习者随时、随地开展知识学习提供了可能。然而,网络学习面临的问题表现在:参与人数众多,但坚持学习、获得学分认证的学习者不多;学习资源丰富,但能满足学习者需求的优质资源相对匮乏;学习平台数量繁杂,但对学习者粘度不足。其核心问题之一,即缺少对平台中学习者学习状态的深度分析[1]。学习者的投入状态、参与方式、学习态度等越来越成为学习发生与发展的起点和驱动力,对学习者学习状态的深度分析,成为网络学习效果提升的重要课题。

学习状态是指学习者在学习时的心理、情感、态度、思维等活跃、积极、接纳、参与状态的综合,是学习者在学习时的身心投入程度。已有研究表明,不同学习状态能产生不同的学习效果[2];个性化学习系统以学习者的学习状态为依据,促进学习者学习,激发并保持学习者的学习投入状态。因此,学习状态既是起点又是归宿。积极投入的学习状态能促进学习者深入到有意义的深度学习中。学习投入状态使学习者对学习的内容,有着更高和更持久的情感投入、认知投入和行为投入[3]。

如何利用在线日志数据分析学习者的学习状态,为教师评估学习投入提供支持,这是网络学习质量提升的难点。为此,美国学校管理者协会联合Gartner公司实施了“减小差距:将数据转化为行动”的项目,让教育大数据融入学生学习状态分析,进而拓展有效教学[4]。在美国政府支持下,eCART系统除了包含弗吉尼亚州学习标准资源和学区核准课程材料的课程库外,还能根据学习者学习状态情况,提供实时评估报告,通过连接学生过去和当前表现的数据,监控学生进步,生成学生情况报告,来实现有效教学反馈,促进学生学习[5]。我国教育部《教育信息化“十三五”规划(教技〔2016〕2 号)》中也明确指出,要积极运用大数据等技术来有效提升数字教育资源服务水平与能力,进而服务课堂拓展,支持泛在学习[6]。

由此可见,数据驱动的学习状态分析,能让相关研究者明确学习者的学习状态,了解学习者的学习状态特征,把握影响学习状态的相关因素,并形成学习状态激发策略,指导教学工作者及时做出教学调整,来促进学习者的学习。

目前,国内关于学习状态分析研究,主要关注的是学习者学习状态的现状分析、学习状态的影响因素以及学习状态调整策略研究等。对于学习者的学习状态分析,主要运用学习者主观自评或调查分析的方法[7]。对于学习状态的影响因素研究,主要运用各因素维度问卷编制及调查分析,再进行相关性分析,进而确定学习状态的影响因素。随着学习分析技术的飞速发展,对学习状态分析的相关研究越来越侧重基于数据的学习状态分析,关注学习者的学习行为、生理指标等客观数据,以此来进行学习者的学习状态分析[8]。为此,本研究试图构建一个数据驱动的学习状态分析模型,以华师云课堂的《教育信息处理》课程为例,探索学习者的学习状态特征,并为不同状态的学习者提供相应策略建议。

二、相关研究

(一)学习状态内涵及构成

学习状态是学习者学习时心理、身体所处的状态,分为认知状态和情感状态[9]。情感状态是人类情感引发的学习状态,例如,当一个学生心情愉悦时,学习状态是相对放松的;当心情烦躁时,学习状态则是消极不安的。认知状态是通过促进学习者对学习内容的结构理解,来影响学习者的学习状态[10]。情感状态和认知状态二者是相互促进的关系:情感状态在一定程度上可以影响学习者的认知状态;同时,良好认知状态也可以让学习者产生积极的情感状态。学习状态主要受个人因素和环境因素的影响:个人因素主要指个人对了解特定主题的内在渴望,是个人内在的认知和情感特质;而环境因素是环境引起的特定情境下的学习状态,包括与人类活动或生活主题相关的内容特征和与任务组织与展示相关的结构特征[11]。积极学习状态的激发,需要个人因素与环境因素的结合。

国外对于学习状态的研究关注的是学习状态中的学习投入度,认为学习投入度是与专注度、兴趣和愉悦度一样,能促进学习者学习体验感,是影响学习效率的重要因素[12]。对于学习投入度的研究主要分为以下三个方面:(1)学习投入度的影响因素研究。Halverson指出,学习投入度主要包括认知投入度和情感投入度这两部分[13];Rui Zhen等指出,基本心理需求、自我效能感和情感状态是学习投入度的三个关键影响因素[14]。(2)激发学习投入度的策略研究。研究表明,充分运用游戏化的手段或增强交互性能够促进学习者的学习投入度[15-16]。(3)学习投入度对网络学习效果的作用研究。Blasco-Arcas等研究表明,高度的学习投入度能够促进学习者的学业表现[17]。尽管对于学习投入度的研究较多,但大多是通过定性研究的方法,从学习者的认知投入度和情感投入度这两方面,来间接研究学习者的学习投入度。

国内对网络学习状态的研究较多,但不同学者对学习状态有着不同理解。李海艳认为,远程学习者的学习状态是学习者在进行远程学习过程中,相对稳定的、可调节的学习心理状态和学习环境状态[18]。郑勤华等指出,学习者的投入度,即学习状态是评价学习者学习过程的重要因子[19]。武法提等研究表明,学习者的学习情感状态特征,是数字化环境下个性化行为分析的重要内容[20]。李彤彤等指出,学习者的学习状态分析是学习干预的基础阶段[21]。目前的学习状态分析研究,主要分为以下三类:(1)基于学习者网络学习交互数据,如,学习进度、学习内容、学习轨迹等来分析学习者的知识建构过程、学习能力等状态[22];(2)根据学习者的生理信号数据,如,脑电波、眼动仪、皮肤电等数据,分析学习者的学习疲劳及关注点[23]。但基于网络学习数据的学习状态分析,还停留在国外经验总结阶段,未深入到具体的数据指标模型分析,仍有待进一步深入。

(二)学习状态的分析指标

学习者的学习状态主要是指学习认知状态和情感状态的综合反映。目前,在网络学习状态的研究中,学习者的网络操作行为常常会被忽略。但这些行为是学习者学习状态的重要评价指标,统计分析每个学习者的网络学习时长、学习资源使用情况、测试情况等,可为网络学习状态的定量分析提供数据支撑。学习行为是情感和认知的外在表现,学习者情感和认知数据是处于冰山模型中水面以下的数据,难以直接获取,而学习行为数据是可通过学习平台进行检测、统计并呈现给研究者,并运用这些可观测的行为操作数据进行学习状态分析。宾夕法尼亚大学(University of Pennsylvania)的Baker和麻省理工学院 (Massachusetts Institute of Technology) 的 Pardos等在Ekman和Picard的研究基础上[24-25],对2786位学生在三年时间积累的810,000条网络学习操作进行研究,构建起学生学习状态和行为操作之间的关系模型,对网络学习状态的数据指标进行了深度研究,并得到了研究者们的认可[26-27]。具体如表1所示。

三、数据驱动的网络学习状态分析模型构建

(一)网络学习状态分析模型

学习状态分析以评估学习者在学习过程中的身心投入状态、发现潜在问题为目的,是对学生产生和收集的大量数据进行阐释的过程,也是学习分析的一个重要方面。关于学习分析模型,主要分为以下四类:(1)以Siemens的学习分析过程模型为代表的线性学习分析过程模型[28];(2)以Elias的持续改进模型为代表的反馈完善分析模型[29];(3)以Ifenthaler的学习分析框架和刘清堂等的学习分析循环架构为代表的环状学习分析模型[30];(4)以SOLAR学者的整合式学习分析系统为代表的多因素模块化学习分析模型[31]。其中,Siemens的学习分析过程模型,包含了学习分析的基本要素和过程;Elias的持续改进反馈模型,从技术资源角度体现了学习分析过程的循环性,他们的研究以学习者学习状态为分析对象。本研究在以上研究基础上,结合Siemens的学习分析过程模型和Elias的持续改进环状模型,提出了数据驱动的网络学习状态分析模型,具体如图1所示。

表1 各学习状态维度描述及其数据依据

图1 数据驱动的网络学习状态分析模型

数据驱动的学习状态分析模型,主要包括:网络学习数据采集阶段、数据处理与学习状态分析阶段、评估预测与干预阶段。网络学习数据采集阶段主要采集的是学习者的网络学习数据,包括:正答率、涉及同一问题的行为数量、使用提示次数、相邻两个学习行为的时间间隔等。以这些数据作为学习状态的分析与评估依据。由于在数据采集阶段收集到的网络学习数据量大,存在很多冗余数据,因此,数据处理与学习状态分析阶段的核心目标,即从复杂多变的网络学习数据中挖掘出有用信息进行分析,并可视化展示。在获取数据库的数据表后,首先要进行数据清洗(检查数据一致性,处理无效值和缺失值),并进行修复,运用表1的数据标准和图1所示的方法,以整体平均数和极值为参照,计算每一学习者的学习状态。最后,将得出的每一维度的标准学习状态向量与学习者的学习记录数据进行相似度计算,得到每一学习者相应的学习状态维度。

评估预测与干预阶段的目的,是为了促进学习者进入并保持学习投入状态,优化教与学。在该阶段中,对处于挫折、困惑、分心等消极学习状态的学习者要进行及时干预。如:对于表现出挫折、困惑的学习者要及时提供支持,为其提供相应知识点和学习材料,来帮助其走出当前的负面学习状态。对于分心的学习者,要实施相应的监测、提醒和干预。平台、学生、教师根据数据处理与学习状态分析阶段所呈现的结果,采取相应措施:学生以呈现的评估预测结果为依据,进行自我反思,采取相应措施及时调整学习状态,实现高效率的自主学习。平台以分析结果为依据,进行相关学习的内容推介。教师以呈现的结果为依据,改进教学策略,完善教学内容,优化学习方法,激发学生积极的学习状态,实现自适应教学。平台管理者以分析结果为依据,来进行相关资源的合理配置,改善教学平台设计,进而影响学习环境相关数据,进一步实现自适应学习。这样,通过学生、学习平台、教师和平台管理者的一系列干预,网络学习系统的网络学习数据也会发生相应改变,从而形成网络学习数据采集、数据处理与学习状态分析、评估预测与干预的整个循环过程,进而激发学习者的学习状态,提高学习者的学习效率。

(二)网络学习状态分析方法

本研究所使用的在线学习平台是云平台,该平台可以自动记录学习者的学习操作日志。根据每一个学习者在测验中的得分计算正答率。测试包括10个问题,满分为100。在学习状态分析中,使用了学习状态检测器,它包含了许多指标:(1)正答率(正答数量与总题目数量之比);(2)行为数量(总的操作次数);(3)两个相邻操作之间的时间间隔,单位为分钟;(4)连续正答次数,连续正确回答问题的数量;(5)涉及相同问题的先前操作次数;(6)关于某一主题的错答次数;(7)帮助请求的数量等。也就是说,平台中学习者的学习行为数据被加工,提取出有用的学习行为特征,来分析学习者的学习状态。

我们收集了2016-2017年《教育信息处理》课程的269名学习者的12912次在线学习操作和学习状态自我报告结果。学习者是教育技术学专业的本科生,《教育信息处理》是教育技术专业本科生的必修课。

我们基于韦伯学习状态评定量表,编制了学习者在线学习自我报告问卷[32]。在该问卷中有20个项目用来测量学生的学习状态。在以下四个维度中每个维度都有5个题项,即投入、挫折、困惑和分心状态[33]。每个题项使用Likert五点量表,从1表示强烈不同意到5表示强烈同意。根据三名在线学习专家,该问卷被验证为可靠。得分最高的维度是学习者的主要学习状态。当一节课结束后,所有学生被要求完成测试和学习状态自评。

根据学习者这七个维度具体取值,和学习状态情况,形成每一个学习者的学习行为八维数据记录。再用同样的方法处理所有269名学习者的学习记录。形成一个269*8的学习者学习状态数据集。经过筛选和清洗,最终数据片段如图2所示。

图2 清洗后的数据片段

使用70%(n=188)的数据训练模型,另外30%(n=81)的学习日志据被用来检验学习状态检测器的有效性。实验运营环境:win10专业版,python 2.7,rapidminer 9.1。整个学习状态分类基本流程如图3所示,具体的rapidminer的分析实现过程如图4所示。其中的Select Attributes算子将除了userid外的8个特征值都作为训练模型的指标;Set Role算子设置最终预测变量为 “learning_state”;Split Data算子用于将数据集分成70%的训练集和30%的测试集。其中,训练数据集作为训练模型的输入;测试集数据则作为模型应用测试的输入。Performance算子用于评估学习状态检测器模型的精确度和一致性(main criteria=accuracy 和 kappa)。

图3 学习状态分类基本流程

图4 学习状态分析实现过程

决策树和朴素贝叶斯是分类器的常用算法,本研究主要使用这两种方法,来进行学习状态分析。机器学习算法的特征选择,是使用正向选择的方法来进行的,其中最能提高模型拟合度的特征被重复添加,直到不再有特征可以增加模型拟合度为止。精确度和科恩的Kappa指标备用来评估学习状态检测模型的有效性,综合考虑这两个指标,相较于朴素贝叶斯的精确度和一致性 (accuracy=0.8101,kappa=0.766),决策树算法的精确度和一致性较好(accuracy=0.925, kappa=0.884)。

基于此,利用rapidminer工具创建决策树模型,将处理好的所有数据集导入rapidminer,选择四折交叉验证算子和决策树算子(criterion=gain_ratio)。对这四种学习状态分类器的特征进行分析,结果如图5所示;挖掘出这四种学习状态的七个行为特征,如表2所示。Performance算子对剩余30%(n=81)的学生学习行为数据进行分析,结果表明,该机器分析方法与学习者自我报告一致性较好 (accuracy=0.925,kappa=0.884),说明该学习状态分析模型是有效的。

图5 rapidminer生成的决策树

表2 各学习状态维度及其行为特征

四、数据驱动的网络学习状态分析模型典型应用

(一)应用案例简介

为了解华师2016级1班学生在《教育信息化处理》课程中的学习状态,在如下应用情境中进行数据收集与分析。《教育信息处理》是教育技术学学生的必修课程,该课程主要目标是使学生了解信息科学的基本概念,理解教育信息处理的基本原理,掌握各种信息处理方法在教育中应用的基本思想和过程。这门课程的学习、作业、测试等被要求在“云课堂”上进行,学生在云课堂上通过教学视频、课件和教师上传的拓展资源来学习课程内容,在每一章节内容学习结束后,学生需要进行该章节内容的课后练习。本研究选择第二章第一节的内容为例,在实验课的课堂上教师要求学生按要求学习课程视频和拓展资源,并回答课后10道习题,在下课前完成。学生的基本信息、操作交互次数(包括文档查看、登录、作业查看、回答问题、查看答案等操作)、概念交互情况(包括正答次数、时长等信息),则通过系统记录。

本研究选取华中师范大学教育信息技术学院2016级1班的59名大二学生的“云课堂”学习行为记录,对这些学习行为数据进行统计分析,了解这门课程学生的网络学习状况。

(二)分析结果与讨论

1.整体学习状态情况分析

我们对59位学习者正答率、操作数量、相邻两个学习行为间的时间间隔平均值等进行统计分析。根据学习状态检测模型,得出每一位学习者的状态。从stu1到stu59的学习状态分析结果,如图6所示。由图6可知,“投入”状态的学习者占学生的49.15%;“挫折”状态的学习者占总体学生的10.17%;学习状态为“困惑”的学习者占全班学生的28.81%;“分心”状态的学习者占总学习者的11.87%。

图6 学习状态分析结果

2.学习效率与学习状态相关性分析

为了研究学习者的学习效率与学习状态的关系,Ryan研究表明,学习者的投入优于挫折,优于困惑和分心[34],故将学习状态中的投入、挫折、困惑、分心分别赋予3-0分,得出表3所示结果。由表3可知,学习效率与学习状态呈正相关,Pearson相关系数为0.64,即|r|=0.64,表示这两个变量为正相关,而两者之间不相关的双尾检验值 (Sig.(2-tailed))为0.00,表示两者是显著相关。其中,积极的学习状态,如,“投入”,能促进学习者的学习效率;而消极的学习状态,如,“挫折”、“困惑”、“分心”等,则不利于学习者的学习效率。

表3 学习效率与学习状态相关性分析

3.自评与访谈分析

自评分析运用的是学习状态自评表[35]。在“投入”、“挫折”、“困惑”和“分心”这四种学习状态中,分别抽取五位学习者进行自评和访谈分析,自评结果与根据学习行为数据的分析结果的一致性为85.0%。访谈主要从学习者的 “投入度”、“满意度”、“感知难度”和“期望支持”四个方面进行。在访谈过程中,学习状态为“投入”的学习者,表现出来的学习投入度和满意度较高,感知难度较低,他们大多认为云平台的资源较全面,测试难度较低,基本功能能够满足他们的需要,但同时也希望平台上的学习资源能够精炼一下,这样有利于他们快速选择出有用的学习材料。“挫折”和“困惑”状态的学习者,学习投入度处于一般平均水平,学习满意度适中,感知难度较高,他们提出测试题的答案不够详细,有部分题目还有疑问。在“期望支持”方面,他们希望题目的解析能够更加详细,在他们遇到问题时能够有老师或助教及时帮助他们答疑解惑。处于“分心”状态的学习者的学习投入度和满意度较低,感知难度适中。他们提出,面对着电脑学习让他们很容易分心,难以投入到学习中。对于“期望支持”方面,他们期待系统能够告知其学习效率和状态并给予反馈,使他们能够及时意识到学习状态存在的问题并进行调整。

五、总结与反思

在基于云课堂的《教育信息处理》课程中,主要学习状态为 “投入”的学生比例占整体学生的49.15%,主要学习状态为“挫折”和“困惑”的学习者分别占28.81%和10.17%,以“分心”为主要学习状态的学习者占总体学生的11.87%。这说明在教师监督下的云课堂教学中学生整体学习状态较好,但 “挫折”状态的学习者较多。相关性分析结果表明,学生的正答率与行为数量呈正相关,学习状态与学习效率呈正相关,这说明教师应鼓励学生加大学习行为投入度,促进学生的学习效率。另外,访谈结果也表明,教师应进一步精炼学习材料,再提供给学习者;对于“挫折”和“困惑”状态的学习者,教师应分析学生“挫折”、“困惑”产生的原因并及时提供帮助,对于题目的提示部分应进一步详细,为“困惑”状态的学习者提供支持;对于“分心”状态的学习者,教师应及时提醒、干预,来努力激发学习者投入学习状态。

本研究以华师《教育信息处理》课程为例,分析结果能为该课程教师和学生提供指导,同时也为其他网络学习状态分析研究提供了新思路。在网络学习环境中,对学习状态的影响因素和数据指标探索是十分有价值的,除了正答率、两行为间时间间隔、总体行为数量外,其他更为细致的学习行为数据,如,提问次数、发帖次数、回复次数和回复内容等,也是值得进一步挖掘的行为数据。

总之,大数据时代下的在线学习数据的充分挖掘应用、基于网络学习数据的学习状态分析,是学习分析和行为分析的综合与发展方向;是自适应网络教学的指向标;也是推动个性化教学的重要力量。其对提升学生的学习效果具有重要作用;对于教师、学生、教育管理者也具有深远的意义,今后值得教育技术领域研究者的共同关注和进一步探索。

猜你喜欢
分析模型学习者状态
基于BERT-VGG16的多模态情感分析模型
你是哪种类型的学习者
十二星座是什么类型的学习者
状态联想
青年干部要当好新思想的学习者、宣讲者、践行者
生命的另一种状态
坚持是成功前的状态
全启发式语言分析模型
高校学习者对慕课认知情况的实证研究
基于Lagrange方法的直升机地面共振分析模型