马 晓 曲建华 徐慧敏
(山东师范大学商学院,250358 济南 )
网络学习已成为互联网+时代教育发展的重要形式,数据驱动的分析和挖掘也为教育研究提出了一种新的范式[1].针对学习者在网络学习的过程中产生的大量行为数据进行网络学习行为的学习分析与研究,对开展个性化学习,提高学习效果,支持教学决策具有重要意义.
虽然对网络学习行为的研究已成为学习分析领域的热点,但仍存在网络学习行为数据利用不全面、实际应用研究不充分等问题.由于互联网技术和信息技术的快速发展,可以对特定情境下的网络学习行为模型进行深入研究,给出个性化的网络学习指导建议.本文以山东师范大学高等数学网络课程中99名学生的网络学习行为数据为研究对象,展开以下研究:构建交互视角下多维度的网络学习行为模型,引入基于交互时间的行为特征,挖掘有意义的网络行为特征;根据网络学习行为特征对学习群体进行聚类分析,将学生分为卓越型、积极型、一般型、拖延型和消极型五种,给出个性化学习建议.
国内学者针对网络学习行为的研究主要表现在建立学习者行为模型[10]、挖掘影响学习效果的学习行为、预测学习效果[11]和分析学习者群体的学习特点等方面.朱珂[12]构建了网络学习空间中的学习者交互模型,度量了模型的参数,并对学习者的交互做了可视化分析.李有增等人[13]以学生人口数据、学习行为数据和校园行为数据为研究对象构建学生行为分析模型,运用大数据技术为学校提供多方面的建议.吴林静等人[14]对各类网络学习行为进行有效分类和度量,并挖掘学习者的相关网络学习行为模式.曹天生等人[15]采用统计分析法、社会网络分析法等探讨了分组策略对交互深度的影响程度.赵慧琼等人[16]采用多元回归分析法探究并分析了影响学生学习绩效的预警因素.武法提等人[17]基于个性化学习模式建立了个性化行为分析模型,并设计了学习结果预测框架.王改花等人[18,19]采用数据挖掘方法与统计学方法对网络学习行为进行定量分析,探讨网络学习行为与学习成绩的关系,进而预测学习成绩,并提出适当干预.许兴等人[20]从学生的实际网络数据中提取一组特征,利用决策树、神经网络和支持向量机机器学习算法对学习成绩进行预测,结果发现,随着特征数目的增加,预测精度普遍提高.胡航等人[21]构建了一种基于决策树和深度神经网络的模型,依据日志数据诊断学生在线学习行为、借阅行为等,预测学习绩效.
从国内外的相关研究可以看出,研究者在挖掘网络学习行为特征、预测学习效果等方面已取得了显著成果,但仍有可以改进之处.例如,在挖掘学习行为特征方面,注重学习行为的次数分析,较少对学习行为的发生时间进行分析.为此,本文引入了基于交互时间的网络学习行为特征,构建了交互视角下多维度的网络学习行为模型,在此基础上对学习群体进行聚类分析,归纳出不同类型学生的网络学习特征,并给出个性化学习建议.
网络学习行为数据主要来源于网络学习过程中学习者按照自身学习需求所进行的交互活动[22].在相关研究的基础[11,12,14]之上,本文构建了图1所示的网络学习行为模型.该模型包含四个维度:人际交互、任务交互、内容交互、系统交互.其中,人际交互是指学生与学生、学生与教师进行的各类交互行为;任务交互是指学生与课程任务之间的各类交互行为;内容交互是指学生与学习资源(课件和视频)产生的交互行为;系统交互是指学习与学习系统之间的各类交互行为.
图1 网络学习行为模型
本文以这四个交互维度为依据,在相关研究的基础之上,确定了网络学习行为模型中各交互维度的行为特征,各行为特征的度量指标如表1所示.人际交互包括参与讨论和发表讨论;任务交互包括完成作业、完成测验、完成签到、总签到数和完成任务点;内容交互包括完成课件、完成视频和观看视频;系统交互包括登录系统次数和访问系统天数.其中,完成作业、完成测验、完成签到、完成课件、完成视频是五个关于交互时间的行为特征,是通过交互行为的发起时间、截止时间和提交时间来度量的,在以往文献中较少提到.这些行为特征对于发现网络学习规律、改善网络学习效果具有重要意义.
表1 网络学习行为特征
在网络学习环境中,较容易获得有关学生交互时间的数据,但以往的研究中较少使用交互时间数据.本文提出了一种新的量化行为特征的方法,以交互行为的时间数据构建度量指标,进而量化行为特征.因此,完成作业、完成测验、完成签到、完成课件和完成视频行为特征能够分别表示学生网络学习的提交作业、提交测验、参与课堂签到、浏览课件资源和浏览视频资源行为.对学生网络行为的量化,能更好地分析学生的网络学习特点.
4.1研究对象与数据采集研究对象为某高校2020年2月至6月高等数学网络课程的99名学生的40多万条网络学习行为数据.这些数据涉及讨论、提交作业、登录系统等交互行为.其中,该课程的作业任务为19次,测验任务为20次,签到任务为30次,任务点总数为194次,课件资源为32个,视频资源为154个.部分行为日志数据见表2.通过对学习行为数据的分析提取如下度量指标:发表讨论数量、参与讨论数量、作业提交时间、测验提交时间、签到完成时间、课件完成任务时间、视频任务完成时间、访问系统数量、平台登录天数等.本文以该课程的线下期末考试成绩作为学习效果进行分析.
表2 部分行为日志数据
4.2数据处理本文使用Python 3.7和SPSS 20.0对数据进行分析与处理,得到网络学习行为模型中的12个行为特征,其处理方法总结如下:
1) 对人际交互维度和系统交互维度的行为特征不进行处理,使用原始数据.缺失值用0代替;
2) 完成作业、完成测验、完成课件和完成视频行为特征的度量方式见算法1.缺失值用对应截止时间代替;
3) 完成签到行为特征采用签到拖延指数(TS)进行定义.签到拖延指数的定义见公式(1).
(1)
其中,i为课堂签到总次数;ten为第n次签到的发布时间;tfn为第n次签到的截止时间;tqn为第n次签到的完成时间;
4) 总签到数和完成任务点行为特征通过对应指标的累加值进行度量,缺失值用0代替.
算法1:计算学生基于交互的行为特征值
经过以上处理,所有行为特征的取值都符合增函数的规律.例如,完成作业行为特征的数值越大,说明该学生提交作业使用的时间越少,越不拖延;完成课件行为特征的数值越小,说明该学生完成课件任务使用的时间越多,非常拖延.
4.3特征挖掘特征挖掘主要用来挖掘出与学习效果显著相关的行为特征,并删除与学习效果不相关的行为特征.本文使用斯皮尔曼相关系数衡量行为特征与学习效果的相关性,得出12个行为特征与学习效果之间的相关系数,见表3.若行为特征与学习效果之间的相关性低,表明该行为特征质量不佳,应将其删除.
由表3可以看出:与学习效果存在显著相关的行为特征有参与讨论、完成作业、完成签到、总签到数、完成任务点、完成课件、完成视频、登录系统次数、访问系统天数.其中,完成作业、完成签到、完成课件、完成视频都是和交互时间有关的行为特征,均与学习效果有较强的相关性,说明基于交互时间特征的选择是合理的.完成作业、完成签到、总签到数和登录系统次与参与讨论数存在显著相关,说明学生登录网络学习系统完成课程任务时,往往伴随着与同学、老师间的人际交互.完成作业、完成签到、总签到、完成任务点与完成课件、完成视频之间存在较强的相关性,说明任务交互行为特征与内容交互行为特征之间的相关性是显著的.特别是完成任务点、完成课件、完成视频和登录系统次数与完成作业的相关系数均大于0.4,说明学生登录网络学习系统时,主要进行课程资源的学习和课程任务的完成等活动,符合网络学习的普遍规律.发表讨论、完成测验和观看视频与学习效果的相关系数绝对值小于0.01,说明发表讨论、完成测验和观看视频与学习效果不存在相关性,可判定其对学习效果的解释力不佳,将其删除.
表3 行为特征与学习效果的相关分析矩阵
注:*表示显著性水平小于0.05;**表示显著性水平小于0.01.
4.4聚类分析为了提高自主学习效率,改善学习效果,在上述模型的基础之上,本文针对学习群体进行聚类分析.为了确定最优的K值,本研究使用轮廓系数法对不同K值的聚类结果进行评价.轮廓系数值越趋近于1,意味着样本与自己所在簇群的样本很相似,并且与其他簇群中的样本不相似,即聚类结果越趋于合理.设定K值的取值范围为3~8,不同K值所对应的轮廓系数值如图2所示.
图2 不同簇群数量及其对应的轮廓系数值
本研究采用K-means聚类算法,对筛选后的9个行为特征进行聚类分析,得到五个簇群,聚类结果见表4.
表4 聚类结果
为了检验聚类后的学习群体分布是否符合正态分布,对聚类后的学习群体人数进行柯尔莫可洛夫-斯米洛夫(简称K-S检验),检验结果见表5.从表5可以看出,K-S检验的显著性结果为0.20,说明聚类后的学习群体分布符合正态分布,与实际情况相符.由此可见,本文选取的行为特征是合理的,聚类结果是有效的.
表5 学习群体的正态性检验
从表4中可以看出,全部学生的总签到数均高于27,由于本文使用的网络课程数据较为集中,说明一般情况下,全部学生能够完成课堂签到任务,参与每次网络授课;簇1、簇2、簇3、簇4学生的完成任务点高于188,说明约95%的学生能够完成全部任务点.簇5学生的全部行为特征值均低于其他学生.
为了更清晰地观察不同簇之间网络学习行为特征的差异,本文通过折线图来对聚类结果进行展示.通过对5个簇的行为特征平均值进行标准化处理,得到图3.由图3可以看出:这5个簇学生的多个行为特征值(参与讨论、完成签到、登录系统次数和访问系统天数)有显著差异,参与讨论、完成签到、登录系统次数和访问系统天数的值是按照簇1、簇2、簇3、簇4和簇5依次递减的.簇1、簇2、簇3和簇4学生的完成任务点和完成视频差异并不明显.不同簇行为特征的差异有助于进一步分析各类学生的网络学习特点,为学生提供个性化学习建议.
图3 聚类结果可视化
4.5学习群体特征分析与建议为了更好地分析不同簇学生的学习效果,本文通过图4对学习效果进行展示.依图4可见,各簇学习效果的上限、中位数和平均值是按照簇1、簇2、簇3、簇4、簇5的顺序依次递减的.因此,将本文中的网络学习群体分为以下5种类型:卓越型学生(簇1),积极型学生(簇2),一般型学生(簇3),拖延型学生(簇4),消极型学生(簇5).
图4 各簇学习效果分析
4.5.1 卓越型学生——簇1 卓越型学生有11人,占学生总数11.11%,其学习效果高于其他类型.由图3可以看出,卓越型学生的多项行为特征值均高于其他类型的学生,可见卓越型学生的网络学习行为是积极的、主动的,特别是在系统交互维度上表现尤为突出.卓越型学生的完成视频情况仅低于积极型学生,说明卓越型学生可能课前已经掌握了部分学习内容,因此没有提前完成视频任务.卓越型学生有良好的自律能力,能主动积极地完成各项网络学习任务,通过自己在学习上的付出获得优异的学习效果.对于卓越型学生,应当丰富网络学习资源,拓宽学习深度,引导学生向更广、更深的层次发展.
4.5.2 积极型学生——簇2 由图4可以看出,积极型学生的学习效果仅低于卓越型学生.结合图3,积极型学生的总签到数、完成任务点和完成视频等行为特征也都比较优秀,特别是积极型学生完成视频的情况显著高于卓越型学生.可见积极型学生能充分利用网络上的学习资源,积极地参与网络学习,从而获得较好的学习效果.积极型学生占学生总数的25%左右,这类学生发展成卓越型学生的可能性很大.但由图3可见,积极型学生的系统交互行为特征明显低于卓越型学生.对于积极型学生,应当加强课前预习与课后复习,积极参与师生的互动交流,积累学习经验,从而改善学习效果.
4.5.3 一般型学生——簇3 从图4可以看出,一般型学生的学习效果居于中等水平,多项网络学习行为特征表现良好.从图3可见,一般型学生的完成作业、完成课件和完成视频的行为特征值低于拖延型学生,说明一般型学生完成网络学习任务较为困难,学习能力一般,学习动机不强烈.一般型学生占学生总数的40%左右,比重较大.对于一般型学生,应当通过积极参与小组协作活动、教师监督、作业提醒等来提高自主学习性,增强学习兴趣,改善学习效果.
4.5.4 拖延型学生——簇4 拖延型学生的学习效果略高于消极型学生.图3中的数据表明,拖延型学生的系统交互行为远低于卓越型学生,说明拖延型学生不能积极主动地参与网络课程的学习,没有完成网络课程的学习任务,达不到应有的学习效果.通过调研发现,原因可能是拖延型学生的知识基础较薄弱,学习能力较差,缺乏学习动机,因此,在完成学习任务时存在一定的拖延.对于拖延型学生,应当及时提醒学生完成网络学习任务,加强与课程有关的基础知识的学习.教师应鼓励学生积极参与网络课程的学习,尽可能地避免完成学习任务时的拖延,在一定程度上改善学习效果.
4.5.5 消极型学生——簇5 消极型学生的数量较少,只有4名学生,学习效果较差.由图3可以看出,消极型学生几乎不参与讨论,很少访问网络学习系统,说明消极型学生缺乏基本的自我学习能力,不关注自己的学习效果,有严重的学习拖延倾向.对于消极型学生,可以通过自我激励提高学习积极性,加强与师生的沟通交流,督促其完成学习任务,尽量改善学习效果.
网络学习行为特征的研究对于发现网络学习规律、提高网络学习效果具有重要意义.本文提出了包含人际交互、任务交互、内容交互和系统交互维度的网络学习行为模型,根据获取的网络学习行为数据,提取了发表讨论数、作业提交时间、访问系统数等多个度量指标,据此进一步构建了参与讨论、完成课件等12个网络学习行为特征.特别地,本文引入了五个基于交互时间的行为特征,即完成作业、完成签到、完成测验、完成课件和完成视频,使得对网络学习行为特征的研究不再局限于学习次数的分析,对网络学习行为的分析具有重要参考价值,可以更好地发现网络学习行为的拖延倾向.通过分析行为特征与学习效果的相关性,挖掘出参与讨论、完成作业、登录系统次数等9个有意义的网络学习行为特征.
为发现不同网络学习群体的学习规律,本文通过轮廓系数法确定了最佳聚类簇数,对研究对象进行了聚类分析,最终得到5种不同类型的学习群体:卓越型学生、积极型学生、一般型学生、拖延型学生和消极型学生.经检验,聚类得到的学习群体符合正态分布.聚类可视化结果显示,卓越型学生的学习效果最为优异,能主动积极完成各项学习任务;积极型学生能够充分利用网络学习资源,从而获得较好的学习效果;一般型学生在完成学习任务方面较为困难,学习效果居中;拖延型学生的学习能力较差,学习动机不强烈;消极型学生的学习效果较差,不具备基本的自我学习能力.针对不同学习群体的学习行为特点和学习规律,本文给出了个性化的建议,期望改善各学习群体的网络学习效果.由于本研究目前的样本数较少,因此下一步的重点是将网络学习行为模型应用到更大规模的在线课程学习体系中.