基于CiteSpace文献计量的国内网络学习行为研究现状与分析

2022-12-22 00:56孙玉展
安徽开放大学学报 2022年4期
关键词:学习效果数据挖掘聚类

索 琪,孙玉展

(青岛科技大学 经济与管理学院,山东 青岛 266061)

一、引言

2022年2月25日,中国互联网信息中心发布第49次《中国互联网络发展状况统计报告》,统计显示,截至2021年12月底,我国网民规模已达到10.32亿,互联网普及率达73.0%。互联网技术的发展和普及,使得在线教育平台迅速崛起。在线教育能够突破传统时空界限,共享优质教育资源,实现个性化学习,已经逐渐发展成为教育信息化时代的重要网络学习模式。尤其在“COVID-19”疫情暴发期间,网络教育平台为“停课不停学”在线学习活动的开展提供了支持环境,实现了在全国范围的大规模推广、应用。事实上,在线学习形式与传统线下面授形式存在显著差异。伴随着在线学习过程,众多在线学习者产生了大量的学习行为数据,这些不同类型的数据被存储在平台管理系统中。深入有效地分析、挖掘并利用这类网络学习行为数据,能够促使教育者适时进行教学干预从而提升教学效果,同时有助于督促学习者根据反馈数据进行自我评估和学习诊断。可见,在线学习行为是预测教学效果的重要变量[1]。

随着学习资源的不断丰富以及在线教学平台的发展完善,国内外学者结合实际教学场景中的应用数据,围绕学习行为分析开展了不同视角的研究。常见分析方法包括数据挖掘、统计分析、社会网络分析、话语分析、内容分析等,通过对在线学习者行为数据进行分析探讨,以挖掘学习规律并提供应用指导。Buckingham和Ferguso[2]探讨了学习分析的发展历程、未来挑战以及常见的社会学习分析方法,从理论层面提供了指导方向。Nistor等[3]通过量化在线学习行为数据,识别学生的自我效能与学业表现之间的关系,进而预测其未来学业表现。Park等[4]对在线学习者产生的行为数据进行聚类分析,并挖掘整理了学习者的行为特征。李曼丽等[5]借助Tobit和Logit模型分析慕课平台学习行为数据,提取出保障学习者课程参与和课程完成度的影响因素。魏顺平等[6]基于学习平台,从教师视角总结了基于教学过程、教学活动与教学环节的反思形式,从而实现教学过程的有效改善。姜强等[7]总结了在线学习行为的特性并将其应用于自适应学习系统中,进一步提升了学习者的学习效率。陈圆圆等[8]引入数据挖掘方法,以成人学习者为对象,探讨了在线学习行为与学习效果之间的关联。李爽等[9]在构建学习行为投入框架基础上,对学习行为投入指标与学习效果进行回归分析,从而识别出有效预测学习效果的行为投入指标。

综上,研究者围绕“网络学习行为”这一主题开展了较为系统的探讨,对教学数据进行了采集、处理、分析与可视化全过程分析,以达到优化学习路径、提升学习效果的目的。为深入了解我国网络学习行为领域的发展脉络,本文对相关文献进行系统梳理和分析,总结当前研究热点与进展,以促使未来该领域研究的进一步深化。

二、研究设计

研究以中国知网(CNKI)数据库作为检索数据源,以“网络学习行为”或“在线学习行为”为主题进行检索,时间截至2021年12月31日,并将数据库检索的文献数据以Refworks格式导出。为保证后续研究的准确性,筛选并剔除与研究主旨关联性较弱的文献,再对数据内容进行规范化处理,在正式分析前选取COOC[10]工具进行数据的预处理。将关键词进行统一化处理,如将“Moocs”“慕课”等统一为“MOOC”,同时删除无意义关键词。此外,将作者所在单位进行合并处理,以便后续识别核心研究机构。最终,共获得有效文献1 186篇作为研究样本。

为进一步梳理国内“网络学习行为”主题领域的研究热点和发展态势,文章采用文献计量法,选取目前已广泛应用于不同学科领域中的文献计量软件CiteSpace作为分析工具。该软件由陈超美教授基于Java语言开发,能够基于共引分析和寻径算法等对文献集合进行计量,并通过绘制可视化图谱直观揭示学科演化动力机制、领域知识结构和研究重点,从而帮助研究者识别本学科发展现状和前沿趋势。将文献导入并转换为软件可识别的文件类型[11],将时间跨度(Time Slicing)设置为2001-2021年,时间分区设置为1年,进行可视化分析。

三、研究结果

(一)文献时间分布

根据研究样本,绘制文献数量折线图,如图1所示。该领域第一篇文章发表于2001年,属于相对较新的话题。根据文献数量变化趋势,将其大致划分为以下三个阶段:(1)探索阶段(2001-2007年),发文数量较少,当时网络环境正在初步建设阶段,大规模在线教育条件并不成熟;(2)起步阶段(2008-2013年),发文数量较上一阶段略有上升,该领域逐渐获得学者的关注,网络平台应用得以进一步扩大,教育部于2012年发布《教育信息化十年发展规划(2011-2020年)》文件,并于2018年发布《教育信息化2.0行动计划》文件,强调了教育信息化的重要作用,相关政策文件的出台推动了该领域发展;(3)发展阶段(2014—2021年),这一阶段发文量呈现出快速上升态势,尤其是 2019—2021年,三年的发文量分别为 172、192 和 200 篇。这意味随着信息技术、在线教育平台和移动学习的普及发展,市场规模也愈加庞大,研究逐渐聚焦于信息技术与现代教育理念的融合[12],已经取得了较为丰硕的系列研究成果。目前,政府和高校对于在线学习的重视程度不断提升,新兴学习工具不断涌现,互联网技术与教育关联性不断增强,可以预计未来对于在线学习的探索将持续深入。

图1 2001-2021年文献数量折线图

(二)研究机构分析

目前关注网络学习行为领域的研究机构较多,已达700余家,主要以各高校的教育学院为主。近年来,在线学习逐渐成为教学过程中的重要一环,高等院校愈加注重探索混合式教学模式。高校通过深入挖掘学习行为特征,以期达到规范线上教学管理和提升线上教学效果的目的。已经初步形成了一批主要的学术机构,排名前20位的研究机构如图2所示。其中,华中师范大学和北京师范大学发文量较多,在该领域具有重要的学术影响力。华东师范大学、华南师范大学和东北师范大学等师范类院校表现也较为活跃。此外,国家开放大学、安徽广播电视大学(安徽开放大学)和浙江广播电视大学(浙江开放大学)等以成人远程教育研究为主的高校,在开放教育教学、管理过程中探讨网络学习行为、优化教育服务等问题,积累了较为丰富的数据资源,对于这类高校也具有重要的现实意义。但当前成果多以研究机构内部的合作模式为主,机构之间的交流合作较少,需要建立合理的合作机制,为跨区域、跨院校合作提供交流平台。此外,大部分研究者的发文较为分散,代表性、系列性的研究成果整体偏少,需要进一步提升科研产出能力和成果的专业化程度,从而促进相关研究的良性发展。

图2 Top20研究机构

(三)发文期刊分析

目前,相关论文刊发于1 200余种期刊上,载文量排名前20位的期刊如图3所示。《中国电化教育》《电化教育研究》《中国远程教育》等教育类CSSCI来源期刊是该领域论文刊载的重要期刊,且文章整体质量较高,对于相关研究具有重要借鉴意义。就期刊发表领域来看,研究主题主要涉及现代教育管理、计算机软件及应用等领域。事实上,网络学习行为的发展和研究不仅仅涉及教育学、基础计算机科学,还与心理学、数学和统计学、机器学习等多领域知识和技术联系密切。系统、科学地使用多元研究方法,丰富和扩展现有知识结构是该学科的重要发展方向,加强跨学科的知识融合,将为当前研究提供新的研究思路和启发。

图3 Top20发文期刊

(四)关键词及共现分析

提取并统计相关论文的关键词,当前研究视角较为纷杂,原始关键词超过1 000个。为揭示网络学习行为研究领域的关注重点,选取并绘制高频词词云,如图4所示。除检索关键词“网络学习行为”“在线学习/学习行为”外,排名靠前的高频关键词依次为“大学生”“大数据”“数据挖掘”“慕课”“影响因素”“高职”“学习效果”“自主学习”“在线教学”“学习投入”“网络环境”“远程教育”“SPOC”“聚类分析”等。

就研究对象而言,当前研究多选择大学生群体进行分析;就研究方法而言,大数据和数据挖掘技术是进行量化分析的重要方法;就研究视角而言,研究多关注于学习者的行为模式、学习效果和影响因素等。

图4 高频关键词词云

在高频关键词基础上,绘制高频关键词共现网络,如图5所示。网络共包含387个节点,1 013条连边,网络密度为0.0136。当前关于网络学习行为的研究范畴较为广泛,网络结构也处于较为松散状态。其中,“网络学习行为”“在线学习/学习行为”处于网络的核心地位,形成了以检索关键词为中心的辐射形网络。除此之外,“数据挖掘”“大数据”“大学生”“影响因素”“MOOC”和“学习效果”等关键词中心性高,在网络中起到较为重要的连接作用。说明当前研究重点聚焦于如何将数据挖掘和学习分析技术等应用于网络学习行为分析中,并试图通过深度挖掘学习数据背后隐藏的行为因素和行为特征,为学习者学习绩效的提升提供一定思路。

图5 高频关键词共现网络

(五)聚类分析

在高频关键词共现分析基础上进行聚类,自动选择筛选后,过滤共获得11个主要聚类,结果如图6所示。聚类主题能够揭示研究领域的主要研究热点[13]。簇号越小,则意味着该簇包含的关键词越多,这类聚类覆盖信息量大,具有代表性。从聚类结果看,排名第一的聚类规模为65,核心主题词包括“学习行为”“网络自主学习”“能力培养”;排名第二的聚类规模为49,核心主题词包括“网络学习行为”“学习评价”“学习者特征”;排名第三的聚类规模为40,核心主题词包括“在线学习”“学习者”“学习绩效”;排名第四的聚类规模为39,核心主题词包括“在线课程”“在线学习平台”“学习效果”;排名第五的聚类规模为39,核心主题词包括“大数据”“聚类分析”“数据挖掘”。综合聚类结果,可以概括出当前研究热点集中在以下几方面:第一,当前研究以学习者为中心,关注于学习者的学习行为内涵、学习需求、学习特征、学习影响因素、学习效果,研究者希望从学习者内部因素和外部环境因素出发,探寻如何从传统的线下学习环境过渡和发展成为有效的线上学习模式;第二,在线课程学习平台中积累了大量学习者学习过程中所产生的多类型数据资源,借助于大数据的信息采集和处理技术,可以为建立模型和学习分析提供可靠的数据基础;第三,数据挖掘、机器学习等技术越来越多的应用于信息分析和呈现过程中,这些技术与方法是数字化学习的基础,在准确定位在线学习者的学习水平,提高分析精度,评估学习效果过程中发挥着重要作用。

图6 高频关键词聚类图谱

(六)研究主题演进脉络

基于CiteSpace的Timezone View方式,获得研究热点以及变化趋势[14]的可视化分析,如图7所示。就研究主体而言,“(网络)学习行为”概念于2001年提出,早期关注学习动机、学习特征以及带来的学习效果。随后,随着研究的深入,为进一步剖析学习影响因素,数据挖掘、聚类分析、结构方程模型等方法逐步引入研究中,使得分析和评估结果更加可靠。2014年开始,“MOOC”和“SPOC”成为新兴关键词。随着互联网技术的迅猛发展,“互联网+教育”将成为在线学习的核心驱动力[15],围绕教育大数据资源进行的数据挖掘分析将继续受到关注。

图7 主题词演进图谱

突变词可用于预测网络学习行为研究的前沿趋势,获得排名前12位的突变词词谱如图8所示。从突变强度看,“网络学习行为”的研究在2009-2016年间发展迅速,“大数据”在2017-2021年间获得了广泛关注,在线学习平台的发展对技术依赖性较强,因此关键技术的发展和突破将成为该领域的重要发展方向。最新研究动态包括“在线教学”“学习投入”和“混合式教学”等,这些研究在未来一段时间内将继续升温。相关研究从早期关注于研究方法和数据分析逐渐转向关注外部网络学习环境和学习者内在行为分析。在大数据技术的支持下,近年来研究进一步强调,学习者通过自主学习加强学习投入,教学者通过开展混合式教学模式改革,双方共同实现转变,以达到深化学习效果的目的。开放的教学环境下,如何保障学习质量也是当前教育领域所关注的热点。

图8 Top12突变词词谱

四、结论与展望

基于中国知网(CNKI)数据库,检索并筛选获得2001-2021年期间以“网络学习行为”为主题的中文文献共计1 186篇,以此为研究样本,采用CiteSpace文献计量软件对相关文献进行知识图谱可视化分析。研究结论如下:第一,网络学习行为自2001年以来,发文数量逐年提升,尤其是近十年,这主要源于互联网技术和在线教育平台的迅猛发展;第二,目前网络学习行为研究领域涉及现代教育管理和计算机软件及应用等领域,部分研究成果发表于《中国电化教育》《电化教育研究》等高质量期刊上,对后续研究具有较为重要的参考价值。从事该领域研究的学者主要以高等院校教育学院和开放大学为主,他们侧重于网络学习行为分析;第三,“数据挖掘”“大数据”“大学生”“影响因素”“MOOC”和“学习效果”等属于广大研究者较为关注的焦点主题,研究主题从早期关注于网络学习行为本身,到注重深入挖掘学习影响因素、数据资源的深入分析与应用等;第四,随着线上教学的普及化,“在线教学”和“混合式教学”将成为未来一段时间的研究热点。

基于目前网络学习行为的相关研究,就该领域未来发展首先应加强多学科领域的交叉与融合、丰富研究内涵、变革研究视野;其次要关注多样化在线学习者的差异性行为特征;最后需更新网络行为分析方法和工具,积累在线行为分析数据。

猜你喜欢
学习效果数据挖掘聚类
疫情期间线上学习效果评价分析
“百词斩”对于大学英语四级词汇学习效果的实证研究
基于学习性评价原则提高研究性学习效果的研究
探讨人工智能与数据挖掘发展趋势
莲心宝宝有话说
基于DBSACN聚类算法的XML文档聚类
基于并行计算的大数据挖掘在电网中的应用
基于高斯混合聚类的阵列干涉SAR三维成像
一种基于Hadoop的大数据挖掘云服务及应用
一种层次初始的聚类个数自适应的聚类方法研究