我国在线学习行为分析研究现状与进展
——基于2016-2020年CSSCI来源期刊文献的分析

2021-10-11 08:13凌雨婷曲建华
关键词:聚类学习者领域

凌雨婷 曲建华

(山东师范大学商学院,250358,济南 )

1 引 言

学习分析最早于20世纪60年代出现在计算机教学领域中,但在2011年新媒体联盟(NMC)发布的《地平线报告》中对学习分析进行预测和定义后,学习分析研究领域才正式引起广泛关注.学习分析运用多种方法和技术大范围采集学生的学习数据(包括学生完成作业情况、网络社交行为、论坛发帖表现、成绩等),研究学生的投入、学习绩效、学习进度、预测表现等,发现潜在问题[1].

2015年,随着国家“互联网+”行动计划的启动,互联网、人工智能等信息技术在教育领域中的应用全面升级,产生了大量的教育数据,“互联网+教育”在教育研究领域由此兴起,并成为备受关注的热点.2019年2月,国务院印发《中国教育现代化2035》,确定了教育现代化十大战略任务.2020年初以来的新冠肺炎疫情,使得高校的传统教学模式产生了历史性的变革,加快了在线教育应用于中国高等教育的步伐,在线教育迎来蓬勃发展的新时期.在2020年2月4日教育部颁布《指导意见》和发出“停课不停学”倡议后,全国各类学校迅速并广泛采取在线课程、网络视频、线上会议等多种在线学习形式进行教育教学工作.

在线学习是教育信息化的一种重要形式,能打破传统学习环境下的重重不足,进而满足不同学习者多样化的学习需求.与传统学习不同,在线学习者的完整、系统的行为数据都能被教育云平台所记录,这为学习行为和学习心理的深入研究提供了数据支持,使追踪学习者的学习过程、把握学习者的学习效果成为可能.

在此背景下,本文针对中国知网(CNKI)数据库中2016-2020年收录的在线学习行为分析相关研究的文献数据,进行数据挖掘、科学计量、内容分析和可视化分析,以期客观准确地探索研究热点、演进脉络和发展趋势.

2 研究方法与数据来源

2.1文献样本选取本文的分析数据源自CiteSpace软件所支持的CNKI数据库.以CSSCI来源期刊《电化教育研究》、《现代教育技术》、《中国远程教育》、《中国电化教育》、《现代远程教育研究》、《开放教育研究》、《远程教育杂志》为文献来源,这7本期刊是国内学习分析领域的重要信息和权威信息来源,基本可反映国内学习分析领域的学术水平、研究动态、热点话题和发展趋势[2].经科学严谨的筛选,最终共获得有效分析文献170篇作为本文的文献综述分析对象.具体检索策略如表1所示.

表1 文献数据检索策略

2.2文献分析过程与方法本文采用定量研究与定性研究相结合的方法,主要运用信息可视化软件CiteSpace和书目共现分析系统Bicomb软件作为研究工具,对2016-2020年刊发在国内7本CSSCI来源期刊上的170篇文献样本进行系统分析,以了解2016-2020年我国在线学习行为研究的整体发展情况.

本文主要采用三种分析方法.一是文献计量法.使用Bicomb软件对文献信息快速准确地提取并做统计计算,主要统计和分析国内在线学习行为分析研究文献的发文时间、发文机构、作者发文量,对在线学习行为分析的研究现状做出客观评价;二是可视化分析方法.即借助CiteSpace软件生成在线学习行为分析视图,以此探索在线学习行为分析研究的历程与现状,并预测未来的发展趋势;三是内容分析法.由于代表性文献是研究的重要知识基础,一般具有重大的学术价值,因此有必要对代表性文献的内容进行分析和描述.然而,CiteSpace仅可对CNKI数据的专业术语和关键词进行有效分析,故在必要时,本文结合内容分析法对文献的研究内容进行分析.

2.3数据处理研究处理的数据为CiteSpace支持的纯文本文件,数据文件由CNKI数据库精炼结果转换得出,数据处理起止时间为2016-2020年,时间分区(Years Per Slice)为1年,数据源(Term Source)包括题目、摘要、作者、关键词与数据库附加关键词等,选择标准为top前50,每个时间切片(Top per slice)排名选前20%数据,阈值设置为(2.3.15)、(3.3.20)、(3.3.20).本文的研究依次对机构、作者、关键词等节点类型(Node Types)进行数据处理,研究结果以经Pathfinder或Pruning sliced networks运算后的知识图谱进行呈现.

2.4研究说明力求在文献样本数据的统计上做到高完整度和高准确率,采用多名研究者人工对文献的内容进行分析和筛选,筛选结果的覆盖率和相关度比采用主题检索、标题检索、关键词检索高,但仍存在未覆盖所有有关在线学习行为分析文献的可能.整体而言,本文的研究所呈现的总体状况是科学的、可信的,具有较高的统计学意义和科学的应用价值.

3 研究数据分析

3.1研究成果产出分布某学科领域受研究者的关注程度可由发文量间接显示,而逐年连续的发文量也可用来分析该学科领域受关注程度的变化情况.经过文献检索与内容分析,得到相关期刊文献170篇.设置Bicomb软件以“年代”为关键字段,对筛选出的文献题录信息按年代进行统计,图1 统计出7本CSSCI来源期刊所收录的2016-2020年在线学习分析主题的发文量.数据显示,2016-2019年期间,每年发文总量整体上呈上升趋势,2018年发文量突破40篇,是一个转折点,此后每年的发文量都在40篇以上,2019年发文量高达42篇;2020年仅能检索到9月份已达27篇.由线性增长趋势可知,2020年的发文量也将高于40篇.

图1 研究成果产出分布图

MOOC(Massive Open Online Courses)课程是在线学习的先驱,MOOC这个术语于2008年率先在国外被提出并快速发展,随后在中国也同样受到了很大关注.随着MOOC的快速发展,其已成为现代最新颖、最潮流的学习形式,在线学习平台积累大量学习行为数据,数据挖掘技术被引入在线学习行为的研究,从而涌现出大量的研究成果.按照文献样本的时间分布,可大致将在线学习行为分析研究划分为两个阶段.2013-2016年为第一阶段,该阶段在线学习研究成果较少,但这些研究成果为未来的在线学习行为分析研究奠定了基础;2016—2020年为第二阶段,是在线学习分析研究的发展阶段,每年的研究论文维持在35篇以上,反映出国内研究者对“在线学习行为分析”的研究关注程度较高,在线学习行为分析的研究在这一时期开始呈现爆发态势.

3.2载文期刊基本情况用Bicomb软件对2016-2020年7本CSSCI期刊共登载的170篇在线学习分析样本文献进行载文期刊分布统计,按刊载论文数量由高到低依次排序结果见图2.从图2可以看出,其中共有4本期刊刊载的在线学习分析主题的文章数量超过28篇,分别是《电化教育研究》、《现代教育技术》、《中国远程教育》、《中国电化教育》——2016-2020年我国在线学习分析研究论文发表的重要阵地,且均是CSSCI来源期刊,所载论文的整体质量稳定且价值较高.由图2文献期刊分布可看出,《电化教育研究》的载文数量在文献来源的7本杂志中遥遥领先,《中国电化教育》、《中国远程教育》、《现代教育技术》的载文数量较为接近,均处于30篇上下;《现代远程教育研究》、《开放教育研究》、《远程教育杂志》的载文数量较为接近,均处于11-13篇之间.

图2 样本文献期刊分布

3.3研究机构分析文献发表机构统计可以帮助我们确认在线学习行为分析的热点研究机构.使用Bicomb软件以“机构”为关键字段,统计得到研究机构共53家,且几乎都是高等院校.表2筛选出了发文量居前5位的机构.从表2可以看出,国内在线学习分析研究的主要阵地和研究成果的主要来源都是高等师范院校,其中发文量以北京师范大学(41篇)和华中师范大学(36篇)最为突出;中心性以北京师范大学(0.09)最为突出.这符合各类师范大学承担教育改革和人才培养重大任务的状态,在大数据环境下更多的研究是以新技术为支撑提升教育教学效果.

表2 我国在线学习行为研究发文前5的机构

3.4作者分析本研究对170篇样本文献使用CiteSpace软件的作者共现功能,形成了在线学习分析作者共现图谱,如图3所示.图3对在线学习行为分析研究领域较有成果的作者进行了可视化,可直观地了解这些作者的合作情况.结合作者所属机构分析可知有合作的作者大都同属于相同研究机构,跨校的研究合作较少,这也从侧面反映出该领域的学者交流还不够充分.

图3 作者共现图谱

排序频次作者百分比累计百分比19刘三女牙5.295.2928刘智4.7110.0037郑勤华4.1214.1246刘清堂3.5317.6555赵蔚2.9420.5965孙建文2.9423.5375姜强2.9426.4785陈丽2.9429.4194武法提2.3531.76104牟智佳2.3534.11

文献作者统计可以帮助我们确认在线学习分析研究领域的领军人物.使用Bicomb软件以“作者”为关键字段进行提取、统计,得到作者共138位.对出现频次排名前10的作者进行再统计,结果如表3所示.由表3可知,第一,我国在线学习行为分析研究的发文数量最多的是刘三女牙,高达9篇,其次是刘智(8篇)、郑勤华(7篇)和刘清堂(6篇).第二,排名前10的作者发文数量,累计频次为34.11%.由此可知,以上排名前10的作者是我国在线学习行为研究领域中的重要人物,他们的学术热情高,科研能力强,在研究成果产出方面有着举足轻重的作用.

4 研究热点与发展趋势分析

4.1研究热点分析对某一研究领域热点的把握,可以通过CiteSpace对期刊文献信息进行可视化分析生成研究热点知识图谱、挖掘和分析文献高频关键词实现.

4.1.1 关键词共现分析视图 本研究借助CiteSpace软件,通过关键词共现功能对170篇样本文献进行关键词共现分析,形成了在线学习行为分析关键词共现分析图,如图4所示.关键词共现图谱显示:共现图谱中共有节点166个,连线317条,网络整体密度为0.023 1.在图4中,一个节点代表一个“关键词”,关键词是对整篇文献的概括,节点越大说明关键词的频次越大,说明某研究方向在一定程度上是该领域内的研究热点;而“中心性”则是衡量节点在网络中重要性大小的一个指标,中心性值高,说明与其联系的关键词越多,能起到链接作用越大,重要程度也就越高.因此,通过比较关键词的中心性与频次,能更精确深入地发现在线学习行为研究热点.表4为CiteSpace软件统计出的频次排名前15位的关键词.

图4 关键词共现图谱

排序频次中心性关键词排序频次中心性关键词1390.45学习分析970.10社会网络分析2300.40在线学习1060.06学习效果3180.39MOOC1160.04SPOC4130.07大数据1260.07网络学习空间590.16学习投入1350.02在线学习行为690.04数据挖掘1440.02在线学习者780.12学习行为1540.02差异性分析880.06慕 课

从关键词出现频次排序看,由表4所示,最高频次的关键词为学习分析,出现39次;在线学习出现频次排名第二,为30次,由于在线学习行为分析是筛选文献样本的重要标准之一,因此其出现在文献样本关键词中的频次最高不足为奇.紧随其后的是MOOC、大数据、学习投入和数据挖掘,其频次分别居第三、第四和第五(18次、13次、9次和9次),说明这四个关键词受在线学习分析研究领域中学者们关注较多,可以推断这4个关键词代表的相关研究方向是在线学习行为分析领域中较为核心的研究内容.数据挖掘是学习分析技术的一种,应用学习分析技术的主要目的是实现对在线学习大数据的分析.

从节点的中心性看,“学习分析”值最高,达到0.45,其次是“在线学习”和“MOOC”,其值分别为0.40和0.39,位列第二和第三,这说明MOOC在在线学习行为分析领域中处于最重要地位.结合其出现频次可知,“MOOC”是在线学习行为分析研究领域的重要热点方向.“学习投入”、“学习行为”和“社会网络分析”三个节点的中介中心度分别为0.16、0.12和0.10,分别居第四、第五和第六位,说明“学习投入”、“学习行为”和“社会网络分析”在在线学习行为分析研究领域的内部连接作用也较强,表现出较强的关联性.这表明,2016-2020年间我国在线学习中,MOOC、学习投入、社会网络分析的研究最为广泛,但是相对突出的研究热点是在线学习的学习投入和社会网络分析,尤其是基于MOOC学习数据的学习投入分析和社会网络分析的相关研究.

探究其原因可能是,MOOC课程是在线学习的先驱,在中国乃至全世界都受到不同学习者的广泛欢迎.国内慕课行业发展受到教育部先后出台的多项鼓励性政策推动,例如2015年,教育部出台了《教育部关于加强高等学校在线开放课程建设应用与管理的意见》鼓励高等院校积极参与制作慕课课程、建设线上平台,同时提倡创新.目前,我国已上线5000门慕课课程,参入学习的高校学生和社会学习者突破七千万人次,参与慕课制作和平台建设的高校数量、慕课总数、学习人数和增长幅度均远超其他国家,位居世界第一且保持着稳健的增长势头.因此,我国的在线学习行为分析多是基于MOOC课程的数据进行研究.

4.1.2 时间线视图 时间线视图可以通过按时间先后顺序将每个聚类的节点排布在同一时间线上,勾画出该聚类的历史跨度,因此,时间线视图有助于对研究热点的时间分布的明确认识.借助CiteSpace的Timeline功能做进一步的时间线图分析,结果如图5所示.在时间线视图中(图5),某两个关键词之间具有线条则代表这两个关键词之间存在联系,线条的颜色则对应着不同的年份.图5中的线条颜色分别有蓝色、绿色、黄色、红色4种,依次代表2017年、2018年、2019年、2020年出现的关键词与在其前面出现关键词的共现联系.

图5 聚类分析时间线视图

从聚类分析时间线视图来看,2016年以前,出现的研究热点不多,且中心度和研究频次相对较少.主要的研究热点是在2016年出现的,其中最为突出的是学习分析、在线学习、MOOC、大数据和SPOC.在2017-2019年间出现了大量新的研究热点,但整体的中心度和研究频次均不多.2019—2020年之间,新的研究热点出现较少,主要是继续深化以前出现的研究热点.2020年的研究热点出现数量呈继续上升的趋势,2020年的研究则主要以社会网络、学习行为序列、聚类分析、优化模型、人工智能、交互模式、认知投入等方面的研究为主.因此,社会网络和深度学习支持的学习分析研究在未来一段时期内仍将是重要的研究主题.整体上看,本领域研究的特点是趋势上静态稳定、方向上逐渐细致与成熟.

4.1.3 在线学习行为研究代表性文献 图4可视化了样本文献的重要关键词以及各关键词之间的联系.为探究各关键词之间更深层次的关系,本文利用CiteSpace软件对关键词进行聚类分析,聚类结果如图6.由图6可以看出,联系紧密的关键词会相对形成一个个小的团体,进而可将这个小团体中的关键词进行归纳总结,总结出一个个主题,然后对主题进行详细论述,其本质就是人工的聚类分析.聚类结果中的模块度Q=0.610 7,远高于0.3,所以此次聚类的结构是显著的,是可信服的.轮廓值S=0.534 8,略高于0.5,所以此次聚类是合理的.

图6 基于关键词的聚类视图

为呈现出连接成分的主要聚类,运用CiteSpace软件的自动选择功能进行筛选,最终过滤得到五大主要聚类,分别是: 社会网络(# 0) 、数据挖掘( # 1) 、交互中心度( #2) 、大数据( #3) 、社会网络分析( # 4).结合聚类主题以及权值较大的关键词进行分析,可以揭示在线学习行为研究领域的知识结构、热点问题、动态演变,其中权值较大的关键词为各聚类的主要研究热点问题[3].为在一定程度上理清关键节点文献在聚类之间或内部的转折作用,把握理论发展的变化,在梳理分析关键节点文献后进行具体阐述.

从聚类结果详情中可以看出,排名首位的聚类规模大小为24,“社会网络”、“在线学习者”和“联通主义”是这一聚类中较大的标识词.基于在线学习者在联通性慕课(cMOOC)学习中产生的行为数据,通过社会网络对学习路径或模式转变分析是该领域最为关注的热点.这一方面的代表性文献是《优秀的慕课学习者如何学习——慕课学习行为模式挖掘》、《cMOOC学习者知识流动特征与交互水平关系研究》、《基于全脑模型的在线学习者学习行为序列分析》,等.[4-6]

排名第二的聚类规模大小为22,“数据挖掘”和“学习行为”是其权值较大的标识词,表明利用数据挖掘的方法对学习行为数据进行分析是在线学习行为分析领域研究的热点主题.这一方面的代表性文献是《慕课环境下学习者学习行为差异性分析研究》、《edX平台教育大数据的学习行为分析与预测》、《面向在线讨论的时间序列建模实验》,等.[7-9]

排名第三的聚类规模大小为20,“交互中心度”、“社会性交互”、“学习预警”以及“交互质量”是其权值较大的标识词,表明针对学习者交互的研究以及对学生学习进行干预是该领域的又一热点主题.这一方面的代表性文献是《MOOCs中学习者论坛交互中心度与交互质量的关系实证研究》.[10]

排名第四的聚类规模大小为18,较大的标识词是“大数据”、“学习风格”、“知识构建模式”、“人工智能”,通过对此聚类的标识词综合分析发现,这一聚类以基于人工智能和大数据的个性化学习研究为中心.这一方面的代表性文献是《在线视频学习投入的研究——MOOCs视频特征和学生跳转行为的大数据分析》、《人工智能支持下自适应学习路径构建》.[11-12]

排名第五的聚类规模大小为17,较大的标识词是“社会网络分析”、“学习绩效”、“交互模式”,反映出基于学习者在线交互的社会交互分析与学习者学习收获研究、构建学习者模型在该领域中的重要性.这一方面的代表性文献是《不同关系定义下在线交互网络特点及其与学习绩效关系——以SPOC论坛为例》、《学习者社会网络交互、情绪表征与学习成效的关系研究》、《混合学习环境中主动性人格和人际交互与学习绩效的关系研究》,等.[13-15]

综上所述,借助关键词频次和中心性以及基于代表性文献的分析,我们可以概括出目前在线学习行为研究的国内热点主要聚焦于以下几个方面:一是在线学习行为分析研究多是基于MOOC平台所记录的学习者在线学习的行为数据;二是利用数据挖掘的方法探究在线学习行为大数据,关注学习者的学习投入、学习效果;三是对在线课程的学习者进行在线学习过程中产生的数据进行社会网络分析.

4.2在线学习分析研究演进脉络分析时区视图可以按时间跨度呈现出知识演进的情况,清楚地展现出新兴研究主题的出现以及各研究主题之间的相互影响.某两个时间段的传承关系可由这两个时区的节点之间联系的数量来体现,且呈正相关关系.借助CiteSpace的Timezone功能做进一步可视化分析,结果如图7所示.关键词节点内圈的颜色表示不同时间段出现,关键词之间的连线代表其存在共现关系,连线的粗细代表共现的强度,连线的颜色则可表示节点之间共现的年份,且与图7中上方年份对应,即紫色-2016年、蓝色-2017年、绿色-2018年、黄色-2019年、红色-2020年.节点最外层为紫圈可说明其中心度较大.

图7 关键词共现时区视图

2011年美国新媒体联盟发布的《地平线报告》将学习分析定义为影响教育发展的新兴技术,此后迅速受到国内学者的广泛关注.随着近些年教育信息化的不断深入开展,基于教育大数据进行学习分析的研究大规模兴起.关键词共现时区图谱表明:直到2016年,在线学习、学习分析、MOOC、大数据、学习行为、学习投入和数据挖掘等关键词字号仍较大,出现频次较高,是在线学习行为分析研究的基础,且在后面几年发表的文献中均有被引用或出现.从2017年至2020年间相继出现热门高频关键词:慕课、在线学习者、网络学习空间、学习绩效、社会网络分析、教育大数据、在线讨论、学习风格、社会网络、认知投入等.“大数据”、“数据挖掘”、“教育大数据”等关键词的高频出现,预示着基于人工智能方法的在线学习分析将迎来爆发期,因为通过对大量数据的分析进行建模是人工智能的本质.对学习者在线学习过程中产生的数据进行分析与建模,并将研究成果与教育学习实例相结合,使得技术手段的标准化优势与人脑的创造力和复杂决策优势得到完美结合.目前人工智能和学习分析的融合应用已深入自适应学习、虚拟助手等场景,未来更多新的场景必将出现.随着未来互联网技术的继续飞速发展,以人工智能为核心技术的“互联网+教育”将是在线学习的核心驱动力.另外,“社会网络分析”最早出现在样本文献中是2018年,在2020年中又出现了“社会网络”,说明基于在线学习行为数据的社会网络分析是该研究领域的研究前沿.此外,使用CiteSpace软件词频探测技术发现(见图8),“学习行为”将依然是未来国内在线学习研究的前沿方向,会持续受到教育领域学者的广泛关注.

图8 突显词图谱

5 研究结论与展望

5.1研究结论通过对中国知网CNKI数据库中2016-2020年在线学习行为分析研究文献进行计量分析、内容分析与可视化分析,本文得出如下主要结论:

1) 从文献发表时间与数量来看,2016-2019年每年的发文量都呈逐年上升趋势,国内针对在线学习行为分析的研究处于稳步发展期.由于2020年文献只筛选到9月,2020年1月 1日至9月31日已有27篇相关文献入库,可以预测2020年及未来对在线学习行为分析的研究仍将是热门领域.

2) 从载文期刊分布情况来看,7本CSSCI来源期刊中,《电化教育研究》、《现代教育技术》、《中国远程教育》、《中国电化教育》刊载的在线学习分析主题的文章数量超过28篇,《现代远程教育研究》、《开放教育研究》、《远程教育杂志》的载文数量均处于11-13篇之间.

3) 从研究机构及其合作关系来看,高等师范类院校是国内在线学习行为研究的主要阵地,具有绝对优势.其中,北京师范大学、华中师范大学、华东师范大学、东北师范大学、江苏师范大学、北京大学发文量和中心性最为突出.然而,这些研究机构之间的合作较少.

4) 从研究者及其合作来看,目前国内已逐步形成了一支在线学习行为分析研究的核心研究者群,这些核心作者的研究成果在质量和数量上均处于较高水平.来自华中师范大学的刘三女牙、刘清堂、刘智、孙建文,北京师范大学的郑勤华、陈丽、武法提、牟智佳,东北师范大学的赵蔚、姜强,是在线学习行为分析研究领域的领军人物,是该领域的主体力量,在一定程度上可从其研究方向发现在线学习行为分析研究领域内的热点与前沿.从作者合作模式来看,基本是同一机构内的合作.

5) 通过关键词分析,结合梳理出的关键文献,从整体来看,在线学习行为分析的研究主题可归纳为三方面:一是在线学习行为数据多是基于MOOC课程所所产生的学习者在线学习的行为数据;二是利用数据挖掘的方法探究在线学习行为大数据,关注学习者的学习投入、学习效果;三是对在线课程的学习者进行在线学习过程中产生的数据进行社会网络分析.

6) 从在线学习行为分析的发展脉络来看,研究者从重点关注学习效果、差异性分析、学习投入等方面,发展到开始聚焦在线学习者的社会网络分析、学习预测、学习干预等问题.另外,在线学习行为分析仍将获得该领域研究者的持续性关注.

5.2研究不足与展望在文献分析的基础上,本文认为国内在线学习行为分析研究未来可能的研究方向和需要解决的问题有:

1) 跨学科合作和技术融合将会是在线学习行为分析领域的重要趋势.数据挖掘技术与教育学、管理学、社会学、心理学等学科相关理论结合的应用创新将会是新的研究方向.教育学、管理学、社会学、心理学等学科在学习行为等方面积累了大量的重要理论,为掌握更全面的数据信息、认识更深层次的学习问题提供了有力支撑,但当前的研究大多数与其联系还不够深入.再者,如何针对在线学习行为分析的具体内容对已有的数据挖掘算法进行改进也是值得关注的研究问题.例如,运用特征工程方法提取有效的学习行为特征并进行量化和编码;根据学生学习行为特征改进聚类算法,使得聚类效果更佳;在对学生成绩或学业拖延情况进行预测时,改进预测算法以提高准确率.另外,如何针对具体问题将其他学科的算法改进后应用于在线学习分析也有待专家学者进一步研究.例如,将深度学习算法与在线学习行为分析进行结合;将人工智能领域的多视图聚类算法改进后应用于在线学习分析.

2) 基于多模态数据与学习行为数据,利用人工智能方法对学习分析展开研究将是未来学习分析领域的新研究方向.在传统的学习分析研究中,研究者普遍关注结构化数据,如在线学习环境中学习者的学习行为日志,并且目前很多学习平台也更倾向于记录学习者的过程性学习行为数据,这导致经典的学习分析较少涉及学习者学习过程中的面部与肢体等信息[16].伴随着低成本模态传感器和物联网方法的成熟,多模态数据建模可实现自动收集各种细粒度的学习者数据,在分析时对不完整数据集进行信息补偿[17].生物多模态数据适用于研究学习者认知、学习情感、心理状态等,整合学习者在线学习行为数据与生物多模态数据,可帮助研究者更全面、客观地刻画在线学习者的学习全景,探索智能时代的学习规律,进而更好地开展学习设计和干预策略设计工作.

3) 由于用户隐私等问题,研究所需要的数据集获取难度较大,这会制约着在线学习行为分析领域的发展.目前大多文献中的数据集来源于各大高校内部的学习平台私有数据,已公开的数据集仅有edx平台上的16门课程的学习数据和UCI数据库中少量的学习数据.此外,各学习平台拥有的学习行为记录以及不同研究所使用的数据集都不尽相同,使得研究结果的可移植性差、普适性低.因此,如何使各平台记录的信息一致,使研究数据集在安全的情况下公开供研究者使用等问题有待进一步探索.

4) 跨学校或机构的合作研究将会驱动未来在线学习行为分析研究.本文发现研究机构较多,高校师生是主要研究者,但跨学校或机构的合作研究仅占少数.然而,“校校”合作以及研究者之间的合作研究,有助于我国在线学习行为分析领域形成核心研究团队,展现整体优势,推动我国在线学习行为分析的研究进程.

5) 近年来,学习干预领域的研究基本基于传统课堂或在线学习平台展开,亟待从以下几个角度进行加强:现有研究中的学习干预对象仅限于已在学习上表现出困难的学生,而未能及时关注具有潜在困难的学生;已有学习干预方面的文献,主要聚焦学生活动参与情况,忽视了学生对课程知识点的掌握程度;干预模型更多的是干预流程,还需明确教师或在线学习平台何时采用何种干预策略.[18]解决以上几点问题,既能提高学生的学习成效,又可科学地追踪学生学习进展,也促进了技术与课程的融合.

本文主要使用Bicomb软件以及CiteSpace软件基于170篇文献样本对我国在线学习行为分析研究进行计量分析和科学知识图谱分析,研究还存在以下不足:一是本文基于发表在CNKI数据库中的7本CCSSI来源期刊的相关论文进行分析研究,一些并未以论文形式发表在其中的研究成果在一定程度上也有较大的参考价值,但未能在本文对在线学习行为分析发展现状分析中得以体现;二是在对软件处理结果进行分析时发现,Bicomb和CiteSpace软件存在一定的不足,比如,无法对意义相近的关键词或主题词进行智能合并等,需研究者人工分析合并进行处理,这可能会影响研究结果的准确性.

猜你喜欢
聚类学习者领域
电子战领域的争锋
你是哪种类型的学习者
十二星座是什么类型的学习者
2020 IT领域大事记
基于K-means聚类的车-地无线通信场强研究
领域·对峙
青年干部要当好新思想的学习者、宣讲者、践行者
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法