【摘 要】 在数据分析驱动教育变革的大数据时代,教育领域蕴藏着具有广泛应用价值的数据。通过教育数据挖掘构建教学变量相关模型、探索学员行为态势的影响机制,是具有较高实践价值的研究选题。本研究以浙江省教师MOOC培训平台中的课程作为研究对象,以网络数据分析工具为依托,采用基础数据整合、聚类结构变换、可视化、回归分析等数据处理和学习分析技术,从资源使用率、搜索词关联度解析、互动版块相关性三个维度对在线教育平台的日志和学员行为数据进行挖掘分析,研究并解析学员群体在线学习特性和学习态势的影响机制。挖掘结果可为量化评估学员的在线行为态势、学习效果及支持服务等提供参考。
【关键词】 在线教育;学习行为态势;象限;数据挖掘;维度;回归分析;互动版块;相关性;优化
【中图分类号】 G40-057 【文献标识码】 A 【文章编号】 1009-458x(2018)10-0035-09
一、引言
随着云计算+工业4.0的整合,“互联网+”教育近年来在国内全面提速,教育部早已不动声色地悄悄布局。2012年3月教育部印发了《教育信息化十年发展规划(2011—2020年)》,明确各级政府以教育信息化带动教育现代化,以优质教育资源和信息化学习环境为基础,以学习方式和教育模式创新为核心的工作思路。2014年11月,教育部、财政部、国家发改委、工业和信息化部、中国人民银行联合发布关于印发《构建利用信息化手段扩大优质教育资源覆盖面有效机制的实施方案》的通知,为未来六年中国教育信息化绘制了一幅清晰的蓝图。2016年6月,教育部在关于印发《教育信息化“十三五”规划》的通知中提出要建立健全教师信息技术应用能力标准,将在线教育列为今后重点发展的政策之一。在这样的大好形势下,各教育机构和企事业单位使出浑身解数欲在这个市场中赢得先机,网易公开课、学堂在线、MOOC联盟等在线教育平台如雨后春笋般出现(裴莹, 等, 2017),在线学习者规模日渐庞大。
区别于传统教育,在线教育平台中学习者的任何在线学习行为都能以数据化的形式记录并保存于本地服务器或云端,因此学习行为数据以指数规模迅速增长。在这样的背景下,以网络数据分析工具为基础,有效挖掘并整合数据,以分析在线学习者学习行为态势,为教师和平台管理者提供数据参考,成为国内外研究的重点(杨现民, 等, 2015)。在数据分析驱动教育、变革教学的大数据时代,教育领域蕴藏着具有广泛应用价值的海量数据,利用教育数据挖掘和学习分析技术研究学员在线学习行为态势,探索教学变量之间的影响机制,构建教学结构的相关模型(方海光, 等, 2016),为教育教学决策提供有效的支持,将成为未来教育的常态发展趋势。
研究表明,教师学员的在线学习行为受到诸多因素影响,包括内在因素和外在因素。内在因素包括技能基础、学习期望和自我效能,外在因素主要包括政策、规章制度、平台环境、在线资源等。在线教育环境囊括了上述的平台环境与在线资源,作为影响教师学员在线学习行为倾向的重要因素,虽已引起关注,却少有研究深入挖掘平台在线环境与学员学习行为态势的关联性与影响机制(Daniel J; 2012)。因此,探究在线教育环境下学员学习行为态势的影响机制对优化平台资源建设、提升学员学习满意度和在线平台竞争力具有重要作用。尽管目前国内关于教育数据挖掘的研究和文章比较丰富,但仅侧重于对国内外教育数据研究现状和数据分析模式的介绍,对在线教育平台中学员数据分析的实际案例分析很少,仅有的几篇文章也只是对资源页面的点击量等日志数据的浅层次分析,并未多维度深层次地立体解析在线数据(Grainger, B, 2013)。在这样的背景下,本研究选取浙江省教师教育平台中的一门在线课程作为研究对象,基于网络数据分析工具和学习分析技术,采用多维分析方法,深入挖掘在线环境对学员学习行为态势的关联性与影响机制,跟踪学员的成长轨迹,捕捉学员群体或个体的在线学习态势,并以此定位平台功能模块、教学资源的种种缺陷(Chafkin, 2013)。本研究对教育数据挖掘与学员行为态势的实证研究将有助于改变目前国内教师在线教育海量数据挖掘分析匮乏的现状,有助于促进教师教育在线培训模式的多样化、菜单化和个性化定制,为我国各类在线教育的深度发展提供新的研究思路。
二、平台分析机制
对平台上学员行为态势分析的主体思路是建构不同数据集群应用的导向因子框架,运用大数据挖掘、语义分析工具、网络数据归因函数挖掘,并重构在线学员对平台各资源版块的使用状态和占用细节,在此基础上深度解析学员学习行为态势的影响机制。
图1所示为建构的平台学习行为态势数据分析技术架构,具体包括站点利用率分析、学员搜索关联度解析、互动版块相关性分析。三者不仅是学员行为态势分析的关键因素,同时相互之间也是渐进深入的关系。其中,站点利用率分析是学员行为习惯分析的首要步骤,主要包括站点访问频度、页面访问细节、浏览次数、独立访问IP、独立访客、站点跳转等因素,通过数据集分析组件Oracle Analysis Service、网络数据分析工具Tableau和Max Compute导向至下一维度。学员搜索关联度解析包括搜索词语义解析、關键词相关度解析两个分维度,两者通过相异性分析实现数据分析的耦合。学员搜索关联度解析是学员行为态势分析的核心组件,能有效洞察学员的学习喜好和在线行为趋势(余鹏, 等, 2016)。互动版块的相关性分析以MapReduce、Spark、Hive作为流数据分析组件,通过与学习效果的差异性关联,实现对两者相关性的研究,主要包括总体访问数据、互动区活跃度比对、互动维度解析、回归分析、学习效果影响维度等(Arnold, 2012),将互动版块各类差异性功能模块的活跃度与学员学习效果相关性作为研究对象,以此探索学员在互动区的行为态势与学习效果之间的关联度。
三、学员在线学习态势分析
学员在线学习态势数据挖掘的基础是站点利用率分析,主要分为站点访问、页面占用、资源利用三大块数据研究面,从数据解析的可行性来看具体包括独立访客(UV)、浏览次数(PV)、资源访问频次(VV)、独立IP、链接来源(SA)、站点跳转(Tc)、站点停留时间(Ts)、页面停留时间(Tp),从资源利用的角度显现平台中学员的在线学习模式。
研究基于2017年上半年浙江省教师MOOC培训平台中的学员学习数据,以平台中的一门精品在线课程“多媒体课件制作在小学科学教学中的高级应用”作为分析对象。课程共七章,按照教学重点可分为九大版块内容,包括音视频、动画、美化大师、插件、FocuSky、控件、SmartArt、课件母版、应用案例。开课时间为2017年3月20日至2017年6月20日,跨度三个月,本时间段选课总人数为2,705人。
(一)站点利用率分析
对站点利用率的分析主要关注两个参数:IP、UV。独立IP用于统计学员在访问站点时的独立IP地址,通过该数据可以掌握学员群体访问站点的广度和深度;独立访客(UV)为单日内访问站点页面的访客数,相同访客多次访问站点页面仍计算为1个独立访客。上述两项参数与站点停留时间(Ts)、页面停留时间(Tp)等参数协同分析,可挖掘出学员浏览站点资源的集中时间段和学习行为态势等基本学习习惯。
如图2所示,通过日均UV、IP地址基础数据的曲线展示,选课学员群体在工作日白天有三个学习峰值,分别对应的是9:20-10:00、12:50-14:00、15:30-17:00,这三个时间段正好与各校学生的课间休息阶段和下午的自习阶段相契合,由此可见大多数教师学员更倾向于利用工作日空余时间进行学习。值得注意的是,这三个井喷时间段中的UV值远大于IP值,通过比对发现同一学校不同教师学员在访问站点时,后台所记录的访问IP地址一致。由上述两个数据挖掘结果可推断为大部分学员更乐于在工作单位进行学习。从微观上分析,学员个体每次登录学习的时间较短,平均持续7-10分钟,3-5分钟的也占了相当一部分比重。如图3所示,根据学员活动曲线展示,总体来看非工作日平台中学习的学员人数一直保持在低位,这出乎大多数教学研究人员的预料。由上述分析可知,学员更善于在日常工作进度中充分利用课余时间进行知识点和技能的学习,碎片化学习的氛围比较浓厚,符合在线学习的教学态势。
浏览次数(PV),即“PageView”值,用以衡量站点资源持续访问情况,学员每打开站点页面一次,PV值加1, 学员多次打开同一页面则PV累积计算,可有效反映页面的受欢迎度。对课程九大版块内容的UV与PV值比对同样可以挖掘学员学习行为规律和态势。如图4所示,美化大师、插件、FocuSky、控件的资源访问度的UV值整体处于低位,但PV值非常高,两者的访问数据值差异很大,表明这四大部分版块内容尽管并不吸引所有学员的关注,但有一部分特定学员对该页面资源的持续访问热度较高。因此,平台后续的优化措施可考虑将美化大师、插件、FocuSky、控件这四个模块内容整合为专题版块。
(二)资源链接跳转分析
对学员群体浏览当前页面资源的链接源进行追溯,可有效反映学员的学习喜好,并充分挖掘站点内各资源页面的相关度和关联性。在展示资源链接相关性分析结果之前,需要引入本平台主要的一个链接观察参数“网页搜索蜘蛛”(SearchSpider),依据平台在线搜索关键词,网页搜索蜘蛛“SearchSpider”通过各访问资源中的链接跳转分析访问抓取相关资源,按照所抓取的资源数累积总量给SearchSpider赋值,SearchSpider赋值加1,则代表着搜索工具被调用一次。通过MatLab对被访问的资源页面上一级链接跳转源进行仿真,并展现数据集的可视化效果,具体如图5所示。由图5可见,在众多教学资源板块中,访问“交互模块资源”“教学实践附件”“教学在线视频”时SearchSpider的调用赋值都处于高位。其中,“交互模块资源”的SearchSpider调用赋值最高,反映了平台交互讨论版块具有较高的黏度,该版块中的学习具有很强的热度和自发性。这从另一个侧面反映了交互模块与其他资源模块的关联度较低,课程页面的模块设置并不完善,学员在平台的学习过程中有很大概率是通过资源搜索工具尋找各类教学资源,因此就这一点来说平台具有明显的缺陷。
(三)课程搜索关联度解析
根据教学内容的侧重关系,该在线课程包含一定数量的关键词,用以描述资源的主要内容和展示相关性课程内容热点。在对关键词进行解析的过程中,一旦发掘出若干关键词在多个资源内容中重复出现,就可以证明这些关键词至少具有松散的内容相关性(邢蓓蓓, 等, 2016);如果这些课程关键词共现的频次较高且趋于稳定,则可以推断这些关键词具有必然联系。
按出现频次高低对课程搜索关键词进行排序,首先剔除出现频次可忽略不计的关键词,利用后台跟踪查找插件iquerypress对该门课程的所有搜索关键词进行访问频次统计,并以逐次迭代的方式对搜索关键词访问频次数据集进行归类汇总、聚类分析、排序,以资源搜索分析的视角建立共词频次矩阵,如表1所示。
共词频次矩阵可有效展示不同关键词相关性的紧密关系。表1对角线中的数据表示为所对应的课程搜索关键词出现的频次,而其他位置的数据则表示所对应横排和竖排不同课程关键词的共同搜索频次。如搜索关键词“动画”共出现276次,而搜索词“动画”和“FocuSky”共现133次,也可以理解成采用逻辑方式“与”搜索“动画”和“FocuSky”的频次为133,两者具有较高的耦合性。表中其他数据依此类推。
对课程关键词相关性进行多元图谱分析,挖掘关键词频次数据所隐含的教学内容聚合度信息,需要对共词矩阵的数据模式进行变换(Pistilli, 2010)。在表1的数据基础上,借鉴Sharikiv相似性系数法则,实现对关键词频次矩阵的相似性转换。Sharikiv相似性聚合计算公式为:
式中[Vi]代表横轴关键词的相关频次,[Vj]代表纵轴关键词的相关频次,[Vij]表示两者相交的相关频次。经过相似性数据聚合算法,得到如表2所示的课程资源搜索关键词聚合频次数据。
经过聚合度解析,相似矩阵中的数据成为非对称聚合数据,其数值大小表明矩阵关键词的相似程度,数据越大表明搜索关键词之间相似度越小,距离越远;反之则表明搜索关键词之间相似度越大,距离越近。运用SPSS的數据结构化变换—整群分析—聚类—异类—相异性算法—多维整编进行搜索关键词图谱分析,得到如图6所示的课程搜索关键词关联度图谱。
图6所示为搜索关键词关联度的图谱分析,靠得近的关键词在本门课程的教学过程中具有更大的关联性。关键词搜索的关联度集中分布于多维图谱中的第二、第三、第四象限。在第二象限中“FocuSky”“动画”比较集中,说明这两个搜索关键词的相关度比较高;在第三象限中“音频”“视频”“控件”“插件”比较集中,说明这四个关键词的教学内容相关度较高;在第四象限中“SmartArt”“艺术字”“图片处理”“美化大师”比较集中,说明这四个教学内容相关度比较高;尽管“母版”与“超链接”分处于不同的象限,但是这两者的联系也比较紧密,说明其教学内容的关联度也比较高;第一象限只有“公式编辑器”关键词分布,说明“公式编辑器”与其他搜索范畴的相关性不大,教学内容与其他关键词联系不紧密。以多维象限图谱中搜索关键词关联度为依据,今后对本门在线课程资源的优化应注重将象限图中贴近的关键词进行教学内容的重新整合:进行“图片处理”学习资源教学设计的时候应注重与“SmartArt”“美化大师”“艺术字”内容的融合;“FocuSky”的资源设计应重视嵌入“动画”教学内容;“插件”教学内容的搭建应注重与“视频”“音频”“控件”这三方面教学内容的整合。
(四)论坛描述性细节分析
学员在平台中论坛的交互情况在一定程度上能够反应平台的受欢迎程度和学员沟通互动的主动性、积极性。首先通过对课程论坛区总体交互情况的统计,学员参与论坛(包括浏览、发布、跟回帖等操作)共计2506人,占总人数的92.64%;首帖数共计1373,跟回帖数共计9257,平均每帖跟回帖数6.74。说明课程在日常教学过程中,参与互动讨论的学员积极性、主动性较高,交互活动频繁,论坛内研讨氛围热烈。论坛交互主题见表3。
图7所展示的为课程互动版块交互关注度主题占比。由数据可知,论坛中的“技术讨论”占了主流,而且技术性帖子交互性更强,更能引起学员之间的激烈交流,帖子受持续关注的时间更长。
交互板块的研究可以从多个维度展开,本研究通过标准误回归分析来深入挖掘互动区活动情况与学员学习效果的相关性。摒弃相关性低等无效因素,归纳为理论层次交互、技术层面交互、设计层面交互、信息资源交互、评论性交互共五个维度。以首帖回帖量、跟帖量、每帖字数、关键字量、每帖点击量作为观察参数,做出帖子交互性回归模型,指标综合判断样本模型拟合度较好,如表4所示。
由表4可见,“理论层次交互”四个参数的相关系数中只有“首帖跟帖、回帖量”的相关标准误DW=2.538(介于2-4之间),表示该项作用误差为偏弱的正相关;四个参数的决定系数(R方)都较小,其中只有“关键词量”稍大于0.2,但也极微弱,对在线学习的导向作用不明显;有一项变量的回归系数显著性检验t=-2.481(<0),其余三项的显著性检验t不显著。同时,该交互式回归模型的零阶远偏离于0.000,容差也大于1.000,远远超出理想的适配区间(0.05-0.40)。上述两方面数据说明“理论层次交互”对学员学习效果提升向负相关趋近,回归系数未达显著性趋近指标。因此,“理论层次交互”对在线学员成绩提升的作用不明显,通过“理论层次交互”的学习难以有效提升学员的学习效果。
“技术层面交互”四个参数的相关标准误DW取值均在2-4之间,表示作用误差的相关为强正相关;四个参数的决定系数(R方)和调整(R方)都较大,达到了显著正向水平,说明技术层面交互对教师学员创新性和在线教学的感知易用性有显著积极的影响。同时,四个变量的回归系数显著性检验t的数值相对较大,而且“成绩趋近相关”的零阶趋近于0.000,容差也在理想的适配区间(0.05-0.40),回归系数接近于强对应状态,验证了其内部维度的相互作用关系。因此,三个维度的参数都趋近于理想状态,“技术层面交互”对学员学习效果的提升作用显著。
“设计层面交互”四个参数的相关标准误DW值有两项介于2-4之间,另两项超出这个范围,四个参数的决定系数(R方)和调整(R方)较平均,因此仅从这些参数无法判明对学习效果的相关性作用。继续观察四个变量的回归系数显著性检验t,发现t的数值都处于理想的正相关取值范围内,同时“成绩趋近相关”的零阶也比较小(未趋近于0.000),但容差值位于理想的适配区间(0.05-0.40)之外。因此,“设计层面交互”对学习效果的影响正相关,对教师的创新性引导具有积极正向的影响,但并未达到显著水平,对学习效果提升的影响较有限。
“信息资源交互”四个参数的相关标准误DW值有三项介于2-4之间,另有一项超出这个范围,因此其作用误差处于理想的正相关状态;四个参数的决定系数(R方)和调整(R方)的绝对值较大,对教师学员的人际相互作用和在线教学感知易用性具有明显的正向作用;四个参数的回归系数显著性检验t都处于比较高的水平,同时“成绩趋近相关”的零阶趋近于0.000,容差处于较低水准,位于理想的适配区间(0.05-0.40)之内。因此,“设计层面交互”与学习效果正相关,达到显著水平,具有积极的影响。
“评论性交互”四个参数的相关标准误DW值有两项介于2-4之间,另两项超出这个范围,四个参数的决定系数(R方)和调整(R方)绝对值较平均,因此仅从这些参数无法判明相关性作用。继续观察四个变量的回归系数显著性检验t,发现有两项t的数值均小于0,处于趋近负相关的状态;再次观察“成绩趋近相关”的数值,发现“成绩趋近相关”的零阶远远偏离0.000(>0.100),容差也处于较高水平,超出理想的适配区间(0.05-0.40)。因此,“评论性交互”对学习效果的正相关未达到显著水平,该方面的交互对学员在线学习效果的提升较有限。
对表4中的四个方面的交互进行横向比较,“技术层面交互”和“信息资源共享”中四个参数的均值都远大于“理论层次交互”“评论性交互”中的四个参数均值。这既反映了交互版块中“技术层面交互”和“信息资源共享”在学员群体中的受欢迎度,也从另一方面印证了四大交互趋向主题的导向及对学习效果提升的差异性。因此,有必要对课程交互版块的交互内容做进一步梳理和引导。
四、研究讨论
通过上述对该门课程选课学员的日常在线行為的数据挖掘,并整理在线点击行为、跳转、论坛互动等数据,得出如下结论:
1. 学员群体在线学习时间呈现特征化规律。通过图2所示学员日均IP、UV曲线比对可以看到,大部分学员更倾向于在工作单位利用课间空余时间学习,受日常工作作息的影响比较明显,呈现碎片化学习态势;学员工作日晚上或周末的学习态势倾向性不明显。因此,对该课程进一步优化时可以考虑合理配置平台服务器各资源链接访问量阈值,并设置随时间周期性灵活改变的带宽通道以满足平台在线教学的流量需要,当访问量小的时候将流量资源释放给其他课程,当访问量大的时候提升带宽以满足本课程访问峰值需要。
2. 特定学员群体对课程各学习点内容的关注度具有偏向性态势。通过图4中的PV、UV对比可知,部分学员对课程中美化大师、插件、FocuSky、控件四个教学内容的学习热度比较高,并且热度持续性较强。因此,可将这四个模块内容整合为专题版块,可考虑引入大数据个性化推荐机制,在课程运行过程中以个性化推荐的形式将这几个专题推荐给可能有兴趣的学员;在交互版块中设定特定区域为这四块教学内容提供专题研讨服务,并通过在交互版块中设置专题导师来引导有兴趣的学员对这几个主题内容进行更深一步的挖掘研究。
3. 课程模块的结构设置对学员在线学习轨迹的影响较大。课程平台中各功能模块导航链接的结构设置体现了平台设计者的理念,同时也反映了课程教学内容的重点和难点。通过图5可知,本课程学员热衷于通过交互版块实现知识技能的学习,这本是件好事,但也由此暴露出课程的重要模块设置不清晰、学员难以顺利找到想要资源的问题,使得通过平台中的搜索引擎查找资源成为学员在线学习中的大概率事件。另外,学员必须通过复杂的子模块链接点击才可以到达交互版块,这也是平台使用过程中非常烦琐的一点。针对上述缺陷,可以对平台的功能模块进行如下优化:①开发关于课程资源的专栏版块,对资源的教学指向进行细分,并在平台的主界面上做出明显的指向模块链接,可考虑在平台主导航栏中增加针对资源的子导航,也可以设计醒目的浮动窗口来指向资源版块;②在课程各类内容界面下方设置交互评论版块,或设置浮动聊天室,方便学员在学习过程中随时与学伴在线互动,在第一时间解决关于内容的疑惑。
4. 通过搜索关键词共词分析,展现出学员在本课程在线学习过程中的知识体系谱系图,也更加明确地揭示出课程各学习要点的相关性对学员的学习具有导向性。通过图6课程关键词多维图谱象限可知,课程的各关键词学习要点之间存在或紧或松的关联,而这会对学员的学习行为产生导向作用。学员群体在学习某个关键词知识点内容的过程中,同时会渴望获得与该关键词关联度比较大的周边关键词群体的内容。因此,对各关键词知识点和学习导入结构的合理调整就显得尤为必要,在下一步的优化中必须注重在各教学资源中整合相近的关键词知识点,这一举措将会在学员的学习中体现出知识虹吸现象,并有效提高学员在线学习的体验感和课程各学习模块的点击量。
5. 互动版块对学员学习积极性具有显著提升作用。由图5的SearchSpider搜索频次强度曲面和论坛描述性细节分析可知,互动版块的点击量和访问量处于高负载状态;进入课程学习的学员有很大比例是先浏览访问互动版块再进入其他资源模块学习,这说明互动版块对学员学习的积极性和导向作用非常明显。除此之外,尽管表4所展示的帖子交互性回归模型中各细分版块的访问均值和标准差存在较大差异,但即使是交互量最低的“理论层面交互”其均值仍高于其他功能模块的浏览访问量,这更加说明了课程中互动版块对学员在线学习的虹吸作用。但是也应看到,互动版块中存在对于课程内容的浅层次研讨和与主题无关的互动内容。针对这个问题,平台在下一步的优化中可以考虑在互动版块中研究设计敏感互动关键词标注,自动屏蔽与主题无关的讨论;设置专门的在线互动人员或交互式人工智能,引导学员进行关于课程内容的有效讨论。
6. 互动版块具有提升学员学习效果的明显作用,但研讨版块中的细分内容对学员学习效果的提升存在差异。通过在线测试日志发现,在最终学习成绩突出和学习效果提升明显的学员群体中,大部分学员在聊天室、论坛等互动讨论版块中所投入的时间占比较高;通过社交分析工具的统计,在互动研讨区中活跃度越高的学员,其课程学习成绩突出的比率就越高。因此,学员群体对互动研讨区的青睐只是表象,通过在互动研讨区中的学习能实现事半功倍的效果才是最主要的因素,这实际上也揭示了互动协作过程对学员在线学习的重要性。但是,学员在互动版块中关注不同的细分内容会对自身学习效果产生差异化的影响。由表4可见,互动版块中关注重点在技术层面交互和课程资源共享的学员群体,其对课程各知识技能的理解和在线学习的效果都处于较高水平,关注度在设计层面交互和评论性交互的学员次之,关注度在理论层面交互的学员其知识技能的掌握和学习成效最弱。因此,在课程交互版块中应重点考虑布局技术层面交互和信息资源共享两方面内容,丰富、细分并拓展这两类交互内容,力争将更多的在线学员吸引到这两类交互中,提升上述两大交互模块的活跃度,有效提升整体学习效果。
五、结束语
如何提升在线教育平台的吸引力和竞争力,不能仅凭平台管理者和建设者的主观意愿,而应该根据后台所存储的学员在线行为数据所反映出的学员学习态势做出科学判断。目前,国内对学员在线学习行为态势发展的实证研究还比较匮乏,如果能将教育数据挖掘与学习分析技术进行有效整合,将有助于在线教育平台的深层次发展。本研究从数据建模和技术层面多维度地实现对在线教师学员学习行为态势影响机制的量化与评测,对学员的学习喜好和学习行为习惯进行了梳理,探索了教学版块与学习效果的相关关系,并以数据可视化的形式进行了展现。作为整个教师教育网络培训体系中的重要组成部分,对学员在线数据的分析和有效整合具有十分重要的作用。因此,在线教育数据分析所揭示的种种在线教学现象,有助于我们更好地了解学员的行为特性,站在学员的角度来发现问题,并以此为依据优化平台。事实上,教育数据挖掘与学习分析技术在教师在线教育中的作用可以多维度延伸,包括教学资源个性化推送与指导、个性化学习路径导引与推荐、虚拟课堂动态化变换、教学互动多样化等。而如何规划教育数据与学习分析,使数据分析能有效地运行,是重中之重的研究模式。本研究致力于将大数据挖掘技术应用于平台学员群体和个体学习行为态势影响机制分析,跟踪学员在课程中的行为踪迹,具备较高的应用价值,对于今后在线课程平台的大规模教育数据分析有一定借鉴作用。
[参考文献]
方海光,罗金萍,陈俊达,杜婧敏. 2016. 基于教育大数据的量化自我MOOC自适应学习系统研究[J]. 电化教育研究(11):38-42.
裴莹,付世秋,吴锋. 2017. 我国教育大数据研究热点及存在问题的可视化分析[J]. 中国远程教育(5):01-08.
邢蓓蓓,杨现民,李勤生. 2016. 教育大数据的来源与采集技术[J]. 现代教育技术,26(8):14-21.
杨现民,王榴卉,唐斯斯. 2015. 教育大数据的应用模式与政策建议[J]. 电化教育研究(9):54-61.
余鵬,李艳,吕鹏. 2016. 高等院校大数据挖掘与决策分析体系的应用研究[J]. 现代教育技术,26(8):102-108.
Arnold, K. E & Pistilli, M. D. 2012. Course signals at purdue:using learning analytics to increase student success[C]. New York:ACM Press.
Chafkin, M. (2013). Udacitys Sebastian Thrun, Godfather of Free Online Education, Changes Course. Distance Education Report, 12(17):5-25.
Daniel J. 2012. Making sense of MOOCs:Musings in a maze of myth, paradox and possibility. J Interact Med Educat(3):18.
Grainger, B. 2013. Introduction to MOOCs:Avalanche, illusion or augmentation?[M]. Moscow:UNESCO Institute for Information Technologies in Education.
Pistilli, M. D, Arnole, K. E. 2010. Purdue signals:mining realtime academic data to enhance student success[J]. About Campus:Enriching the student learning experience.
收稿日期:2017-09-10
定稿日期:2018-01-20
作者簡介:陈雷, 硕士, 讲师, 宁波教育学院组织部、宣传部、统战部(315016)。
责任编辑 刘 莉 张志祯