陈晓稀+闫冬
摘要:随着教育信息化的快速发展,基于网络的在线学习已经被越来越多地应用到各类学习情境之中。同时,数据挖掘技术在教育领域的应用也逐渐成为当下研究的热点之一。文章利用网络内容分析法对国内近十年来E-Learning数据挖掘领域的124篇相关期刊文献进行量的统计与质的分析,梳理了E-Learning数据挖掘领域的研究现状,基于此提出E-Learn-mg环境下的学习者模型及其对数据挖掘研究的补充,最后分析了该领域的研究发展趋势。文章力求丰富教育数据挖掘相关研究,以期对E-Learning数据挖掘的良性发展有所裨益。
关键词:E-Learning;数据挖掘;学习者建模
新一轮课改政策的发布使得教育个性化发展逐渐成为未来趋势,同时,“在线学习”被明确写入全国两会。教育发展的内部需求和外部环境带给E-Learning无限曙光,也对E-Learn-ing学习系统提出了更高要求,比如对学习者的学习行为进行准确的预测,这就有赖于在现有基础上将学习者模型进一步完善,构成学习者模型的数据进一步充实,与其同时发生变化的是数据挖掘,数据挖掘对象有待扩大,数据挖掘技术有待丰富。
1研究综述
教育数据挖掘是综合运用数学统计、机器学习和数据挖掘的技术和方法,对教育大数据进行处理和分析,通过数据建模,我们能进一步探索学习者学习结果与学习内容、学习资源和教学行为等变量间的相关关系,借此来预测学习者未来的学习趋势。
以“教育数据挖掘”为主题词在中国知网(CNKI)进行全文检索,共得到相关文献1118篇。论文篇数一直随着年份推移而递增,则说明教育数据挖掘研究可谓当今一大趋势。
但是在高级检索中,将主题词更改为“数据挖掘”与“E-Learning”进行二次精检索之后,共搜到参考文献124篇,研究数量的减少一定程度上说明了该研究层次中对“E-Learning”的研究还留有一席之地。其研究领域大致可分为两类:一类是以工程技术为主题的研究,文章内容多为在线学习系统数据挖掘的搭建、优化,以及数据挖掘工具的开发等技术性内容,其数据挖掘平台已经在使用当中,可以为后续学者的研究提供相应的数据来源,数据挖掘的工具在实践中不断经受着检验。例如:陶漪在《基于E-Learning的数据挖掘系统的改进设计与实现》中提出的包括E-Learning编辑服务器和数据处理体系,E-Learning编辑服务器由准备模块、展示模块和生成模块构成的基于E-Learning衍生的数据挖掘系统。
另一类是以评述为主的文献研究,多运用内容分析法在知网或资料中心限定一定时间区间,根据关键词的搜索对文献进行分析和评析,以揭示研究现状并预测发展趋势,教育数据挖掘的趋势已经从“工具开发”向“系统优化”方向进行偏移。例如:刘冰、赵君丽在2015年对教育数据挖掘方法使用的分析中提出“神经网络技术”在教育数据挖掘中使用还不多,主要使用的是聚类、关联规则、决策树,以及指出许多理论研究团队与系统开发团队合作与交流不够充分;丁波在其研究中提出了四点趋势,分别是:开发专门的教育数据挖掘工具、在教育环境中集成教育数据挖掘工具、将教育数据挖掘数据及模型标准化、研究特定的教育数据挖掘的技巧。
另外,笔者发现,对学习者建模的研究文献还相对较少,且发表年份多集中在2010年前后,其构建的模型主要为知识模型、认知模型、情感模型与学习行为模型,在这四个部分中对学习者的知识模型研究最多,例如:赵德芳等学者在《可演化的个人知识图建构及认知评估模型研究》中指出,“在自规律在线学习系统中要构建出学习者的显性知识模型和隐性知识模型,利用两个模型指导系统呈现给学习者知识的方式。”笔者在各类文献研究中发现,学习者的知识模型的研究重点更多聚焦于知识本身,是较为独立的知识,而非与学习者结合的内化知识。独立的知识模型具有较强的可复制性,但其研究对后期学习者行为的预测也将出现较大偏差。
2E-Learning环境下的学习者模型
学习者模型是用于描述学习者认知、情感、学习行为等方面的特征的表示,主要包括知识模型、认知模型、情感模型和学习行为模型四个方面。分析和表示学习者模型的过程称为学习者建模。
现阶段的E-Learning具有大众化与个性化、快速性与一致性、高效率与低成本、可跟踪和可管理的鲜明特点,而针对传统学习模式的学习者模型无法完全满足E-Eearning的特点需求。
从E-Learning教育数据挖掘的角度出发进行思考,本文将对学习者建模进行三方面的扩展,意在构建更具个人学习特点的学习者模型,运用扩展后的模型进行数据挖掘分析,可以对学习者的学习行为进行更精确的预测,以重新组织不同的知识来展现,施以不同的教学策略,从而使自适应的个性化学习与学习者更加匹配,进而提高学习绩效。
1)学习者知识水平建模
学习者知识水平是何克抗先生在《“学习分析技术”在我国的新发展》一文中提出的,现在将这一概念引入教育数据挖掘领域,借此来丰富所构建的学习者模型的数据。此处的知识水平不局限于学习者对课程学习是否具有专业的课程性知识,而是指人具有的各方面的知识。学习者知识水平应该存在于学习者进入学习系统之前所搭建出来的一个数据模型之中。
能够在网上进行自主学习活动的学习者,其知识水平已经达到一定层次,但是对于同一内容的学习,不同学习者的知识水平层次不一,这便影响了学习活动的进行速率。例如,在网络视频课程的开发过程中,我们倘若只按照教学行为的速度安排教学内容的呈现速率,将使得不同层次的学习者接受与理解的结果产生很大差异。
在知识水平维度我们按照何克抗先生对“知识水平”层次的分类一一“初学者、初级、中级、高级、非常高级”五个层次进行速率的设计。同时,不应只着眼于单一知识点检测数據的抽取,而是将知识点、知识单元、课程等多个层面进行数据抽取;另外,我们也不应只着眼于结果性的测试数据,而应加人课程前的测试和课程进行中的测试。通过多方数据进行学习者知识模型的搭建,我们可以将这一模型纳入到学习者建模中,以体现学习者的过程性知识和高阶思维能力。endprint
我们提出的“学习者知识水平模型”的构建完成于学习者进人学习系统之前,那怎样进行学习者知识水平的获取便成为首要问题。理想状况下是学习者的数据在各个系统之间可以共享。例如:新*方学校的中学培训部在课外培训中要求每个学习者使用“Clicker”进行签到、答题等交互性活动,在此时建立好学习者的个人学习数据库。当学习者从初中部升入高中部时,学习者的学习数据(此处主要是对单一知识点的掌握)迁移至高中,此时,高中部的老师能够迅速了解该学习者对之前知识的掌握情况,这无疑使得教与学在知识衔接时的准备更加充足。但是,在不同的在线学习平台之间进行学习者的学习数据共享,就目前情况来看是不容易實现的,这就要求学习者在进入平台学习之前,要进行相应的个人知识水平测定,测定的内容应该不仅仅是学生对知识点的掌握,而应是通过学习者的答题情况得到认知特点与基于认知风格的知识水平模型。学习者知识水平建模是依托大量的相关度分析和回归分析的基础,需要一定数量的在线学习平台中学习者的交互数据,以此建立可靠的学习者知识模型。
2)学习情绪建模
学习情绪是指个体对学习情感的意义倾向,表现为学习者对学习的喜恶感受和体验。现在的学习者模型中,除学习者的知识模型外,对学习者的认知模型等的搭建占有较大部分,而忽视了学习情绪这一心理因素。
郭秀丽在《精心创造有效情景,激发学生学习情绪》一文中指出:“较高的情绪容易促进学习者学习的积极性”。同时,心理学研究表明:一定的连续学习时间内,学习者学习情绪的变化随学习时间的增加呈“u”型变化趋势。这个“u”型变化曲线是基于定量研究的,在每个学习者身上学习情绪的变化与定量研究得出的“u”型曲线不会完全重合,所以我们要针对每个学习者的学习情绪进行模型的构建。在此过程中,学习者兴趣处于“u”型趋势底部时,可以采取创设惊奇等策略,以此激发学习者的学习兴趣,提高学习情绪,进而提高在线学习的绩效。
不仅每一节课程内存在学习情绪的变化,课程内部同样存在学习情绪的变化,如:MOOC学习过程中,学习者的学习活动持续力不强以及弃课率的存在难免与其学习情绪有关。这就要求在学习情绪变化不同的学习者之间采用不同的课程排列方式。从学习情绪出发,使得数据挖掘的范围进一步扩大,要处理神经网络技术、眼动技术记录在后台数据库中的大量数据。瓦拉特普(Vatrapuetal,2013)曾经通过技能测量、微笑等九个指标来描述学习者的学习状态,我们也应该在将来把更加先进和成熟的技术应用于教育数据挖掘的领域中。
3)学习行为特征抽取
在线学习的过程中,教师的角色已经发生了极大变化,他们并不能出现在学生面前管理和调节学习者的学习过程。现阶段,学习者行为的模型多偏向于研究学习者的认知,但认知不足以将学习者的学习行为全部概括。学习者的学习进度以及各种学习活动安排的权力将全部掌握在学习者自己手中,这就造成了不同学习行为之间存在不同特征。如:孙月亚在《开放大学远程学习者在线学习行为的特征分析》中利用实证研究的方法得出了学习者在四个阶段的特征一一重开端、轻视频、重考核、轻反思,并得出了“只有学习者的学习行为才能真正预测学生的学习效果”的结论。
学习者在网络环境下的学习行为在各项研究中包括个体学习行为和社会学习行为两个方面。个体学习行为是指个体自主完成学习任务的行为,具体包括登录行为、阅读行为和提交作业行为;社会性学习行为是指学习者在网络中维系与他人的社会性关系的行为,具体包括在线讨论行为和协作学习行为。
大量具有相同特征的学习行为可以抽象为学习行为范式。例如,加拿大萨斯卡通大学(University of Saskatoon)的布鲁克斯(Brooks,2014)获取在线学习系统中学习者交互数据时,采用非监督机器学习技术,抽取了五种学习者行为范式,包括“活跃型、早期型、及时型、最少活动型和延期型”,他指出活跃型对提高学习成绩并无显著性影响。吴忭等学者也对学习者图示化学习过程开展序列分析,发现具有“概念建构一假设提出一推理论证”学习行为模式的学习者比较容易取得好成绩。
在学习行为特征的抽取过程中,我们需要收集在线学习系统中学习资源的点击次数、顺序及停留时间等数据,这些学习过程中出现的具体数据不存在于服务器日志当中,这意味着教育数据挖掘对象的进一步扩大。收集数据完毕后,我们要从大量的数据中抽离出学习行为的范式或在个人领域内形成资源结构特征,并研究其与学习者生成的形成性评价与结果性评价的关系。
3新的学习者模型下的数据挖掘
在E-Learning环境下的学习者模型为数据挖掘提供了新的可能和新的资源,也提出了新的要求,对应此环境及模型的数据挖掘也应施以新的发展策略。
1)树立对学习者进行长期建模的理念
学习是贯穿学习者生命始终的,这是终身学习提出的概念,尤其在如今高度信息化的社会中,学习者的学习行为不断发生,从学习行为中收集数据,并加以分析处理,以便对之后的学习行为进行更加准确的预测正当其时。正如“常用常新”说的就是这个道理。就学习者的学习内容来分析:单基于皮亚杰的认知发展理论而言,在0-2岁的感觉运动阶段,人们主要进行简单的思考和支配自己的动作;在2-7岁的前运算阶段主要进行的是形象思维的构建,这时学习的内容是简单的、形象的知识;在7-11岁时进人具体运算阶段,这时学习的内容中就可以添加一些具有逻辑性的知识;在12-15岁的形式运算阶段,人们可以接受更加抽象的知识。学习者在不同阶段的学习内容具有不同的特点,这就可以从认知发展维度为学习者搭建个性化模型。这只是一个关于认知的理论基础,就已经将学习者的学习内容划分为四种,随着学习理论的进人,便可组合衍生出更多的情况。不仅在学习内容上情况如此复杂,学习过程中各种有代表性的学习行为都可以为模型增加维度。因此,长期建模的理念是在基于E-Learning的数据挖掘过程中一定要养成的思维模式,其作用是对学习者模型的丰富、完善以及对预测精准度的保证。endprint
2)扩大基于E-Learning数据挖掘的对象
现有文献数据表明在教育大数据挖掘中,主要挖掘对象为:服务器日志、平台课程数据库、论坛帖子集等。但是这些数据远不能满足模型的新需求。例如:要抽象出学习行为的新范式就意味着要分析形成这一范式的数据并进一步将其深化。这一特定数据需要大量信息作为基础,并不能使用原始數据,数据来源便是数据挖掘的对象。数据挖掘对象的增加是由研究所需数据量的增加引起的,这是因为既有的数据挖掘对象无法为新的研究提供所需的数据。同时,不断有新的技术应用于E-learning的数据挖掘中,挖掘对象也随之丰富起来,随着研究领域的扩展和研究层次的深入,数据挖掘对象的增加是必然的趋势。
然而,数据挖掘的对象并不是盲目增加的,还是应该与范式特点具有一定的相关度或者说具有一定的联系性。否则大量无关数据的分析不仅会影响分析的效度,也会降低数据分析工作的效率。
3)在E-Learning数据挖掘中使用新的数据工具
技术的更迭是飞速的,E-Learning数据挖掘作为一个交叉学科更要掌握技术发展的趋势,以促进学科发展,丰富学科内涵。尤其是近年来脑科学研究的不断深入以及传感技术的日益成熟,国内外许多研究者开始对这一领域进行初步探索,其中以眼动技术最为成熟。在我国学者对眼动技术的研究中,已将其数据化,在微眼动的识别和分析技术中,主要涉及的眼动参数有眼球位置、方向、频率、速率、加速度、幅度和持续时间等。通过这些数据的搜集和分析,可以与注意、知觉建立起联系。在此过程中搜集到的数据有赖于小波转换技术去滤掉奇异值再进行分析。当脑科学等技术融入后,学习者模型中的数据不仅是计算机记录的行为数据和知识数据,还是大量的生物数据。生物数据和原有数据进行整合时,有赖于基于小波的识别技术将其进行处理,随处理后的新数据进入新的研究领域和研究视角。新技术带给E-Leaming数据挖掘的不仅是该领域的拓宽,由于技术流入生成的数据模型使得后期的预测将更趋向于精确化。
4)建立基于E-Learning平台间的数据共享
在学习者长期的学习过程中连续使用同一在线学习平台的情况很少。换言之,每个在线学习平台都有其独特风格与专长领域。假设学习者在早期使用A在线学习平台,又更换至B在线学习平台,那么在刚进入B在线学习平台时,该学习者模型处于空白状态,自适应学习系统将无法预测他的学习行为,无法准确判断他原有知识水平等学习者特征。但是,此学习者在A在线学习平台中的学习者模型是成熟的,数据是被大量记录与分析的。在两平台之间实行数据的共享,就是解决这一难题的捷径,即共享原生数据,或共享学习者的模型。具体运行手段可以通过有偿或者建立联盟等方式运行。
假设平台之间选择共享构建的学习者模型,则需要同一模型的规范,正如秦王统一度量衡一般,方便平台间实现共享。社会不断进步,科技飞速发展,学习者需要获取更多知识,而需要E-Learning数据挖掘做的也有很多。
4结束语
学习者的模型构建是E-Learning中的重要部分。本次研究提出了从学习者的知识水平、学习情绪、学习行为特征三方面来扩充和完善E-Learning环境下学习者的模型,并对学习系统的教育数据挖掘提供了策略,以期使得E-Learning系统能适应教育的发展和外部环境需求,达到更好的效果。endprint