牟智佳 武法提
摘要:基于数据集的学习分析和人工智能技术的深入发展,使得以优化学习过程、缩短学习改善周期为目标的学习结果预测得到研究者的广泛关注和实践探索。文章首先对数字化学习环境下的学习预测研究探索进行梳理,辨析其研究特性,之后纵向解析了学习结果预测研究中的内容,并横向剖析了研究中存在的问题;在此基础上,从情境、理论、数据、方法和结果五个层面对未来学习结果预测研究的设计取向进行讨论;最后,对以学习者为中心的数据的预测设计原理进行阐释,并设计个性化学习结果预测研究框架,以明晰其系统化分析流程与结果。
关键词:学习结果预测;学习分析;人工智能;个性化学习;设计取向
中图分类号:G434 文献标识码:A
一、数据集驱动学习预测研究的发展契机
计算机和数据科学的进步使得基于新类型证据的决策得到前所未有的发展。尽管数据科学已经在商业、工程、技术、科学等领域建立了良好的应用基础,但对教育领域的影响和渗透还尚未全面展开。近年来,移动技术的逐渐普及和网络学习资源的指数性增长使得数字化学习逐渐成为常态,而增强现实技术和可穿戴技术的兴起则进一步丰富了数字化学习方式和学习环境。大数据技术和数据科学给教育带来的冲击使得研究者、管理者、教育企业、教师等不同角色人员开始重视对不同学习情境和学习方式下生成的数据进行整合与分析,并逐步形成了基于不同类型数据集进行学习测量与计算的学习评价新生态。与此同时,学习分析探索已走过初期对分析模型、应用价值、发展方向等理论方面的研究,正转向基于数据集的可视化分析和学习行动,以将其理论分析的价值转化成实际应用效能。在教育大数据和学习分析的背景下,以优化学习过程和改善学习成效为目标的学习预测研究迅速得到研究者的广泛关注和实践探索。而以模式识别、计算感知、神经网络、机器学习等为代表的人工智能技术的深入发展则为学习预测研究提供了分析技术上的有力支撑,从而使学习预测有了实现实时动态监测和智能化分析的可能。尽管当前对学习预测的研究有了一些探索和成果,但距离实现系统平台的准确分析和大规模应用还较远,特别是在实践中还出现一些分析和设计问题,使得预测模型和结果并不能被广泛应用于当前的数字化学习中。因此,有必要对学习预测研究中的问题进行深入剖析,明晰未来研究设计取向,促进其效能转化以提高其应用价值。
二、学习结果预测研究的内容解析与问题述评
该部分首先对数字化学习环境下的学习结果预测研究进行纵览,以窥看其整体研究状态。之后从不同视角对其研究内容和问题进行分析以洞察其研究现状。
(一)数字化学习环境下的学习结果预测研究探索梳理
对数字化学习环境下有关学习结果预测的研究文献进行系统搜集,采用内容分析法对各项研究中的预测维度、数据来源、预测方法、结果分析等方面进行总结分析,结果如下页表所示。在学习预测维度上,研究者主要对学习心理特征、学习结果与表现、学习能力等方面进行预测,其中对学习成绩、学习结果和学习成功预测研究较多。在数据来源上,主要集中在课堂学习测评数据、问卷调查数据和学习管理系统数据上。在预测方法上,以多元回归分析、决策树、贝叶斯网络和神经网络分析方法为主。在分析结果上,预测模型在所研究的具体情境中表现较好,但在不同预测方法的准确率上存在差异。整体而言,学习结果预测研究体现出以下几方面的特性:(1)微情境性,已有的学习预测研究偏向具体的学习情境,如多媒体学习环境、网络学习环境、移动学习情境等,侧重对学习者在某一具体情境下的学习阶段活动分析;(2)学习数据的外在性,预测数据来源主要依靠网络学习活动的外在行为表现和课堂学习情境下的学习测试表现;(3)预测内容的可计算性,尽管学习预测内容多样化,但每一项预测内容都转化成可以测量和计算的指标,以支持分析工具的数据处理和自适应学习系统的识别与自动化分析;(4)学习预测的结果导向性,学习预测主要依据之前和当前的学习活动特征对学习者未来的结果表现进行预估,如学习成绩、学习目标和学习能力等,通过不同形式的學习结果预测来改善学习成效和学习体验。通过对学习预测研究的梳理分析可以看出,以学习成效和学习能力为目标的学习结果研究是预测的重点,这反映出学习预测的目标是促进学生个体能力发展和学习成功。
(二)纵向解析学习结果预测研究中的内容
教育大数据的日渐兴起和学习分析的广泛应用使得学习结果预测研究成为学习分析领域中的一项研究热点。为了进一步明晰该类研究的当前状况和发展态势,我们对有关学习结果预测研究的内容进行解析,窥探其预测方向和原理。该类研究内容主要集中在以下四个方面:
1.学习结果预测模型的生成
学习结果预测的原理是将预测目标内容作为因变量,预测指标内容作为自变量,通过分析来探索两者之间的关系。而学习结果预测模型的生成就是通过数据分析探索自变量和因变量之间的关系,并确定不同测量指标对预测目标的影响效应权重。该类研究生成的模型包括基于特定理论设计并验证的结构方程模型、基于多元回归分析生成的学习预测参数、决策树分类模型以及数学公式的假设与验证。在学习结果预测目标方面,主要是对学习成绩与等级和学习成败进行预测,在预测变量上,以个人背景信息、过程性测评结果、学习参与状况、学习情绪等方面为主要测量指标。
2.学习结果预测系统的设计
学习结果预测的应用目标是实现自适应网络学习系统的实时监测与评估。当前对有关学习结果预测系统方面的研究还处在设计与初步应用阶段。这方面的研究主要是学习成功系统的分析设计和学习表现预警系统设计应用。其关键问题涉及将学习者的哪些数据作为分析指标以及如何对学习成败进行计算测量。在数据来源上,研究者将课程参与、内容学习、社交互动和测评分数等方面作为数据来源分析,在学习结果测量上,依据预测模型将输入数据转化成预测结果数据,并将分析结果按等级划分,同时采用不同颜色标识,从而形成对学习结果预测的计算和可视化输出。
3.MOOC情境下的学习辍学率与持久力预测研究
大规模开放在线课程爆发性的增长和广泛应用使得注册和学习课程的学生数量逐年递增。然而,相对于较高的课程注册数,能够坚持系统完成课程内容学习和测评的学习者数量较少,多数学习者在课程中后期退出学习,导致MOOC的辍学率较高。与辍学率相对应的是学习者的持久力,即学习者能够坚持学习完整门课程的能力。当前对于MOOC学习结果预测的研究主要通过对学习者的课程学习时间、学习次数、学习互动情况、作业提交情况等方面进行分析来预测学习者的辍学率,通过学习者参与度和形成性评价预测其持久力。
4.虚拟情境中的学习表现效应研究
相对于网络学习情境,虚拟学习环境下的学习体验能够让学习者有更多沉浸感和悦趣感,其应用场景包括教育游戏和虚拟现实。这方面的研究主要体现在两方面:一是通过鼠标点击行为预测存在学习风险的学生,学习者在某项学习活动停留的时间和学习次数能够反映其学习状态;二是监测严肃游戏环境下学习者的心理活动反应,并预测其对学习效果的影响。随着增强现实技术的逐步成熟和应用,对该情境下学习者的心理状态与学习表现的分析探索也将逐步开展,探索影响学习表现的学习心理指标及其与学习表现的效应关系是这方面研究的重要议题。
(三)横向剖析学习结果预测研究中的问题
前面对学习结果预测研究内容进行了纵向分析,了解其主要关注点和具体分析内容。下面对各类研究进行横向对比分析,剖析研究中存在的问题。
1.学习情境的单一性与应用局限
对各项学习结果预测研究的情境进行总结分析发现,研究情境涉及网络学习环境、移动学习环境、虚拟学习环境和多媒体学习环境等,学习分析是基于某一单项具体情境开展的。当前,移动技术的广泛应用和增强现实技术的日渐兴起使得学习者的学习方式日渐多样化,学习环境也将混合化。在这种背景下,基于某一单一学习情境的预测研究结果将无法迁移到常见的混合式学习情境中,其推广应用受到局限。
2.数据来源的局限性与数据链的割裂
学习结果预测研究的数据来源对分析结果的准确性和科学性有直接影响。已有研究的数据来源主要集中在问卷调查数据、学习管理系统数据和课堂学习情境下的测评数据。尽管这些数据在一定程度上能够反映学习状态,但从类型上看仍属于外在学习行为数据。对于基于眼动设备的学习者注意力行为数据、基于情感监测设备的脑电波数据、心率数据和皮肤感应数据等内在心理状态行为数据分析的较少。偏重于外在学习行为数据的分析使得预测结果的可信度降低,同时也割裂了内在行为与外在行为相统一的数据链。
3.预测方法的约束性与分析结果的冲突
预测方法为数据的分析和模型参数的生成提供了工具支持。受制于有限的数据类型和数据量,学习结果预测方法以多元回归分析和结构方程模型分析为主,采用决策树、贝叶斯网络、神经网络、支持向量机等分类预测方法的研究较少。尽管通过统计分析能够对数据间的线性关系进行分析,但当数据类型较为丰富、数据量较大时,采用机器学习预测方法通过训练集和测试集方式形成的预测模型更加准确可靠。此外,由于数据样本的差异化和方法的约束性,使得同一预测方法在不同样本中的预测效果存在差异,从而使分析结果存在冲突,无法辨析最优预测方法。
4.理论基础的薄弱性与预测模型的低效度
尽管学习分析是对学习过程数据进行可视化分析和输出,但其最终目标是改善学习成效,其出发点和终点都是以学习为中心理念。同样,作为学习分析后期研究模块的学习结果预测研究也需要坚实的学习理论为支撑。然而,有关学习结果的预测研究较少提及所依据的教与学理论和思想框架,特别是缺少与学习活动过程紧密相关的教学设计理论,而这类理论对学习活动表现和结果有直接影响。缺少相关理论支撑的预测分析不仅降低了预测模型的效度,也阻碍研究者发现真正影响学习的关键因素。
三、学习结果预测研究的设计取向
学习结果预测研究是学习分析系统流程中的重要一环,其结果将为学习干预提供参照。随着大规模开放在线课程的广泛应用、自适应网络学习平台的发展和智慧学习环境的兴起,为学习者提供学习结果预测服务将逐渐成为未来数字化学习的必要条件,且这种服务将实现监测的实时性与自动化。科学有效的学习结果预测研究不仅要在结果上具备准确性和可靠性,在应用上也要具有可迁移性。我们认为未来学习结果预测研究是这样一种系统化流程,即在混合式学习情境下整合不同学习类型和行为数据,通过机器学习方法训练出较为准确和稳定的预测模型,并为学习者提供个性化学习结果反馈。下面结合教育大数据、学习分析和人工智能技术的发展,从情境、理论、数据、方法和结果五个层面对未来学习结果预测研究的设计取向进行阐释,以促进该类研究向着合理性发展。
(一)情境取向:混合式学习情境
移动技术和虚拟现实技术的发展使学习者由早期在传统课堂环境下的正式学习演变成在不同情境下正式学习和非正式学习相融合的学习生态,支持学习者开展泛在学习的混合式学习情境是未来学习情境的常态。2016年《地平线报告》(高等教育版)在加速技术在高等教育中采用的关键趋势部分指出,增加混合式学习设计是未来短期的影响趋势,而混合式学习的设计需要丰富的学习情境提供支持。由于学习者的行为表现被分布到不同的学习情境中,因此在研究中需要整合常见的学习情境,如網络学习情境、移动学习情境、虚拟现实情境等,这样既可以全面分析学习者在不同情境的行为表现,同时使扎根于常见混合式学习情境的分析结果具有可推广性。
(二)理论取向:整合教学设计与学习分析理论
数字化环境下的学习活动表现与教学活动和资源设计紧密相关,教学内容的编排和难易程度直接影响学习结果和学习体验。当前,MOOCs较高的辍学率和低参与度其中就是由于课程内容缺少差异化以及师生互动黏性低导致的,而这与教学设计的适恰性密不可分。因而,学习结果预测研究需要考虑教学设计因素对学习表现的影响,在以教为主、以学为主和主导一主体教学设计理论的框架下,针对不同类型的课程设计,选择合适的教学设计理论作为理论分析基础。此外,学习结果预测是基于学习行为数据开展的分析,属于学习分析流程中的一个环节,同样需要学习分析理论的指导。因此,在实际探索中需要整合教学设计理论和学习分析理论对预测指标设计和分析流程进行设计,从而使预测模型能够建立在可靠地分析理论之上。
(三)数据取向:学习者心理状态与行为表现数据
以往的学习结果分析数据侧重学习者的点击数据,即学习者在不同网络学习平台中通过点击生成的学习时间和学习次数数据,这些统称为学习者外在学习行为数据。然而,学习者在课程学习过程中也会出现情绪上的变化,从心理学视角分析学习行为和状态有助于探测影响学习结果的实质因素口”。近年来可穿戴技术、情感测试技术和增强现实技术的快速发展,使得研究者可以获取到学习者内在心理状态变化数据,如学习表情、学习情感、学习注意力等。在整合学习者外在学习行为和内在心理状态数据的条件下,我们可以更精确地分析立体化的学习行为特征,发现隐藏在点击数据背后真实的学习状态,从而使学习结果的预测结果更为可靠。
(四)方法取向:机器学习为分析主导
教育大数据的逐步成熟和人工智能的深入发展正变革着当前以统计分析为主的研究分析范式。学习数据类型的多样化和数量的增加使得以集成学习、基于规则的分类器、支持向量机、神经网络等预测分类算法为代表的机器学习模式逐渐成为分析主导。机器学习分析模式下的学习结果预测分析涉及两方面问题:一是采用监督学习探索自变量和因变量之间的映射关系,采用非监督学习探索学习表现中的行为模式,发现关键分析指标;二是对比不同预测分类方法的准确率和分析效率,整合各类算法优点找到适合分析不同情境下的最优预测分类方案,以便后面应用到网络平台中。
(五)结果取向:个性化学习结果反馈
学习结果预测研究的最终目标是为学习者提供服务,促使学习者优化学习路径、改善学习成效。而未来学习方式将逐渐走向个性化,美国2016年国家教育技术计划《未来学习准备:重塑技术在教育中的角色》在学习部分中指出,未来教育将通过技术和工具为学习者提供个性化学习。因此,为学习者提供个性化学习服务是技术改善学习的内在旨趣。在个性化学习服务的理念下,未来学习预测结果将为学习者提供个性化学习反馈,具体包括两个方面;一是预测学习者学习成败表现、学习成绩等结果性信息;二是基于学习者的学习结果和个性特征,为其提供个性化学习反馈,包括学习内容推荐、学习互动人群推荐和学习练习推荐,从而使预测结果由初期的学习预警转变成学习改善。
四、个性化学习结果预测研究的设计框架
基于学习结果预测研究的设计取向,我们以个性化学习结果为预测目标,进一步整合各方面分析内容,形成了以学习者为中心数据的学习预测设计原理。在此基础上,设计个性化学习结果预测研究框架,以明晰其系统化分析流程与结果。
(一)个性化学习与学习结果的内涵分析
在设计个性化学习结果预测框架之前,我们需要辨析个性化学习和学习结果这两个概念,以使其符合当前数字化学习环境发展的需要。个性化学习是由不同时代教育家和研究者针对教育问题不断探索提出的。古代伟大的思想家、教育家孔子最早提出“因材施教”的教育思想。随着教育云计算、大数据技术、网络学习空间的建立以及移动终端的日渐普及,实现个性化学习逐渐成为可能。在个性化学习概念的分析上,国内外研究者开展了较为广泛的探索。通过对相关文献的搜集和分析,得出不同研究者对个性化学习概念和特征的解释。国内比较有代表性的分析如杨南昌认为个性化学习是根据学习者的个性特征实施的学习活动,依据学习者个别所需提供最佳的学习方法和策略,它是在教师或学习者组成的小团体中开展的一种学习方式。王艳芳认为个性化学习强调以学习者为主体,针对学习者个性特点、知识经验和能力、学习需求、偏好以及具体学习情境而采用恰当的学习方法、学习内容和学习进度,促使学习者的能力与个性在学习活动过程中得到充分、自由、和谐的发展。从国内研究者定义来看,基于传统学习环境的个性化学习侧重学习课程内容和学习方式分析,基于数字化学习环境下的个性化学习侧重学习者的差异化管理和知识建构与内化分析。
相对于国内的分析维度,国外研究者和学术团体进行了较为深入和较多维度的探索。凯勒、美国课程监督和发展委员会、新媒体联盟等研究者和学术组织对个性化学习的内涵、特征、政策进行了分析。其中TheBill&MelindaGates Foundation、the Michael and Susan Dell Foundation~EDUCAUSE等组织提出的关于个性化学习的四大支柱,包括学习者档案袋、个人学习路径、灵活的学习环境和基于竞争力的进度,明确了数字化学习环境下个性化学习的工作定义,是对新媒体环境下个性化学习较为成熟的分析。然而已有的定义仍存在以下几个方面的问题:(1)缺少对整个学习分析链的分析,数字化学习环境下的个性化学习涉及活动参与、数据搜集和服务支持,最终帮助学习者完成学习目标;(2)未体现学习者的主动性,学习分析结果和服务的提供是为帮助学习者更好地了解和开展学习。基于上述分析,我们认为数字化学习环境下的个性化学习是学习者基于个人学习能力自主选择学习网络资源和参与学习活动,并依据已有学习行为过程数据分析结果及时调整学习进度和内容,形成以自主、按需、反馈为网络学习特征的一种学习方式。
当前教育范式已经由原来的重视教学转变成关注学生学习。而在对学习者进行学习评价时,会使用學习结果、学习目标等术语进行表述,较多研究者对此进行辩论和分析。关于学习结果的讨论自教学目标理论、掌握学习理论就已经开始,是一个线性发展的过程。Robert Gagn e认为学习结果是学习过程的精炼理解,并允许为具体的教学设计提供参照。该描述是一种结果导向、学习结束和可测量的分析思路,是从行为主义理论视角进行分析。Elliot Eisner认为学习结果是个体参与后的结果,该描述认为学习结果并不意味着学习结束且不能够对学习结果进行测量,是从实用主义和社会建构主义理论视角进行分析。Tine S.Preitz从学习是否结束、预先指定目标和测量方式等方面对已有学习结果内涵取向进行分析。可以看出,学习结果在过程与结果导向、学习结束和可测量方面形成了两大阵营。本研究认为数字化学习环境下的学习结果是学习者基于网络进行知识学习、参与互动交流并完成学习任务的非线性学习行为体现。其评价方式是通过对学习者的学习活动过程参与和完成情况进行分析和评定。
通过对个性化学习内涵的分析,进一步明确了个性化学习结果预测研究是以学习者为中心、以个性化学习服务为目标的设计方向,注重对其学习活动行为进行汇总分析,并提供符合个性需求的学习反馈服务。对学习结果概念的分析明确了个性化学习结果预测研究要从知识学习、内容互动和学习测评等方面进行内容解析,以适应当前基于内容的学习和基于互动的协作学习这两种主流学习方式下的行为分析。
(二)以学习者为中心数据的预测设计原理
已有的学习行为分析主要从学习管理系统中抓取数据,体现的是以系统为中心的数据搜集思想。尽管利用这些数据能够分析学习者的活动过程,但不能够立体化的还原其学习表现。首先,学习结果预测研究的中心对象是学习者,他们既是学习分析研究的起点也是学习分析服务的终点。因此,应该以学习者为中心整合不同层面的学习数据,从而最大程度的对学习表现进行解析。其次,学习结果预测研究的核心特征是个性化,因此在数据搜集上应侧重搜集具有个性特征的学习行为数据,进而为学习者提供个性化学习预测反馈服务。基于上述分析,我们提出以学习者为中心数据的学习结果预测框架设计原理,如图1所示。该设计原理包括整合个性化学习理论、认知心理学理论和教学系统设计理论影响下的学习行为表现和整合内在行为和外在行为的数据分析思想。
(三)个性化学习结果预测研究的设计框架
學习结果预测设计原理明确了以学习者为中心数据的分析思路,而要形成对该类研究的系统化指导则需要一个整体设计框架,以诠释个性化学习结果预测研究的分析思想。基于前面对个性化学习和学习结果的内涵分析,该框架以学习者为中心,通过数据层、分析层和结果层展示系统化流程,如图2所示。数据涵盖学习点击数据、学习情感数据和学习档案数据三种类型的数据,其中学习点击数据主要指学习管理系统中的学习行为数据,学习情感数据指学习表情、学习注意力和情绪特征等心理活动数据,学习档案数据指学习者个人信息、学习经历和学习表现等信息数据;过程层整合了混合式学习情境、机器学习分析方法、教与学分析理论等内容;结果层是为学习者提供个人学习成绩预测和个性化的学习内容反馈、学习互动反馈和学习测评反馈。该设计框架在数据层上要搜集识别学习者内在和外在学习数据,强调数据的全面性;在分析层中要基于数据进行学习行为分析和模式识别,强调分析的可靠性;在结果层中依据分析结果进行个性化学习反馈,强调反馈的差异性。
五、结语
学习结果预测是学习分析和教育数据挖掘领域中的研究热点,它使学习者能够在学习过程中及时调整学习策略和路径,并进一步缩短了学习成效改善的周期。未来学习结果预测研究将扎根于混合式学习情境,基于学习者为中心数据的分析思路,通过监督学习和非监督学习分析方法生成预测模型,以提高其可靠性和可迁移性。
收稿日期:2017年3月14日
责任编辑:赵云建