自适应学习算法的应用研究进展

2020-05-06 05:01汪存友赵燕飞王亚青
开放学习研究 2020年2期
关键词:遗传算法学习者状态

汪存友 赵燕飞 王亚青

(1.山西师范大学 传媒学院,山西 临汾 041004;2.山西师范大学 教育科学学院,山西 临汾 041004)

一、引言

信息技术的飞速发展促进了个性化学习的诞生,个性化学习依据学习者的个性特征进行教学活动,满足每位学习者的不同学习需求和学习偏好。而个性化学习的实现依赖于自适应学习,自适应学习是人工智能技术在教育领域的高阶表现形式,其基于学习者的个性特征适应性地改变所教授的学习内容(Oxman & Wong, 2015)。自适应学习实现的关键支撑则是自适应学习算法,随着人工智能技术的不断进步,先后出现许多具有不同特性的自适应学习算法,特性的不同,导致算法在自适应学习中的实现方式及实现的功能也各不相同。因此,自适应学习整体功能的实现需根据自适应学习算法的不同特性进行多项选择。目前国内外对自适应学习的研究较多,对自适应学习系统及相关模型的构建、自适应学习平台的比较分析等都有丰富的研究,但只有少数文献会提到自适应学习的关键支撑——自适应学习算法,且缺少对自适应学习算法的系统性研究。有关自适应学习算法的研究中,董晓辉、杨晓宏与张学军(2017)指出自适应学习技术对于促进个性化学习具有很大的潜力,通过内容分析法对国内外的项目反应理论算法、推荐算法、认知水平诊断算法等自适应学习技术相关文献进行了梳理和研究,却没有对自适应学习技术的内容和功能进行详细阐述。Birjali、Beni-Hssane 和 Erritali(2018)利用遗传算法和蚁群优化算法构建了基于大数据的自适应学习模型,利用构建的模型向学习者推荐最佳的学习资源。Sitthisak、Gilbert和Albert(2013)针对计算机自适应测试系统中存在的问题,提出了一种运用能力模型与知识空间理论相结合的自适应学习。马玉慧、王珠珠、王硕烁与郭炯(2018)指出现有的基于行为数据实现的个性化学习资源推送方法存在局限性,并提出以认知诊断算法为基础的适应性学习资源推送方法,从而弥补基于行为数据推送方法的不足,由此实现大规模的个性化学习。卫文婕与付宇博(2018)对目前常用的个性化学习资源推荐算法进行了梳理和研究,并对协同过滤算法等推荐算法做了比较分析,总结出各推荐算法的优缺点。Pliakos等人(2019)指出自适应学习系统存在冷启动问题,并提出将项目反应理论算法与机器学习算法相结合的方法来缓解冷启动问题,通过在教育数据集上的实验表明了该方法的有效性。近年来自适应学习领域也应用了一些新的算法,如深度知识跟踪算法、概率图模型算法等。

当前很多教育机构利用自适应学习算法构建了自适应学习平台,但由于自适应学习算法的复杂性及多样化,自适应学习平台现处于起步阶段,很多自适应学习平台普遍存在对自适应学习算法选择不当的情况,导致自适应学习平台中出现对学习者知识状态诊断不精确及在推荐学习资源及学习路径时不够个性化的问题。综上所述,对自适应学习算法的系统性研究是必要且急切的,精准高效地利用自适应学习算法,将为学习者提供更为智能、高效的个性化学习服务。同时,对自适应学习算法的系统性研究,将会为自适应学习的进一步发展提供更大的可能。当前自适应学习还处在弱人工智能水平,实现自适应学习从弱人工智能进化到强人工智能的突破口在于对自适应学习算法的突破。本研究通过对相关文献及目前存在的自适应学习平台的研究,梳理出应用较多且具有较大潜力的自适应学习算法,结合已开发的自适应学习平台,归纳出算法的应用进展,并探讨未来自适应学习的发展建议。

二、自适应学习算法的应用进展

通过对相关文献及目前存在的自适应学习平台的研究,梳理出八种应用较多且具有较大潜力的自适应学习算法:项目反应理论、认知诊断理论、知识空间理论、贝叶斯知识跟踪、深度知识跟踪、概率图模型、协同过滤算法及遗传算法。依据算法的实现原理,将自适应学习算法大致分为心理测量类和机器学习类两类算法,如表1所示。目前诸多教育机构综合这两类算法构建了自适应学习平台,主流的自适应学习平台国外有Knewton、ALEKS等,国内有乂学教育、猿题库、试达测评系统、沪江网校的Uni智能学习系统等。其中自适应学习算法具有领域适用性,根据算法本身的特性应用于自适应学习平台的不同领域,此部分将自适应学习算法的应用领域分为三部分:知识状态测量领域、预测学习者未来学习能力表现领域、学习资源及学习路径推荐领域,并分别介绍了算法应用中的关键操作和目前已开发的自适应学习平台。

表1 自适应学习算法的应用

(一)知识状态测量领域

知识状态测量领域是根据学习者的个性特征及知识状态精准测量学习者的认知能力水平及认知结构,更为客观有效地揭示认知过程。在自适应学习中,精准的知识状态测量是实现自适应的前提(王硕烁,马玉慧,2018)。知识状态测量领域中应用到的算法归属于心理测量类,心理测量类的算法更注重如何对学习者的认知结构及认知过程进行精准测量,从潜在心理特质出发,通过对学习者个性特征的分析,测量学习者学习过程中的认知结构及认知过程,从而掌握学习者的知识状态,以此向学习者推荐适当的补救措施。

1. 项目反应理论

项目反应理论算法是一种用于评估学习者认知能力水平的算法,其基本思想是根据学习者的潜在心理特质及学习者对题目的作答状况,推断学习者的学习能力。在自适应学习平台中,Knewton采用项目反应理论算法,根据试题级别表现对学习者的认知能力水平进行建模(万海鹏,汪丹,2016)。乂学教育研发的自适应学习引擎松鼠AI,采用项目反应理论算法,对项目进行难度标签的标定,并结合知识空间理论算法,测量学习者整体的知识状态(薛佳怡,2018)。猿题库采用项目反应理论算法,根据学习者的历史学习数据,计算学习者在各个知识点的认知能力水平,通过与以往测试重点的匹对,映射到实际测试中,预测学习者实际可能取得的分数(蒙遗善,2014)。项目反应理论算法被广泛应用于教育评估中,传统的自适应学习平台在对学习者认知能力水平进行评估时,大都采用项目反应理论算法进行实现。

2. 认知诊断理论

认知诊断理论算法是一种基于认知诊断模型对学习者的认知结构及认知过程进行诊断和评估的算法,算法通过定位到学习者学习过程中出现的认知缺陷,以此为学习者提出弥补认知缺陷的补救措施,从而提升学习效果。试达测评自适应学习平台采用认知诊断理论算法,从知识、技能、能力、思维类型四个维度对学习者的认知结构及认知过程进行综合立体式的多元多维诊断(张小逸,2016)。

3. 知识空间理论

知识空间理论算法由Doignon 和Falmagne(1999)提出,它提供了一种表示知识结构的方法,是一种测量学习者认知水平及认知结构的心理学理论,其通过对学习者的题目作答状况进行有效地测量,从而得出学习者对知识的掌握状况。ALEKS采用知识空间理论算法对学习者的认知结构及认知过程进行精确诊断,从而为学习者推荐最恰当的学习资源及学习路径来提高学习者的学习效率,增强学习者的学习效果,让学习者在自适应学习的方式下高效地实现学习目标(ALEKS,2017)。

以上三种算法中,项目反应理论算法仅测量学习者的认知能力水平,传统的自适应学习平台在应用时会根据系统需求对项目反应理论算法进行适当的改进。例如:Knewton考虑到学习者的认知能力水平参数是不断变化的,且仅用一个参数对学习者的认知能力水平进行表示是不符合实际的,因此对项目反应理论算法进行扩展,从问题层级的表现对学习者的认知能力水平进行建模,利用聚焦于概念层面的知识图谱对学习者认知能力水平进行测量和表征(万海鹏,汪丹,2016)。认知诊断理论算法和知识空间理论算法均是多维能力测验,不仅对学习者的认知能力水平进行测验,且对学习者的认知结构及认知过程进行测验。

(二)预测学习者未来学习能力表现领域

预测学习者未来学习能力表现领域是通过对学习者学习行为数据的分析,发现学习行为数据中的潜在关系,探索建立预测模型,最终实现对学习者未来学习能力表现的预测。预测学习者未来学习能力表现领域中应用到的算法归属于机器学习类,机器学习类的算法旨在通过算法从大量历史学习行为数据中学习规律,自动发掘模式并进行预测,能够结合学习者的知识结构及历史学习行为数据等信息有效地构建自适应学习。

1. 贝叶斯知识跟踪

贝叶斯知识跟踪算法是一种通过对学习者知识状态进行实时跟踪,以此预测学习者能力表现的算法,算法的核心是隐马尔可夫模型(HMM),其将学习者的潜在知识状态建模为一组二元变量,其中每个变量表示理解或不理解的单个概念,当学习者正确或不正确回答给定概念练习时,使用隐马尔可夫模型来更新这些二元变量中的每一个概率,以此预测学习者在特定技能上的认知水平(Piech et al., 2015)。乂学教育研发的自适应学习引擎松鼠AI采用贝叶斯知识跟踪算法判定学习者知识点掌握程度是否达标,以此预测开始下一步学习的时间节点(李诗,2018)。

2. 深度知识跟踪

深度知识跟踪算法随着深度学习技术发展而来,是一种利用循环神经网络(RNN)对学习者学习行为进行建模的先驱算法,其使用大量的人工“神经元”向量表示潜在知识状态及时间动态,通常从数据中学习知识的潜在变量并对学习者进行持续地隐式建模,以此预测学习者未来学习能力表现(Piech et al.,2015)。国内的沪江学习网利用人工智能技术开发出Uni智能学习系统,该系统运用深度知识跟踪算法对学习者的知识状态进行实时跟踪,由此预测学习者未来学习能力表现(王新义,2018)。在应用到自适应学习中时,深度知识跟踪算法不仅会分析学习者当前的知识状态,还会考虑到学习者之前所有的学习表现,综合分析学习者整体的知识状态及学习表现,由此预测学习者未来学习能力表现。

3. 概率图模型

概率图模型算法是根据计算相关联知识点之间的相互关系,以此来预测学习者未来学习能力表现的算法,在处理计算机领域中不确定概率关系方面有着巨大的发展潜力及非常好的应用前景(Pearl, 1988)。乂学教育研发的自适应学习引擎松鼠AI采用概率图模型算法根据学习者的学习行为数据对学习者画像进行刻画,分析学习者的整体知识掌握情况(李诗,2018)。Knewton采用概率图模型算法计算邻近知识点间的关联度,并预测学习者在邻近知识点上的掌握程度,对学习者的学习行为进行实时计算和预测(Ferreira, 2016)。在自适应学习的应用中,利用概率图模型算法计算相关联知识点之间的相互关系,以此了解学习者的知识状态,并推断出学习者未来学习能力表现,即根据学习者之前内容学习上的表现,来预测之后内容学习上的表现。

以上三种算法中,深度知识跟踪算法是在贝叶斯知识跟踪算法的基础之上发展而来,继承了贝叶斯知识跟踪算法的优点,并针对贝叶斯知识跟踪算法的不足进行改进,加入遗忘机制,可以长时间反映知识点与知识点之间的关联,进而通过对复杂知识点之间的潜在关系实行建模,以此反映学习者连续的认知能力水平变化。概率图模型算法的核心模型是贝叶斯网络模型和马尔可夫随机场模型,实际上贝叶斯知识跟踪算法使用的核心模型隐马尔可夫模型是结构最简单的动态贝叶斯网络模型。同时,隐马尔可夫模型是有关时间次序的概率图模型。由此可知,概率图模型算法较为复杂,涵盖丰富的知识关系,可以捕捉随机变量之间的关系。

(三)学习资源及学习路径推荐领域

学习资源及学习路径推荐领域是实现个性化学习路径推荐的关键,可以基于学习者此时此刻的知识状态,推荐与之相适应的学习资源及学习路径,并对学习资源进行优先排序。自适应学习通过一系列的知识状态测量和预测学习者未来学习能力表现,最终目的在于为学习者推荐最佳学习资源及学习路径,协助学习者根据自身的知识状态进行高效学习。学习资源及学习路径推荐领域中应用到的算法同样归属于机器学习类,在此领域最常用的是协同过滤算法和遗传算法。

1. 协同过滤算法

协同过滤算法是个性化推荐系统中最常用的推荐算法,其基本思想是根据学习者对学习资源的评分矩阵,通过相似度算法找到最邻近的资源或用户,根据最邻近资源或用户来预测未评分的目标学习资源,依据预测结果向学习者推荐较为准确的学习资源及学习路径(卫文婕,付宇博,2018)。Knewton采用协同过滤算法从学习者的学习目标、认知结构及学习投入度出发,快速定位学习者所需信息,为学习者未来的学习呈现最优的学习内容和学习路径(Knewton Company, 2014)。

2. 遗传算法

遗传算法是进化算法的一种(Whitley,1994),依据初始种群,经过一系列操作,抽取出用户的偏好属性值,以此进行学习资源及学习路径推荐。乂学教育研发的自适应学习引擎松鼠AI在跟踪分析学习数据的基础之上,运用遗传算法为学习者在全局范围内推荐合适的学习资源及学习路径(李诗,2018)。猿题库在面对海量学习资源时,同样采用遗传算法,根据学习者的知识状态表现,向学习者推荐最佳的学习资源及学习路径(蒙遗善,2014)。

以上两种算法中,协同过滤算法和遗传算法各自存在优缺点,一方面协同过滤算法在搜索效率维度上优于遗传算法,其因协同过滤算法能够处理复杂的非结构数据,且具有很好的适用性,但同时协同过滤算法进行有效推荐存在前提条件,即学习系统要有足够的学习行为数据及评分数据,否则就会出现冷启动和数据稀疏问题,导致推荐结果不理想。另一方面遗传算法的鲁棒性优于协同过滤算法,其因遗传算法具备潜在并发性,可以同时进行多个项目的比较,但遗传算法在搜索效率上低于协同过滤算法,其原因归咎为遗传算法的编码实现过程较为复杂。

三、讨论与建议

通过梳理自适应学习算法及其应用进展发现,心理测量学和机器学习两类算法实现的目标相同,都是利用技术更深入地理解学习者的学习过程,从而为学习者高效率的学习创造条件,打开“学习黑匣子”( Luckin,Holmes,Griffiths, & Forcier, 2016)。但同时心理测量学侧重于通过知识状态精确了解学习者的认知结构及认知过程,而机器学习更侧重于通过对学习数据进行训练学习从而进行自动建立预测模型,以此实现对学习者学习表现的预测。虽然机器学习能够通过强大的计算能力使用相对简单的方法实现传统心理测量学无法达到的效果和目的,但机器学习并不能取代心理测量学。相反,它是心理测量学的延伸和拓展。机器学习不存在对测量结果进行解释的理论基础,而心理测量学侧重于对测量结果进行描述性解释。因此,可以说心理测量学是机器学习的理论基础,并且心理测量学通过适应机器学习而变得更强大。在自适应学习平台中,对学习者知识状态进行精准测量、预测学习者未来学习能力表现及为学习者推荐合适的学习资源及学习路径是其三大关键功能。对学习者知识状态进行精准测量主要是采用心理测量学领域的算法,测量学习者的知识状态,定位学习者学习中的薄弱点。预测学习者未来学习能力表现主要是采用机器学习领域的算法,利用算法强大的计算能力,实时监测学习者的学习状况,以此评测学习者的知识状态,进而预测学习者未来学习能力表现。为学习者推荐合适的学习资源及学习路径同样采用机器学习领域的算法,依据学习者的学习目标及知识状态,推荐最佳学习资源,规划最佳学习路径。因此可以从以下两个方面对未来自适应学习的发展提出建议。

(一)心理测量学和机器学习算法的深度结合

自适应学习实质上是结合心理测量学和机器学习两种不同领域的算法进行实现,目前存在的自适应学习平台均采用心理测量学和机器学习相结合的方式进行构建,如前面表1中所体现的,一个完整的自适应学习平台需采用多种算法的深度结合。例如:国外著名自适应学习平台Knewton,以心理测量学为基础,结合先进的机器学习技术构建自适应学习平台。其采用心理测量学领域的项目反应理论算法通过对学习者在不同级别试题上的表现对学习者的能力进行建模,测量学习者的知识掌握水平;在项目反应理论算法的基础之上,采用机器学习领域中的贝叶斯知识跟踪、概率图模型及协同过滤算法实现对学习者知识状态的持续跟踪,并经过挖掘学习者的庞大学习行为数据,关联分析学习者的学习行为数据信息,预测学习者的学习表现,由此推理出最适合学习者的学习资源及学习路径,帮助学习者提高学习效率。同时,国内乂学教育研发的自适应学习引擎松鼠AI,同样采用心理测量学和机器学习相结合的方法构建自适应学习平台。松鼠AI利用心理测量学领域中的项目反应理论算法和知识空间理论算法把知识根据重要性、难易度及认知层次进行等级划分,并对学习内容建模,进而精准定位学习者的知识状态,了解每位学习者的知识薄弱点(薛佳怡,2018)。利用机器学习领域中的贝叶斯知识跟踪、概率图模型及遗传算法三大算法对学习者的知识状态进行实时跟踪及对学习者的学习行为数据进行分析处理,在此基础上,分析学习者当前的知识状态及测评学习者的认知能力水平是否达到预设目标,据此为学习者推荐最佳的学习资源及学习路径(李诗,2018)。因此,自适应学习中,心理测量学和机器学习两个领域算法的深度结合,能够促使自适应学习更加智能,从而推动学习者进行个性化的学习。

(二)自适应学习平台算法选择建议

自适应学习平台中,为学习者推荐合适的学习资源及学习路径是在对学习者知识状态进行精准测量和对学习者未来学习能力表现进行预测的基础之上实现的,功能间的相互依存形成了一个相互循环的动态系统,使整个自适应学习平台更加完整,更加丰富。在对学习者知识状态进行精准测量时,传统的自适应学习平台通常采用较为成熟且对数据样本量要求较低的项目反应理论算法实现,但项目反应理论算法存在用一个笼统的值表示学习者认知能力的缺陷,导致无法测量学习者的认知结构及认知过程。在项目反应理论算法基础上提出的认知诊断理论算法和知识空间理论算法克服了此缺陷,认知诊断理论算法和知识空间理论算法可以对学习者的认知水平及认知结构进行双重诊断分析,将此应用到自适应学习平台中,可以弥补平台中存在的对学习者认知水平及认知结构诊断模糊这一缺陷,实现对学习者认知水平及认知结构的精准测量。在预测学习者未来学习能力表现时,目前传统的自适应学习平台普遍采用贝叶斯知识跟踪算法实现,但随着深度学习技术的发展,产生了优于贝叶斯知识跟踪算法的深度知识跟踪算法,其能够发现技能概念中的潜在结构,并利用灵活的循环神经网络模型实现对学习者知识状态的建模。深度知识跟踪算法应用在自适应学习中,能够自动发现知识点之间的相互关联,即自动建立知识图谱,并且能够智能设计课程,减少教育工作,对构建更智能的自适应学习有重要意义。目前众多自适应学习平台从机器学习领域中的协同过滤算法和遗传算法中选择一种方法为学习者推荐合适的学习资源及学习路径,遗传算法和协同过滤算法虽都具有很好的推荐效果,但也均存在不足之处,当下众多研究者在提倡组合推荐算法(Hybrid Recommendation),即将多种算法结合在一起,弥补各自的不足。满足各种场景的需求(Burke, 2002)。有研究者在数据集上做推荐对比实验表明,基于遗传算法的聚类和协同过滤算法组合成的推荐算法,能使之推荐的学习资源更加高效精准(冯智明,苏一丹,覃华,邓海,2014)。协同过滤算法和遗传算法的组合推荐算法,可以利用遗传算法的特性解决协同过滤算法中存在的效率和质量不高的问题,以此获得更高质量的推荐内容。

猜你喜欢
遗传算法学习者状态
基于遗传算法的高精度事故重建与损伤分析
你是哪种类型的学习者
十二星座是什么类型的学习者
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
状态联想
青年干部要当好新思想的学习者、宣讲者、践行者
基于遗传算法的智能交通灯控制研究
生命的另一种状态
坚持是成功前的状态
高校学习者对慕课认知情况的实证研究