学习路径规划方法*

2024-01-19 05:55:08罗中凯张立波

中国科学院大学学报 2024年1期

罗中凯,张立波

(中国科学院软件研究所智能软件研究中心, 北京 100190) (2021年10月25日收稿; 2022年6月10日收修改稿)

在传统学习过程中,呈现给学习者的学习内容及其先后顺序,是由专家或教师根据学习内容的难易程度并结合自身实践经验进行定义,因此,所有学习者均以相同的顺序学习相同的内容[1]。然而不同学习者的学习能力、学习目标和已掌握的背景知识可能存在较大差别,使用这种无差异的教学方式无法达到因材施教的效果。越来越多的学习者渴望通过个性化和智能化的方式来获取知识[1]。此外,科技的发展和互联网的广泛普及促进了在线教育的发展,为学习者打破了学习的时空障碍,学习者可以方便快捷地获取各种学习资源并进行自主学习。特别是2019年新冠疫情大流行以来,进一步促进了学习方式从传统课堂向互联网学习环境转移。然而互联网中学习资源数量巨大,海量学习资源给学习者造成了较大的认知负荷[1]。同时,学习者有限的学习时间和无限的学习资源之间存在巨大矛盾,因此如何高效学习显得尤为重要。学习者高效学习的关键在于,能为学习者提供符合其个性化条件(学习偏好、学习能力等)的学习材料,并合理规划这些材料学习的先后顺序。已有研究表明,合理有序的学习资源序列对学习者的学习进程和学习效果具有促进作用：Durand等[2]通过实验证明,学习材料的呈现顺序对学习者快速准确地掌握知识有较大影响;Chen[3]通过研究指出,通过学习当前知识的先验和后验知识,有助于学习者理解当前知识。因此,如何快速有效地从海量资源中检索出满足学习者需求的学习资源,并将其规划生成排列有序的学习路径,成为在线学习过程中需要解决的关键问题。

学习路径规划方法能够很好地解决上述问题。学习路径规划方法可以针对每个学习者特定的学习需求,为学习者量身定制特定的学习内容,并能适应学习者在学习过程中不断变化的需求,从而提高学习者的学习表现,优化学习者的学习体验,帮助学习者在更短的时间内,以更低的成本,更高效地达到学习目标。因此,学习路径规划方法具有较高的研究意义与实用价值。

自20世纪60年代末以来,面向学习路径规划方法问题,涌现出大量研究成果,包括基于进化算法的学习路径规划方法、基于图的学习路径规划方法、基于数据挖掘的学习路径规划方法、基于神经网络的学习路径规划方法等。这些成果在一定程度上解决了学习路径规划问题。然而,大多数研究成果仍然还局限于理想条件下的研究型项目中,在教育与生活中的实际应用依然具有局限性,该领域的发展存在很大的提升空间。

学习路径规划拥有巨大的应用前景,为便于后续研究人员在现有研究工作的基础上得到更好的研究成果,我们查阅整理了近年来学术界的相关研究成果,对这些研究成果按照使用的算法技术进行分类,对每类算法的优缺点进行分析,并对该领域的数据集、评估方法、主要挑战以及未来发展方向做了系统性的论述。本文主要内容如图1所示。

图1 本文主要内容Fig.1 The main content of this paper

1 学习路径规划问题

1.1 学习路径规划问题的定义

为实现某个特定的学习目标,需要向学习者提供系统学习的知识,将这些知识由易到难、由简单到复杂、由部分到整体,编排形成一条有先后学习顺序的知识序列,使学习者以较小的代价达到学习目标。这条有先后学习顺序的知识序列就称为一条学习路径。它强调学习过程中知识之间的相互关联,通过对学习内容的选择与组织,建立学习的基本框架,达到学习目标。即学习路径是一条有先后学习顺序的学习资源序列。

学习路径规划方法是,为实现学习者特定的学习目标,根据学习者的学习能力、学习偏好、学习节奏、现有知识储备等个性化特点,为学习者筛选合适的学习资源并规划生成学习路径的方法。通过学习路径规划方法,可以避免学习者在海量的学习资源中迷失方向,为学习者营造个性化的学习环境,使学习者实现个性化、差异化学习。一般地,学习路径规划问题可以看作是一个函数f：U×L×C→S,其中学习者特征U、学习材料特征L、学习者学习目标C为该函数的参数。S表示函数f依据输入参数生成的学习路径。学习路径规划方法的一般架构如图2所示。

图2 学习路径规划方法的一般框架Fig.2 General framework of learning path planning method

1.2 学习路径规划问题核心要素

如1.1节所述,在学习路径规划之前,必须收集学习者的学习目标、学习者个性化参数以及学习材料的描述信息等相关要素[4]。学习者特征U和学习材料特征L是学习路径规划问题的核心要素,这些参数描述了学习者与学习材料的特征,是学习路径规划方法中的重要组成部分。下面对这些参数进行介绍。

1.2.1 学习者特征参数

学习路径规划以学习者为核心开展研究[5],因此,如何定义学习者特征是学习路径规划方法中需要研究的重要问题。

学习者特征参数可以分为学习者固有参数和学习者外部参数两大类别。学习者固有参数是用来表征一个学习者的独特属性,与学习者之外的其他因素无关。学习者外部参数是指与学习者所处学习环境或者与知识领域相关的学习者的外在特征。学习者固有参数和学习者外部参数及其描述如表1所示。

表1 学习者特征参数Table 1 Learner characteristic parameters

1.2.2 学习材料特征参数

学习材料是学习内容的最小单元,在一些文献中,学习材料又称为学习对象、知识单元或学习资源。在学习路径规划过程中,对学习材料进行正确分类与建模是需要考虑的重要问题。学习材料特征参数及其描述如表2所示。

表2 学习材料模型参数Table 2 Learning material model parameters

2 学习路径规划方法研究进展

给定学习材料集合,学习路径规划方法的主要任务是根据学习者的学习目标和学习偏好等特征,自动生成满足学习者个性化需求的学习路径。

为解决学习路径规划问题,学术研究领域出现了多种方法。根据使用算法的不同,可将学习路径规划方法划分为基于进化算法的学习路径规划、基于数据挖掘的学习路径规划、基于图的学习路径规划、基于神经网络的学习路径规划[6]。在工业领域,基于学习路径规划方法的电子教学平台蓬勃发展。本节将分别介绍各个类别的学习路径规划算法,并对其优缺点进行分析。

2.1 基于进化算法的学习路径规划方法

根据学习者学习目标、学习偏好等特征,从学习材料库中筛选并生成合理的学习材料序列可以抽象为一个组合与排序问题。由于学习材料的爆炸式增长,这个组合排序问题落在NP-hard问题范围内。进化算法是NP-hard问题的经典解法。进化算法是一个“算法簇”,它们产生的灵感都来自大自然的生物进化。在学习路径规划方法研究的早期,很多研究者使用进化算法来解决学习路径规划问题,其中,最广泛使用的进化算法包括蚁群优化算法[7-14]、遗传算法[6,15-19]、粒子群优化算法[20-22]等。

2.1.1 基于蚁群优化算法的学习路径规划方法

蚁群优化算法是求解组合优化问题的一种元启发式算法。蚁群优化算法已被成功应用于解决很多难度较大的优化问题,这是研究人员将蚁群优化算法应用于学习路径规划问题的主要原因。

随着学习进程的推进,学习者的学习能力、知识储备等特征也在不断变化,蚁群优化算法具有较强的鲁棒性和自适应性,能够较好地适应学习者特征的变化,因此蚁群优化算法在学习路径规划中能取得较好的效果。蚁群优化算法也存在其固有的弊端,例如,在使用蚁群优化算法求解过程中,大量的学习材料很难组织成一个有效的蚂蚁觅食图,并且当路径规划过程中存在大量约束条件时,算法不能对这些约束条件进行准确表示,蚁群优化算法无法适应学习材料激增的局面。

2.1.2 基于遗传算法的学习路径规划方法

遗传算法是在达尔文进化论的启发下提出的一种搜索技术。在遗传算法中,通过3个步骤进化出一个候选解群体：1)选择最优的个体作为亲本;2)通过重组亲本和突变产生新的个体;3)将新的个体插入到种群中。在搜索解的过程中,通常采用替换策略来保持种群大小不变,并使用适度函数对候选解进行评估。

Seki等[6]使用学习材料难度、学习材料之间的关系构建适应度函数,并基于分布式遗传算法生成最优学习路径。Samia和Mostafa[17]同时考虑了学习者的个性化特点与学习目标,使用遗传算法生成学习路径。Hovakimyan等[19]以达到教学目标所需要的时间最小化为目标,使用遗传算法为学习者寻找最优学习序列。Dwivedi等[30]开发了基于变长遗传算法的个性化学习路径推荐框架。檀晓红[31]提出基于遗传算法的个性化课程推荐模型。吕琳和韩永国[32]设计了个性化学习路径规划系统,该系统首先通过前测获取学习者当前的知识水平,然后系统将学习者的知识水平和系统中课件的难度水平进行匹配,同时考虑课件之间的相关关系,使用遗传算法为学习者生成最佳学习路径。Salehi等[33]提出“显式属性”推荐模块与“隐式属性”推荐模块相混合的推荐方法,并使用遗传算法进行优化求解。Wu等[34]基于对学习者掌握知识程度的评估,通过动态编程和遗传算法为学习者生成难度适宜的试卷。Lumbardh和Krenare[35]提出一种新的遗传算法混合方法,该方法能够根据课程难度级别、持续时间、评分和学习对象之间的关系程度寻找和生成个性化的学习轨迹。

一些与遗传算法相似的算法也被应用到学习路径规划领域。Memetic算法采用与遗传算法相似的框架和操作流程,并在此基础上通过局部邻域搜索使每个演化代的所有个体都达到局部最优。文献[1]提出一种基于改进的Memetic算法的学习路径规划算法,并以计算机网络课程为例进行了实验验证。轮盘赌算法是一种没有交叉算子的遗传算法的简化算法。Ballera等[36]提出了基于轮盘赌算法的学习路径规划方法。

遗传算法具有易于实现的优点,对解决学习路径规划问题是有效的。然而,遗传算法面临着参数设置和算子选择的问题。例如,当交叉、变异、重组等参数设置不合理时,会导致进化过程出现不确定性,甚至失控。

因此，只有随着认识和实践的不断进步，充分估计前进道路上的困难和曲折，正确认识当前甚至今后一个时期高效节水灌溉发展的进展，在辩证唯物主义认识论的指导下，依靠正确的认识论和方法论，才能有力促进高效节水灌溉的发展。必须站在新的历史高度，在马克思辩证唯物主义及其认识论的指导下，依靠新的认识指导新的实践，通过实践认识再实践再认识过程不断开拓进取，充分认识发展高效节水灌溉的艰巨性，增强发展高效节水灌溉的自觉性、支撑力和自信心，创造条件，因地制宜加快推进高效节水灌溉的健康发展。

2.1.3 基于粒子群优化算法的学习路径规划方法

粒子群优化算法的灵感来源于鸟群和鱼群的社会行为。一个粒子代表一个候选解决方案,每个粒子都保存着关于其目前达到的最佳位置的信息,而群则记录着全局最佳解决方案。

Gao等[37]构建了一个基于多目标粒子群算法的学习路径规划模型,并将构建的模型用于真实的学习系统中,为用户提供个性化的学习路径。陈其晖等[38]基于知识空间理论建立学习状态空间,引入交换子和交换序的概念对粒子群算法进行改进,通过改进的粒子群算法对学习状态空间中的学习路径进行最优化控制,并利用死亡惩罚函数把约束最优化学习路径问题,转化成无约束的最优化学习路径控制问题。吴雷和方卿[39]提出一种改进粒子群算法解决在线学习系统中的学习路径优化问题。系统在寻找最优学习路径时,采用局部邻域搜索与禁忌搜索相结合的方式,从而改进了标准粒子群算法的寻优性能。李浩君等[40]提出基于多维信息特征映射模型的在线学习路径规划算法,使用双映射二进制粒子群优化算法对学习路径规划算法进行优化求解。

粒子群优化算法具有参数较少的特点,能够较好地解决复杂度高的问题,目前已被广泛应用于学习路径规划算法中。然而,与遗传算法相比,粒子群算法容易陷入局部最优,并且缺乏有效的收敛分析方法。

2.1.4 其他算法

除蚁群优化算法、遗传算法、粒子群算法外,研究人员还使用了DNA计算、和声搜索算法、免疫算法、蛙跳算法等来解决学习路径规划问题。Debbah和Ben[41]使用DNA计算解决学习路径规划问题,DNA计算可以进行大规模的并行搜索,具有较高的计算效率。Hnida等[42]提出基于和声搜索算法的学习路径规划方法。Wan和Niu[43]提出基于免疫算法的学习路径规划方法,该方法利用抗体适应度和浓度移动候选解方案,同时使用2种局部搜索算法提高算法的性能。Gomez-Gonzalez和Jurado[44]提出一种二值混叠蛙跳算法向学习者推荐合适的课程学习方案,通过比较实验的方法证明了基于二值混叠蛙跳算法的学习路径规划方法要优于部分基于遗传算法和粒子群算法的学习路径规划方法。Wan和Lyu[45]提出基于种群增量学习的学习路径规划方法,并证明该方法在运行时间上要优于基于遗传算法的学习路径规划方法。

2.2 基于数据挖掘的学习路径规划方法

随着数据挖掘技术在商品推荐等领域取得成功应用,该技术逐渐被研究人员应用于解决学习路径规划问题。基于数据挖掘的学习路径规划方法[46-50]的主要思路是,以学习者的历史学习数据为基础,通过挖掘学习者学习过程的相关信息,为后续的学习材料推荐提供决策支持,生成满足学习者个性化需求的学习路径。常用的数据挖掘算法包括聚类、频繁模式挖掘、协同过滤等。

在真实的教育场景中,相似的学习者具有相似的学习行为、相似的学习路径。基于此,Chen[3]构建了一个个性化在线学习系统,通过挖掘个体学习者在前测阶段和学习过程中的行为数据,为学习者推荐合适的学习路径。Klašnja等[51]构建了编程教学系统Protus的一个推荐模块,该模块可以自动适应学习者的学习兴趣和知识水平并生成学习路径。首先,该系统根据学习风格对学习者进行聚类处理;然后,利用Apriori All算法挖掘频繁序列,分析学习者的学习习惯和兴趣;最后,根据Protus系统提供的这些频繁序列的评级,完成学习内容的个性化推荐。Hsieh和Wang[52]开发了基于网络的在线学习系统,系统首先使用基于Apriori算法的数据挖掘方法发现一些候选课程;然后基于形式概念分析的学习路径构建方法,使用从一些选定文档中提取的关键字构建概念格,以形成由关键字表示的所有概念的关系层次;接着计算文档之间的相互关系,以决定合适的学习路径。Hsu[53]、Chen等[54]基于学习者的阅读行为和阅读能力,向学习者推荐合适的学习材料。对于公司的业务,通常需要一群人来完成特定的任务。但是,小组成员不具备与任务相关的同等水平的先验知识,因此,对于在协作商业环境下工作的员工来说,发现一条群体化的学习路径是非常重要和必要的。针对这个问题,Feng等[55-56]提出一种基于角色的学习路径发现算法,使一组员工能够更高效地掌握与某项业务任务相关的新知识。Liu等[57]通过探索学生在线学习过程的大数据,构建了一个在线学习路径模型,该模型根据学生的学习习惯,为普通学生推荐个性化、相似度高的优秀学习路径。Ge等[58]在课件推荐模块中提出一种将内容过滤和协同过滤相结合的算法,该算法能够根据学习者的学习兴趣,为学习者生成个性化的学习路径。Salehi等[59]提出一种基于顺序模式挖掘和多维属性协同过滤的学习材料推荐系统框架。Fu等[60]提出一种基于二部社区的协同过滤方法,以提高学习材料推荐的准确性和多样性。AI-Hassan等[61]将基于本体推理的语义相似度和基于项目的协同过滤相结合,提出一种基于混合语义增强的学习路径规划方法。Xu等[62]利用社交标签构建用户档案,用于寻找相似的学习者,然后利用贝叶斯公式预测大多数相似学习者下一步要学习的学习材料的概率。针对团队学习问题,Xie等[63]通过考虑各种与学习相关的因素,提出一种基于轮廓的小组学习路径发现框架。Li等[64]将基于项目的协同过滤和贝叶斯个性化排名进行结合,用于解决课程推荐问题。

随着计算机技术的发展,强大的数据挖掘技术能够挖掘数据中的相似特征,并能构建相应的决策规则和预测模型,这些规则和模型易于在教育数据中使用,且成本较低,具有较强的可移植性和可扩展性,能够适应更广泛的学习场景。使用基于数据挖掘算法的学习路径规划方法,学习者能够获取系统自动推荐的个性化学习材料,不再需要自己组织规划学习内容。但是基于数据挖掘的学习路径规划方法存在诸多缺点：一是使用基于数据挖掘的学习路径规划方法通常需要较大规模的学习过程数据集,通过挖掘学习者与学习材料之间的关联关系生成学习路径,忽略了学习材料之间的潜在依赖关系;二是基于协同过滤的方法存在较严重的冷启动问题,即不能向新来的学习者推荐合适的内容,也无法将新加入系统的学习材料准确推荐给学习者;三是如果系统中的目标用户数量巨大,存在较大的计算开销,并且无法适应学习者、学习材料激增的情况;四是基于数据挖掘的学习路径规划方法难以让教育领域的专家学者信服。

2.3 基于图结构的学习路径规划方法

在一条学习路径中,当前学习资源与下一个学习资源之间存在先修关系,在现有的学习系统中,学习材料的特征以及学习材料之间的这种依赖关系由课程教师或专家录入。由于人类固有的偏见性,课程教师或专家对相关概念/课程之间关系的定义可能是不精确的,甚至可能会忽略或混淆相互矛盾的需求,那么,据此得到的学习路径可能缺乏合理的逻辑推理[65]。因此,研究者提出,使用图的形式组织学习资源(课程/概念),并对其进行语义分析,提取学习资源之间的依赖关系或约束关系,进而为学习者推荐更匹配的学习路径。在学习路径规划领域,常用的图结构包括概念图、本体和知识图谱。

概念图是一种组织和表示知识的工具。在概念图中,概念用圆圈或方框表示,概念间存在的关系用圆圈或方框之间的连接线表示。认知教育心理学家奥苏贝尔认为,在学习者的概念结构中,当新概念与已有概念相联系时,就会产生学习过程[28]。陈其晖等[66]发现不同概念之间的先序依赖关系对学习过程有重要影响。Liang等[67]发现,概念之间的前提关系在许多教育应用中都发挥着重要作用,因此,他们研究了如何从课程依赖中恢复概念间的前提关系,并提出一个框架来解决这个问题。Pan等[68]基于大规模开放网络课程,研究如何提取知识概念之间的潜在前提关系,并提出一种基于表示学习的课程概念的表示学习方法,尝试利用不同特征捕捉概念之间的先决关系。Pan等[69]提出一种基于图的传播算法,根据课程概念的学习表示对概念进行排序。Liu等[70]将不同的在线课程映射到一个通用的概念空间,并预测概念和课程之间潜在的依赖关系。Chu等[71]构建了一个基于概念图的电子学习系统,该系统根据知识元素之间的依赖关系构建概念图,并根据概念图中的关系生成学习路径。Leung和Li[72]通过动态概念网络机制,捕捉课程之间的关系以促进学习路径的动态生成。同时,为满足不同学习者的个性化需求,构建了一个智能知识库,帮助了解学生的个性化行为,从而为不同的学习群体呈现个性化的结果。Hung和Hung[73]使用模糊关联规则挖掘方法找出概念与概念之间的所有先决关系,并构建概念图,基于此提出自适应教学模型,向学习者推荐合适的学习材料。Steiner和Albert[74]概述了使用概念图推导学习材料之间的前提关系和组织结构的方法,这些关系和结构可以作为个性化学习规划的基础。

概念图能够使概念之间的关系更具组织性和适应性,基于概念图生成的学习路径能够呈现出合理的概念学习顺序。基于概念图的学习路径规划方法虽然考虑了学习材料之间的潜在依赖关系,但是学习材料之间的关系/依赖关系的具体分类仍然缺乏考虑,忽略了知识单元之间的认知关系对学习者学习过程的影响,这对于有效组织在线学习者的学习内容至关重要[75]。因此,研究者提出了使用知识图谱和本体组织学习材料。

Shi等[75]提出一种基于多维知识图框架的学习路径推荐模型。首先设计一个多维知识图框架来表示和存储不同的学习对象,然后基于多维知识图框架设计了满足不同学习需求的学习路径推荐模型,从而改善网络学习者的学习体验。Shmelev等[76]将学习者模型与学习材料的领域知识本体库进行匹配结合,通过语义推荐算法实现学习路径的个性化推荐。Snae和Brückner[77]提出本体驱动的泰语学习系统(O-DEST),该系统用本体建立学习内容的领域模型,并根据学习者的学习风格为学生规划生成合适的学习路径。Balik和Jelinek[78]提出一个使用语义表示和本体的自适应在线学习系统模型,该模型包括2种本体：一种是用于为学习者构建个性化学习对象的课程材料本体;另一种是用于评估学习者学习进度的本体,包括作业分数、考试分数和出勤率。Wang等[79]发现,学习系统中学习对象数量庞大,学习者在选择合适的学习对象时,可能会迷失方向。因此,使用本体来增强在线学习系统的推荐功能,使其更容易、更有效地为学习者推荐合适的学习对象。Min等[80]提出一种使用本体和推理机制的自适应个性化在线学习系统,该系统可以根据学习者不同的学习目标,为其提供合适的学习路径。Pandit[81]实现了一个基于本体技术的在线电子学习系统,该系统通过本体来介绍和描述学习材料的结构、内容和上下文信息。Ouf等[82]提出基于知识图谱的智能在线学习生态系统框架。Wei等[83]开发了一种基于知识图谱的个性化课件推荐系统,为同一组学习者提供相同的课件树,以提高学习者的学习效率。针对自动化专业知识的学习,刘萌等[84]提出基于知识点网络的学习路径推荐方法。该方法首先依据知识点以及知识点之间的关联关系构建有向知识点网络,并用邻接矩阵存储网络的拓扑结构信息;然后基于学习者的目标知识,通过可达矩阵与并行拓扑排序算法实现学习路径的提取与优化,保证学习者“按需所取”知识点;最后针对选取的目标知识点推荐学习路径。Zhu等[85]考虑到学习者在不同的场景中需要不同的学习路径,提出基于知识图谱的多约束学习路径推荐算法,该算法根据学习者的先验知识、学习目标以及预设的学习场景,为学习者规划生成合适的学习路径。

基于图结构的学习路径规划方法具有下列优点：一是知识图谱能以精确的方式表达知识,可以明确地对概念、概念的属性及其之间的关系进行定义,避免学习材料描述中的歧义现象;二是根据不同学习者的需求和偏好,使用知识图谱能够进行更多细节方面的检索,这反过来可以为学习者提供更精确的内容推荐。因此,知识图谱能使学习过程更具个性化,提高学习者在线学习的效率;三是使用本体可以构建多个学习对象之间的关联关系,很好地解决冷启动问题;四是知识图谱、本体等图数据结构具有可重用性、可推理和支持推荐的机制,这些机制有助于更精确地向学习者推荐学习内容。基于图结构的学习路径规划也存在一定的缺点,图结构的设计和维护需要较强专业知识的支撑,并且图数据的构建具有一定的挑战性、花费昂贵且比较耗时。

2.4 基于神经网络的学习路径规划方法

神经网络是由大量交织在一起的神经元或部件组成的,它们协同工作来处理信息并解决问题。神经网络是一个可以接收信息并分析处理信息的系统,并能产生比其他信息处理范式复杂得多的结果,因此成为模拟人类行为的一种非常有影响力的手段。研究表明,使用基于神经网络的机器学习、深度学习等人工智能技术进行学习路径规划与课程推荐,是将人工智能技术集成到在线学习系统中的一个潜在发展方向[86]。人工智能技术具有开发和模仿人类推理和决策过程的能力,并且具有最大限度地减少人类决策过程中的不确定性的能力。因此,这类方法逐渐得到研究人员的青睐。

在教育领域,机器学习技术可以模拟并跟踪学习者认知能力的变化过程,从而为学习者推荐合适的学习材料。例如,Hussain等[87]使用支持向量机、逻辑回归、朴素贝叶斯分类器等机器学习算法,评估学生目前所具备的能力,并预测后续学习内容对学习者当前状况的难易程度,辅助教师及时调整教学内容。

循环神经网络是一种专门处理序列数据的神经网络,其通过添加指向自身的回路,使得神经网络能够捕获并记忆输入数据中的序列变化信息,并且,循环神经网络可以处理任意变长的序列数据。学习者的学习路径可以视为一个时间序列数据,且不同学习者的学习路径长度可能存在较大差异,因此,可以使用循环神经网络来建模学习路径规划问题。

Saito和Watanobe[88]以一个在线编程系统——AOJ系统为研究对象,提出使用学习者能力图构建学习路径推荐系统的方法,并基于循环神经网络实现了该系统。学习者能力图能够直观反映学习者在各个方面具备的能力分数和期望达到的目标分数。随着学习过程的推进,学习者能力图在不断变化,以跟踪学习者的能力变化。在实验过程中,基于学习者能力图构建学习者特征向量,根据学习者在编程系统中的历史提交顺序,使用循环神经网络预测下一个适合帮助学习者实现目标的学习内容,并保证推荐的下一个问题能适应学习者当前的能力。

卷积神经网络的中心思想是捕捉局部特征,其最初在图像领域取得了巨大成功,随后在文本领域也得到了广泛应用。对于文本来说,局部特征就是由若干单词组成的滑动窗口。卷积神经网络能够自动对不同滑动窗口中的特征进行组合和筛选,从而获得不同抽象层次的语义信息。注意力机制源于对人类视觉的研究,为了合理地利用有限的视觉信息处理资源,需要选择视觉区域中的特定部分,然后重点关注它。将注意力机制融入卷积神经网络,可以增强卷积神经网络的性能,使其可以重点关注重要特征并抑制不必要的特征。

Wang等[89]提出基于注意力卷积神经网络的个性化学习材料推荐方法。该神经网络的输入包括学习者上下文信息、课程上下文信息以及学习者学习活动信息3部分,该神经网络的输出是预测学习者在一门课程中的考试分数。通过神经网络的预测分数与学习者真实考试分数之间的差异来训练神经网络。其中,学习者上下文信息包括学习者的性别、年龄、专业、课程注册信息、课程点击信息等内容;课程上下文信息包括课程类型、授课教师、课程目标、课程时长等内容;学习者学习活动信息包括学习者的学习偏好、学习者暂停学习次数、学习者学习次数等内容。作者先用独热向量对这3部分内容分别进行编码;然后使用注意力卷积层和全连接层级联的神经网络提取学习者特征、课程特征、学习活动特征,以及它们之间的潜在关联关系,将这3部分特征编码到一个向量中;最后使用编码得到的特征向量进行分数预测。训练好的神经网络可以协助学生进行课程选择,为学生推荐其可能得分最高的top-n课程。基于注意力卷积神经网络的个性化学习材料推荐系统工作流程如图3所示。

图3 基于注意力卷积神经网络的个性化学习材料推荐系统工作流程Fig.3 Workflow of personalized learning material recommendation system based on attention convolutional neural network

目前,在提取欧式空间数据的特征方面,传统深度学习方法(卷积神经网络、循环神经网络等)取得了巨大成功,但是许多实际应用场景中的数据是从非欧式空间产生的,传统的深度学习方法在处理这类数据时难以产生令人满意的结果。例如,由于图数据中节点之间固有的不规则链接,使得传统深度学习方法在处理图数据时面临着巨大挑战,因此,图神经网络应运而生。图神经网络的核心思想是通过保留图的网络拓扑结构和节点内容信息,将图中的节点表示为低维向量,以便进行分类、回归等后续处理操作。

Wang等[90]提出一种基于图神经网络的top-n个性化课程推荐方法。作者通过研究指出,学习者的学习偏好可以分为“一般偏好”和“近期偏好”2种类型。“一般偏好”用于反映学习者在学习过程中的长期偏好和一般静态行为,“近期偏好”用于反映随着学习进程的推进。学习者学习偏好的变化情况,属于学习者的短期和动态偏好。学习路径规划问题应该同时考虑学习者的一般偏好和近期偏好。为此,作者使用在线学习平台“学堂在线”中的真实数据,构建了“学习者-课程”交互图,并将该交互图进一步分解为“学习者-课程”二部图、“学习者-学习序列”交互图和“课程-类别”图3个子图。在这3个子图中,运用图神经网络和卷积神经网络提取学习者特征与课程特征,使提取的学习者特征中同时包含“一般偏好”和“近期偏好”,提取的课程特征中既包含课程类别特征,也包含与该课程相关的学习者信息。接着,基于学习者特征和课程特征,使用注意力机制与贝叶斯个性化排序算法,为学习者推荐下一步学习的合适课程。

Kwasnicka等[91]提出一种基于自组织神经网络的学习路径生成方法,该方法会基于描述学生和学习材料的元数据进行推理,为学习者生成个性化的学习路径。Zhang等[92]通过研究发现,现有的在线学习系统不能捕捉学习者不同访问会话间的复杂关系,并且不能同时考虑学习者对当前课程兴趣偏好的变化。基于此,作者提出一种基于会话的课程推荐神经网络框架STR-SA,STR-SA使用自注意力模块,能够推荐学习者感兴趣的学习内容。Wu等[93]提出一种新颖的练习题推荐方法,首先利用长短时记忆网络预测知识概念的覆盖率,然后利用深度知识追踪,根据学生的练习答案记录,预测学生对知识概念的掌握程度,预测结果用于过滤练习题。由此生成练习库的一个子集。因此,可以通过解决优化问题获得推荐练习的完整列表。Antony和Arokia[94]提出一种新的学习材料推荐系统,该系统将嵌入式特征选择方法与基于模糊时态逻辑的决策树卷积神经网络分类器相结合,能够根据学习的理解水平向学习者推荐合适的学习内容。

Choi等[95]指出,现有学习路径规划方法存在以下3方面缺陷：1)学习路径规划方法的决策机制对于学习者而言是不透明的,即为何要将一个特定的学习材料推荐给学习者,学习者几乎一无所知,学习者对学习材料的选择的参与度较低;2)学习者必须完成当前推荐的学习材料后,才能获得下一个学习材料,学习者没有机会对当前的学习材料给出及时反馈;3)系统仅基于学习者的历史学习过程数据向学习者推荐学习材料,并没有收集和利用学习者对学习材料认知方面的数据。为此,作者提出一个名为Rocket的在线学习系统界面程序,该界面程序是一个类似于社交软件Tinder的学习界面,该界面可以显示使用卷积神经网络提取的学习材料的视觉特征,使学习者能够快速确定当前推荐的学习材料是否满足他们的需求。学习者可以通过向左滑动拒绝当前推荐并获取新的推荐,或者可以轻触界面,开启学习。Rocket允许学习者自由选择是否使用系统当前推荐的学习材料,收集学习者对学习材料认知方面的反馈,从而为个性化学习路径的生成提供指导信息。

强化学习是机器学习的一个分支,强调智能代理如何在不确定和复杂的环境中行动,以取得最大化的预期利益,实现特定目标。Li等[96]提出基于强化学习的最优分层学习路径规划方法,在该方法中,作者假设,在线学习系统中的学习材料固定不变,将学习路径规划问题建模为一个马尔科夫决策过程,其状态空间是技能属性,动作空间是系统中所有的学习材料。具体而言,在线学习系统中不同学习材料对应不同的技能,这些技能之间存在先序关系与依赖关系,作者使用经典认知诊断模型评估每个学习者已经掌握的技能和掌握的熟练程度,并为其构建技能层次化模型。基于该层次化模型,采用强化学习方法,为其推荐下一步需要学习的材料。当学习者完成系统推荐的学习材料后,会将其新获取的技能反馈给学习系统,学习系统据此更新学习者的技能层次化模型,并为其推荐后续学习材料。基于强化学习的最优分层学习路径规划方法示意图如图4所示。

图4 基于强化学习的最优分层学习路径规划方法示意图Fig.4 Schematic diagram of optimal hierarchical learning path planning method based on reinforcement learning

El等[97]提出一种基于多智能体和强化学习的自适应电子学习系统。该系统使用Q-learning算法向学习者推荐符合其特征和偏好的学习路径。该系统侧重于3个主要特征,即学习风格、知识水平和学生可能存在的残疾。考虑到3种类型的残疾,即听力障碍、视力障碍和阅读障碍。该系统将能够为学生提供与他们的个人资料相匹配的一系列学习对象,使学生获得个性化的学习体验。

基于神经网络的学习路径规划方法可以让网络自动学习学习材料间的依赖关系,捕捉学习者与学习材料之间的关联关系,并构建学习材料推荐模型。构建的模型具有一定的可移植性。但是基于神经网络的学习路径规划方法存在诸多缺点：一是训练这些神经网络模型需要大规模的学习过程数据,获取这些数据的成本较高;二是模型可解释性差。神经网络具有黑盒特征,神经网络学习到的权重通常很难被人类解释,神经网络的输出结果也不具有可解释性,因此该方法不能被教育领域的专家学者所信服。此外,在前述的top-n课程推荐方法中,由于在线学习系统中课程种类繁多、学习资源数量庞大,向学习者推荐的top-n课程可能是学习者已经学习过的课程(知识)或是已学习过的类似课程(知识)。

3 学习路径规划方法的评估标准

3.1 数据集

在学习路径规划领域,尚且缺乏标准的验证数据集,研究者常用到的数据集包括edX、Coursera、XuetangX等在线课程平台提供的数据集。此外,多数研究人员会使用自组织的数据集评估提出的学习路径规划方法,并在论文中提供构建数据集的相关信息。研究者常用的数据集构建方法是将领域知识组织为具有4层结构的层次化知识表示模型,即目标层、子目标层、知识点层、基本素材层[1],层间关系及其描述见图5所示。其中,目标层是学习者将要学习的某门课程或者目标知识,每个目标均可分解为若干个子目标。子目标层即为知识单元层,知识单元由若干知识单元和知识点组成,属于同一个知识单元的知识点和知识单元间具有较强的关联性[1]。这一层的目的是将分散的知识点关联在一起,使知识点具有较强的层次和结构关系。知识点层是整个知识表示模型的核心层,该层重点描述每个知识点的难度、重要度、所需预备知识集、测试通过阈值等。知识点之间可以存在多种关系,如前驱关系、后继关系、兄弟关系、包含关系、对立关系等。一个知识点可以与多个基本素材之间存在关联关系。基本素材层为物理上真实存在的、以教学为目的的数字化媒体文件,如文本类、视频类等。一个基本素材可以与若干知识点存在关联。

图5 数据集常用构建方法Fig.5 Common construction methods of datasets

叶露[13]使用八爪鱼采集器抓取了在线学习平台——果壳网MOOC学院中的计算机和数据与统计2个领域的所有课程,共收集到1 246条课程内容,以抓取的课程内容作为学习材料数据,验证提出方法的有效性。Shi等[75]将机器学习的领域知识进行整理,构建机器学习领域知识图谱,该数据集包含675个学习对象和1 033种对象间关系,将这个构建的数据集作为学习路径规划算法的验证数据集。周莹莹[98]研究初等数学领域知识间的关联关系,构建了初中数学领域知识图谱,知识图谱中共包含知识点实体2 225个,由专业团队对知识点间的关系进行标注,得到11 274条关系数据,去掉无关关系后,最终得到1 749条有效知识点关系数据,使用该数据集验证规划算法的有效性。Menai等[99]收集一所大学在线学习系统中的真实课程数据与学生学习数据,从中随机挑选2 000名学员的学习数据,来测试学习路径规划方法的性能。Agarwal等[100]使用来自匿名开放大学中开设的真实课程数据与10 000名学习者的学习数据,测试他们设计的学习路径规划算法的性能。

3.2 评估方法

如何对学习路径规划方法进行评估是研究人员需要考虑的重要问题。根据不同的研究目标,可以将评估方法分为两大类别：一类是内部评估,另一类是外部评估。内部评估试图证明,研究者提出的学习路径规划算法适用于解决学习路径规划问题,或者在计算性能方面具有更好的表现;外部评估更关注学习者主观的学习体验与学习效果。

3.2.1 内部评估

在内部评估方法中,研究者通常使用信息检索、机器学习和决策支持系统中常用的评估方法对学习路径规划方法进行评估,包括准确率、召回率、灵敏度[101]、均方根误差、平均绝对误差、模型运行时间等。Govindarajan等[101]以学习者表现为基础,通过准确率和灵敏度2个指标评估学习路径规划算法的性能。作者将学习者按照其对知识掌握的熟练程度进行划分,准确率用来度量当课程结束后,在所有注册课程的学习者中,对课程掌握的程度可以达到“熟练水平”的学习者数量所占的比重。灵敏度用来度量当课程结束时,对课程的掌握程度达到“专家水平”的学习者数量占所有注册人员的比重。

文献[51,102-103]使用平均绝对误差评估学习路径规划算法的性能。例如,Klašnja等[51]将学习者满意程度和平均绝对误差相结合,评估学习路径规划算法的性能。通过引入学习者满意程度,使学习者可以明确地决定算法的效用。即学习路径规划算法通过学习者的个性化特征为学习者推荐一条学习路径,并预测学习者对当前推荐的学习路径的满意度,记为pi;当学习结束后,会要求学习者对推荐的学习路径的满意程度进行评分,记为qi。满意度评分最低为1,最高为5,评分越高表示学习者对推荐的学习路径越满意。记录学习者对推荐的N条学习路径的真实评分与预测评分,并使用平均绝对误差来度量这种偏差,偏差越小,代表学习路径推荐算法性能越好

(1)

Durand等[2]通过计算算法生成一条学习路径的平均时间评估算法的性能。Li等[104]通过分析学习路径规划算法的执行时间评估学习路径规划算法的性能。Garrido等[105]通过评估算法生成的路径与学习者真实使用的路径在学习材料内容和数量上的差异评估算法的稳定性,通过统计生成一条学习路径所花费的时间评估算法的可扩展性。

李浩君等[40]使用相斥度评估算法性能。相斥度定义为学习路径规划算法生成的学习路径与学习者需求之间的符合程度。相斥度越小,表明当前学习路径越符合当前学习者的个性化需求;反之,则越偏离学习者需求。学习者与学习路径的相斥度函数由4个子映射函数通过加权系数构建：

(2)

其中：ωi表示权重系数,F(i)表示子映射函数。F(1)表示学习资源难度与学习者能力差异信息映射函数;F(2)表示学习资源间的支出映射函数;F(3)表示学习资源与目标知识点匹配度映射函数;F(4)表示学习者学习风格与学习资源类型匹配度映射函数。

Saito和Watanobe[106]将学习路径规划问题抽象为推荐问题,并使用推荐系统中常用的度量指标——轮廓系数衡量算法性能。轮廓系数计算同一簇中学习材料内容的一致性评估学习材料是否被合理分配。轮廓系数介于-1和1之间,接近1表示处于同一簇中的学习材料被正确分配。轮廓系数由下面的数字表达式定义：

(3)

其中：a(i)是簇内每个学习材料之间的平均距离,b(i)是每个学习材料到最近的簇的平均距离。

上述评估方法的优点是容易实现,能够在花费较少的前提下比较多种学习路径规划算法之间的优劣[1]。但是该方法也存在一定的可靠性风险,因为用户的学习行为或学习偏好在学习过程中可能发生改变,但是上述评估方法没有考虑这些因素的影响。

3.2.2 外部评估

学习路径规划方法的主要目的是提供满足学习者个性化需求的学习材料,提高学习者的学习效率,针对该目的,研究人员提出了外部评估方法。外部评估方法主要包括对比分析法和用户调研分析法2种。

对比分析法是目前最广泛使用的外部评估方法。在该方法中,学习者被分为2组——实验组和对照组,其中,实验组的学习者使用学习路径规划算法推荐的学习路径进行课程学习,对照组的学习者则自行完成课程学习或者使用老师制定的学习计划完成课程学习。通过比较2组学习者对学习内容的完成度、完成同一学习目标所用时间、学习结束后作答同一测试试卷获得成绩的高低等指标评估学习路径规划方法的性能。

Klašnja等[51]通过统计发现,实验组的学习者完成一门课程需要的时间比对照组用户少,从而证明学习路径规划算法的有效性。Xu等[62]在学习结束后,比较实验组和对照组学习者编写的程序的性能,验证学习路径规划方法的有效性。Feng等[56]、Yang等[107]、Colace等[108]通过比较实验组和对照组学习者作答相同试卷的成绩,评估学习路径规划算法的有效性。Essalmi等[109]通过计算学习者的满意度和用户忠诚度评估学习路径规划算法的性能。

对比分析法可靠性较高,但是使用该方法比较耗时,需要统计学习者真实的学习数据,花费成本较高。

另一种比较常用的外部评估方法是用户调研分析方法。使用该方法需要研究人员收集与学习路径规划算法相关的一些定性和定量信息。定性信息主要通过对学习者进行问卷调查的方式来获取,例如,“你认为当前推荐的学习任务容易完成吗?”,“你是否有足够的时间来完成学习路径规划算法推荐的学习内容?”等。定量信息可以统计用户在完成学习路径规划算法推荐的学习内容时花费的时间来获得。Klašnja等[51]通过非强制性问卷的方式,让用户对学习系统的速度、准确性、适应性、便利性4个特征进行评估。Li等[104]设计了一份由5个问题组成的问卷收集学习者真实的评估信息。

用户调研分析方法可提供一些额外的信息,比如学习者真实满意度、学习者忠诚度等,但是完成调研工作需要消耗较高的时间和金钱成本。由于用户调研方法的难度大、成本高,用户调研通常只能针对少量用户和特定任务展开。因此,用户调研的结果不能对所有用户都具有可信度和概括性。

4 展望

学习路径规划方法虽然已经取得了很多重要的研究成果,但是仍然存在很多限制和挑战。明确这些限制和挑战可以帮助研究人员在未来的研究中解决当前的缺陷。本文提出以下7个关于学习路径规划方法存在的不足及未来的发展方向：

1)学习者参数的特异性

现有的学习路径规划算法中,在构建学习者模型时,主要考虑所有学习者均存在的共性参数,例如学习者的学习偏好、知识背景、个人知识储备等,还存在许多与特定学习者相关的因素会影响学习者的学习进程和学习效率,例如学习者的第一语言、学习者间的文化差异、学习者的政治偏见、学习者的宗教信仰、学习者所处的社会经济条件等。这些未被考虑的因素为未来的研究提供了机会。现存的学习路径规划算法研究的目标通常是以前述的共性参数为基础,提出一个普适的学习路径规划方法,以适应所有学习者,但是并没有考虑特定环境中的特定学习者。

2)学习对象的多模态性

现有的学习路径规划方法主要针对单模态的学习材料展开研究,一些研究表明,使用多模态学习材料对学习者的学习过程具有积极的影响。未来的学习路径规划方法应该考虑不同知识领域中学习材料的多模态性,关注如何对不同模态的学习资源进行准确丰富的表示,并探索不同内容之间更丰富的语义关系,为用户提供多模态学习材料融合的学习路径。

3)学习材料参数的生成方式

目前,构建学习材料模型使用的各种参数主要由专家来定义,因此这些参数可能会受专家个人情感、经验的影响存在一定偏差,另外随着学习材料规模不断扩大,这种参数定义方法需要较大的人力开销。因此,未来需要研究学习材料特征自动捕获和语义注释的自动生成技术,从而自动生成学习材料的参数。例如,运用深度学习技术从视频资料中自动提取学习材料的视觉特征,自动生成学习材料的特征参数,提高学习材料推荐的准确性。

4)学习路径规划算法的可扩展性

随着学习者数量和学习材料的增加,学习路径规划算法需要处理的数据量同步增长,因此,需要存储的学习者与学习材料的交互数据可能是巨大的。学习路径规划算法需要尽可能快地为学习者生成符合其特性的学习路径,因此,在大规模数据量的情况下,如何设计具有高度可扩展性和适应性的学习路径规划方法成为一个值得探索的研究方向。

5)学习路径规划算法的评估标准

目前,尚缺乏一个统一且全面的评估标准对不同的学习路径规划算法进行比较。一个统一的评估标准应该拥有可靠的公共数据集以及一系列可用于评估算法结果的标准度量方法。目前,在学习路径规划领域中还没有公开的可靠公共数据集和测试标准,这为未来的研究人员提供了一个可行的研究方向。

6)学习路径规划算法的实际应用

尽管学习路径规划算法已经取得了一定的进展,并且很多研究已经表明,学习路径规划方法提供的解决方案在提高学习者学习效率方面具有积极的影响,但目前大多数研究成果在教育中的实际影响仍然还局限于研究项目中。因此,还需要做进一步的研究与推广,以使学习路径规划方法在现实场景中得到有效应用。

7)与学习路径规划相关的道德伦理问题

目前关于学习路径规划的研究中,并没有提及与此相关的道德伦理问题。学习路径规划问题是一个涉及人类与智能技术的问题,因此,随着科技的进步,道德伦理问题是一个需要被考虑的重要因素。

5 总结

学习路径规划方法的相关研究经过漫长发展,在学术界与工业界的均取得了一定的成果。本文从研究现状、评估方法、未来发展方向几个方面对学习路径规划方法进行综述,指出学习路径规划方法目前存在的问题与面临的挑战,这些问题为研究人员揭示了研究机会。这些存在的挑战必须得到解决,从而为学习者生成更高质量的学习路径,推动学习路径规划方法更广泛应用于实际学习与生活中。