谢苏超
摘要摘要:在线智能化学习是目前教育技术领域研究的热点,其中课程资源自动编列是在线智能化学习系统应用成功的关键。课程资源编列能够较好地解决个性化学习资源筛选与重组问题,已成为智慧学习领域重要的研究课题。首先在分析国内外课程资源编列文献的基础上,阐述了课程资源编列问题的内涵,构建了课程资源编列问题模型,然后梳理基于进化计算的课程资源编列问题研究文献,探索基于学习者特征的课程资源编列分类研究现状,开展基于进化计算的课程资源编列问题应用研究分析,最后给出了研究趋势与展望。
关键词关键词:在线学习;课程资源编列;学习资源;进化计算
DOIDOI:10.11907/rjdk.171024
中图分类号:TP301
文献标识码:A文章编号文章编号:16727800(2017)005019905
0引言
近年来,随着大数据、机器学习和云计算等新兴技术的快速发展,人工智能已广泛应用于各个领域,以进化计算方法应用为代表的智慧学习研究也得到了迅速发展,成为推动智慧学习[1]系统构建的关键技术之一。信息技术的快速发展以及在线学习资源的不断丰富,使学习者能获取的学习资源越来越多。在为学习者带来便利的同时,也使学习者需要花费更多的时间和精力去筛选符合自己学习需求的资源,因此“资源超载”现象越来越严重[2]。此外,由于学习者的认知能力存在差异,导致不同学习者的学习需求也是不同的。因此,学习者迫切期望能获得符合其实际需求的学习资源序列和资源内容[3]。
在线学习环境中,为了从众多的学习资源中发现、导入、组合以及分发给学习者适合的资源序列与资源内容,需要为学习者设计智能化、动态化以及个性化的资源处理工具,从而产生了在线学习领域的课程资源编列问题(Curriculum Sequencing Problem)。从广义而言,课程资源编列指根据学习者的学习特征提供个性化的学习资源,如:学习资源推荐、个性化学习路径生成[4]等,从而提高个体学习者的学习效率;从狭义而言,课程资源编列指按照学习者的个性特征、学习目标、学习内容以及课程层次要素组织课程学习资源序列。
在线学习系统应用成功的关键是提供的学习资源能否适应学习者的先验知识和学习需求[5],其中课程资源编列问题是在线学习系统中实现智能化学习的核心。在传统的学习系统中,学习资源是固定、预先存储的。然而,在智能化学习系统中,学习资源可以动态的增加、移动和删除。因此,迫切需要一种能解决课程资源编列的算法,可以适应不断变化的学习环境。进化算法(又称为演化算法)与传统的优化算法相比,进化计算的自适应、自学习等特性,能够较好地处理课程资源编列问题。
1课程资源编列问题
1.1课程资源编列问题描述
Brusilovsky[6]认为在线学习系统应提供教师导学功能,并给予学习者个性化的服务支持。但由于学习内容和服务需求具有较强的个性化和特异性,海量的学习资源容易使缺乏经验的学习者无所适从,因此要求学习系统能够提供有效的学习资源管理策略。
目前绝大多数数字化学习系统采取固定的资源管理策略模式,提供的学习资源以及资源序列都没有考虑到学习者的偏好、需求以及个性特征。在线学习者人数众多且存在特征多样性,学习者的需求也会在学习进程中不断变化,在线学习系统应该能够为学习者提供动态、个性化的资源序列和内容,不应把为初学者准备的引导性学习资源推送给有一定学习基础的学习者,同样也不应把为有编程经验的学习者提供的程序设计学习资源推送给无编程经历的学习者。
课程资源编列即为学习者提供最佳的个性化学习资源序列,使其能高效地完成学习任务。课程资源编列涉及学习者相关特征和课程学习内容,具体包括学习者的背景、先前所修课程学习内容、学习动机、成绩以及学习能力和风格等。即使是确定的学习者,随着其学习内容的增加与能力的提升,该学习者的实际学习需求也会发生变化,对应的学习资源会被加入或者剔除,这些都是课程资源编列所需解决的问题。
根据在线学习应用关注的重点不同,课程资源编列问题也有多种表现形式,例如:个性化学习路径及资源推荐、课程学习资源排序以及课程学习资源组合等问题。总之,为学习者指定适合其学习所需的学习资源序列和资源内容是课程资源编列问题研究的宗旨。
1.2课程资源编列问题模型构建
课程资源编列问题可视为一个NP难问题[7],即针对特定学习者遍历课程资源的所有可能序列并寻找最优序列是非常困难的。假设课程学习内容包括n个课程学习资源,如果不考虑各种约束条件,所有可能的课程资源序列为n!,但课程学习资源很多时候很难得到所有可能的序列并寻找最优排序。如果考虑到学习者先前所学的知识、学习能力、背景、学习风格等约束条件,可行的编序则会缩小。因此,课程资源编列问题可构建为约束满足问题模型或者多目标最优化问题模型。
1.2.1约束满足问题模型
约束满足问题(Constraint Satisfaction Problem,CSP)广泛存在于人工智能领域。一般而言,CSP问题可定义为P=(Q,E,C)。其中,Q是n个变量(Q1,Q2,…,Qi ,…,Qn)的集合,E是n个域(E1,E2,…,Ei ,…,En)的集合,Ei是Qi可能取值的集合,C是变量Q之间的约束关系集。
当满足约束问题中存在元组排序需要时,被称为排序满足约束问题。一个排序满足约束问题可以定义为:(X,E,C,P),其中(X,E,C)为一个满足约束问题,P=
课程资源编列问题模型转化为一个排序满足约束问题(PermutCSP)模型[8]。例如:假設有N个课程学习资源,则排序满足约束问题的解集S={1,2,3,4…N} (其中所有的学习对象必须是有顺序的)可以被定义为:
X={x1,x2,x3,x4…xN}
E(Xi)={1,2,3,4…N} xi∈X
C={xi+1-xi>0:xi∈X,i∈{1,2,3,4…N}}
P=<1,2,3,4…N>
1.2.2多目标优化问题模型
在优化问题中存在多个需要同时处理的优化目标时,则成为多目标优化问题(Multiobjective Optimization Problem,MOP)。多目标优化问题是由多个决策变量、目标函数、约束条件组成的优化问题。课程资源编列问题可构建为一个多目标优化问题[9],其中决策变量、目标函数如下:
(1)学习者参数:①{L1,L2,…,LK}代表K个学习者;②{A1,A2,…,AK} 代表K个学习者的水平,其中Ai,1≤i≤K,是学习者Li的学习水平;③{H1,H2,…,HK} 代表K个学习者期望的学习目标。每个Hi 有 M 个二进制值,Hi={hi1,hi2,…,hiM},其中 him = 1,1≤i≤K 且1≤m≤M,代表期待的学习目标包含了学习概念 Cm,否则 him=0;④约束tl_i,1≤i≤K:学习者Li学习期望时间的下界;⑤约束tu_i,1≤i≤K:学习者Li学习期望时间的上界。
(2)学习资源参数:①M个学习概念{C1;C2… CM};②N个学习对象{ LO1;LO2… LON}。一个LOi 可以涵盖多个学习概念(1≤i≤N);③学习对象难度水平{ D1;D2… DN}。Di 代表学习对象LOi的难度(1≤i≤N);④学习对象涵盖学习概念{R1;R2… RW}。每个 Ri都是M个二进制值的向量(1≤i≤W)。Ri={ri1;ri2;… ;riM },如果学习对象LOn涵盖了学习概念Cm,rnm = 1,1≤m≤M,否则值为0;⑤学习对象LOn的学习时间tn,1≤n≤ N。
(3)决策变量xni,1≤n≤N且1≤i≤K。如果学习对象LOn是学习者Li课程总序列的一部分,xni = 1,否则xni =0。
课程资源编列的目标函数可表示为:
(1)F1:学习对象和目标之间学习概念的平均差异。
F1=∑Mm=1∑Nn=1xni|rmn-him|∑Nn=1xni,1≤i≤K(1)
(2)F2:学习对象难度和学习者能力水平之间的平均差异。
F2=∑Nn=1xni|Dn-Ai|∑Nn=1xni,1≤i≤K(2)
(3)F3:全部材料的学习时间与学习者期望时间的关系。
F3=maxtli-∑Nn=1tnxni,0+max0,∑Nn=1tnxni-tui,1≤i≤K(3)
(4)F4:学习概念在所安排课程中的平衡性。
F4=∑Mm=1him∑Nn=1xnirnm-∑Nn=1∑Mm=1xnirnm∑Mm=1him,1≤i≤K(4)
当4个目标函数F1、F2、F3、F4值达到最小时,表明课程资源编列的序列最符合学习者需求,即:
Fmin=F1+F2+F3+F4(5)
因此,课程编列问题即可定义为同时满足F1、F2、F3、F4 4个目标函数的最优解问题。
2进化计算
进化计算(Evolutionary Computing)是以达尔文的进化论思想为基础,模拟生物进化过程的人工智能技术,其过程包括:选择、重组和变异。常见的进化计算算法有:遗传算法(Genetic Algorithms,GAs)、蚁群算法(Ant Colony Optimization,ACO)以及粒子群优化算法(Particle Swarm Optimization,PSO)等。
遗传算法是由美国Hooland J H[10]教授参考生物进化论和遗传定律的思想并改进后提出的进化计算算法。遗传算法的3个步骤分别为:选择、交叉和变异,通过上述3个步骤完成个体的更新和重组;蚁群算法是模仿蚂蚁的觅食过程,由意大利Dorigo等[11]提出的。蚂蚁行走的路径上会留下信息素,其它蚂蚁可以通过信息素的多少判断路径正确与否;粒子群概念起源于对简化的社会系统的模拟。1995年,Kennedy和Eberhart等[2]提出粒子群算法。粒子根据当前群体最优粒子的位置和自身历史的最优位置来判断自己的飞行方向,具有速度快、操作简单、鲁棒性强等特性,适用于处理优化问题。
3进化计算解决课程资源编列问题分类
国内利用进化计算解决课程资源编列问题的研究数量不多,而国外相关研究工作开展较早,相关研究文献数量也较多。图1是对最近10年进化计算解决课程资源编列问题文献数量的统计汇总。目前研究问题主要集中于课程资源结合个性化在线课程生成、移动学习路径生成、学习资源与学习路径推荐等领域。
在线学习领域中学习者要从学习资源中获取所需的相关知识,从而完成規定学习领域中具体课程的学习内容,而学习者自主寻找与自身当前学习状态相符的学习资源是非常困难的。基于进化算法的课程资源编列服务可以根据学习者个体需求、学习目标、知识水平、学习能力等,从学习资源中提取合适的学习资源片段,为学习者提供智能化的学习向导服务。因此,利用进化计算算法解决课程资源编列问题是在线学习领域的一个重要研究内容。在线学习领域应用较多的进化算法有遗传算法、蚁群算法、粒子群算法以及数据挖掘等。
通过整理课程资源编列问题研究的相关文献,按照解决此问题时是否关注相似经历的学习者,可以将此类问题分为:基于群体特征的课程资源编列(Social Sequencing)和基于个体特征的课程资源编列(Individual Sequencing)[12]。
3.1基于个体特征的课程资源编列
基于个体特征的课程资源编列研究的关注重点是个体学习者的个性特征而不是多个学习者的整体表现。与基于群体的课程资源编列不同,学生个体模型和学习目标是基于个体特征的课程资源编列方法的基础。基于个体特征的课程资源编列研究中使用的进化计算算法主要有遗传算法、文化基因算法等。
从表1中可以看出,与基于群体的编列不同,基于个体特征的课程资源编列中涉及学习资源概念关联度、学习资源难度、学习者背景以及学习顺序等因素,强化了对于个体的关注度。该研究领域中应用最多的进化计算中的遗传算法可生成满足学习者的课程资源学习内容编列。
分析近几年的文献可以发现,遗传算法被用来解决个性化网络课程构建、学习路径优化以及个性化在线学习系统构建等问题。如陈华月[13]利用遗传算法来获取学习资源特征,分析用户个性特点,使在线学习智能化,并设计了学习资源推荐系统模型;李浩君等[14]将遗传算法用于移动学习路径研究中,提出了移动学习模式和学习路径优化策略,并在网络工程综合实验课程学习中加以验证,证实了其有效性。
此外,很多学者通过对遗传算法的改进,优化了问题解决策略。Shen等[15]为了解决课程难度和学习者表现的动态变化之间的匹配问题,对遗传算法加以改进,提出了PCE-GA方法,给出了PCE-GA架构图,实现了个性化课程的动态生成;Chang等[16]利用改进的遗传算法(Genetic Algorithm with Forcing Legality)实现个性化网络课程构建,并对PSO、RPSO和GA进行了对比研究,结果表明改进的遗传算法作为推荐算法效果更好;Huang等[17]针对现有在线学习系统忽略了学习者能力与课程难度之间匹配程度的问题,利用案例推理法重用已有的学习经验,构建基于遗传算法的个性化在线学习系统。通过实验验证,该系统可以帮助学习者提高网络学习效率;傅伟司[18]设计了基于遗传算法的个性化在线学习系统(GA-Based POLS),该系统在综合考虑用户个性化需求的前提下,利用遗传算法对学习资源进行智能化推荐,推荐的结果满足了学习者的个性化需要。
遗传算法是进化计算在各个领域应用最频繁的算法之一。遗传算法应用在课程资源编列问题时,基因就是课程知识领域的概念,染色体是课程资源编列,通过选择(从新课程编列中选择适应度值小的序列,淘汰适应度值大的序列)、交叉(课程内容编列重排)、变异(个性化课程的概念序列中某一核心概念序列的改变)来得到优化的课程资源编列。基于遗传算法的课程资源编列问题解决思路如图2所示。
通过上述分析可见,遗传算法在解决课程资源编列问题中应用十分广泛。研究者在利用遗传算法时,有些利用算法提取用户兴趣,也有结合其它方法,如案例推理等进行个性化在线学习系统的构建,完成了具有编列功能系统模型的建立。此外,遗传算法用于移动学习领域的个性化学习路径问题也已得到关注。
3.2基于群体特征的课程资源编列
基于群体的课程资源编列借鉴了电子商务中的推荐系统概念。电子商务推荐系统能分析不同用户的需求,在为用户提供产品信息的同时给出购买建议,以达到扩大销售的目的。在线学习领域中基于群体的课程资源编列依据不仅有学习者个体特点,还有相似学习者的学习历史记录以及学习效果表现等。群智能方法(Swarm Intelligence Method)通常被用来寻找相似学习者并安排学习内容给潜在的学习者,其中应用最多的是蚁群算法。此外,粒子群算法、遗传算法结合数据挖掘算法也被用来解决此类问题。
蚁群算法是基于群智能算法的课程资源编列问题研究中应用最广泛的算法之一。如表2所示,类比蚁群中蚂蚁的集体行为,基于群体的编序参考标准中包括了其他学习者的学习表现、学习风格以及学习者访问历史等因素。
通过文献梳理可以看到,蚁群算法被应用于解决学习路径推荐、资源检索、学习资料动态选择等问题。Valigiani等[19]用实验揭示了学习者的行为不同于人工蚂蚁。标准蚁群算法是通过类比“ant-hill”的行为得来的,而学习者的“man-hills”的行为则与之不同;吴彦文等[20]设计了基于蚁群算法的资源检索模块。该模块可以挖掘用户日志,获取用户使用特征。通过模拟蚁群算法建立概率模型,并按照概率值对资源进行降序排列。实验表明,采用蚁群算法后提高了系统的查准率,减少了资源检索开销。但是在实际应用中存在干扰因素,算法的准确度还有待提高;Dharshini等[21]在利用蚁群算法生成学习路径中,重点改进了信息素更新策略,使利用蚁群算法的学习路径推荐结果更加准确;Wong等[22]利用蚁群算法实现自适应学习路径生成,并开发了DYLPA(Dynamic Learning Path Advisor)系统。其中,信息素的计算是基于校友的学习路径和他们所达到的成绩。对系统原型的验证表明,该算法更加适用于时变领域,即对于课程不断更新,学习指导、工具和学习者特征不断变化的网络学习有较高的适应性;Semet等[23]利用蚁群算法使学习网站可以智能、动态地显示学习材料,同时提供给教学团队一个精确的审核工具,以帮助他们确定教学材料的优劣之处。
在算法改进方面,通过加入贝叶斯网络、特征等提高了系统精确度。Marquez等[24]利用特征模型、贝叶斯网络和蚁群算法生成学习路径,将贝叶斯网络和蚁群算法同时应用于适应性函数,使系统更加有效地生成学习路径;Yang等[9]利用基于特征的蚁群算法系统(AACS)实现自适应学习资源的推荐,该算法是蚁群算法的改进,改变了信息素更新策略,从学习者知识水平和学习风格两方面更新信息素,并使用该算法实现了基于网络的学习门户(FORPA);程岩[11]为解决学习路径问题,提出了一种增强蚁群算法,该算法推荐的指标为:学习路径评价、学习者知识水平和学习者学习风格。模拟实验结果表明,该方法准确性较高。
从文献梳理中可以发现,粒子群算法用于解决课程排序、资源导航、课程构建等问题。DeMarcos等[25]利用粒子群算法解決基于能力本位的课程顺序问题,即将元数据和能力作为学习资源之间的联系,运用粒子群算法进行资源推荐。实验结果显示出粒子群算法解决此类问题的良好效果;黄永青等[26]利用蚁群算法分析使用者的浏览日志,并提出一个导航路径挖掘算法,帮助用户提高其资源搜索能力,并为其提供个性化资源搜索服务;肖会敏等[27]根据学习目的和知识水平寻找相似的学习者,利用粒子群算法实施学习路径推荐,推荐过程中主要参考相似学习者对学习对象的评价,并且验证了该方法的有效性。
此外,很多改进粒子群算法也被用于课程资源编列问题的解决中。Wang等[28]提出了一个复习课程建构系统,在系统中使用离散粒子群最优算法快速挑选出与学习者意图相匹配的学习资源。此外,还使用了贪婪算法对选出的学习材料进行排序。实验结果表明,此系统可满足学生需求;Sarath等[29]利用基于数字信息素改进的粒子群算法生成个性化网络课程。实验结果显示,此方法相比其它粒子群算法有一定提高;杨超[30]在解决学习资源推荐问题时,先构建了知识点网络图,再分析不同学习者的个性特点以及能力水平,应用粒子群算法筛选个性化的学习资源推荐给学习者,其中加入了项目反应理论和概念图理论。最后通过实验验证了其收敛性,学习资源推荐效果能够达到学习者预期。
通过上述分析可见,属于群体特征的蚁群算法和粒子群算法的关键在于算法模型与学习模型的匹配。而能够通过利用知识概念构建知识点结构图等方法获取不同学习者的目标和能力是应用算法的基础,也是提高算法精确度的关键。
4研究展望
进化计算目前是一个新兴的研究领域,仍有许多值得深入探索和亟待解决的问题,也是今后需要进一步研究的方向。
(1)学习者模型优化。在应用进化算法实现课程内容动态生成的过程中,学习者模型始终是算法准确度的一个重要前提,而在实际学习场景中,对学习者特性的准确建模有一定挑战性,还需要深入研究。目前对学习者特性的评估方法准确性还有提升的可能,需要更多领域的学者参与进行进一步研究,以建立更加完善的用户模型。
(2)进化算法优化。随着研究的深入,为了提高课程资源编列的效率和准确度,應对最新的进化算法进行改进以适应要求,尝试使用新的改进进化算法,如:云变异粒子群算法、Tent混沌粒子群算法、均匀搜索粒子群算法等,可满足推荐效率和准确度方面的要求。
(3)应用领域扩展。随着学习者学习需求的增长,在移动学习领域同样面临着学习资源序列推荐问题。与传统的网络学习相比,移动学习中移动学习情景的变化也增加了资源编列的复杂度。进化计算应用于此类问题也是今后的研究方向。
在后续研究中,应从用户模型及算法性能等方面提高编列的可靠性。除此之外,引入新型算法、拓展应用领域也是新型学习方式的必然要求。
5结语
进化计算作为求解最优化问题的重要工具,已经得到了广泛关注并且吸引了大量研究人员参与。将进化计算技术应用于课程资源编列问题领域,能克服传统学习系统学习资源固定、无法动态生成的问题。通过这种具有高鲁棒性和广泛适用性的全局优化方法,使在线学习系统可以适应不断变化的学习环境,实现学习的个性化和智能化,提高学习效果。本文在分析课程资源编列问题的基础上,详细阐述了基于进化计算的课程资源编列问题研究现状和进展,以期为相关领域的研究人员提供参考。
参考文献参考文献:
[1]吴洪艳.智慧学习视角下个性化在线学习系统设计与应用[J].中国电化教育,2015 (6):127131.
[2]赵呈领,陈智慧,黄志芳.适应性学习路径推荐算法及应用研究[J].中国电化教育,2015 (8):8591.
[3]赵铮,李振,周东岱,等.智慧学习空间中学习行为分析及推荐系统研究[J].现代教育技术,2016,26(1):100106.
[4]曹良亮.在线学习中学习路径分析及学习行为特点研究[J].中国远程教育:综合版,2014(4):2530.
[5]张家华,张剑平.适应性学习支持系统:现状、问题与趋势[J].现代教育技术,2009,19(2):1820.
[6]BRUSILOVSKY P.Adaptive and intelligent technologies for webbased eduction[J].Special Issue on Intelligent Systems and Teleteaching,1999(4):1925.
[7]ACAMPORA G,GAETA M,LOIA V.Hierarchical optimization of personalized experiences for elearning systems through evolutionary models[J].Neural Computing & Applications,2011,20(5):641657.
[8]DEMARCOS L,GARCA A,GARCA E,et al.An adaptation of the parliamentary metaheuristic for permutation constraint satisfaction[C].2010 IEEE Congress on Evolutionary Computation.IEEE,2010:18.
[9]CHU CP,CHANG YC,TSAI CC.PC2PSO:personalized ecourse composition based on particle swarm optimization[J].Applied Intelligence,2011,34(1):141154.
[10]葛继科,邱玉辉,吴春明,等.遗传算法研究综述[J].计算机应用研究,2008,25(10):29112916.
[11]程岩.在线学习中基于群体智能的学习路径推荐方法[J].系统管理学报,2011,20(2):232237.
[12]ALMUHAIDEB S,MENAI MEB.Evolutionary computation approaches to the curriculum sequencing problem [J].Natural Computing an International Journal,2011,10(2):891920.
[13]陳华月.基于遗传算法的个性化在线学习系统设计[J].通化师范学院学报,2011,32(8):2324.
[14]李浩君,徐佳程,房邵敏,等.个性化移动学习路径优化策略应用研究[J].电化教育研究,2016(1):3944.
[15]TAN XH,SHEN RM,WANG Y.Personalized course generation and evolution based on genetic algorithms[J].Journal of Zhejiang UniversitySCIENCE C (Computers & Electronics),2012,13(12):909917.
[16]CHANG TY,KE YR.A personalized ecourse composition based on a genetic algorithm with forcing legality in an adaptive learning system[J].Journal of Network & Computer Applications,2013,36(1):533542.
[17]HUANG MJ,HUANG HS,CHEN MY.Constructing a personalized elearning system based on genetic algorithm and casebased reasoning approach[J].Expert Systems with Applications,2007,33(3):551564.
[18]傅伟司.基于遗传算法的个性化在线学习系统模型研究[D].广东:广东技术师范学院,2014.
[19]VALIGIANI G,BIOJOUT R,JAMONT Y,et al.Experimenting with a realsize manhill to optimize pedagogical paths[C].Proceedings of the 2005 ACM symposium on Applied computing.ACM,2005:48.
[20]吴彦文,吴世杰,刘晋萍.蚁群算法在网络教育资源检索中的应用[J].计算机应用与软件,2008,25(11):197198.
[21]DHARSHINI AP,CHANDRAKUMARMANGALAM S,ARTHI G.Ant colony optimization for competency based learning objects sequencing in elearning[J].Applied Mathematics & Computation,2015,263(C):332341.