李春生 张 朦
(东北石油大学计算机与信息技术学院 大庆 163318)
随着教育信息化的发展,在线学习平台也逐渐走入教育教学的视野[1]。由于在线学习平台具有跨越时空距离、资源重复利用、内容丰富多样、学习成本低等特点,受到广大学习者的喜爱与推崇。但纵使在线学习平台有着如此多的优势,其学习资源数据量大、知识结构复杂、内容丰富多样等信息过载现象,给学习者的学习造成了一定困扰,学习者在繁复多样的学习资源中选择适合自己的学习资源变得十分困难,因此学习者迫切地需要个性化学习路径推荐服务[2]。个性化学习路径推荐主要以学习者的基本特征、初始能力水平与学习风格等因素决定,主要满足学习者个性化和精准化的学习需求[3]。
目前,国内外越来越多的学者开始进行学习路径推荐研究。Ghauth和Abdullah[4]提出了一种基于内容的推荐算法,该算法以优秀学习者评分为依据,从而提高了推荐系统的准确性。另外,Aher 和Lobo[5]等采用了K-means 和关联规则算法Apriori的组合方法对学习者的历史学习数据进行分析,并成功地向新生推荐课程,取得了显著的效果。Zhou[6]等基于聚类和机器学习技术提出了一种新的全路径推荐模型,很好地提高了学习效果。综上,混合推荐算法取得了较好的推荐效果,但是其推荐数据过于单一,致使推荐精准度较低,并且忽略了学习具有序列性的特征,无法真正满足学习者的个性化需求。
针对上述问题,本文构建了一种新型个性化学习路径推荐模型。模型主要分为两个部分,首先采集分析学习者的在线学习行为数据,使用K-means算法将学习者聚类,构建相似学习者模型;然后,以相似学习者模型为基础,向学习者推荐最优学习结果的学习路径,同时采用Lasso-Lars 算法,分析影响学习效果的各个影响因素的强度序列,进一步优化个性化学习路径推荐模型。
在线学习平台中学习者可以按照自己的行为习惯和偏好选择学习资源进行学习[7]。例如学习者选择知识的顺序、不同的学习活动、访问某些模块的频次等等,这些记录在系统日志中的学习行为数据反映了学习者学习特征。同时,学习者的心理特征也影响学习者学习效果和成绩[8]。因此,本文将从学习者心理特征和在线学习行为两方面分析学习者特征。
学习者心理特征主要包括学习态度、学习动机和学习类型[9]。学习态度是学习者对学习、学习环境和教学活动所表现出来的心理倾向[10]。学习动机是指学习者内在产生的学习动力,并促使行为朝向一定的学习目标[11]。学习类型分为视觉型、听觉型、动觉型,主要依据学习者学习感官倾向[12]。学习者在线学习行为数据存储在学习平台日志中。通过对这些数据计算分析,获得相似学习者模型和学习风格特征,以此为基础构建个性化学习路径推荐模型。
学习风格是具有学习者个性特征的学习方式和学习倾向的总和[13]。本文主要采用Felder-Silverman学习风格模型[14],即应用非常广泛的所罗门模型。该模型将学习风格分为4 个维度8 种类型,分别是信息加工(活跃型/沉思型)、感知(感悟型/直觉型)、输入(视觉型/言语型)、理解(序列型/综合型)[15]。
Lasso-Lars 算法在2004 年被Efron 等[16]正式提出。Lars算法是一种特征选择算法,它从训练数据集中选择相关性强的特征序列[17]。算法首先选择与响应变量相关性最大的观察变量,然后沿着该方向继续选择下一个观察变量,直到特定条件满足[18]。如果有多个观察变量与残差的相关性相同,算法会选择沿着它们等角度的方向继续前进,并选择所需的观察变量[19]。
Lars算法步骤[20]如下:
1)将回归系数向量设置为0,然后找到与响应变量yi最相关的一个观察变量,记作;
2)将沿着此观察变量的方向最大限度地增大,直到找到另一个与当前残差r=y-最相关的观察变量被选中为止,将其记为;
3)将朝着与(,)等角度的方向增大,直到出现第3 个观察变量符合与当前残差最相关这一条件;
4)一直沿着与(,,)等角度的方向增大,直到出现第4个观察变量,以此类推。
Lars算法是残差不断减小的过程,具有很高的计算效率[21]。因此,本论文采用Lasso-Lars 方法对学习者的心理特征和在线学习行为进行分析,通过Lars算法迭代计算,得到与学习者学习成绩相关性最强的特征序列。
本文将学习者在线学习行为分析引入个性化学习路径推荐,通过对学习行为数据分析设计相似学习者模型,并以此为基础构建个性化学习路径推荐模型。构建该推荐模型主要考虑三个问题:第一,依据学习者在线行为分析,如何构建学习特征相似、知识水平一致的相似学习者模型;第二,经过上述分析,如何选择最优的相似学习者学习路径,完成个性化推荐。
针对上述问题,设计相似学习者模型和个性化学习路径推荐模型共同构成个性化学习路径推荐模型框架。首先利用K-means 算法聚类获得特征相似、知识水平一致的相似学习者模型。而另一部分个性化路径推荐模块,在相似学习者模型基础上,使用Lasso-Lars 算法分析出与学习成绩具有强关联关系的几种学习者在线学习行为,在推荐时优先考虑。
在线学习行为不同表示学习者学习风格和学习水平具有差异性特征,实现个性化学习路径推荐需以此为依据。因此,构建相似学习者模块根据以下三步进行:第一,量化学习者的在线学习行为;第二,对学习者学习风格进行分析;第三,构建相似学习者模块。
3.1.1 量化在线学习行为
学习者在线学习行为数据反映了学习者基本特征、学习偏好和认知水平,这些数据储存在学习平台日志中。学习者的基本特征用来标记和区分学习者,包括学习者的编号、姓名、性别、年龄、职位、科目信息。将知识按照复杂程度划分5 个层级,依次排列为{1,2,3,4,5},设计试卷对学习者进行初始能力测试。
3.1.2 学习风格分析
根据学习者学习行为的差异性,从学习平台日志中提取学习者在线学习行为数据,通过计算分析得出学习者学习风格,以便向学习者推荐个性化学习路径。
表1 学习风格分析计算表
3.1.3 相似学习者模型的构建
相似学习者是指特征相似、知识水平一致的学习者群体。利用聚类K-means 算法将学习者分成多个聚类,且每个聚类都包含至少一个相似特征。根据学习者的基本特征,包括编号、性别、职位、科目信息和初始能力测试,将它们用作5 个聚类中心。然后,计算每个学习者与聚类中心的距离,并将其分配给距离最近的聚类中心。这样,每个聚类中心所包含的学习者就构成了一组聚类。当前学习者与聚类中心距离最近时,将此编号学习者分配给此聚类中心S 组,并从学习集中提取N 组向量。以此类推,在以性别向量为聚类中心的学习者集合中获得聚类向量S1,在以职位向量为聚类中心的学习者集合中获得S2,在科目向量为聚类中心的学习者集合中获得S3,在初始能力向量为聚类中心的学习者集合中获得S4。按照给定的方法,重新计算每个学习者集群之间的相似度,并将相似度最小的两个学习者集群合并,直到所有学习者都被分类到集群中。最后,重复以上步骤,将各学习者重新分配到学习者集群中,并重新计算新的学习者集群中心,直到集群中心不再改变。由此,相似学习者模型构建完成。
学习路径时学习者选择学习内容和学习活动的有序序列,学习路径推荐是为了提高学习者的学习成绩,获取最优的学习过程辅助学习者的学习。因此,将相似学习者模型中学习成绩最优的学习者学习路径推荐给同一集群的其他学习者,以此确保学习者获得最优学习路径。由于学习者的个体差异较大,为了实现个性化学习路径推荐,需要进一步优化。主要的方法是采用Lasso-Lars 算法,该算法可以分析与学习成绩具有强相关性的几个关键因素。在为学习者推荐学习路径时,优先考虑这些因素,并根据其关联关系为学习者提供更加精准的个性化学习路径。
3.2.1 个性化学习路径推荐
个性化学习路径也就是根据学习者特征分析结果,在保证学习内容一致的基础上,为学习者匹配最符合其个性化发展的学习路径。本文主要以相似学习者模型为基础,充分考虑学习者的基本特征、学习风格、初始能力水平,向学习者推荐合适的学习路径。依据学习者的基本特征和初始能力水平,向学习者推荐相似学习者集群中学习效率最高、学习成绩最好且能力水平一致的学习者学习路径;根据学习者的学习风格,推荐与其个性化特征相符的学习方式和学习活动,以促使学习者在学习活动中投入度最大化,并实现更好的学习效果。与此同时,在线平台日志中的学习者在线行为数据也将动态监测学习者的学习路径,以此获得实时反馈和评价。
3.2.2 基于Lasso-Lars算法的学习路径优化推荐
为了达到更好的效果,在学习路径推荐时需要考虑的学习者特征必须全面,但并不是所有的学习者特征都对学习效率和学习成绩有明显的影响。因此,通过文献分析以及调查研究发现,学习者的学习成绩主要与学习者的心理特征和学习行为相关,本文主要采用Lasso-Lars 算法分析找到这些影响因素的差异性,获得其优先级,从而优化个性化学习路径推荐模型。
首先,设计问卷调查学习者的学习动机、学习态度和学习类型,获得学习者心理特征数据。然后,从在线平台日志中提取学习者在线学习行为,分别为视频观看时长、PPT 观看时长、文本材料访问时长、初始测试得分、课后习题得分、浏览论坛时长、发帖以及回复帖次数、做笔记方式、签到次数以及测试成绩。综上,共有3 个心理特征和9 个学习行为影响学习成绩。
使用Lasso-Lars 算法,以学习者的测试成绩为自变量,上述12 个因素为因变量,将每个学习者的数据作为一个记录。通过应用Lasso-Lars 算法,可以得到每个因素对应的回归系数的变化趋势图,并确定不同因素对学生学习成绩的影响大小。根据这些结果,确定影响因素的序列。最后,在推荐学习路径时基于相似学习者的模型,优先考虑对学习成绩影响较大的因素。这样可以提高学习者的学习效率和学习成绩。
根据个性化学习路径推荐的特点,本文采用的是岗位技能培训系统为实验对象,对构建的个性化学习路径推荐模型进行实验效果分析。岗位技能培训系统由六大模块,分别为学习指导、岗位技能培训、学习工具、测评管理、教师知识管理、系统管理模块。如图1所示。
图1 岗位技能培训系统架构图
在系统日志中随机选取50 名学习者学习行为数据信息,同时向这50 人发放调查问卷。获得学习者学习动机、学习态度、学习类型、视频观看时长、PPT 观看时长、文本材料访问时长、初始测试得分、课后习题得分、浏览论坛时长、发帖以及回复帖次数、做笔记方式、签到次数以及测试成绩数据。由于Lasso-Lars 算法只能处理数值型数据,因此对12个影响因素数据进行量化处理。
关于学习者学习动机和学习态度,在调查问卷中设计5 个代表不同分值的选项,分别是“非常不同意”、“不同意”、“不确定”、“同意”和“非常同意”,按照问题利弊分别表示1~5 个分值,最后计算学习者学习动机和学习态度分值。学习类型分别标记视觉型为“1”,听觉型为“2”,动觉型为“3”。对于学习者在线视频观看时长、PPT 观看时长、文本材料访问时长、浏览论坛时长、发帖以及回复帖次数、签到次数,则直接使用从日志中获取数据。对于学习者做笔记方式,在线平台中有笔记模块,使用笔记的学习者记为“1”,未使用的学习者记为“0”。对于学习者课后习题得分,取所有得分均值,并保留两位小数。
学习行为特征包括学习动机分值、学习态度分值、学习类型、视频观看时长、PPT 观看时长、文本材料访问时长、初始测试得分、课后习题得分、浏览论坛时长、发帖以及回复帖次数、做笔记方式、签到次数,由上述12 个特征构成输入因素集,以学习者最终测试成绩为参照变量。每个学习者学习行为数据作为一个样本,所有学习者学习行为数据就构成了一个样本集合。将12 个特征影响因素依次编号,分别是1学习动机分值、2学习态度分值、3学习类型、4 视频观看时长、5PPT 观看时长、6 文本材料访问时长、7初始测试得分、8做笔记、9课后习题得分、10 浏览论坛时长、11 发帖以及回复帖次数、12签到次数。
Lasso-Lars 算法将每个学习者数据作为一个记录,应用Lasso-Lars 算法,得到每一个因素所对应的回归系数组成回归系数变化走势图,并确定出不同的因素对学生学习成绩的影响大小,由此确定影响因素序列,如图2所示。
图2 学习行为特征分析
由图2 可以看出,学习者学习成绩影响因素强度排序依次是学习动机、课后习题得分、做笔记、初始测试得分、学习态度、浏览论坛时长、发帖及回复帖次数、学习类型、文本材料访问时长、PPT 观看时长、视频观看时长、签到次数。将者12 个特征按影响系数又可以分为4个层次。
第一个层次是学习者学习动机。好的学习动机可以使学习者获得更好的学习效率,提高学习动机应该充分了解并满足学习者学习需要,即满足学习者个性化发展要求。
第二个层次包括课后习题得分、做笔记和初始测试得分。课后习题的练习可以增强学习者对知识的理解与应用,学习者能够更好地掌握相关知识,因此这是学习路径推荐中必不可少的一环。做笔记代表学习者的一种优秀学习习惯,在线学习没有教师监督,做笔记就是学习者的一种良好的自我监督形式,将学习内容归纳整理后更容易被学习者掌握。初始测试成绩反映了学习者的初始能力水平,同等条件下,初始能力水平高的学习者会有更多的时间应用到知识较难的学习中,获得更好的学习成绩。
第三个层次包括学习态度、浏览论坛时长、发帖及回复帖次数。学习态度体现了学习者对自身的要求,能否为了实现目标在学习上付出更多的努力。浏览论坛时长以及发帖及回复帖次数,都是学习者在遇到问题时的一种求助方式,无论是哪一种方式,适合学习者的就是最好的。
第四个层次包括学习类型、文本材料访问时长、PPT 观看时长、视频观看时长、签到次数。学习类型、文本材料访问时长、PPT 观看时长以及视频观看时长都反映了学习者选择学习方式时的学习倾向,选择学习者更倾向的学习方式即可。签到次数是为了监控学习者是否每天按时登录系统学习,由于本次实验对象是成人学习者,自我控制能力较强,因此签到次数对学习成绩影响不大。
综上,向学习者推荐学习路径时,在获取最优学习者学习路径的前提下,应优先考虑习题模块、测试模块和学习工具模块,以此优化学习路径,使学习者获得更高的学习效率和学习成绩。
随着信息技术与教育的逐步融合,使学习平台的服务越来越趋向于精准化和个性化。本文以学习者在线学习行为分析为基础,充分考虑学习者的基本特征、心理特征和学习风格的差异性,利用K-means算法划分相似学习者,并在此基础上进行学习路径推荐,同时采用Lasso-Lars 算法对学习路径推荐进行优化处理,多方面实验分析,让学习路径的生成更加精准化和个性化,帮助学习者提高学习效率进而获得优秀的学习成绩。