基于用户学习路径分析的教育资源个性化推荐研究

2019-10-08 03:15赵学孔龙世荣
大学教育 2019年10期
关键词:个性化推荐关联规则个性化学习

赵学孔 龙世荣

[摘 要]针对学习者用户差异性需求推荐个性化教育资源是智能学习领域研究的难点,也是构建E-learning个性化学习支持服务的关键。学习者在网络学习过程中,其时序化的学习行为日志蕴含了各种学习路径信息。通过对目标用户学习路径分析可挖掘其所潜在的认知风格、学习偏好、认知水平等各种隐性特征信息,为E-learning教育资源个性化推荐提供重要依据。基于关联规则挖掘对用户行为日志分析,从系统架构、模型构建、路径匹配以及推荐算法四个维度切入,提出了E-learning环境下基于用户学习路径分析的教育资源个性化推荐解决方案。

[关键词]E-learning;个性化学习;学习路径;关联规则;个性化推荐

[中图分类号] G64 [文献标识码] A [文章编号] 2095-3437(2019)10-0107-04

当前,数字化学习(E-learning)因其便捷性、时效性、共享性等诸多优势成为网络信息时代新兴的一种重要学习方式。E-learning环境中丰富多样化的教育资源是学习者获取知识的主要来源,但同时也是学习者学习过程中产生认知负荷或学习迷途的主要诱因。因此,当学习者在E-learning环境下学习时如何针对其差异性学习需求推荐个性化教育资源并以此提高学习者学习效率和質量是当前国内外众多研究者重点关注的主题,对其研究意义深远。

一、领域相关研究进展

以学习者用户差异性学习需求为导向向目标用户推荐个性化教育资源,其实质体现了个性化学习思想,这也是当前在E-learning大众式泛化学习情况下专业学习领域精细化以及用户认知思维结构差异性对未来网络教育的必然诉求。为了使传统E-learning系统支持个性化学习服务,计算机科学、教育技术、人工智能等众多学科领域研究者进行了大量理论与实践探索。国外Brusilovsky等人从课程序列化和适应性导航维度切入提出了智能个性化学习系统实现的技术路线[1];Weber G等人通过个性化导航策略实现了E-learning适应机制,并开发了ELM-ART、Knowledge Sea系统原型[2];DeBra教授基于学习者认知水平层面构建用户模型,开发了AHA开源系统[3];Markellou等人采用语义框架技术分析学习者当前的个性化需求,并利用关联规则挖掘提供学习者适当的资料[4];Wang等人提出E-learning环境下一种利用内容过滤和协同过滤技术获取用户浏览Web行为的方法[5]。国内余胜泉教授等人通过系统建模与推荐算法构建了具有一定智能性的学习元平台[6];陈品德教授从内容呈现和导航支持考虑适应性设计了A-Tutor原型系统[7];中国台湾淡江大学利用Agent技术研发了分布式智能学习系统MMU[8]。

纵观上述成果分析,研究者从不同视角切入提出了E-learning个性化、适应性、智能性的策略方案。其中,个性化导航、用户认知建模、语义框架分析、推荐算法以及智能代理等都是成果中较典型代表,这为今后本领域的研究提供了宝贵参考价值。当然,当前对于智能化E-learning系统的研究仍处于“百家争鸣”探索阶段,仍有较多领域值得更深入探索实践。为此,本研究在借鉴上述研究成果基础上,尝试从用户学习路径角度切入,利用关联规则挖掘对用户行为日志分析以此探索E-learning环境下教育资源个性化推荐解决方案,以期为本领域研究者提供参考借鉴。

二、基于学习路径分析的教育资源个性化推荐

学习者在网络学习过程中,其不同时间节点的学习行为日志蕴含了各种学习路径信息,而通过对这些学习路径遴选、归并等分析处理过程可挖掘其所潜在的学习者认知风格、学习偏好、认知水平等各种隐性特征信息,为E-learning教育资源个性化推荐提供重要依据。在此,本文将尝试从系统架构、模型构建、路径匹配以及推荐算法四个维度切入,探索E-learning环境下基于学习者用户学习路径分析的教育资源个性化推荐解决方案。

(一)系统架构设计

E-learning个性化学习中,对学习者学习路径分析的实质是对其时序化学习行为日志的规则匹配,而其前提是通过监控器对学习者的各种学习行为日志的实时采集。学习资源库是E-learning个性化推荐的数据源,通过与学习者学习路径中所潜在的认知风格、学习偏好、认知水平等各种隐性特征信息匹配,在关联规则AprioriAll算法基础上形成推荐资源集。学习支持工具(如笔记本、交流工具、单元测试等)为个性化学习提供辅助,其单元测试成绩可作为学习者认知水平参考依据。基于此,本文构建的个性化E-learning系统推荐框架如下图1所示。该框架主要由监控器、学习行为和学习资源数据库、个性化推荐引擎以及学习支持工具等部件构成。其中,个性化推荐引擎是系统的核心,其可从大量学习行为日志数据集合中挖掘符合匹配规则的信息,并由此产生符合当前学习者的个性化学习路径,进而推荐相关学习资源,实现个性化学习支持服务。

E-learning系统个性化推荐过程大致分五个步骤,其描述如下。

第一步,用户(学习者)注册登录E-learning系统。系统需要实时判定用户当前的登录状态,其只为注册并登录的用户提供个性化学习支持服务,因此学习者只有注册登录系统后才能浏览系统推荐的个性化资源。

第二步,实时记录更新学习行为日志事务。在学习过程中,监控器会实时获取和分析当前用户的学习行为日志信息,并将其结果转换成序列模式存储在日志事务数据库中,为后续关联规则挖掘提供基础数据。

第三步,生成个性化学习路径。个性化推荐引擎从日志事务数据库获取数据,并从认知风格、认知水平等多个维度利用关联规则挖掘技术以及AprioriAll算法进行规制匹配,最终生成个性化学习路径。

第四步,学习路径预处理。个性化推荐引擎推荐的个性化学习路径需要经过数据预处理才能供用户浏览使用。数据预处理程序负责将个性化学习路径与学习资源数据库进行关联映射,然后将转换生成的推荐资源集按照用户的学习进度逐步呈现。

第五步,用户浏览个性化学习资源。E-learning环境下,用户在相关学习支持工具的辅助下通过终端浏览器浏览推荐的资源。在此过程中,系统又会进入以上第二步环节,通过监控器实时采集当前用户学习行为日志,为后续进一步更精确推荐个性化学习资源提供决策依据。

(二)特征模型构建

个性化学习理论强调学习过程中学习者的主体能动性,学习的本质是具有不同个体特征的学习者认知思维进行意义建构的过程。而在E-learning环境下,学习者个体认知思维的变化则很大程度上体现于认知风格、学习偏好以及认知水平维度,可通过对其学习行为日志挖掘获取其个性化特征信息,然后与资源对象特征模型匹配以此获取推荐资源序列。

1.资源对象模型

资源对象是E-learning个性化推荐的数据基础,同时也是学习者获取知识内容的主要来源,其可以是文本、图片、音频、视频等各种媒体格式。根据教学目标与计划,学习资源之间应存在一种隐性的关系结构,这种关系结构能充分应用于学习策略或学习方式的匹配过程中。因此,学习资源建模时需要考虑结构化、粒度化等标准范式,通过多维的属性描述建立资源对象模型,以提高系统个性化推荐的精准度。为了更加精细准确地表征资源对象结构化特征,E-learning中的资源类型尽可能以微型化方式来存储。在参考当前国际数字化教育资源IMS建模标准的基础上,本研究中资源对象的表征方法如下。

ResourceModel=(Rid,Rname,Rcontent,Rstyle,Rlevel,ROR)

其中,Rid表示资源对象的唯一标识,Rname表示资源对象的名称,Rcontent表示资源对象内容信息,Rstyle表示资源对象的风格类型(Rstyle∈{“文本型”,“图片型”,“动画型”,“音频型”,“视频型”}),Rlevel表示资源对象的难度系数(Rlevel∈[0,1],该值越大意味资源对象难度程度越高),ROR表示资源对象所属的关系集类型。通常情况下,资源对象间的关系主要包含前驱关系、后继关系、并列关系以及相关关系四种类型。基于此,资源对象模型中的ROR可进一步表征为:ROR(a,b)={,Rtype,Rweight}。ROR关系模型中,Raid表示资源对象a的标识,Rtype表示资源对象间的关系类型(Rtype∈{“前驱关系”,“后继关系”,“并列关系”,“相关关系”}),Rweight表示资源对象间关系的权重值(Rweight∈[0,1],该值越大意味资源对象间关系程度越高)。

2.行为日志事物模型

行为日志事务是学习者在学习过程中执行某种操作行为的数据记录,其包含了学习者访问页面的详细信息。在E-learning系统中,行为日志事务是个性化推荐引擎进行关联规则挖掘的数据来源,通过数据间的相关性可获取学习者学习路径信息。为了向用户推荐精准的个性化学习路径,日志事务模型应尽可能包含用户全面的访问信息。本研究中,我们尝试构建的用户学习行为日志事务模型包含访问者、访问时间、访问地址以及访问内容描述等基本信息,其具体表示方法如下图2所示。

以上行为日志事物模型可采用如下元组表达式:

LogTransaction(Ui)={AccessUser,AccessTime,AccessUrl,AccessDetail}

其中,AccessUser表示行为日志事务的访问用户,可用UserId用户编号唯一标识;AccessTime表示访问时间,可通过开始时间(BeginTime)和结束时间(EndTime)之差表征访问时长;AccessUrl表示访问资源的地址;AccessDetail表示访问资源对象的描述信息。由于每个用户在学习过程中往往会访问很多资源内容,导致系统生成多项日志事务记录,为了提高E-learning系统对数据的检索与挖掘效率,我们利用监控器将获取的用户初始化日志信息进行预处理转化为简单的序列模式,然后存储于日志事务数据库中。行为日志信息的序列模式处理方法为:利用AccessTime获取用户访问资源的先后顺序,利用AccessUrl与AccessDetail映射用户访问的资源对象标识。例如,若用户Ui在学习过程中依次访问的资源对象向量序列为(其中,Ri表示用户访问的资源对象唯一标识),那么该用户的行为日志事务模型可表示为LogTransaction(Ui)={Ui, }。

(三)路径匹配规则

E-learning环境中,学习者的学习行为日志往往蕴含了其学习过程的时序性与关联性,主要体现在不同时间节点学习相同的主题内容,或同一时间段内学习不同的主题内容。显然,通过对学习者学习行为及学习主题的内在关联性分析一定程度上也能刻画出学习者当前的认知需求状态。为了从当前学习者的学习行为日志判定其学习内在需求并进一步推导出最优学习路径,本研究主要采用关联规则挖掘技术对用户行为日志分析。关联规则挖掘最早由Agrawal等人提出,其实现机理主要是以递归扫描方式从日志数据集合中发现频繁序列项集,然后通过对遴选的满足条件(最小支持度)的高频序列项间强关联关系分析进一步预判行为路径[9]。下文将结合具体案例对E-learning环境中个性化学习路径匹配方法进行描述。在此,设定某学习者学习行为日志事务集T包含4个事务,每个项集反映了学习者访问资源对象的序列,其具体结构如下表1所示。

根據关联规则挖掘原理,E-learning环境下学习者个性化学习最优路径的产生大致需要经过产生高频访问路径项集、产生访问路径关联规则、个性化学习路径预处理三个阶段,具体如下。

1.产生高频访问路径项集。将学习行为日志事务库T中(表1)的用户访问频繁项集找出,该阶段需要使用AprioriAll 算法计算表1中知识项集的支持度,算法具体内容我们将在本文后面的内容中阐述。本例中,设定最小事务支持度为0.5,则最小事务支持计数为MinSup=0.5*4=2,经过第一轮扫描事务库T得到候选集C1={},将C1中非频繁项(即小于最小支持度计数2的项)删除,得到频繁项集L1={};同理,经过第二轮扫描事务库T后删除C2中非频繁项{}得到候选集L2={};经过第三轮扫描事务库T后删除C3中非频繁项{}得到候选集L3={},即高频访问路径项集为L={}。

2.产生访问路径关联规则。高频项集的推理为数据项关联规则的产生提供了基础。在产生关联规则时需要以最小置信度(MinConf)作为参考,其推理范式为:设存在频繁项集Y,X为Y的任一个非空子集,Z为X的子集,若有规则Y-X=>X为关联规则,那么也为Y-Z=>Z关联规则,记为{,Z}。根据上文中高频访问路径项集L={}可获得6个候选关联规则,分别为{{,R5},{,R4},{,R1},{R1,},{R4,},{R5,}},其对应的候选关联规则置信度为{1,1,2/3,2/3,2/3,2/3}。设置最小置信度阀值为0.8,那么得到两条强关联规则{{,R5},{,R4}},即学习者学习资源内容R1和R4后也需要学习R5,学习R1和R5后也需要学习R4。由此得到學习路径RPa={R1,R4,R5}或RPb={R1,R5,R4}。

3.个性化学习路径预处理。该阶段一方面需要从上一环节产生的学习路径RPa和RPb中寻找最优路径,另一方面需要根据最优路径及学习者学习进度依次推荐匹配的资源集。在分析判定最优路径时,需要与资源对象关系模型ROR匹配。假设本例中R1、R4和R5之间存在关系ROR(R1,R4)={,前驱,0.8}、ROR(R1,R5)={,前驱,0.6}和ROR(R4,R5)={,前驱,0.5},那么根据ROR权重参数值及关系类型可推导出RPa为当前最优学习路径。接下来,需要根据资源对象模型依次分析最优学习路径节点中的资源风格、难度系数等参数,然后将匹配最优路径的同一风格类型、同一难度系数的资源对象集按学习者学习进度依次隐射推荐,而学习者即可在相关学习支持工具的辅助下通过终端浏览器进行个性化学习。

(四)推荐算法

E-learning系统产生个性化学习路径主要基于关联规则的生成原理,其采用了AprioriAll算法。AprioriAll算法是由Agrawal等人提出的,该算法的基本思想是在每一轮扫描数据库时,利用上一轮扫描时产生的大序列生成候选序列,并在扫描同时计算它们的支持度(support),满足支持度的候选序列作为下次扫描的大序列。本文对AprioriAll算法进行了优化处理,其描述如下。

输入:事务库T中的所有知识项集

输出:高频访问的最长资源项序列

1)L1={frequent resource-items sequence};  //大项集阶段得到的序列结果

2)for(r=2; Lr-1≠0; r++)do

3)Ur=Get_Access(Lr-1);     //利用函数Get_ Access构造用户访问候选资源项集

4)for each resource-item sequence R∈Ur do  //对Ur中的每一个资源项序列R

5)Rt=subset(Ur,R);        //计算资源项集所包含的资源项

6)for all s∈Rt do s.sup=s.sup+1; end for   //累计资源项支持数

7)end for

8)Lr={s∈Ur | s.sup>=minsup};   //计算K阶大序列

9)end for

10)L=UrLr;

三、结语

个性化学习理论强调学习过程中学习者的主体能动性,学习的本质是具有不同个体特征的学习者认知思维进行意义建构的过程。而在E-learning环境下,学习者个体认知思维的变化则很大程度上体现于其学习行为日志中。通过对学习者时序化学习行为日志分析可挖掘其最优学习路径,进一步获知学习者认知风格、学习偏好、认知水平等各种隐性特征信息,为E-learning教育资源个性化推荐提供重要依据。本文基于关联规则挖掘对学习者行为日志分析,尝试从学习者学习路径角度切入,从系统架构、模型构建、路径匹配以及推荐算法四个维度分析论述了E-learning环境下基于用户学习路径分析的教育资源个性化推荐解决方案,以期为本领域研究者提供参考借鉴。

当然,目前我们的研究仍处于探索阶段,尚有不足之处。下一步,将通过理论与实践研究进一步探索E-learning个性化推荐方案。

[ 参 考 文 献 ]

[1] Brusilovsky P. User Models for Adaptive Hypermedia and Adaptive Educational Systems[M].The adaptive web, 2007:87-110.

[2] Weber G. Adaptive Learning Systems[M]. Springer US, 2012:351-384.

[3] DeBra. AHA![EB/OL].http://aha.win.tue.nl/,2007.

[4] Multimedia P. E-Learning and Semantic Technologies[J]. Encyclopedia of Distance Learning Second Edition, 2009:461-826.

[5] Wang P., Wolfram D. Mining web search behaviors: Strategies and techniques for data modeling and analysis[J]. Proceedings of the American Society for Information Science & Technology, 2008(1):1-8.

[6] 余胜泉,陈敏.泛在学习资源建设的特征与趋势——以学习元资源模型为例[J].现代远程教育研究,2011(6):14-22.

[责任编辑:黄紧德]

猜你喜欢
个性化推荐关联规则个性化学习
基于链式存储结构的协同过滤推荐算法设计与实现
教学资源支持下的Sakai个性化学习研究
个性化推荐系统关键算法探讨
基于协同过滤算法的个性化图书推荐系统研究
微视频在初中英语听力教学中的应用探索
基于SOA的在线学习资源集成模式的研究
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法