马璐钰
摘要:针对传统网络学习系统存在的不足,该文基于个性化推荐技术和Web日志挖掘技术,提出了一种新的个性化学习资源推荐模型。该模型通过分析和研究网络学习行为的特点,挖掘并分析出不同学习者的学习特征,实现了在线学习的个性化推荐,有效地提高了学习质量和学习效果。
关键词:Web日志挖掘;个性化推荐;网络学习模型
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)23-0023-02
Abstract: Focused on the shortcomings of the traditional network learning system, this paper proposes a personalized learning resources recommended model. Based on the personalized recommendation technology and Web log mining technology , the model searches the different learning characteristics of the users through analyzing their learning behaviors in the network, and then generates the personalized recommendation for the online learning, This recommendation model can effectively improve the quality and effect of learning .
Key words: Web log mining; personalized recommendation; network learning model
1 引言
当前,随着网络技術和信息技术的飞速发展,社会各领域与互联网的联系越来越紧密,不断地影响和改变着人们的生活方式和学习方式。网络在线学习作为一种全新的知识传递模式和学习方式,从早期的网络学习平台,到如今风靡全球的 MOOC网站的兴起——国外的Coursera、Udacity、edX等在线课程提供商,国内清华大学的学堂在线和网易的中国大学MOOC等,都让学习者能够不受时空限制、随时随地系统深入地学习,越来越受到人们的欢迎。
网络学习的快速发展也使得一些问题逐渐浮现,传统网络教学平台没有考虑学习者学习需求、学习风格等个体差异,提供给学习者的学习资源千篇一律,本文利用Web日志挖掘技术,根据学习者访问网络学习平台保留的日志记录,挖掘并分析出不同学习者的初始能力、学习兴趣、学习风格、学习路径等特征,设计出个性化的学习资源推荐模型,为学习者提供更符合学习需求的资源,将提升其学习效率和学习效果,尽可能做到因材施教。
2 Web日志挖掘
在信息时代,数据就是财富。因特网中的数据更是呈指数级暴增,怎样在这样庞大的数据集合里挖掘出有价值的信息已经成为数据挖掘的研究热点。但是Web站点中的数据具有数据量庞大,信息源动态强,数据异构或半结构化等特点,传统的数据挖掘很难应对。Web挖掘是数据挖掘技术的应用与延伸,是利用数据挖掘、文本挖掘、机器学习等技术从Web页面数据、日志数据、超链接关系中发现感兴趣的、潜在的、有用的规则、模式、领域知识等[1]。根据挖掘中使用的数据类型,Web挖掘一般可分为三类:内容挖掘(Web Content Mining)、结构挖掘(Web Structure Mining)和使用挖掘(Web Usage Mining) [2]。
Web日志挖掘属于Web使用挖掘的一种,主要根据用户在访问系统留下的日志文件,提取Web日志中的有效信息,结合用户的背景、兴趣等,为用户提供个性化的推荐服务,帮助优化改善站点结构,使得系统效率得以大幅改善。在网络教育中,通过对学习者访问Web站点的信息进行挖掘,可以实现按知识点对网络课程内容进行分类,还可以获取学习者的访问方式、访问行为和访问序列等有关信息,挖掘并分析出学习者的个性特征,既满足了学习者对知识的需求,又可以向教师或网络课程制作者提供网络课程的改进意见[3]。
雁过留声,学习者在访问Web站点时,会留下很多宝贵的数据信息。这些信息主要包括了学习者的IP地址、访问时间、用户名、访问出错信息等。这些数据信息大都包含在Web服务器的各种日志文件中[4]。收集到的日志文件有相当比例的是无用的或者不正确的数据,需要进行数据清洗转换、用户识别、用户会话识别、访问路径补全等数据预处理操作,得到适合挖掘的结构化会话数据。然后利用统计分析、关联规则、序列模式、聚类与分类等挖掘技术得到数据背后隐藏的有用模式集合。最后一步是模式分析,根据数据预处理和模式识别的结果,对数据做进一步的分析,提取有价值的规则集合,即用户的个性特征,并将其可视化。具体流程如图1所示。
3 个性化学习资源推荐模型设计
基于Web日志挖掘的个性化学习资源推荐系统,利用Web日志挖掘技术和个性化推荐技术,在传统网络在线学习系统的基础上设计了相应模块,使得该学习系统能够对Web服务器上学习者的访问日志进行Web访问信息挖掘,挖掘并分析出学习者的访问序列,从而根据学习者的学习特征、学习行为和学习轨迹等分析和考虑学习者的学习风格、学习习惯和学习兴趣等,而不是仅仅考虑认知水平和学习进度,对学习者的后续学习行为及目标知识进行合理预测和个性化推荐,更好地提供个性化学习服务,发挥系统的社会价值,有利于形成终身学习的学习型社会。
本系统主要由六个模块组成:登录模块、Web日志挖掘处理模块、知识库、个性化推荐模块、常规功能模块和学习资源库,如图2所示。用户登录时必须首先注册,并认真填写系统管理员设计的调查问卷,生成用户个性化信息资料,建立初始用户对资源的兴趣矩阵,避免出现系统冷启动问题。该系统中有传统在线学习系统具有的功能,如用户管理、学习资源管理、在线测试、网上答疑和教学评价等,同时该系统中也包含了一个核心的个性化的智能模块——Web日志挖掘处理模块,以实现对学习者和页面的聚类及学习者学习规律、学习风格的分析。当用户访问系统时,该模块主要完成以下两方面操作:第一,利用K-Means聚类算法进行分析,根据学习者和页面两种对象根据它们之间的相似度分为若干小组,相似对象构成一组。如发现某些页面属于同一小组,可在学习者访问其中页面时将本组其他页面推荐给学习者。同时,同一组学习者一般具有相似的学习特征,可对同组学习者提供相同的个性化推荐服务。第二,利用Apriori算法进行关联规则发现。在数据预处理模块中,提取了学习者访问的页面路径序列,利用关联规则挖掘,可以得到学习者访问请求的关联规则,发掘学习者具有潜在兴趣的知识点之间的关联,并实时地推送给学生。例如,学生访问了页面A后,又访问页面B,如果完成此类操作的学生数量超过预设的值时,系统即认为页面A与页面B之间存在关联。以后学生在访问页面A时,系统就会自动地提供指向页面B的链接[5]。经过这两步的操作,不仅可以达到为学习者推荐符合其学习特征的个性化学习资源目的,还可以动态监测学习者学习兴趣和记录学习轨迹,以便及时采取合理的推荐策略,调整推荐学习内容,更好地突出学习者的主体地位,为学习者提供个性化特征服务。
4 结语
本文在传统网络在线学习系统基础上,利用Web日志挖掘技术,构建了个性化学习资源推荐模型。本系统改变了传统的教学模式和教学方法,使得学生会根据自己的学习兴趣选择学习内容自行在线学习,在一定程度上达到了因材施教,按需学习的效果,同时也有利于改善在线学习系统的设计以及建立个性化的学习站点,有效提高了学习质量和学习效果,帮助学生更好地学习,有利于形成终身学习的学习型社会。
参考文献:
[1] 张琰,王强,安萍.基于Web文本挖掘相关技术的研究[J]. 科协论坛, 2012(9):83-84.
[2] Yoon Ho Cho,Jae Kyeong Kim. Application of Web usage mining and product taxonomy to collaborative recommendations in e-commerce[J]. Expert Systems With Applications,2004,26(2).
[3] 赵德伟,高江锦,徐正巧. 基于K-means算法的Web日志挖掘在移动学习中的实现[J].电脑编程技巧与维护, 2012(16):92-94.
[4] 肖建琼.WEB日志挖掘在个性化网络课程设计中的应用[J].福建电脑, 2007(1):148-149.
[5] 徐怡,徐汀荣.基于Web日志挖掘的个性化教育系统的研究与实现[J].福建电脑,2009, 25(6):90-90.
【通联编辑:代影】