关联规则挖掘在高校网络教学平台中的应用研究

2019-03-14 12:42叶根梅吴志霞
电脑知识与技术 2019年1期
关键词:关联规则网络教学

叶根梅 吴志霞

摘要:针对目前大多高校网络教学平台教学资源呈现单一、不能根据学习者的学习轨迹进行内容推荐的弊端,研究关联规则和Apriori算法,以及Apriori算法在网络教学平台中的应用。运用关联规则挖掘获取学习内容相关的页面集合,从而一定程度地优化网站结构,并对学习者进行个性化内容推荐服务,提高学习者的网络平台学习体验。

关键词:关联规则 Apriori 网络教学

中图分类号: TP434     文献标识码:A      文章编号:1009-3044(2019)01-0017-02

1 背景

随着互联网技术的发展,各大高校陆续构建自己的网络教学平台,以实现学习资源数字化、教学方式网络化、学习方式多元化的网络教学方式。但是,目前高校的网络教学平台普遍存在网络资源呈现单一化特征,网站不能根据学习者的学习行为提供个性化的内容推荐服务。因此,在教学平台中,加入基于关联规则的个性化内容推荐对提升学生的学习体验和效果很有意义。

2 关联规则挖掘

关联规则挖掘最早用来发现超市交易数据中商品之间的关联[1],近几年在网站和移动应用的个性化推荐系统中,如电子商务、新闻网站、社交等领域被广泛应用。通过关联规则挖掘可以发现事务之间的联系,提升信息筛选的效率,对于决策者和用户来说,具有现实的意义,因此,关联规则挖掘也作为数据挖掘一个重要的课题和方法被广泛研究和应用。

3 关联规则在高校网络教学平台中的应用

3.1 网络教学平台的关联规则挖掘功能模型

网络教学平台中要实现学习者因人而异、按需学习的内容自动推荐功能,运用关联规则,可建立如下功能模型,如图1所示。

参照《WEB挖掘技术在网络教学中的应用研究》和精品课程论文。

在该模型中,服务器端记录用户访问信息并存储用户日志数据,包括用户在教学平台中的访问内容和行为,如页面浏览内容和时间、访问路径、超链接的点击行为等。对这些数据进行收集、预处理和规范化,构成事务集,再运用关联规则挖掘技术,挖掘出有价值的网页集合,从而明确学习者的学习兴趣和需求,根据关联规则结果进行个性化内容推荐,方便学习者快速发现自己需要的学习内容[2]。

3.2 关联规则挖掘算法--Apriori算法

Apriori算法是关联规则最成熟的算法,因其数据要求低、推导相对简单,使其得到广泛应用。

设I={i1,i2,…,im},是m個不同的项目的集合, 长度为m的项集I称为m-项集,T={T1,T2,…Tn}是与任务相关的事务的集合,每个事务Ti都是项集I的一个子集。假定X,Y均为项集,均是T的非空子集,且X和Y的交集不为空,则表示X和Y是相关联的项集,项集X在某一事务中出现,会导致Y以某一概率也会出现[3]。将蕴含表达式X=>Y称作T中的关联规则。关联规则的强弱通过指标支持度和置信度来衡量。事务集T中项目集X出现的次数count(X)与事务集T中事务总数|T|的百分比,称作项目集X的支持度support(X),可通过以下计算公式获得:

support(X)=[count(X)|T|]*100%

相应地,关联规则X=>Y的支持度support(X=>Y)的计算公式如下:

support(X=>Y)=[count(X?Y)|T|]*100%

事务集T中X、Y同时出现的次数与事务集T中项目集X出现的次数的百分比,称作关联规则X=>Y的置信度confidence(X=>Y),可通过以下计算公式获得:

confidence(X=>Y)= [supportX?Y supportX]*100%

最小支持度minsup和最小置信度minconf是用户设定的衡量支持度和置信度的一个阈值,如果关联规则X=>Y的支持度support(X=>Y)和置信度confidence(X=>Y)大于等于用户定义的最小支持度minsup和最小置信度minconf,则称X=>Y为强关联规则。关联规则挖掘的目的就是找出强关联规则。同时,对于项目集X,如果support(X)>= minsup,则X为频繁项集。

3.3 运用Apriori算法挖掘关联规则

运用Apriori算法实施数据挖掘主要分为两步:

首先,找出事务数据库中所有大于等于指定的最小支持度的频繁项集,然后根据指定的最小置信度找出需要的关联规则。

针对高校网络教学课程,学生访问网站不同页面时,其访问信息都将在网页路径中体现出来。 如用户访问http://localhost:8080/course/s20.php,然后又访问http://localhost:8080/course/s23.php,并在这些页面及其子页面停留了一定的时间,表示用户学习了页面分别为s20.php和s23.php的两门课程及其对应的知识点资源。将用户在网站访问期间的页面路径暂存在用户会话文件中,当用户离开网站时,将该信息作为用户学习日志记录表中的一条记录保存起来。然后,对事务数据库进行预处理,运用Apriori算法挖掘学生学习网络课程的访问日志,找出学生频繁访问的知识点页面所在的网页路径,基于学生频繁访问的网页路径,找出频繁项集,进而进行个性化内容推荐[4]。

按照上述步骤,这里,抽取5个学生对网络教学平台课程访问信息,表1记录了其访问网站的网页路径。

假设最小支持度minsup为3,最小置信度minconf为70%。Fk表示频繁k-项集的集合,Ck表示产生FK项集的候选项集,算法的处理步骤如下:

对置信度进行计算:

confidence(s3=>s4)=4/5=80%

confidence(s3=>s5=4/5=80%

confidence(s4=>s5)=3/4=75%

由此可见,{s3 s4 s5}是学习者访问频率较高的一种网页组合,因此可以通过建立超链接的方式对这些页面进行关联,或者将该关联规则存储到关联规则表中,提供学习者的访问效率,实现网络教学平台的个性化推荐功能。

4 结束语

在高校网络教学平台中引入关联规则,优化网站课程结构,实现一定程度的教学内容的个性化推荐,提升学习者的学习体验,对高校网络教学平台的建设具有非常现实的意义。

参考文献:

[1] 王涛伟, 杨爱民. 加权关联规则研究及其在个性化推荐系统中的应用[J]. 郑州大学学报: 理学版, 2007(2): 65-69.

[2] 梁燕红. WEB挖掘技术在网络教学中的应用研究[J]. 信息技术与信息化, 2017(9): 128.

[3] 卢小华, 刘静. Apriori算法在网络教学平台自动推荐学习资源功能中的应用[J]. 现代工业经济和信息化,2016(15): 101-102.

[4] 于华. 网站结构优化方案的设计与实现[J]. 现代计算机, 2017(20): 82-84.

猜你喜欢
关联规则网络教学
利用网络教学多样性 开展有效教学