数据挖掘技术在远程教学系统中的应用*

2013-12-03 03:56曹良林
九江学院学报(自然科学版) 2013年4期
关键词:项集事务页面

宋 莉 曹良林

(九江学院信息技术与科技学院 江西九江 332005)

网络教学是伴随着计算机网络技术和多媒体技术的发展,产生的一种新兴的教学手段。它是一种不同空间模式下的教学行为,是指在教师和学习者、学习者和教育机构之间采用多种多媒体手段进行系统化教学和网络通信互动的教育形式。和传统的教育模式相比,远程教育的特征更为显著:在整个学习期间,师生可以在不同地域实施教学,学习者通过教育机构或组织提供的学习材料和支持服务两方面进行学习;教育机构或组织则可利用各种技术媒体联系师生并承载课程内容;提供双向通信交流。

1个性化导航在远程教学系统中的应用

个性化学习理论指出,学习过程既是学习者个性的展现过程,更是追求自我和满足自我的过程。在个性化学习中强调[1],学习过程应是针对学习者个人兴趣爱好和发展潜能而综合采取恰当的方法、内容、手段、进程、起点、评价方式等,让学生各方面获得充分自由发展空间的过程,从而达到因材施教的最终目的。因此,个性化的现代远程教育可以针对学习者的学习基础、兴趣、学习能力等差异,为每个学习者制定适合他们的教学内容、教学策略。个性化的现代远程教育能够为学习者提供多方面的个性化服务:可根据不同学习者的不同学习层次为其推荐难度适合的学习内容;也可根据学习者的测试成绩给出适合的学习建议,同时为学习者提供没有掌握好的知识点的相关学习资源作参考;施教者可以根据各学习者的个性、兴趣、学习行为及反馈,及时调整对应的教学策略,定制出合适的教学内容和活动等。因此,个性化网络教学平台为每个学习者提供了适合其学习的资源,并根据其学习行为自动地调整学习资源以迎合学习者的兴趣,使学习者感到其拥有整个教学系统的所有资源,充分发挥其学习潜能。

网络教学的特点是利用网络,可以进行在线视频教学、在线辅导、在线实验、在线测试,提供丰富的教学资源及相关材料的下载,同时为所有用户提供了交流互动的平台。Web数据挖掘指从Web文档和访问数据中寻找有用的规律知识。因此,将Web挖掘应用在网络教学中,可以从海量的Web访问数据日志中发现学习者的学习信息,根据学习者的访问规律调整对应的教学策略,即时为学习者制定个性化的学习内容;发现学习者的相关学习兴趣,并据此给学习者提供相关的学习内容和学习建议,根据在线测试成绩指出学习者所有知识点的掌握情况并给出学习建议,同时系统也将学习者相关信息反馈给施教者,使施教者能及时调整教学重点、教学内容和教学方法,以更适合学习者自身学习需求。数据挖掘的应用为现代远程教育系统的个性化、智能化提供了非常重要的技术手段[2,3]。

2个性化导航模型

个性化导航模型如图1所示,由2个基础数据库和3个模块构成。

图1 个性化导航模型示意图

2.1数据预处理模块

其主要功能是对用户的初始记录进行预处理,处理后的数据才可被用来数据挖掘研究。源数据通常呈半结构化或非结构化特征,不能被直接使用,必须经过数据的清洗、用户的识别、会话的识别、路径的修补、事务集的识别、路径的完善等步骤[4]。

2.2数据挖掘模块

其主要功能是对用户数据库进行挖掘研究。研究主要从两方面进行:一方面是对所有用户的访问记录进行挖掘研究,得到共同的学习模式;另一方面是对学习者测试结果进行挖掘研究,得到个性化模式。

2.3个性化推荐模块

其主要具备两个方面的功能:①根据用户基本信息记录数据库完成个性化定制;②是通过对用户数据库的知识挖掘,得到的模式应用在个性化推荐,从而自动为用户提供学习内容。

2.4用户特征数据库

其存储了用户基本信息,学习信息等。

2.5知识库

其储存了所有的教学资源,为个性化推荐模块准备了庞大而丰富的教学资源。

3个性化导航实现的关键技术

向学习者推荐学习页面,首先得了解其学习能力,为更好的实现个性化服务,应对学习者按照不同类别进行分类,主要是根据每次对学习者的测试情况分类。在进行数据挖掘研究的同时,也需要对所有的数据进行分类,使得推荐的学习内容与学习者相匹配,从而达到个性化教学的最佳效果。

用户使用远程教学系统进行学习的时候,他所访问的所有页面之间一定存在着某种关联,而这是由页面存储的知识点之间的逻辑关系决定的,如某用户在浏览某知识点时,该用户很可能需要访问该页面涉及到的其它知识点页面[5]。页面间的关联可以通过两方面来建立:一方面根据大多数用户的访问记录自动调整;另一方面根据施教者的教学经验和知识点间的联系事先制定[5]。

在用户访问关联规则中出现的“事务集”是指个性化教学系统中存储的知识点页面集合,而采用关联规则发现的频繁事务集是频繁被访问过的知识点页面集合,频繁访问事务集所形成的有序访问路径称之为频繁访问路径[5]。运用关联规则对这些事务集与频繁事务集进行挖掘,得到的模式能为用户推荐相对匹配的教学资源。

个性化推荐的过程就是将该用户会话片段与己产生的频繁事务集进行匹配的过程,该过程会产生满足一定支持度和置信度的关联规则,而所有这些关联规则的后所生成的页面集合就是推荐用户访问页面集合。

本文采用一种特殊的数据结构-频繁项集图,可存储相应的频繁项集。该图设计为有向图,分为k个层次,每个节点表示一个频繁项集,零层代表空集,即根节点;将频繁1项集存储第一层,频繁j项集组成第一层节点,依次类推。

Web访问事务子集如表1 ,事务编号用Tid代表,t. p分别代表该事务的具体内容。表1中的事务集可构造如下表2的频繁项集。

表1 Web访问事务子集

表2 频繁项集

表2中的频繁项集可构造频繁项集图,如图2所示。这种数据结构的优势在于算法在产生推荐页面的过程中产生部分关联规则,从而可提高推荐的效率。

图2 频繁项集图

在这里引用以往经典算法,一般而言,用户浏览个性化系统的操作可分为两种形式:一种是根据知识点自身之间的关联进行页面相链接;另一种是通过访问过的页面日志记录进行回退操作。本文将要对绝大多数用户第一种方式操作行为进行信息处理关联。从用户访问第一个知识点页面开始依次记录,直到用户进行访问以访问过的页面操作为止,所记录下来的有序页面集合称为最大向前路径。假设存在用户访问事务集合P={ P1, P2,…,Pn}。Y表示用户访问最大向前引用事务集合, D表示用户访问事务存储数据库[4]。

则用户访问最大向前引用事务算法如下所述:

输入:学生会话事务{P}

①初始化Yi ,令Y1= P1,则D1 = (P1 )。

②循环读入P,使序列Yi 增加,即D=(P1,P2, …,Pj-1) 。查看Yi∉, 若Yi Di,则继续执行本步骤。

③如果 Y j ∈ Ti,则已经找到最大路径,保存Di,将P后退一个,直到找到下一个前向路径

输出: 最大向前事务的数据库D

假设某用户的访问事务集合为{A,B ,C ,D ,C E,G ,H ,B ,W ,A ,0 ,U ,0 ,V }, 运用该算法将用户访问事务集合进行分割,可得到的最大向前事务集合为{ABCD, ABCEGH, ABW, AOU,AOV}[5]。

因每个用户的接受能力都不一样,学习效果也不一样,对数据来源应当进行分类,根据用户的在线学习时间和学习成绩进行分类,生成不同类别频繁模式。

学生频繁访问路径的模式发现可以分解为3个子问题:①根据用户学习效果和平均学习时间对数据源进行分类。②求出所有满足最小支持度的频繁路径。③找出满足最小置信度的频繁路径。

该算法核心就是第2个子问题,其基本思想是:分多个步骤和层次来处理事务集数据库。首先找出用户访问事务集合中满足最小支持度的页面项目集合,即最大项目集;接着循环处理直到再没有新的最大页面项目集生成,最后在第k次循环中,找出满足最小支持度的k维最大项目集[5]。求满足最小支持度的所有频繁路径的算法如下所示:

符号说明:

K-itemset:k维页面项目集

L[k ]:满足最小支持度的最大K-itemset,该集合中任一对象有两项属性(itemset和support)[5]

C[ k]:备选的K-itemset,该集合中任一对象有两项属性(itemset和support)

INPUT:用户访问事务集数据库D

OUTPUT:最大向前事务的数据库D

{输入数据库D

计算各页面的支持度,生成频繁1项集;

生成含k个页面的侯选页面集;

调用can_gen函数

统计c的支持度;

输出:长度为k的高频页面集L

}

算法描述如下:

①统计各页面的支持度,生成频繁1项集。

②生成含k个页面的侯选页面集,其中所有频繁项集必须满足最小支持度,不满足条件的将直接被过滤掉,不会对其进行多余的计算。达到提高运算效率目的。

算法说明:

can_gen函数中,最大项目集的子集一定为最大项目集,从而减少候选中子集的数目,提高运算效率,避免重复计算。

用改进的算法对用户访问事务集{A,B ,C ,D ,C E,G ,H ,B ,W ,A ,0 ,U ,0 ,V }进行运算,得到用户访问最大事务集合为{ABCD, ABCEGH, ABW, AOU,AOV}[5]。结果一致,但是需要计算的次数大大减少了。

4 结束语

本文针对现有远程教学系统存在的教学模式单一、个性化欠缺等问题,在系统中引入个性化导航。个性化导航主要通过数据预处理技术和数据挖掘技术的研究[5],实现智能化导航。本文引用了改进的关联规则算法,生成最大事务集,为其他用户推荐学习页面提供科学的依据。对学习者进行因材施教,为学习者提供个性化教学,推荐学习内容。

参考文献:

[1]李广,姜英杰.个性化学习的理论建构与特征分析[J].东北师大学报(哲学社会科学),2005,55(3):152.

[2]张震.基于Web的智能网络教学框架模型的设计与实现[J].现代教育技术, 2004, 14(3):64.

[3]何典,宋中山.基于Web 挖掘的个性化网络教育研究[J].计算机与现代化, 2005,21(5):100.

[4]苏林萍.基于数据挖掘技术的电子商务模式研究[D].北京:华北电力大学,2003.16.

[5]于倩.基于Web挖掘的个性化学习学院[D].北京:中国石油大学,2006.6.

猜你喜欢
项集事务页面
刷新生活的页面
答案
河湖事务
基于矩阵相乘的Apriori改进算法
不确定数据的约束频繁闭项集挖掘算法
基于优先级的多版本两阶段锁并发控制协议
Web安全问答(3)
移动实时环境下的数据一致性研究
常用关系数据库并发控制的比较研究
分布式数据库的精简频繁模式集及其挖掘算法*