面向微课移动学习的教学资源平台数据挖掘技术分析

2020-02-14 05:58陈雪梅杜棋东
计算机时代 2020年1期
关键词:移动学习数据挖掘微课

陈雪梅 杜棋东

摘  要: 为了解决目前学习平台中微课资源推送不精准、缺少学习路径优化推荐功能等问题,文章在分析微课与移动学习的内涵特征的基础上,重点对数据挖掘技术中的K-means聚类算法和Apriori算法进行分析,并通过数据挖掘技术实现了教学资源平台微课程资源的智能推送。

关键词: 微课; 移动学习; 教学资源平台; 数据挖掘; 智能推送

中图分类号:TP311.13          文献标识码:A     文章编号:1006-8228(2020)01-62-04

Abstract: In order to solve the problems existing in the current learning platform, including inaccurate pushing of micro course resources, lack of learning path optimization recommendation function, etc., this paper analyses the connotation and characteristics of micro course and mobile learning, and specially focuses on K-means algorithm and Apriori algorithm in data mining technology, and finally realizes the intelligent push of micro course resources in teaching resources platform by data mining technology.

Key words: micro course; mobile learning; teaching resource platform; data mining; intelligent push

0 引言

現在各种微课学习平台不断推出,但是微课存在诸多有待解决的问题,如资源推送不精准、缺少学习路径优化推荐功能等问题。如何通过平台从大量的资源数据和学习数据中挖掘相关联的信息,从而为学习者提供相应的推荐决策参考,以及提供更优质的服务,是实现当前移动学习教学资源平台建设的难点问题。

1 微课与移动学习的内涵与特征

1.1 微课

“微课”是一种基于信息技术的、以微视频为主(时长尚未有统一标准)的数字化教学资源,它展示了某个学科知识点,表达了一个精练简要的教学过程[1]。站在教师的角度,微课革新传统教学方法,突破传统教学中重复听课难、教学问题针对性弱、教学效率低的困境,使教师备课指向性强,教学效率性高,教学反思有据可依;站在学习者的角度,微课能够精准细化学科知识点,提供个性化学习条件,使学生课前预习、课中学习、课后复习更具主动性与实效性。

1.2 移动学习

移动学习是指计算机技术支持下在移动设备上进行学习的一种学习、探究方式[2]。移动设备作为其基础支持条件,一方面能够呈现学习资源,另一方面能够起到不同角色之间网络交流的纽带作用。移动学习创建了一个具有激励性、和谐性、营养性、可持续发展性的学习生态环境,对学习者自主学习起到很大的促进作用[3]。在移动终端,学习者可以查看学习情况、设置学习进度。基于数据挖掘技术的移动学习终端,学习者还可以获得个性化信息资源的智能推送和学习路径的优化建议,提高学习效果和效率。

2 数据挖掘技术分析

数据挖掘是大数据分析的关键技术,它能够根据指定的问题,利用一种或多种算法,分析不同的数据找到关联的规律,其中,聚类分析、决策树、神经网络、关联规则、回归等数据挖掘技术较为成熟[4]。针对面向微课移动学习的教学资源平台,文章阐述K-means算法和Apriori算法。

2.1 K-means聚类算法

聚类算法是指从样本数据中按照一定的方法或理论划分出不同的类别或者组合的分析方法。

K-Means算法是一种使用均值聚类数据点的聚类算法,其中,K代表类别数,Means代表均值。通过预设类别以及选择初始化的质心,然后将相似的数据点进行划分。K-Means算法的优势在于它的简单和快速,只需要计算点和群中心之间的距离。

假设某资源就是待聚类样本点,目标是需要将样本点聚类成3个类别。对于每个点,计算其距离所有中心点当中离自己最近的那个中心点,可以将这个点定义为其同一簇。经过一次迭代之后,重新计算每个簇类的中心点,然后为每个点重新找到最接近自身的中心点。就这样不断循环,直到前后两次迭代的簇类不再有变化。算法过程如图1所示。

算法的步骤

step1: 选定要聚类的类别数目k(如上例的k=3类),选择k个中心点。

step2: 寻找距离中心点最近的样本点并将其归类,距离同一个中心点最近的所有点表示一个类,这样就算完成一次聚类了。

step3: 判断聚类前后的样本点的类别情况是否相同,如果相同,则算法终止,否则进入step4。

step4: 针对每个类别中的样本点,计算这些样本点的中心点,当做该类的新的中心点,继续step2。

Step5: 直到聚类结果不在变化,得到K个聚类。

k-means算法数据之间距离越小,表示样本A跟B越相似,差异度越小;距离越大,样本A跟B越不相似,差异度越大。根据距离的长短进行聚类成指定的类别数K,为下一步智能推送奠定数据基础。常用的欧式距离公式为:

2.2 Apriori算法

关联分析是一种无监督学习算法,主要是从大量交易数据中查找隐藏的对象关联关系[5-6]。

Apriori算法是用于挖掘关联规则的频繁项集算法。频繁项集是指经常出现在一起的项的集合,关联规则表明这两个项之间可能存在密切关系[7]。假设有4门微课程:微课程0,微课程1,微课程2,微课程3。图4显示了课程之间所有可能的组合,最上面的集合表示不包含任何课程的空集(?),课程集合之间的连线表示可以组合两个或更多个集合以形成更大的集合。目标是找到经常在一起浏览的课程集合,这里使用集合的支持度来度量其出现的频率。

如果某个项集是频繁项集,那么它的所有子集也是频繁的。即假设{0,1}是频繁的,那么{0},{1}也一定是频繁的。如图2所示,图中给出了所有的可能项集,其中非频繁项集用黑色表示。黑色项集{2,3}属于非频繁的,那么项集{0,2,3}、{1,2,3}以及{0,1,2,3}也都是非频繁的。由此可见,如果计算出了{2,3}的支持度,得知它是非频繁项,就可不再需要计算其他非频繁项的支持度。

支持度(Support)可理解为支持的程度[8],假设某平台一共有100000个ID用户,其中30000个用户浏览了对象A,那么对象A的支持度为P(A)=30%(30000/100000)。在所有项集中同时出现A跟B的概率,即P(AB)。假设A跟B一起出现的概率非常大,那么就说明A跟B是相关联的。设A的访问次数是X,B的访问次数是Y,支持度的公式可表示为:

置信度(Confidence)表明了当A出现时,B是否一定会出现,如果出现则其概率为多少,即P(A|B)。假设置信度为100%,则说明A出现时B一定会出现。

3 数据挖掘技术在微课教学资源平台的应用

3.1 平台总体架构设计

在平台总体架构中,教师通过访问用户界面来上传和管理微课资源,教师也还可访问移动终端来获取学生的反馈结果和管理测试等。而学生则通过移动终端观看微课资源,同时,平台利用聚类分析和关联分析中技术,结合XMPP传输协议智能地将类似的微课程资源推送到学习者界面,帮助学习者有效地发现有价值的微课程视频。如果在学习过程中遇到问题,可以在平台中对微课资源进行提问和评价等。教师收到学生提问后,在系统互动平台进行分析解答。这时基础数据库会将微课资源的访问量和评价情况进行分析统计并将结果展示于学习者界面,如图3所示。

3.2 数据挖掘算法在平台中的实现

以某学校现有的微课平台浏览记录为例,用K-means算法进行课程聚类,最后用Python3代码来实现,发现浏览微课最多的人群均集中在年纪为大二的学生。对计算机技术感兴趣的同学一般会对传媒也有兴趣。专业是计算机应用、机械制造、道路桥梁等的浏览者人群大多数为男生。机械制造、道路桥梁、车载危机检修与故障诊断三类微课联系比较密切,原因是该校是一所以轨道交通类为背景的学校,所以学生大多会同时浏览这几类微课。

Apriori算法中的频繁项集是指那些经常出现在一起的课程,同样以某学校现有的微课平台ID用户浏览记录为例,如表1所示。表中的数据显示经常被浏览的课程是{“计算机基础”,“VIS视觉设计”,“office案例应用”},从数据集中也可以找到“计算机基础”->“VIS视觉设计”的关联规则,这意味着有人看了“计算机基础”的课程,那很有可能他也会看“VIS视觉设计”课程。关联规则由支持度和置信度来定义。

支持度:表1中数据集总数为5,“office案例应用”这门课程被浏览的次数为4,因此算出“office案例应用”这门课程的支持度为4/5,同样,{“office案例应用”,“计算机基础”}两门课程同时出现的数据集为3,代入支持度的公式⑵算出{“office案例应用”,“计算机基础”}的支持度为3/5。

可信度(置信度):由支持度的计算公式⑵算出{“计算机基础”,“VIS视觉设计”}的支持度为3/5,“计算机基础”的支持度为4/5,这时代入可信度的公式⑶算出{“计算机基础”->“VIS视觉设计与制作”}的可信度为3/4=0.75,这意味着“计算机基础”的浏览记录中,找出了75%浏览者都适用的规则。

通过Apriori算法进行关联性分析发现,75.2%的学生浏览了“计算机基础”之后,还浏览了“网络工程技术”“网络安全”这两门微课;有62.3%的学生浏览了“Photoshop视频教程”后,还浏览了“CorelDRAW视频教程”;有80.5%的同学在浏览了“列车日常事务办理”后,还浏览了“运输阻碍与事故处理”这门微课。

根据学习者学习记录,通过K-means算法和Apriori算法智能判断学习者学习行为,并将相关的微课程资源推送到学习者界面,达到精准服务学习者的目的。

4 结束语

本文阐述了K-means算法和Apriori算法在微课教学资源平台的应用,解决了教学资源平台微课資源推送不精准的问题,不仅给学习者创造了积极主动学习的氛围,而且使获取信息资源的途径有一定的智能性,对设计与开发面向微课移动学习的教学资源平台有一定的参考价值。下一步将研究相关算法,实现学习者个性化微课资源学习路径的优化推荐。

参考文献(References):

[1] 胡铁生."微课":区域教育信息资源发展的新趋势[J].电化教育研究,2011.10:61-65

[2] 温川雪,周洪建.面向智能手机与Web平台的微课移动教学系统的设计[J].中国远程教育,2014.12:60-66

[3] 杜棋东.职业教育微视频课程知识元的深度聚合与实践应用[J].中国教育信息化,2018.4:32-35

[4] 马如义.Apriori算法在词性标注规则获取中的应用[J].计算机时代,2016.10:32-35

[5] 刘迎春,朱旭,谢年春,李佳.基于数据挖掘的专业可信回答者个性化推荐——以Stack Overflow问答社区为例[J].现代教育技术,2019.29(5):78-84

[6] 李澎林,郏莉,李伟.一种基于数据挖掘的图书荐购模型研究[J].浙江工业大学学报,2019.47(1):80-85

[7] 薄洪光,李焕之,张慧琳.面向智能制造应用型人才培养的生产管理实践教学微课平台模式构建[J].实验室研究与探索, 2018.37(8):191-196

[8] 张波,李舸.基于改进聚类算法的Web异常数据挖掘软件设计[J].现代电子技术,2019.42(8):73-76,81

猜你喜欢
移动学习数据挖掘微课
探讨人工智能与数据挖掘发展趋势
微课在幼儿教育中的应用
微课在高中生物教学中的应用
微课在初中历史教学中的应用
基于并行计算的大数据挖掘在电网中的应用
智能手机在大学生移动学习中的应用研究
基于云计算的移动学习平台的设计
基于移动学习的自动问答系统设计
移动学习方式下实验教学资源建设的研究
一种基于Hadoop的大数据挖掘云服务及应用