基于大数据技术在线学习过程行为分析框架设计

2017-11-17 13:10赵睿王庆岭
电脑知识与技术 2017年30期
关键词:数据模型聚类分析大数据

赵睿++王庆岭

摘要:针对国内外中等规模以上在线学习平台课程完成率低、用户流失严重的现象,分析了在线学习过程行为影响学习效果提升的关联因素。基于大数据技术,构建了在线学习过程行为分析模型总体框架和数据模型,依据行为科学和人工智能理论,完成了对在线学习行为的聚类分析和关联分析,最终,给出了个性化学习资源和教学策略的推荐,有效提高了在線课程资源的利用率和学习效果。

关键词:大数据;在线学习过程;数据模型;聚类分析;课程推荐

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)30-0001-03

Design of Online Learning Process Behavior Analysis Frame Based on Big Data Technology

ZHAO Rui, WANG Qing-ling

(Department of Information Processing and Control Engineering, Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China)

Abstract:In view of the low completion rate and the serious loss of users in the online learning platform at home and abroad,analyzed the related factors that influence the learning effectiveness of online learning process behavior.Based on the big data technology, constructed the overall framework of online learning process behavior analysis model and the data model, on the basis of behavioral science and artificial intelligence theory, completed Cluster analysis and association analysis of online learning behaviors ,finally, recommended personalized learning resources and teaching strategies ,Effectively improved the utilization of online curriculum resources and learning results.

Key words:Big data; Online learning process; Data model;Cluster analysis;Course recommendation

随着互联网技术及教育信息化的快速发展,在线学习模式得到了学校、教师和学生的广泛认可,在线学习系统已成为教学单位的主要辅助教学平台和职业素质提升阵地,其注册的学生人数和建设的课程资源出现了爆发式增长,在线学习平台的应用扩展了教学手段、突破了教学活动的时间和空间限制[1]。国内外大多数在线学习平台在应用规模的增长过程中,普遍出现了课程完成率低和用户流失严重的现象 [2,3]。由于中等规模以上的在线学习平台拥有较大的学生群和形式多样的课程资源,本文依据大数据技术,结合平台数据库,采集Web服务器和客户端形成的学习行为数据,构建在线学习行为数据分析模型,完成对在线学习行为的聚类分析和关联分析,给出个性化学习资源和教学策略的推荐。

1 构建基于大数据技术的学习过程行为分析模型总体框架

1.1 在线学习过程

学习过程是在学习动机指引下进行的一系列学习活动,以满足学生需要并获取学习成果的过程[4]。在线学习过程是指学生在基于网络环境开发的集教、学活动和课程资源为一体的平台中,进行自主学习和交互活动的总称。学生根据自我动机和学习需求,选择在线课程,利用平台工具进行学习。

1.2 在线学习过程的大数据属性

在线学习平台经过一段时间的运行,平台记录的在线学习过程数据量大、类型多,具有大数据的特性[5]。从量大、复杂的原始学习过程行为数据中挖掘对学生具有监控和引导作用的学习过程属性,进行分析和构建数据模型。抽取的学习过程属性要包含对资源的使用程度指标和学习效果指标,具体属性参数如表1所示。

1.3 构建在线学习过程行为分析模型总体框架

利用大数据技术,构建在线学习过程行为分析模型总体框架,如图1所示。首先,构建在线学习过程行为数据模型,完成数据采集和预处理。其次,设计在线学习过程行为分析模型横向流程,包括采用K-means算法对学习过程行为数据进行聚类分析,个性化课程资源推荐,以及在线学习过程与学习效果关联性挖掘等。最后,设计在线学习过程行为分析模型纵向流程,包括学习过程行为数据选取、预处理、分析方法选择以及分析结果可视化等。

在线学习过程行为分析模型总体框架提供了研究学生在平台中进行的各类学习过程,及学习过程行为分析模型建立流程。

2 在线学习过程行为数据采集与预处理

2.1 在线学习过程行为数据模型

在线学习过程行为数据模型是学习过程的信息框架。根据在线学生的活动等级,将在线学习过程分为低级、中级和高级三个级别。低级在线学习过程是用户在平台中的一次性操作,如保存电子文档、观看视频、收听音频等操作。中级学习过程是用户在平台中的互动操作,如在线交流、讨论、提问、解答及评价等操作。高级学习过程是用户在平台中利用已知知识完成综合性问题解答的操作,如对问题的深加工、作品设计等操作。endprint

根据在线学习过程等级构建的在线学习过程数据模型,如图2所示。该数据模型具有多层次性,能够更加深入分析在线学习过程的类别、数据关系及数据定义格式,为学习过程行为的聚类分析,课程资源推荐及学习过程与学习效果关联分析提供基礎数据。

2.2 在线学习过程行为数据采集

由于在线学习过程行为数据复杂繁多,必须在后台数据库提供的基本课程及用户数据基础之上,结合从服务器端和客户端采集的学习过程行为数据,才能保障在线学习过程行为数据的全面性和真实性。

1) 服务器端数据。学生登录在线学习平台选择某门课程进行学习时,tomcate等Web服务器会利用系统日志记录用户的行为轨迹及各种操作,收集的信息包含学生的IP地址、登录时间、在线时长等。Web服务器系统日志采集用户学习过程行为数据流程如图3所示。

2) 客户端数据。程序员可以利用Javascript等脚本语言及page、session、application等内部对象实现对用户数据收集,也可以借助一些具备数据收集功能的浏览器来采集平台用户的学习过程行为数据。

3) 学习平台后台数据库。在线学习平台的后台数据库MySQL记录了用户的基本信息以及学习课程的基本情况。

在线学习过程行为数据由于存在不同的类型,如结构化、非结构化及半结构化,同时,收集的源数据可能存在冗余、不完整、有噪声的情况,需对原始学习过程行为数据进行去重、去噪、转换及缺失处理等数据预处理工作。

3 在线学习过程行为数据的聚类分析

由于学生在学习动机、学习需求以及学习方式等方面存在很大的差别,导致产生不同的学习行为。针对量大复杂学习活动的分析,首要解决的是进行学习过程行为数据的分类。利用RFL分析方法构建学习过程行为数据分类指标体系,使用K-means算法进行学习过程行为数据聚类分析,流程如图4所示。

根据在线学习忠诚度和学习效果,对学生学习过程行为数据进行聚类分析,将学生分为持续学习用户、积极学习用户等6种类型。

1) 持续学习用户。在线学习时间较长、学习频率较高,对课程拥有最高的忠诚度,是平台运营的主要竞争力。

2) 积极学习用户。在线学习总体学习时间较长、频率较高,但近期登录平台很少,对课程拥有良好的忠诚度。

3) 独立学习用户。近期在线学习时间较长,但缺乏与同学的交流互动,对课程的忠诚度一般。

4) 间断学习用户。在线学习次数较高但学习时间较短,对课程的忠诚度较低。

5) 惰性学习用户。在线学习时间较多,但次数少,对课程具有一定的忠诚度。

6) 观望学习用户。学习进度长、在线学习次数很少且学习时间很短,对课程的忠诚度最低。

在线学习平台根据用户类型及时找出学习效果不佳的学生,提醒教师应当采取有效措施,如推荐合适的课程,来提高课程忠诚度。

4 个性化课程推荐

根据课程学习过程行为数据的聚类分析,进行个性化的课程推荐,能够增加在线学习资源的访问的机会;能够延长用户滞留学习时间,提高对学习平台的粘性;能够帮助学生发现感兴趣的课程资源,提高学习的积极性。

在线学习平台为不同学习需求和学习动机的学生提供差异化的课程资源是平台的基本服务和功能。平台根据学生的兴趣特征,采用PageRank算法找出代表性学生,为其推荐个性化的课程资源与内容,具体流程如图5所示。

图5 个性化课程推荐流程

5 在线学习过程行为与学习效果的关联规则分析

利用FRSAR(贝叶斯模糊粗糙集的属性约简)算法,对用户学习行为与学习效果之间的关系进行关联分析,并用Apriori算法归纳出决策规则,为学生、老师及平台管理者提供相应的指导与对策[6]。例如,学生利用在线学习过程行为关联性分析结果,调整学习计划与进程,提高学习进度;教师利用关联性分析结果向学生推荐适合的学习资源,改进学习效果;平台管理人员利用关联性分析结果向学生推荐成功的学习经验,提供有针对性的教学策略。

6 分析结果可视化及应用

将最终得到的学习过程行为分析结果呈现给学生、教师和其他结果需求者是在线学习过程行为分析中的一个重要环节。构建在线学习过程行为分析模型要求注重对分析结果的呈现和表征,通过采用折线图、条形图、移动点、圆饼图等多种形式,将具体的分析结果以一种直观易理解的方式呈现给学生、教师等,从而使他们能快速了解分析结果。通过观察行为分析结果,能够帮助学生进行自我意识、自我反思和意义的建构。教师可以根据分析结果反馈为学生重新设定学习路径,通过互动反馈可以进一步掌握学生学习情况,实时调整教学内容。平台管理者通过分析结果可以优化平台服务功能及支持工具,根据问题学生的行为特征,设计出能够及时解决学生流失问题的措施服务及功能,为提高平台用户使用率提供一定的指导建议[8]。

7 结束语

采用大数据技术,完成了学生在线学习过程行为数据的采集和预处理,构建了数据分析模型,依据行为科学和人工智能理论对学习行为进行界定和聚类分析,实现了课程资源个性化推荐;依据学习行为与学习效果的关联分析,实现了教学策略的定制化,解决了学生流失问题,提高了学习效果和网络课程资源利用率。

参考文献:

[1] 李爽,王增贤,喻忱.在线学习行为投入分析框架与测量指标研究——基于LMS 数据的学习分析[J].开放教育研究,2016,22(2):77-88.

[2] 姜强,赵蔚,王朋娇.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育,2015,(1):85-92.

[3] 樊超,宗利永.MOOC在线学习行为的人类动力学分析[J].开放教育研究,2016,22(2):53-58.

[4] 宗阳,孙洪涛,张享国,等.MOOCs学习行为与学习效果的逻辑回归分析[J].中国远程教育,2016,36(5):14-22.

[5] 田娜,陈明选.网络教学平台学生学习行为聚类分析[J].中国远程教育,2014,(11):38-41.

[6] 施晓菁,梁循,孙晓蕾.基于在线评级和评论的评价者效用机制研究[J].中国管理科学,2016,24(45):149-157.

[7] 荣辉桂,火生旭,胡春华.基于用户相似度的协同过滤推荐算法[J].通信学报,2014(2):16-24.

[8] 任泰明.高职院校院系级单位做好顶层设计、提高管理效率的探索与实践[J].兰州石化职业技术学院学报,2016,16(4):37-38.

猜你喜欢
数据模型聚类分析大数据
面板数据模型截面相关检验方法综述
加热炉炉内跟踪数据模型优化
面向集成管理的出版原图数据模型
一种顾及级联时空变化描述的土地利用变更数据模型