教育大数据在地方高等院校教育教学中的应用研究

2018-02-24 13:55董婧
电脑知识与技术 2018年34期
关键词:海量结构化数据挖掘

董婧

摘要:综合应用教育学、计算机科学、统计学、信息学等多学科理论可以实现对高校教育大数据的深层次挖掘和应用。采用Hadoop大数据挖掘云服务,构建了高校教育大数据挖掘系统,应用数据挖掘技术和统计方法处理曲靖师范学院本科教学评估期间收集的海量数据,可以实现对大学更加精准高效的管理以及智慧教与学,提高教育教学质量。

关键词:教育大数据;数据挖掘;云服务;地方高等院校;Hadoop

中图分类号:G642        文献标识码:A        文章编号:1009-3044(2018)34-0139-02

大数据时代的教育数据与传统教育数据相比,具备实时性高、颗粒度细、真实性和决策性强等特点。教育大数据产生在教与学的各个环节[1],包括了各种类型的结构化、半结构化和非结构化的具有大数据特征的数据集,如教学数据、管理数据和科研数据,通过数据挖掘和分析、云计算等信息技术展现教育大数据的价值,各高等院校需要利用有效的信息技术来处理海量数据,挖掘出对高校教育教学管理决策有价值的信息[2]。教育数据挖掘主要采用了数据挖掘、数学统计和机器学习等技术对海量教育数据进行处理和分析并建立科学的数据模型[3],从中发现学习者学习结果与学习内容、学习资源和教学行为等一系列变量之间的相关关系,挖掘学生的学习习惯、学习兴趣和学习偏好。

我国大数据在高等教育领域应用的原理性研究较少,有些支持理论尚处于初生阶段缺乏相关的资料支持。随着教育机构的信息化系统中积累的数据量日益增多,教育行业的管理人员在选择资源时无法得到有效、优质的信息,导致部分有效的信息得不到发掘利用,出现“信息孤岛”的现象[4]。数据挖掘技术可以从教育信息海量数据中发现有用的信息,让教育系统中的各个参与者受益,为解决教育领域中存在的半结构化以及非结构化的决策问题提供依据。

1教育大数据关键技术

1.1交叉学科

利用教育大数据实现对高校教育大数据的深层次挖掘和应用,需要综合应用教育学、计算机科学、统计学、信息学等多学科理论。近几年来,教育领域和信息领域发生了历史性的变革,各种在线学习平台、智能手机应用和社交网络为研究者提供了大量的应用和海量数据,但是这些数据还没有被许多地方高校足够重视与合理运用,利用许多新型的信息技术,如云计算技术、物联网、移动计算和大数据技术,为分析和挖掘教育大数据提供了技术支持,可以将这些闲置数据变废为宝,实现数据技术的有效处理,挖掘出蕴含的隐藏价值。

云计算服务解决了高校信息化建设中的信息孤岛现象[5-6],可以集中整合分散的教育资源,使教师和学生能够共享存储在云服务端的教育资源,并且与各类终端设备无缝连接,将云服务端的各种分散的关系化、结构化和非结构化数据利用数据挖掘技术、数据分析和数学统计等方法进行分析和挖掘[7-8],通过数据挖掘技术得到的信息,可以准确分析评价课堂教学的质量。

1.2数据来源

地方高校目前普遍存在教育经费使用效率不高,教育投入产出比低;在教学组织形式方面,沿袭工业化时代的标准化教学内容、教学方法、考试制度、学科设置及人才培养模式,忽视学生的个性特征和认知发展等问题。曲靖师范学院刚完成普通高等学校本科教学工作审核评估,各个学院以及教辅部门收集整理了各个方面的资料,如教学设施、课程资源、社会资源、教学改革、课堂教学、实践教学、第二课堂、招生及生源情况、学生指导与服务、学风与学习效果、就业与发展、教学质量保障体系、质量监控、质量信息与利用和质量改进等,涵盖了学校教学与服务的方方面面,针对这些海量数据,如何为我校师生做到精准的教与学以及质量评价是一个难题。本研究主要以曲靖师范学院本科教学评估期间收集得到的最新教学状态数据、学生网上学习的日志数据、用户产生的UGC数据,比如微信、微博、论坛等数据为主,另外学校已开设了公共关系礼仪实务等10门尔雅通识课、唐诗宋词人文解读等9门好大学在线等多达几十门MOOC课程,这些教学的过程数据可以实现全程采集,利用这些数据来为我校师生做精准化分析服务。

其中,基础数据包括学生基本信息、招生及生源情况;管理数据包括学风与学习效果、教学质量保障体系、质量监控、教学评价;教学数据包括教学设施、课堂教学、教学改革、课程资源、MOOC课程和网络课程教学平台;科研数据包括教师各项科研成果、第二课堂、实践教学、大学生创新创业项目;服务数据包括学生指导与服务、图书档案服务、学生网上学习日志数据;舆情数据包括UGC数据,如微信、微博、论坛等数据。

2教育大數据挖掘应用实现

2.1教育大数据分析系统框架

教育大数据分析系统采用Hadoop大数据挖掘云服务,它是一个开放的主要面向互联网海量非结构化数据的分析和挖掘平台,也支持结构化和半结构化数据,集成了多种基于Hadoop的并行数据预处理和挖掘算法,如K-means算法,系统框架如图所示:

2.2数据挖掘与数学分析

数据挖掘是从大量的、有噪声的、不完备的、随机的数据中,发现隐含在其中的、人们事先不知道的、但是是潜在有用的信息和知识的过程。原数据通常是大量的、真实有效的、含噪声的;数据挖掘的主要特点是对数据库中的大量数据进行提取、转换、分析以及其它模型化处理,挖掘出用户感兴趣的以及有助于管理者决策的重要信息。本文以曲靖师范学院的高校办学状态等数据为原始数据源,采用数据挖掘技术中的统计方法、机器学习方法和仿生物法建立模型,获取教育大数据中隐藏的潜在信息。统计方法用到了回归分析、聚类分析、主成分分析和关联规则挖掘,机器学习方法主要用到支持向量机等相关算法,仿生物法主要用到神经网络,使用SPSS Clementine数据挖掘软件对学生特征行为分析模块、学生就业因素分析模块、学习结果预测模块、教学质量监控评测、高校管理发展影响因素分析模块等进行模型构建,进行实例仿真,相关的教育数据挖掘研究结果如下:

3 结论

采集高校和各学院的办学状态数据,通过数据挖掘技术,可以消除信息孤岛,实现横向关联比较,纵向历史分析,提供精准服务,支持科学决策。通过数据挖掘技术得到的信息,可以准确分析评价课堂教学的质量,实现对大学更加精准高效的管理,使得教和学更加智慧,具体来说,对本校各学院学生学习过程进行跟踪,实现兴趣、个性、情感等方面的动态分析与挖掘,两者结合起来,建立基于用户兴趣和个性的资源推荐,最后实现个性化精准过滤;同时对教师的教学质量和效果可以进行综合、动态和客观的评价。通过数据挖掘、分析、可视化等技术展现教育大数据的价值,推动教育发展创新,提高教育教学质量。

参考文献:

[1]周庆,牟超,杨丹.教育数据挖掘研究进展综述[J]. 软件学报, 2015,26(11):3026-3042.

[2]张燕南. 大数据的教育领域应用之研究——基于美国的应用实践[D],华东师范大学, 2016.

[3]马秀麟,衷克定,刘立超. 从大数据挖掘的视角分析学生评教的有效性[J].中国电化教育, 2014(333):78-84.

[4]彭涛,丁凌云.基于教育数据挖掘学生表现预测模型构建研究[J].黑龙江高教研究, 2015(11):55-58.

[5]崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展, 2012(49):12-18.

[6]何清,敖翔,庄福振,罗平.一种基于Hadoop的大数据挖掘云服务及应用[J].信息通信技术, 2015(6):42-49.

[7] Chen X, Vorvoreanu M, Madhavan KPC. Mining social media data for understanding students learning experiences[C]. IEEE Trans. on Learning Technologies, 2014, 7(3):246?259.

[8] Chang MM, Lin MC. The effect of reflective learning e-journals on reading comprehension and communication in language learning. Computers & Education, 2014(71):124?132.

【通联编辑:王力】

猜你喜欢
海量结构化数据挖掘
一种傅里叶域海量数据高速谱聚类方法
促进知识结构化的主题式复习初探
结构化面试方法在研究生复试中的应用
海量快递垃圾正在“围城”——“绿色快递”势在必行
基于并行计算的大数据挖掘在电网中的应用
一个图形所蕴含的“海量”巧题
一种基于Hadoop的大数据挖掘云服务及应用
基于图模型的通用半结构化数据检索
基于软信息的结构化转换
基于GPGPU的离散数据挖掘研究