林 静
大数据在教育领域的应用研究*
林 静
(宁德职业技术学院,福建福安 355000)
摘 要:大数据时代,各个领域都试图应用大数据技术来进行管理、优化等工作,大数据在教育领域也得到了一定的应用,本文阐述了大数据的准确概念及其三种数据类型,分别介绍了大数据的六个特点:数据量大、类型多、对存储要求严格、时效强、速度快、管理过程比较复杂,并提出了大数据技术在教育领域有转变教育理念、改变思维模式,让传统教育模式向个性化教育转变,重新确立教学评价的方式,加强学校基于数据的管理等的应用。
关键词:大数据;大数据技术;教育数据挖掘;数据分析
1.1 大数据是什么
这是一个信息爆炸的时代,随着信息的爆发式增长,海量数据由此而生,人们通常将这种大规模的数据集称为大数据[1]。在网络与信息技术的飞速发展中,大数据可以说是这个时代的必然产物。而且大数据的出现,必然为诸多领域或行业带来极大的冲击。
大数据到底有多大?有人进行过相关数据研究得出,仅一天时间,在互联网上发出的邮件有2940亿封之多;发出的社区帖子达200万篇;卖出的手机约37.8万台,每天全球出生的婴儿数量则高达37.1万(见表1)。
表1 互联网一天所产生内容的部分数据Tab.1 Part of the data generated Internet content in one day
1.2 大数据的数据类型
大数据的数据类型可以根据数据来源的不同来区分,而大数据的来源各种各样:有公开的信息如报纸、杂志、文章,还包括购买交易记录,网络日志,视频和图像档案等[1]。归纳总结后大数据的数据类型主要有以下三种:
(1)科研数据
许多传统学科的研究都在产生越来越多的数据,这些传统学科一般都是以数据为中心,典型的有生物学科、天文学科等。这些数据的产生不仅速度快,数量也是惊人,例如用电子显微镜重建大脑中的突触网络,1立方毫米(几乎只有一颗白砂糖那么大)大脑的图像数据就超过1PB。
(2)互联网数据
互联网数据一般指各类计算机信息系统产生的数据,近年大数据的飙升主要还是来自人们在使用互联网的过程中所产生的数据。对于本土搜索引擎的龙头百度来说每天大约要处理几十个PB的数据,而国外一款社交软件Facebook每天更新的照片超过了1000万张,会生成300TB以上的数据。
(3)感知数据。
进入移动互联网时代后,大量感知数据产生,不同的各个监控同时在采集流媒体数据,这些数据的数量是不可计量的。这些数据与网络数据有一部分重叠。感知数据有许多不同于自然科学数据的特点,科学实验的数据采集是人为的,检索识别等都有律可循。而感知数据包括多种不定性因素,实时性强,非结构化数据多,互联网数据和感知数据中的大量数据都是随机动态产生的[2]。
1.3 大数据的特征
大数据的特征主要有以下几点:
(1)数据大
数据大的特点指收集和分析的数据量非常大,其数据量的起始计量单位至少是PB、EB乃至ZB。
(2)种类多
由于数据来源的不同数据的种类也十分丰富,文字、音频、图片、地理位置信息、购买日志等等都是不同形式的数据,而越多种类的数据越需要更高的数据处理能力及相关技术。
(3)存储要求高
大数据必须存储在一定等级的数据存储系统才可以。因为大数据的规模一般至少是可达到PB级别甚至以上的,所以最理想的是这个存储系统还具有相应等级的扩展能力。互联网中的数据是不断变化的,新数据类型不断涌现,用户需求提高,数据存储系统要求也随之提高。
(4)价值密度低
一个最好的说明大数据价值密度低的例子就是,物联网已经得到广泛应用,物联网中的信息感知无处不在,这类信息的数量是海量的,但整体来说其中有价值的信息却相对较少。
(5)时效强、速度快
数据的产生速度几乎无法具体计算,在每一时刻都会有海量数据的产生,互联网数据和感知数据中的大量数据都是随机动态产生的。
(6)管理复杂
大数据的规模和复杂结构,使得传统数据管理体系显得力不从心。海量异构数据的处理也无法利用传统的数据管理技术。无法及时处理投入的巨大采集的信息并反馈有效信息,对于许多相关组织来说都是事倍功半的。
由徐子沛所写的《大数据》一书中有这样一句话:“大数据之大,并不仅仅在于容量之大,更大的意义在于通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值”[2]。大数据中有价值的信息是不可估量的,企业如果能好好利用大数据将会给企业带来巨大的发展,但其过程也是非常艰辛的。不过目前许多行业都已经开始着手研究并应用大数据了,大数据技术在教育领域也得到了一定的应用。
2.1 大数据技术在教育领域的理论应用
大数据在教育领域的理论应用主要在于对传统教育理念的创新以及传统教育思维的革新等方面,主要表现方式如下:
(1)利用大数据技术推动教育向信息化方向发展
新的时代,教育领域也充满了大数据,教育领域的大数据应用改变了传统教育思维。
教育领域的大数据包括学校里的一切事物,教师、学生的所有行为都可以把它整理成数据。大数据不同于传统的数字,大数据应用在教育领域有着其深刻的价值[3]。举个例子来说,采集一个学生在一次编程实验中,使用的所有编程控件及数据,从中我们就可以看出学生对控件的认知水平,应用能力,分析能力及解决问题的能力。通过构建完善的数据采集教育平台,让数据成为信息反馈的工具,从数据分析中教师可以明确学生知识的缺陷并进行学生个性教学,进一步提高教学水平。
传统的教育思维是将教育作为一门用理念和经验来传承的社会科学,而大数据时代的到来将让教育变成一门基于数据的实证科学。大数据革新了教育者的思维,传统的经验理念有时并不全面也缺乏一定的科学依据,但在大数据相关技术的应用中相关部门可以通过对数据的分析,更直观、更准确地挖掘出符合学生实际与教学实际的教育情况,并制定出更符合实际的教育教学策略。
(2)大数据技术实现了差异化教育
大数据在教育领域的应用可以改变传统群体教育的方式,使实现个性化教育具有了可能性。
首先是学生方面,利用大数据技术,我们可以关注到每一个学生个体的微观表现,比如他每天在教室待的时间多长,他在什么时候做作业,做题的效率又如何,会向多少同学或老师发起主动交流,开小差的次数分别为多少等等。这些数据的产生完全是过程性的,是对学生即时性的行为与所在状态的记录。这些数据是学生个体在教学过程中的学习表现和学习水平的体现。最有趣的是,为了获得学生的真实表现,也不影响他们的日常学习与生活,数据的采集可能是在他们完全不知情的情况下,通过一定的观测技术与设备来获取这些数据。
其次,是教师方面,大数据技术采集到的学生信息数据通常是提供给相关教师的,教师获得了每个学生的特点信息后,可以在教学过程中有针对性地进行因材施教。例如,在课堂学习过程中,教师可以了解到哪些学生是对课本理论知识掌握比较牢靠,哪些学生是比较喜欢实践得出结论的,哪些学生在某一学科的薄弱点在哪里等等[4]。除了课堂学习可以应用到大数据,学生在课后作业过程中也能通过数据分析强化学习效果。学生在做题过程中遇到哪些问题,哪些题目是重、难点题目都可以在学生课后作业中体现出来,教师也可以将其作为依据强化教学。
(3)大数据技术建立了纵向教学评价和学习分析的方式
在教学评价和学习分析中利用大数据分析,使教学评价和学习分析的方式从依靠经验评价转向基于数据评价。
教学评价的新方式是可以通过归纳教学活动中大量的数据找出一定的规律,从而能更好地优化教学过程。在教学过程中,每个学生学习的效果往往都体现在日常的学习行为中,哪类问题最易犯错等等问题成为分析每个学生学习行为的直接依据。而基于大数据技术的新一代的在线学习平台可以通过记录学习者鼠标的点击路径,研究出学习者的学习轨迹,将学习者哪些题目最容易犯错、哪些知识点没有掌握或掌握有难度等问题直观地展现出来,从而让教师进行针对性地教学,提高学生的学习效率。
此外,通过大数据相关技术手段还实现了从教学结果评价转向教学过程性评价。发现记录学生学习成长过程的特点,能让教师对学生的发展提出建议。同时,教师也可以在这些数据中发现自身问题,然后进行教学反思并改进,从而优化教学实施过程。
学习分析的目的是评估学业进步、预测未来表现、发现潜在问题。学习分析需要对学生学习过程中产生的大量数据进行解释、分析,这些数据既来自学生完成作业和参加考试等这类显性行为产生的数据,也来自学生课外活动,在线社交,以及其他一些不直接作为学生教育进步评价的活动等隐性行为产生的数据。新的学习分析方法可以让教师和学校创造适合每个学生能力的教育机会[4]。
2.2 大数据技术在教育领域的实践应用
大数据在教育领域的实践应用主要表现在教育数据挖掘方式的革新以及学校管理的加强,具体表现如下:
(1)教育数据挖掘方式的革新
新的教育数据挖掘方式可以应用机器学习、统计学的相关数据挖掘技术以及数据开发方法,对教学过程中收集的海量数据进行分析。
不同于网站日志数据挖掘的早期教育数据挖掘,新的教育数据挖掘方式在计算机相关技术支持的条件下,通过工具所收集学生行为的数据更全面准确。教育者在教育数据挖掘过程中能发现这些数据中的模式和规律,从而可以建立模型重新发现和预测学生如何学习。
例如,Hung,J.L.等开发了一种新的在线课程评价方法,通过分析共有7539名学生在883门注册课程中的23854527份学习日志,结合每个学生的特征数据、在课程中学生的学习表现以及课程结束时对学生开展的课程评价问卷调查,对所有的学生进行一个有规则的分类,进而发现高表现学生和高危学生的不同的具体特征,达到预测学生的成绩,了解学生的学习能力,并支持研究学生表现和对课程满意度的关系的结果[5]。
教育数据挖掘很早以前在教育领域就已经得到成功应用,只不过最早是用来预测学生表现也就是预测学生成绩的,即教育数据挖掘最普遍的应用,近年来,教育数据挖掘的目标越来越广泛,应用也已经越来越全面,《通过教育数据挖掘和学习分析改进教与学:问题简介》一书中对教育数据挖掘的目标和应用进行了详细的阐述,总体来说教育数据挖掘的目标可以概括如下:
1.通过创建学生模型来预测学生未来的学习行为。这个模型应该包括学生已经拥有的知识、学习的动机、学习元认知和学习态度等方面。
2.完善学科领域的模型。这些模型得到完善后应该能够概括学生们要学习的知识内容特点和教师们应该优化的教学步骤。
3.研究学习软件的学习效果。在教学过程中所使用到的学习软件能够提供对不同教学法支持的效果,教育者应该挖掘出其中的相关数据,分析制定更有效的教学方法制度。
4.通过建立计算模型推进科学知识的学习。所建立的计算模型应该综合学生模型、领域模型和软件教学模型,更丰富地挖掘出关于学习和学生的数据。
(2)基于数据的学校管理的加强
在加强学校管理这方面,大数据的相关技术也是能起到至关重要的作用的,大数据技术的应用对于实现学校管理的精确化、科学化具有一定价值。
在学习管理中信息的丰富多样,任何一个行为都可能产生大量数据,同时学校管理也离不开这些信息和数据,学校管理中出现的各种决策和行为,都是以大量的数据为基础的。教学计划的制定、教学质量控制、教学评估、教师与学生管理等,都离不开数据,在这些决策行为执行的过程中还会不断产生海量数据,如果不能及时的处理,前面为得到这些数据付出的劳动都将被浪费,只有基于已有的数据来预测未来可能产生的数据并及时处理这些数据,教学管理才算是有效的,因此大数据的处理和挖掘对于学校管理具有关键作用。
在教学管理过程中利用大数据技术,可以完成管理决策、管理活动、管理过程的控制,从而全面归集学校管理部门有序地管理学校大数据。举例来说,在教务管理方面,学校管理部门可以对全校有关教务管理相关的数据进行规划、梳理,并将数据收集标准规范应用到其下各个细分领域,并及时归集,就形成了全校管理教务大数据。
此外,学校网络信息安全管理是学校管理中十分重要的一部分,而且也可以利用大数据分析技术进行管理。比如学校管理部门可以利用大数据帮助分析学校信息网络运行日志数据,有了网络运行日志数据相关管理人员就能够审计网络环境,在出现故障时利用大数据分析技术快速找到故障点的位置,生成故障检测报告,这样可以快速帮助网络信息安全管理人员进行程序修补,或采取其他安全措施,从而使校园的信息安全防护能力得到提升。
根据以上研究我们可以看出对促进教育领域发展大数据技术应用的作用是显而易见的,未来教育发展的趋势也正朝着大数据方向发展。近年来,国内的专家学者也纷纷展开了大数据对教育方面影响的相关研究和探讨,但仍停留在理论探讨上,实际应用的很少。大数据是一项新生的技术理念,对教育领域来说还非常新颖,其应用也并不十分成熟,但是关于大数据在教育领域的更多深入应用值得我们继续研究。
参考文献:
[1]涂子沛.大数据[M].广西:广西师范大学出版社,2012.
[2]魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013(2).
[3]Bienkowski M,Feng M,Means B.Enhancing teaching and learning through educational data mining and learning analytics:an issue brief.Washington,D.C.Office of Educational Technology,U.S.Department of Education,2012.
[4]佚名.湖北五名贫困大学生“受助不感恩”引风波[J].湖北教育,2007(10):60.
[5]王敏.城市家庭少儿社会情感忽视问题实证研究——基于长沙市100个家庭的调查[D].长沙:中南大学,2006:32.
中图分类号:G40-05
文献标识码:A
文章编号:1673-6125(2016)02-0070-04
收稿日期:2015-12-16
作者简介:林 静(1980-),女,福建连江人,宁德职业技术学院讲师。主要研究方向:数据挖掘、大数据技术。
Research on the application of big data in the field of Education
LIN Jing
(Ningde Vocational and Technical College,Fu'an Fujian 355000,China)
Abstract:the era of big data,all fields are trying to use big data technologies to manage and optimize work,big data in the field of education has also been a certain application,this paper firstly describes the accurate concept of big data and three data types,the data has a large amount of data,multiple types,storage strict,strong,fast,time management is a complicated process of six features,in the main part of the article explains the big data technology is changing the concept of education,change the mode of thinking in the field of education,so that the traditional education mode change to the personalized education,re establishing teaching evaluation mode,strengthen school management based on Application data.
Key words:big data;big data technology;educational data mining;data analysis