刘帅兵 孙铭泽 隋新
摘要:近年来,计算机技术的进步,新的应用不断涌现,数据的规模呈爆炸式的增长,大数据、教育大数据引起了政府部门、教育部门的关注。在教学过程中充分利用教育大数据,可以预测学习、判断在教学过程中的问题,进行个性化的指导,提高教学效果。本文对教育大数据对高等教育产生的影响及带来的挑战进行了分析。
关键词:大数据;教育大数据;高等教育
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2021)08-0127-02
Abstract: In recent years, with the progress of computer technology and the emergence of new applications, the scale of data is growing explosively. Big data and education big data have attracted the attention of government departments and education departments. In the teaching process, making full use of education big data can predict learning, judge the problems in the teaching process, carry out personalized guidance, and improve the teaching effect. This paper analyzes the impact and challenges of education big data on higher education.
Key words:big data; education big data; higher education
1 大數据
信息技术的发展产生了大数据,不同的领域机构对大数据有着不同的定义。维基百科对大数据的定义是:规模庞大、结构复杂,难以通过现有商业工具和技术在可容忍的时间内获取、管理和处理的数据集。
大数据不仅是规模大的数据,更是一种技术。大数据即海量数据,数据包括结构化和非结构化的形式。其中非机构化的数据占大多数,一般指文档、图片、声音、视频等信息,其具有格式多样性的特点。结构化的数据是指可以统一结构表示的信息,如数字、符号等数据。大数据具有4V的特点,数据容量规模大、类型多样、价值大、处理速度快。
2 教育大数据
教育大数据是指整个教育活动过程中所产生的以及根据教育需要所采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合[1]。
教育大数据是教师与学生在整个教育教学活动中所产生的所有的行为数据,可以看作大数据的一个分支。教育大数据包含教职工、学生所有的基本信息;教学活动中课程的基本信息,如培养方案、教学大纲、教学日历等,以及学生在学习过程中的学习行为等。
3 在线教学平台
在线教学平台即网络学习平台,该平台提供了共享的课程教学资源,学生可以自主地进行课程的学习。国内比较主流的学习平台有中国大学MOOC、智慧树、学堂在线、好大学在线、学银在线等。在线平台提供了丰富的学习资源,多种多样的互动模式。利用MOOC学习不再受时间的限制,学生可以个性化地选择学习内容。利用数据挖掘技术对MOOC平台产生的教育大数据进行挖掘分析成了热点问题。
MOOC平台能够记录学生的学习行为,如登陆平台的次数、登陆时间、视频观看情况、任务点完成情况比率、参与互动的情况(如教师发布的讨论、问卷、投票、选人、抢答等活动学生完成的情况)。这些是平台能够记录的学生的学习行为,像学生的主观意愿、学习的动机等学习平台并不能够记录下来。
4 教育大数据背景下对高等教育的影响和挑战
4.1教师的信息素养有待进一步提高
MOOC时代已经到来,教师可以结合其学科课程的特点,建设其MOOC课程,或者有效地选取MOOC资源,积极面对大数据时代。
4.2在线管理存在一定的不足
MOOC利用信息化对教学活动进行管理,但是受到传统的教学管理的方式的影响。在MOOC教学过程中,虽然课程团队花费了大量的人力、物力、时间等,有的课程并没提供很好的课程资源[2]。在MOOC教学过程中,大多数教师采用在线的MOOC资源与线下的实体课堂相结合的混合式教学模式。部分教师认为不太好严格地针对线上学生自主的MOOC学习进行实时监管。并不能真实有效地对学生的所有学习行为进行实时监控,不能保证学习行为的真实性。
MOOC的兴起,推进了教育技术与信息技术的发展与融合。MOOC不仅要对教学设施、平台支持与硬件设施有相应的辅助配套,更要求对在线课程有较为完善的管理机制[3]。
在MOOC开始学习之前,教师设置各种学习资源所占的权重。MOOC平台自动记录学生的学习行为。但这仅仅是对学习行为的记录和管理,并不能对学生的学习效果进行客观的评价。学生修读后学分认定存在一定的困难。
教育大数据一般只在其内部可以共享使用,为了让更多的高校、社会组织在教育教学领域有所创新,就应当共享其教育大数据资源。一方面想构建教育大数据共享中心,一方面还要对教育大数据采取有效的安全管理措施。
5 教育大数据平台架构的初探
教育大数据可以促进教育资源的共享,促进教育的均衡发展。学生可以获取优质的学习资源,改进学习的方法。
5.1教育大数据的应用
通过采集在教学活动中教师教与学生学产生的教育教学数据,能够分析学生的学习行为,并对其学习效果有效地预测,对学生进行有针对性的指导,教师也可以及时改进其教学策略,提高学习效率。
通过在线平台统计的学生行为数据,对其进行分析挖掘,预测学生是否能顺利完成某门课程的学习,教师可以有针对性地改变教学策略,使其完成课程的学习,提高教学效果。
以“数据库技术及应用”课程为例,本门课程在超星的学银在线上线。通过超星的泛雅平台的后台服务器能够记录学生学习课程的信息。本门课程任务点共计125个,该课程的任务点类型百分比分布如图1所示,本课程任务点以课程的教学视频、课程文档为主。
基础物理硬件的架构,建立包括各个高校、校内资源的互联共享网络。网络终端应具备比较好的性能。软件技术层面的架构。实现大数据共享,首先要采集数据。获取部分高校的教育大数据,主要包括教职员工的基础信息、学生的基本信息;教学过程中的软件资源,如教学视频、教學课件、教学大纲、教案、学生的作业、实验报告等。以及在教学活动中产生的教育数据,如教师的授课轨迹、学生在学习过程中的行为等。
基础的教学相关信息可以通过本校的教务管理系统、办公系统获取。学生的学习行为可以通过在线平台的后台统计获取,也可以通过网络爬虫获取学生学习行为的非结构化数据。
5.2相关的主要技术
收集教育大数据是架构大数据的首要任务。教育大数据的类型比较多,产生教育大数据的主体也比较多,除了结构化的数据,还有非结构化的数据。采集的数据包括静态的文档、课件、教学视频、学生成绩等,还需要掌握学生在学习过程的学习行为,课上的表现,课下参与互动的情况等。
对于类型多样的非结构化数据,主要采用网络爬虫技术进行捕捉收集。学习在学习平台的学习行为、学习成绩等可以通过后台数据库及网络日志获取。
学生线上考试成绩可以通过在线平台进行统计,本门课程其中一个教学班(会计3、4班)的学生线上考试成绩百分比分布如图2所示。
数据的预处理技术,收集到的教育大数据类型丰富多样,要保证数据完整性,没有冗余,需要对收集到的数据抽取、清洗、转换和集成[4]。从而提取实体和实体间的关系,通过关联、聚合等操作,为数据的存储做准备。
传统的课堂教学以教师讲授为主,“互联网+”大数据的到来,学生不仅可以在课堂获取知识,还可以通过互联网MOOC平台获取更多的课程资源。学生也不再是被动地学习,而是主动地获取知识。教育大数据的应用已经引起了广泛的重视。在主动学习的过程中,学生学会思考,在掌握知识的同时,收获学习的方法,能够构建知识体系。教育大数据改变了传统的教学模式,充分利用智能技术进一步推动教学模式方法的改革、促进应用型人才的培养。
参考文献:
[1] 刘淇,陈恩红,朱天宇,等.面向在线智慧学习的教育数据挖掘技术研究[J].模式识别与人工智能,2018,31(1):77-90.
[2] 柳泉,车敏,安利.MOOC参与的大学计算机基础教学模式探索[J].物联网技术,2018(12):108-109.
[3] 曾嘉灵,欧阳嘉煜,纪九梅,等.影响MOOC合格学习者学习效果的行为特征分析[J].开放学习研究,2018(6):1-9.
[4] 李俊杰,谢志鹏.大数据技术与应用基础项目教程[M].人民邮电出版社,2017.
【通联编辑:王力】