南京市宁海中学(高中部) 翟家祺
著名的教育家孔子曾经说过对于学生最重要的是“因材施教”,但是教育方式大多都是分班制,每个班级的人数也在四五十个,每个班级的老师精力有限,不可能有时间去钻研每个学生的特点从而找到适合的学习方法。另外即使有充足的时间找到学生适合的学习教学方法也会夹杂着老师的主观印象。总之来说,我们崇尚“因材施教”,但是现实是很难做到。
传统教育方式针对性差:在学科针对性上,并非每一门学科的学习方法都是一样的,文科注重积累,理科注重思路,细细分下去,各科都有各科独特的特点。所以不同的学科的授课方式要根据学生的特点来设计效果更佳。但是现在的老师大多都是根据以往教学的经验上设计课程,这就造成了教学方式和资料落后。在教学方案针对性,传统教育中,老师准备的教学资料大多是针对大多数学生来设计的,这就会对平均水平以上和平均水平以下的学生不利,一些尖子生会重复已有的知识技能,而很难有效的提升。而对于一些差生会因为跟不上老师同学的节奏而更加落后普。再加上每一个学生的学习能力不同,学习习惯迥异,性格爱好五花八门,再加上出生环境的不同,父母学历这些因素都会影响学生的成绩。
学生、老师与家长了解的信息不对等:学生大多的时间实在学校里度过的,本来和家长相处的时间就少,再加上学生学业繁重,有些家长也比较忙,学生和家长之间的沟通就越来越少。大多数家长了解自己孩子学习的情况大多数是通过家长会,然而家长会提供的资料只是一个方面,作为孩子的第一个老师的父母不能像老师那样了解学生详细的情况。
这是一个信息爆炸的时代,随着信息的爆发式增长,海量数据由此而生,人们通常将这种大规模的数据集称为大数据[1]。在网络与信息技术发展迅速的今天,大数据也可以认为是这个时代紧密联系的,大数据将改变我们的一些生活方式。如果能用好大数据,首先应该了解大数据,那么大数据有哪些特点呢[1]:
(1)Volume(大体量):数据量大,教育资源的数据量包括众多学生,老师,班级等产生的数据至少是P开始的,1p通常等于1000个T,另外需要计算和存储的量也很大。
(2)Variety(多样性):种类和来源多样化。可以是结构化、半结构化,也可以是非结构化数据,具体表现为音频、网络日志、图片、视频、地理位置信息等等,对于教育数据可以是视频,成绩,音频等等。
(3)Value(大价值):大数据有数据量大的特点,数据价值密度相对较低,但是在现在机器学习的时代,能够从大量的数据中找到有价值的数据,然后做相应的分析可以获得较大的价值。
(4)Velocity(时效性):现在大多数的设备都是联网进行的,通常学生,老师的数据能实时的记录下来。
(5)Veracity(准确性):通常收集到的数据是准确的。我们可以利用大数据的这些特点来改进当今的教育方式。
利用大数据的这五个重要的特性,在教育领域我们可以推进教育方面的进步,主要表现两个方面。
(1)有目的的分析教育数据:产生的教育数据可以用来作为机器学习和数据挖掘的数据集。其中数据挖掘不同于早期web日志的挖掘,数据挖掘是在计算机相关技术支持下,由学生行为更全面准确地收集到的一种新的教育模式。教育工作者在数据挖掘的教育过程中可以找到这些数据的模式和规律,以便建立模型并预测学生如何学习。
(2)完善老师教学的模型:收集学生的数据,我们可以从中提取分析有用的数据。然后对学生的学习方式以及班级的特点进行数据画像。任课的老师针对产生的分析设计教学方式和计划[2]。
数据采集:数据采集是大数据教育平台的核心内容之一,学生在学习中产生的数据,老师教学的数据,高考和平时练习题目产生的一些数据都可以数据的共享传输。数据采集是数据存储和计算平台的前提。对于数据采集我们选择数据采集源,设置采集的时间,周期等参数。我们采集的数据在经过相应的处理之后存到原始数据仓库,作为教育平台的基础。
数据存储:数据存储是大数据教育平台的重要内容之一。用来存储的数据库可以由关系型数据库Mysql、Oracle、sqlserver,也可以是非关系型数据库,比如说Redis,Hbase等。我们要求采集的数据应该按照一定规则存在数据库里。
图1 基于大数据的教育平台
数据备份:因为数据存储有不安全的因素,单一的存储的数据容易在服务器断电、毁坏等问题容易丢失,所以我们要做相应的数据备份,数据备份一般会备用3-5份,以备不时之需。
计算平台:计算平台是大数据教育平台的核心内容之一,像大脑的作用。计算平台主要是用来分析数据,这里可以是像Hadoop大数据处理平台,在计算中会采用数据挖掘中相关的算法、模型。教育大数据中心将有效整合数据挖掘和分析方法,常用的数据挖掘领域,如相关分析、聚类分析、分类分析、异常分析、特定群体分析和进化分析等,和现有的挖掘算法是比较成熟的开放源代码工具集成到教育数据中心平台,在一方面,为方便各业务系统数据的数据挖掘程序,另一方面可以更加有针对性的分析,在此基础上构建了多种模式,如课程学习成功的预测模型,区域教育均衡发展趋势预测模型,学生学习障碍的诊断模型,教学行为模式模型等。
权限管理:角色与权限管理是整个系统安全运行的基础,不同的用户只有被分配不同的角色后才会根据自己的权限来享受相应的服务。有了权限管理才能保证大家各司其职,数据等的安全。角色与权限管理的具体功能包括:角色管理、添加角色、删除角色、修改角色、用户角色分配、角色权限关联、群组管理等。
安全管理:安全管理负责大数据教育平台的安全保密,是这个系统重要的一部分。教育大数据中心对数据的备份策略、恢复机制、加密策略、数据清理等都有很高的要求。首先要数据库的备份,可以是镜像和快照,在遇到问题的时候可以通过快照和镜像来恢复数据。为了保证数据不被危险的人员查看我们对数据做一个加密,可以MD5,RSA等方式。定期查看数据,对不需要数据做一定清理。还要会查看操作日志,在出现问题的时候通过日志来定位。
可视化分析和重现:可视化分析和重现是对于需要了解数据分析结果人员而言的,通过计算平台使用不同数据挖掘的模型产生相应的结果,然后对数据结果做一些处理,以文字,图标(折线图,柱状图,饼形图)等形式显示给用户查看[3]。
数据本身不产生价值,如何分析和利用大数据对教育产生帮助才是关键。教育大数据技术对于教师来说,其能够改善现有的学校考核方式,用来评估课程和机构,并提供更多的教学分析数据,方便教师在分析数据的基础上,为学生提供更多、更有针对性的教学干预;对于学生来说,基于学习行为的大数据分析,让学生以学习者的角度了解学习过程发生的机制,以此来优化学习,并展开自我导向学习和适应性学习。对于家长来说,有利于全程跟踪学生的学习过程和学习动态,为学习方法和路经的选择多些参考与指导。
(1)学科教学针对性。大数据可以根据每一科目的特点及每个学生的掌握程度“私人订制”每个学生每天的学习任务。比如,通过对学生己经拥有的知识、学习动机、学习认知和学习态度等方面的数据分析和处理、预测学生的学业表现,并向其推荐他们可能取得优秀学业表现的课程。系统先获取某个学生以前(高中或大学)的学业表现,然后从已毕业学生的成绩库中找到与之成绩表现相似的学生,分析以前的成绩和待选课程表现之间的相关性、结合某专业的要求和学生能够完成的课程进行分析、利用这些信息预测学生未来在课程中可能取得的成绩,最后综合考量并预测的学生成绩。再例如,根据遗忘曲线帮助学生复习英语单词,或是根据学生在平时的作业或是考试中所犯的错误,有针对性地重点复习帮助学生有效提升学习效果。
(2)教学方案针对性。大数据可以根据全班同学的掌握情况做出具体分析,制定适合绝大部分同学都能接受的教学内容及教学难度。从而提高教师讲课的效率,达到学生事半功倍的目的。通过大数据的云计算平台,我们可以准确的找到符合学生的教学方式。比如说我们可以通过学生在学习平台上产生的数据,判断学生适合学习文科还是理科,该学生适合以学生为主导的课堂还是以老师为主导的课堂。
(3)学生学习针对性。根据每一个学生的作业及考试情况判定其对知识点的掌握情况,然后根据其掌握情况找出相应的试题,让学生正真的掌握他们原先不会的或是有疑问的知识点,从而达到学生学习成绩稳定提升的目的。比如说我们可以计算学生失分的主要是知识点不会,计算失误,还是其它原因,也可以得出每个学生掌握知识点并且能熟练运用需要付出多长时间的练习等[4]。