李凤霞,徐玉晓
(华南师范大学 教育信息技术学院,广东 广州510631)
本文以Web of Science(WOS) 数据库为基础,使用“TS=education AND big data”检索式,时间跨度为2000 -2018年,国家/地区排除中国,检索文件类型为ARTICLE 以及REVIEW,检索出1 255 篇文献并按“相关性”排序,筛选出与“教育大数据”高度相关的500 篇文献。利用WOS 数据库中自带分析检索结果功能统计文献相关数量信息,将统计数据导入Excel 绘制可视化图表;将文献信息导入可视化文献分析软件Citespace,对研究热点进行聚类分析。此外还借助Google Earth 可视化呈现文献空间分布情况。
根据国际教育大数据文献数量变化情况(见图1) ,可大致将其发展轨迹划分为起步阶段(2000 -2011) 、快速发展阶段(2012 -2017) 、平缓发展阶段(2018 至今) 。2000 -2011 年间,大数据相关研究并不深入,还停留在数据处理技术实现及大数据在教育领域应用可行性探讨层面。2011年,麦肯锡全球研究院首次提出“大数据时代”的概念[1]。2012 年大数据研究热点由教育数据应用可行性探讨转向了教育大数据实践应用,开启了教育大数据由“发现数据”到“挖掘数据”的初步尝试,较多关注教育大数据与教育应用的决策支撑与学习预测等[2]。2012 年,美国发布了《大数据研究与发展倡议》[3],与《通过教育数据挖掘与学习分析促进教与学》教育大数据报告,拉开大数据在教育领域的研究热潮[4]。2017 年是国外教育大数据发展最火热时期,2018年教育大数据研究逐渐迈进相对平缓阶段。
图1 国外教育大数据文献时间分布
本文将文献信息导入Cit espace 软件,结合Google Earth工具,生成文献空间分布地理位置图。
从图2 -4 可看出,教育大数据研究主要分布在欧洲、北美洲、亚洲等区域,且欧洲数量最多。欧洲教育大数据研究主要分布在西欧国家; 北美洲教育大数据相关文献主要分布在美国东部地区; 亚洲教育大数据相关研究主要以日本、韩国两地为中心。由此可见,教育大数据发展水平与所在国家或地区经济发展水平、综合国力等密切相关。
图2 欧洲研究分布
图3 北美洲研究分布
图4 亚洲研究分布
本文统计了国外教育大数据相关文献涉及的研究领域,表1 是文献数量排名前8 的研究领域。由表1 数据可知,国外教育大数据相关文献研究方向主要集中在计算机科学与教育研究两大领域,除此之外,工程、社会、心理、通信、科学技术等相关领域也有涉及。由此可见,教育大数据是综合性较强的领域,需要融合多个相关学科领域开展跨学科研究。
表1 研究方向文献数量及比例
本文将文献信息导入CiteSpace,将时间跨度设为“2000-2018”,time slice 设为1,node type 选择Keyword,topN =10。最终得到了节点数为112,连线数为183,密度为0.029 4的研究关键词分析图谱(见图5) 。由图5 可知,教育大数据研究热点主要集中在“大数据”、“教育”、“云计算”、“学习分析”、“高等教育”、“数据挖掘”、“分布式计算”及“行为”等方面,且关键词联系紧密、分布集中,一些边缘化关键词出现次数相对较少且与核心概念关联度较低。这表明国外教育大数据相关研究热点较为集中,对“云计算”、“学习分析”、“数据挖掘”等教育大数据核心领域研究较为丰富,但缺乏对教育大数据新兴方向的深入探索。
图1 国外教育大数据关键词知识图谱
教育大数据理论研究主要包括教育大数据概念与内涵、应用价值与前景、未来挑战等。国外关于大数据的概念与构成并未达成一致,总体趋向于按数据量大小定义大数据。Daniel 等于2013 年提出了教育大数据构成的理论框架,该框架将大数据分为机构分析、信息技术分析、成绩分析以及学习分析。美国独立研究机构Brookings Institution[5]认为大数据预测与决策功能可在教育教学中得到良好应用。Aleksandra[6]等提出了教育领域中数据科学以及大数据与学习分析的总结性意义,认为可通过大数据技术构建高质量、多功能教育平台。AZ Bhat[7]等探索了在教育机构中大数据利用的各种可能性及其影响。一些学者从不同角度阐述了教育大数据未来所面对的挑战,包括研究人员与大数据分析从业者的培养与发展[8]、数据安全与隐私问题[9]、资金投入问题[10]等。
(1) 数据采集技术。如Edu-graph 从学习内容、学习活动、操作行为及学习者或教师参与数据等方面采集教育数据[12]。在数据采集方式上,一般通过在线学习环境自动采集、摄像头等检测设备获取、问卷等测量工具收集等形式
(2) 数据存储技术。数据存储一般运用关系型数据库与非关系型数据库[13]。随着数据类型与数据量变化,数据存储也出现多种技术,如Hadoop 技术、云存储技术等。但采用Hadoop 存在安全管理与数据分析等问题,有学者使用包括内容中心网络(CCN) 与软件定义网络(SDN) 在内的未来互联网模型,对研究与教育网络(REN) 上的大数据架构(Hadoop) 进行了改进,旨在提供高性能与可扩展的大数据分析技术[14]。此外,数据仓库也是教育大数据存储解决方案之一[15-16]。
(3) 数据挖掘技术。数据挖掘是对大数据实现关联化探索的过程,通过对教育大数据挖掘相关的算法、挖掘工具进行梳理如图6 所示。
(4) 数据可视化技术。数据可视化是从数据中挖掘相关信息,将其转为清晰、直接、有效的图形可视化模式,目前多采用动态数据可视化分析工具。
图6 教育大数据挖掘技术算法及工具
(1) 应用大数据技术对教育数据进行分析与预测,能够帮助教师实时诊断教学过程,不断改进教学模式与策略,促进新型教学模式的产生。
(2) 应用大数据技术开发自适应学习系统,实时记录学习者学习行为与路径,为其提供个性化学习资源、活动、路径、工具与服务等,实现个性化学习。
(3) 应用教育大数据改变了传统的基于经验的单一评价,使其走向基于数据的综合评价。
(4) 应用教育大数据技术采集与分析教育管理过程中教学活动、人员、学校等信息,及时发现教育系统中存在问题,为学校教育管理与决策工作提供科学数据支撑。
通过上述分析可对国际教育大数据形成如下判断: ①相关研究发展迅速;②研究地区集中于发达国家;③跨学科融合研究; ④研究内容覆盖面广,涵盖了理论、技术以及应用等多个方面。国际教育大数据发展对我国启示主要有:①相关部门应提高对教育大数据的重视程度,并加强对大数据发展的整体规划; ②加大教育大数据资金、人才投入,提供基本性条件保障; ③鼓励跨学科、跨领域合作,营造开放、融合的教育大数据发展氛围;④加快对教育大数据多方面的深入研究。