基于知识图谱的教育大数据研究热点与主题分析

2017-07-21 10:07王群利
中国医学教育技术 2017年4期
关键词:分析研究教育

王群利,王 慧

1陕西师范大学教育学院,西安 710062;2太康县第一高级中学,河南 周口 461400

基于知识图谱的教育大数据研究热点与主题分析

王群利1,王 慧2

1陕西师范大学教育学院,西安 710062;2太康县第一高级中学,河南 周口 461400

教育大数据已经成为当前教育领域研究的热点。文章以中国知网2013—2017年收录的与教育大数据有关的文献为研究对象,通过共词分析和聚类分析,探究我国教育大数据领域的研究热点与主题。研究发现,我国教育大数据的研究主要围绕着数据分析使用的技术手段、核心素养教育、在高校的应用研究、应用平台以及大学生创新思想教育这五个维度。据此提出自己的建议,以便为教育大数据的研究提供参考。

教育大数据;知识图谱;高频关键词;研究热点

微课程、翻转课堂、慕课、电子书包、创客教育等都是对教育变革的一种尝试,这些教育变革的实验都离不开数据。类似的教学改革都围绕一个主题,即为学生提供学习资源,并在学生学习的过程中收集与学习有关的数据,然后分析应用这些数据,最后为他们提供评价与反馈,可以说当前的教育变革都离不开基于数据的教与学[1]。在维克托·迈尔舍恩伯格等合著的《与大数据同行:学习和教育的未来》一书中谈到大数据正进入教育的方方面面,将为教育带来变革。教育大数据是教育中大数据的产物,是具有潜在价值的数据集合。国内学者杨现民利用Cite Space知识图谱对教育大数据进行可视化分析,探测自教育数据应用以来教育大数据的发展状况[2]。目前,国内有关教育大数据的研究成果并不多。该研究采用社会网络和聚类分析等可视化分析方法,探索国内教育大数据的发展状况,分析其研究热点及研究主题,以期为其他研究者提供参考。

1 研究设计

1.1 研究方法

该研究主要采用基于共词分析和知识图谱分析法对文献进行可视化的统计与分析,得出研究热点与发展趋势。知识图谱是反映知识发展进程与结构关系的一系列不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系[3]。共词分析法是通过对所选该学科领域的文献中关键词出现在同一篇文章中的现象进行分析,进而判断学科领域中主题间的关系,从而展现该学科的研究结构[4]。

1.2 数据来源

该研究以中国知网的核心期刊和CSSCI期刊为数据来源,以篇名为条件,以大数据&教育、教学资源&大数据、教育大数据为关键词进行检索,检索时间限定在2013—2017年(具体日期是2017年3月2日),共检索到与教育大数据有关的文献210篇,除去会议征稿通知、卷首语等与主题无关的文献后,共得到有效文献199篇,即以这199篇文献作为该研究的数据。该研究借助Bicomb、Ucinet及SPSS 21.0软件完成对样本数据的分析。

2 研究结果与分析

2.1 文献发表时间分析

该领域内文献发表数量的增速可反映该领域学者对此的关注度。由图1可知,文献发表的数量随着时间一起在增长。2013年教育大数据开始慢慢兴起,在此期间关于教育大数据的文献还不多,只有13篇。其后开始掀起教育大数据的热潮,2015年可以明显看出关于此类的文章数量涨势迅猛,从2014年的25篇增加到2015年的60篇,这说明教育大数据在国内已经逐渐得到关注。总体说来这一现象与政府的关注、互联网的发展是密不可分的。由图1可知在2017年的前两个月,已有文献12篇,是2016年的12.6%,由于期刊文章被中国知网收录的时间存在滞后性,可能有一部分文献已经在纸质版发表,这在一定程度上对该次检索的结果有所影响[5]。但可预测的是2017年的教育大数据的文献数量应呈现上升的趋势。

2.2 发文作者机构与发文数量分析

通过对某一研究领域作者的发文规律及其数量关系进行分析,可以确定该领域的核心作者群与重要作者,有利于学术交流及发展[6]。为了清楚显示教育大数据研究学者的情况,接下来从发文作者的机构与发文量进行分析。

2.2.1 发文作者机构分析 对作者机构的分析,可了解教育大数据研究团体或机构的状况。由图2可知,发文量在3篇以上的有14所院校,在作者所属单位中师范类和综合类大学所占比重基本均衡。由图2可知华东师范大学以17篇的发文量位居第一,可以看出华东师范大学对教育大数据给予了极大的关注。2017年3月20日华东师范大学举办了“教育大数据应用技术”国际学术研讨会,通过对教育大数据技术的教育研究实践的运用,极大地促进了大数据在教育改革中的运用。戴尔曾与华东师范大学签署合作备忘录,共同创建“互联校园”,以期推动教育信息化技术的发展应用以及人才培养。在综合类大学中,以西南大学、电子科技大学、中国人民大学是教育大数据研究的重要力量。其中,2014年电子科技大学成立学校大数据研究中心,2015年电子科技大学与国家信息中心合作共建大数据研究中心,这对促进教育大数据的研究具有较强的推动作用。

图1 文献发表时间

图2 作者发文机构分析

2.2.2 作者发文量分析 通过对发文作者的分析可以看出其在该领域的研究兴趣及研究水平。该研究文献共有作者361名,由于作者数量众多,该研究只对第一作者进行了统计,其中第一作者有204名。发表3篇以上的作者有2位,占总作者数的2.94%;发2篇论文的作者有11位,占总作者数的11.82%;发表1篇论文的作者有346位,占总作者数的85.24%。通过对发文作者的分析可知对教育大数据的研究尚未形成统一的团体,研究力量相对来说较分散。电子科技大学的李怀杰以电子科技大学大数据研究中心为依托进行了创新性实践,进而探索出了运用大数据技术提升高校思想政治教育实效性的新路径和新模式[7];重庆广播电视大学的吴南中对基于教育大数据的MOOC支持服务特质与形成进行了研究,他认为教育大数据改善MOOC支持服务,是解决MOOC学习过程中学习支持服务乏力的有效手段[8]。

2.3 关键词词频分析

高频关键词可以对某一领域关注的热点进行反映。特定研究领域一段时间内大量研究成果的关键词集合,有助于了解该领域的研究热点和未来的前沿趋势等[9]。该研究通过Bicomb软件对关键词进行统计,并合并相同意义的关键词(学习分析与学习分析技术),统计出关键词有773个。根据1973年由Donohue提出的高频词界分公式(其中I1为关键词的总数),得T=38.822,阈值为39,符合此条件的关键词只有大数据(119),很明显大数据这一关键词并不能反映出教育大数据的研究方向,之所以有这种现象出现可能跟所选期刊有关,由于是核心期刊,载文量少;其次可能是广大学者的关注度尚且不够。

该研究选取关键词词频大于等于3(30个)的词频作为该次研究的高频关键词,在一定程度上反映了教育大数据的研究热点。高频词具体情况如表1所示。由表1可知,前10个高频词分别为大数据(119)、高校思想政治教育(30)、大数据时代(25)、教育大数据(15)、教育变革(13))、高等教育(12)、学习分析(8)、数据素养(7)、创新(7)、教育变革(7)。由表1可知大数据时代、数据素养、教育变革等是由教育大数据衍生出来的相关概念。由此可知关于教育大数据的研究并非单一的,而是建立在大数据时代、教育变革之上的。高校思想政治教育、高等教育、高校图书馆、MOOC、网络思想政治教育表明了高校是教育大数据应用的核心领域,学习分析和数据挖掘是教育大数据应用的主要技术手段。

表1 教育大数据高频关键词词表

2.4 社会网络分析

高频关键词并不能真实地反映出网络环境下学习动机的研究热点,关键词之间的关系也是研究重点[10]。首先利用Bicomb软件对选择的高频关键词进行矩阵分析,建立共现矩阵如表2所示,表中行列交叉处为两个关键词在同一篇文献中出现的次数。

表2 高频关键词共现矩阵(部分)

在词频分析的基础上,借助Ucinet社会网络分析软件对高频关键词进行可视化分析,形成高频词社会网络图谱,如图3所示。

图3中的正方形点代表高频关键词节点,节点的大小以及节点与节点之间连接线的粗细都对节点在该网络图谱中的作用大小息息相关。由图3所示:从节点的大小来看,图中最大的节点就是大数据,其次是大数据时代、高等教育、学习分析等,随着互联网、物联网、移动智能终端和云计算的迅猛发展,人类时刻都在产生巨量数据,这也宣示着人类已经进入大数据时代[11],大数据为教育大数据的开展奠定了基础。这些关键词与其他关键词之间的联系较紧密,说明它们是教育大数据的研究热点。

从节点之间的连线看,每个节点与其他关键词都有直接或间接的联系,与大数据联系紧密的关键词有高校思想政治教育、高等教育、在线教育等,这说明高校和网络教育是教育大数据的出发点,思想政治教育是教育大数据模式的新起点,学习分析和数据挖掘是教育大数据应用的一项重要的新兴技术,为数据分析提供了可能。大数据时代的到来引起了教育领域的一场变革。

2.5 高频关键词聚类分析

高频关键词聚类分析是将密切的关键词聚在一起形成类团,使团内的相似性最大,类团间的相似性最小[12]。将Bicomb产生的关键词共词矩阵导入到SPSS 21.0中进行聚类分析,得到的聚类图如图4所示。依据聚类图的关系将研究主题分为五部分。

主题一涉及核心素养教育,包括数据素养、信息素养、数据素养教育、高校图书馆四个关键词。由于大数据时代的来临,能够辩证、科学、正确地认识和识别数据的价值,进而可以操作、管理、分析和应用数据将成为大数据环境下人们的必备素养之一[13],同时也是为了适应大数据环境所应具备的能力。数据素养和信息素养教育是目前教育领域的研究热点,而数据素养和信息素养则是为高校图书馆服务,具备这些能力可以更好地应对大数据。

主题二涉及教育大数据中的评价与决策方式研究,教育大数据重在对多维、大量数据的深度挖掘与科学分析以寻求数据背后的隐含关系与价值[14],为教育评价提供全方位及程序化的依据。基于数据的教育决策这一教育技术领域的研究传统获得了新的发展机会[15],逐渐成为教育数据中的研究热点。

图4 高频关键词聚类分析图

主题三涉及高等教育中的教育发展,包括信息技术、高等教育、教育发展、教育管理四个关键词。高校采取何种管理方式去应对数据的泛滥,促进教育更好的发展是广大学者关注的焦点。

主题四涉及在线教育与技术,包括在线教育、MOOC、数据挖掘和学习分析等关键词。MOOC、在线教育、网络思想政治教育等网络教育是教育大数据产生的根源,教育大数据最终都会促进教育的改革与创新。学习分析和数据挖掘是教育研究在数据分析中使用的主要方法,被应用于教育系统的各个层面[16]。

主题五涉及大学生创新思想教育,包括高校思想政治教育、大学生、创新和大数据时代四个关键词。大数据时代是将数据视为核心要素的时代,人类的思想行为在其中是高度数据化的。大数据技术引发了思想政治教育学科的深刻变革[17],大学生在大数据的时代也许会迷失自己、放纵自己等,产生不好的影响,所以应加强大学生的思想政治教育。

3 结论与反思

通过对高频关键词的社会网络关系和聚类分析,可以看出教育大数据的研究热点、主题以及未来的发展趋势。综上所述,关于教育大数据未来的发展主要集中在以下几个方面:①教育大数据使用技术手段的研究,仍是未来几年关注的焦点;②教育大数据在高校的应用研究,该主题关注度很高,未来仍是研究的主要方向;③教育大数据在MOOC、在线学习等网络教育,也是未来教育大数据研究的趋势。但另一方面,大数据时代数据的泛滥,关于数据隐私如何保护、如何保证教育大数据的公平性是需要我们进一步研究的问题。

[1]肖玉敏.大数据来了,教育如何站立[N].中国教育报,2015-03-23(006)

[2]王娟,陈世超,王林丽,等.基于CiteSpace的教育大数据研究热点与趋势分析[J].现代教育技术,2016(2):5-13

[3]秦长江,侯汉清.知识图谱—信息管理与知识管理的新领域[J].大学图书馆学报,2009(1):30-37,96

[4]庞恩旭.我国核心期刊的现状分析与研究[J].图书馆论坛,2004(2):15-17

[5]李鹏飞,张宝辉.中国创客教育研究热点与趋势分析—基于词频分析与共词可视化方法[J].数字教育,2016(3):20-25

[6]邱均平.改革开放30年来我国情报学研究的回顾与展望(二)[J].图书情报研究,2009(2):8-9

[7]李怀杰,夏虎.大数据时代高校思想政治教育模式创新探究[J].思想教育研究,2015(5):48-51

[8]吴南中.基于教育大数据的MOOC支持服务特质与形成研究[J].中国远程教育,2015(12):49-55,79-80

[9]侯海燕.基于知识图谱的国际科学计量学研究前沿计量分析[J].科研管理,2009(1):164-165

[10]孙诚,姜泽许.校企合作共建实训基地研究热点—基于CNKI核心期刊的共词聚类分析[J].中国远程教育,2015(11):72-76

[11]张明海,周艳红.大数据时代大学生数据素养教育的目标定位及体系构建[J].图书馆,2016(10):84-88

[12]王敏,郭文斌.我国近十年情绪调节研究热点知识图谱[J].心理研究,2011(5):56-59

[13]邱庆东.大数据环境下的图书馆员角色定位与创新服务研究[J].图书与情报,2015(6):119-121

[14]郑燕林,柳海民.大数据在美国教育评价中的应用路径分析[J].中国电化教育,2015(7):25-31

[15]顾小清,薛耀锋,孙妍妍.大数据时代的教育决策研究:数据的力量与模拟的优势[J].中国电化教育,2016(1):56-62

[16]吴青,罗儒国.学习分析:从源起到实践与研究[J].开放教育研究,2015(1):71-79

[17]徐亮.挑战与创新:大数据在高校思想政治教育工作中的运用[J].理论导刊,2016(9):96-98,107

《中国医学教育技术》2017年度刊载重点

1、教育技术理论研究:基于大数据、云计算的学习分析研究与评价;基于互联网的混合学习模式研究与评价;

2、基于微信的移动学习教学实践(包括医学教育、住院医师培训、全科医师培训等);

3、翻转课堂教学研究与评价;

4、数字医学应用研究与评价;

5、虚拟现实、增强现实、机器人、创客等在教育领域的应用研究;

6、智慧教育、智慧医疗环境建设与应用研究;

7、职业教育中基于项目驱动、产教结合等的相关研究;

8、教学资源建设:关于微课、MOOC、SPOC、教育游戏、虚拟资源的开发与应用研究;

9、虚拟现实教学平台开发与应用;网络学习空间设计与应用,等;

10、临床教学与基础教学。

《中国医学教育技术》杂志编辑部唯一的投稿信箱:cmet@mail.xjtu.edu.cn

联系电话:029-82655088

《中国医学教育技术》编辑部

Analysis of hot spots and hot topics of big data in education based on know ledgemap

Wang Qunli1,Wang Hui2

1School of Education,Shaanxi Normal University,Xi'an 710062;2The First High School of Taikang County,Zhoukou 461400,China

Big data in education has become a hot topic in the field of education at present.Taking the literature from 2013 to 2017 related to big data in education in CNKIas the research object,making co-word analysis and cluster analysis,we explored the hot spots and topics of big data in China’s education.The results show that the research on big data in China’s education mainly concerns the five dimensions as follows:technologicalmeans used in data analysis,core literacy education,applied research at colleges and universities,application platform,and college students'innovation education.Finally,the paper proposes some suggestions in order to provide reference for research on big data in education.

big data in education;knowledgemap;high frequency keyword;hot research spot

G40-057

:A

:1004-5287(2017)04-0367-05

:10.13566/j.cnki.cmet.cn61-1317/g4.201704003

2017-05-21

王群利(1992-),女,河南太康人,硕士研究生在读,主要研究方向:学习科学。

猜你喜欢
分析研究教育
国外教育奇趣
FMS与YBT相关性的实证研究
题解教育『三问』
辽代千人邑研究述论
隐蔽失效适航要求符合性验证分析
视错觉在平面设计中的应用与研究
教育有道——关于闽派教育的一点思考
EMA伺服控制系统研究
电力系统不平衡分析
办好人民满意的首都教育