◆马卉 王晓春 张功云
基于知识图谱的国内学习分析研究热点及趋势分析*
◆马卉 王晓春 张功云
学习分析,作为一个新兴的交叉研究领域,受到国内外教育研究者的广泛关注,成为当前教育技术领域的研究热点。为探究国内学习分析技术的研究热点和发展趋势,基于科学知识图谱的基本理论与方法,利用可视化网络分析软件CiteSpace对中国期刊全文数据库中收录的144篇国内学习分析文献样本的关键词进行分析。
学习分析;知识图谱;可视化分析;CiteSpace;关键词分析
随着教育大数据的迅猛增长,学习分析(Learning Analytics)[1]作为一种新兴的交叉技术,通过深度挖掘、分析学习者学习行为和学习过程数据背后所隐藏的含义,得出有效的结论来指导和干预教学、优化学习和学习环境,更好地为教育决策和学生学习提供服务[2]。由于学习分析技术的这种实际应用价值,使其受到国内外教育研究者的广泛关注,成为教育信息化领域研究的热点问题之一。
2010年,加拿大阿塞巴斯卡大学G.Siemens教授[3]在博客中宣布将于2011年2月举办第一届学习分析国际会议并解释何为学习分析,由此拉开学习分析技术领域形成的序幕。2011年,美国新媒体联盟公布的地平线报告[4]把学习分析技术列为未来4~5年被广泛应用的技术。2012年,Educational Technology & Society[5]出版了10篇关于学习与知识分析的系列专题论文。2013年,由国际知名学者组成的、经过法律批准的学习分析技术研究学会(SOLAR)[6]正式成立,并于同年开始举办学习分析暑期学院。2014年,《学习分析》杂志[7]正式出版第一卷第一期,学习分析技术在国际上不断壮大与发展。
从2012年开始,国内也掀起了学习分析技术的研究热潮,并出现一些有关学习分析综述的文章:顾小清等[8]分析了学习分析技术的前世今生、关键技术以及应用趋势;李青等[9]总结了学习分析技术的技术来源、方法和工具;吴青等[10]介绍了学习分析的源起、主要研究内容、实现技术与应用等;王良周等[11]从大数据视角分析了学习分析的相关概念,综述了学习分析的框架、技术和应用;等等。但这些综述多以介绍国外的学习分析技术为主,对国内发展情况的介绍相对较少,而且这些综述以人工梳理为主。
为了更全面、完整地把握国内学习分析技术的研究热点和发展脉络,本文利用科学知识图谱技术,对中国期刊全文数据库(CNKI)中的学习分析相关文献进行可视化分析。
数据来源 中国知网(China National Knowledge Infrastructure,CNKI)的中国期刊全文数据库是目前世界上最大的连续动态更新的数据库(每日更新),收录的期刊文献全面且质量较高[12],能够较为全面地反映国内学术研究情况,故本研究选其作为数据来源。在检索时,以“学习分析技术”“学习分析”或“Learning Analytics”为检索词,在篇名和关键词中进行精确检索(时间跨度为2010—2015年,检索时间为2016年5月20日),共获得191篇文献。为了保证研究的准确性,在此基础上剔除重复、主题不相关或相关度小的文献,最终选择144篇作为有效文献。
*项目来源:本文受到北京市教育科学“十二五”规划重点课题“基础教育学校课堂教学实验研究”(基金编号:ABA150008)、北京市教育委员会科技计划面上项目“移动终端授课环境下学生行为的实时分析与可视化技术”(基金编号:KM201410028018)资助。作者:马卉、张功云,首都师范大学教育技术系,研究方向为教育信息化绩效技术;王晓春,博士,首都师范大学教育技术系硕士生导师,研究方向为教育信息化绩效技术(100048)。
研究方法与工具 本文的研究和分析是以科学知识图谱为基础,以采集到的144篇国内学习分析研究文献为对象,通过关键词分析,借助关键词共现图谱和关键词时序图谱来探究该领域的研究热点以及主题演化趋势。
美国费城德雷克赛尔大学陈超美博士开发的信息可视化软件CiteSpace是一种知识图谱可视化工具,包含了关键词共现分析等多种功能[13],能够满足本文的可视化分析需求,因此被选为本文的研究工具,在本文出现的各种知识图谱都是借助CiteSpace 3.8.R6绘制的。
关键词共现分析 虽然关键词在一篇文章中所占的篇幅不大,却是作者对于文章核心的概括和精炼,是一篇文章的精髓,因此,常用高频关键词来探测某领域的研究热点[14]。本文以关键词(剔除了检索词“学习分析”“学习分析技术”和“Learning Analytics”)为节点,设置Top N per slice为30,Threshold Interpolation为{(2,2,30),(4,3,20),(4,3,20)},采用最小生成树法(Minimum Spanning Tree),绘制关键词共现网络图谱,共得到98个节点,88条连线,结果如图1所示。
图1 国内学习分析研究关键词共现图谱(2010—2015年)
如图1所示,图谱中的节点大小代表关键词频度,节点越大,说明该节点对应关键词出现的频次越高;内部不同年轮的颜色代表出现的相应年份,年轮越多说明研究时间跨度越长,年轮越厚说明该关键词在当年的研究热度越高。外部年轮为紫色的节点,与其他节点相比,具有高中介中心性。中介中心性高的节点,对其他节点之间的联系起到控制作用,反映了其在整个网络中的重要地位[14],说明此节点代表的关键词主题性强。为了突出重点,图中显示了频次≥3的关键词。
由图1中节点大小可知,关键词大数据出现的频次最高,其次是数据挖掘、个性化学习、教育数据挖掘、在线学习、社会网络分析等,这说明它们具有学习分析领域最高的研究热度。由图谱还可以发现,数据挖掘、大数据、个性化学习等关键词对应的节点外部年轮为紫色,这表明它们具有高中介中心性,但依据关键词对应的节点在图谱所处的位置不难发现,数据挖掘的中介中心性高于大数据。这说明与大数据相比,数据挖掘虽然中介中心性高,主题性强,但没有大数据受到的关注度高,这与大数据研究在当前学习分析研究领域中的研究热度有关。同时,这也说明关键词出现的频次与其中介中心性两者之间并不一定严格呈正相关,关键词的中介中心性并不一定随着其出现频次的增加而增长。
为进一步探究学习分析领域内关键词频次与中介中心性的关系,从而反映出学习分析的当前研究热点和主题性,在对图1知识图谱进行宏观分析的基础上,对关键词的频次和中介中心性进行二次统计,结果如表1所示。对比表中关键词的频次和其相应的中介中心性发现,关键词数据挖掘出现的频次为20,低于大数据的24,但数据挖掘的中介中心性为0.43,高于大数据的0.36,因此,大数据具有更高的热度,这与从图谱中观察到的结果一致。
表1 关键词频次及其中介中心性对照表(频次≥3)
同理,通过对比关键词频次排名和其中介中心性排名可知,大数据、教育数据挖掘、在线学习、社会网络分析、智慧教育、教育大数据、MOOCs等关键词相对于主题性而言,都表现出更高的研究热度。
通过对图1和表1中学习分析高频关键词的语义关系做进一步分析发现,教育大数据是大数据的下位词,教育数据挖掘是数据挖掘的下位词。在学习分析研究中,大数据往往特指教育大数据,数据挖掘也往往特指教育数据挖掘,二者既是独立研究领域,又是学习分析的技术支撑基础,成为除学习分析和学习分析技术之外出现频次最多的关键词,而且具有较高的中介中心性。个性化学习、智慧教育、智慧学习是学习分析技术的研究目的,个性化学习研究有着悠久的历史,智慧教育、智慧学习是近几年的研究热点,它们与学习分析技术相互促进、相互发展。学习过程,作为学习分析技术的主要研究对象,在国内学习分析研究中也是备受关注。MOOCs和MOOC是同义词,二者是在线学习的下位词,在线学习又是在线教育的下位词,从而反映出学习分析的实际应用主要集中在在线教育领域。特别是MOOC的迅速发展为学习分析提供了大量的真实数据[15],成为当前学习分析应用的主要实践基地。
社会网络分析[16]作为一种新的分析方法,被应用于学习分析领域,不仅可以将学习者个体作为研究对象,通过社会网络分析算法分析学习者在学习群体中的活跃程度、影响力、与同伴的交互状况等,还可以将学习网络作为研究对象,发现和分析学习社群,关注群体学习过程中的信息产生及流动,成为当前学习分析技术的研究热点。
关键词时序分析 为考察国内学习分析研究主题的变化趋势,借助CiteSpace软件绘制国内学习分析研究的高频关键词时序图谱(频次≥3),具体如图2所示。为便于分析,本文将学习分析技术的研究分为2012年、2013—2014年和2015年三个阶段。
2012年标志着国内学习分析研究的起步,其研究论文的核心关键词为大数据、数据挖掘,它们主题性强,说明二者是国内学习分析技术的研究基础;通过对相关论文的研读分析发现,这一年的研究以理论研究、总结和吸收国外学习分析思想为主。而另外三个重要关键词为学习行为、学习过程和个性化学习,分别代表学习分析技术的数据来源、分析内容和主要目标,充分体现了学习分析技术研究的内涵。
2013—2014年,学习分析技术开始向细粒度的学习分析主题发展,研究内容由理论研究转向实际应用层面。在这一阶段,2012年的核心关键词——大数据和数据挖掘演化为教育大数据、教育数据以及教育数据挖掘,充分体现了研究者对学习分析领域的进一步思考和定位。在此阶段,学习分析逐渐被应用于MOOC、MOOCs、电子书包等实际应用中,由此表明此阶段学习分析的应用与实践主要集中于在线教育领域。此外,该阶段学习分析技术研究的目的是实现智慧教育,并开始关注学习分析中的关键技术。
2015年,国内学习分析的研究目的从2013—2014年的智慧教育向智慧学习和教学设计等更细粒度聚焦,并开始注重学习环境优化、教学优化和学习优化;同时该阶段的研究也不再停留于对学习者学习行为数据的浅层分析,而是引入社会网络分析等先进模型对各种数据背后所隐藏的含义进行深度分析,并结合智慧学习实现学习优化和环境优化。
从2012—2015年的研究主题变化趋势来看,首先,未来几年的学习分析技术研究将更加细化,与学习分析相关的具体应用分析、经验和案例分析将成为热点;其次,在技术方面,社会网络分析与学习分析技术的结合研究才刚刚起步,因此,基于社会网络分析或基于各种先进算法与模型的学习分析研究也将会是近期的研究热点;最后,依据G.Siemens教授[17]的分析,学习分析学与机器学习、教育数据挖掘、统计学、学习科学、学习心理学等领域密切相关,特别是随着具体应用的展开,学习科学、学习心理学与学习分析的结合研究也将成为近期国内的研究热点。
本研究在中国期刊全文数据库中,选择以2010—2015
图2 国内学习分析研究高频关键词时序图谱
年为发表时间,以“学习分析”“学习分析技术”“Learning Analytics”为检索词在篇名和关键词中进行精确检索,收集文献样本,借助CiteSpace III的可视化分析功能,从文献计量学的角度以知识图谱的方式展现国内学习分析领域的研究热点和主题演化趋势,得出以下结论。
1)通过对研究热点及研究主题的演化分析发现,学习分析技术经历了从理论到实践、从总体框架到细节的研究发展过程。其中学习分析技术的研究基础是大数据、数据挖掘,当前的主要应用领域是MOOC等在线教育领域,应用目的从开始的个性化学习向智慧学习、教学设计等具体目标转变,研究内容也从关键技术概述向社会网络分析等具体模型的应用方向发展。
2)依据应用研究的科学发展规律,学习分析技术的研究将更加细化,注重与实际应用的结合;技术方面注重社会网络分析等新技术的引入与利用;从G.Siemens教授的分析来看,学习科学、学习心理学与学习分析的结合研究也将成为近期国内的研究热点。
[1]Greller W, Drachsler H. Translating Learning into Numbers: A Generic Framework for Learning Analytics[J].Educational technology & society,2012,15(3):42-57.
[2]Ferguson R. Learning analytics: drivers, developments and challenges[J].International Journal of Technology Enhanced Learning,2012,4(5-6):304-317.
[3]Siemens G. What Are Learning Analytics?[DB/OL].[2016-05-20].http://www.elearnspace.org/blog/2010/08/25/what-arelearning-analytics.
[4]The Horizon Report 2011 edition[DB/OL].[2016-05-20]. https://library.educause.edu/resources/2011/2/2011-horizon-report.[5]Journal of Educational Technology & society[DB/OL]. http://www.ifets.info/issues.php?id=56.
[6]Society for Learning Analytics Research (SoLAR)[DB/OL].[2016-03-10].https://solaresearch.org.
[7]Journal of Learning Analytics[DB/OL].[2016-03-10]. http://epress.lib.uts.edu.au/journals/index.php/JLA/index.
[8]顾小清,张进良,蔡慧英.学习分析:正在浮现中的数据技术[J].远程教育杂志,2012(1):18-25.
[9]李青,王涛.学习分析技术研究与应用现状述评[J].中国电化教育,2012(8):129-133.
[10]吴青,罗儒国.学习分析:从源起到实践与研究[J].开放教育研究,2015(1):71-79.
[11]王良周,于卫红.大数据视角下的学习分析综述[J].中国远程教育,2015(3):31-37.
[12]中国期刊全文数据库:简介[DB/OL].[2016-05-20]. http://www.cnki.net/jianjie/jj1.htm.
[13]Chen C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientifi c literature[J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.
[14]刘泽渊,陈悦,侯海燕.科学知识图谱方法与应用[M].北京:人民出版社,2008.
[15]Milligan S. Crowd-sourced learning in MOOCs: learning analytics meets measurement theory[C]//Proceedings of the Fifth International Conference on Learning Analytics And Knowledge. ACM,2015: 151-155.
[16]Cela K L, Sicilia M Á, Sánchez S. Social network analysis in e-learning environments: A Preliminary systematic review[J]. Educational Psychology Review,2015,27(1):219-246.
[17]Siemens G. Learning analytics: envisioning a research discipline and a domain of practice[C]//Proceedings of the 2nd International Conference on Learning Analytics and Knowledge. ACM,2012:4-8.
Research Hotspots and Trend Analysis of Learning Analytics in China based on Mapping Knowledge Domain
MA Hui, WANG Xiaochun, ZHANG Gongyun
Learning analytics, as a new intersectant research field,has attracted wide attention among educational researchers and is becoming a current research focus in educational technology fi eld. To explore the research hotspots and the development trend on Learning Analytics in China, based on the basic theory and method of mapping knowledge domain, analyze keywords from 144 pieces sample literatures within Chinese Journal Full-Text Database(CJFD)with a visibility network analysis software, CiteSpace.
learning analytics; mapping knowledge domain; visual analysis; CiteSpace; keywords analysis
G652
B
1671-489X(2016)18-0001-04
10.3969/j.issn.1671-489X.2016.18.001