基于共词网络的教育信息化热点主题识别与发展态势研究*

2024-02-27 12:43石道元
关键词:共词聚类矩阵

石道元

(重庆工商大学 会计学院,重庆 400067)

一、引言

以教育信息化带动教育现代化,是推进我国教育事业改革发展的重大战略抉择。2010年7月,国务院颁布《国家中长期教育改革和发展规划纲要(2010—2020年)》(以下简称《纲要》),《纲要》明确指出“加快教育信息化进程”“把教育信息化纳入国家信息化发展整体战略”。为推进《纲要》对教育信息化建设的总体部署和发展任务,2012年3月教育部发布了《教育信息化十年发展规划(2011—2020年)》纲领性文件(以下简称《规划》)。因此,非常有必要梳理一下近年来我国教育信息化领域热点主题及发展态势。

科学文献是科学研究成果的主要载体、科学知识传播的主要媒介,而关键词是科学文献核心内容的高度凝练体现。因此,利用教育信息化领域文献集合中关键词共词分析,可以揭示教育信息化领域研究热点、主题结构及发展动态[1]。这些年来,很多学者运用多种共词聚类技术从不同的视角、对象、年限对我国教育信息化研究主题热点、趋势进行了充分研究[2][3][4],并取得了丰硕的成果。在传统主题挖掘分析过程中,各关键词均被视为独立属性变量。科学文献体系中,各文献知识元间交叉链接,共同构成了节点丰富、交错纵横的知识网络系统,如关键词之间的共现构成了共词网络。从网络分析的视角来看,关键词是共词网络中的知识节点,它们之间的“共现关系”不是单个关键词所拥有的属性,而是共词网络系统的属性。因此,基于常规统计手段(如SPSS等)属性变量分析并不适合分析共词网络关系数据,其研究结果的正确性也有待考证[5]。共词网络数据存在网络各节点之间,表征着节点间关联、接触、联络及群体依附等关系,适用于分析共词关系数据的方法是网络分析[6]。基于此,本文尝试拓展网络分析理论并将其应用于教育信息化领域知识结构的探测,以揭示我国教育信息化热点主题,进而探讨其发展态势。

二、研究设计

(一)数据处理

本文研究数据处理包括数据采集、关键词清理、高频关键词筛选和共词矩阵构建四个环节。

1.数据采集

我国的教育信息化最初以“电化教育”形式参与教育教学改革,先后经历了电化教育、教育信息化、智慧教育等几个发展阶段[7][8]。按文献内容的学科属性和特征,《中国图书馆分类法》将“教育信息化”主题文献归属于“G43电化教育”,且下属划分有“G431视听教学(电化教学)”“G432广播、电视教学”“G433程序教学”“G434计算机化教学”“G436电化教材”等。本研究数据来源于CSSCI数据库刊载教育信息化研究文献,限定检索条件为“中图分类号=G43电化教育”,期刊年限为“2010— ”,检索日期为“2020年5月3日”,共返回相关文献7 600篇。

2.关键词清理

由于部分文献中关键词命名存在不规范情况,在不影响分析结论的前提下,本文采取了相应规范化处理:① 同义、近义关键词合并处理,如以统一的替代词“慕课”替换不同表达形式的关键词“MOOCs”“MOOC”,等等;② 专指性不强,含义过于宽泛的关键词删除处理,如“影响因素”“策略”等。经过上述处理后,将7 600篇文献题录信息导入BibExcel进行关键词词频统计,共得关键词13 095个,累计频次31 226次,平均每篇文献关键词4.11个。

3.高频关键词筛选

关键词的频次是衡量其表征研究热点的能力和重要程度的重要指标。从表1可看出,词频大于等于40的关键词有64个,累计频次总占比17.51%;慕课、教育信息化、信息技术、翻转课堂、人工智能、学习分析、教学设计、大数据等是时域内教育信息化研究热点,也是本文研究分析的对象。

表1 高频关键词统计

4.共词矩阵构建

利用BibExcel统计高频关键词在文献集合中共同出现的频率,构建64×64的共词矩阵Aij,如表2所示。

表2 高频关键词共词矩阵(部分)

(二)研究方法

本研究主要采用共词分析、社会网络分析和战略坐标分析相结合的研究方法,这样能更客观准确地描述和分析我国教育信息化热点主题结构及发展态势。

1.共词分析法

共词分析作为一种文献内容分析方法,起源于20世纪70年代,并由Callon、Courtial将该方法引入文献情报学领域[9]。当两个能表达某学科领域的主题关键词共同出现在一篇文献中时,则表明这两个词之间存在一定的相关关系[10]。关键词共现频数越多,它们之间关系越紧密,主题也就越相近。关键词的共词关系可以用共词矩阵表示(参见表2),共词矩阵除可直观展示关键词之间的关系距离外,共词矩阵还是开展共词网络分析的前提和基础。

2.社会网络分析法

社会网络分析起源于矩阵论和图论,发端于20世纪30年代的英国人类学研究,旨在对社会行动者关系与结构进行分析。近年来,社会网络分析的思想和方法逐渐渗透到自然科学和社会科学诸多研究领域,形成了一门相对独立的网络科学[11]。作为一种结构主义视角下的量化分析方法,社会网络分析一方面可揭示知识网络的属性特征,如网络节点中心性等;另一方面还可定量描述网络社群关系结构,如根据知识节点在网络结构层面上的对等关系进行主题聚类等。

3.战略坐标分析法

1988年,Law等人提出通过绘制战略坐标图的方法来展现研究领域内部关系及该领域与其他领域间相互影响的情况[12]。战略坐标图常被用来描述分析主题聚类的发展态势[13][14]。战略坐标图是以主题聚类内部强度指标“密度”为纵坐标,以聚类间联系强度指标“向心度”为横坐标,以横纵坐标平均数(或中位数)为坐标原点的二维四象限坐标分布图。在战略坐标图中,向心度指标反映了一个主题与其他主题的联结能力,向心度越大,说明该主题与其他研究主题联系越频繁,在整个研究领域中趋于核心地位;密度指标则反映了一个主题聚类的内部聚合能力,密度指标越大,主题内部结构就越稳定,表明该主题研究发展越成熟[15]。

三、研究结果分析

(一)我国教育信息化研究热点分析

在社会网络分析中,最常使用的数据处理对象是二值邻接矩阵,即矩阵中的行和列都代表完全相同的行动者,且排列的顺序相同。将原始矩阵Aij转换成二值矩阵Bij的转换方法为:计算Aij所有数据平均值(0.898 3),设定共词频数临界值为“1”,当小于临界值时取值为“0”,反之取值为“1”。将二值矩阵Bij导入Ucinet,可视化结果如图1所示。

图1是一个二元无向关系网络,共包含64个关键词节点、1 532条关系连线。借助共词网络社群图,一方面可以“透视”共词网络中各关键词节点位置及节点间的互动,另一方面还可通过点度中心度、中间中心度和接近中心度等中心性指标精确度量节点在网络中的地位和影响力。

1.点度中心度(Degree)

某点的点度中心度就是该点与其他节点直接关联数。对于一个拥有n个节点的无向图,节点i的点度中心度是i与其他n-1个节点的直接联系总数,其计算公式为:

如果一个点与其他很多点直接相连,就说明该点具有较高的点度中心度,表明该节点居于中心地位。

2.中间中心度(Betweenness)

中间中心度是以经过某个节点的最短路径数量来表征节点重要性的指标[16]。节点中间中心度愈大,就愈凸显该节点的中介作用和核心地位。假设gjk是节点j到节点k的捷径数,点i的中间中心度是节点i处于所有点对的中间度之和,中间中心度的计算公式为:

3.接近中心度(Closeness)

接近中心度测度的是该点与图中所有其他点的捷径距离之和,关注的是节点与网络中其他所有节点的接近性程度。假设dij是节点i到节点j的捷径距离,接近中心度的计算公式为:

表3列示了各高频关键词节点中心性计算结果及排序。

表3 高频关键词节点中心性指标

一个高中心度的节点,会在网络中拥有更多的资源,并占据着网络中的特殊位置,而低中心度的节点一般位于网络的边缘,在关系的形成过程中是不活跃的[17]。结合图1、表3发现,慕课、教育信息化、人工智能、教学设计、教学模式、深度学习、学习分析、信息技术、翻转课堂、在线学习等关键词具有较高的点度中心度、中介中心度和较低的接近中心度,具有较高的影响力,居于网络中心地位;大学生、网络教学、教育技术学、混合式教学、教育应用等关键词则以较低的点度中心度、中介中心度和较高的接近中心度处在网络边缘位置。另外,较高的词频代表了较高的热度,但较高的研究热度未必会带来与之对应的地位与影响力,如大数据、信息技术虽具有较高的研究热度,但由于与之发生关系的关键词偏少、重要性不够,这就导致了这些研究热点在教育信息化领域重要性大大降低;反之,深度学习、在线学习、在线课程、教育公平、智慧课堂等等尽管研究热度不高甚至很低,但却居于领域研究的核心或相对重要的网络位置而具有较高的影响力。可见,社群网络结构属性能对节点产生能动影响。

(二)我国教育信息化研究热点聚类主题分析

在社会网络分析中,聚类的目的就是把关系性质相似的点归为一类,而把差别大的点归为另一类,从而使同类的点具有高度的同质性。目前聚类方法主要有组合式聚类、分区式聚类两种,前者将点逐步组合聚类,而后者则将大的点集逐步分化。从理论上讲,对初始矩阵行(列)的相似性计算及置换不会给矩阵带来任何信息改变,但这种行为有助于发现矩阵隐含的关系模式。CONCOR作为一种迭代相关收敛算法,它利用Pearson相关系数作为相似性测量,针对矩阵行(或列)间的相关系数进行重复计算,经过无数次的反复迭代计算,最终产生的是一个仅仅由+1(完全相关)和-1(完全无关)项组成的相关系数矩阵。这样每行/列分裂为两个类,每个类都由一系列关系结构对等的点构成。从算法上看,可对每个子矩阵继续无限细分下去,但究竟细分到何种层次,这取决于问题研究分析的层次。通过CONCOR算法迭代计算,初始矩阵重排分区为如表4所示的聚类矩阵。

表4 共词聚类矩阵

结合表4,可对重排分区的六个主题聚类特征作具体分析。

1.在线学习与开放教育(主题聚类#1)

主题聚类#1是最大的知识聚类网络,主要围绕在线学习与开放教育的研究,包含慕课、教学设计、在线学习、网络课程、在线课程、网络学习、在线教育、移动学习、泛在学习、网络教育、高等教育、远程教育、开放教育资源、开放教育等16个高频关键词。随着新技术革命和信息时代的到来,人们的学习方式也在发生巨大的改变,在线学习开始受到社会关注。在线学习即E-Learning,又称远程教育、网络学习、在线教育等,是一种通过应用信息科技和互联网技术进行内容传播和快速学习的方法[18]。近年来随着在线学习的不断发展与演变,又开始衍生出虚拟学习、移动学习、泛在学习等学习方式。为迎接以互联网为代表的信息技术给高等教育带来的挑战与变革,麻省理工学院通过大规模建设、发布和共享课程资源,拉开了开放教育资源运动的序幕[19]。2015年教育部颁布《关于加强高等学校在线开放课程建设应用于管理的意见》,极大地推进了我国高校数字化教学资源的建设。开放教育资源运动的实践和推广也推动了开放在线课程(慕课)在世界范围内迅速兴起。目前,慕课的发展已成为当前高等教育发展新趋势,势必会对我国的高等教育产生重要影响[20]。

2.学习分析(主题聚类#2)

在主题聚类#2中,学习分析、教育大数据、大数据、数据挖掘、个性化学习、社会网络分析等关键词聚集在一起,表明聚类#2主要是围绕着学习分析的研究。学习分析是通过对学习者、学习环境的数据收集、分析和呈现,从而实现对学习和学习情境的优化[21]。学习分析研究本质是从大数据的角度理解学习,教育大数据为学习分析提供了独特的机会,使研究者可从与学生相关的海量数据中辨别他们的学习行为发展趋势,可以更清楚地了解学习者的能力和进步,从而促进个性化和适应性学习体验[22]。早期的学习分析研究是伴随线上学习特别是慕课的发展而兴起的,如利用在线学习平台上的学生活动数据挖掘,可以开展学习行为群体特征分析、在线学习投入分析、在线学习质量分析、学习结果预测分析等[23]。近年来,随着大数据、商业智能及可视化技术在教育领域的持续渗透,学习分析的发展有了更为广阔的前景,学习分析的方法也从被动潜在的指标分析演变为实时动态学习分析。

3.信息化教学模式与方法(主题聚类#3)

主题聚类#3是关于信息化教学模式与方法的研究,主要包括翻转课堂、微课、教学模式、混合式教学、教学改革、大学生、知识建构、深度学习、内容分析、自主学习、协作学习等14个高频关键词。利用信息技术创新教学模式与学习方法,是深化教育改革发展的重要途径。早期的信息化教学比较重视教学模式研究实践,强调教师教学设计与策略目标的达成,不太关注学生的学习活动。随着科技的进步和教育的发展,基于网络的自主学习开始涌现,能够统筹线上、线下学习优势的混合式学习越来越受到社会的关注。与混合式学习不同的是,翻转课堂教学更加强调课堂外学习和课堂内知识内化提升[24]。翻转课堂通过重构课堂教学流程,让学生课前利用微课等学习资源进行自主学习,课堂上由教师组织学生通过小组协作学习等方式展开课堂教学,把学生学习由浅入深地引向深度学习,以提升学习者的知识建构能力[25]。

4.教育信息化理论与实践(主题聚类#4)

在主题聚类#4中,教育信息化、信息技术、信息化教学、教育公平、教育变革、教育技术、教育技术学、基础教育、电子书包、互联网+、云计算、人工智能、智慧教育、智慧课堂、网络学习空间等15个高频关键词聚集在一起,表明聚类#4主要是围绕着教育信息化理论与实践的研究。教育信息化是指在教育领域全面深入地运用现代信息技术来促进教育改革和教育发展的过程[26]。这些年我国教育信息化理论与实践均取得了长足的进展,在实现教育公平、提高教育质量、推进教育创新等方面发挥了重要支撑作用。联合国教科文组织把信息技术应用于教育的过程分为四个阶段:起步、应用、融合、创新[27]。在融合创新阶段,互联网+、云计算、人工智能等新一代智能信息技术与教育“双向融合”,包含了实体空间与网络学习空间的融合,形成技术沉浸、信息无缝流转的智慧教育新生态[14][28]。另外,电子书包作为一种教育信息化移动终端设备,迎合了基础教育信息化的发展要求,促进了学生个性化学习[21]。

5.教师专业发展(主题聚类#5)

主题聚类#5是关于教师专业发展的研究,主要包括教师专业发展、教师培训、TPACK、信息素养、网络环境、课堂教学等关键词。教师是教育信息化乃至技术整合的关键因素,也是教育变革的自主行动者[29]。而教师培训是促进教师专业发展的一种有效途径,教师培训的有效性直接影响教师信息化教学能力的提升效果及专业发展水平[30]。为全面提升教师信息化教学能力,教育部先后出台了《关于实施全国中小学教师信息技术应用能力提升工程的意见》(教师〔2013〕13号)《关于实施全国中小学教师信息技术应用能力提升工程2.0的意见》(教师〔2019〕1号)《教师教育振兴行动计划(2018—2022年)》(教师〔2018〕2号)等文件,对提高我国教师信息素养和信息化教学能力起到了重要作用。作为一套符合信息技术时代教师专业发展需要的专业知识体系,TPACK创造性地将技术、教学法和学科内容三种关键知识整合起来,为促进教师专业发展提供了新思路。

6.学习环境与学习资源(主题聚类#6)

聚类#6是关于学习环境与学习资源的研究,包括学习环境、学习资源、教育应用、学习科学、虚拟现实、创客教育、教育游戏等关键词。随着大数据、虚拟现实、智能终端等信息技术的快速发展及学习科学、情境认知、分布式认知等理论在教育领域的兴起,为学习环境与学习资源的建设提供了新思路[31]。首先,新信息技术使教育空间拓展为物理空间、资源空间和社区空间,线上线下融合、真实空间和虚拟空间交互的混合式学习空间越来越多地进入学习领域[32]。其次,数字化学习资源趋向多元共创和开放共享,创客教育、STEAM课程等将成重要发展领域。最后,未来的学习设计中兼顾知识性和趣味性,教育游戏环境设计、教育游戏成效、游戏化教学策略等将成新的研究热点[33]。

(三)我国教育信息化研究热点主题发展态势分析

在社会网络分析中,密度指标可用来测度主题聚类内部及相互之间的连接程度。对于特定的主题聚类而言,密度Dk的计算可以通过该聚类中所有关键词之间(不考虑自相关)共词频数的平均值来表示,而不同主题聚类间互动关系密度Dkl可以通过该聚类中所有关键词与其他聚类的关键词之间共词频数的平均值来表示,具体计算方法如下:

其中:gk是主题聚类块矩阵βk中关键词个数,xij表示关键词间共现频次,gl是块矩阵βkl中关键词个数,而Dkl是块矩阵βk与块矩阵βkl之间关系密度值。

结合表4,各块矩阵聚类密度计算结果如表5所示。

表5 聚类密度矩阵

表5揭示了所有聚类主题内部及相互间关系紧密情况,如聚类#2密度6.800(赋值关系矩阵密度可以大于1)是密度最高的聚类,表明自身内部成员间关系最为紧密,同时该主题聚类与主题聚类#1、主题聚类#4之间也有着紧密的渗透联系。总的来说,六个主题聚类内部关系比较紧密,而各主题聚类间关系相对疏远,说明主题聚类派别表现较为明显。为进一步揭示各主题聚类的动态特征与发展趋势,下面对各主题聚类进一步实施战略坐标分析。

按前面战略坐标图绘制方法,主题聚类内部强度指标“密度”值Dk为战略坐标纵坐标,而横坐标指标“向心度”Ck具体计算方法如下:

结合表5,可进一步计算出表6所示的各主题聚类向心度值Ck、密度值Dk。以向心度平均值(0.618)、密度平均值(2.569)为中心,通过Excel散点图的形式绘制出如图2所示的教育信息化领域主题战略坐标图。

表6 主题聚类密度、向心度值

图2 我国教育信息化领域主题战略坐标

不同的战略坐标位置揭示了不同的发展态势,结合图2可以对各象限聚类主题进行深入分析。

(1)学习分析(#2)位于第Ⅰ象限的外缘,其向心度、密度都远远高于其他主题聚类。作为一个新兴的交叉研究领域,学习分析以教育领域数据为研究对象,通过挖掘其背后隐含的信息实现对教育的促进[34],近年来受到了国内外教育研究者的广泛关注。结合表5、表6可以看出,该聚类主题具有最高的外联向心度(0.825),与#1、#4等主题聚类保持着密切的联系,表明当前学习分析研究主要集中在在线学习领域,也是教育信息化领域研究的活跃主题,处于研究的最核心领域;同时,该主题聚类还具有最高的内聚密度(6.800),说明近年来该主题内部联系紧密,具有稳定的研究方向,研究成果丰富且趋向成熟。

(2)第Ⅳ象限中包括教育信息化理论与实践(#4)、在线学习与开放教育(#1)两个主题聚类。近年来,教育信息化与国家发展和技术进步呈现整体上的拟合共振[14],一方面教育信息化发展战略方向明确,凸显“互联网+教育”;另一方面教育信息化发展实践走向微观,更加关注信息技术与课程的融合[31]。处于该象限的研究主题具有较高的外联向心度和较低的内聚密度,表明这两个研究主题与其他主题联系紧密,具有较高的关注度;但这两个主题又存在自身主题内部结构松散,研究不够充分,研究热点不聚焦等问题。后面持续的研究过程中,这两类研究主题很容易分解发展成相关热点主题。

(3)第Ⅲ象限包含信息化教学模式与方法(#3)、教师专业发展(#5)和学习环境与学习资源(#6)等3个主题聚类。它们的外联向心度、内聚密度均较低,说明这些研究主题处于教育信息化领域研究的边缘,与其他研究主题联系不紧密,受关注度比较少;主题内部联系松散,或是研究年限较短,或是新研究热点,发展尚不成熟,有待进一步发展。但需要提醒的是,新出现的热点多出现在该象限[35]。

四、结语

教育信息化是一项复杂的系统工程,对教育信息化领域研究热点主题的探测识别一直是教育学界的热点研究问题。不同于常规统计手段(如SPSS等)属性变量分析方法,本文基于共词网络分析的视角,以近十年来我国教育信息化领域7 600篇高水平学术文献关键词为研究对象,借助词频分析、共词网络中心性分析、热点主题聚类分析及主题战略坐标图分析等手段和方法,得出以下结论:

(1)从词频统计结果上看,在13 095个有效关键词中,慕课、教育信息化、信息技术、翻转课堂、人工智能、学习分析、教学设计、大数据等高频关键词反映了当前教育信息化领域研究热点,也是时域内我国教育信息化研究的重要分析单元对象。

(2)通过共词网络中心性分析发现,慕课、教育信息化、人工智能、教学设计、教学模式、深度学习、学习分析等关键词占据网络中心位置,具有较高的重要性和影响力;大学生、网络教学、教育技术学、混合式教学、教育应用等关键词处于网络边缘位置,影响力偏弱。进一步的研究表明,较高的研究热度未必有对等的地位与影响力。

(3)共词聚类分析结果显示,当前我国教育信息化领域的六大研究主题是:在线学习与开放教育、学习分析、信息化教学模式与方法、教育信息化理论与实践、教师专业发展、学习环境与学习资源。

(4)战略坐标图分析表明,学习分析得到了教育研究者的广泛关注,尤其是针对在线学习领域的学习分析研究更是当前教育信息化研究的焦点、核心,且研究已趋向成熟;信息化教学模式与方法、教师专业发展、学习环境与学习资源相比其他研究主题较少被关注,处于边缘、不成熟的位置,还有待进一步发展;教育信息化理论与实践、在线学习与开放教育虽受到较高的关注,但研究不够充分,有待进一步深入研究。总的来说,表征研究成熟度的第Ⅰ、Ⅱ象限中只有1个研究主题,而处于“边缘、不成熟”的第Ⅲ象限占据了3个,这表明我国教育信息化领域研究总体上处于不成熟状态,还需进一步探索和研究。

以上研究结论有助于厘清当前我国教育信息化领域各研究热点主题结构及发展态势,为我们从整体上把握教育信息化研究提供了重要参考。另外,文中基于共词网络结构定量分析的热点主题识别分析方法,同样适用于探索其他学科领域的热点主题及发展态势,也为相关同类问题研究提供了一种新的研究理路。

猜你喜欢
共词聚类矩阵
基于突变检测与共词分析的深阅读新兴趋势分析
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
初等行变换与初等列变换并用求逆矩阵
矩阵
矩阵
矩阵
基于共词知识图谱技术的国内VLC可视化研究
基于关键词共词分析的我国亲子关系热点研究
一种层次初始的聚类个数自适应的聚类方法研究