基于文献关键词统计分析的我国开放与远程教育研究现状探析

2016-10-20 19:32刘时勇常若松
关键词:共词分析社会网络分析聚类分析

刘时勇 常若松

摘 要:以中国知网(CNKI)为平台,利用共词分析方法,对2006年1月至2015年6月间公开发表在开放与远程教育领域期刊论文的关键词进行统计分析,结合SATI软件和UCINET软件进行数据处理,探讨高频关键词之间的内在联系,揭示我国开放与远程教育研究的主题结构和核心领域。结果表明:此间我国开放与远程教育领域主要存在七大研究主题;远程学习、网络课程、学习支持服务、学习者是该领域的研究核心;移动学习、内容分析、学习科学和远程学习者将成为未来的研究热点。

关键词:开放与远程教育;词频统计;共词分析;因子分析;聚类分析;社会网络分析

中图分类号: G40-058.1 文献标志码: A 文章编号:1672-0539(2016)05-0110-08

函授教育作为一种独特的教育形态,自19世纪40年代源起,在经历“函授教育”、“远程教育”和“现代远程教育”(亦谓“开放和远程教育”、“开放和灵活的远程学习”)三个阶段的发展演进后,已成为一种代表教育未来发展方向的教育形式,引领着世界各国教育领域的全面变革与革新(陈丽,2004)。在我国,《面向21世纪教育振兴行动计划》(教育部,1998)和《国家中长期教育改革和发展规划纲要(2010-2020年)》等纲领性文件的颁布、实施,有力推动了我国开放与远程教育改革和发展的步伐。时至今日,现代远程教育事业在我国已经显现出跨越式发展之态势。笔者从文献关键词的角度出发,采用共词可视化的分析方法,探析我国开放与远程教育研究领域的理论热点、主题结构等现状特点,以期对新时期该领域的研究取向以及解决所面临的问题提供一些切实、有价值的参考。

一、数据来源与研究方法

(一)数据来源

本文以CNKI为文献数据库来源进行检索,期刊年限设定在2006年1月至2015年6月,选取在远程教育领域学术水平高、具有典型性、影响相对较大的5种期刊:《开放教育研究》、《中国远程教育》、《远程教育杂志》、《现代远距离教育》和《现代远程教育研究》进行检索,共检索到有效的、相关主题的学术性文献7260篇。利用CNKI提供的存储功能,保存以上文献的题录信息以便接下来的统计分析。

(二)研究方法与工具

本文以共词分析为研究方法。该方法认为关键词是连接文献数据库和可视化分析的桥梁。其原理是利用某一文献集中共同出现的代表主题内容的词汇对,通过聚类分析等多种统计分析方法来确定该文献集所代表的学科领域中各主题之间的关系。一般认为,词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密(钟伟金,2008)。运用共词分析法进行相关研究主要包括关键词的提取、高频词的选定、共词矩阵的构建及其标准化、统计分析和结果展示四个步骤。

在选择研究工具时,前期通过文献题录信息统计工具SATI 3.0以及Microsoft Office Excel 2010开展数据统计与筛选,然后采用社会网络分析工具UCINET及其内部集成的可视化分析软件Net Draw、Net Miner4进行共词网络分析。

二、数据统计与预处理

(一)高频关键词的确定

经过SATI 3.0进行转换、抽取和统计等过程处理题录数据,得到原始关键词7286个。依据共词分析中作者关键词规范化处理的方法(邵作运,2012)。遵循专业性、价值性、准确性和真实性的原则,本文采取如下处理方式:将表示同义的中英文关键词进行统一,如混合学习与Blending learning等;合并开放与远程教育领域具有相同或相似含义的关键词,如合作学习与协作学习等;删除一些泛义关键词如设计、对策、策略、发展、建议、启示、思考、评价等,将与研究主题不相关的关键词如西方、筹资、网上机考等也进行删除。经过多次权衡和比对,最终确定了6784个有效关键词,并依据其出现频次的高低予以排序。采用词频g指数方法进行高频关键词的选择。结果显示:g=42,即选取前42个关键词作为高频关键词(如表1所示)。

(二)关键词共词矩阵的建立

为更清楚地反映关键词之间的关系,揭示开放与远程教育领域的研究结构,对这42个关键词进行两两配对,统计它们在同一篇文献中共同出现的次数,形成一个42×42的共词矩阵(见表2)。

(三)构造相似矩阵、相异矩阵

共词矩阵中的数据是关键词共现次数的直接显示,这里引入Equivalence系数对共词矩阵进行处理,将共词多值矩阵转化成相似矩阵,如表3所示。但由于相似矩阵中的零值过多,在进行统计分析时易产生误差,这里用1与相似矩阵中的元素值相减,得到如表4所示的相异矩阵。表中数据代表两个关键词之间的异化程度,即数据越大则二者联系越小,距离越远,相似度越差。反之亦然。

三、数据分析

(一)因子分析

因子分析的基本思想是:根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构——即公共因子。本文选取Kolmogorov-Smirnov单样本检验,计算结果显示K-S检验的显著性水平sig=0.000,均小于0.05,即矩阵的总体分布不符合正态分布规律。

根据因子分析对数据的要求,将共词矩阵转化成斯皮尔曼相关系数矩阵,在此基础上进行因子分析,通过主成分分析法、方差最大法提取因子和进行因子旋转,输出因子个数的碎石图(图1)以及旋转后的因子载荷矩阵(表6)。

一般认为,提取累计方差贡献率超过85%时的特征根个数为因子个数。通过因子解释原有变量总方差(表5)的情况看出,累计方差贡献率达到89.54%的7个因子被提取,总体上说,可代表其他因素产生的效果,因子分析的效果也很理想。相应的因子個数碎石图直观地显示出最佳公因子为6-7个。所以将这42个高频关键词划分成7个类别,便可以很好地解释我国开放与远程教育领域的研究主题。

因子载荷矩阵的求解是因子分析的核心内容。选取因子载荷的绝对值应该超过0.5的方为有效结果,如关键词“远程学习者”和“移动学习”在第六个因子上有较高的载荷,表明它们之间具有较强的相关性,可以归为一类。

为更加客观、准确、科学地展现我国开放与远程教育领域的研究主题现状和结构特征,这里暂不对因子进行命名,有待在下一步的聚类分析中进一步明确。

(二)聚类分析

聚类分析是根据变量数据的诸多特征按照在性质上的亲密程度进行分类的一种多元统计分析方法(薛薇,2009)。具体到本研究中就是将这些高频词重新组合,以揭示开放与远程教育领域的主题结构。以高频关键词的相异矩阵为基础,利用层次聚类的方式,指定类间距的计算方法为组间连接法,选择欧氏距离平方作为变量距离的测度方法,并输出聚类分析的树状图(图2)。该图清楚地展示了每一次聚类的情况,并且所有关键词都参与了聚类过程,不存在遗漏的情况。

结合上述因子分析结果和聚类分析过程,经过综合分析和比较,虽然我国开放与远程教育领域研究的关键词过多,研究的焦点存在一定程度的分散性,但可以将在此时期内的研究主题和结构概括为以下七大热点:

第一,围绕建构主义教学设计开展的研究。这方面的关键词是建构主义、学习环境、教学设计和教育技术等。该聚类结果和因子分析中的第2个公因子相关联。其中教育技术被认为是所有远程教育形态的支撑基础。建构主义被认为是教育技术学的理论基础之一,而教学设计是教育技术学的核心内容,是教育技术开发、管理、运用与评价的基础,它们便成了历来教育技术研究中的重点和关键,相应地在开放与远程教育领域也不例外,为开放与远程教育的发展提供理论支撑,促使着传统远程教育向现代远程教育的革新。其中基于建构主义学习理论的以“学”为主的教学设计模式正是在20世纪90年代以后随着多媒体和网络技术的日益普及发展起来的。建构主义教学设计基于学习环境的复杂性理论,强调学习过程中的情境创设和学习自主性,认为学习是学习者在与环境交互作用的過程中产生的,同时提供一定的认知工具,这恰好符合了开放与远程教育中“教”与“学”的特征,因此成为该领域的基本研究内容。

第二,围绕网络教育开展的相关研究。关键词包括学习科学、信息技术、网络教育和网络课程等。该聚类结果与因子分析的第3个公因子基本一致。信息技术(以多媒体计算机和网络通信技术为核心)在教育领域的广泛应用为网络教育的产生和发展提供了技术基础。网络教育是远程教育的一种形式,但又不局限于远程教育,与传统的学校教育相比,教师和学习者的角色发生了变化,学习者获取知识的途径也发生了改变,其中最具有代表性的当是网络课程。信息技术带来的这种传统教育的变革,与学习科学最关注的问题即如何设计有效的学习环境、促进深层学习相吻合,使得彼此相互影响与促进。

第三,围绕网络协作学习开展的研究。包括网络学习、协作学习、E-learning等关键词。网络协作学习是指利用计算机网络以及多媒体等相关技术,由多个学习者针对同一学习内容彼此交互和协作,以达到对教学内容比较深刻理解与掌握的过程(谢舒潇,2002)。该主题的研究范围主要集中在CSCL、学习共同体、协作学习环境和模式的设计及构建、学习评价以及促进协作的策略、方法等方面。

第四,围绕教育信息化开展的研究。包括教育信息化和网络教学等关键词。教育信息化是“实施信息化教育的结果”(包国庆,2011)。其目的是利用信息技术实现创新人才的培养。该主题的研究范围主要集中在信息素养、信息技术教育、教育信息化理论、基础教育信息化与高等教育信息化、区域教育信息化以及教育信息化的现状与困境等方面。

第五,围绕新媒体和新信息技术产生的学习方式开展的研究。包括移动学习和远程学习者等关键词。该聚类结果与因子分析的第6个公因子相一致。当前新的技术层出不穷,以云计算、web2.0、微博、移动阅读和移动终端等为代表的网络技术和移动通讯技术的教育功能日益显现,为学习者提供了新的更加灵活的学习方式,学习者随时随地都可以实现资源的获取,促进了知识的共享与传播,这将对以后的开放与远程教育发展产生重大影响,也是未来该领域的研究趋势。

第六,围绕在线学习中的交互开展的研究。包括在线学习、交互和内容分析等关键词。该聚类结果与因子分析的第2个公因子基本一致。作为数字化时代的一种新型学习方式,在线学习对人们的生产、生活、学习和交往方式产生了较大的影响,近年来已成为教育技术、远程教育及图书馆等多个领域的研究热点之一。在线学习环境的特殊性决定了交互是在线学习的灵魂。该主题的研究范围主要集中在虚拟社区、学习者之间以及学习主体与学习内容间的交互、在线交互的影响因素、交互方法的设计、交互的评价等方面。

第七,围绕开放与远程教育的理论体系、建设和发展开展的研究。包括开放教育、教学模式、终身学习、远程教育、开放大学、高等教育和教育资源等关键词。该聚类结果与因子分析中的第1个公因子基本一致。任何一个领域涉及到有关自身建设发展的研究都可以认为其是一个范围较广且富有深度的主题。该主题的研究范围主要集中在开放大学与电大的建设、国外远程教育的发展、成人教育与终身教育、远程教育质量保证、学习支持服务以及远程教育的研究方法等方面。

需要说明的是,虽然关键词“网络”在聚类分析中被单独聚为一类,但由于其包含意义的广泛性和丰富性,在实际意义上已经被融入到其它更小更详细的研究主题中并以指定的形式表现出来,如网络教育、网络课程、网络学习等。

(三)高频词共词网络分析

因子与聚类分析从总体上揭示了我国开放与远程教育领域的研究主题和知识群,为了更加清晰地显示高频词间的关联性与紧密程度,需进行进一步的社会网络分析。社会网络分析是对社会关系结构及其属性加以分析的一套规范和方法,其关注的主要是社会行动者及其间的关系的集合(刘军,2004)。本文认为,共词能够形成一个虚拟的关键词网络,通过对该网络的分析有助于揭示国内开放与远程教育领域的研究热点与重点。为梳理共词网络的整体结构模式,将共词矩阵转换成用0和1表示的二值矩阵,利用NetDraw软件绘制共词网络结构图(图3)。

从结构图中可以直观地看出:网络教育、网络课程、开放大学、移动学习、远程学习、信息技术和教学设计等关键词位于网络系统的中心,且其周围联系相当丰富,表明它们在开放与远程教育领域得到极为广泛的关注,研究成果丰富,发展得相对成熟。而MOOC、学分银行、学习科学、终身教育等关键词则明显处于网络的边缘位置,拥有的联系也较少,说明对此还缺乏深入的研究,在未来会逐渐成为研究的热点。由于“远程教育”和“开放教育”两个关键词与本研究领域的名称重复,所以不予讨论。

用密度对共词网络整体结构进行量化表示,密度越大则联系越紧密。数据结果显示,该网络密度为0.8026,根据组织粘度概念(Krackhardt,1993),可以认为本研究中共词网络的密度比较适中,即关键词之间的信息交流频繁,表明了开放与远程教育的研究已经达到一定的深度,且研究主题正朝着多元化的方向发展。

中心性分析是共词网络分析最常用的测度之一,用来判断一个结点在网络中的地位与重要性。主要有点度中心度、中间中心度和接近中心度三个维度,计算结果如表7所示。点度中心度是一个最简单、最具有直观性的指数,表示与某个结点相连的其它结点的个数,度数越高则反映在共词网络中就位于中心地位,影响力也就越大,在一个学科领域里通常认为该数值较大的结点代表着当前的研究重点(图4)。中间中心度是指一个结点是否在其它两个结点联系的路径上,

度数越高表明其他点对它的依赖性越强(图5)。接近中心度是指某结点与其它结点的接近程度,度数越低说明其越处于核心位置。

数据结果显示,开放大学、信息技术、教学设计、网络课程等关键词的点度中心度和中间中心度均较高,而相应的接近中心度却较低,说明它们既是开放与远程教育领域的研究核心与重点,还是联系其它相关主题开展研究的桥梁。相反,某些关键词如学习科学、教师专业发展、教育游戏和内容分析等还处于不成熟状态,有望在今后成为新的研究热点和趋势。

四、結语

通过我国开放与远程教育研究现状的共词聚类图谱及关联性分析,结合统计数据可以发现, 我国开放与远程教育的研究热点和趋势具有显著的时代特征和变革特点。近些年开放与远程教育的发展进入了新的历史时期后,呈现了深刻而复杂的多变性。相应地,围绕其展开的研究也日益增多,对现有研究现状与特点进行描述以确定未来的研究方向很有必

要。以上采用共词分析可视化的方法,以5种权威期刊2006年1月至2015年6月期间刊载的7260篇学术文献的关键词为研究对象,通过对关键词的提取和词频统计确定了开放与远程教育领域研究的高频关键词,进而建立共词矩阵并对矩阵数据做出相应处理。通过因子分析和层次聚类分析的方法确立了我国开放与远程教育领域的七大研究主题结构,通过高频词共词网络分析揭示了开放与远程教育领域的研究热点与核心。这样一幅有关开放与远程教育研究的知识图谱有助于研究者更清晰地了解该领域的研究概况,并为今后的相关研究提供一定的借鉴和参考。

诚然,本研究中确立的研究主题和研究热点与核心并不是一直不变的,伴随着时间的推移和研究的深入,有可能会出现新的研究主题和热点,原有的研究主题也可能会逐渐消失,以及词频较低的关键词可能会成为研究的前沿,等等。而且不可否认的是,本研究还存在一定的局限性,如研究文献选取量的问题、关键词的高度精确规范化等,这也是在接下来的研究中需要进一步注意和改进的地方。

参考文献:

[1]包国庆.教育信息化的学科归类及其与现行教育学的关系[J].中国电化教育,2011,(5):19-22.

[2]陈丽.远程教育学基础[M].北京:高等教育出版社,2004:13-14.

[3]丁兴富.论远程教育学的理论研究和学科建设[J].开放教育研究,2005,(2):10-17.

[4]范如永.终身学习理念下我国远程教育研究的热点、前沿和发展趋势分析[J].中国电化教育,2013,(2):34-37.

[5]耿志杰,朱学芳,王文鼐.情报学领域关键词同现网络结构研究[J].情报科学,2010,(8):1179-1182.

[6]何克抗,李文光.教育技术学[M].北京:北京师范大学出版社,2002:384.

[7]教育部.面向21世纪教育振兴行动计划[EB/OL].(1998-12-24)[2015-10-03].http://www.moe.gov.cn/publicfiles/business/htmlfiles/moe/moe_177/200407/2487.html.

[8]开放教育研究.《开放教育研究》荣获“中国现代远程教育十年最有影响杂志奖”[J].开放教育研究,2009,(6):8.

[9]李爽.远程教育研究领域分类的初步探索[J].中国远程教育,2009,(3):29-35.

[10]李长玲,翟雪梅.我国情报学硕士学位论文的共词聚类分析[J].情报科学,2008,(3):73-76.

[11]刘军.社会网络分析导论[M].北京:社会科学文献出版社,2004:4.

[12]邵作运,李秀霞.共词分析中作者关键词规范化研究——以图书馆个性化信息服务研究为例[J].情报科学,2012,(5):731-735.

[13]武法提.网络教育应用[M].北京:高等教育出版社,2003:274.

[14]谢舒潇,黎景培.网络环境下基于问题的协作学习模式的构建与应用[J].电化教育研究,2002,(8):44-47.

[15]薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社,2009:328,302.

[16]杨爱青,马秀峰,张风燕,等.g指数在共词分析主题词选取中的应用研究[J].情报杂志,2012,(2):52-55.

[17]张秀娟,李新宇.远程教育研究主题划分与近五年研究热点分析——基于对397份研究生学位论文的分析[J].电化教育研究,2010,(8):94-99.

[18]张伟远.中、英、美开放与远程教育研究论文的比较研究[J].开放教育研究,1999,(2):59-62.

[19]钟伟金,李佳.共词分析法研究(一)[J].情报杂志,2008,(5):70-72.

Abstract:Based on co-word analysis method, this paper takes the CNKI as platform and analyzes the keywords of research papers which are published on the Journal of Open education research from January 2006 to June 2015 Combining with the software of SATI and UCINET, we processed data and explored the internal relationship between high frequency keywords. And then revealed the topic structure and research core. The results of the research show that there are seven main topics in the field of open and distance education in China. Research core mainly include distance learning, online courses, learning support service and learner. Mobile learning, content analysis, learning science and distance learners will become the future research hotspots and trends. Finally we hope it will provide some practical and valuable reference for related research of open and distance education in the new period.

Key words: open and distance education;word frequency statistics;Co-word analysis;factor analysis;cluster analysis;social network analysis

編辑:黄航

猜你喜欢
共词分析社会网络分析聚类分析
基于德温特数据库的关键共性技术分析
国内图书馆嵌入式服务研究主题分析
境外公益旅游研究进展与启示
新浪微博娱乐明星的社会网络分析
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
基于知识图谱的智慧教育研究热点与趋势分析
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于社会网络分析的我国微课研究探析
基于聚类分析的互联网广告投放研究