基于文献计量的眼动与汉语研究动态的知识图谱分析

2017-07-03 16:12:18甘桥
长春教育学院学报 2017年5期
关键词:眼动图谱可视化

甘桥

基于文献计量的眼动与汉语研究动态的知识图谱分析

甘桥

运用CiteSpace文献计量学方法,以1995-2016年间中国期刊全文数据库(CNKI)中收录眼动与汉语研究相关的266篇学术论文作为数据来源,对从事相关研究的主要作者、科研机构、高频热点词等方面进行了可视化知识图谱分析,梳理了国内学界22年来利用眼动技术进行汉语研究的发展脉络、核心课题和研究前沿,对这种新的学科内部交叉研究进行了深入分析。旨在辅助从事眼动与汉语研究的学者全面把握领域进展,借鉴已有经验和成果,以更好地进行交叉研究,探究汉语学习中学习者的潜在心理进程,为教育研究者将学习结果和相关的认知加工过程联系起来提供一个便捷的途径,并深度建构汉语研究的心理学路径。

文献计量;CiteSpace;眼动;汉语研究;科学知识图谱

眼动即眼球的运动,是指通过测量眼睛的注视点的位置或者眼球相对头部的运动而实现对眼球运动的追踪,在视觉系统、心理学、认知语言学的研究中有广泛的应用。它与注意及内部信息加工机制具有密切联系,存在着外源性和内源性两种控制,更多情况下受到任务或目的指引。因此,眼动心理学研究已经成为当代心理学研究的一种有用范型,同时,基础性眼动研究及其理论建构也越来越受到重视,眼动追踪技术在汉语研究领域中应用的程度也随之提高。本文通过对1995-2016年文献的总结,揭示眼动追踪技术在汉语研究中的应用。对研究中所使用眼动指标的统计表明,时间指标(如注视时间)的使用最多,其次是量值指标(如注视点个数),而空间指标(如注视位置)则较少。通过对内容的分析,发现眼动追踪技术主要被用于探究汉语中7个方面的主题:阅读、词切分、词汇识别、句子理解、语义加工、工作记忆和眼动特征。利用眼动追踪技术,可以探究汉语学习中学习者的潜在心理进程,为教育研究者将学习结果和相关的认知加工过程联系起来提供一个便捷的途径,并深度建构汉语研究的心理学路径。

一、数据来源

本研究所使用的数据均来源于中国知网全文数据库。笔者于2017年1月6日以“眼动”并含“汉语”或者“中文”为检索式,检索类型为“主题”,检索时间不限,在CNKI中共检索到323篇论文,借助NoteExpress文献管理器的去重功能,以及剔除期刊目录、会议通知等无效数据后梳理出266篇有效论文。每条引文均保存为纯文本格式以便导入CiteSpace进行可视化分析提取数据,包括作者、篇名、期刊名称、出版年份、作者单位、摘要、关键词等指标。

二、研究方法

本研究借助科技文本挖掘及可视化工具——CiteSpace计量文献学系统对文献数据进行分析,此系统由美国德雷赛尔大学知识可视化与科学发现联合研究所所长陈超美博士开发。CiteSpace是一款基于Java语言、着眼于科学分析中蕴含的潜在知识,并在科学计量学、数据和信息可视化背景下逐渐发展起来的一款引文可视化分析软件,得到的可视化图形称为“科学知识图谱”(Mapping knowledge domains,MKD),具有图和谱的双重特性[1]。

三、数据分析

(一)文献发表时间分布图

图1 1995-2016年CNKI中眼动与汉语研究的发文量统计

从图1中可以看出,国内学界该领域研究发端于20世纪末,发文量总体呈波动上升趋势,2014年达到顶峰29篇之后数量有所回落。最早一篇论文出现在1995年,除1996和1997年文献量为0,其余20年里每年均有相关论文出现。肇始的论文由秦震和陆费汉倩1995年发表于《临床神经科学》,涉及华人和德国人阅读中德文眼动型式的比较研究,结果表明,华人与德国人各自阅读本国文字材料的眼动型式非常相似,原来学习表意文字(表音文字)的人在转而学习另一种文字时很可能还是运用阅读原来文字的语言手段。对内容一致的横排体和直排体中文的阅读眼动参数并无明显区别[2]。该文献借助眼动实验研究了不同国籍汉语学习者的阅读差异,揭示了学习者间的阅读异同,深刻阐释了眼动在汉语研究中的巨大前景,此后的20年间借助眼动进行汉语研究的实验不断增加,质量也更高,既有对汉语学习的理论建构也有对教学实践的科学指导。

(二)主要学者及科研单位

CiteSpace通过渐进的共引网络分析来实现对一个学科或者研究领域发展脉络的梳理[3]。因此,本文以年为时间分区,将1995-2016划分为22个时间分区。选取每个时间分区内发表论文篇数前50名的作者、科研机构作为数据,采用最小生成树算法得到作者及科研机构合作情况的可视化知识图谱。阈值设定为2,即图谱中的作者和科研机构频次均不少于2次,字号为5,字节尺寸取最大值,并选择展示连接强度功能,最终生成图2的可视化知识图谱。

图2国内从事眼动与汉语研究的主要学者和科研机构分布

图2 中节点的大小、颜色深浅以及连线强度代表该学者或机构发表的论文数量,数量越多节点越大,字体颜色越深且作者间以及作者与科研机构间合作频次越大,连线越明显。例如图中“闫国利”和“白学军”与“天津师范大学心理与行为研究院”这三点间有连接线,且闫国利字体颜色最深,所占图谱圆周最大,这说明以上两名研究者的工作单位均是天津师范大学心理与行为研究院,且合作发表过文章,其中闫国利的文章产出数量多于白学军。

1995-2016年期间,国内从事眼动与汉语研究且产出成果较多的学者和科研机构较为有规律可循,作为教育部人文社会科学百所重点研究基地之一(全国仅有2个心理学重点研究基地)的天津师范大学心理与行为研究院产出文献最多,单一单位署名文献达35篇,闫国利和白学军为最高产学者,分别产出文献31、23篇,该基地的区域影响力突出,南开大学和天津外国语大学均有多位学者与该单位有实质性的合作研究,致力于汉语的语义消歧、歧义加工、注视位置和词汇识别研究。此外,高产的作者和单位还有辽宁师范大学任桂琴,研究领域主要是句子语境下的词汇形、音加工和词汇歧义消解;北京师范大学心理学院舒华和武宁宁,主要研究词汇和句子层级的歧义消解和句子加工;中国人民大学心理学系张积家和王娟针对汉英双语者进行启动语言和语义加工研究。从中我们可以看出天津师范大学心理与行为研究院独树一帜,合作优势明显,区域辐射力较强,研究领域主要集中于汉语阅读研究,也启发研究者应该进行学科交叉和优势互借,加强协同合作,提升研究层次以促进学科的纵深和优化发展。

(二)研究领域和热点

1.研究领域。CiteSpace软件能够通过绘制聚类和时区视图显示一个学科或知识域在一定时期发展的趋势和动向,展示若干研究前沿领域的演进历程[3]。因此,以1年为时间分区,将1995-2016年划分为22个时间分区,采用寻径算法剪切后生成可视化知识图谱。其中,阈值设置为3,即关键词的出现频次不少于3次,字体大小设置为16号,节点选取最大值并选择展示连接强度功能键,最后得到图3的知识图谱。基于图谱及CiteSpace的统计数据,得到表1的高频次词频表和表2的高中心度关键词词频表。

图3国内眼动与汉语研究热点分布

图3 中的每个圆圈(即节点)代表一个关键词,节点越大反映该关键词出现的频次越高。节点颜色深浅反映了研究热点的演变过程,年轮的厚度代表该时间分区里关键词出现的次数—数量越多,年轮越厚[4]。节点间不同的连线代表其共现关系,连线越粗共现关系则越密切。有些大的节点内部或周围分布着一些小的节点,说明这些节点之间关系非常紧密,构成了聚类(cluster)。例如图3中的“汉语阅读”与“眼动仪”“词切分”与“中文阅读”明显属于两个不同的聚类。

表1 高频次关键词

从图3和表1的统计信息看来,眼动与汉语研究的研究对象集中于老年人和学前儿童,领域分布于阅读、词切分、词汇识别、句子理解、语义加工、工作记忆和眼动特征7方面,其中“汉语阅读”频次为31,表明有31篇文献以汉语阅读为关键词,占比12%,“词切分”“阅读障碍”和“阅读过程”频次均大于10,这3个关键词均属于阅读领域,分别占比6%、5%、4%,汉语阅读研究占比最大,涉及阅读障碍、阅读过程、阅读知觉广度等内容,经系统检测得知,其中“阅读过程”Sigma值达到2.63且2000年的突变值为4.43,表明阅读过程研究在眼动与汉语研究中重要性最突出,具体研究内容为阅读过程的句子理解、词汇识别以及对双字词的认知加工。

2.研究热点。中介中心度是用来测量节点在网络中重要性的指标,CiteSpace使用此指标来发现和衡量关键词的重要性、揭示研究演绎路径和热点。现通过考察和解读高中心度关键词解读眼动与汉语研究的热点。

表2是笔者根据CiteSpace生成的信息统计得出的中介中心度大于或等于0.10的14个高中心度关键词表。

表2 高中心度关键词

由表2可以看出,眼动研究、阅读过程的聚类中心度均大于0.20,是眼动与汉语研究的前沿与热点,具体体现在利用眼动技术进行阅读过程的探讨,如沈模卫,张光强等介绍了阅读过程眼动控制理论模型-E-Z Reader的理论基础和具体操作方法[5]。韩玉昌,隋雪等探讨了小学学习困难生阅读过程中的眼动特征[6],指出小学学习困难生文章阅读的注视次数多、注视范围小且回视次数多;注视点持续时间长、加工速度慢;眼跳距离小。贺荟中和贺利中针对聋生篇章阅读过程进行了眼动研究[7],指出语言发展前全聋学生阅读记叙文的整体能力与低于其3个年级的听力正常学生有差距,主要表现在文章阅读的整体效率显著低于听力正常学生,而在其他眼动指标上均未见差异,但以反复回视、增加注视点等为代价。

此外,由表1、表2可知,眼动研究在基于眼动实验的系列研究中仍然占据本体地位,因此,从事眼动与汉语研究的科研工作者应当具备必要的眼动知识,包括仪器使用、实验设计、变量监控等各个环节的准备与参数设定。事实上,只有系统全面地掌握了眼动实验知识才能提升基于眼动的汉语研究水平,进而从方法论创新的高度建构汉语研究的心理学路径。

眼动与汉语研究目前主要集中于阅读,包括词汇识别、阅读障碍、阅读知觉和句子理解等研究主题,该领域研究成果丰硕,使用眼动技术有力的推动了汉语阅读研究的纵深发展,然而与汉语写作、听力、口语等方面的结合相对较少,可能的原因一是操作难度较大,相关变量的可控性和实验环境及设备的限制性,二是该领域的研究仍处于发展阶段,写作、听力、口语等研究主题会有后续的研究进展。据此,下一步研究应注意领域的广度与深度,眼动与汉语的研究尚大有可为,具有良好发展前景,如充分利用眼动仪观测汉语写作时学习者的心理加工特性,基于学习者心理探索高效的汉语写作教学模式。此外,笔者在WOS数据库中以“eye movement”AND“Chinese”检索得到772条相关文献,文献量为CNKI数据库相关数据的两倍,其中台湾和中国大陆学者为主要学者群,通过阅读发现国外眼动与汉语研究成果较多,且呈现多格局和精细研究的趋势,如加拿大学者Tsang,Cara和Chambers,Craig G.的最新成果针对粤语口语的复合词、重复词和增量词识别进行了研究[8],这一研究充分的开拓了眼动与汉语口语研究的心理学路径。总之,眼动与汉语结合的研究历史较短,急需开拓的领域广泛且研究深度极具前景,相关实验结果对阅读障碍、特殊语言教育等有较好的临床辅助和矫正效果,这一领域值得进一步拓展。

[1]李杰,陈超美.CiteSpace:科技文本挖掘及可视化[M].首都经济贸易大学出版社,2016:2-3.

[2]秦震,陆费汉倩.华人和德人阅读中—德文眼动型式的比较研究[J].临床神经科学,1995(4):14-17.

[3]刘则渊,陈悦,侯海燕等.科学知识图谱方法与应用[M].北京:人民出版社,2008.

[4]Chen Chaomei.Predictive Effects of Structural Variation on Citation Counts[J].Journal of American Society for Information Science and Technology,2012(3):439-449.

[5]沈模卫,张光强,符德江,陶嵘.阅读过程眼动控制理论模型:E-ZReader[J].心理科学,2002(2):129-133,252.

[6]韩玉昌,隋雪,任延涛.小学学习困难生阅读过程中的眼动特征[J].心理科学,2005(3):550-553.

[7]贺荟中,贺利中.聋生篇章阅读过程的眼动研究[J].中国特殊教育,2007(11):31-35.

[8]Cara Tsang,Craig G.Chambers,and Mindaugas Mozuraitis.Compounds,Competition,and Incremental Word Identification in Spoken Cantonese [J].Language,Cognition and Neuroscience,2017 (1):69-81.

责任编辑:贺春健

H109.4

A

1671-6531(2017)05-0049-04

甘桥/西安交通大学外国语学院在读硕士(陕西西安710049)。

猜你喜欢
眼动图谱可视化
基于CiteSpace的足三里穴研究可视化分析
基于眼动的驾驶员危险认知
基于Power BI的油田注水运行动态分析与可视化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于ssVEP与眼动追踪的混合型并行脑机接口研究
载人航天(2021年5期)2021-11-20 06:04:32
绘一张成长图谱
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
传媒评论(2019年4期)2019-07-13 05:49:14
补肾强身片UPLC指纹图谱
中成药(2017年3期)2017-05-17 06:09:01
主动对接你思维的知识图谱
国外翻译过程实证研究中的眼动跟踪方法述评
外语学刊(2016年4期)2016-01-23 02:34:15