基于CiteSpace的国内句法复杂度研究可视化分析

2024-11-21 00:00:00王艳金
今古文创 2024年43期

【摘要】本文使用CiteSpace对收录于中国知网核心期刊与CSSCI期刊的句法复杂度论文进行可视化分析,发现自有论文发表以来,句法复杂度研究受关注程度一般,核心与C刊中论文发表数量不到百篇、且正处于从年度发文量最高峰下降后的恢复期;论文作者之间与所属机构之间均有一定的合作关系;研究热点主要是二语/外语写作中的句法复杂度问题及其影响因素;研究前沿曾有向专门领域写作和纵向的句法复杂度研究转变的趋势。

【关键词】 CiteSpace;句法复杂度;中国知网;可视化分析

【中图分类号】H0 【文献标识码】A 【文章编号】2096-8264(2024)43-0121-04

【DOI】10.20024/j.cnki.CN42-1911/I.2024.43.032

一、引言

在语言学领域中,句法复杂度概念用来揭示语言结构的丰富性和多样性,对于理解和解析人类思维过程、认知能力和语言发展等有着不可忽视的重要性。从语言发展的角度来看,句法复杂度研究可以揭示语言结构的内在规律性,为语言习得和语言障碍研究提供重要参考。句法复杂度作为语言结构的重要指标,有助于深入理解语言习得的机制、更好地了解语言发展的规律,为语言教育提供科学依据[1]。句法复杂度研究也可以为语言障碍的诊断和干预提供科学依据;比如,通过分析句法复杂度在口吃患者中的表现,可以帮助研究人员更准确地诊断和干预这些语言障碍,有助于提高语言障碍患者的康复率和生活质量[2]。

国外语言学界对句法复杂度的关注始于20世纪六七十年代,起源可以追溯到早期的结构主义语言学和生成语法学派。结构主义语言学强调语言结构的内在规律和形式,通过分析语言中的句法结构和规则来揭示语言系统的普遍性和规律性。[3]生成语法学派则更加关注语言生成的过程,提出了一系列关于句法结构生成和解释的理论模型,为后来的句法复杂度研究奠定了基础。[4]

从研究范式来看,国内外学者对于句法复杂度的定义和测量方法有着不同的视角。传统上,复杂度经常通过句子长度、句法深度、从句嵌套结构、结构类型的复杂化与多样化等因素来量化[5]。然而,现代研究更倾向于结合语法结构的多样性、灵活性以及非线性特征来进行评估[6]。随着神经科学和心理科学的发展,句法复杂度的研究已逐渐成为跨学科研究的热点,它不仅影响着阅读理解的速度与效率[7],也与认知发展等领域紧密相连[8]。另外,随着计算机技术的发展,计算语言学的出现也为句法分析和句法复杂度评估提供了新的方法和工具,使研究者能够更加客观地分析语言结构的复杂度。这种多学科的交叉融合,提升了句法复杂度研究的水平,进而更全面深入地探究语言习得和语言障碍的问题。

国内对句法复杂度的关注远迟于外国学界,但也获得了一些成果。由中国知网得知,国内涉及句法复杂度主题的研究论文最早发表于2006年。那么时至今日,国内关于句法复杂度的研究成果,其大致情况、研究热点与研究前沿又是什么?基于中国知网核心期刊和CSSCI期刊收录的论文数据,本文将通过CiteSpace可视化分析,对以上几个方面进行简单地回顾与梳理,以便为该领域的后续研究提供一些建议与参考。

二、数据收集与研究方法

本文数据在中国知网的检索过程具体如下:由旧版网址进入,选择期刊检索,点击“高级检索”进入检索页,以“句法复杂度”为检索词、检索条件选择“主题并且篇关摘”,不限定文献发表时间(数据采集时间为2024年3月29日)。为保证研究论文的水准,文献来源选择核心期刊和CSSCI期刊。剔除无关文献后,最终获取有效文献78条。

本研究主要使用CiteSpace(6.3.R1 64-bit)进行可视化分析,通过对所选论文的作者、机构和关键词的分布和聚类挖掘,展现出句法复杂度研究的现状、热点与前沿的动态发展。CiteSpace主要通过对文献的共引分析,利用寻径网络或者最小生成树算法,对一定条件下所收集的相关文献进行统计分析[9],最后通过可视化图表直观地展现“一个学科或知识域在一定时期发展的趋势与动向,形成若干前沿研究领域的研究历程”[10]。

三、国内句法复杂度研究的可视化分析

(一)知网发文量概况

下面图1展示了自有关于句法复杂度研究的论文收录于中国知网以来的核心与C刊论文发表的数量及走向。由该图可知,国内句法复杂度研究的论文数量不是很高(共78篇)。由图1可见,在2006年发表了第一篇论文之后,经历了一个长达五年的空窗期。随后,发文量才于2012年开始缓慢上升,并经历了一个增长(并于2022年到达最高峰)、回落又上升的过程,2024年度发文量能否超越2022年的最高峰(18篇)尚未可知。大致上,句法复杂度研究受关注度呈增长态势。

(二)研究者及其机构

在进行研究者、机构和关键词的CiteSpace可视化分析中,时间切片默认设置为1,筛选标准选择g-index (K=25)。因生成的图谱足够简洁,在图谱剪裁设置栏中未勾选任何参数,选择软件默认计算法和图谱剪裁策略。

通过分析得知,句法复杂度的研究者节点数共116个,合作关系连线为92条。如果设定参数阈值(by citation)为2,可获得图2,展示了其中发文数量较高的研究者及其合作关系。CiteSpace的运作逻辑是通过节点和姓名标签的大小来表示发文数量的多少; 节点与标签越大,发文数量越高,反之亦然。经过仔细观察可看出,节点与姓名标签最大者为吴继峰(发文4篇)。紧接其后的是韩笑、冯丽萍、何莲珍、胡韧奋、刘黎岗、张会平和郑咏滟(均为3篇)。王同顺、亓海峰等人发文数则均为2篇。另一方面,网络图中连线则表示这些研究者之间的合作关系。图2显示,句法复杂度研究中,部分研究者们中有比较密切的合作关系,形成了一定的研究小团体,如吴继峰和胡韧奋等人、韩笑和冯丽萍等人间的合作。

研究者所属机构方面,CiteSpace的分析结果显示,节点数为95个,合作关系连线61条。把节点标签的参数阈值(by citation)设定为3,获得关系图谱3。图3显示,发文数量前十的机构中,上海交通大学节点最大,发文数量最高(5篇),与其他研究机构有较紧密的合作关系。节点小于它的是北京师范大学汉语文化学院,发文数量为4篇,但连线显示其与其他机构之间的合作关系更加密切。中央民族大学国际教育学院、北京外国语大学等其他六家研究机构节点更小,发文数量也少,均为3篇。节点的大小和之间的连线显示,机构间有较紧密的合作关系,但尚未形成研究阵地或者研究中心。

(三)研究热点

CiteSpace可视化分析中,研究热点的获取主要通过提取关键词来实现[11]127,具体则通过对某领域相关论文中的关键词项进行提取、统计其频数、并形成网络图谱,从而确定该领域的研究热点。关键词来源涵盖论文的题目、摘要、作者关键词以及补充关键词[11]204。

在进行句法复杂度研究关键词共现分析时,CiteSpace的参数设置基本相同,其中的节点标签参数阈值选择“by frequency”(值为2)。最后我们获得节点123个、连线153条,如图4所示。节点和标签的字体越大,说明该关键词出现的频数越高,研究热度也越高[12]。

由CiteSpace分析可知,句法复杂度研究中关键词频数在2及以上的共有19个。其中,二语写作为9,复杂度和准确度均为8,紧随其后的是英语写作(5次),流利度和语料库各4次,写作质量3次,写作质量、写作等12个关键词频数为2。由图可见,相关论文中的高频关键词均与语言产出有关,主要围绕二语写作、英语写作、复杂度、准确度形成四个关键词节点群,体现了句法复杂度领域的研究热点,主要是二语或外语写作中体现出的句法的复杂度、准确度。其他的小关键词节点群包括元分析、协同效用等,相关论文主要试图解释呈现不同句法复杂度的原因。以上关键词是句法复杂度研究论文核心内容与主题的高度提炼,由这些关键词出现的频数变化可看出句法复杂度研究的热点和重要主题之所在[13]。

在已有关键词及共现网络的基础上进行聚类,把聚类栏中的参数“set the smallest size of a cluster to show”设定为3,共获得七个聚类,如下面图5所示。该图再次印证,句法复杂度研究的热点是二语/外语写作或学习中所呈现出的句子复杂度问题以及对影响句法复杂度因素的探究。另外,聚类分析也显示,翻译活动中的目的语文本的句法复杂度也是研究的热点。下文简单介绍相关热点。

1.二语/外语写作中的句法复杂度研究。国内句法复杂度研究多与二语/外语写作相关,图5所示关键词聚类0号、1号和6号中至少19篇论文是此主题。比如,亓海峰、廖建玲考察了34名汉语学习者九周内记叙文与议论文的词汇复杂度和句法复杂度的发展情况,发现两种文体呈现出不同的发展轨迹,其中部分词汇和句法复杂度指标高于其他指标,有显著的发展,但准确度未展现明显的发展[14]。周文华通过追踪4名汉语学习者8个月内的120篇周记、考察他们在词汇、句法方面的复杂度与准确度的发展,发现句法方面的发展慢于词汇层的发展[15]。

2.关于影响句法复杂度因素的研究。比如,邢加新、罗少茜以英语论文为对象、运用元分析方法讨论了任务复杂度对英语书面语产出的词法与句法复杂度的影响,结果显示,任务复杂度对产出语言的词法与句法复杂度的影响均是正面的,而对其准确度和流利度的影响则均为负面的[16]。另外,任务组织形式、任务复杂度、反馈方式等因素均对二语/外语写作中的句法复杂度产生影响。刘兵和尉潇以65名英语专业大一学生为对象,探讨不同任务组织形式对在线写作任务的准备和产出的影响;其研究发现,对于不同的任务,学生在准备层面体现出时长、形式和内容上的差异,方差分析进一步说明不同任务形式对语言产出的流利度没有明显影响,但对句法复杂度和准确度的影响明显,复杂度和准确度均大幅上升[17]。张煜杰和蒋景阳通过分析180名学生的三种不同写作题型的英语作文发现,高复杂度的英语写作任务有助于提高英语写作产出的句法复杂度,但其对词汇的复杂度和准确度的影响则比较小;另外,复杂度与准确度的表现容易受到写作任务要求和体裁的影响[18]。白云等人以自动评分系统反馈与范文反馈为例、探究了纠错与非纠错反馈对大学生英语作文语言复杂度的影响,他们发现,自动评分系统反馈可有效提高词汇复杂度但会降低句法复杂度,而范文反馈对作文的词汇与句法复杂度均有显著的提升作用[19]。

3.翻译活动中目的语文本的句法复杂度研究。比如,赵秋荣、孙培真比较了汉语母语者和英语母语者所做的两个《传习者》英译文本,发现英语母语者的译入型文本在词汇上更丰富、句法复杂度也更高,但准确度与忠实度底、易读性较差;汉语母语者的译出型文本在词汇上不够丰富,句法复杂度底,但准确度与忠实度更高、易读性更好[20]。朱周晔、王金铨通过自建语料库比较了英语学者在汉译英时,源文本的不同文体将影响目标文本,具体体现在词汇丰富程度、句法复杂度和衔接连贯度上[21]。吴继峰等人基于两个可比语料库、使用14项句法复杂度指标比较了翻译汉语与原创汉语的句法复杂度,结果发现,翻译汉语有8个指标显著高于原创汉语,4个指标则显著低于原创汉语;8个指标中文本类型和体裁类型有显著的交互作用,7个指标中翻译汉语与原创汉语不同体裁的句法复杂度表现有差异[22]。

(四)研究前沿

在CiteSpace可视化分析中,研究前沿的获取与讨论可通过关键词突现图谱和关键词时间线图谱来进行。

根据突现关键词图谱(图6)可以看出,2015—2020年,关于句法复杂度的研究较为关注产出语言的准确程度、流利程度和复杂程度,其中准确度突现程度最高,说明句法复杂度与句法的准度密切相关。同一期间,还有对造成不同句法复杂程度原因的元分析。2017—2019年,“学术写作”突现而出,说明研究热点曾短暂着落在学术文章所呈现出的句法复杂度上。2020—2021年,“文体”成为突现关键词,说明有研究开始关注不同文体文章所体现出的句法复杂度现象;“动态发展”则说明有研究关注句法复杂程度的纵向发展。2021—2022年,有论文关注句法复杂度与写作质量的关系。

此外,我们也可以从关键词时间线图谱直观地观察句法复杂度研究前沿的演变。从下面图7可看出,各主要关键词首次出现的时间节点以及与其他关键词的共现关系。除突现关键词图谱显示的“二语写作”“复杂度”“准确度”等关键词外,时间线图也展示了其他非突现关键词,例如,“翻译质量”“译入”,说明翻译中的句法复杂度问题成为了研究的前沿热点。

四、结语与展望

本文使用CiteSpace软件对中国知网收录的有关句法复杂度研究的核心期刊和CSSCI期刊论文进行了可视化分析,从多方面展示了国内时至今日该领域的研究现状、研究热点以及研究前沿的演化过程,最后发现,自有论文发表以来,句法复杂度的关注度在2022年经过最高峰后,现正处于恢复阶段。仅就核心和C刊论文刊发数量上看,该领域受关注程度一般。其研究热点主要是二语/外语写作中的句法复杂度问题及造成写作中不同句法复杂度的因素,热点也包括翻译中目的语文本的句法复杂度问题。研究前沿也曾由一般写作的句法复杂度研究转向学术等专门领域写作的句法复杂度研究、由横向研究转向关注句法复杂度发展的纵向研究。

国内句法复杂度研究在一定程度上揭示了英语、汉语等语言的句法结构的内在规律,但是仍有诸多尚待解决的问题和未充分挖掘的研究领域。纵观这78篇论文,不难发现以英语作为研究对象的论文占大部分,而以汉语为研究对象的论文占比较少(13篇);关注书面语的论文多,研究口语的论文少(7篇);此外,涉及或进行中外语言句法复杂度对比研究的论文更少,仅有区区3篇。

由此可见,我们可以加大汉语言产出的句法复杂度研究。增加口语产出的句法复杂度研究,因为从本体论的角度来看,口语是先于书面语的,是语言的根本,口语的复杂度水平更能反映语言复杂度问题。增加中外语言对比的句法复杂度研究;句法复杂度是一个普遍问题,但单一语言情境中体现出的句法复杂度现象在跨语言情境中多大程度上为真,需要通过研究才能得出结论。另外,我们可以构建更大规模、更具代表性的语料库,以提高研究的普适性和可靠性;探索更多元的句法复杂度维度,如动态变化、层级结构等,以更全面反映语言的复杂动态性;关注个体差异,特别是对特殊群体(如儿童、语言障碍者)的研究,以增进对语言学习和认知发展过程的理解。

参考文献:

[1]Lu,X.Automatic Measurement of SyntacticComplexity in Child Language Acquisition[J].InternationalJournal of Corpus Linguistics,2009,(1):3-28.

[2]Yaruss,J.S.Utterance Length,Syntactic Complexity,and Childhood Stuttering[J].Journal of Speech,Language,and Hearing Research,1999,(2):329-344.

[3]Bloomfield,L.An Introduction to the Study of Language[M].New York:Henry Holt and Company,1933.

[4]Chomsky,N.Syntactic Structures[M].The Hague:Mouton&Co.,1957.

[5]Ortega,L.Syntactic Complexity Measures and Their Relationship to L2 Proficiency:A Research Synthesis of College Level of L2 Writing[J].Applied Linguistics,2003,(24):429-518.

[6]王淼.二语写作句法复杂性研究的新发展[J].北京第二外国语学院学报,2019,(2):81-99.

[7]Wang,M.D.The Role of Syntactic Complexity as a Determiner of Comprehensibility[J].Journal of Verbal Learning and Verbal Behavior,1970,(4):398-404.

[8]Kagan,D.M.Syntactic Complexity and Cognitive Style[J].Applied Psycholinguistics,1980,(1):111-122.

[9]袁琳,孙敬姝,盖学敏.基于CiteSpace的物理演示实验可视化分析[J].物理实验,2018,(1):33-38.

[10]陈超美著,陈悦,侯剑华,梁永霞译.CiteSpace Ⅱ:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,(3):401-421.

[11]李杰,陈超美.CiteSpace:科技文本挖掘及可视化[M].北京:首都经济贸易大学出版社,2017.

[12]雷晓康,陈泽鹏.国内政府治理研究热点和发展趋势的知识图谱分析——基于CSSCI数据库(2000—2019)的可视化研究[J].济南大学学报(社会科学版),2021,31(01):108-117+159.

[13]庄少霜.近二十年国外认知语言学;领域研究的可视化分析——基于CiteSpace II的计量分析[J].哈尔滨学院学报,2016,(8):97-101.

[14]亓海峰,廖建玲.基于记叙文和议论文的汉语二语写作发展研究[J].世界汉语教学,2019,(4):563-576.

[15]周文华.零起点汉语学习者书面语复杂度、准确度的动态发展——以4名预科学生的周记追踪为例[J].世界汉语教学,2022,(1):130-144.

[16]邢加新,罗少茜.任务复杂度对中国英语学习者语言产出影响的元分析研究[J].现代外语,2016,(4):528-538+584-585.

[17]刘兵,尉潇.任务组织方式对在线英语写作任务准备和产出的影响[J].中国外语,2019,(6):67-74.

[18]张煜杰,蒋景阳.任务复杂度对二语写作复杂度和准确度的影响[J].西安外国语大学学报,2020,(4):49-54.

[19]白云,韩佶颖,王俊菊.反馈方式对二语写作语言复杂度的影响[J].外语教学理论与实践,2022,(1):111-121.

[20]赵秋荣,孙培真.译者多重身份对译者行为影响路径的语料库考察——以《传习录》英译本为例[J].外国语文,2024,(1):131-143.

[21]朱周晔,王金铨.文体差异、语言特征与学习者汉英翻译质量的关系研究[J].中国外语,2020,(4):58-68.

[22]吴继峰,刘康龙,胡韧奋,周蔚.翻译汉语和原创汉语句法复杂度对比研究[J].外语教学与研究,2023,(2):264-275+320-321.

作者简介:

王艳金,男,汉族,江西信丰人,硕士,浙江传媒学院国际文化传播学院讲师,研究方向:句法学。