王 淼
(辽宁师范大学 国际教育学院,辽宁 大连 116029)
二语加工研究的主要研究内容是非母语使用和习得的心理过程。它借用心理语言学的研究方法和理论框架,发现和研究二语加工的特殊问题,并为了解二语习得的心理过程提供证据[1]。在认识人脑的认知方式、进行二语习得研究与教学实践等方面均有着重要意义。
本文运用陈超美教授开发的科学计量分析软件CiteSpace,整理分析国际二语加工研究相关文献,通过可视化知识图谱动态呈现国际二语加工研究的整体图景,客观描述二语加工的研究前沿及研究趋势,以期为国内二语加工研究提供借鉴与参考。
本研究以Web of Science数据库作为基础数据库和样本来源,采用高级检索方式,对学术期刊进行文献检索,文献来源类别为 Web of Science 核心合集。检索条件如下:TS=(“second language”)AND TS=(processing);文献类型为“论文”“会议录论文”“综述论文”“在线发表”;类别为“linguistics”;语种为“English”;检索时间为 2022 年 1 月14日。经过数据的标准化和剔除重复数据等处理后,共获得引文数据2 081篇。对所得数据进行发表年度趋势统计,发现从2008年始,本研究领域发文量呈明显上升趋势,因此将2008—2021年的1 691篇文献作为本文的研究对象。
本研究以量化研究为主,运用CiteSpace(5.8R3版)可视化软件对二语加工研究的文献数据进行可视化分析。在“Selection Criteria”面板选择“g-index”,阈值设置为25,Time Slicing 设为2,其他设置均选择默认选项。结合阅读文献内容,对CiteSpace生成的可视化知识图谱进行深入解析。为保证软件数据分析的可靠性和准确性,对数据分析结果呈现出的关键文献进行人工阅读、分析和总结,以此获取信度较高的结论。具体分析方法将在下文中结合图谱解读进行详细介绍。
本研究包括两个主题:(1)2008—2021年国际二语加工研究前沿分析;(2)2008—2021年国际二语加工研究趋势分析。本研究采用CiteSpace提供的文献共被引及聚类分析功能,探测国际二语加工研究前沿;采用突现检测和结构变异功能,探测国际二语加工研究趋势。
探测学科研究前沿以及研究趋势的变化,有助于研究者科学地辨识某一学科领域知识结构的内在联系、演变过程,为进一步的科学研究提供参考性依据。
最早提出“研究前沿”概念的是普赖斯,他认为某个研究前沿大概由40~50篇最近发表的文章组成[2]。CiteSpace为了探测某一学科的研究前沿,将引证分析(历时性)和共引分析(结构性)综合起来,创建了从“知识基础”映射到“研究前沿”的理论模型[3]。
1.文献共被引分析
2008—2021年国际二语加工研究文献共被引图谱(见图1)中的点(节点)表示引文,连线表示引文之间的共被引关系,本知识图谱中含有节点602个,连线2 168条,节点大小代表文献被引频次的高低。
图1 2008—2021年国际二语加工研究文献共被引图谱
高频被引文献表示对该主题研究具有突出贡献和价值的文章。CiteSpace 提供的文献共被引图谱可以帮助我们通过图谱中的关键节点、聚类及颜色的深浅,进行前沿分析、领域分析、科研评价等[3]。CiteSpace可按被引频次的高低导出被引文献信息。本文将对2008—2021年国际二语加工研究的前5篇高被引文献进行讨论分析。
排名第一的高被引文献是Bates等人发表于2015年的文献[4],被引频次为56次。文章介绍了如何运用R语言平台中的lme4包完成模型的参数估计,详细描述了该模型的结构、评估分析偏差的步骤、约束最大似然估计法的准则。Bates通过混合模型实例、数学原理呈现以及lme4包应用,使用户能够参考本高被引文献,调用R语言中的lme4包,建立混合模型,解决实际问题。
排名第二的高被引文献是Clashen & Felser于2006年发表的文献[5],被引频次为39次。文章采用实验心理语言学技术对不同群体语言学习者的语法加工过程进行了详细研究,发现成人母语者倾向于采用以句法结构为导向的加工策略,而二语学习者则更倾向于利用词汇、语义线索为指导。Felser在后续的研究中对所提出的“浅层结构假说”进行了进一步的阐释[6]。12年后,Clashen针对学界的误解和后期的研究成果对“浅层结构假说”的某些问题进行了澄清,并提供了解释性的补充说明(详见下文“聚类分析”)。
排名第三的高被引文献是Barr等人发表于2013年的文献[7],被引频次为32次。文章提出线性混合效应模型(LMEM)在心理学和相关领域中的作用越来越突出,通过理论论证和蒙特卡罗模拟,如果使用最大化随机效应结构,线性混合效应模型的普适性最强。因此,最大线性混合效应模型应成为心理语言学及其他领域验证性假设检验的“黄金标准”。
排名第四的高被引文献是Hopp发表于2010年的文献[8],被引频次为23次。Hopp进行了四项有关二语形态句法的实证研究,结果显示二语形态句法发展不存在关键期,学习者非本族语法和本族语法的加工系统本质上相同,不存在根本性差异,二者的区别仅在于,由于母语的影响二语系统运算效率偏低。
排名第五的高被引文献是Kuznetsova & Brockhoff发表于2017年的文献[9],被引频次为22次。文章提出运用R语言中应用最普遍的lme4包进行混合线性分析时,可以将lmerTest包用于检测lme4对象的固定因子和随机因子。lmerTest包扩展了lme4包的一些功能,为使用者提供了更为方便的进行总体均值计算和多重比较检验的方法。
一般来说,发表时间早的文献往往比发表时间晚的更能获得较高的引文量,比如Clashen & Felser于2006年发表的文献[5],但是通过对高被引文献的分析我们发现,一些发表较晚的文献,如Bates等人发表于2015年的文献[4]和Kuznetsova等人发表于2017年的文献[9],也都获得了较高的引文量,表明这些文献近年来在国际二语加工研究领域受到了较高的关注。高被引的5篇文献中,有3篇均与数据量化分析方法有关,可以看出计算机智能算法和程序等相关领域的研究越来越多地应用到二语加工研究中,跨学科融合特点日益凸显。
2.聚类分析
共被引文献聚类表征着当前活跃的研究领域。依据网络结构和聚类的清晰度,CiteSpace 提供了模块值(Q值)和平均轮廓值(S值)两个指标,这两个指标可以作为我们评判图谱绘制效果的依据。
本研究的聚类图谱中,Q值为0.754 7,S值为0.896 9,因此可以认为该共被引知识图谱中聚类主题的区分度较好[3]。包含文献数较少的聚类往往不如较大的聚类具有代表性[10],因此本研究仅对规模大于20的前11个聚类进行讨论分析。
文献共被引还可以通过CiteSpace提供的时间线视图(timeline view)方式进行呈现。在时间线视图中, 各个聚类按文献数量情况从高到低纵向排列,代表了各个聚类的重要程度,还可以看出各个聚类中被引文献的时间跨度以及某一个特定聚类研究的兴起、繁荣以及衰落过程[11]。
对于每个聚类,研究者尤其需要关注大型节点或深色年轮状节点,因为具有这样特征的节点表示此文献或者为高被引文献或者为突现引文(citation burst)或者兼而有之[12]。本研究的时间线视图见图2。
图2 2008—2021年国际二语加工研究文献共被引图谱(时间线视图)
从图2可以看到,聚类1、2、3、8包含了大部分大型节点或深色年轮状节点,表明这四个聚类构成了2008—2021年国际二语加工的主要研究前沿,具体分析如下。
聚类1,语法性别一致(gender agreement)。本聚类包含了二语加工领域早期的一些重要文献,高被引文献除了已探讨过的Clashen & Felser发表的文献[5],还有Hopp于2006年发表的文献[13]和Sabourin & Stowe于2008年发表的文献[14],被引次数也均在15次以上。Hopp进行了大量的实证性实验来探讨语法性别一致问题,发现学习者的语言水平对于目标语加工起着至关重要的作用。Sabourin & Stowe对比了不同语言学习者动词语域依存性和语法性别一致的脑神经加工数据,发现当目标语的语法结构和母语类似时,实验探测出 P600 指标,表明母语和二语在句法结构相似时加工过程相同,母语和二语相似性与句法加工的一致性呈正相关。
聚类2,二语句子加工(second language sentence processing)。本聚类的时间跨度最长(2004—2016年),可见本聚类涉及的研究前沿在相对较长时间内一直受到关注。Felser & Roberts利用图片启动任务研究了英语二语学习者对含有类似wh-依存关系句式进行的实时加工,发现二语者难以表征具有复杂层级结构的句子,因为二语者的心理表征缺乏抽象的语言结构[15]。Sorace在2006年提出了“界面假说”,后又对其进行了修正,认为作为外部界面的“句法—语用”界面和“句法—语篇”界面对于二语学习者来说是非常难以习得的部分,因为处理外部界面需要完成更多的加工任务,二语学习者很难达到母语者的加工水平[16]。本聚类中的其他文献也从不同角度对二语句子加工机制进行了探讨。
聚类3,预测加工(predictive processing)。本聚类包含了前文提到的3篇高被引文献,即Bates等人发表的文献[4],Barr等人发表的文献[7]和Kuznetsova等人发表的文献[9],以及突现值高于6的7篇引文(本聚类共含48篇引文),同时本聚类的出现时间较晚(2009年始),表明“预测加工”在二语加工研究领域是近期较为重要的研究前沿。如前文所述,计算机领域的成果已经越来越多地应用于心理学和心理语言学领域,而且线性混合效应模型在数据分析中具有更多的优势。Clashen&Felser在澄清一些误解的基础上进一步阐释了“浅层结构假说”,认为无论是母语者还是二语学习者的语言加工策略都不是一成不变的,针对不同情况都会采用“浅加工”和“深加工”路径[17]。也有研究认为,就句子加工机制而言,母语者和二语者在预测方面本质上是相同的,区别就在于母语者和二语者的预测性激活[18],或由于预测的认知资源不足[19],或由于检索的干扰[20],减缓了预测的形成。本聚类集中探讨的就是学习者个体在编码、存储、检索等方面的差异,进而推进对学习者语言预测加工机制的了解。
聚类8,电生理技术(electrophysiological approaches)。Dowens 等人以22名英语为母语的西班牙语二语高水平学习者为被试,收集了他们进行数与语法性别一致加工时的事件相关电位(ERP)数据。实验分母语组及二语组进行,结果支持母语迁移假说,当母语与二语有重合时,高水平学习者在二语加工过程中可以诱发与母语者相似的P600效应[21]。Foucart&Frenck-Mestre利用ERP技术考察了母语和二语相似性对于二语加工的影响。该结果进一步证明二语中的句法加工受到母语与二语句法规则相似性的影响[22]。Morgan-Short等人采用人工语言学习范式学习人工语言BROCANTO2,结合ERP技术,研究二语学习者在显性学习和隐性学习两种不同的学习方式下的语言性别一致加工问题。被试在加工 BROCANTO2 时产生了和自然语言相似的大脑活动特征[23-24]。本聚类中的其他文献也都与电生理技术在二语加工研究领域的应用有关,由于电生理技术能够精确获取人脑认知加工的动态信息,增强实验结果的可信度,因此成为二语加工领域的研究前沿。
其他聚类也代表了二语加工研究的不同关注点。比如,聚类0,眼球追踪(eye tracking),是最大的聚类,包含85篇引文。近些年大量的实证研究证明眼球追踪技术优于其他的研究方法,如有声思维、自定步速阅读任务等,并且认为眼球追踪可能是二语习得研究的一个有价值的补充[25]。聚类5,二语水平(second language proficiency)。二语水平如何影响二语学习者的二语加工机制进程一直备受学界关注。同时也有不少研究开始关注语言水平对三语习得的影响,并提出了语言类型优选模型(TPM)[26]。聚类6,从人体神经学角度对二语学习者本身展开研究。有研究证明二语学习经历对大脑有可塑性,可以引发大脑功能重组,当然这种可塑性与习得年龄和语言熟练度有关[27],然而大脑结构如何因双语经历而改变仍然是一个有争议的话题。如何将“模糊的视图(hazy view)”变得清晰可见,正是研究者关注的课题。聚类10,领域一般性听觉加工(domain-general auditory processing)。有研究表明,听觉模式与语言结构的各个层面关系密切,包括语音、韵律、词汇和语法特征等。而听觉加工与二语习得成功的相关性超过了习得年龄、居住时长等因素[28]。因此,探索二语学习者的听觉加工机制, 对进一步认识听觉加工的本质有重要的意义。
以上聚类代表了二语加工的主要研究前沿。聚类分析表明,目前二语加工研究方向较为分散,没有形成较大、较集中的研究主题。
科学研究的新趋势是研究者们始终关注的话题,探测学科未来研究趋势的变化可以帮助研究者更好地开展科学研究。通过动态可视化方式可以更加直观地展现研究趋势。
1.突现检测分析
对最新的持续一段时间的突现引文进行分析,可以在一定程度上揭示某一领域的未来研究趋势[29]。本研究即采用CiteSpace突现检测功能提取突现引文,并结合二次文献法,将今后的研究趋势归纳为以下几类。
(1)跨学科实验研究范式持续增加
二语加工的研究范式不断演进。随着信息技术、认知心理学和脑科学的不断发展,利用眼球追踪技术和脑成像技术来收集脑神经加工数据,探究脑神经加工的实验范式不断增加。Elgort等人采用眼球追踪技术探索荷兰语母语者进行英语阅读时的眼球运动轨迹,发现随着学习次数累加,新词加工时间出现从高速到平缓的变化趋势,甚至出现“平台期”[30]。
眼球追踪技术还被应用到词汇加工领域。Godfroid等人通过为期两天的眼球追踪阅读实验,探讨学习者在阅读长篇真实语料时,如何随着新词的复现对其进行加工和习得。通过生长曲线模型发现复现率能预测新词的习得,证明了在词汇习得中重复的重要性,建议语言教师在教学过程中制定高标准,提供丰富语料,培养学习者终身自主学习能力[31]。
传统的认知神经科学研究通常采用ERP研究大脑对视听刺激的加工过程。Caffarra等人回顾了现有的二语句法加工的ERP研究,以确定各因素在二语加工过程中的相对权重,并进行了Logistic回归分析。结果表明,沉浸时间与和句法加工早期机制相关的ERP呈正相关,而整体水平与和后期语言监控活动相关的ERP呈正相关[32]。
本聚类中的其他文献也探讨了二语加工研究的跨学科研究实验与研究范式,基于眼球追踪技术和ERP技术的在线任务,能更敏感而准确地捕捉到被试的语言加工动态,因此更受推崇。
(2)量化质化研究方式有机结合
二语加工研究趋向于量化质化研究相结合,计算机程序或者软件广泛应用于二语加工研究。运用R语言辅助二语加工研究的实验范式持续增加。Bates详细介绍了如何运用其开发的lme4包构建混合效应模型,进行数据分析[4]。Matuschek等人指出,在心理学和心理语言学领域,线性混合效应模型越来越多地代替方差分析,为其他领域研究者在应用线性混合效应模型建模时提供了借鉴与参考[33]。
二语加工研究的核心议题之一是二语语音加工。Boersma & Weenink开发的语音学软件Praat是一款跨平台的多功能语音学专业软件,可以采集语音,并将其做数字化处理、分析,生成各种语图,以及对语言学数据进行统计分析,可以为语音加工研究提供重要的数据支撑。
元分析可以审视研究设计、数据分析和结果报告的科学性、规范性,对具体的统计方法和统计指标进行系统评价,以保证研究具有理论及实践的参考价值。Plonsky & Derrick选取537篇二语研究领域的文献,对其内部一致性、评分者和评分者间的信度系数进行元分析,证明不同研究设计,包括样本数的大小、测量工具的差异等,都可能造成信度系数的差异,并发现内部一致性系数值最低,同时研究提供了一组一般的可靠性估计范围,为研究人员在信度系数选择和解释方面提供参考,并建议加强对二语教师及研究者进行包括心理测量学等方面的培训[34]。
除了主流的量化和心理测量手段,学者们还注重质化研究。Dornyei&Ryan在二语习得领域个体差异研究重心转变背景下,在《语言学习者学习心理“再探”》一书中总结2005—2015年的最新研究成果,提出了质化研究方法,即叙事研究[35]。
由此可见,各种计算机程序和软件的应用拓宽了二语加工研究的范畴,为二语加工研究的量化研究提供了科学翔实的数据支撑,同时质化研究、混合式研究等多种研究方法也越来越多地应用于二语加工研究。
(3)多层面研究向纵深方向发展
二语加工研究开展得比较多的三个方面是语音加工、词汇加工、句子加工[1]。现在越来越多的研究将二语加工的关注点放到了预测加工、语篇加工以及情绪词汇加工等方面。进行补充性说明后的“浅层结构假说”继续为二语加工研究提供理论支撑[17],使二语加工研究不断向纵深发展。
预测加工对语言研究最重要的贡献之一是,改变了人们对理解和产出关系的认识[36]。Kuperberg & Jaeger运用反应时研究范式,发现语言理解具有预测性,是一个迅即的过程。预测性激活的水平和程度依赖于理解者的目标、先验知识和自下而上的信息输入[18]。
眼球追踪技术和电生理技术等多种实验方法的出现和发展,推动了预测机制的研究进程。Hopp通过两个实验探讨了成人第二语言习得中性别一致性的预测加工[37]。Cunnings还发现,二语学习者与母语者句子加工机制本质上是相似的,其加工过程的差异只是一种量的差别,是由二语加工认知资源受限而导致检索受到干扰[20]。此研究结果与Hopp的观点一致。
词汇加工继续向纵深发展。以往研究大多通过行为和脑电实验探究情绪词加工机制,而Kazanas & Altarriba采用双语样本对双语者的两种语言情绪标注词和情绪负载词的加工机制进行了对比研究,发现因为情绪标注词更直接地表达情绪,其内涵会迅速吸引学习者的注意力,促进词汇的加工,反应时更短,正确率更高,情绪标注词比情绪负载词所产生的启动效应更大。因此,今后的研究应该对两类情绪词进行区分, 分类别探讨认知加工机制上的异同[38]。
相较于语音加工、词汇加工和双语加工,二语加工研究的语篇加工较少。Barkaoui考察了54名不同二语水平、不同键盘操作能力的二语学习者,在应对不同计算机定时写作任务时进行实时写作修改的表现[39]。通过阅读本被引文献的重要施引文献,发现学者们开始关注计算机辅助二语写作研究[40-42]。本研究推测这将为二语综合加工研究(包括词汇加工、句子加工、语篇加工等)提供新的切入点。
(4)不同情境下对比性研究加强
二语加工和二语习得密切相关,不同教学方法及不同语境对二语习得与二语加工的影响也越来越受到学者们的关注。Long在《二语习得和任务型语言教学》一书中,全面阐述了任务型教学(task-based language teaching,TBLT)的心理语言学基础和实施方法,提出了认知—互动理论(cognitive-interactionist theory),认为显性学习更能促进成人学习者二语加工机制的发展[43]。很多研究为此理论提供了实证性的支持。Cerezo等人采用两项产出性任务,考察70名大学生复杂西班牙语gustar结构加工的情况。研究结果表明,在完全在线的环境下,显性归纳式教学方式优于显性演绎式教学方式[44]。
《二语习得理论》第六章“技能习得理论”由DeKeyser撰写。DeKeyser认为人们习得技能时都要经历三个阶段:陈述性阶段、程序性阶段和自动化阶段。语言习得作为技能习得的一种,必定也要经过以上三个阶段[45]。同时,进行精细化、个性化、具体化的练习后,才能“习得技能”。通过阅读该被引文献的重要施引文献发现,很多研究为“技能习得理论”提供了实证性的支持。有研究探讨了不同的语言训练方式,如感知训练对语音加工的影响[46]、不同学习语境对学习者二语习得与二语加工的影响[47]。
2.结构变异性分析
如果一篇文献在引文知识图谱中构建了跨越不同主题边界的新奇的引文轨迹,引起了知识图谱结构的变异,那么我们可以就此推断,此引文可能具有引发新的研究结构的潜力[48]。CiteSpace能够通过模式性变化率(ΔM)、聚类间链接变化率(ΔClw)和中心性分散度(ΔCkl)对知识图谱的结构变异情况进行计量[49]。
通过分析发现,Morgan等人发表于2010年的文献[23](以下称文献1)和Sagarra & Herschensohn发表于2010年的文献[50](以下称文献2),其ΔM、ΔClw、ΔCkl三个计量指标值均处于较高水平,这两篇文献又同为较重要的被引文献,尤其是文献1突现值高达7.04,说明两篇文献对知识图谱结构变异的影响力很大,是引发新的结构变异的潜在标志。文献1探讨了显性教学和隐性教学对学习者二语加工的影响(见上文“聚类分析”);文献2通过在线自定步速实验和离线语法判断任务实验,发现所有被试离线语言加工任务表现一致,中级水平二语学习者和母语者在线语言加工任务表现一致。图3展示了两篇文献引起知识图谱结构变异的引文轨迹,文献1见左图,文献2见右图。两篇文献的引文轨迹结构相近,但有所不同。文献1引文轨迹跨越了四大聚类,分别为1、2、4和8号聚类,文献2引文轨迹跨越了1、2、4和11号聚类,两篇文献发表的年份同为2010年,且通过分析影响知识图谱结构变异的文献,发现影响力较大的引文中有50%的文献发表于 2010 年,说明2010年是引起二语加工研究知识图谱结构变异的重要年份。通过对施引文献的进一步阅读、分析,本研究推测各种实验范式的结果是否在自然语言环境下具有同样解释力,同时二语加工研究成果如何有效应用于三语乃至多语加工,有望成为今后研究关注的方向。
图3 文献1(Morgan et al., 2010)和文献2(Sagarra & Herschensohn, 2010)引文轨迹
以Web of Science数据库为依托,以可视化软件CiteSpace为工具,本文考察了 2008—2021年间国际二语加工研究的发展现状、研究前沿与研究趋势。首先,从文献发表年度趋势的统计看出,二语加工研究一直是学界关注的重点,发文数量总体呈上升趋势;其次,通过文献共被引和聚类分析功能,探测二语加工研究前沿,发现学界关注点比较分散,没有形成较大、较集中的研究前沿;最后,通过突现检测和结构变异分析发现,二语加工研究趋向于量化质化研究相结合,基于计算机程序的实证或实验研究是主流范式。跨学科研究方法尤其是结合脑神经科学和计算机科学的研究方法快速增长,研究层次也逐渐向纵深发展,不同情境下的对比研究不断拓展,同时增强各种研究范式在三语和多语加工研究中的应用效力以及在自然语言环境下的解释力,有望成为今后的研究方向。