基于文献计量分析的国内日语二语习得研究现状与展望(2012—2022年)

2023-12-05 10:38洪春子
东北亚外语研究 2023年4期
关键词:二语日语语料库

王 冲 洪春子

(大连理工大学 外国语学院,辽宁 大连 116023)

第二语言习得研究始于20世纪60年代末,主要分析学习者的第二语言特征及其发展变化,论述影响第二语言习得的因素,探讨第二语言习得机制。其发展经历了对比分析、偏误分析与中介语理论三个重要阶段(迫田久美子,2020)。目前心理语言学、神经语言学、语用论、语料库语言学、社会语言学等众多领域的理论、方法被引入二语习得研究,其研究范围及视角日趋扩大,跨学科特色凸显,研究呈现百花齐放的态势。

第二语言习得的概念从20世纪70年代开始被引介到国内,20世纪80年代国内涌现出了相关研究,但多以英语的习得研究为主。初期的日语二语习得研究多为偏误分析,如赵福全(1980)、朱万清(1981)等。而中国知网的检索结果显示,作为与日语“二语”(非母语)习得相关的描述,“习得”一词早期在论文题目中有所体现的是杨秀娥和陈俊森(2005)、翟东娜(2006)等的论文。其中,翟东娜(2006)以认知语言学的原型概念为中心,基于日语教学中几个难点语法、词汇的二语习得研究结果,探讨了对教学的启发,可以说是早期将认知语言学理论与日语二语习得相结合的代表研究之一。张佩霞和吴宇驰(2013)考察了2000—2011年间刊登在《日语学习与研究》的国内日语教学相关的研究现状,指出国内日语二语习得领域的语言对比研究和学习者偏误分析比重过大的问题。冷丽敏和郭朝暾(2022)基于中国知网数据对2001—2021年间日语二语习得研究的相关论文进行分析,指出现阶段对比语言学、偏误、母语迁移视角下的日语语言知识习得研究居多,而认知语言学视角以及实证类的研究较少。

由此可知,国内日语二语习得研究近年虽得到一定的关注,但研究略显薄弱,还具有很大的发展空间。二语习得研究主要描述学习者的第二语言特征及其发展变化,阐释习得的机制,涉及语言学、心理学、心理语言学、神经语言学、认知科学、社会语言学等众多方面,故分析其现状尤其探讨其发展动态需聚焦除“偏误”“中介语”“语言习得顺序”“母语迁移”之外的更广范围的主题词。

为进一步推动国内日语二语习得研究,本文首先以近十年国内日语习得类研究为对象,基于文献计量分析考察该领域研究的整体发展现状。并在此基础上聚焦发表在国内外语类核心期刊的该类论文,基于其研究内容的主题词汇,进一步探讨该领域的发展趋势。

一、国内日语二语习得研究整体现状分析

(一)研究方案

本文选取的数据来自中国知网(CNKI),包含“学术期刊”“学位论文”“会议论文”数据库。文献检索时,在CNKI中选择“高级检索”类型,选择“主题”检索①,检索条件为“日语*习得”,并从检索结果中去掉“留学生”“汉语母语者”“汉语习得”等主题,文献收录时间覆盖2012年1月1日至2022年12月31日,共获得相关论文数据353篇,包括作者、文献来源、题名、摘要、关键词、发表时间等字段。

本文借助文献计量工具CiteSpace软件,首先对上述353篇日语二语习得研究相关论文进行可视化分析,从整体上考察这十余年国内日语习得类研究的热点、动态和趋势,根据CiteSpace的分析结果,系统地梳理该领域的文献及其内容。

(二)国内日语二语习得研究整体研究热点

关键词是文章核心内容的浓缩及提炼,高频关键词是指该研究领域研究者使用最多的关键词,高中心性关键词是指连接多篇文章起着枢纽作用的关键词,二者代表着一段时间内研究者共同关注的问题以及研究热点。本文借助 CiteSpace软件,对2012—2022年期间发表的353篇国内日语二语习得研究相关论文的高频关键词及其中心性进行了定量分析,形成研究热点领域的可视化共现知识图谱。本文选取了词频不低于5的18 个高频关键词进行数据统计,详情见表1。根据表1可以看出,这十余年间国内日语习得类研究不只局限在二语习得,也包含了三语习得。研究主要集中在偏误分析(误用、误用分析、偏误)、教学(日语教学)、中介语、习得顺序、复合动词、促音等方面,研究方法多为问卷调查。促音及复合动词两个关键词分别首次出现在2016年、2017年,其他关键词几乎都出现于2012—2013年。

表1 国内日语二语习得论文高频关键词及中心性统计(2012—2022年)

本文在词频分析的基础上进一步考察了关键词共现分析。共现分析是对一组词两两统计它们在同一组文献中出现的次数,通过共现次数来测度一组词间的关联强度,进一步确定这些词所代表的学科或领域的研究热点。研究设定时间跨度为2012—2022年,时间间隔为一年,采用Pathfinder算法和对整个网络进行修剪的修剪策略,得到国内日语二语习得研究领域的关键词共现知识图谱,详情见图1。图1中几个比较大的关键节点(深色圈节点)代表中心性和频次都比较高的关键词。图1中共有261个节点,306条连线,密度为0.009。总体上关键词共现网络结构仍比较松散、密度不高,表明领域研究内容涵盖的范围很广,如图1中可观察到的促音、复合动词、情感表达、指示词、动作动词、可能表达、授受表现等关键词;研究视角丰富,如图1中可观察到的对比分析、偏误分析(误用分析)、语言迁移(母语迁移)、感知同化、习得顺序、习得策略等。数据多来源于问卷调查,也有基于语料库的研究。这与二语习得研究本身具有的跨学科特点相一致。除此之外,由于习得类研究的实践性特征,其与日语教学的结合也是必不可少的。

图1 2012—2022 年国内日语二语习得研究论文关键词共现图谱

为进一步探讨国内日语二语习得研究领域的热点,本文利用CiteSpace软件进行聚类分析,生成关键词共现的聚类标签视图,详情见图2,结合关键词共现进行综合分析。CiteSpace的关键词聚类功能侧重于体现聚类间的结构特征,突出关键节点及重要连接,可明确某研究领域的热点和发展趋势(王雯婷 马小兵,2020)。如图2所示,关键词共现聚类图谱形成了10个主要聚类(聚类0-9)②。作为评判聚类图谱绘制效果的指标,模块值Modularity即Q值,越趋近于1表示网络聚类结果越好;平均轮廓值Mean Silhouette即S值,若在0.5以上,则认为聚类是合理的,大于0.7时,则认为聚类是高效的。本聚类图谱Q值为0.8597,S值为0.9371,聚类结果较好,聚类效率较高。

图2 2012—2022 年国内日语二语习得研究论文关键词共现聚类图谱

聚类0“二语习得”和聚类1“习得状况”、聚类2“习得”、聚类6“习得研究”标签名称类似,因此将这几个聚类统一归并至聚类0。归并后共有6个聚类,从大到小依次为:二语习得(聚类0)、日语(聚类3)、三语习得(聚类4)、日语学习(聚类5)、他动词(聚类7)、误用分析(聚类9)。鉴于日语学习(聚类5)与本研究主题即日语二语习得相关,故将其归并至聚类0“二语习得”,结果如表2所示。在此逐一进行讨论。

表2 关键词聚类情况

聚类0 二语习得,从具体研究内容来看,包括词汇句法层面的接续词、助词、搭配、多义动词、指示词、使役态、授受表现、寒暄语、感谢表达、敬语、基础日语等;从研究定位来看,包括日语教育、教学实践等;从研究视角来看,包括使用倾向、中日对比、负迁移等;从研究方法来看,包括问卷调查、回归分析等。

聚类3 日语,以日语的基础词汇、同形词、中介语为研究对象,探讨包括高职日语、二外日语的教材、教学等。

聚类4 三语习得,此聚类的研究多以语言、外来语为研究对象,通过对比分析、偏误研究分析日语作为第三语言的学习效果,双向考察母语迁移的影响,探讨教学策略。

聚类7 他动词,从原型义、意义扩展等角度探讨动词语义的习得顺序、习得过程、使用频度等。

聚类9 误用分析,聚焦人称限制、主句限制等,通过问卷调查分析日语使用状况、习得情况、使用意识等。

综上所述,日语习得类研究这十余年不仅研究第二语言,第三语言习得研究也有所涉猎。研究对象不仅包含普通高校日语专业学习者、高职院校日语学习者,也涉及二外学习者。研究内容涵盖了词汇、语法、语音等较广领域。研究多从对比分析、偏误分析、中介语等视角展开,研究方法多采用问卷调查,导致探讨的迁移现象多局限在母语的语言迁移层面。未来应在研究视角上寻找新的切入点,引入新式研究方法,深入挖掘日语二语习得特性,开展多视角、多层面研究,有效提升研究创新性。

(三)国内日语二语习得研究整体研究趋势

本文进一步通过突现词考察国内日语习得类研究趋势。CiteSpace 软件提供了突变检测算法,该算法从文献的关键词等提取出使用频次突然明显增多或短时间内突然出现的术语(即突现词),根据突现词的词频变化可以判断研究领域的前沿与趋势。本文运用CiteSpace软件基于2012—2022年期间发表的353篇国内日语二语习得研究相关论文的关键词,进行突现词分析,得到了12个突现词,详情见图3。

图3 2012—2022 年国内日语二语习得研究突现关键词

从时间序列来看,2015年以前的突现词为误用分析、中介语、正用、语言迁移、日语学习、误用;2016年、2017年未观测到突现词;2018年之后至今的突现词为问卷调查、习得研究、语料库、二语习得、接续词、使用频率。由此可知,从这十余年范围看,国内日语二语习得研究大致经历了学习者偏误研究、语言迁移研究、习得研究的发展阶段,研究方法趋向实证类,且呈现出从问卷调查向语料库转变的倾向。偏误分析类研究地位相对变弱,随着各种国内外日语学习者语料库的成熟,基于语料库的数据分析受到更多研究者的青睐。

二、国内外语类核心期刊中日语二语习得研究特征

前文分析了国内日语二语习得类研究的整体状况,为了更有针对性地探讨国内该领域的发展趋势,在此将研究对象进一步聚焦为这十余年刊登在国内外语类核心期刊的相关论文,对其特征进行分析。首先,基于前述353篇文献,从中选取了收录于15种外语类CSSCI(含扩展版)核心期刊(《外国语》《外语电化教学》《外语教学》《外语教学理论与实践》《外语教学与研究》《外语教育研究前沿》《外语界》《外语与外语教学》《现代外语》《中国外语》《解放军外国语学院学报》《外语学刊》《外语研究》《西安外国语大学学报》《日语学习与研究》③)中的论文。共获相关论文数据41篇④。具体为《日语学习与研究》19篇,《解放军外国语学院学报》8篇,《外语教学与研究》6篇,《外语与外语教学》2篇,《外语研究》1篇,《现代外语》2篇,《外语教学》1篇,《外语学刊》1篇,《外语教学理论与实践》1篇。

由于样本数量限制,本文采用Python语言进行了数据分析。以上述41篇论文的题目、关键词、摘要为文本,选取203个表示研究内容的主题词汇,绘制共现网络图,考察外语类核心期刊中日语习得类研究特征。设定所选取词汇的最小出现次数为5,得到有效节点65个,绘制主题词共现网络图。且根据主题词之间的共现关系将研究分成4类,研究主题词分别为语料库中介语、语音、迁移、加工机制4类。每类研究里标注了代表性论文,具体如图4所示。

图4 外语类核心期刊日语习得类研究主题词共现网络

本文整理了各类研究中的代表性论文,具体如表3至表6所示。由表3可知,这十余年内语料库中介语类研究未曾中断,研究材料多为学习者书面语料库,内容包括“テイル”“ル形和タ形”“有对自他动词”“助词”等教学难点项目的习得,研究方法多采用比例分析和卡方检验,分析日语学习者语料库中的中介语特征。

表3 语料库中介语类研究代表论文

由表4可知,语音类研究视点多样,研究内容主要包括促音感知、发音习得水平、发音自然度等。促音相关研究主要基于感知实验,采用逻辑回归模型等较为复杂的分析方法探讨学习者促音感知机制。发音相关研究多通过测试评价或实验的方法,比较日语学习者与日语母语者在发音水平上的差异,探讨母语(方言)对学习者的影响。

表4 语音类研究代表论文

迁移类研究多基于类型学理论、迁移相关理论、认知语言学相关理论展开,通过分析语言产出、理解过程中的二语使用状况,探讨语言迁移或概念(认知)迁移。研究内容不仅涵盖副词、格助词、复合动词等词汇的习得,也涵盖事件、构式的习得。迁移类型多以母语对目标语的正负迁移为主。分析方法多采用卡方检验,部分研究采用了分类树分析法,详见表5。

表5 迁移类研究代表论文

加工机制类研究主要基于心理语言学与神经语言学研究领域的E-prime实验与近红外脑成像技术等探讨了国内日语学习者二语词块(搭配)、屈折词形、形态复杂词等的认知处理机制。研究方法多为命名实验(产出)、词汇判断任务实验。分析方法多为方差分析、t检验以及线性混合效应模型,详情见表6。

表6 加工类研究代表论文

综上所述,刊登在外语类核心期刊的该类论文,整体上研究视角不断扩大,不仅包括语言对比分析、偏误分析、中介语分析,认知科学、心理语言学、神经语言学等领域也有所涉及。研究方法多样,除调查问卷外,语料库、心理实验等也逐渐应用于研究当中。分析方法也从比例分析、卡方检验等拓展到了多元方差分析、线性混合效应模型等较复杂分析方法,从而更深入地挖掘数据。讨论视角从基本的语言层面延伸到了认知层面,体现了语言习得研究的跨学科融合特色。研究内容愈加丰富,除词汇、语法习得外,也涉及语音类、词块、语用类、事件词汇化等的习得。从期刊角度看,《日语学习与研究》期刊中语料库中介语、语音、迁移类论文刊载数量都较多,而加工机制类研究主要刊登在《解放军外国语学院学报》《现代外语》《外语教学与研究》期刊上。

除此之外,从表5、表6的结果可以看出,迁移、加工机制类研究中的高产作者情况,以及加工机制类研究合作发文状况。研究绝不是孤立的,研究机构以及研究者可以利用各自的资源优势进行资源整合,达成合作研究。构建日语习得领域相关论文的高产作者和研究机构图谱,探讨不同研究机构及作者的发文情况以及合作关系,可有效促进日语习得研究领域学术交流与发展。

三、研究展望

目前,国内日语二语习得研究的研究领域日益扩大,研究范式不断更新,多维的研究视野和丰富的研究方法将为日语二语习得研究发展提供广阔的空间,无论是在理论探究还是实证研究方面均取得了一定进展。基于上述外语类核心期刊研究特征,本文试对该领域提出以下四个方面的展望:

第一,这十余年间研究者们从不同的理论框架对日语二语习得现象进行了验证。除了上文中提及的理论框架,基于使用取向、复杂动态系统理论等视角下的二语习得研究在国内外语界也受到了广泛关注(蔡金亭 王敏,2020;郑咏滟,2020),但相关研究以英语、荷兰语等欧洲语言为主,此类语言与日语在语言类型、形态特征等方面具有较大差异。因此,今后日语二语习得研究可以基于以上理论展开,在阐释日语二语习得机制的同时,验证并完善理论。

第二,基于语料库的习得研究一直以来都是日语二语习得研究的热点。语料库为研究者提供真实的语料,基于大量的语言数据更为客观地描写语言现象。随着学习者语料库的数量、种类的日趋增多,可通过语料库对比学习者书面语与口语中介语的异同,及利用语料库纵向数据探讨中介语的变异性。同时,基于心理语言学、神经语言学视角的日语习得研究也成为日语二语习得研究领域的特征之一。心理语言学、神经语言学领域常采用启动范式实验、近红外光学成像技术等方式收集数据,此类实时收集在线数据方法,能为研究者提供最接近自然语言处理的数据。以上两类数据收集方法侧重点不同,但不互相排斥。未来也可以将这两种方法有机结合,相得益彰(Falck & Gibbs,2012;Gries,2013)。

第三,二语习得受母语影响,迁移是习得类研究永恒的话题。如表5所示,至今国内大部分的日语二语习得研究关注了汉语对日语习得的正负迁移。有关迁移问题,除了母语对目标语的正向迁移,也有目标语对母语的反向迁移(徐庆利等,2013)。此外,迁移不只发生在语言层面,还可能发生在认知层面,即发生概念性迁移。Jarvis(2007, 2016)将概念性迁移分为概念迁移与概念化迁移。前者由不同语言使用者大脑中储存的概念结构的跨语言差异而引起,需通过非语言实验验证;后者则由不同语言使用者对特定情景或事件的概念知识加工过程以及形成与组织临时性表征方式上的跨语言差异而引起,主要通过语言实验验证。语言与非语言实验相结合,能够为概念迁移提供更有力的证据(蔡金亭 李佳,2016)。至今日语习得相关的迁移类研究还多以语言实验为主,今后可以将语言与非语言实验合理结合,从汉语对日语、日语对汉语双向迁移角度进一步深入探讨概念迁移机制。

第四,在统计方法上,日语二语习得研究至今常采用比例分析,通过统计观察数值占整体的比例来描述偏误的分布情况与母语者的差异等内容。也有研究者将比例分析与卡方检验、t检验等结合,检验比较值之间的差异是否具有统计显著性,但这些统计方法所能提供和验证的数据信息较有限。也有研究采用了线性混合效应模型、逻辑回归模型、分类树分析等较为复杂的统计方法。由于语言间的特征以及学习者属性特征具有多样性,语言习得会受到多种因素的影响,数据分析自然要求向多元统计方向发展。未来研究可以尝试将认知语言学领域中较常用的多元统计方法应用到习得研究,如聚类分析(Divjak,2010)、多维尺度分析(Hilpert,2011)等,这些探索性分析能够探索数据内在规律,通过树状图、多次元空间图等方式将不同母语者与不同学习者数据结构中语言差异更直观、形象地展示出来。同时,也可以利用如多元回归建模等验证性统计方法,分析影响习得的主要因素、交互因素并预测习得状况。

第二语言习得研究具有十分鲜明的跨学科属性,日语习得研究已不仅局限于日语专业。伴随新文科建设的推进,相信研究者能够开展更多的多视角学术创新,以实现日语习得领域研究的内涵发展。

注释:

① 主题检索是在中国知网标引出来的主题字段中进行检索,该字段内容包含一篇文章的所有主题特征。也就是说主题检索能检索出“题名、关键词、摘要”中包含检索词的所有文献。

② Pathfinder 算法能够简化网络并突出其重要的结构特征,因此图2 中没有显示聚类8。经人工处理发现聚类8 的标签名称为「甘い」,聚类较小且与其他主要聚类并无直接联系,不能判定其为日语二语习得研究的一大领域,故本文不将其作为讨论对象。

③ 《日语学习与研究》是国内日语界具有权威性的综合学术刊物,其他期刊虽英语相关研究较多,但投稿原则上不受语种限制。本文对这15 种期刊不做具体区分,一并分析。

④ 前述353 篇文献中共获取33 篇论文数据,因大数据筛选难免存在误差,故本文进一步以逐一阅读的方式从上述15 种外语类核心期刊中又人工选取了8 篇日语习得类相关论文,最终有效数据为41 篇。

猜你喜欢
二语日语语料库
从推量助动词看日语表达的暧昧性
明朝日语学习研究
《语料库翻译文体学》评介
《教学二语习得简介》述评
关于日语中的“のた”和“の”的研究
Ferris与Truscott二语写作语法纠错之争
国内二语写作书面纠正性反馈研究述评
基于JAVAEE的维吾尔中介语语料库开发与实现
二语习得中母语正迁移的作用分析
从语义模糊性看日语委婉表达