基于语料库的中国日语学习者复合动词习得研究*

2022-06-14 01:38
北方工业大学学报 2022年3期
关键词:偏误语料句法

陈 曦

(西安外国语大学日本文化经济学院,710128,西安)

日语中的动词根据其内部结构不同分为单纯词和复合词。其中复合词又可细分为“名词+动词”“动词+动词”“副词+动词”“形容词+动词”等四类。本文所探讨的是上述第二类,即前项动词的连用形(“V1”)加后项动词(“V2”)所构成的“V+V”型复合动词,如“切り落とす、読み始める”等。这一类复合动词约占日语母语者常用动词的40%,是日语词汇的重要组成部分。从形式上看,复合动词是两个独立动词的简单组合,但是其意义并非两个动词的直接叠加。前后动词的结合受诸多条件制约,结合之后两个动词之间呈现复杂多变的意义关系。因此对日语学习者而言,复合动词的习得较为困难。我们经常在中国日语学习者的语言产出中发现这样的复合动词偏误。①

例(1)是由于学习者无法区分“絞りこむ”和“絞る”,即本动词和复合动词的区别导致的偏误;例(2)是学习者未能掌握“とりあげる”和“とり入れる”的区别导致的偏误;例(3)则是由于学习者对自他动词以及复合动词结合条件的相关知识不健全所导致的自他动词“始める”“始まる”的偏误。

以上例句表明,中国学习者的复合动词使用意识和能力较为薄弱,即使日语达到中高级水平仍会出现类似例(1)~(3)的偏误。森田良行、姬野昌子、松田文子等学者均指出,日语教学界应充分认识到复合动词习得的重要性,加强对复合动词的体系性教授和指导。[1-3]近年来,日语教学视角下的复合动词研究不断涌现,但是其习得的落后局面仍未有根本改观。

如果外语教育的目的在于培养该语言的运用能力,那么调查学习者对该语言的使用情况就是外语教育的出发点也是目的地。在探究复合动词习得困难的原因时,不仅需要着眼于复合动词本身,更需要关注学习者的语言使用。通过与母语者的比较,明晰学习者在实际的语言交流中使用什么复合动词、如何使用复合动词,其偏误的类型及其成因是什么,可以为日语教学提供“教什么”“怎么教”的参考。然而,迄今为止围绕学习者复合动词使用的研究并不多见,学习者的使用情况、习得过程仍不明了。本研究基于语料库考察中国日语学习者的复合动词习得状况,并尝试提出面向中国学习者的复合动词教学建议。

1 研究现状

复合动词研究于1950—60年代兴起,一直是日语语言学领域的研究重点和热点。本体研究主要有两类。一类聚焦分类和结合条件,代表性成果有寺村秀夫、山本清隆、影山太郎、松本曜、由本阳子、何志明等学者的相关研究。另一类聚焦构造和语义,尤其是后项动词的语义特征及类义复合动词的语义辨析,主要研究者有姬野昌子、杉村泰、杨晓敏、许临扬等。1990年代汉日对比研究陆续出现,主要有待场裕子、汤廷池、望月圭子等学者的论著。总体而言,本体研究积累丰硕,对比研究尚未形成体系。随着日语教学研究的深入,2000年以后复合动词习得渐受关注,积累了一批相关成果。根据对象为个别复合动词还是整体复合动词、方法为实验调查法还是语料库研究法可分为以下三类。

一是从认知语言学或对比语言学视角出发,以构词能力强、语义复杂的复合动词为对象,通过句法判断、句子产出、多项选择等实验调查法进行的习得研究。其中最具代表性的是松田文子运用意象图式理论对“~こむ”进行分类,在此基础上就“~こむ”的理解和产出进行调查,提出在教学中使用意象图式促进复合动词习得的设想。[4]白以然以韩国学习者为对象,就“~だす”的习得进行考察,指出在语义理解方面存在母语迁移。[5]陈曦运用原型理论就中国学习者“~あう”和“~こむ”的习得难点及顺序进行探究,指出正确理解本动词的核心语义和周边语义,进而理解复合动词的整体语义是共通难点。[6]二是以整体复合动词为对象,通过问卷调查法、内省法等探究学习者使用情况、偏误类型及成因的研究。何志明以中国香港学习者为对象,对复合动词的习得难点和顺序进行了调查。[7]邹奇凤采用复合动词语句的汉译日测试法,分析了中国学习者复合动词的使用情况,将其分为“正用”“误用”和“非用”三类,总结了不同类型复合动词的习得顺序。[8]三是以整体复合动词为对象,利用语料库研究法就学习者复合动词使用情况进行调查或对偏误进行分析研究。其中陈曦的系列研究最具代表性。陈曦利用中介语对比分析法,就不同母语背景、不同语言水平的日语学习者口语和书面语中的复合动词使用进行了系统考察,指出学习者的使用频率及种类均明显低于母语者,且使用形式单调、语义单一还伴有较多偏误。[9-10]张楠利用KY语料库调查了中、韩、英学习者的复合动词使用情况,将复合动词误用分为“过用”“错用”“避用”三类,指出学习者缺乏句法知识,往往用单纯动词代替复合动词。[11]

这些研究从不同角度推进着复合动词习得及教学的发展。近年来,有学者提出国别化问题在日语教学中的地位和作用,开始为面向中国学习者的日语教学做出专题研究。这是在新的日语教学形势下为强化教学的针对性和适应性而做出的尝试。具体到复合动词教学,需要加入对中国的语言、文化背景以及对中国学习者的习得过程、认知方式的考量,从而探讨适合中国学习者的教学内容和教学方法。这是深化日语教学的必经之路,也是提升日语教学水平的必然要求。

基于此,本文以中国学习者为对象,采用中介语对比分析法,考察中国学习者口语中的复合动词使用情况,分析其复合动词偏误的类型及成因。通过此研究,为中国的复合动词教学创新提供基础数据,为今后的同类研究提供参考和思路,以期更好地服务于中国的日语教学。

2 研究方法和初步数据

本研究采用中介语对比分析法,利用日语母语者和中国学习者两种语料库,对两者的复合动词使用情况进行对比。一是试图从日语母语者语料库中获取典型的复合动词信息,二是通过两个语料库的比较来发现中国学习者复合动词使用特性,包括误用、多用、少用和回避等。典型可靠的母语信息对教学中复合动词的选择和安排、教学内容的设计、教学方式的使用等有重要意义。而复合动词教学质量的提高则需要了解学习者的复合动词使用情况,因为这些信息能为中国日语教学一线提供学习者会产生的偏离类型,即复合动词的习得难点所在。

本研究试图解决以下问题:首先,从量的方面来看,学习者和母语者在复合动词使用的总体趋势上是否存在差异?高频后项及前项动词分别是哪些、有何差异?其次,从质的方面来看,学习者会产出哪些类型的偏误?偏误产生的原因是什么?最后,基于以上问题的探讨,给出对日语教学的建议。

2.1 语料来源及处理

在选择语料时,最重要之处在于语料内容和形式以及数量的匹配,即可比性。本文选择同样以OPI②形式收集的学习者与母语者的口语语料为研究素材。学习者语料来自KY语料库,③母语者语料来自上村语料库。④人数均为50名,语料规模分别为314 784字和318 276字。从语料选择上保证了内容、形式以及数量的可比性。

首先对数据进行整合和清理后,用日语语素解析系统“ChaSen”(茶筅)对语料库进行赋码。然后用计算机编程语言Perl分别抽取两个语料库中的“动词连用形+动词”组合,手动剔除无关数据后形成复合动词一览表。按照前项动词、后项动词分别进行统计。基于影山太郎的研究成果,将复合动词分为句法型复合动词和词汇型复合动词两类。⑤并参照《日语能力考试出题标准》(2004年版),从难到易将所有复合动词划分为1级、2级、3级、4级词汇。

2.2 初步数据

两个语料库的总字数、动词数、复合动词总计词数及区别词数等情况的对比见表1:

从表1可见,在两个语料库中动词数分别占总字数的5.01%和5.46%,在动词使用频率上无显著差异(x2=2.20, ns)。学习者的复合动词使用频率(0.04%)不足母语者(0.11%)的半数,两者有显著差异。无论从使用频率还是种类上看,学习者的复合动词使用均明显低于母语者,学习者有重复使用同一复合动词的倾向(总计词数:x2=64.87,p<0.01;区别词数:x2=30.583,p<0.01)。也就是说,中国学习者口语中的复合动词使用数量少且形式单一,面向中国学习者的复合动词教学应引起重视。

表1 学习者和母语者的动词、复合动词使用概况

两个语料库中的10个高频复合动词,在学习者语料库中是“付き合う、出かける、乗りかえる、引き出す、見つける、取り上げる、つっこむ、取り入れる、話し合う、申しこむ”,在母语者语料库中则是“出かける、ひっこす、働きすぎる、付き合う、見つける、申し上げる、話しかける、差し上げる、恐れ入る、思い始める”。10个高频复合动词均占各自复合动词总计词数的30%~40%,“出かける”“見つける”“付き合う”为共通项目。词汇型复合动词在学习者语料库中的占比为90%,在母语者语料库中的占比为70%,即高频复合动词中词汇型复合动词的占比远高于句法型复合动词。复合动词位于词汇和句法的连接线上,兼具词汇和句法两方面的特性。迄今为止以松田文子为代表的复合动词习得研究多聚焦复合动词的句法特性。由表1可知,教学不仅需要着眼于句法层面,更需要关注其词汇层面的特性。学习者高频使用的基本都是词汇型复合动词,是由于学习者将复合动词当作单纯动词来整体识记和使用,对句法型复合动词未形成意识,导致句法型复合动词输出贫乏。

学习者和母语者的高频复合动词,基本都在日语能力考试所划定的词汇范围之内,且语义简单者居多。母语者的使用中有“申し上げる”“差し上げる”等敬语复合动词,而学习者的使用中并未出现。这表明日语教学中需要加强敬语复合动词的教学。

3 调查结果与分析

复合动词的构成要素为前后两个动词,存在一些使用频率高、功能发达的前项和后项动词。日语的语法顺序为SOV,其语法结构一般遵循中心词居后原则。日语中除表示并列关系的复合动词(如“泣き叫ぶ”“思い描く”等)外,语义的核心基本为后项动词。如“~こむ”“~だす”“~かける”等构词能力强、语义复杂的后项动词是导致习得困难的重要因素之一。接下来分别考察后项、前项动词的使用情况。

3.1 后项动词使用分析

如表2和表3所示,学习者和母语者使用的10个高频后项动词中,有“~あう”“~だす”“~こむ”“~かける”“~つける”“~すぎる”“~あげる”等7个共通项目(加下划线的为共通项目,下同)。10个高频后项动词均占复合动词总计词数的一半以上,其中在学习者语料库中的占比为74.10%,在母语者语料库的占比为53.30%。可见在日语教学中优先安排这些后项动词能够有效促进复合动词习得。而相比于母语者,学习者倾向于频繁使用某几个后项动词的某一两个核心语义,说明学习者后项动词的词汇深度和广度有待扩展。

表2 学习者语料库高频后项动词Top10

以母语者使用最多的“~かける”为例。除“出かける”以外,“読みかける”“走りかける”等5种的前项均为动作性动词,“~かける”为其添加“开始”语义。学习者使用的3种11个“~かける”中,8个为“出かける”,另外3个是表示“搭话、打招呼”的“話しかける”和“しゃべりかける”。也就是说,学习者使用的“~かける”语义和语境都较为简单,对“~かける”表达“开始”的语义不甚熟悉。母语者除“~かける”之外,还使用“~はじめる”“~つづける”等表示

表3 母语者语料库高频后项动词Top10

“体”(“アスペクト”)的后项动词。然而在学习者语料库中,表示“体”的后项动词使用频数远低于母语者,且多见有关“~はじめる”“~はじまる”和“~つづける”“~つづく”等后项动词自他混用偏误。由此可见,学习者有过少使用表示“体”的后项动词倾向,且习得存在一定困难。学习者使用频率最高的是“~あう”,占学习者复合动词总计词数的14.50%,远高于母语者使用“~あう”的频率(8.70%)。

3.2 前项动词使用分析

如表4—5所示,10个高频前项动词中,“み~”“とり~”“つき~”“で~”“ひき~”“おもい~”“もうし~”等7个是共通项目。10个高频前项动词均占复合动词总计词数的一半以上,即存在频繁使用的前项动词,在教学中可优先安排重点教授。在学习者语料库中“み~”“とり~”分别占复合动词总计词数的10.70%和9.90%,高于母语者,可见中国学习者有过多使用“み~”“とり~”的倾向。

这一差异可从前项动词的特征上寻求解释。“ひき~”“とり~”等作为前项动词时,往往失去其原有的意义和功能,仅为后项动词添加某种属性。如“引っ返す”“取り囲む”中的“ひき~”“とり~”都只起加强语气、强调后项的作用。去掉前项,句子的语义不会发生根本改变,只会导致日语表达贫乏或欠地道。在复合动词习得和教学中,前项动词尚未引起足够重视。掌握如“とり~”“み~”“ひき~”等构词能力强、使用频率高的前项动词,对复合动词习得有较大意义。

表4 学习者语料库高频前项动词Top10

表5 母语者语料库高频前项动词Top10

3.3 不同日语水平学习者的使用分析

从不同日语水平学习者的复合动词使用情况来看,复合动词使用频率和学习者日语水平呈正相关。日语水平越高,复合动词使用的频率及种类就越多。观察学习者例句可发现,学习者倾向于集中反复使用少数几个复合动词,远没有母语者用法多样、搭配丰富。

再看中级、高级、超级学习者及母语者使用频率最高的5个后项动词,其中“~あう”为共通项。即从中级到超级,学习者都有频繁使用“~あう”的倾向。而且学习者产出的“~あう”例句基本没有偏误。“~あう”使用率及正用率较高的原因,一是“~あう”能产性强且语义相对简单,为前项动词添加“互相”语义较易被理解和掌握;二是学习者在口头产出时倾向于选择自己熟悉的、有把握的词汇。超级学习者与母语者有“~あう”“~こむ”“~かける”“~すぎる”4项是共通的,说明超级学习者的复合动词使用情况比较接近母语者水平。然而在复合动词使用的多样性上与母语者仍存在一定差异。也就是说,即便日语已达到较高水平,复合动词的使用情况依然差强人意。这个结果佐证了加强复合动词习得与教学研究的必要性。

4 复合动词习得情况及偏误分析

以上通过与母语者语料的多角度对比,就学习者口语中的复合动词使用情况进行了量化分析。本节主要探讨学习者复合动词的整体使用情况、偏误类型及其成因。在实验中,请15名母语者(其中8名为日语教师)对学习者产出的131个复合动词例句进行了“正用”“不自然”“误用”三段式句法容许度判断,并要求其就判断为“误用”或“不自然”的例句给出修改意见。根据母语者的正误判断情况进行了统计。将0~1个误用计为“正用”;2~5个误用计为“不自然”;6个以上计为“误用”。

4.1 整体情况

先就学习者复合动词整体使用情况进行说明。学习者的使用分布为“正用”101个、“误用”10个、“不自然”20个。整体来看,不自然和误用的占比约为30%,并不是很高。由于复合动词前项与后项的结合有一系列特殊规则,并且其使用会受到语义、语境的约束,因此成为学习者很难习得的项目之一。在初中级阶段,学习者尚未构建出复合动词知识系统,语言交际中倾向于使用自己熟悉的、有把握的单纯动词。口语是即时表达,学习者缺乏监控语言输出的时间,这是口语中复合动词偏误并不凸显的原因所在。

在学习者语料库中发现多个复合动词避用例句。如例(4)中,学习者用“勉強(が)始まった”表达“从中学开始一直学习日语”,但是这一表达方式含有被动含义,使用“勉強し始めた”更为贴切自然。从学习策略角度来看,由于复合动词属于较难理解和掌握的复杂词汇,导致学习者对其运用简化策略和回避策略。即便是高水平学习者也倾向于使用简单易懂的单纯动词来代替复合动词。因此口语中学习者复合动词使用频率远低于母语者。中级学习者复合动词的误用及不自然较为显著,随着日语水平提高误用呈递减趋势。

4.2 偏误类型及成因

口语中的偏误情况如表6所示,包括:与本动词混用(14个);与其他复合动词混用(14个);后项自他动词的错误使用(2个)。文首的例(1)~(3)分别代表了表6列出的三种偏误类型。

表6 学习者复合动词偏误一览

首先看与本动词混用的情况。从表6可看出,母语者基本将“与本动词混用”判定为“不自然”而非“误用”。说明不使用复合动词未必是错误,但是会在词汇使用方面显得单调匮乏、不够地道和自然。语言表达想要达到和母语者一样地道和丰富,复合动词的正确、恰当使用是一个不容忽视的指标。例(5)是超级水平学习者产出的例句,这里使用“考えすぎる”并不能算偏误,只是改为“考える”会更为自然。

其次看与其他复合动词混用的偏误,例(6)是中级水平学习者产出的例句,可见学习者分不清“待ち合う”和“待ち合わせる/落ち合う”的区别。

例(7)是将“受け入れる”和“取り込む”混同所导致的偏误,这种偏误可认作复合动词偏误,也可认作名动搭配偏误。如将“受け入れる”前搭配的名词改为“文化”,句子就是可接受的。

最后来看后项自他动词的错误使用。上文中指出在学习者口头产出中,“~かける”、“~はじめる”等表示“体”的复合动词使用较少。如例(8)所示,为数不多的与“体”相关的复合动词使用例句还多见偏误。在学习者尚未掌握自他动词的区别以及复合动词的结合条件时,会将复合动词的结合规则进行不适当的类推,从而导致了“走り始まる”这样的偏误。

5 结语

本文运用中介语对比分析法,就中国学习者口语中的复合动词使用情况、偏误类型及成因进行了探究。习得研究目的是为语言教师提供策略,使之在教学中提升学习者的学习效率。根据以上分析,我们认为复合动词教学应注意以下问题:

首先,针对学习者过少使用复合动词的问题,可利用母语者语料库加大输入的质和量,让学习者了解母语者常用的复合动词有哪些、这些复合动词经常被用在哪些语境当中。当学习者知道在哪些情况下可以使用复合动词就能减少回避现象。教师在教授复合动词过程中,除了要讲解复合动词的语义,还要讲清楚在同样情况下,汉语的对应表达跟日语复合动词的用法有哪些异同。这样能够有效避免母语负迁移,并且在一定程度上增加母语正迁移。

其次,教师应重视多义前项或后项的教学,引导学习者关注复合动词组成成分的多义性。成为前项或后项的动词多数原本就是多义词,与其他动词结合成复合动词后,语义会发生一定程度的变化,如语义扩大或缩小。在尚未掌握一个多义词的所有义项时,学习者较易进行猜词策略的泛化。因此,教师应尽量列举学习者可能遇到的有相同前项或后项的复合动词,着重说明不能以此类推所有包含该词的复合动词,从而有针对性地进行复合动词组成成分的教学。另外,一切语言知识教学的最终目的在于学习者的使用,而搭配是语言使用的具体表现,在教学中应重视复合动词的搭配信息。

词汇习得是一个从意义到用法逐渐过渡的过程,词汇意义的获得相对靠前和简单,句法功能的获得相对困难。在教学过程中,应将句法功能的教学放在重要地位。在编写教材时,也应重视导入能产性强、句法功能发达的句法型复合动词。对句法型复合动词后项及前项的设定,需要优先考虑母语者高频使用的后项及前项动词。在基本意义之外,还要重视句法型复合动词的用法以及主要的搭配关系、适用语境的讲解,这样有望缩短学习者词汇获得的路径,提高复合动词使用的质量。

注释:

① 下划线处为复合动词偏误,括号内为订正内容。为行文方便,部分例句有删减。

② OPI(Oral Proficiency Interview)是美国外语教育协会(American Council on the Teaching of Foreign Languages, ACTFL)开发的口头表达能力测试。其特点是通过30分钟以内的采访,使受试者的口头表达能力最大程度地得以发挥,根据ACTFL外语能力标准将受试者的外语水平进行分级。

③ KY语料库是由镰田修和山内博之采用OPI形式收集的日语学习者口语语料库。包括以汉语、英语、韩语为母语的日语学习者各30名(初级5名、中级10名、高级10名、超级5名),共计90名日语学习者的口语语料,总字数为390 907字。本研究选取其中的中国学习者25名(中级10名、高级10名、超级5名)语料,以及镰田修教授收集的未收入KY语料库的中国学习者25名(中级10名、高级14名、超级1名),共计50名中国学习者的OPI语料,两部分的合计字数为314 784字。

④ 上村语料库是由上村隆一建成的采用OPI形式收集的口语语料库,包括54名日语母语者的语料,以及以英语、韩语、汉语、俄语等为母语的66名日语学习者的语料。本文选取其中50名日语母语者的语料,总字数为318 276字。

⑤ 影山太郎从词与词的结合上把复合动词分为句法型复合动词和词汇型复合动词。句法型复合动词有:1)前后项动词构成主谓关系(例:食べ過ぎる→食べることが過ぎる)、2)前后项动词构成补足关系(例:読み続ける→読むことを続ける)两种。词汇型复合动词为除句法型复合动词以外的复合动词。参见:影山太郎.語彙的複合動詞の新体系―その理論的·応用的意味合い―∥影山太郎.複合動詞研究の最先端―謎の解明に向けて―[M].東京:ひつじ書房,2013:3-46。

猜你喜欢
偏误语料句法
柬语母语者汉语书面语句法复杂度研究
海量标注语料库智能构建系统的设计与实现
韩国留学生舌尖后音习得偏误分析
浅谈视频语料在对外汉语教学中的运用
可比语料库构建与可比度计算研究综述
偏误分析的文献综述
句法二题
《空间句法在中国》段进、比尔?希列尔等(著)
诗词联句句法梳理
偏误分析的意义与局限