基于Sketch Engine检索工具的日语近义词辨析
——以「残る」「余る」为例

2023-12-08 15:19:04傅秀娟
关键词:近义词素描日语

傅秀娟

(金陵科技学院外国语学院, 江苏 南京 211169)

日语中有大量的近义词,这些词无论在语义上还是语法上都有许多相似之处。近义词之间的语义重叠容易给语言学习者的理解和使用带来障碍,母语学习者一般可以凭借语感无意识地区分和使用这些近义词,但对于非母语学习者来说却是习得难点。三井一巳对日语学习者进行调查后发现,所有调查对象都对「類義語」(近义词)的差异产生过困惑,不清楚如何恰当地选择使用近义词[1]。加之字(词)典和参考书大多仅标注简单的释义和例句,学习者无法从根本上把握近义词之间的差异。例如「残る」「余る」这一组动词都有“剩、余”之意,「料理が残る/余る」「手元に残る/余る」等表达都成立,但有些语境中就无法代替,例如:

(1)化粧水にも、さっぱり、しっとりなど好みで選べるものがありますが、使用後5分たってもつっぱらず、しっとり感が残る(余る?)ものを探して古い角質細胞の剥離を促し、水分浸透のスピードを高めるため、塗った直後になめらかさを実感。

(2)年々東京に近づく変容は、東京育ちの私にとって違和感はなかった。私は現役時代から東京に出る機会が多く、用件を済まして時間が余る(残る?)と、銀座とか新宿の繁華街をぶらついたものである。都会の刺激を受けることが、多忙な日常のストレス解消ともなっていたようである。

近年来,随着语料库语言学的发展,以语料库为基础的研究日益兴起。语料库包含大量真实语料,这些直观、准确、可靠的语料信息可以弥补传统近义词教学的不足,通过定量和定性相结合的方式,可以更全面、客观地辨析近义词的差异,帮助学习者了解习得语言的搭配规律及语义特征,提高其词汇搭配和语言交际的能力。因此,本文以日语近义词「残る」「余る」为例,基于在线语料库检索工具Sketch Engine的Japanese Web2011目标语料库,利用词汇素描(Word Sketch)功能和词汇素描差异(Word Sketch Difference)功能,比较两词的搭配倾向,厘清语义特征。

一、基于语料库的日语近义词研究现状

目前,基于新闻语料库和自建语料库的日语近义词研究已有数例:郜枫基于中日新闻语料库研究了「しんみり」「しみじみ」与动词的搭配特征[2];赵恩英基于每日新闻库,研究了「ついに」「とうとう」后续共起的表现差异[3];大曾美惠子基于名古屋大学自建语料库考察了「みたいだ」「ようだ」的使用情况[4]。但由于新闻语料库专业性较强,而自建语料库规模又小,因此以上研究结论难免有失偏颇。随着『現代日本語書き言葉均衡コンパス』语料库(简称“BCCWJ”)的建立,日语近义词的语法研究取得了巨大进展:王华伟等基于BCCWJ对「かえりみる」「ふりかえる」「ふりむく」三个动词的搭配进行了对比研究[5];郜枫基于BCCWJ从词汇搭配视角对比分析了近义动词「願う」和「祈る」的区别[6]。尽管BCCWJ规模较大,但需要人工计算表示词汇结合强度的MI值、t值和表示词汇辨析度的LD值,不够便捷。

Sketch Engine是Lexical Computing公司于2003年推出的在线语料库查询工具,目前包含汉语、英语、日语、意大利语、德语等多个目标语料库,总词量达数亿,库容十分庞大。Sketch Engine不仅可以应用于词典编纂,还可以用于机器翻译研究、语言学习、语言教学、语言对比和分析等。目前,国内已有学者基于该平台开展学术研究:葛晓华介绍了Sketch Engine的核心功能和应用前景以及国内外利用Sketch Engine开展研究的现状[7];周芬基于Sketch Engine对英语近义词assure和ensure展开了辨析[8];李雪等基于Sketch Engine的汉语目标语料库对近义词“知道”和“懂”进行了研究[9]。笔者在中国知网以“Sketch Engine”和“日语”为关键词进行检索,仅查询到《基于大规模语料库的日语近义词辨析——以「行為」与「行動」为例》和《基于Sketch Engine检索工具的日语近义词辨析——以「積む」「蓄える」「重ねる」为例》两篇文献,可见基于Sketch Engine开展的日语研究尚不多见。

二、日语词典中「残る」「余る」的解释

日语词典种类繁多,本文参考『外国人ための基本語用例辞典』『学研国語大辞典』以及线上词典『デジタル大辞泉』,对「残る」「余る」的常见用法和解释进行了总结,结果如表1所示。

此外,『類義語使い分け辞典』也对「残る」「余る」进行了比较:

残る:時間的基準点の前後を比較して、後に作用、行為が引き続き存在する。

表1 「残る」「余る」的常见用法和解释

可见,「残る」「余る」都有“剩余、剩下”之意,前面一般用助词「が」「に」来接续,「残る」侧重「時間の変化」,「余る」更强调「基準量を超える」,但在具体语境中,如「残ったご飯」「余ったパン」,就很难分辨二者的语义内涵有何不同。

三、研究工具及研究步骤

Sketch Engine的Japanese Web2011目标语料库是目前规模最大的日语语料库。Sketch Engine能够根据语法成分自动提取词语搭配组合,并按照频次和显著性进行统计排列。Sketch Engine最核心的功能是词汇素描,即将检索词汇的语法和搭配表现总结在同一页面,且所有条目均经降噪处理。词汇素描差异是Sketch Engine的另一个重要功能,可以对比呈现词汇的搭配差异并根据语法关系将搭配词汇分为不同的类别。这种检索和呈现方式对语言研究者和学习者都较为友好。因此本文基于Sketch Engine的Japanese Web2011目标语料库,首先使用词汇素描功能分别检索「残る」「余る」,结果显示「残る」出现的频次为1 256 325,「余る」出现的频次为137 245;然后使用词汇差异素描功能将其各自搭配词汇分别进行可视化呈现,在反映两词共同之处的基础上分析差异,进而辨析该组近义词在语法及语义上的异同。

四、基于数据库检索的「残る」「余る」近义词辨析

Sketch Engine可以自动呈现词语的搭配信息,词汇素描功能还可以提供关键词的多种语法关系检索结果。例如,当输入动词时,数据库会自动显示可以与该动词搭配的宾格名词、格助词及修饰成分等。因此,在获取语料库中「残る」「余る」的词汇素描结果后,本文选取与「残る」「余る」搭配最显著的「Nが」「Nに」语法形式作为研究对象,其他语法形式因显著性不强本文不进行讨论。

(一)「Nが残る」搭配词语考察

首先,在词汇素描中选择「残る」的「Nが」典型语法搭配,去除语料库中不符合项,经过处理后,将「Nが残る」搭配中前15位名词按LD值降序排列。「Nが残る」主要是指整体中消失或减少后留存的内容,以时间为线索。表2结果显示:从搭配主体来看,「Nが残る」搭配中的主体名词既有表示问题的残留(疑問、不安、不満、悔い),也有表示受害留下的痕迹(跡、疲れ、傷),还有表示感觉、体验的残留(余韻、印象、記憶、感);从动作表示的内容来看,既可以是具体物(記録、雪、自然),也可以是抽象物(印象、不安、疲れ);从动作实施的主体来看,既可以是人(疑問が残る、不安が残る),也可以是物(頂上に雪が残る、服に匂いが残る);从语义上看,有的表示“(整体的一部分没了)剩下一部分”之意(「跡が残る」「雪が残る」「記憶が残る」「匂いが残る」),也有的表示“未淹没、留传、留下”之意(「疑問が残る」「記録が残る」「不満が残る」「悔いが残る」);在「Nが残る」搭配中,「跡」的显著性最高。

利用词汇差异素描功能,绘制「Nが残る」搭配可视化分布图。在可视化分布图中,圆圈越大表示该名词出现的频次越高,离圆心的距离越近表示越典型。从图1可以看出,「跡が残る」(留下痕迹)、「疑問が残る」(留有疑问)、「記録が残る」(留下记录)、「雪が残る」(残留积雪)、「印象が残る」(留下印象)、「不満が残る」(留下不满)等属于高频搭配,在习得时应重点掌握。

(二)「Nに残る」搭配词语考察

首先,在词汇素描中选择「残る」的「Nに」典型语法搭配,去除语料库中不符合项,经过处理后,将「Nに残る」搭配中前15位名词按LD值降序排列。

图1 「Nが残る」搭配可视化分布图

表3结果显示:「Nに残る」搭配中的「に」格名词,既可以是具体名词(耳、手元、肌),也可以抽象名词(印象、記憶、思い出);从动作实施的主体来看,既可以是人(「人が決勝に残る」),也可以是物(「映画が印象に残る」「音楽が耳に残る」);从语义上看,有的表示“(某种体验)留在记忆里”之意(「印象に残る」「記憶に残る」「心に残る」「思い出に残る」「耳に残る」「肌に残る」),有的表示“未淘汰,留下”之意(「最後に残る」「中に残る」「決勝に残る」);在「Nに残る」搭配中,「印象」的显著性最高。

利用词汇素描差异功能,绘制「Nに残る」搭配可视化分布图。从图2可以看出:高频搭配主要有「印象に残る」(印象深刻)、「記憶に残る」(留在记忆中)、「心に残る」(铭记在心)、「思い出に残る」(留在回忆里)、「歴史に残る」(名垂青史)、「耳に残る」(记忆犹新)、「頭に残る」(留在脑海),这些高频词汇在教学时可以让学习者重点记忆。

表3 「Nに残る」搭配中前15位名词信息

图2 「Nに残る」搭配可视化分布图

(三)「Nが余る」搭配词语考察

首先,在词汇素描中选择「余る」的「Nが」典型语法搭配,去除语料库中不符合项,经过处理后,将「Nが余る」搭配中前15位名词按LD值降序排列。表4结果显示:「余る」的动作主体可以是具体物(チケット、皮、お金、ご飯、米),也可以是抽象物(時間、予算);从语义上看,「Nが余る」搭配单纯表示数、量的剩余、结余,没有“未淹没、留传”之意;「時間」出现的频次最高。

利用词汇素描差异功能,绘制「Nが余る」搭配可视化分布图。从图3可以看出:「時間が余る」(时间剩余)的搭配频次最高,「チケットが余る」(票剩余)是典型搭配。在学习时,可以加强学习者对「皮が余る」(皮剩余)、「お金が余る」(钱剩余)、「予算が余る」(预算结余)、「ご飯が余る」(米饭剩余)等高频搭配的掌握。

表4 「Nが余る」搭配中前15位名词信息

图3 「Nが余る」搭配可视化分布图

(四)「Nに余る」搭配词语考察

首先,在词汇素描中选择「余る」的「Nに」典型语法搭配,去除语料库中不符合项,经过处理后,将「Nに余る」搭配中前15位名词按LD值降序排列。表5结果显示:「Nに余る」大多表示超出某种能力或限度、无法负担的含义;从语义上看,有的表示“超出某种程度、无法胜任”之意(「目に余る」「両手に余る」「身に余る」「手に余る」「指に余る」「想像に余る」「身の丈に余る」「思案に余る」「力に余る」),有的表示“剩余的场所”之意(「手元に余る」「倉庫に余る」);「目に余る」出现的频次最高,搭配最典型。

利用词汇素描差异功能,绘制「Nに余る」搭配可视化分布图。通过图4可以发现:高频词汇包括「目に余る」(不能容忍)、「身に余る」(愧不敢当)、「手に余る」(无法应对)、「想像に余る」(难以想象)、「身の丈に余る」(身不由己)等。

表5 「Nに余る」搭配中前15位名词信息

图4 「Nに余る」搭配可视化分布图

(五)「残る」「余る」词汇素描差异分析

为考察「残る」「余る」是否有共同搭配的主格名词,本文使用Sketch Engine的词汇素描差异功能,首先输入「残る」「余る」,并选择「Nが」语法成分,根据平台自动生成的搭配名词的频次和显著值,将词汇素描差异分析的关键信息汇总,结果如表6所示。在Sketch Engine的词汇素描差异中,LD值≥5的词为显著搭配词。从表6结果可以看出:「Nが余る」搭配中,名词的LD值均大于5,都可视为显著搭配主格名词;「Nが残る」搭配中,LD值大于5的词汇有「体力」「在庫」「金」;「残る」「余る」共同显著的词汇有「体力」「在庫」「金」;「布」「予算」与「余る」搭配的LD值分别为7.0和7.5,而与「残る」的搭配LD值仅为1.9和2.1,可见「布」「予算」与「余る」的搭配更常见。

为了进一步明确语义区分,本文选取与「残る」「余る」搭配共同显著的名词「体力」「在庫」「お金」,分别选取例句进行分析。

表6 「 Nが残る」「Nが余る」搭配词汇素描差异

(3)この15分に勝負を賭けられる体力が残っているが、パワープレーに耐えられる力などがポイントとなる。

(4)運動不足が夜泣きの原因と考える説があります。体力が余った状態では、よく眠れなくなります。

(5)日本国内だけでも1万本の在庫が残っていると聞きました。

(6)ひょっとしたら最初に見誤ってたくさん作りすぎて在庫が余っているため、売り切るまで手をつけないつもりなのか。

(7)家計簿上は黒字のはずなのにお金が残らない。

(8)役員報酬を下げれば、会社にお金が余ります。

在例(3)和例(4)中,「体力が残る」「体力が余る」虽然都表示体力尚存,但「体力が残る」表示“还有可以赌上胜负的体力”,以时间为线索;「体力が余る」则表示因运动不足而造成的体力富余。同样的,在例(5)和例(6)中,「在庫が残る」「在庫が余る」都表示有库存,但前者客观地描述了“只剩1万支库存”的事实,后者则表示因误判制作太多而造成库存大。在例(7)和例(8)中,「お金が残る」「お金が余る」均表示钱有剩余,前者是客观说明事实,后者则表示如果减少员工报酬就会有剩余,这种过多或剩余是以所需要的量为参照物的。由此可见,「残る」是强调整体中一部分内容的消失,以时间为线索,客观地描述事实;「余る」强调的是多出了必要的数量。

为考察「残る」「余る」是否有共同搭配的「に」格名词,本文利用Sketch Engine的词汇素描差异功能,首先输入「残る」「余る」,并选择「Nに」语法形式,根据平台自动生成的搭配名词的频次和显著值,将词汇素描差异分析的关键信息汇总。从表7结果可以看出:与「残る」搭配显著的名词有「耳」「中」「後」「胸」「日本」「体」「最後」「体内」「手元」「手」;与「余る」搭配显著的名词有「手元」「掌」「手」「倉庫」「指」「手札」「目」;与「残る」「余る」搭配共同显著的名词有「手元」「手」。

表7 「Nに残る」「Nに余る」搭配词汇素描差异

为了进一步明确语义区分,本文选取与「残る」「余る」搭配共同显著的名词「手元」「手」,分别选取例句进行分析。

(9)過失相殺後の支払額が90%で360万円です。病院に200万円支払いますから、手元に残る金額は160万円です。

(10)メモリは当初16Mが2枚載っていたのですが、手元に余っていた32M2枚に交換しました。

(11)閉まる扉の音を聞きながら、私は手に残ったチョコレートをじっと見つめていました。

(12)HPのテーマとして取り上げるには少々手に余るかもしれない。

在例(9)和例(10)中,「手元に残る」「手元に余る」都表示手头剩余之意,但「手元に残る」是指从整体360万日元中减掉200万日元后,手头还剩余160万日元;「手元に余る」是指本来就富余。在例(11)和例(12)中,「手に残る」表示留在手上,「手」是「残る」残留的位置;「手に余る」则表示束手无策,超过了自己的能力,二者意思完全不同。

五、结论

本文基于在线语料库检索工具Sketch Engine的Japanese Web2011目标语料库,考察了「残る」「余る」的搭配规律及语义特征,并根据词汇素描结果,选取与「残る」「余る」搭配最显著的「Nが」「Nに」语法形式作为研究对象,得到以下结论:

(一)「残る」的搭配特点

「Nが残る」搭配中,出现频次较高的名词有「跡」「疑問」「感」「雪」,表示“未淹没,残留”之意,主体可以是具体物也可以是抽象物,这些搭配中的「残る」不能与「余る」互换;「お金/時間/ご飯/体力が残る」表示整体中一部分的剩余,这种剩余以时间为线索,可以将搭配中的「残る」替换成「余る」,但语感不同。

「Nに残る」搭配中,出现频次较高的名词有「印象」「記憶」「心」「思い出」,除了表示人留在某地、在比赛中没有被淘汰等,还表示抽象物经过时间的流逝后并未消失,还残留在某处;「印象に残る」搭配中动作的主体是人,不可以替换为「余る」。

(二)「余る」的搭配特点

「Nが余る」搭配中,出现频次较高的名词有「時間」「お金」「チケット」,强调超过了必要的量,而这种量的过多或剩余是以所需要量为参照物的,这些搭配中的「余る」可以与「残る」互换,但是语感不同。例如:假设原本需要2万日元,但因为多准备了5 000日元,所以有5 000日元的剩余,表达应为「お金が5 000円余る」;如果原本需要2万日元,但实际上的费用没有全部用完,剩余了5 000日元,则应表达为「お金が5 000円残る」。

「Nに余る」搭配中,出现频次较高的名词有「目」「身」「手」。「目に余る」(不能容忍)、「身に余る」(愧不敢当)、「手に余る」(无法应对)都表示超过某种基准和可以忍耐的程度,是惯用表达。尽管也有「目に残る」「手に残る」此类表达,但「その風景が」「目に残る」是指闭上眼睛,即便时光流逝,整体的景观已从视野中消失,但特定的光景也不会消失,总是浮现在脑海里。同样的,「手に残る」表达「手」是「残る」残留后的位置,强调经过时间流逝后还残留在手里。

通过对「残る」「余る」这组近义词的考察,可以清楚地区分前文「料理が残る/余る」「手元に残る/余る」两组表达的差异:在表示“未淹没、遗留、留在原地”之意时,只能用「残る」,动作的主体可以是人,也可以是物;在表示“剩下、剩余”之意时,「残る」强调的是整体中部分的减少,以时间为线索,「余る」单纯地表达量的过度、多余,且以所需要量为参照物。

猜你喜欢
近义词素描日语
从推量助动词看日语表达的暧昧性
初夏素描
怎样辨析近义词
明朝日语学习研究
甘肃教育(2020年17期)2020-10-28 09:02:32
武汉素描
歌剧(2020年4期)2020-08-06 15:13:32
素描
雨露风(2020年8期)2020-04-26 19:55:51
找找近义词
凡·高的早期素描
读者(2016年23期)2016-11-16 13:27:55
关于日语中的“のた”和“の”的研究
文学教育(2016年27期)2016-02-28 02:35:10
不由分说