搭配信息在隐喻辨识中的运用

2017-03-07 19:30武继红
辞书研究 2017年1期
关键词:义项词典语料库

武继红

摘要隐喻研究是当代认知语言学、心理语言学和应用语言学、语料库语言学的热点之一。隐喻辨识是隐喻研究的基础。自2007年MIP问世以来,越来越多的人基于MIP进行隐喻辨识研究,研究者基于学习词典和OED提供的信息确定词汇单位的基本语义和语境语义,继而对词汇单位的隐喻性做出判断。文章作者指出在隐喻辨识过程中,除义项划分、释义和词的历史信息外,研究者还可利用词的搭配信息确定语义,尤其是语境语义,学习词典提供的搭配信息和搭配词典可在一定程度上弥补学习词典义项划分不准确和释义含混的不足,词的搭配信息对隐喻辨析具有重要意义。

关键词隐喻辨识搭配语义辨析

一、 导语

隐喻是语言研究的重要组成部分。自Lakoff & Johnson 1980年出版了Metaphors We Live By《我们赖以生存的隐喻》以来,隐喻研究已成为认知语言学、心理语言学、应用语言学和语料库语言学的热点之一。随着语料库的广泛应用,人们开始强调语法和具体使用的不同(Steen 2007),与此相应,越来越多的人对来自大型语料库的与具体语境相关的隐喻进行了研究,这使得隐喻辨识成为定性研究和定量研究的基础(Krennmayr 2013)。隐喻辨识包括语言层面和概念层面两个层面,2007年MIP(Metaphor Identification Procedure, Pragglejaz Group 2007)问世以来,隐喻辨识的重心从概念层面转向了语言层面。运用MIP进行隐喻辨识的关键是词汇单位基本义和语境语义之间的对比,由于“当代用法词典收录词汇最基本的词义”(Steen et al. 2010: 35),且母语使用者使用的99%的隐喻意义被当代英语用法词典收录(Steen 2011),词典成为运用MIP进行隐喻辨识的关键因素。作为独立、客观的参考工具,詞典为隐喻研究者做出相对一致的判断提供了依据,从而为隐喻辨识研究的可靠性奠定了基础。在隐喻辨识过程中,研究者通常参照词典的词目、义项划分和释义确定词汇单位、区分基本语义和语境语义,本文认为除此之外,研究者还可参考搭配信息确定语义,尤其是语境语义,搭配信息对隐喻辨识具有重要意义。

二、 隐喻辨识及词典在隐喻辨识中的运用

1. 隐喻辨识: MIP和MIPVU

在隐喻研究早期,对自然语料中隐喻的辨识往往有赖于研究者的直觉,如Lakoff & Johnson(1980)的研究。随着语料库语言学的发展,人们对隐喻的辨识逐渐摆脱了对直觉的依赖,有了相对统一、有效的标准。目前隐喻辨识主要包括自上而下和自下而上两种途径,前者是先预设概念隐喻,然后在文本中检索与之相对应的词汇隐喻,而后者是基于词汇中的映射确定隐喻。随着语料库语言学的发展,研究者应用语料库基本原理和手段对自然语料中的隐喻进行识别(Deignan 2005; Koller et al. 2008),这类研究从本质上看属于自上而下的研究,但近年来人们意识到这种演绎式研究方法的不足——没有可靠的识别概念隐喻和词汇隐喻的步骤,研究者在很大程度上需要依赖直觉。目前,越来越多的研究者开始采用自下而上的研究方法,为人广泛接受的MIP及其升级版MIPVU(Metaphor Identification Procedure at VU University Amsterdam, Steen et al. 2010)就是典型的自下而上的研究方法(为行文方便起见,以下统称MIP)。MIP将语言形式分为隐喻表达和非隐喻表达,认为一旦词汇通过引入不同的概念域破坏了语义的一致性,则可确定其为隐喻表达,因此,MIP的核心在于对比词汇的基本语义(basic meaning)和语境语义(contextual meaning),一旦二者分属于不同的概念域,则可确定其隐喻性。MIP的具体步骤如下:

(1) 阅读文本掌握其大意。

(2) 确定词汇单位。

(3) a. 确定每个词汇单位的语境语义;

b. 确定词汇单位在其他语境中更加基本、现行的语义,基本义更加具体、准确,通常和躯体运动相关,出现的年代更早;

c. 确定基本语义与语境语义是否冲突,是否通过相互比较得以理解。

(4) 如可理解,则可确定其隐喻性。

运用MIP进行隐喻识别有以下两个特征: 其一,MIP涉及的隐喻主要指词汇隐喻而非概念隐喻,即辨识词汇隐喻而非概念之间的映射,因此,MIP主要用于辨识词汇隐喻,一则词的基础语义和语境语义具有相对确定性,可以减少对直觉的依赖;二则通过对每个词汇单位的具体分析,可以避免研究中“隐喻无处不在”的现象。其二,MIP在进行基本语义和语境语义的对比时严格遵循词典定义,因此,词典对采用自下而上的研究方法进行隐喻识别具有重要意义。

2. 隐喻辨识中词典的运用

运用MIP进行隐喻辨识的关键是词汇单位基本语义和语境语义之间的对比,研究者严格参照权威词典的词目和释义确定词汇单位及其基本语义和语境语义,因此,词典的选择和运用至关重要。MIP在词典选择上提出的标准是词典的编纂应基于大型、通用、当代的英语语料库。Pragglejaz Group选择的是Macmillan English Dictionary for Advanced Learners《麦克米伦高阶英语词典》(以下简称MED),该词典语料来自包括广泛文本形式的、约2亿词的当代英语语料库World English Corpus。 MIP除选用MED外,还选用了基于1亿词的英语国家语料库BNC编纂的Longman Dictionary of Contemporary English《朗文当代英语辞典》(以下简称LDOCE)和基于历史主义原则编纂的Oxford English Dictionary《牛津英语大词典》(以下简称OED)。Pragglejaz Group认为当代学习词典的编纂无一例外依托大型语料,与其他类型的词典(尤其是收录难词、专用词供母语读者使用的词典)不同,学习词典收录基于真实语言使用统计结果的最高频词,同时还具有义项划分细致、释义准确,以及收录典型例句、搭配和语法结构的特征。这对分析高频词(如say、see、light、grasp等)尤其重要,因为为母语使用者编纂的词典通常不会对读者可以熟练使用的这类词汇加以详细的描述,而在隐喻辨析中,这部分高频、基础词汇往往会带来更多困难。

三、 搭配信息在隐喻辨识中的运用

2007年,MIP作为研究工具被推荐给隐喻研究者并获得广泛应用(钟兰风,陈希卉2013),与此同时,词典在用MIP进行分析时暴露的不足也不断为人所诟病。除词典编纂的时效性等不可避免的问题之外,研究者还指出学习词典作为为非母语使用者编纂的教学型词典,释义使用特定范围的高频词,且出于实用性和节省空间的考虑,根据词的使用频率排列义项,难免导致义项缺失、义项合并及释义含混等情况(MacArthur 2015; Steen 2007; Deignan 2009),这对英语学习者而言并无不妥,但对隐喻研究者而言却有可能造成困扰。在这种情况下,搭配信息可为隐喻辨识提供帮助。

1. 学习词典中的搭配信息

MIP的关键在于语境语义的识别和与基本语义的对比,而语境语义的识别在很大程度上依赖于与其相关的词汇即搭配,常用的搭配词往往表明词的基本语义与语境之间的悖反和冲突,这恰恰预示着其隐喻性。语料库研究显示典型搭配可以用于区分词的不同用法(Deignan 1999),事实上,MIP也强调语境语义的识别需要注意词汇单位前后的词汇,即搭配(Pragglejaz Group 2007)。词典提供的搭配信息可为语义辨识,尤其是语境语义的辨识提供帮助。当代学习词典都注重搭配信息的呈现,五大学习词典(Big Five)虽然体例不同,但无一例外都注重在词典宏观和微观结构中凸显搭配信息,如Collins Cobuild Advanced Learners English Dictionary《柯林斯COBUILD高阶英语学习词典》(2003)通过整句释义模式提供典型搭配,MED为高频搭配提供搭配框,LDOCE把典型搭配处理成独立的义项。学习词典往往通过搭配信息呈现义项之间的差别,弥补其释义不够准确的不足,这为隐喻研究者基于搭配信息進行隐喻辨识提供了线索。

1) 释义

学习词典有时在释义中直接提供搭配词,这为区分词汇单位的基本语义和语境语义提供了直接的帮助。如MED和LDOCE为例(1)中embrace提供的第二个与抽象用法相关的义项直接为研究者判断其隐喻性提供了帮助:

(1) Community standards may embrace moral principles or they may not.[1]

embrace

MED: to completely accept something such as a new belief, idea, or a way of life.(sense 2a)

LDOCE: to eagerly accept a new idea, opinion, religion etc.(sense 2)

2) 搭配词

有时学习词典虽然对具体、抽象义项进行了切分,但由于学习词典在释义时采用高频的释义词,有时会出现释义含混的现象,这时,学习词典往往会通过搭配信息对词义做进一步说明。

(2) He turned round and directed a torrent of abuse at me.

torrent在MED中有两个义项,第一个是与水流有关的具体用法,可视为基本语义;第二个义项是“a large amount of something, especially something unpleasant”,仅从释义看,something的具体或抽象特性指代不明,something unpleasant勉强可以说明其抽象性,但通过义项2的搭配信息“+ of a torrent of abuse/words/criticism”,研究者可对其抽象特征做出明确判断。

3) 义项排列

当代学习词典主要基于词频排列义项,如LDOCE把典型搭配处理成独立的义项。以例2中的torrent为例,在LDOCE中,torrent的第一个义项是与水流有关的具体用法,第二个义项本身就是一个黑体凸显的搭配a torrent of something,其释义为“a lot of words spoken quickly, especially in order to insult or criticize someone”,其抽象特征一目了然。学习词典这种利用义项排列凸显典型搭配的体例为区分词汇单位的基本语义和语境语义提供了直接的帮助。

2. 搭配词典

当代搭配词典的编纂具有基于大型、当代、通用语料库的特征,真实、有效地呈现了词的搭配,2010年出版的Macmillan Collocation Dictionary《麦克米伦搭配词典》(以下简称MCD)即是利用搭配词典进行隐喻辨识的一个很好选择。麦克米伦系列词典是当代学习词典中最具有隐喻意识的词典系列,2002年出版的MED是目前唯一将隐喻引入词典结构的学习词典,它及时反映了当前语言学领域隐喻研究的最新成果。MCD秉承MED一贯的隐喻意识,其独特的编纂体例为隐喻辨识提供了更加有效的途径。MCD的一个突出特点是利用最先进的软件,从近二十亿词的语料库中选择高频词、词的义项和搭配词,这使得该词典提供的义项往往与词目的隐喻意义相关而不是与基本语义相关。MCD另一个突出的特点是各词目的搭配词皆依语义群组分类,这为隐喻研究者基于词的搭配区分词汇单位的基本语义和语境语义提供了帮助。

1) 词目收录

与学习词典不同的是,MCD只收录名词、动词和形容词,在其精挑细选的4500个重要词中,名词占55%,动词和形容词分别占21%和24%(Coffery 2011)。利用词典进行隐喻辨识的优势主要体现在针对实词,尤其是名词和动词进行的分析(Pragglejaz Group 2007),对于大量功能词的隐喻辨识,主要还须依赖研究者的直觉。学习词典虽然具有收录高频词、划分义项细致的优势,但与搭配词典各有不同的功用,前者更强调语言的概括性语法特性(grammar),而后者则更突出语言的具体性使用特征(usage)。采用MIP研究来自大型语料库的、与具体语境相关的隐喻恰恰更加强调语言的使用,从这个角度看,虽然MCD收录的词目数量不大,但由于MIP选取的语料分析样本是正式、当代、标准的书面体英式英语(Pragglejaz Group 2007),这部分高频词目涵盖了隐喻辨识研究的核心部分。

2) 义项选择

与学习词典和传统搭配词典Oxford Collocations Dictionary for Students of English《牛津英语搭配词典》(以下简称OCD)相比,MCD在义项选择上具有凸显词的隐喻义项的特征,其收录的义项主要是与隐喻义相关的当代高频的义项。以cultivate(V)为例,MED和LDOCE分别为该词提供了4个义项,前两个是与“种植”相关的具体用法,后两个是与“培养能力”“发展关系”相关的抽象用法。在OCD中,编者为cultivate提供了与三个语义域(1. land, 2. crop, 3. try to develop)相关的V+adv的搭配,而MCD仅收录了一个与隐喻意义相关的义项“develop an attitude, ability, or relationship”,展示V+adv和V+n的搭配。MCD收录的词目中,有相当数量仅收录其隐喻意义,如gulf、ignite和veil等。这一凸显词的隐喻特性的体例对确定词的语境语义提供了直接的帮助。

不仅如此,MCD还补充了学习词典和OCD未收录的词的隐喻义项:

(3) Soaring house prices led to the unsustainable property bubble, which finally burst in 2008.

语料库研究显示,bubble是近年来反映经济活动的高频词,但无论在MED还是LDOCE中该词只有基本语义:

bubble

MED: 1. a ball of air or gas in a liquid

2. a structure that is round like a babble

LDOCE: 1. a ball of air or gas in liquid

2. a small amount of air trapped in a solid substance

MCD: 1. a ball of air or gas sense

(搭配词略)

2. a situation in a particular business when there is a lot of uncertainty

adj+Nspeculative, unsustainable

n+Ndoctom, housing, internet, property, stock, market

N +vburst, collapse

虽然MED和LDOCE在bubble中提供了“the bubble bursts”“a bubble of sth”和“burst/pick ones bubble”等以詞组呈现的词条,但相较MCD,这两种释义的对比显著性大为逊色。毫无疑问,MCD对bubble的义项划分更加准确、直接,对于利用MIP进行隐喻辨识而言更加有效。

3) 搭配词呈现

确定隐喻的前提是词汇单位具有两个不同的语义且能在词典中检索到不同义项,但学习词典编纂者或是为节省空间,或是考虑到目标受众的需求,有时不得不将不同义项压缩为一个义项。因此,两个不同的语义不一定能在词典中找到对应的两个义项。同时,由于大多数学习词典的编纂都基于描述主义原则(descriptivism)和语料库研究方法,在确定义项顺序时主要基于词频,且学习词典尤其是纸质词典通常不提供词源,导致研究者在利用学习词典确立语义,尤其是基本语义时无法根据具体或抽象及义项出现的先后顺序确定基本语义,这时MCD独特的依据语义群提供搭配词的体例可为研究者提供帮助。在例(4)中,我们可以看到通过提供不同的搭配词群组,MCD可以有效解决学习词典释义中对具体和抽象事物不做区分造成的基本义和语境义混淆的问题。

(4) I have to repay $250 every month, and thats a big chunk of my salary.

chunk

MED: 1. a large, thick piece of something

2. a large amount of part of something

LDOCE: 1. a large thick piece of something that does not have an even shape

2. a large part or amount of something

chunk在MED和LDOCE中虽然都有两个义项,但由于义项1和义项2中都是用了不定代词something来指代chunk,仅从释义看,前者是基于物体的形状,后者是基于数量,而数量本身并不能说明其抽象特征,因此,无法判断后者是否比前者更加抽象。

MCD: a large part or amount of something

·N+of foodbeef, bread, cheese, chicken, cucumber, lamb, meat, pineapple

hard solid substanceconcrete, ice, masonry, metal, rock, wood

time or moneybudget, day, money, salary, time

MCD虽然只有一个释义,但是其独有的基于语义群提供搭配词的体例却对something做出了明确的区分,在例(4)中,我们看到搭配词典通过提供不同的搭配词群组,可以有效解决词典释义中超用something造成释义含混、对具体和抽象事物不做区分造成基本义和语境义混淆的问题。无疑,MCD独特的基于语义群组提供搭配词的体例为判断chunk的基本义(具体)和语境义(抽象)提供了帮助,从而解决了释义不够准确而为研究者带来的困扰。

四、 结语

在应用MIP和MIPVU进行隐喻识别的过程中,研究者可利用词典,尤其是学习词典提供的通过大量语料提炼出来的信息进行词义对比,继而对词的隐喻性做出判断,词典为隐喻研究的可靠性提供了保障。在利用词典进行隐喻辨识过程中,研究者主要基于学习词典和OED提供的义项划分、释义和词的历史信息等确定词汇单位的基本语义和语境语义,但学习词典由于其使用目的和编纂体例所限,难免出现义项划分不够准确及释义含混等不足,在这种情况下,学习词典提供的搭配信息和搭配词典可为语义辨识,尤其是语境语义的辨识提供帮助,搭配信息在隐喻辨识过程中发挥重要的作用。

附注

[1]本文中的例证均来自BNC语料库。

参考文献

1. 钟兰风,陈希卉.隐喻识别研究现状述评.外语研究,2013(5): 40—44.

2. Coffey S. A New Pedagogical Dictionary of English Collocations. Journal of Lexicography, 2011(3): 328—341.

3. Deignan A. Linguistic Metaphor and Collocation in Nonliterary Corpus Data. Metaphor and Symbol, 1999(1): 19—36.

4. Diegnan A. Metaphor and Corpus Linguistics. Amsterdam/Philadelphia: John Benjamins, 2005.

5. Diegnan A. Searching for Metaphorical Patterns in Corpora. ∥Baker P.(ed.) Contemporary Studies in Linguistics: Contemporary Corpus Linguistics. London: Continuum International Publishing, 2009: 10—31.

6. Koller V, Harolie A, Ray Son P. et al. Using a Semantic Annotation Tool for the Analysis of Metaphor in Discourse. Metaphorik De, 2008(15): 141—160.

7. Krennmayr T. Adding Transparency to the Identification of Crossdomain Mappings in Discourse. Review of Cognitive Linguistics, 2013(1): 163—184.

8. Lakoff G, Johnson M. Metaphors We Live By. Chicago: The University of Chicago Press, 1980.

9. MacArthur F. On Using a Dictionary to Identify the Basic Sense of Words. Metaphor and the Social World, 2015(1): 124—136.

10. Pragglejaz Group. MIP: A Method for Identifying Metaphorically Used Words in Discourse. Metaphor and Symbol, 2007(1): 1—39.

11. Steen G. Finding Metaphor in Grammar and Usage: A Methodological Analysis of Theory and Research. Amsterdam: John Benjamins, 2007.

12. Steen G. et al. A Method for Linguistic Metaphor Identification. Amsterdam: John Banjamins, 2010.

13. Steen G. The Contemporary Theory of Metaphornow New and Improved. Review of Cognitive Linguistics, 2011(1): 26—64.

(廣东外语外贸大学国际商务英语学院广州510420)

(责任编辑李潇潇)

猜你喜欢
义项词典语料库
《语料库翻译文体学》评介
米沃什词典
评《现代汉语词典》(第6版)
词典例证翻译标准探索
基于JAVAEE的维吾尔中介语语料库开发与实现
两用成语中的冷义项
《胡言词典》(合集版)刊行
语料库语言学未来发展趋势