基于语料库的现在完成体与动词语义适配性研究*

2022-09-10 04:41张立英
外语研究 2022年4期

张立英

(浙江理工大学外国语学院,浙江杭州 310018)

0.引言

英语现在完成体(以下简称完成体)在语言学研究中备受关注。完成体的用法如何分类,以及这些用法是语义还是语用范畴,学术界有多种观点(McCoard 1978;Fenn 1987;Klein 1992;赵兴1996;谢应光1997;陈前瑞2016)。随着语料库语言学的发展,学界近年来开始再次关注完成体(Werner et al.2016),从语料库的视角探讨完成体与一般过去时的交替使用(Elsness 1997;Hundt&Smith 2009;Yao 2015),调查各英语变体中影响完成体使用的各种因素(Schlüter 2002;Davydova 2011;Yao & Collins 2019;顾凯,王同顺2005;刘晶等2011)。现有对完成体的研究或解释其意义,或围绕其使用语境,探讨完成体的不同用法、在不同英语变体中的差异以及完成体与一般过去时的异同。与完成体密切相关的动词仅仅被视作影响完成体使用的诸多因素之一加以考察,对其描述不够系统深入。本研究旨在基于大量真实语料对完成体中动词的语义特征进行考察。

1.动词语义与基于语料库的搭配研究

1.1 动词语义分析

根据动词的时间结构特征,Vendler(1957)将动词分为四类,即活动(activity)、完结(accomplishment)、成就(achievement)和状态(state)动词,区分这四类动词的语义特征为静态性(static)、持续性(durative)和终结性(telic)(表1)。

表1 :动词体类型的时间结构特征(Smith 1997:20)①

在动词与完成体关系的分析中,Comrie(1976:41)认为动词的一些词汇语义特性,如终结性、动态性,与其他成分相互作用,或禁止某些成分的结合,或限制结合后的语义。Biber et.al.(1999:464)基于语料库的调查发现,一些动词的行为方式独特,很少在完成体中使用,如glance、kiss、scream,但他们并未详细分析这些动词的语义特征。

在完成体与动词相互作用机制的研究中,完成体被视为专门的类型转换装置(de Swart 1998;Michaelis 2011)。De Swart将完成体视作现在完成体算子,认为它“适用于任何动词体类型”(1998:354)。Michaelis认为完成体是静态构式,要求输入的动词是事件动词(2011:1382)。De Swart和Michaelis等学者的研究基于少数例句推导,对完成体和动词类型关系所得出的不同结论,需要更多真实数据的检验。同时,这些研究在探讨完成体对动词的选择性时,未全面考察真实语料中用于完成体的动词。

基于语料库的研究发现,成就动词(Elsness 1997:234-235)和动态动词高频出现于完成体(Schlüter 2002;Davydova 2011)。Yao(2014)对完成体的历时研究表明,表达直接结果的终结性情境使用比例呈下降趋势,非直接结果的终结性情境呈增加趋势,非终结性情境比例也在上升。这些实证研究都涉及了完成体中常搭配的动词类型,但是由于动词不是研究重点,并未得到系统深入分析。

以上基于真实语料的研究多采用多变量分析方法,动词类型作为影响完成体使用的诸多因素之一,所采用统计方法均为计算频数百分比,且不考虑动词在其他时体的分布,因而不能排除占比高的动词有可能由频数效应引起,即某些动词在完成体中占比高是由于它们在语料中使用频数高。构式搭配分析法可以避免以上问题。此外,以往研究由于编码方案复杂,语料取自小规模语料库或大型语料库的小规模随机样本,数据规模小。本研究将基于大型语料库,使用构式搭配分析法识别大量被完成体吸引和排斥的动词列表,以避免频数效应并解决动词样本的代表性问题。

1.2 基于语料库的搭配研究

已有研究表明,意义与结构有千丝万缕的联系,词与词、词与型式、词与构式之间的高频共现或高强度搭配关系是这些联系的体现之一。搭配可以通过科学的量化分析程序进行界定、测量和分析(Sinclair 1991;李文中2019;陈功,梁茂成2017;濮建忠2020)。Sinclair(2004)基于对大量搭配的分析研究得出结论,词语和语法不可分,二者相互渗透,相互联结,相互依存。构式搭配(collostruction)研究把语料库语言学的搭配概念与构式语法及认知语法结合起来,以语法结构为观测节点,观察和分析与该结构共现的搭配词(Stefanowitsch & Gries 2003:14),并提出相应的统计方法以计算搭配关系(Gries 2013)。

语料库搭配和型式研究表明,意义和句法之间的联系表现出很强的共现倾向(Sinclair 1991:65),用于同一型式中的词语并非任意出现,其中很多词项在意义上非常接近(Hunston & Francis 1999),共享某一型式的词语,同时也共享某些语义特征。句法研究学者在研究动词语义与句法结构关系时也得出类似的结论,动词意义包含结构性成分和特质性成分:结构性成分与句法行为有关,具有相同句法行为的动词具有相同的结构性成分;特质性成分是动词的实际“意义”成分,或者说是此动词与其他具有相同句法行为的动词的区别所在(Hovav & Levin 1998)。

搭配和型式语法研究揭示了语法与词汇不可分割的共选关系,但针对英语动词时体的相应探索依然少见(张立英2021)。以动词为核心分析其与完成体的构式搭配,可以提取那些以高于预期频数用于完成体的动词。分析这些动词共有的语义特征,可以发现与完成体适配的动词的整体语义特征,从而更好地理解完成体构式的意义和用法,为英语时体的理论探讨提供数据支撑,为解答有关完成体的诸多疑惑提供思路。为此,本研究采用数据驱动的方法,基于大型语料库,用构式搭配分析法提取被现在完成体吸引和排斥的动词词表,在此基础上,分析被完成体吸引和排斥动词的语义特征,探究动词与完成体的语义适配性。

本文将重点关注以下问题:

在英语国家语料库(BNC)和美国当代英语语料库(COCA)中,哪些动词被完成体吸引?哪些动词被完成体排斥?

被完成体吸引和排斥的动词分别具有哪些语义特征?动词的哪些语义特征与完成体语义适配?

2.研究语料与方法

本研究的数据来自BNC和COCA,这两个库分别代表英式和美式英语(Aston & Burnard 1998;Davies 2010)(表2)。

表2 :BNC和COCA②语料库概览

我们采用构式搭配分析法作为分析动词与完成体适配性的辅助工具。根据同一个动词在不同时体的频数分布,使用构式搭配分析软件③计算得出被完成体吸引和排斥的动词词表。观察这两组动词词表,能发现与完成体兼容和不兼容的动词语义特征,对这些语义特征的分析有助于深入理解完成体构式。构式搭配分析法基于类符和形符的频数分布,通过费舍尔精确检验,统计构式与词项的搭配强度,考察词项与构式的吸引或排斥程度,吸引强度排行最高的动词与构式义适配性最高,排斥强度高的动词则语义适配性低。构式搭配强度大于3时等效于p<0.001,构式搭配强度大于2时等效于p<0.01(Stefanowitsch&Gries 2003:214)。

对动词Vi进行构式搭配分析,需要现在完成体中动词Vi的原始频数,动词Vi在其他时体的频数和全库所有现在完成体的总频数。BNC语料库中完成体动词频数,使用Wordsmith软件提取,即输入”has/have”检索所有含有has或have的索引行,并在Wordsmith生成的搭配词表中计算has/have右侧第1(R1)到第3(R3)位置出现的所有过去分词总频数。COCA语料库中的完成体动词频数,使用以下方法提取,在COCA库的在线检索界面输入搜索词“has_v?n*”和“have_v?n*”,提取前1,500个高频完成体动词。动词Vi在其他时体的频数则借助词性赋码标注统计。

3.语料库中完成体与动词构式搭配分析结果

统计结果表明,完成体的使用频数在BNC和COCA两库间存在显著差异(χ2=29,863.0271,p<0.001),BNC中完成体的使用频数低于COCA。

3.1 BNC语料库中现在完成体吸引和排斥动词

BNC语料库构式搭配分析产生了715个与完成体具有吸引关系的动词(其中441个动词搭配强度≥1.3,p<0.05),627个具有排斥关系的动词(其中474个动词搭配强度≥1.3,p<0.05)。针对以上动词,已使用构式搭配分析法的算法排除了频数效应的可能性,即这些动词不可能是由于它们在整个语料库中使用的频数很高或很低而被完成体吸引或排斥。表3列出了BNC中完成体吸引和排斥动词列表中的前20个动词。

表3 :BNC中被完成体吸引和排斥的前20个动词

BNC构式搭配分析结果显示,被完成体吸引的动词中,成就动词占很大比例。前100个动词中,成就动词占50%,如become、give、achieve;活动动词占28%,如develop、change、rise;状态动词占16%,包括prove、fail、survive等;完结动词占6%。就终结性、持续性和动态性特征而言,被完成体吸引的动词中,84%带有动态性,56%带有终结性,50%带有持续性。

被完成体排斥的动词呈现出不同的结果,前100个动词中,57%为活动动词,43%为状态动词。被完成体排斥的活动动词包括smile、nod、stare、laugh、sigh、murmur等。被完成体排斥的状态动词包括know、mean、look、seem、want等。状态和活动动词是仅有的两类与完成体具有排斥关系的动词,其中57%带有动态性,0%带有终结性,100%带有持续性。

对比被吸引和排斥的动词列表可以看出,完成体对成就动词有偏好。在所有被完成体吸引的动词中,成就类动词约占50%;在被完成体排斥的所有动词中,没有成就动词。对于状态和活动动词,它们表现出分化现象:有些状态和活动动词被完成体吸引,而有些则被排斥。

3.2 COCA语料库中现在完成体吸引和排斥动词

COCA语料库构式搭配分析结果显示(表4),在所提取的前1,500个高频现在完成体动词中,765个与完成体具有吸引关系(其中708个搭配强度≥1.3,p<0.05),735个有排斥关系(其中686个搭配强度≥1.3,p<0.05)。

表4 :COCA语料库中被完成体吸引和排斥的前20个动词

在COCA语料库中,完成体动词类型的分布与BNC语料库类似。在被完成体吸引的前100个动词中,成就动词占50%,活动动词占36%,状态动词占12%,完结动词占2%。成就动词在所有动词类型中所占份额最大。但在COCA中,活动动词的百分比高于BNC。

COCA中被完成体排斥的动词列表也与BNC类似。状态和活动动词是被完成体排斥的动词列表中仅有的两种类型。被完成体排斥的前100个动词中,57%是活动动词,43%是状态动词。被完成体排斥的状态动词有contain、wish、sound等。

?

在BNC和COCA中,完成体都表现出对成就动词的偏好,活动动词和状态动词则呈两极分化:有些被吸引,有些被排斥。就动词的终结性、持续性和动态性而言,动态性和终结性是被完成体吸引的动词的最主要特征,但是动态性同时又是被排斥动词的主要特征,而终结性只能解释部分被完成体吸引的动词,有很多被完成体吸引的动词属于非终结性动词。为更好地解释以上发现,我们将进一步分析被完成体吸引和排斥动词的其他语义特征,讨论动词和完成体的语义适配性。

4.现在完成体与动词语义适配性分析

4.1 被现在完成体排斥动词的语义特征

以往研究大多聚焦被完成体吸引的动词,而被完成体排斥的动词未得到足够关注,值得注意的是,被吸引与被排斥动词对完成体与动词关系探讨同样重要。仔细观察被完成体排斥的活动动词,会发现描述动作执行的方式是其语义的一部分,并且它们绝大多数符合对方式动词的评判标准:(1)这些动词对其主语有一定限制,不允许表达自然力或无生命的名词作主语;(2)将这些动词带入以下表达会出现语义矛盾,“#Jim+方式动词,但没有动一块肌肉”(Beavers& Koontz-Garboden 2012)。因此,被完成体排斥的活动动词属于方式动词。

除了方式动词外,有些动词既包含结果义又包含方式义,属于“方式+结果动词”(ibid.)。这些动词也出现在被完成体排斥的动词列表中,如climb、shake、cast、plunge、stick、jump、press。动词climb有两种不同的用法,一种是方式动词用法,另一种是结果动词用法。Climb在关于方式/结果区分的研究中经常被讨论(Jackendoff 1983;Koontz-Garboden 2010;Hovav & Levin 2010;Mateu & Acedo-Matellán 2012),如下面两句。

[1]We climbed the rickety wooden stairs that led up to a balcony.(BNC)

[2]Profitsmeanwhileheadedtheoppositedirection—they climbed 1.25 percent to S244 million.(COCA)

表5索引行列举了更多动词的方式和结果用法,在这些索引行中,用于一般过去时的动词可被解读为方式用法,用于完成体的动词可被视作结果用法。

表5 :动词方式和结果用法索引行

需要注意的是,climb在句[1]中表达爬升,用作方式动词,而语料库检索结果发现,作为方式动词的climb很少出现在完成体中(表6)。在BNC中,climb用于完成体的情况共计43例,其中,像句[1]用作攀爬义的句子只出现了3次,而climb在剩下的40例中都表示上升或增加的意义,表达沿着一个特定测量路径的变化。类似的观察结论适用于其他“方式+结果”动词,如shake、cast、stick。当用作方式动词时,它们很少出现在完成体中,而用于完成体的情况大多数都表达结果状态或变化。对这些“方式+结果”动词的索引行分析表明,当“方式+结果”动词用于完成体时,绝大多数情况下不用作方式义,而用作结果义。

表6 :用于现在完成体的“方式+结果”动词的结果和方式义使用频数对比⑤

方式动词的本质属性是非等级变化,动作由一系列复杂且各自独立的变化构成,但是这些各自独立的变化“并不构成一个在某单一属性或单一维度上的变化”(Beavers & Koontz-Garboden 2012:343)。方式动词如laugh、smile、stare、limp等指明面部、眼睛或四肢运动组合的序列,由一系列各自独立而相互关联的变化构成,但这些变化不能汇聚为某单一属性或维度的变化,亦即面部、眼睛或四肢的各种动作不会构成沿着某一个维度或属性的特定变化。

被完成体排斥的动词除了方式动词,还有一部分静态动词,如know、wish、want等。有些静态动词表达单纯的心理状态,这些动词或相关论元的语义中不带有状态的变化。被完成体排斥的其他静态动词,如contain、seem等,与心理状态动词相似,单纯描述某些实体的状态。这与被完成体吸引的静态动词如cost、benefit、help、result、last形成鲜明对比,后者与论元或其他句子成分一起表达某一个等级属性,具有等级性特征。

BNC中约62%、COCA中约57%被完成体排斥的动词具有方式义和动态性,其余为静态动词,而被排斥的静态动词一般表达单纯的状态,不具有等级性特征。因此,非等级性或方式义可以被认为是完成体排斥的动词最突出的特征。

4.2 被现在完成体吸引动词的语义特征

分析完成体吸引的动态动词(即所有成就、完结和部分活动动词)可以发现,所有这些动词都表达等级变化,即单个属性在特定方向上沿着量级(scale)的变化(Hovav 2008:17)。属性可以是某种特征、体积、程度、运动路径上的位置等,比如动词invest,其测量值由货币或时间属性的有序值组成(投资事件必然涉及货币或时间等属性值的增减)。等级性动词的主要特征是可以用量级来刻画事件或动作的进程,动词或其内在论元的语义中带有某个属性特征,该特征沿量级的变化与事件进程具有同构关系,随动作或事件的进展而发生变化。量级可以分为两极和多值。两极变化中,属性只有两个值,动词的量值从一个转换到另一个。例如,在句子Mr Kaifu has won a small but notable victory中,Kaifu先生经历了从没赢到赢的两极变化。成就动词如give、fall、win、reach属于两极变化。在多值量级中,某一属性有许多值,代表属性的不同程度。完结和部分活动动词如invest、expand、develop、evolve等属于多值变化。

与等级性动词不同,非等级性动词无法提取某一主要属性特征,非等级性动词如limp、scurry、meander虽然编码了速度、路径、步伐等可用量级表示的运动特征,它们同时也描述了动作执行者的具体动作特点或心理状态,如动作执行的难易、匆忙与否、有无目标等。这些高描述性语义成分压倒了可以用量级刻画的动作速度、路径等属性特征,从而难以用量级刻画动作所描述事件或动作的进程。

一些被完成体吸引的状态动词,如last、cost、suffer、help、benefit等,它们或者在其论元的语义中编码了等级性(Fleischhauer & Gamerschlag 2014),表达某一属性的变化;或与时间状语一起表达状态的持续,可视为等级性结构。在被完成体吸引的前50个状态动词中,等级性状态动词在BNC中约占70%,在COCA中占65%。在BNC和COCA中,动态动词中的等级性动词和状态动词中的等级性动词,分别占被完成体吸引的动词列表的89%和93%。

因此,等级性是被完成体吸引动词最突出的语义特征,等级性的一个重要特征是其简单性,即单个属性值的定向变化。等级性动词不一定都是动态动词,有些静态动词可以表达等级性;等级性动词也不一定都是终结性动词。

4.3 现在完成体与动词语义适配性

基于BNC和COCA的构式搭配分析结果显示,在动词的时间结构特征中,动态性和终结性是被完成体吸引动词的最主要特征。这与其他基于语料库的发现一致,即成就动词(Elsness 1997)和动态动词高频用于完成体(Davydova 2011)。

本研究验证了动态性是完成体中动词的主要语义特征,但同时发现动态性也是被完成体排斥动词的主要特征,而这一发现得益于构式搭配分析法的算法优势。构式搭配分析法根据动词在不同时体的频数分布,计算出动词与时体的吸引和排斥关系及其关联强度。

对完成体吸引和排斥动词的进一步分析发现,等级性是被完成体吸引动词的主要特征,而非等级性或者方式义是被完成体排斥动词的主要特征。编码等级性的动词倾向于被完成体吸引,编码非等级性的动词则倾向于被排斥。这样,完成体中动词的使用可分类如下(图1):

图1 :完成体中动词分类

方式性、等级性、终结性、动态性作为动词语义特征,与动词编码的事件结构有关(Beavers 2008),常用于解释动词的句法行为。这些语义特征并非相互独立(Caudal & Nicolas 2005;Kennedy & Levin 2008),方式/结果义的本质是非等级/等级变化,等级性是终结性的必要但非充分条件,带有终结性的动词必然具有等级性,并非所有等级性动词都是终结性动词。而带有非等级性特征的动词,由于缺乏一个测量维度,其必然是非终结性动词。方式/结果、终结性/非终结性的区分都是在动态动词范畴下进行。

终结性强调动作的终点,可以是动作的自然终点,或是动词论元或其他成分对事件或动作进程进行量化,从而使动作终止。前者是动词本身编码了终结性,后者则是动词与其他成分组合形成的终结性。等级性是动词所具有的可以沿量级变化的单一属性特征。如果等级性动词所涉量级是封闭的,具有一个最高或最低值,则有终结性;如果量级是开放的,则有非终结性。因此等级性是比终结性更为基础的语义成分,终结性可以由等级性特征推导得出。

本研究发现完成体对动词类型有选择性。亦即,完成体作为语法构式倾向于选择带有特定语义特征的动词类型。完成体的选择性和动词在完成体中的不同行为可以通过完成体和动词的语义适配性来解释。

现在完成体表达静态义或表达某一事件结果(Katz 2003:208)。完成体吸引等级性动词,这类动词指向了变化后的状态或状态的持续,与完成体的构式义兼容。虽然方式动词也涉及变化,但是这些变化是复杂无序的,没有一个单一的、沿某一个测量维度的主导性变化。方式动词类似于Snell-Hornby(1983)所提出的义素复杂的描述性动词。一个动词描述性越高,义素越复杂,句法类型越受限(Boas 2006)。此外,方式动词的语义结构中带有的方式义,与完成体的静态性冲突。

Vendler的四分法可以解释为什么完成体吸引成就动词、完结动词和一部分活动动词———这些动词的动态性特征使其被完成体吸引,却不能解释活动和状态动词在完成体中的两极分化现象。区分等级性/非等级性可以解释更多基于大型语料库所发现的被完成体吸引和排斥的动词。等级性动词倾向于被完成体吸引,而非等级性动词倾向于被完成体排斥。动词能否在完成体中使用,很大程度上取决于该动词是否具有与完成体适配的语义特征。

5.结论

完成体对动词具有选择性,更倾向于吸引等级性动词作为搭配动词,排斥非等级性或方式动词,这在BNC和COCA两库中均有类似发现,说明不论英式或美式英语,等级性是完成体吸引动词的主要语义特征,方式义是完成体排斥动词的主要语义特征。

等级性不仅编码于动态动词,有些静态动词也编码等级性。本研究发现,在动词时间结构特征基础上,综合考虑动词等级性语义特征有助于解释被完成体吸引和排斥的动词,尤其是解释活动和状态动词被完成体吸引和排斥的两极分化现象。

本研究基于大量真实语料对完成体中动词进行了系统详细的描述,可为完成体的理论探讨提供数据基础。但本研究仍有局限性,其中一些可在未来研究中解决。首先,我们的调查仅限于BNC和COCA两个语料库,未考虑其他英语变体,不能排除各英语变体中的完成体存在较大差异的可能。此外,其他语境因素,比如体裁、语用等因素,可能会影响完成体的使用,这些问题将在未来研究中探讨。

注释:

①Smith(1997)在Vendler动词四分法基础上增加了一次性瞬时动词(semelfactive),该类动词语义特征为非静态性、非持续性、非终结性,如cough、flap、tap等。这类动词在所研究语料中数量很少,仅有的5个动词多用于活动动词,如句子American flags hanging from front porches flapped in the overcast sky(COCA),因此这里未考虑此类动词。

②COCA每年会收录新语料以增加库容,本研究所用COCA语料库来自2017年12月在线数据,该语料库网址为https://www.english-corpora.org/coca/。所用BNC为单机版语料库。

③本研究采用的构式搭配分析软件为S.T.Gries开发的Coll.Analysis 3.2a。

④排斥关系并不一定意味着这些动词不用于现在完成体,而是说这些动词用于现在完成体的频数(包括0频次)远远低于其用于其他时体,或者说这些动词在现在完成体中的频数远远低于构式搭配软件计算出的预期频数。

⑤本表统计的完成体不包括带有不定式和情态动词的完成体。