英语多词组合分类的影响因素及搭配的认定原则

2012-08-15 00:45李华商金芳
大家 2012年6期

李华 商金芳

(李华:河北行政学院经济学教研部,副教授,研究生。商金芳:河北行政学院经济学教研部。)

搭配,这种多个词构成的组合,作为一种语言现象受到第二语言教学、词典编纂和自然语言处理等领域的重视。组合基于一定的关系,不同的关系构成了搭配分类的基础。

一、英语多词组合分类的影响因素

对于搭配,有基于统计和基于非统计两种不同的观察角度。前者根据语料库中词语的共现来认定搭配;后者则从组合本身的语言特点出发来看待搭配。认定搭配的影响因素如下。

(一)词性因素

英语对外教学的先驱Harold E.Palmer(1933)将搭配分为动词搭配、名词搭配、副词搭配和介词搭配。

Benson(1986),将词汇搭配分为:动词+名词/代词/介词短语;动词+名词;形容词+名词;名词+动词;名词1 of 名词2;形容词+副词;动词+副词。

与之类似,Aisenstadt(1981)从组成元素的词语类别角度进行过分类。

这些分类主要涉及动词、名词、形容词、副词等开放类实词。介词在英文中和动词关系紧密,所以也被考虑。选择开放类实词的原因在于它们侧重词汇意义,个体差异较大,其它词类相比较而言更多体现出语法意义,共性较多,比如冠词、连词。另外,由于英语中词类和句法成分具有比较强的对应关系,所以,其它一些从句法角度分类的方法也可看作基本等同于从词类角度分类。

(二)语义透明

Vinogradov(1947)将多词单位三分。1)短语合并:语义不透明并且一般结构固定,语义不透明标准作为判断习语的标准已被广泛接受。2)短语结合:其意义是其原本意义的比喻拓展;3)短语组合:构成组合的两个词都属开放词类,其中一个是字面意义,另一个是比喻用法,如meet the demand,meet为比喻用法,demand为字面意义。

1963年,Amosova的观点缩小了Vinogradov的第三类组合范围。后者认为第三类组合中对应比喻用法的词(meet),既可以只有一个搭配词,也可以有多个搭配词(demand,need,requirement等);而Amosova则认为不包括多个搭配词的情况。

不难看出,两人的划类标准属于意义标准,即,通过组合意义、各部分意义之间的关系来确定不同组合类别。

(三)可替换性

Howarth(1998)从替换的角度将动词+名词的搭配分为五种:1)名词自由替换,动词受限(小部分同义动词);2)均可部分替换(小部分名词,小部分同义动词);3)小部分同义动词+名词唯一;4)小部分名词,动词唯一;5)二者都唯一,如curry favour。

(四)语义透明度和组合内部变化的结合

在Cowie,Mackin,& McCaig(1975),Cowie(1981)中,作者提出了划类的两条标准:意义和内部变化。并将组合划分为四类:1)习语;2)比喻习语: 组合具有比喻意义,但字面意义仍然在使用,如catch fire;3)受限搭配: 一个词仅在此组合中具有比喻意义,另一个词保留字面意义并可能替换成其他词,如a cardinal error/sin;4)开放搭配:两个构成元素可以自由重新组合fill/empty the sink/basin。

综上,观察搭配的角度主要有:词类、语义透明度、内部变化(主要是可替换性)。其中,语义透明度和内部变化具有一定的相关性,即,可替换性越强,语义透明度越高。可以认为可替换性是语义透明度的外在表现形式。所以,事实上,英语搭配的分类主要考虑了句法和语义。

二、英语搭配确定的原则

搭配主要应用于词典编纂、第二语言学习和自然语言处理。不同的应用需求是否需要相同的搭配呢?第二语言学习者对于词语搭配的各种限制,如词语选择、内部替换等不太敏感,容易产生问题。自然语言处理中,如词义消歧,主要需要的是能够帮助确定意义的搭配。而词典限于容量不可能收录全部可能的搭配。如果以上面语义透明度来表示,从完全透明(纯粹自由组合)到习语(语义完全不透明)构成一个连续统,那么,事实上第二语言学习和自然语言处理需要面对的搭配其实是相容的,即排除掉完全不透明的习语后的全部组合,而词典还需要排除掉最极端的自由组合。

但是,无论何种应用,去掉习语的多词组合实际上仍然是一个无限的开放集,可操作性很低,且其范围还可继续缩小。因此,在认定搭配时,需要考虑下面的原则。

(一)代价大小的原则

参考上述分析,并不是所有的相关因素都产生影响。比如词类,就不会考虑冠词,因为对于人或机器来讲,有限的规则就足够了。所以,搭配的范围可以继续缩小,缩小的原则就是无论对人还是对机器,如果有规则可循,而且学习规则的代价小于学习每一个组合的代价,则这个组合就可以通过规则来学习。实际上,这也是为什么辞典编者、第二语言研究者经常将自由组合排除出搭配的范围的原因。

(二)能产的原则

首先,真实语言具有能产性,每天都在产生新词,母语人士都能正确的使用其构成搭配;其次,无论从多大的语料库或者任何其他途径获得的搭配相对于真实语言中的搭配都是一个有限集。这就要求在划定搭配研究范围时要考虑潜在的合理搭配,也就是能产性。

上述两条原则实际上是从不同的角度讨论相同的问题。代价大小是从学习者角度考虑;能产是从语言本身的特点考虑。之所以提出这样两条原则,在于学术界之前的分类和搭配范围的认定都忽略了这样的角度,而这两点是和有效的学习息息相关的。对于学习者(无论人或者机器)来讲,显然规则是需要优先考虑的。