基于语料库的大学英语教材兼类词分析研究*

2019-01-15 23:21马亚伟
山西青年 2019年20期
关键词:多义词互信息词类

张 晨 马亚伟

(甘肃政法学院,甘肃 兰州 730030)

一、大学英语教材的兼类词

在大学教材语料库采用的标注类型为词性标注,词性标注也被称为语法标注。本文中使用的大学英语教材语料库采用的是claws7词性标注集,其中词类标记共有11个,除了词类外,还对语料库中的某些特殊句法表现做了标记,使用的特殊标记共10个,包括连词7个,限定词13个,冠词2个,介词4个,名词22个,形容词4个,数词7个,代词19个,副词16个,动词31个,其他类12个。

由于对大学英语教材语料库语料标注时使用的是词性标注,因此在标注时会遇到词的兼类现象,词汇歧义的表现形式有三种,一是只有一个歧义词的结构现象,但其不同词义解释属于同一词类。二是含有两个歧义词的结构现象,这两个歧义词属于不同词类,但每个歧义词的不同词义解释为同一类型。三是只含有一个歧义词的结构现象,但不同词义解释为不同词类。这种歧义现象主要是因为歧义词可身兼双职,担任不同的词类现象,因此形成了结构的歧义现象,从而造成语义的歧义,这种现象叫做兼类词歧义。

(一)词语意义引起的歧义

多义词指有一个以上意义的词,它出现在句子中往往使句子产生歧义。多义词涉及多种词类,既可能是形容词、副词、名词、动词等开放性词类,也可能是介词和助动词等封闭性词类。其中包括一词多义词和同音(同形)异义词,如一词多义词,例如:Mary can’t bear children.bear有“生育”“忍受” 和“背负”的意思,从而造成了以下的歧义:玛丽不能生孩子;玛丽不能容忍孩子;玛丽背不动孩子。还有同形异义词,“Ask for him this afternoon,and you will find him a grave man !”在这里grave可以指 serious,也可以指tomb.grave这个词描述了主人公的开朗的性格。

(二)由词汇层结构而引起的歧义

派生词中由于各词素之间不同的结构关系而形成的歧义:That door is unlockable.

unlockable这三个词素可以有不同的组合形式:(a)un+Vable;(b)un V+able 词汇的意思。Unlockable是因为词汇的内部结构的不同发生了词义的变化,因此理解也有所不同:

(a)那个门不能上锁。(b)那个门是能开锁的。

(三)特殊词汇引起的歧义

含糊词,英语中有些词,如democracy,equal,obscene,radical,justice,fanatic 等,词义含糊,不同社会阶层的人会有不同的理解。例如All men are created equal 这句话,至今仍是解释各异。一些人认为这里的equal 是指人的天赋,气质和能力的无差异;另一些人则认为这是指民族、种族和出身的平等。这样,一句话就有完全不同的解释。

合成词,某些专有名词和其它普通名词构成有特别意义的普通名词,如a black sheep(黑/败家子),a white elephant(白象/无用的累赘东西),an old bird(老鸟/精明老练的人)等习语都有不同的内涵意义,如果不能真正的理解这些词汇的内涵,就很难理解词汇所表达的真实含义。又例如,China bean 是红豆,China rose 月季,使用这类词时应特别注意其引申意义,切勿望文生义,否则会翻译错误闹出笑话。

二、大学英语教材兼类词消除歧义的方法

(一)互信息(概率信息)

互信息是研究词语搭配常用的方法,就是一个词的出现为给另一个词提供的信息量有多大,一般来说,两个词目之间的联系越强,它们之间的互信息就越大。如果两个词目之间是负相关,则它们的互信息就是一个负值。如果两个词目相互对立,这时互信息为零。即互信息较高的两个词目很有可能组成一个有意义的搭配,互信息值小于零则词目不可能构成搭配。互信息的值可以根据实际确定,一般为3;大于3通常表明是有意义的搭配,小于3则表明二者的搭配无显著意义。

在大学英语教材兼类词中,有些兼类词消除歧义主要靠for等后置词组或靠从句作定语,常用一个名词或词组代替放在前面以减少单词量,因此,that在大多数情况下的词性为连词,如that和人称代词、疑问代词、be动词、实义动词和名词的互信息都大于3,因此可以判断出that和人称代词、疑问代词、be动词、实义动词以及名词都为有效的搭配,但是还不能确定准确的词性,又如for与人称代词、疑问代词、名词都为有效的搭配,但是却不能判断其词性,所以还应根据语境来确定其词性。

(二)上下文语境

语境就是根据上下文运用语言的环境,包括特定的自然环境、社会环境和交际环境。具体来说,在书面语中是由文章的上下文体现,在口语中是由具体的时间、地点、人物身份、场合等因素来决定。词汇歧义现象,特别是指由于词汇自身引起的歧义都可以通过语境来解除歧义。语境有上下文语境、情景语境和文化语境之分。上下文语境是指一个语言单位(词汇)和它的上下文之间的联系,这种联系既可以是语音层面的,也有语义层面和语法层面的,通过特定的上下文语境来可以了解词汇出现的目的,词汇选择的客观依据,词语组合的一般规律,根据不同的情景来确定词汇的语义。

大学英语教材兼类词在确定其互信息有效的情况下,再根据上下文语境便可确定其词性,一个多义词可能会有几个不同的意义,但在一定的上下文语境里却不会产生歧义现象。在一个具体的语言环境里,可以排除这个多义词的其它讲不通的意义。如,Say it again! 这句话的含义因语境而不同。假设两人在谈话,说话人声音较小,听话者没有听清楚,让说话者重复一遍,听话者说Say it again!如果两人在吵架,一个人对另外一个人 说Say it again! 这就是在警告不要重复刚才说的不恰当的话。又如:He went to the bank.本句的歧义是由于 bank 可作“银行”,也可作“河岸”解。如果为该句增加一个限制性信息,就不会有歧义了。如:a.He went to the bank for money.b.He went to the bank for fishing.

三、结语

兼类词是词性标注的难点,因此应该根据兼类词的不同类型选择不同的方法对兼类词进行词义消歧,大学英语教材中的兼类词属于词类歧义,即一个词具有两个或两个以上的词性,根据互信息的方法首先确定词汇搭配是有效搭配,然后再根据上下文语境确定词性,这样才能提高语料标注的准确性,为进一步的词法、句法研究奠定基础。

猜你喜欢
多义词互信息词类
中文词类信息在副中央凹中的加工*
体认原型范畴视域下多义词延伸及对学科英语研究生培养的启示
多义词
用词类活用法扩充词汇量
大学英语词类教学研究及启示
中、英多义词的翻译识别劣势效应及其影响因素
从成语中学习词类活用
基于改进互信息和邻接熵的微博新词发现方法
基于互信息的图像分割算法研究与设计
基于互信息的贝叶斯网络结构学习