基于语料库的optimal和optimum词义辨析

2018-08-13 02:04
信息记录材料 2018年9期
关键词:近义词辨析语料库

孙 露

(西安石油大学 陕西 西安 710065)

1 引言

随着社会、经济的发展,学习英语的人原来越多,近义词辨析一直都是英语学习中的一大重点和难点。“传统的同义词辨析方法多依赖于直觉经验,采用内省的定性方法对同义词的词目意义进行分析,或通过对同义词的词形、词义、结构或用法等方面的比较来就行辨析。”(徐娟,2011)但由于词典只提供简单的解释和少量的例子,很难掌握词最细微、最本质的差别。

语料库作为一种新的学科和研究方法,包含有大量真实的语言数据和文本。对其进行自动检索、分类汇总,分析数据、概括和总结,可以系统、高校、科学地分析词的具体用法,从而达到近义词辨析的目的。

2 语料库研究

2.1 研究工具和方法

本次采用研究采用语料库研究的方法,主要使用的本族语语料库为美国当代英语语料库(Corpus of Contemporary American English,简称COCA),此语料库由美国杨百翰大学的Mark Davies教授创立并于2008年上线,包含4.5亿词的文本。每年至少更新两次,至少扩展2000万词汇,涵盖口语、小说、流行杂志、报纸和学术性文体,各占20%,基本成均衡平衡分布。是世界目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库。

2.2 分析对象

在柯林斯英汉双解大辞典中,optimal和optimum是这样定义的:

Optimum:ADJ The optimum or optimal level or state of something is the best level or state that it could achieve.最佳的。

Optimal: →see optimum

除了在柯林斯英汉大辞典外,几乎在所有相对比较权威的字典中,optimal和optimum都是这么定义的,这就意味着这两个词是完全一样的。事实真是这样吗?这两词有区别吗?

2.3 语料库分析

2.3.1 概况

2.3.1.1 总频率 通过语料库统计,optimal的使用频率为4142次,每百万次出现频率为8.92词,明显高于optimum的1563次,3.37词,optimal是optimum的2.6倍。在研究中我们先查了下optimum作为名词时使用的频率,结果显示只有在1992年academic中出现过一例,这样我们可以得出,在英语为母语的国家optimum已经不再所为名词使用。而在我们平时学习和使用中我们还常常使用,这与英语在其母语使用有出入。鉴于此,我们只需要辨析同样作为形容词两词的区别(以下研究均已除去其作为名词使用的情况)。鉴于此,我们只需要辨析同样作为形容词两词的区别。

2.3.1.2 各自在口语和书面语的频率 统计得出optimal在口语和书面语中的使用频率分别为:105次和4037次,比例为1:38。Optimum在口语和书面语的频率分别为69次和1494,比例为1:22。以上数据说明optimal和optimum都广泛用于书面表达中,尤其是optimal更是大量用于书面表达中。

2.3.1.3 各自在不同语域的使用频率 optimum各语域的使用频率按照从多到少排序,依次为:academic(学术)、magazine(杂志)、newspaper(报纸)、spoken (口语)、fiction(小说)。而optimal为:academic(学术)、magazine(杂志)、newspaper(报纸)、fiction(小说)和spoken(口语)。Optimum和optimal都较多使用在academic(学术)、magazine(报纸)和newspaper(报纸),其比例分别为:

表1

由表1可以看出:optimal在academic中大量被使用,其使用频率远高于optimal和optimum使用的平均频率。Optimal除了在fiction的低于optimum外,在其他语域中的使用频率都远远高于optimum。随着书面表达要求越严,optimal使用比例越高,除在fiction中外,具体原因下文讨论的两词的显著搭配词特征时分析。

2.3.2 搭配词和类连接 在语料库中,MI经常用来作为搭配强度的标准。MI值即相互信息值(mutual information value)。体现词汇之间的搭配强度和具体搭配的显著程度。通常来说,M1值大于3的搭配可视为显著搭配。(胡开宝,2011)

在COCA语料库中,将跨距设为4并将共献频率大于10,按照MI值为标准进行排序,前10个如表2所示。

表2

从表2可以得出这样的结论:

(1)Optimal与其所搭配词的相互信息值整体上高于optimum与自己所搭配词的相互信息值,说明其搭配力要高于optimum。

(2)optimal除了和普通词汇搭配外,多和术语搭配,如Pareto,而optimum多个普通词汇搭配。这也说明为什么学术论文中optimal的使用比例远远高于optimum。而optimum多和efficiency,dose,performance等表示实际行动或者操作的词连用,这是在学术论文,杂志和报纸中optimal比例较高,而只有在小说中optimum使用频率比optimal高。

在COCA语料库中,将跨距设为4并将MI值设为大于3,按照共现频数为标准进行排序,排名前30中的单词中,optimal和optimum共同的搭配词有:level,conditions,performance,Solution,levels,learning,determine,achieve,design,provide,results等。

将左右间距设定为±4,按搭配频率排序前16个词:

表3

表4

综合表3和表4可以看出:(1)在普通词汇的搭配使用中,绝大多数词汇搭配频率optimal远高于optimum。(2)从相互信息值的高低排序的词语来看,optimal和optimum有较大区别的。Optimal多与Pareto; foraging;algorithm,ratio,disclosure等表示或与经济、数学,数字等相关的词搭配,或与Stimulation、foraging、precaution等表示行动力的词搭配。Optimal多和没有具体尺度衡量的词搭配,比如:function,balance,challenged等表示模糊尺度概念的词搭配。而Optimum多与temperature;speed、PH等表示有具体度量的词连用。(3)在与size、amount、weight则无明显差别。

最后,通过查询,可以看出COCA数据库中optimal十个近义词而optimum只有八个。Optimum和optimal互为近义词,optimal包含optimum的全部意思,含有optimal所没有的target和goal的意思,从这点来说optimal比optimum范围要广。另外他们彼此不是互为第一近义词,说明其意义还有一定差别的。

3 结语

通过借助语料库分析,optimal和optimum搭配有一定倾向性和差别。绝大多数时候,Optimal的使用频率远高于optimum。optimal多与表示数学,数字,计算机科学的词搭配。但第二语言习得者因为语言输入少,获取材料少导致对很多类似近义词难以辨析。借助语料库通过对其使用频率、搭配,MI值,近义词等的分析,我们能更好的了解近义词的细微差别。在翻译时,我们应该根据文本的性质和主被动情况来确定用词,切不可无选择的使用。本文不足之处在于,因本人仅借助COCA一个语料库,难免有一定局限。

猜你喜欢
近义词辨析语料库
怎一个“乱”字了得!
——辨析“凌乱、混乱、胡乱、忙乱”
怎样辨析近义词
《语料库翻译文体学》评介
找找近义词
圆锥曲线易错题辨析
同义词组辨析练习
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
“assess”和“evaluate”辨析与翻译