基于语料库的英汉开始类词语的语言差异性探究
——以start,begin和开始为例

2019-07-08 12:45李佳夏云
英语教师 2019年9期
关键词:语域语体语料库

李佳 夏云

引言

随着语料库语言学的研究发展,人们日益关注词汇的纵深信息。对于词汇深度知识的构成,内申(Nation,1990)认为掌握一个词意味着了解它的形式(口头、书面)、位置(语法句型、搭配)、功能(频率、得体性)和意义(概念、联想)。掌握一个外语词远非仅仅了解“符号—意义”一对一的简单过程,而是涉及对一个词全部特征的了解、熟悉和掌握。此外,语料库证据表明,每一个词项都有独特的搭配行为(Partington 1998:27),同义词也不例外,它们一般只在概念意义上相同或接近,但在搭配词选择上并不能随意替换(Conzett 1997)。例如,powerful car和strong tea是典型搭配,而powerful tea和strong car则不符合英语表达习惯(Halliday 1976)。本文以start,begin和开始等具有代表性的一对英语同义词和汉语对应词为例,观察其在不同语域中的词频分布差异、语义韵特征及其搭配词的所属分类,挖掘词汇纵深信息,厘清英汉“开始”类词语的语言差异性。

一、研究方法

(一)研究工具

本研究所用的语料库包括两个部分:第一部分是英语国家语料库(British National Corpus,简称BNC),词容量超过一亿,能够较好地体现以英语为母语的本族学习者的语言特点;第二部分是兰卡斯特汉语语料库(The Lancaster Corpus of Mandarin Chinese,简称LCMC),是一个100万词次的现代汉语书面语通用型平衡语料库。本研究选用的start,begin和开始在BNC语料库和LCMC语料库中基本高频出现。因此,它们能够在一定程度上反映出“开始”类词语的语言特征。AntConc 3.2.2语料库分析软件为本研究的检索工具。

(二)研究步骤

本研究分别从BNC语料库和LCMC语料库中提取真实数据,分析start,begin和开始在不同语域中的词频分布差异、语义韵特征及其搭配词的语义搭配行为。该研究主要分以下三个步骤进行:

首先,分析start,begin和开始三个节点词在不同语域中的词频分布差异。观察BNC语料库中start,begin两个节点词在不同语域中的分布频率。通过AntConc 3.2.2语料库分析软件,检索开始一词在LCMC语料库中15个不同文本类型中的分布情况,参照BNC语料库中的语体分类标准,观察其在不同语域中的分布频率。

其次,对start,begin和开始三个节点词进行义韵标注。根据上下文语境信息把节点词的语义韵特征标注为消极语义韵、中性语义韵和积极语义韵三类。在标注过程中,对于少数不能明确反映节点词语义韵特征的索引行,从原文中获取上下文语境信息进行观察。

最后,提取start,begin和开始三个节点词的搭配词。在BNC语料库中,分别检索start,begin两个节点词,按搭配词出现的频率检索出前100位搭配词,人工分析三个节点词与搭配词共现的索引行,剔除重复行和不符合义项要求的部分,再对其有效索引行的搭配词进行定性分类,可归纳为以下9类:时间类、动作类、评价类、状态类、工具类、心理类、事件类、价格类及其他;用AntConc 3.2.2软件在LCMC语料库中分别检索开始节点词出现的总频数,人工分析该节点词与搭配词共现的索引行,剔除无效或不符合义项要求的部分,并对其搭配词进行定性分类和分析,分类标准与start,begin搭配词分类标准保持一致,并对比start,begin和开始三个节点词搭配行为的差异。

二、基于语料库的语言差异性探究

(一)start,begin和开始在语料库不同语域中的词频分布差异

语域(Register)这个概念最初是里德(Reid)在1956年研究双语现象时提出来的。关于语域的内涵,哈利迪和哈森(Halliday&Hasan,1985)明确指出:“语域是个语义概念,是与某一特定的话语范围、话语方式和话语基调情景有关的意义组合。”语言使用的领域有很多,如新闻广播、演说语言、广告语言、课堂用语、办公用语、日常谈话、口头自述等,在不同的领域会有不同的语体。由于同义词在不同的语域中往往会呈现出不同的频率特征,所以统计出start,begin和开始三个节点词在不同语域中的频率差异,能够加深学习者对词汇深度的理解,促进其对同义词的合理运用。

LCMC语料库中涵盖15个文本类型,如小说、学术、新闻报道等。开始一词在各个文本中的分布较为平衡,语体差异不显著。

在BNC语料库中,start,begin两个节点词在不同语域中的分布呈现出不同倾向(见图1)。

图1:start,begin在BNC语料库中的分布频率

start,begin在BNC语料库中的分布频率结果显示,这对同义词在不同语域中的分布频率存在很大的差异:start一词在SPOKEN语域中分布频率最高,在ACDEMIC语域中分布频率最低,偏非正式化、口语语体;begin一词则在SPOKEN语域中分布频率最低,偏正式化、书面语体。汉语对应词开始在各个语域中分布较为平衡,没有明显的语体倾向。所以,对于start,begin和开始的辨析如果仅仅从概念意义出发,则很难辨析出同义词之间的细微差异;如果以节点词在不同语域中的频率分布情况为出发点,就可以发现其差异性,使学习者对同义词的辨析有更加理性的认识。

(二)start,begin和开始语义韵差异研究

在英汉两种语言中,许多词语通过自身的含义就可以标示出词语的态度附加功能,如褒义、贬义或中性的特点。然而,语言系统中还有很多概念意义单一的词汇,其态度标示功能就比较隐含,如start,begin和开始。为了对该类词语的态度标示功能进行准确“定性”,需要引入词语搭配的语义韵研究,并以此为基础进行辨析。

语义韵是指具有相同或相似语义特点的搭配词习惯性地、循环往复地与节点词在文本中共现,节点词也就被“传染上”了有关的语义特点,整个跨距内就弥漫着一种特殊的语义氛围(Louw 1993)。词语搭配形成的语义韵大体上可以分为消极语义韵、中性语义韵和积极语义韵三类(Stubbs 1996)。以下分别对start,begin和开始这三个节点词进行语义韵描述。

从BNC语料库中提取的索引证据显示,当start作名词时,该词前经常伴有一个评价性单词,如unpleasant/unpromising/ill-fated/unconvincing/bad/shaky/rocky/nervy/nervous/hesitant/wretched/disjointed/inauspicious;promising/bright/good/super/perfect/fresh/new;quick/early/immediate等。该节点词所吸引的搭配词呈现出消极语义的居多,见例1—3:

3.The BBC told him he’d madestart.

当 start作动词时,常与 new,again,next连用,表示阶段性的重新开始,一般具有积极的语义韵,见例4—5:

4.They had gone out to Jamaica to start

从BNC语料库中检索begin发现,该节点词语义糅杂,既搭配消极涵义的词项,又搭配积极涵义的词项,但大多数搭配词为中性语义,如seep,sprout,discern,proliferate,creep,stir,film shipments,deliveries,rehearsals等,呈现出一种错综的语义韵,见例6—8:

7.The great line of the centuries begins...

在LCMC语料库中,开始节点词共出现了447次,将搭配跨距界定为-4/+4,即取节点词开始左右各4个词为其搭配环境,搭配词出现频率设置为不低于3次,检索出217行索引行。逐一检查索引行,剔除重复行和不符合义项要求的部分,观察其语义韵的特点。检索结果显示,开始节点词的搭配词多为中性语义词汇,其语义特点既不消极又不积极,如思考、发展、走向、接触、建设、实行、实施等,见例9—11:

9.一九八九年以来,各级审计机关陆续开始对一些重点企事业单位实行经常性审计监督制度。

10.辽宁省许多有识之士已开始认真思考,他们开始承认自己的不足与落后。

11.发展西部的工作,在“七五”就已开始实施。

基于语料库,对start,begin和开始这三个节点词进行举例分析,可以看出这三个词的语义韵特征不明显,整体呈现出中性语义韵的特点,但值得注意的是,start作名词时,常与具有消极意义的评价性形容词构成固定或半固定短语,同时需要更多详实的数据,以进行更科学而全面的描述。

(三)start,begin和开始搭配词分类情况

词语搭配指的是词与词结伴使用的语言现象。弗思(Firth,1957)提出的一个著名论断是“由词之结伴可知其词”。语言的词汇并不是单独和孤立地使用的,而是和别的一些词构成习惯性和典型性的结伴关系一起使用的。本文采用卫乃兴(2002)对搭配的定义:“词语搭配是在文本中实现的一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现。”本研究从语料库中提取真实数据来分析start,begin和开始三个节点词的典型搭配词,并对其搭配词进行分类,以归纳以上三个节点词的异同之处。

BNC语料库结果显示,start一词的有效索引行为2,081行,begin一词的有效索引行为1,601行。LCMC语料库结果显示,开始一词的有效索引行为53行。由此可见,三个节点词的搭配词分类情况存在差异(见图2)。

图2:BNC语料库和CLEC语料库中start,begin和开始搭配词分类情况

根据以上数据可以得出:start搭配词分类范围最广,与时间类搭配词搭配使用最频繁。start与动作类搭配词搭配的使用情况明显多于状态类搭配词的使用,与评价类、工具类和事件类搭配词搭配的使用情况也比较多。begin一词与时间类搭配词搭配使用最频繁,与状态类搭配词搭配的使用情况明显多于动作类搭配词的使用,使用情况恰好与start相反。begin与心理搭配词搭配使用的情况也较多,但与评价类、事件类搭配词搭配使用的情况较少。值得注意的是,没有出现与工具类、价格类搭配词搭配。“开始”一词搭配词分类范围偏少,主要与状态类搭配词搭配使用,其次为时间类、评价类、动作类。

结语

本文的研究遵循“从语料库到认知”的原则,分别对start,begin和开始三个节点词进行了语料分析,具体包括如下三个方面:其一,通过观察start,begin和开始三个节点词在语料库的不同语域中的分布频率,揭示出三个节点词的语体特征;其二,通过对节点词的语义韵分析,厘清了同义词依据搭配语境所显示的不同的词语态度标示功能;其三,通过对节点词的典型搭配词进行归类,归纳出节点词搭配词的分类特点。研究结果发现:(1)start,begin两个节点词呈现出不同的语体倾向,start一词偏非正式化、口语语体,begin一词偏正式化,而汉语对应词开始没有呈现出显著的语体倾向。(2)start,begin和开始这三个节点词语义韵特征不明显,整体呈现出中性语义韵的特点。(3)start,begin和开始这三个节点词在搭配习惯上存在差异。start节点词的搭配词分类范围最广,常搭配时间类搭配词,而begin和开始更多的是与状态类搭配词搭配。以上研究方法对传统的同义词辨析方法起到了有效的补充作用,能够解决在理解和运用过程中产生的部分困惑,对语言学习者在英语同义词差异辨析方面起到了一定的指导作用。

猜你喜欢
语域语体语料库
《语料库翻译文体学》评介
基于语料库的近义词辨析
语言表达与语体选择
语体语法:从“在”字句的语体特征说开去
基于JAVAEE的维吾尔中介语语料库开发与实现
语体转化的量度与语体规范
语篇元功能的语料库支撑范式介入
汉代语体思想浅谈
浅析语域的特性及教学模式探讨
语域语块与外贸英语教学