汉英学习型词典中动词“提升”的类联接信息表征研究

2020-03-23 06:09曾利陈丛梅
辞书研究 2020年2期
关键词:表征语料库提升

曾利 陈丛梅

摘 要 类联接是语法层面的组合关系,是二语词汇学习的一项重要内容,文章以“提升”为例,尝试构建汉英学习型词典中动词词目的类联接信息表征方式。首先,采用中介语对比分析法,得出汉语学习者“提升”一词的类联接习得现状;其次,考察三部汉英学习型词典和三部英汉双解学习型词典的类联接现有处理方式;最后,借鉴英汉双解学习型词典类联接信息表征方式,尝试采用“类联接+真实例证”的方式,构建动词义项“提升”的微观结构,希望为汉英学习型词典的编纂提供一些启示。

关键词 类联接 《汉英学习型词典》 语料库 “提升” 表征

一、 引言

类联接(colligation)最早诞生于伦敦语言学派对于“意义的情境化”研究(庞双子2014),这一术语首先由Simon(1953)提出,后经Firth等语言学家发展并逐渐为学界所关注。Firth(1957)认为,语法关系涉及一些抽象的语法形式,如在句子“I watched him”中,类联接涉及人称代词,即第一人称主格单数形式I、第三人称宾格单数形式him和及物动词watch的过去时态-ed等语法关系,它们或隐含或直接呈现该肯定句中的语法类别和语法范畴之间的内在联系,这些联系即为类联接。Mitchell(1975)认为,词语搭配不仅要考察词项间的共现,还应考察词项间相互结合的语法结构或框架。类联接是关于词语组合类别的抽象表述,搭配则是类联接在词语层面的具体实现,所以由具体的词语搭配可以提炼出语法层面的类联接形式,如“读书”“看报”等这类动宾搭配可以抽象出共同的类联接形式: 动词+名词的搭配组合。

類联接描述词汇在语法层面的组合关系,在词汇教学中加入类联接信息可有效帮助学习者提高语言产出能力。此外,类联接信息也是学习型词典设计特征中的必要信息类型之一。(赵连振2017)现有许多英语学习型词典或英汉双解学习型词典都在微观结构中直接表征了词目的类联接信息,而汉英学习型词典还鲜有表征汉语词汇类联接形式的编纂先例。汉英学习型词典作为汉语学习者的重要工具书,也有必要表征汉语词汇的类联接信息。另一方面,与英语语言相较而言,汉语语言是一种动词性语言(刘丹青2014),汉语动词优势明显,使用比例较高。因此,本文基于语料库,以汉语动词“提升”(《汉语水平词汇与汉字等级大纲》丁级词)为研究对象,通过考察汉语学习者“提升”一词的类联接习得现状和现有汉英学习型词典中该动词词目的描写情况,借鉴目前英汉双解学习型词典的类联接信息处理方式,探索汉英学习型词典中该词目的类联接信息表征方式。

二、 基于语料库对动词“提升”的类联接习得现状分析

汉英学习型词典的编纂目的是满足母语为英语或其他语言的词典用户的语言编码需求,需以学习者的水平和特点为导向。本文以汉语本族语者的类联接特点作为参照,分析汉语学习者与汉语本族语者使用“提升”时的类联接形式差异,揭示汉语学习者“提升”一词的类联接习得情况。

(一) 研究问题

本研究采用中介语对比分析法(Contrastive Interlanguage Analysis),将北京语言大学创建的“HSK动态作文语料库”(以下简称“HSK语料库”)作为研究语料库,以“国家语委现代汉语语料库”(以下简称“语委语料库”)作为参照语料库,对汉语学习者和汉语本族语者使用“提升”一词的类联接形式进行考察,主要回答以下问题:

1. 汉语学习者使用“提升”一词的类联接特征是什么?

2. 汉语本族语者使用“提升”一词的类联接特征是什么?

3. 汉语学习者和汉语本族语者在“提升”一词的类联接形式使用上有何差异?

(二) 研究工具与方法

本研究使用的语料库为HSK语料库,是母语非汉语者参加高等汉语水平考试(HSK高等)作文考试答卷语料库,收集了外国考生的作文答卷11569篇,共计424万字;参照语料库为语委语料库,作为一个大规模的平衡语料库,其语料选材类别广泛,时间跨度大(1919—2000年),共计约2000万字。本研究采用HSK语料库提供的在线分词和词性标注功能进行生语料的分词和词性标注。

研究所采用的语料库分析软件是日本早稻田大学Laurence Anthony教授开发的AntConc3.5.8。另外,还使用了Chi-square Calculator(梁茂成,李文中,许家金2010)来计算汉语学习者和汉语本族语者在“提升”一词类联接形式上的差异是否显著,具体值为: 卡方值(χ2,自由度为1)如果大于临界值3.83、6.64和10.83,则表明该值在显著性水平0.05,0.01和0.001的情况下具有统计学意义。显著性有以下三种判定标准:

1. 当0.01≤p≤0.05, χ2>3.83时,便认为差异是显著的(用*表示)。

2. 当0.001≤p≤0.01, χ2>6.64时,便认为差异是很显著的(用**表示)。

3. 当p≤0.001, χ2>10.83时,便认为差异是相当显著的(用***表示)。

具体研究步骤如下:

1. 从HSK语料库和语委语料库检索并导出“提升”一词的相关语料。

2. 通过人工分析,将HSK语料库和语委语料库中“提升”名词义项的索引行进行剔除。

3. 用Excel工作表进行语料整理,对于HSK语料中的熟语料,删除其标注,使其还原为生语料。

4. 使用HSK语料库提供的在线分词和词性标注功能对生语料进行分词和词性标注,然后逐个检查处理好的语料,按照《现代汉语词典》第7版中的相关词汇信息对部分分词或词性标注错误的词汇或句子进行人工校对。

5. 将处理好的语料分别按HSK语料库和语委语料库存成两个文本文件,分别导入语料库分析软件AntConc3.5.8。

6. 先利用AntConc3.5.8的词丛(Clusters)功能检索出“提升”周围的词丛列表,然后在Excel工作表里统计两个语料库中每类类联接形式的数据,再用Chi-square Calculator计算差异值。

7. 利用AntConc3.5.8的搭配(Collocates)功能分别检索两个文件中“提升”的左右搭配词并进行记录。

(三) 研究结果与讨论

以“提升”为节点词,从HSK语料库和语委语料库中检索得出:“提升”在HSK语料库和语委语料库的出现频次分别为59次和71次,剔除“提升”名词义项的索引行,整理出动词“提升”在HSK语料库和语委语料库的使用频数分别为46次和52次。借助AntConc3.5.8和Excel工作表进行检索和归纳分析,得出动词“提升”在两个语料库中的类联接形式(见表1)。

说明:

1. V=“提升”;v=动词;n=名词或名词词组;q=数量短语;c=连词;adv=副词;pron=代词;prep=介词。

2. 其他形式1(在语委语料库中未出现): “v+n+V”(频数=2,百分比=4%)、“V+adv”(频数=1,百分比=2%)、“v+V”(频数=1,百分比=2%),因频数太少不统计差异。

3. 其他形式2(在HSK语料库中未出现): “V+pron+为+n”(频数=3,百分比=6%),“V+v+n”(频数=1,百分比=2%),“V+pron”(频数=1,百分比=2%),“prep+n+V”(频数=1,百分比=2%),“V+c+n”(频数=1,百分比=2%),“adv+V+v”(频数=1,百分比=2%),因频数太少不统计差异。

经分析发现,在HSK语料库中,“提升”有八类类联接形式: “V+n、adv+V、V+为+n、V+q、V+到+n、v+n+V、V+adv、v+V”,总体而言,汉语学习者更倾向使用“V+n”(59%)[如例(1) ],偶尔使用“adv+V”(15%)[如例(2)]和“V+为+n”(9%)[如例(3)],很少使用“V+q”(4%)、“V+到+n”(4%)、“v+n+V”(4%)、“V+adv”(2%)和“v+V”(2%)。

V+ n:

(1) 现在我又修读有关设计的一些课程,希望借此提升我的设计水平。

adv+ V:

(2) 烟的价格年年提升,可仍吸引了无数人浪费钱去买它。

V+为+ n:

(3) 我在推销方面有过不错的成绩,曾被提升为推销小组组长。

在语委语料库中,“提升”出现了11类类联接形式: “V+为+n、V+到+n、V+n、V+q、V+pron+为+n、adv+V、V+v+n、V+pron、prep+n+V、V+c+n、adv+V+v”,其中,汉语本族语者通常使用V+为+n(37%)[如例(4)],偶尔使用“V+到+n”(19%)[如例(5)]和“V+n”(15%)[如例(6)],较少使用“V+q”(8%)、“V+pron+为+n”(6%)、“adv+V”(6%)、“V+v+n”(2%)、“V+pron”(2%)、“prep+n+V”(2%)、“V+c+n”(2%)和“adv+V+v”(2%)。因类联接形式“V+为+n”(37%)、“V+到+n”(19%)和“V+n”(15%)使用频率较高,故将它们判定为主要类联接形式。

V+为+ n:

(4) 由于他能正确地执行党的政策,很快地由连长提升为营长。

V+到+n :

(5) 在现代人的感性活动的基础上,创造了高度先进的科学技术,使人能思考地球以外的生存价值,把人的生命意义提升到从未有过的高度。

V+n:

(6) 电动机提升物体的功率。

对比两个语料库中“提升”的类联接形式可知,汉语学习者使用了三类在汉语本族语语料库中未出现的类联接形式,即: “v+n+V、v+V、V+adv”,汉语本族语者也使用了六类汉语学习者未使用的类联接形式,即: “V+pron+为+n、V+v+n、V+pron、prep+n+V、V+c+n、adv+V+v”,以上几类类联接形式频数较少,差异不显著。但是汉语学习者和汉语本族语者在类联接形式“V+n”(χ2=19.9423,p=0.000)上存在相当显著的差异,在“V+为+n”(χ2=10.5348,p =0.001)上存在很显著的差异,在“V+到+n”(χ2=5.0314,p =0.025)上存在显著差异,以上差异主要表现在: 相较于汉语本族语者而言,汉语学习者较多使用“V+n”形式,较少使用“V+为+n”和“V+到+n”形式。

综上可知,在使用“提升”一词的类联接形式上,汉语学习者与汉语本族语者相比仍具有明显偏差,汉语学习者并未完全掌握“提升”的类联接形式。汉语学习者与汉语本族语者在“提升”一词的类联接形式上存在的差异说明: 汉语学习者的类联接信息还未达到一语状态,词汇语义和句法信息并未完全整合。那么,作为汉语学习者必备工具书之一的汉英学习型词典是否为学习者提供了充足的类联接信息?学习者所表现的不足是否是因为词典类联接输入不足造成的?为此笔者需要进一步考察现有汉英学习型词典的类联接表征现状,探索汉语学习者类联接使用形式差异的原因。

三、 现有汉英学习型词典对“提升”一词的类联接信息处理

汉英学习型词典要满足语言学习者的语言编码需求,类联接作为一项重要的句型编码信息,可有效幫助语言学习者产出正确地道的搭配或句子,因此学习型词典不应忽视类联接信息。为此笔者对现有三部汉英学习型词典中“提升”一词的类联接信息显性或隐性表征情况进行考察。这些词典如下: 《汉英双解词典》(以下简称《汉英双解》)、《ABC汉英大词典》(以下简称《ABC汉英》)、《汉英双语学习词典》(以下简称《汉英双语》),“提升”在三部汉英学习型词典中的表征情况如表2所示。

考察发现,在“提升”的表征上,三部词典都区分了两个义项,并且都标注了“提升”的动词词性,其中《ABC汉英》词性分类更加细化,其标注“提升”为R.V.(Resultative Verb,结果补语词,即注重动作的结果和目的,而非动作本身)。从类联接信息表征来看,三部词典都未显性表征词目的类联接信息,但词典中的具体例证是类联接信息在具体语境中的实现形式,成熟的使用者可以由具体例证归纳出抽象的类联接形式。《汉英双解》中“提升”有两个义项,词典仅为义项一“提高(职位、等级等)”配例,该例证包含词汇搭配“提升为教授”,如果将其抽象至语法层面,便可得到类联接形式“V+为+n”;《汉英双语》为“提升”的两个义项都提供了例证。义项一“提高(职级等)”的具体例证搭配“提升到军官”可以提炼出类联接形式“V+到+n”,义项二“借助卷扬机等机械向高处运送”的具体例证搭配“提升到楼顶”同样可以提炼出类联接“V+到+n”。由此可见,《汉英双解》和《汉英双语》实则是隐性表征了词目的类联接形式,其类联接信息间接隐藏于例证的词语搭配中,可从具体的词语搭配中抽象得出。然而,根据上文的语料库检索结果,汉语本族语者使用的三类主要类联接形式为“V+为+n、V+到+n、V+n”,而《汉英双解》和《汉英双语》例证中的词语搭配单一,并未体现出汉语本族语中所有主要的类联接形式。

综上,三部汉英学习型词典都未直接表征词目的类联接形式,《汉英双解》和《汉英双语》的类联接信息间接体现于例证的词语搭配中,这种例证方式提供了具体的词汇语境,虽有利于学习者习得特定的词汇搭配,却因其表现不明显,难以有效帮助语言学习者习得词汇的语法搭配,提高外语产出能力。目前主流的英语学习型词典都倾向于将类联接凸显出来,以引起读者注意,并受到许多词典用户的欢迎,因此,笔者接下来将以“提升”的英语对等词之一——promote为例,考察三部英汉双解学习型词典中动词类联接信息的处理方式。

四、 现有英汉双解学习型词典对promote一词的类联接信息处理

Quirk(1990;转引自陆谷孙,王馥芳2011)认为相对于英语单语词典,英语学习型词典的一个区别性特征是其特别重视提供语词语法信息,英汉双解学习型词典以英语学习型词典为蓝本,再现了其中的语法信息。因此,对英汉双解学习型词典的考察有利于汉英学习型词典的编纂。笔者将对现有三部英汉双解学习型词典的类联接信息处理方式进行考察,这些词典如下: 《牛津高阶英汉双解词典》第8版(以下简称《牛津双解》)、《朗文当代高级英语辞典 英英、英汉双解》新版(以下简称《朗文双解》)和《柯林斯高阶英汉双解学习词典》(以下简称《柯林斯双解》)。三部英汉双解学习型词典中“promote”的微观结构如表3所示(省略词条中的注音信息和词汇屈折变化信息等)。

考察发现,以上三部英汉双解学习型词典都为词条promote标注了相应词性和类联接信息,但所提供的类联接信息内容和编排形式并不完全相同。其中,《牛津双解》为词目的每个义项都提供了相应的类联接信息,在其后还配有相应例证;在编排形式上,《牛津双解》将类联接形式置于释义后或嵌入释义中作为释义的一部分,并以黑体字突出。《朗文双解》只为“promote”的第二个义项和第六个义项提供了类联接信息,也配有相应例证;在编排形式上,《朗文双解》也是将类联接置于释义后或嵌入释义中。《柯林斯双解》的词条解释采用嵌套定义法,将合乎语法规范的完整语句用作词条释义,词典用户可通过释义了解词目的典型搭配信息。此外,在三部词典中,《柯林斯双解》为promote和其派生词promotion提供了丰富的类联接信息;在编排形式上,《柯林斯双解》的一个重要特色体现在词条右侧的边栏,类联接信息和其他语法信息单独置于右侧边栏里,左边则是相应的义项和例句,这种文本编排形式更易引起词典用户的注意。

综上,就类联接表征内容上来看,三部词典都在不同程度上提供了类联接信息。《牛津双解》和《柯林斯双解》为每一义项都提供了类联接信息,《朗文双解》只为部分义项提供了类联接信息,且三部词典都体现出了“类联接信息+例证”的处理方式,这一点也印证了其他研究者的发现: 当今英语学习者词典动词词条的结构形式已经完全一致,即“释义+句型代码+例证”(鲍志坤2013),这说明类联接信息已成为英语学习型词典中的一项重要信息。

五、 基于语料库的汉英学习型词典“提升”一词的类联接表征方式

类联接体现词类与词类间的横组合关系,而词类反映词语搭配纵向的类属关系,是具体词项在纵聚合关系上的产物。因此,在词典文本中,既要表征类联接信息,也要在一定程度上体现词类中的具体词项,而对本族语语料库的检索分析可帮助总结本族语中的典型类联接信息和具体词项。作者尝试在词典文本中以语法代码组合形式呈现典型类联接形式,以语料库中常用搭配行为作为类联接辅助信息,以语料库中真实句子作为相应例证,以动词“提升”为例,构建“类联接+真实例证”的类联接信息表征方式。(本文主要研究“提升”的类联接信息在汉英学习型词典中的表征方式,不涉及汉英学习型词典中的译义问题,以下译文均为参考。)

由于类联接是某一词义倾向于形成的语法搭配,因此多义词的不同义项就会有不同的类联接形式,也会有不同的具体搭配词。结合现有汉英学习型词典“提升”的表征情况,按语料库中“提升”的搭配行为,我们将“提升”的语义分为三类: 1. 表示提高(职位、等级等);2. 表示用卷扬机或其他工具等向高处运送(矿物、材料等);3. 表示将抽象事物提至更高的水平、状态等。这三类义项的划分与其所结伴的名词语义密切相关,因此这三类义项可简称为职级类、具体事物类、抽象事物類。经对语委语料库数据的整理分析,动词“提升”在汉语本族语中的具体类联接形式和搭配行为见表4,以下出现的类联接形式、搭配词和例证均来自语委语料库。

结合以上归纳出的类联接信息表征内容,笔者拟借鉴《柯林斯双解》的类联接信息编排方法,在词条右边位置设立边栏,并将类联接信息及词性信息置于其中,左边的释义和例句与右边的类联接信息对应。具体编纂范例如表5所示:

以上编纂范例尝试在汉英学习型词典中表征“提升”的主要类联接形式,并结合汉语本族语语料库的真实例句,构建“类联接+真实例证”的类联接信息表征方式。这种表征方式既呈现了语法范畴上的抽象关系,又提供了具体词汇搭配,可帮助汉语学习者习得地道的汉语语法知识和词汇搭配。此外,在词典表征类联接信息的同时,需在词典前页材料中说明相应的语法代码信息,以帮助用户理解词典内容,且语法代码应做到易于理解和记忆。

六、 结语

语料库语言学的研究方法能帮助词典编纂者掌握词语在不同句法位置上的出现频率、与不同词语之间的搭配情况。(刘慧2013)本文基于语料库,以汉语动词“提升”为例,尝试在汉英学习型词典中表征其主要类联接形式。首先采用中介语对比分析法,发现汉语学习者并未完全掌握“提升”的类联接形式;然后考察了现有汉英学习型词典中类联接信息的表征方式,得出三部学习词典都未直接表征词目的类联接形式,《汉英双解》和《汉英双语》的类联接信息间接体现于例证的词语搭配中;接下来考察总结了现有英汉双解学习型词典的类联接信息表征方式;最后尝试在动词“提升”的微观结构中按义项构建“类联接+真实例证”的类联接信息表征方式。本文认为,新一代的学习词典不仅应提供传统的音、形、义等基本词汇信息,还应表征有利于辅助学习者语言编码活动的类联接信息。本研究虽以汉英学习型词典为研究文本,但不可否认的是,汉英学习型词典中的词条表征还涉及语言转换问题,本文暂未涉及此方面。因此,如何在汉英词典的译语中再现汉语的类联接语境值得进一步研究。

附 注

[1]两个语料库中有两类类联接形式: “提升+为+n”和“提升+到+n”,对于这两类结构中的“为”和“到”的词性,学界尚未形成统一的定论,由于该类结构的特殊性,本文将其列为两类单独的类联接形式。

参考文献

1. 鲍志坤. 英语学习者词典中动词的句法信息描述. 外语研究,2013(6): 56-62.

2. 德范克(John De Francis)主编. ABC汉英大词典. 上海: 汉语大词典出版社,2003.

3. 国家汉语水平考试委员会办公室考试中心. 汉语水平词汇与汉字等级大纲. 北京: 经济科学出版社,2001.

4. 霍恩比. 牛津高阶英汉双解词典(第8版). 北京: 商务印书馆,2014.

5. 靳光瑾,肖航,富丽,等. 现代汉语语料库建设及深加工. 语言文字应用,2005(2): 111-120.

6. 梁茂成,李文中,许家金. 语料库应用教程. 北京: 外语教学与研究出版社,2010.

7. 刘丹青.著名中年语言学家自选集·刘丹青卷. 上海: 上海教育出版社,2014: 275.

8. 刘慧. 利用语义韵研究改进对外汉语学习词典释义及用例——以“可想而知”为例. 辞书研究,2013(6): 27-33.

9. 陆谷孙,王馥芳. 大型双语词典之编纂特性研究——以《英汉大词典》编纂为例. 上海: 上海译文出版社,2011: 5.

10. 庞双子. 类联接概念的演变及其与语料库语言学研究范式的内在联系. 外语电化教学,2014(2): 11-16.

11. 钱王驷,姚乃强主编. 汉英双语学习词典. 北京: 外文出版社,2007.

12. 王还主编. 汉英双解词典. 北京: 北京语言文化大学出版社,1997.

13. 肖航. 现代汉语通用平衡语料库建设和应用. 华文世界,2010(106).

14. 肖航. 语料库词义标注研究. 昆明: 云南教育出版社,2016.

15. 英国培生教育出版有限公司编. 朗文当代高级英语辞典 英英、英汉双解(新版). 北京: 外语教学与研究出版社,2005.

16. 英国柯林斯公司编. 柯林斯高阶英汉双解词典. 北京: 商务印书馆,2008.

17. 张宝林. “HSK动态作文语料库”简介. 国际汉语教育,2003(4): 37-38.

18. 赵连振. 英语学习词典中词目类联接编码信息探讨——以名词条目为例. 西南交通大学学报,2017,18(3): 47-53.

19. 中国社会科学院语言研究所词典编辑室编. 现代汉语词典(第7版). 北京: 商务印书馆,2016.

20. Firth J R. Modes of Meaning.∥Firth J R. Papers in Linguistics, 1934-1951. London: Oxford University Press, 1957.

21. Mitchell T F.Principles of Firthian Linguistics. London: Longman, 1975.

22. Simon H F. Two Substantival Complexes in Standard Chinese. Bulletin of the School of Oriental and African Studies, 1953,15(2): 327-355.

(西南科技大學外国语学院 绵阳 621010)

(责任编辑 刘 博)

猜你喜欢
表征语料库提升
《语料库翻译文体学》评介
“定篇”及其课堂教学有效性表征
单亲家庭儿童自卑心理的表征及形成原因分析
提升小学语文课堂效率的策略与方法
提升小学生语文综合素养的有效策略
如何提升公民生态意识
后进生转化和提升的实践与思考
铁锰双组分氧化物催化剂低温催化还原性能表征研究
两例铜基配合物的合成、表征及电化学性能研究
基于JAVAEE的维吾尔中介语语料库开发与实现