霍忠振
(四川外国语大学 研究生院,重庆 400031)
汉英词典中“承诺”的词类标注问题
——基于双层词类范畴化理论的研究
霍忠振
(四川外国语大学 研究生院,重庆 400031)
目前,各汉英词典和语文词典对“承诺”一词的词类标注存在分歧。文章基于王仁强提出的双层词类范畴化理论模型,通过对语料库的使用模式的调查,对该词重新进行词类标注,发现该词属于动名兼类词。通过探讨“承诺”一词的词类归属,以期对汉英词典的编纂提供合理的建议。
词类标注;兼类词;双层词类范畴化理论模型;使用频率;规约化
汉语词类在语言学界一直被认为是一个老大难问题[1](P34),而词类标注在汉语/汉外词典编纂中是一件牵一发而动全身的大事[2](P20)。在词类标注研究中,兼类现象也被称作语法多功能现象,指的是“一个多义的概括词在社群语言系统层面词库中兼属两个或两个以上词类范畴”[3](P98),在词典当中具体表现为兼类词。王仁强指出,在词类标注的众多研究当中,由于不少都恪守着“词义不变,词类不变”的原则和“兼类尽可能少”的原则,因此,基本上不认可动词和形容词名物化后的自指义项[4](P100)。但是,要判断一个个体词项是不是兼类词,并且是否应该作为兼类词收录进词典,我们应当进行基于语料库的使用模式调查。故本项研究采取基于普通语料库的语言研究方法,具体考察了国家语委现代汉语语料库(以下简称为国家语委现汉语料库)和北京大学中国语言学研究中心的古代汉语语料库(以下简称为北大古代汉语语料库)以及北京大学中国语言学研究中心的现代汉语语料库(以下简称为北大现汉语料库)。
笔者在查阅《现代汉语规范词典》和《现代汉语词典》等汉语词典以及包括《外研社·柯林斯英汉汉英词典》和《新世纪汉英大词典》(2003)在内的汉英词典之后,发现各词典对“承诺”一词的词类标注存在分歧。
以《现代汉语词典》(第6版、第7版)和《新世纪汉英大词典》(第1版、第2版)为首的字典将“承诺”一词标注为动词词类;而以《现代汉语规范词典》(第2版、第3版)和《外研社·柯林斯英汉汉英词典》为首的词典将其标注为动名兼类词。
表1 三部汉语词典中“承诺”的词类标注情况
表2 五部汉英词典中“承诺”的词类标注情况
由于词典之间对于“承诺”一词的词类标注有分歧,笔者有以下疑问:
一是在古代汉语中,是否有“承诺”一词;如果有,它的词类归属有无争议。
二是在现代汉语中,“承诺”一词的词类标注的共识是属于动词词类,分歧在于该词属于单类词还是兼类词。其动词名物化后的自指义项是否已经规约化,从而可以收录进词典;在基于语料库使用模式调查后,我们能否解决这个分歧。
(一)在北大古代汉语语料库中的表现
经过检索北大古代汉语语料库(该语料库的规模为字符数201668719),得到共计51条索引数。在全部的51条索引中,得到的有效索引数共计41条(索引有效率约为80%),经过手动标注,全部为动词用法,故可以得出结论,古代汉语当中“承诺”一词是动词,无兼类现象。
表3 “承诺”一词在北大古代汉语语料库中的词类分布
动词名词总计频数41041频率100%0%100%
(二)在国家语委现汉语料库中的表现
为了调查“承诺”一词在现代汉语中的使用情况,笔者检索了国家语委现汉语料库。国家语委现汉语料库作为一个大规模的平衡语料库,其特点是语料的选材类别较广泛,时间跨度较大,在线提供的检索语料经过分词和词类标注。语料库总汉字词语个数为151300(含汉字的词语个数,不含外文词、标点、数字串等),语料库字符数为19455328个(含汉字、字母、数字、标点等)。
经检索,得到总共14条索引数。由于其中一条有2个个体词例,因此,总计共15个个体词例。由于国家语委语料库本身有对词类进行标注,根据其标注情况显示:15个个体词例当中只有3个是动词用法,其余12个个体词例都是是名词用法。
表4国家语委现代汉语语料库的词类分布
动词名词总计频数31215频率20%80%100%
经过分析,笔者发现国家语委现汉语料库的词类标注情况存在些许错误,于是根据每个个体词例的表述功能对检索结果进行手动标注。郭锐指出,“词类的本质是表述功能”[5]。 命题言语行为功能相当于词语的语法意义,指词语表达语义的模式,包含“指称、陈述、修饰和辅助”等四种基本类型。结果发现:该语料库的词类标注的错误率高达6/15,即40%。经过分析,发现在15个个体词例当中,8个是名词用法,7个是动词用法。即名词的个例频率占53.33%。名词的个例频率超过动词的个例频率。
表5对“承诺”一词手动标注后的结果
动词名词总计频数7815频率46.67%53.33%100%
手动标注前后的数据比较如下:
表6国家语委现代汉语语料库标注结果和手动标注结果对比
动词名词总计语料库标注频数31215频率20%80%100%手动标注频数7815频率46.67%53.33%100%
由国家语委语料库的检索数据可知,“承诺”一词在言语层面句法中充当的是命题言语行为中的指称和陈述作用。
(三)在北大现汉语料库中的表现
由于国家语委现汉语料库中检索到的索引数较少,笔者继续考察了 “承诺”一词在北大现汉语料库(该语料库规模为:字符数581794456)中的表现。经检索,共得到17461条索引结果。经过随机选取1000条索引结果,进行索引结果的有效性分析,发现存在索引结果出现重复的情况。在重复的索引结果中,笔者剔除重复的索引结果,每样只保留一条作为有效数据,共计36条是重复无效的。剩下的索引结果当中,部分“承诺”只做构词的语素,如“承诺费”“承诺人”等,共计124条,这类构词语素不考虑其词类归属,划为无效索引。剩下独立成词的有效索引共计840条。抽取样本的有效性如下表所示:
表7 “承诺”一词在抽取样本中的有效性分析
语素独立成词重复索引结果总计频数124840361000
笔者根据个体词例在语料库中充当的表述功能进行手动词类标注,得到的结果是:在840个个体词例当中,有364个是动词用法,其余的476个是名词用法。结果如下表所示:
表8 “承诺”一词在抽取的北大现汉语料库样本中词类分布情况
动词名词总计频数364476840频率43.33%56.67%100%
鉴于“概括词的兼类现象与使用频率(包括个例频率和类型频率)密切相关”[3](P89),我们还需对其做类型频率分析。由于动词用法是“承诺”一词的固有用法,我们要分析的是名词用法是否归约化,所以我们仅对上面的467条含有“承诺”一词名词用法的索引进行类型频率分析。经过分析发现,“承诺”一次的名物化自指义项具有很高的类型频率。得到的结果如下所示:
表9 “承诺”一词在抽样样本中的类型频数
句法功能结构频数主语/宾语名+(助词“的”)+~61形+~111代+~52名+连+~/~+连+名17量+~26~92宾语介+~9定语~+助词“的”+名7其他101共计476
由于“承诺”一词前面可以加上承诺的内容,如“认真履行‘把消费者购物的风险降至为零’的承诺”构式较为复杂,很难归到“其他”之前的类别。因此,此类皆归入“类型频数句法功能结构频数”的“其他”一项中。
在判断概括词的词类归属时,应当注意区分词类范畴化的两个层面,即言语层面句法中的词类范畴化和社群语言层面词库中的词类范畴化。王仁强和陈和敏基于复杂适应系统语言观以及跨语言的词类本质观,根据词在两个层面——言语层面句法中和社群语言系统词库中的两种存在状态,提出:“词类的范畴化也在词的两个层面发生,即个体词例的词类范畴化和概括词的词类范畴化。”[6]前者体现为说话者对命题言语行为功能的表达过程;后者体现为“一个语言社群集体的自组织过程,其核心是规约化/相变”。概括词的词类归属不是一成不变的,在言语层面句法中个体词例的不断使用会影响概括词的词类归属。
从北大古代汉语语料库的数据中,我们可以看出,“承诺”一词在古代汉语中只有动词用法,它的词类归属属于单类。随着时间的推移,在言语层面开始出现了名词化的用法。在调查国家语委现代语料库和北大现汉语料库,发现“承诺”一词的名词用法占有超高的个例频率,分别占53.33%和56.67%,甚至超过动词用法的个例频率。鉴于“个例频率促成个体词例的规约化,类型频率则促成更抽象图式的规约化”[7](P188),而“类型频率与语言结构的能产性密切相关”[8],“承诺”的名词用法具有很高的个例频率和类型频率,因而具有很高的归约化程度,因此,概括词“承诺”在大中型语文词典和汉英词典中应该标注成动名兼类词。
语文词典对《现代汉语词典》的修补如下:
【疑惑】❶(动)对某项事务答应照办:慨然~。❷(名)对办某事做出的应允:遵守~。
汉英词典对《新世纪汉英大词典》的修补如下:
【疑惑】chéngnuò❶(动)promise to undertake; undertake/ agree to do sth; commit oneself to sth/ doing sth: ~偿债 undertake/ promise to pay one’s debts ❷(名)promise; commitment: 履行~ act up to/carry out/fulfil/perform one’s promise; carry out one’s commitment.
本文基于双层词类范畴化理论模型,通过对语料库的使用模式的调查,对“承诺”一词重新进行词类标注,发现该词属于动名兼类词。在判断概括词的词类归属时,应当注意区分词类范畴化的两个层面,即言语层面句法中的词类范畴化和社群语言层面词库中的词类范畴化。“承诺”一词在言语层面句法中充当的命题言语行为功能中的陈述和指称功能,由于该词的名物化自指义项具有很高的个例频率和类型频率,即使用频率,证明该词的名物化用法具有高度的归约化程度,所以其名物化用法应当收录进词典。在社群语言词库中,“承诺”一词是动名兼类词。另外,通过数据分析发现:国家语委现汉语料库的词类标注的准确性上目前仍存在一些问题。在使用该数据库的时候,应该再进行手动重新标注。最后,词典的词类标注应当基于对语料库的使用模式,系统而全面地调查,以语言事实为依据,摆脱“简略原则”的束缚。
[1]陆俭明. 现代汉语语法研究教程:第4版[M].北京:北京大学出版社, 2013.
[2]王仁强.汉意双语学习词典词类标注研究——以《汉意—意汉双解词典》(2012)为例[J]. 外国语文研究,2015(2).
[3]王仁强,黄昌宁. 从双层词类范畴化理论看现代汉语自指词项的兼类问题[J].外国语文,2017(1).
[4]王仁强.语法隐喻与汉语词典自指义项的设立——一项基于语料库的研究[J].外国语文,2009(1).
[5]郭锐.现代汉语词类研究[M].北京:商务印书馆, 2002.
[6]王仁强,陈和敏.基于语料库的动词与构式关系研究——以sneeze及物动词用法的规约化为例[J].外语教学与研究,2014(1).
[7]Evans V, Green M. Cognitive Linguistics: An Introduction [M].Edinburgh: Edinburgh University Press, 2006.
[8]Bybee, J. language, Usage, and Cognition [M].Cambridge: CUP, 2010.
[责任编辑薄刚]
TheProblemandStrategyofWordClassLabelingof“承诺”——A corpus-based survey based on two-level word class categorization theory
HUO Zhong-zhen
(Graduate School of Sichuan International Studies University, Chongqing 400031,China)
The word class membership of “承诺” among all kinds of dictionaries is divergent. This paper, based on Two-level Word Class Categorization Theory first proposed by Prof. Wang in 2014, seeks the word class membership of “承诺” by conducting a usage survey in corpora, and finds that the word “承诺” should be verb-noun heterosemous. By conducting this survey, this paper aims to provide inspiration for word class labeling in Chinese-foreign dictionaries.
word class labeling;heterosemy;Two-level Word Class Categorization Theory;frequency of use;conventionalization
2017-04-13
霍忠振,四川外国语大学研究生院硕士研究生,研究方向:词典学、语料库语言学、类型学。
H314;H136
A
2095-0292(2017)03-0088-04