宫 妮
(四川外国语大学 研究生院,重庆 400031)
汉英词典中“贪污”的词类标注问题与对策
——基于双层词类范畴化理论的研究
宫 妮
(四川外国语大学 研究生院,重庆 400031)
准确的词类判断对汉英词典编纂具有重要意义,直接影响其编纂质量。基于对10余部大中型汉英词典的调查,发现“贪污”一词在词类判断、译义和配例等方面存在诸多矛盾与困惑。本文在双层词类范畴化理论的指导下,基于语料库使用模式调查,研究“贪污”一词在现代汉语社群语言层面词库(即语文词典)中的词类归属,并针对该词的词类标注问题提出对策。
汉英词典;“贪污”;词类标注;双层词类范畴化理论;语料库
国际上汉语热的持续升温对汉英词典的编纂质量提出了更高的要求。准确的汉语词类识别是汉英词典准确译义的前提。但是,词类研究一直是汉语语法研究的一大难题。[1]342014年,在德国语言学会第36届年会上,词类等语言范畴的研究被誉为语言学中的“上帝粒子”研究。而汉英等汉外词典的词类标注也一直是双语词典编纂的难题。[2]汉英词典的词类标注涉及汉、英两种语言,关系到词类判断、译义和配例等具体问题,因此在汉英词典编纂中是牵一发而动全身的大事。
近几年,汉语/汉英词典词类标注的研究已经取得一定进展,但是现有词典对词语的词类标注仍然存在不同程度的问题。鉴于此,本文在双层词类范畴化理论的指导下,基于语料库使用模式调查,研究使用频率较高的双字词“贪污”(《现代汉语常用词表》中的序频为5673)的词类标注,以期有助于解决汉英词典的词类标注问题,进一步提高汉英词典的编纂质量。
鉴于言语层面句法中词类的本质是指称、陈述、修饰等命题言语行为构式功能[3],基于复杂适应系统语言观和语料库方法,王仁强[4-6]针对汉语、英语等分析语提出了“双层词类范畴化模型”。该理论认为: 分析语的词类范畴化发生在两个层面,即言语层面句法中和社群语言层面词库中的词类范畴化。前者的词类范畴化是说话者的命题言语行为(包括指称、陈述、修饰等)的表达过程;后者的词类范畴化体现为一个语言社群集体无意识的自组织过程,其核心是规约化/相变。语言层面词库中概括词(word type)的词类属性既非“先验存在”,也非“词无定类”,而是随着个体词例(word token)在言语层面句法中(即各种命题言语行为构式中)反复使用而发生演变,概括词的语法多功能/兼类与使用频率(含个例频率和类型频率)密切相关。社群语言层面词库中概括词的词类归属(单类或兼类)是其意义潜势,是其在言语层面句法中所体现出来的规约性命题言语行为模式,需要描写语言学家基于语料库使用模式调查,抽样分析有关词项在言语层面句法中的命题言语行为功能,并根据其命题言语行为模式的规约化程度有意识地实施的范畴化过程,其中语文词典编纂中的词类标注就是典型代表。鉴于语言演变呈现一种双螺旋结构[7]411,“双层词类范畴化模型”既揭示了语言系统层面词库中的词类和言语层面句法中的词类的区别,又指出了其中的有机联系。根据这一理论模型,“贪污”在语言系统层面词库中的词类应该源于其在言语层面句法中的词类,即“贪污”在句法中规约化的词类属性才等同于其在词库中的词类。因此,笔者通过语料库提供的数据,分析“贪污”一词的命题言语行为功能(具体体现为语法功能)及组合关系,以使用频率统计结果为标准来确定其准确的词类。
(一)个例频率
每个词的规约允准用法只有通过概率方式界定,对其搭配和配价进行统计分析,最好采用多种统计方式,并运用多个语料库。[7]382-383为了确保调查的准确性和可靠性,笔者选取了国家语委现代汉语语料库和Sketch Engine两个语料库。国家语委现代汉语语料库中关于“贪污”的索引共有79条,进行全样本分析;而Sketch Engine中关于“贪污”的索引共有20814条,笔者随机抽取其中的1000条作为研究对象。经过考察,以上抽取的所有索引词条皆为有效索引,但国家语委现代汉语语料库中有3条、Sketch Engine中有69条索引包含“贪污罪”“贪污案”“贪污者”“贪污局”“贪污犯”,这几个词中的“贪污”是构词用法,频繁出现,已独立成词,在此不讨论其词类。其余的语料,笔者坚持以命题言语行为功能为主,语义为辅,判断其词类属性的标准,通过分析每条索引中“贪污”的语法功能推断其命题言语行为功能。例如,“李某在看守所内承认自己贪污了2万余元”,这条索引中,“贪污”在句子中作谓语,表陈述,语义为“用职务上的便利非法取得财物”。依照此方法,经过分析整理,得出以下数据(见表1):
表1 国家语委现代汉语语料库和Sketch Engine中“贪污”索引词类分析结果
(二)类型频率
如表2所示,国家语委现代汉语语料库和Sketch Engine中“贪污”表陈述用法有“贪污+ NP①”“贪污+的+ NP”“(NP)+贪污”三种结构,分别占总数的42.86%、12.11% 和45.03%。
表2 国家语委现代汉语语料库和Sketch Engine中“贪污”表陈述的结构类型
(三)“贪污”一词的词类属性及其规约化
鉴于规约化程度取决于个例频率、类型频率、历时分布、语域分布等,其中前两者为最重要的参考标准[5]。因此,笔者根据“贪污”在语料库中的个例频率和类型频率来识别其词类属性,并判断其规约化程度是否达到语言系统层面而收入词典。经过分析表1,笔者发现国家语委现代汉语语料库76条关于“贪污”的索引中,表陈述、指称、修饰的分别是31、37、8条;Sketch Engine931条索引中有569条表指称,是名词性用法,占总体比例61.11%,并且语义都为“用职务上的便利非法地取得财物的方式、行为”,在政治、法律中是普遍用法。两个语料库中“贪污”表指称主要的结构类型是:“VP+贪污(腐败/腐化/受贿等)犯罪案件/活动/不文明行为/条例……”,“贪污(腐败/腐化/受贿等)+VP”,或者“介词+贪污(腐败/腐化/受贿等)”,即“贪污”与“腐败/腐化/贿赂/犯罪/浪费”等搭配作主/宾语或主宾语的同位语,因此,“贪污”一词的名词性用法已形成规约化的典型使用模式。另外有322条(国家语委现代汉语语料库和Sketch Engine中分别为31、291条)索引的“贪污”可以单独作谓语,表陈述,语义均为“用职务上的便利非法地取得财物”。根据表2,“贪污”表陈述结构中“贪污 +NP”和“(NP)+ 贪污”所占比例较高(分别为42.86%和45.03%)。其中有138条“贪污”以“经费/资金/公款/财物/多少/奖励款/抚养费/款物……”,或者以具体的数额为宾语。总之,与“贪污”搭配的词语类型很多,并呈现出一定的规律。换言之,“贪污”作谓语,表陈述的用法类型频率相当高,已形成规约化的模式。
但是,表1中“贪污”表修饰功能分别为8条和71条,占总体的10.53%和7.63%。相对于表陈述、指称功能,其表修饰功能的个例频率相当低。那么这类用法是形容词性规约化用法还是动词、名词有标记的临时用法呢?简言之,“贪污”是否有形容词词性呢?鉴于此,笔者拟采用学术界普遍认可的判断形容词常规标准[8]“很[不]~”。标准中的“很”代表绝对程度副词,包括“很、挺、顶、满、怪、十分、非常、格外、极、极其”等。经检验,笔者发现“贪污”不能被“很、挺”等程度副词修饰。“贪污”作定语如“……贪污的人”,“……贪污豪绅还要卑劣”等索引中的“贪污”是名词有标记的临时用法,语义未变,“……邵军贪污受贿案”等索引中的“贪污”起修饰作用,是动词有标记的临时用法,语义也没有变化,且结构类型主要为“贪污+(的)+ NP”,类型频率较低,并未上升到语言系统层面。因此,现代汉语中“贪污”一词在汉语社群语言层面词库(即语文词典)中的词类归属是动、名兼类,应在词典中明确标出。可见,《新汉英词典》(2007)将“贪污”处理为动、名兼类的做法是合理的。
(四)“贪污”的译义对“词类对译”原则的把握
“词类对译”是双语词典编纂中的一条重要原则。王仁强[9]强调编纂词典(汉语或汉外词典)应顾及语言与言语两个层面,即区分“语言对应词”和“言语等值词”。前者适用于词目及其义项的翻译,要求对应词的词汇意义及语法功能与源语词对应;后者适用于例证翻译,要求例证功能等值,而不必计较词类、句法、表面意义等的对应,必要时可采用“词类转换”的翻译手法,以提供更丰富、有效的例证。
而根据表1,《汉英综合大辞典》(2004)【贪污】corruption; graft; embezzlement; greedy; embezzle:~犯person guilty of corruption; ~分子a person guilty of corruption; grafter; embezzler. ~盛行riddled with graft and corruption; ~无能corrupt and incompetent; ~罪 crime of corruption. 这里混合了动词、名词和形容词(greedy)的释义,采用了混合译义的方式,而且“~分子”“~罪”等是构词用法,不能很好地说明“贪污”的相应用法。
显然,上述词典在例证翻译中灵活地采用了“词类转换”的翻译方法,即言语层面等值的原则,较准确地例示了“贪污”一词的意义与用法,并显示了英汉两种表达的区别与联系。但是,这些词典在语言层面的对应方面处理词目及义项还有待商榷。
经过上述实证分析与研究,笔者发现12部大中型汉英词典中“贪污”一词在词类判断、译义和配例等方面普遍存在以下问题:
(一)未显性标注词类
参见《汉英综合大辞典》(2004)、《新时代汉英大词典》(2000)、《新时代精选汉英词典》(2002)、《汉英大词典》(2010)、《现代汉英词典》(2001)。
(二)词目功能义项不一致
《简明汉英词典》(2002)、《新世纪汉英大词典》(2003)、《汉英双解词典》(1997)、《汉英词典》(第三版)、《牛津·外研社英汉汉英词典》(2010)等只标注了动词义项。而《新时代精选汉英词典》(2002)、《新时代汉英大词典》(2000)和《现代汉英词典》(2001)这三部词典虽未明确标注词类,但都根据“词类对译”原则[9]推断,将其按名词处理;《新汉英词典》(2007)、《汉英大词典》(2010)、《汉英综合大辞典》(2004)和《ABC汉英大词典》(2003)这四部词典将“贪污”当作动词兼名词译义。
(三)混合译义
在一个义项之下包含两种词类对应词,参见《牛津·外研社英汉汉英词典》(2010)、《新时代汉英大词典》(2000)、《汉英词典》(2002)、《新世纪汉英大词典》(2003)。
(四)配例不够典型
《汉英综合大辞典》(2004)、《牛津·外研社英汉汉英词典》(2010)、《汉英词典》(第三版)、《新时代精选汉英词典》(2002)、《现代汉英词典》(2001)等出现了“~犯 person guilty of corruption; ~分子a person guilty of corruption”这样的构词用法例证,不能准确说明其核心的语法功能。
而作为汉英词典重要参考的汉语词典如何识别“贪污”的词类属性呢?经过调查发现, 6部权威汉语词典虽实现了较全面的显性词类标注,但《现代汉语规范词典》(第2、3版)、《当代汉语词典》、《现代汉语词典》(第5、6版)、《中华实用词典》都将“贪污”明确标注为动词,无名词义项,且存在配例与词类标注不协调或配例不够典型等问题。
汉英词典的编纂通常以权威汉语词典为主要依据,所以12部汉英词典中有5部将“贪污”识别为动词也是无可厚非的。为什么词典编纂会屡次出现类似于“贪污”词类功能义项缺失、词类标注与配例“牛头不对马嘴”的情况呢?这与词典编纂者采用的词类判断标准、层面和程序密切相关。
词类属性的识别需要遵循一定的标准、层面和程序,也取决于研究者所遵循的逻辑。关于词类,学界已达成共识,词类是根据词的语法功能划分的类别,意义只能作为参考。分析语中概括词存在语法多功能现象,但是有的汉语语法研究者过分夸大了汉语词类的多功能,对于兼类问题过分谨慎,甚至重拾词类判断意义标准,如有的主张“兼类要尽可能少”,沈家煊将其概括为“简略原则”,这一原则几乎成为汉语学界的定论。[8-11]甚至还有学者[12]认为汉语词类划分中不应该存在兼类。王仁强和周瑜[13]基于对国家语委现代汉语语料库和《现代汉语词典》(第5版)的调查发现,现代汉语中的兼类与词频呈正相关,即高频词更容易发生兼类,而且王仁强[4]已通过大量的数据和事实证明,现代英语兼类现象普遍存在,且类型众多,其中名、动、形、副四大开放词类之间的兼类最多,即兼类现象是分析语或孤立语的共性特征,并且现代汉语的兼类应该适当多于现代英语。不少研究者显性或隐性地遵循“奥卡姆剃刀原理”,即“简略原则”(核心是“词义不变,词类不变”),致使汉语、英语等分析语的词类范畴化问题成为一个持续数百年的“哥德巴赫猜想”。
本文探讨的“贪污”词类属性识别情况正反映了汉语词典和汉英词典编纂存在严重的人为减少兼类的情况,显然违背了语言事实,这对于以汉语为母语者及非母语者利用词典学习都是非常不利的。
通过上述对“贪污”一词词类标注与译义的研究,本文针对汉语/汉英词典存在的问题与困惑提出以下建议:汉英词典的编纂必须摆脱“简略原则”的束缚,尊重语言事实,坚持以“双层词类范畴化模型”为理论指导。第一,在研究汉语词类及词类标注时,必须区分语言系统层面与言语层面,注意词类判断的正确程序,使词目、义项和例证三者协调一致,提高词典编纂的准确性和逻辑性;第二,汉英词典的词类标注应依靠大型汉语语料库及网络语料库的用法调查,不能仅凭主观判断或者完全参考权威词典的标注;第三,汉英词典应坚持词类对译原则,坚持汉语本位法;第四,汉英词典应尽量实现全面显性的词类标注,以提高汉英词典的科学性和实用性。
结合上述理论分析与语料库实证研究结果,汉语词典中“贪污”一词的释义应作以下处理:
参考汉语词典及语料库调查结果,汉英词典中“贪污”一词的释义应作如下处理:
综上所述,有关词类及词类标注的研究虽已取得了一定进展,但是词类标注理论仍然不成熟,实践也处于探索阶段。目前,大中型汉英/汉语词典在词类判断、译义和配例等方面仍然存在诸多问题。因此,汉语词类研究及汉英/汉语词典编纂必须区分言语句法层面和社群语言系统层面的词类范畴化,根据句法功能为主、意义为辅的标准界定言语层面的词类属性,结合大型语料库判断其使用模式,最终得出正确的词类属性并在词典中加以表征,从而真正做到尊重语言事实,提高词典的编纂质量。
注释:
①本文中NP指名词或名词短语,VP指动词或动词短语。
[1]陆俭明.现代汉语语法研究教程(第四版)[M].北京:北京大学出版社,2013.
[2]姚小平,主编.汉英词典(第三版)[M].北京:外语教学与研究出版社,2010.
[3]Croft, W. & E. van Lier. Language Universals without Universal Categories [J]. Theoretical Linguistics,2012, 38 (1-2): 57-72.
[4]王仁强.现代英语兼类现状研究——以《牛津高阶英语词典》(第7版)为例[J].外国语,2014(4):49-59.
[5]王仁强,陈和敏.基于语料库的动词与构式关系研究——以sneeze及物动词用法的规约化为例[J].外语教学与研究,2014(1):19-31.
[6]Wang, R. Q. & Huang, C. N. Two-level Word Class Categorization Model in Analytic Languages and Its Implications for POS Tagging in Modern Chinese Corpora[C]∥Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation. Shanghai: Shanghai Jiao Tong University, 2015: 1-10.
[7]Hanks, P. Lexical Analysis: Norms and Exploitations [M]. Cambridge: The MIT Press, 2013.
[8]郭锐.现代汉语词类研究[M].北京:商务印书馆,2002.
[9]王仁强.论双语词典学的“词类对译”原则[J].四川外语学院学报,2007(3):41-46.
[10]陆俭明.汉语词类的特点到底是什么?[J].汉语学报,2015(3):2-7.
[11]沈家煊.词类的类型学和汉语的词类[J].当代语言学,2015(2):127-145.
[12]周韧.兼类说反思[J].语言科学,2015(5):504-516.
[13]王仁强,周瑜.现代汉语兼类与词频的相关性研究——兼评“简略原则”的效度[J].外国语文,2015(2):61-69.
[责任编辑 亦 筱]
2016-06-03
重庆市社会科学规划项目“基于语料库的外向型汉英高阶双语学习词典编纂研究”(2014YBYY083)
宫妮(1990— ),女,甘肃庆阳人,硕士研究生,研究方向:词典学、语料库语言学。
H313
A
1008-6390(2017)01-0039-04