董玉双
(四川外国语大学 研究生院,重庆 400031)
范畴化是语言研究的核心问题,词类研究一直被认为是汉语语法研究的一个老大难问题,[1](P34)其中,语法多功能现象(兼类)问题尤为凸显。[2-5]王仁强指出,兼类是指“一个多义的概括词或词项在社群语言系统层面词库中兼属两个或两个以上词类范畴的语法多功能现象,在语文词典中体现为兼类词”。[6]兼类问题是汉语词类问题研究的难点,同时也是语文词典编纂研究的核心和关键。
鉴于此,笔者通过查阅汉语/汉英词典对多音节词“斗争”进行个案研究,并发现,汉语词典将“斗争”标为动词,部分汉英词典将其标注为动名兼类词。鉴于现代汉语是典型的分析语,其兼类比例应高于现代英语。因此,笔者以现代英语词典为辅助,对“斗争”的对应词“struggle”进行查阅发现,《牛津高阶英语词典》(第9版)(以下简称《牛津9》)将“struggle”标为动名兼类。由此可见,现代汉语对词类范畴划分尚存在问题。基于此,本文以双层词类范畴化理论为指导,探讨汉语多音节词“斗争”的词类范畴,同时对比汉英“斗争”/“Struggle”在各自词类系统中的标注情况,旨在更深层面揭示汉、英动词和名词在汉语词典和英语词典中的标注异同及背后影响因素。
双层词类范畴化理论(Two-level Word Class Categorization Theory)是针对汉语、英语等上千种分析语中概括词在社群语言层面词库中普遍存在的语法多功能性,基于近些年在国际上涌现出的复杂适应系统语言观以及 Croft和 Van Lier所主张的跨语言词类本质观而提出的一种新的词类范畴化理论模型。[7](P345-347)该理论的主要内容包括:言语层面(个体词例)的词类范畴化和社群语言层面(概括词)的词类范畴化。言语层面词例的词类是说话者对指称、陈述、修饰等命题言语行为功能的表达过程。社群语言层面词库的词类是一个语言社群集体的自组织过程,其核心是规约化/相变。概括词的词类属性会随着个体词例在言语中反复使用而发生演变,概括词的兼类现象与使用频率(包括个例频率和类型频率)密切相关;概括词的词类归属(单类或兼类)是其意义潜势,是个体词例在句法中所体现出来的规约性表述功能。基于语料库的使用模式调查,判断规约化有四个维度的标准:个例频率、类型频率、历时分布、语域分布,[8]其中个例频率与类型频率是判断规约化的主要标准。
1. 基于词典的使用调查
首先,调查权威汉语词典《现代汉语词典》(第6、7版)和《现代汉语规范词典》(第3版)中“斗争”的微观结构,调查三部汉语词典中“斗争”词类标注是否准确,释义与词类是否协调,配例与词类是否一致。依次再查阅其他五部权威汉英词典,观察“斗争”词类标注情况。其次,鉴于“牛津3000关键词”(Oxford 3000TM)是基于英国国家语料库(BNC)和牛津语料库集成(Oxford Corpus Collection),并按照使用频率和语域广度进行精选的,据此我们调查现代英语词典《牛津9》中“struggle”的微观结构。最后,对比汉语、英语词典对于“斗争”/“struggle”的词类标注情况以及主流汉英词典对“斗争”词类标注的异同。
2.基于语料库的使用调查
首先,基于国家语委现代汉语语料库(以下简称“语委语料库”)对“斗争”一词的用法进行检索和判定,从个例频率和类型频率两方面对其规约化程度进行数据分析。其次,由美国杨百翰大学Mark Davies领衔学术团队开发的美国当代英语语料库(COCA)是目前在线免费的最好的英语语料库之一,它是当今世界上最大的免费使用的英语平衡语料库。基于此,检索“struggle”在COCA的个例频率和用法类型频率。最后,对比分析两者异同。
首先,笔者查阅七部权威汉语/汉英词典对“斗争”的标注情况,并以现代英语词典《牛津9》为参照,结果如表1、2所示。
表1 “斗争”词条在七部汉语/汉英词典中词类标注情况
表2 “struggle”词条在《牛津高阶英语词典》(第9版)中词类标注情况
1.基于国家语委语料库的调查结果
首先,笔者基于语委语料库对“斗争”词例进行检索,得出“斗争”词例在语委语料库中共有3 183条。基于此,笔者进行了全样本分析。通过初步统计,在3 183条索引中,仅有744条标注为动词,占23.37%;2 439条标为名词,高达76.63%。但通过分析,笔者发现以下问题: “斗争”在做主宾语时前后的词类标注不一致;“斗争”在动词后并在句中做中心语受其他词修饰,仍标注为动词;“斗争”表示词素用法时标注前后不一;“斗争”在介词后做宾语却标注为动词。故此,笔者从个例频率和类型频率两方面进一步统计分析全样本数据。
(1)个例频率
在数据处理过程中,首先区分了词用法和构词用法(语素组用法),如索引中出现的“斗争性”“斗争会”“斗争史”等,其用法频繁出现,已然独立使用,因此,笔者将其视为构词用法,在此研究中不对其进行讨论。通过分析所得词用法共2 598条,占81.62%,语素用法有585条,占18.38%。通过命题言语行为功能进行重新标注后,2 598条“斗争”词条中表示指称用法的有2 217条,占总数的85.33%,其次381条表示陈述用法,占总数的14.67%。
(2)类型频率
鉴于“斗争”词例在语委语料库中标注情况存在明显差异,因此,笔者对“斗争”的2 217条指称用法(作主/宾语)和381条陈述用法(作谓语)分别进行类型频率分析。如表3、表4所示,“斗争”一词的指称用法模式各有五类。
表3 2 217条“斗争”指称用法在各结构中的分布情况
表4 381条“斗争”陈述用法在各结构中的分布情况
2.基于COCA的使用调查
(1)个例频率
笔者通过检索COCA,发现“Struggle”作为动词和名词的个例频率都很高,而且使用域也很广泛,在五个语域都有很广的分布,见表5。
表5 “Struggle”动词和名词用法在COCA的分布情况
(2)类型频率
笔者再次检索“Struggle”在COCA中作为动词和名词时的使用类型,调查中取其使用搭配的间距为+4。调查结果发现,“Struggle”能产性较高,可一起搭配不同的使用类型,其中动词用法有867个,名词用法有10 628个,具体如表6所示(其频率最高的前15)。
表6 “Struggle”在COCA中的类型频率
首先,基于语委语料库的调查,从表3、4可知,“斗争”的指称用法在各结构中分布众多,其中“动词+斗争”和“(修饰语)+斗争”两种结构类型占有较高频率,分别为37.75%和35.05%。“揭露斗争”“争取斗争”“加强斗争”“复杂的斗争”和“艰苦卓绝的斗争”等范例在语料库中频繁出现。不仅如此,个例频率较低于名词用法个例频率的动词用法,在其类型频率上却也是分布广泛。其中“动词单独使用”和“连动用法”占较高比例,分别为51.71%和30.44%。其次,基于COCA的调查,从表5、6可得,“struggle”的动词用法和名词用法明显都有着超高的个例频率,且类型搭配结构多样。
个例频率和类型频率,导致了不同语言单位的巩固。个例频率促成个体词例的固化,类型频率促成更抽象图式的规约化,[9](P118)类型频率是语言结构能产性的重要决定因素,且与语言结构的能产性成正相关。[10](P95)因此,“斗争”表示指称和称述的用法都已达到规约化程度,概括词“斗争”在汉语社群语言系统层面理应兼属动词和名词词性。
标注与词典的微观结构和宏观结构有密切关系,而汉英词典中兼类词的处理问题主要是汉语词目的兼类处理问题。兼类问题是汉语词类问题研究的难点,同时也是词典编纂研究的核心和关键。
由表1、2所知,《牛津9》将“Struggle”标为动名兼类词,《现代汉语词典》(第6、7版)和《现代汉语规范词典》(第2版)将“斗争”标为动词。基于汉语词典为蓝本编纂的汉英词典《新时代汉英词典》和《汉英英汉双解词典》都将“斗争”标为动词,而另外《汉英词典》(第3版)、《新世纪汉英大词典》(第2版)和《汉英翻译词典》(2015)将其标为动名兼类。不仅词典之间对于同一词的释义不同,各个词典内释义与词类标注、配例与词类标注也不协调。具体如下所示:
1.配例与词类标注不协调
【斗争】动:(1)“跟歪风邪气做坚决的斗争”“开斗争会”(《现代汉语词典》〈第6、7版〉);(2)“开展武装斗争”(《现代汉语规范词典》〈第3版〉);(3)“新与旧的斗争”|a conflict between the old and new(《新时代汉英词典》);(4)“你死我活的斗争”|life-and-death struggle(《汉英英汉双解词典》)。
2.释义和词类标注不协调
【斗争】动 :群众用说理、揭发、控诉等方式打击敌对分子或坏人(《现代汉语词典》〈第6、7版〉)。
不仅在词典的微观结构中出现诸多问题,在词典的宏观结构中也存在相应问题。在已有的一些定量研究中,王仁强通过调查发现:《现代汉语词典》(第5版)共收录65 815个条目,仅有3 479个兼类词条,占总数的5.29%。[11]杨旭、王仁强指出《现汉》(第6版)收录了69 232个条目,有3 746个兼类词,占标注词目的6.65%(标注词目有56 325条)。[12]然而,在《牛津高阶英语词典》(第7版)整部词典46 380个词条中,有10.48%的兼类词(共4 861个),共有125种兼类情况,其中以兼两类为主(占兼类词条总数的91.15%),名动兼类词占 59.65%。[6]因其现代汉语和现代英语都是典型的分析语,[13](P295)而现代汉语的分析性高于现代英语,那么现代汉语兼类比例应该适度高于现代英语才真正符合现代汉语的现状。但从上述数据得知,事实并非如此。由此可见,同为分析语的现代英语在处理兼类时,并没有因为兼类增多及其他连锁反应而给英语语法研究者带来很多担忧。相反,现代汉语的兼类问题处理方式却是截然不同。出现这些情况的主要原因是受“简约原则”的影响,“兼类要尽可能少”原则被视为金科玉律。不少学者在对兼类词进行处理时也采取根据需要分情况进行,坚持“词义不变,词类不变”。王仁强、周瑜则指出,“简约原则”存在误用逻辑关系的现象,一阶逻辑只能解释言语句法层面的词类范畴问题,而社群词库层面的词类范畴问题则需要高阶逻辑才能进行合理解释。[14]由此可见,兼类问题处理的好坏直接关系到词典的编纂质量,严重影响词典微观结构的准确表征,并且会影响汉语学习者的学习效率。相对应的,如果兼类问题研究的理论出现偏差,则会导致词典微观结构表征的实践冲突。
此外,根据双层词类范畴化理论,词典中词目词属于社群语言词库层面,它标注的是概括词的词类归属,语料库中的文本属于言语层面的词库,它需要根据词例在特定句子中的命题言语行为功能进行标注。杨惠中认为组合关系具有丰富的形式和内容,且组合轴上的意义也非常丰富。[15](P87-88)因此,只有通过强大的语料库才能支撑词语的组合关系,使准确发现词义成为可能,而基于语料库的使用调查能清楚地查看一个词目的语法功能和词义。基于对上述两大中型语料库调查得知,“斗争”理应设立动词和名词两个义项。基于语料库编纂的现代英语词典《牛津9》在其义项、释义和范例设立方面都遵循大数据的统计分析,将“斗争”对应词“struggle”标注为动名兼类。但不同的是,即使在一个语料选材类别广泛、时间跨度大,且库容约为1亿字符的大规模的平衡语料库——国家语委语料库原始数据中,尽管已明确“斗争”词类属性,但汉语词典却在某种程度上因“简约原则”而精简其词性,仍未增设其名词义项。①
鉴于词典的收录对象是规约化的词汇单位,表征的是语言层面词库中语言单位的意义潜势,因而词典中的词项被视为语言系统中的一部分。所以,要想实现这些词项的常规用法,只能通过大型语料库分析。[16](P349-350)因此,要想提高词典编纂效率,保证词典使用质量,明确汉英词类范畴,基于语料库的使用模式调查是关键。再者,词类的本质是表述功能,只有基于语料库的调查,才能把握语言事实,确认其是否是兼类。根据双层词类范畴化理论可知,词类是指社群语言层面词库中所属的概括词,个体词在言语层面达到固化模式之后形成概括词,即规约化后的词。通过上述语料库检索数据可知,“斗争”兼类词分布模式符合言语(即使用中的语言)作为复杂系统表现出的“二八法则”。②兼类词虽是少数,但却是“关键少数”。由此可见,在一阶逻辑指导下的“简约原则”问题尤为明显。
由上述结果和讨论可知,“斗争”在汉语社群语言系统层面应兼属动词和名词词性。因此,建议对汉语词典“斗争”的释义和配例作出以下修改:
【斗争】:dòuzhēng
动 (1)矛盾的双方互相冲突,一方力求战胜另一方:要胜利,就得~ ;(2)揭露批判;打击:对危害人民利益的言行必须坚决~;(3)努力奋斗:为祖国的繁荣昌盛而~ 。
名(1)为争取自由、政治权利等而采取的一种方式;一种长期艰苦的奋斗:权利~|争取独立的~ ;(2)用武力手段打击敌对分子或坏人:凶杀现场没有~痕迹|他正同对手进行一场激烈的~ ;(3)(对某人而言)是困难的,是难事:这个~是很困难的。
参照汉语词典以及语委语料库和COCA的调查分析为蓝本,对汉英词典中“斗争”的释义和范例作出以下修改建议:
【斗争】:dòuzhēng
动(1)to struggle;fight;strive;combat: ~ 到底 fight to the end||同不正之风~ struggle unhealthy tendencies.(2)to expose;denounce;accuse:~贪污分子 to denounce embezzlers.(3)to strive; fight; work energetically:为真理而~ to fight for truth || 为完成五年计划而~ strive for the fulfillment of the five-year plan.
名(1)a hard fight:权利~ a power struggle||善与恶的~the struggle between good and evil.(2)a physical fight:凶杀现场没有~痕迹There were no signs of struggle at the murder scene||进行~ carry on/conduct/wage a struggle.(3)something that is difficult for you to do or achieve:这个~是很困难的this struggle is so difficult.
通过以上分析可知,汉英“斗争”/“Struggle”做名词表指称的个例频率和类型频率均达到规约化程度,在社群语言系统层面理应标注为动名兼类词。而通过“斗争”的个例研究再次证明,双层词类范畴化理论兼顾经典逻辑和模糊逻辑,有效区分了概括词和个体词不同的范畴化过程,对分析语的词类范畴化难题能够提供更加完整合理的解释。此外,词典编纂应注重词类标注、释义模式和配例之间的同一性。语言是基于使用的,是历史文化的积淀,在对兼类问题进行处理时,我们更应基于大中型语料库的使用模式,采取自下而上的方式,系统而全面地调查,摆脱“简约原则”的束缚,促进汉英词典的发展,从而更好地服务于“汉语国际化”的战略。
注释:
①在3 183条“斗争”索引中,2 439条为名词,占总数的76.63%,744条为动词,占总数的23.37%。
②语委语料库中“斗争”名词2 217条,占总数的85.33%,381条动词词性用法,占总数的14.67%;在COCA中,动词有8 387个,名词有24 808个。