洪桂治++苏新春
摘要现代汉语语义分类成果丰硕。《现代汉语分类词典》(苏新春主编)是当前词汇分类研究的最新成果之一,其特点在于以语文词为材料建立分类框架,并贯彻了以义为纲的原则。整部词典以“义”为分类对象和分类依据,注重义类划分的层级性与逻辑性、义类排列的有序性与文化性、类名提取的概括性与典型性。文章从材料、内容、结构角度等方面介绍其编纂特色,讨论该词典在词汇学习、语言教学、中文信息处理等领域的应用价值及其不足之处。
关键词《现代汉语分类词典》语义原则语文词
苏新春先生主编的《现代汉语分类词典》(A Thesaurus of Modern Chinese;以下简称《分类词典》)历经近十年的研制,于2013年1月由商务印书馆出版。与按读音、字形编排的词典不同,它是按词的意义进行分类编排的。学界将这类词典称为分类词典,又因为语义在分类中的作用,也称义类词典或类义词典。它不同于一般的语文词典,也不同于同义词反义词词典,而是按一定语义关系、逻辑关系组织起来的词汇系统。
自20世纪80年代以来,以《同义词词林》(梅家驹等主编,1983)的出版为标志,语义研究悄然升温,自此也拉开了汉语建构词汇语义系统的帷幕。此后的几年,《现代汉语分类词典》(徐为民主编,1984)、《简明汉语分类词典》(林杏光等主编,1987)、《现代汉语分类词典》(董大年主编,1998)、《现代汉语分类大词典》(董大年主编,2007)相继出版。除却这些以修辞写作、语言教学的“表达”为诉求的分类词典外,《知网-中文信息结构库》(owNet,董振东、董强,1999)、《现代汉语语义词典》(SKCC,王惠等,2003)、汉语框架语义网(CFN,刘开瑛,2003)等适应计算机需求的成果也陆续面世。在这“人丁兴旺”的分类词典家族中,缘何要再研制、编纂《分类词典》?工作的初衷只是为了把“现有的注重语义性的分类模式做得更完善些”(苏新春 2008)。从结果来看,《分类词典》达到了预期的目标,完整、精细地贯彻了以义为纲的原则:对“义”分类,以“义”聚类,按“义”编排,据“义”索类。同时,《分类词典》在人的语言学习与使用中的作用也显而易见。下文将从《分类词典》的材料、内容、结构角度等方面介绍其编纂特色,列举《分类词典》的实用价值与应用方式,对《分类词典》下一阶段的工作做了展望。
一、《分类词典》的材料特色——语文词
综观现有语义分类词典可以发现,其分类对象不限于“词”,或者说,它对“词”的界定会宽泛一些。如,《同义词词林》的“收词范围包括词以及部分词素、词组和成语等”,“还收了一些较常见的方言词与古语词”,“固定语”在其中占了不小的比例。(梅家驹等 1983)《现代汉语分类词典》(徐为民版)收录了“词素、词(双音词)”,且是文学作品中的“词”。究其因,与这类词典定位为“写作词典”密切相关。《分类词典》收“词语”,一般不收“词素”与“短语”,酌量收录了一些成语、惯用语等固定短语。这与它“词义系统”的定位是吻合的。
在词的筛选中,《分类词典》十分强调对“语文词”的收录。“语文词”是苏新春先生提出的一个术语,其概念源于语文词典。它与“百科词、术语词、行业词”相对,具有现代性、通用性的特征。语文词是词汇的核心部分,“把语文词管住了,在此基础上再作词量的扩展也就不难了”(苏新春 2013)。基于此,《分类词典》以语文词为主体,建立起语义分类框架,形成一个开放、动态的系统,便于词汇系统的更新。
《分类词典》收录的语文词又是怎么来的呢?早期编写分类词典缺少语料库技术的支撑,词语的筛选多基于教材、经典读物、辞书等材料进行,收词面会受限。再则,随着时间的推移、语言的变迁,部分词汇出现新旧交替,当代词汇系统得以更新。《分类词典》是基于前人分类成果、语文词典、大型现代汉语语料库及最新的词表编写的。在研制过程中对当代词汇做了广泛收集,“所涉语料有:10余种有代表性的现当代语文词典;20余种新词语词典;近十年数亿字的新闻报刊;半个世纪来有代表性的文学作品;较为流行的词表与词库;最新一种则是刚研制完成的依词频排列、多达5.6万词的《现代汉语常用词表》”(苏新春 2008)。此外,还进行了人工干预,通过词语联想补充新词新义,再从中筛选流行范围较广、稳定性较高的加以增补。最终,按词计,《分类词典》收录76464条;按词项计,《分类词典》收录82955条。可以说,《分类词典》语料新、全,词汇覆盖面广。
二、《分类词典》的内容特色——以义为纲
主编苏新春先生谈及《分类词典》研制动因时曾说:“作为真正的语义分类词典,必须正面探究语义问题,寻找到体现一种词汇语义系统的最佳展现方式。” 《分类词典》就是以此为目标去努力的。“义”,是《分类词典》的特色所在、生命力所在。可以说,《分类词典》是一棵以“词项”为材料、以“语义关系”为枝干建构起来的茂盛的“语义树”。
1.以“义”为分类对象和分类依据
词汇系统有多种分类标准,依据词的形态、读音、语法属性或意义进行分类,可形成不同的词汇聚合。但词义系统的分类标准是唯一的,只能是“词义”。《分类词典》的分类依托词项进行,其实质是对词义的划分。
对“词义”进行不同角度、不同层次的解读,又对应着不同的分类方法。现有义类词典采用的分类方法主要有两种:一是基于组合特征的方法。即在配价理论与选择限制理论指导下,以词义间的组合特征为依据的方法。句法功能特征与论元结构在分类中起决定作用,语义的核心——概念“所指”作用甚微。信息处理用的分类体系多采用这一方法。北京大学研制的《现代汉语语义词典》(SKCC)就是其代表成果。二是基于词义特征的方法。即通过义素分析析取词义特征,寻求词义间共性并建立词义联系的方法。词义特征包括词义内涵(词义核心成分)、词汇的类别(领域)特征和词义关系三大内容。这是最为直观、最为简便、最易于融合词义语言学特征与人类思维中的世界知识系统的一种方法。梅家驹等编纂的《同义词词林》就是代表成果。
《分类词典》从自身“服务语言认知与使用”的应用目标出发,采用“词义特征”作为分类依据,根据词所表达的概念义(包括词义的范围、性质、特征、程度等)和附属义(包括词的感情色彩、形象色彩、语体色彩等)将不同词项聚合成义组,再以某一概念为核心,将与之关联的义组聚合成义类。义组、义类即为大小不同的语义场。如“筷、箸、公筷、筷子、竹筷、卫生筷”,这组词表示的概念义都是“夹饭菜或其他东西的细长棍儿”。尽管还可析出“制作材料、功能、时代色彩”等词义特征的差异,但其核心概念是一致的,形成“筷”组。而以“吃饭的用具”这一概念为中心,“筷”组又可与其他词义相关组如“碗”组、“勺”组、“匙”组等形成“餐具”语义场。这些组之间在“词义内涵”即词义所指上是不同的,但具有“类”的共同意义。简言之,《分类词典》在基础语义类范围内,更强调词义“所指”的一致性;在义组与义组相系联构成义类时突出了“类别(领域)特征”,系联的依据就是词义关系。这样的分类相较其他分类词典,更趋于细致。
此外,以义为对象、依据的分类是以“词项”为载体进行的。所以,其实质是对义位的分类,归词时就要保证每一义位意义类属的唯一性,避免“一义多归”现象的产生。如“试用”,归入“尝试”或“使用”似乎均可,归类不同,强调的语义特征也不同。作为单义词,它不能双归,因而根据其语义重心归入“使用”类。多义词则根据其义位多归,每个义位归入一个义类。如“遭遇”就收录了一个名词义、一个动词义,分别归入“经历”类和“吃苦”类。
2.义类划分的层级性与逻辑性
《分类词典》呈树状分布,分五级语义层,可自上而下循“类”而至“词”。如“的士”,归属于“贰 具体物—四 器具—E 交通工具—a 车—08”。从最上层“具体物”往下走,到“器物、交通工具”,再到“车”以及“出租车”。在第五层“08”形成了表示“按里程或时间收费、供人临时雇用的汽车”义的词语集合。
《分类词典》五级语义层各司其职。第一至三层是抽象的类别概念,第五层是具体的词语概念,第四层是介于二者之间的衔接层。外在分明的层级性,实则受内在严密逻辑性的控制,体现在上下层级的语义关系与同一层级的语义关系上。
《分类词典》上下层级在语义上是上下位关系。这种关系是双向的,既有上对下的统辖(涵盖),又有下对上的切分(隶属)。如上位概念“动武”包含下位概念“殴打”“打架”“制服”“屈服”,这四类又从“行为”和“结果”两个角度对上位概念“动武”进行了周遍的切分。
《分类词典》同一层级的语义关系则要复杂得多。它牵涉到基础语义类的聚合、相邻语义类的系联与区分。洪桂治(2012)讨论了《分类词典》最底层基础语义类的五种基本结构关系,即词与词聚合的依据:等义关系、同义关系、对义关系、类义关系以及相关关系。其中,又以同义关系为多。这里不再赘述。相较以往的分类成果,《分类词典》值得称道的地方在于它对语义颗粒的细致处理。如,《分类词典》收录的表示“婚姻关系中男性的配偶”义的词有97个。若归为一个基础义类,显然过于庞大。因此,在这个同义义场里,根据词义侧重点的不同分出了八类:基于称呼方式的不同,分出“妻子”“拙荆”“尊夫人”三类分别表示一般性称呼、自己妻子的谦称、对别人妻子的尊称;基于配偶地位的差异,分出“嫡妻”“庶妻”两类;根据婚姻状态持续与否,分出“前妻”“继室”“亡妻”三类。难能可贵的是,在《分类词典》中,这样精细的处理是贯穿于整个系统的。
相邻语义类尤其是词义系统中层相邻语义类的系联与区分是分类过程中难度较大的一项工作。基础语义类(义组)要聚合成更大的语义类(义类、义群),既要保证具有相同语义中心的义类相互系联,而不是简单的拼合,又要注意与其他义类保持一定的语义距离,具备相对独立性,同时还要保持义类与义类之间的均衡性。鉴于以往分类成果在这方面的不足,《分类词典》分类时用力甚多,结果也颇为出彩。如“抽象事物”类下分出了“事情”“属性”“意识”“社会”“政治”“军事”“经济”“科教”“文体卫生”“数量单位”等十类。这十类聚合了众多抽象概念,皆是人类意识的产物;但彼此又相互独立,形成各自的语义中心。当然,根据人们日常的认知习惯,“科教”与“文体卫生”可并为“科教文卫”。若合并,该类将下辖13个三级类,较相邻类多出了不少,相邻类之间在规模上会失去均衡。可以说,《分类词典》的处理是经过了多方面权衡的。
3.义类排列的有序性与文化性
苏新春先生对“义类排列”工作的定位是“与义类分立、类名提取共同承担着语义系统建构的任务”。他在两篇讨论《分类词典》研制工作的文章(2008,2010)中均花了大量篇幅阐述《分类词典》的义类排序原则。由此可见《分类词典》对义类排序的重视。
《分类词典》的义类排序原则可简述为:“同级语义层中各义类按一定的语义关系排列。先概称类,后具体类;先泛称,后确称;先通名,后狭名;先褒词,后贬词。”(苏新春 2008)具体来说,第一,根据义类关系排序。义类关系即义类与义类之间的语义关系,它也代表着人们对语义的认识。“相对同类关系”的义类编排方式是褒义在前,贬义在后,积极意义在前,消极意义在后。“序列同类关系”下,一是按照程度的轻重、数量的大小、等级的高低进行排列,二是按人们的日常认知习惯进行排序。“共体关系”下,“整体”义在前,“部分”义在后,“总指”义在前,“分说”义在后。“同属关系”下,典型义在前,边缘义在后。如,“生物”类下,作为“整体”的“人”“动物”“植物”“微生物”在前,作为“部分”的“生物部分”在后。再如“婚恋”类中,“恋爱—未婚—订婚—婚嫁—已婚—离婚”是以事件发展的过程为序的,它也与人们的日常认知相一致。第二,根据类名排序。这适用于采用并举式命名的义类。如“东南西北”类便是按此方位排序。第三,根据认知规律排序。由具体到抽象,由表及里,由点到面等等。这多用于上位层级的义类排序。如“性质与状态”类下,由“形貌、知觉、性状、性质、才品”到“情境”,便是由作为“点”的个体存在的特征到作为“面”的个体存在的背景、情境扩展。
有趣的是,透过《分类词典》义类排列,可窥见一个社会、民族、观念的文化世界。苏新春先生(2008)对“壹 生物一 人D 亲属c夫妻”下20个五级类的排序从文化角度的分析发现:“义类按先总指后分指、先通名后狭名、先雅名再俗名,先正名后旁名,并按婚姻过程前后相续而列”,“显示出汉民族传统中男性中心、女性附庸,婚姻道德对男性要求松,对女性要求严格,重婚姻的原生性一贯性,轻婚姻的再生性接续性的文化特点”。这个例子极为典型。此外,《分类词典》对“褒义在前,贬义在后,积极意义在前,消极意义在后”“男在前,女在后”“老在前,少在后”的追求,也是民族文化心理的体现。
4.类名提取的概括性与典型性
“类名简而言之就是能对该类所属词语起代表作用,揭示该类主旨、主题,起标志、提示、指引作用的代表词。能够让人一看到类名就联想到该类的基本意思。”(苏新春等 2010)《分类词典》将类名的提取与立类工作同步进行,反复斟酌。结果也显示出《分类词典》在类名上的两大特征:概括性、典型性。
在词义系统中,上位层级义类要能统领、覆盖下位层级义类。这通常体现在上位义类的类名上。上位义类类名具有概括性,能涵盖下位义类的全部内容。越是上位层级,其类名的概括性越高;越是下位层级,其类名也就愈加具体。《分类词典》的类名有总括式的,也有并举式的。如“才品”类下,“才”与“品”是并举的,涵盖了“才能”与“品性”两个下位类。细究“才能”二字,可知其既包含先天之能,也包含后天之知,因而可确切地称为“资质能力”。这四个字便是对“智—愚”“能—庸”“巧—拙”“进—守”的全面概括。再往下看,“智—愚”“能—庸”“巧—拙”“进—守”作为类名,是对更下位义类的具体概括。
另一方面,由于词汇纷繁芜杂,有时候上位类名不足以全面概括下位义类。这种情况下,《分类词典》采用最典型的、最具代表性的类名。这样的情况往往出现在由语义核心向语义边缘不断延伸的语义场内。如以“健—弱”为类名的义类下,“健”和“弱”是它下辖的两个义核。在语义场“弱”内,除了彰显义核的“虚弱”类外,还包含“绵软(形容身体无力)”和“聋(生理缺陷)”两个边缘类。严格从词义来看,“绵软”类和“聋”类并不属于“弱”的范畴,但它们具有关联性。又由于难以找到能覆盖这三个义类的类名,因而选用具有代表性的这一语义场的核心“弱”来作为类名。
三、《分类词典》的结构特色——语义分层与分类标示
义类词典收词量大,又按义编排,因此,有清晰的结构和便捷的检索途径就显得特别重要。
网状与树状是词汇系统的两种典型结构。“网”是立体的,“树”是平面的,“树”状结构是纸质化分类词典的必然选择。《分类词典》也不例外。它采用五级语义层分类体系,一至二层是对词汇系统的领域划分,三至四层是词汇系统的节点,五层是各种语义关系词语的类聚。这五层分别用大写汉字、小写汉字、大写英文字母、小写英文字母和阿拉伯数字标示。把五个语义层的序号加起来,就是词语的语义层级和义类序列的编号。这样一来,每个底层的五级语义类都有一个特定的“身份证号”。
同时,《分类词典》可采用类序与音序进行双向的检索,十分便捷。一方面,在正文之前有一至三级语义类的分类目录用以提示、指引进入正文,然后可根据凡例提示的排序规则寻找相应的义类。另一方面,正文后附有全部词语的音序索引,每个词后都有义类编号,可根据该编号回溯至正文。
四、《分类词典》的实用价值与应用方式
1.词汇学习与运用的材料
《分类词典》可满足人的社会认知、词语学习与交际应用需求。
现代汉语义类词典最初是作为以义求词的工具书出现的。当你想到一个词语不合适或者只有一个意义类属印象而根本没找到一个词语时,即可通过词义关系层层查找、挑选你认为最合适的词。因此,早期的义类词典也常被称作“写作词典”,满足写作、翻译之需。到后来,义类词典的应用范围拓宽了,延伸至语言教学领域。反身来看《分类词典》,语义分析精细是《分类词典》十分突出的特点。其底层义类(即义组)内部绝大多数以同义关系聚合,义类排列井然有序,这也正迎合了学习者的需求,有助于学习者对词汇的记忆、理解、辨析以及选用。一方面,它可在“教”“学”活动中作为学习者词汇扩充记忆的材料;另一方面,可通过同一义类内部、同一层级不同义类之间、不同层级义类的排比,加强学习者辨析同义词近义词的能力。
2.教学资源开发的材料
《分类词典》收录的是具有通用性特征的语文词,因而可作为教学资源开发的材料,用于教材编写、学习词典编纂、词表研制等。
教材词汇的超纲问题、复现问题、出现次序问题屡为学界所关注,也是词汇学习的障碍之一。这是目前教材采用“先选文、再适当改写进而编写生词表”的编写形式所带来的问题。有《分类词典》的分类体系作为材料支撑,使根据交际任务、情境、话题确定词语表进而编写课文具有了可能性。与此同时,《分类词典》义类体系也为编纂搭配词典、同义词辨析词典等工具书准备了充足的词汇材料。义类是根据一定语义关系形成的。同一义类内,同一义群下不同义类之间,同一语义中心下不同义群之间,都有其共通性与区别性。以此为基础,从学习者的学习需求出发,编纂搭配词典、同义词辨析词典,将极大地促进词汇的学习。
3.语言研究的材料
《分类词典》是基于语义哲学观建构起来的一个词义系统。围绕《分类词典》,可开展词汇系统研究、词汇对比研究、核心词研究等。如,词汇系统的建构理论研究、历时研究。再如,《分类词典》每一语义层都有类名,它们是揭示各义类主旨、主题的代表词,也是词义系统中的基础词、常用词。基于《分类词典》类名开展核心词词表研制工作,对语言教学大有裨益。
4.中文信息处理的应用
《分类词典》的义类体系同样可应用于中文信息处理,对词义消歧、文本分类、机器翻译、语言信息提取等有重要作用。如在多义词词义自动标注中,可利用语义分类体系“研究词语在类聚基础上的组合关系,把研究由词语之间的组合推进到词语义项和义类之间的组合关系上”[1],能有效改善建构概率模型时的数据稀疏问题。这在苏新春先生主持的“国家语委‘通用语料库之上的汉语义频词库的开发” 项目中已得到了利用。
五、《分类词典》的不足与下一步工作
《分类词典》的研制是一项充满探索性的艰苦工作。由于各种主客观原因,《分类词典》还存在一些缺憾,有待下一阶段的工作去弥补。
首先是多义词的收录问题。《分类词典》以义项为分类单位,不同义项归入不同的语义类别。全书对5500余条词做了多义词条的处理,但还不足以全面反映现代汉语多义词的情况。如多义词“香”,就未收其“吃东西胃口好”的义项。对多义词义项进行增补,是《分类词典》下一步工作之一。
其次是一些常用词、常用义项以及现阶段稳定下来了的新词新义的增补。尽管《分类词典》在筛词时依托多个语料库,参考了多种词表,但漏收在所难免。如“温和”,《分类词典》收录了读作“wēnhé”音的两个义项:①(气候)不冷不热;②(性情、态度、言语等)不严厉,不粗暴,使人感到亲切。但漏收了读作“wēn·huo”音的“(物体)不冷不热”义。下一阶段,《分类词典》要对这部分义项进行增补。
再次是词条用法信息的标注。过去有些分类成果给词条标注了用法信息,如《同义词词林》给单音多义词做了语例标注,《现代汉语分类词典》(董大年版)标注了词性。在《分类词典》的研制过程中,标注过五级类的类名与词义关系,也对五级类内部进行语义排序而非现在的以字数、拼音为序。后来限于体例与篇幅,《分类词典》仅以分类词表的形式呈现,未附带任何其他信息。下一步将考虑对难词难义进行用例、用法信息的补注。
此外,《分类词典》出版后也收到了读者就相关词条调类、类名提取提出的一些意见。这些意见均已记录在案,留待日后酌情处理。
附注
[1]引自国家社科基金课题“基于国家语委‘通用语料库之上的汉语义频词库的开发”结项报告,2010:93.
参考文献
1.洪桂治.论《现代汉语分类词典》基础语义类的形成.云南师范大学学报,2012(1).
2.梅家驹等.编纂汉语类义词典的尝试——《同义词词林》简介.辞书研究,1983(1).
3.苏新春.《现代汉语语义分类词典》研制中若干问题的思考.中文信息学报,2008(5).
4.苏新春等.再论义类词典的分类原则与方法.世界汉语教学,2010(2).
5.苏新春等.国家社科基金课题“基于国家语委‘通用语料库之上的汉语义频词库的开发”结项报告,2010年2月.
6.苏新春.现代汉语分类词典.北京:商务印书馆,2013.
(华侨大学华文教育研究院厦门361021)
(厦门大学中文系厦门361005)
(责任编辑李潇潇)