苏向丽,宋春淑
(1. 北京语言大学 对外汉语研究中心,北京 100083;2. 北京交通运输职业学院 普通课教研室,北京 102618)
语言学研究
现代汉语基本词汇的组合能力及其分布特征
苏向丽1,宋春淑2
(1. 北京语言大学 对外汉语研究中心,北京 100083;2. 北京交通运输职业学院 普通课教研室,北京 102618)
以374个单音词为样本词,通过对现代汉语基本词汇组合能力的量化分析,考察了基本词汇的能产性。研究显示,基本词汇样本词中93%的词具有组合能力,各词类的组合能力分布不平衡,排序依次为:名词>数词>形容词>动词>副词>介词>代词,功能词中的连词、助词、叹词和语气助词没有组合能力。此外,样本词中每个词及其义位的组合能力也都有很大差异。“能产性”对基本词汇的部分成员而言是典型特征,对部分成员而言是非典型特征。
基本词汇;能产性;组合能力;分布特征
(一)基本词汇
在语言系统的各子系统中,词汇系统是一个开放的系统,处于不断变化中,但有变量也有常量。总词数是变量,基本词汇是常量。国内外在词汇研究上都很重视基本词汇的研究,但关于基本词汇性质却一直争论至今。国内对“基本词汇”的基本理解,可以用《现代汉语词典》中的定义作为代表:“词汇中最主要的一部分,生存最久、通行最广、构成新词和词组的能力最强,如‘人、手、上、下、来、去’等。”[1]多数人对基本词汇的理解是具有稳固性、全民性(含常用性)、能产性,这是有关基本词汇性质50年来经典的“三性说”。
(二)组合能力
基本词汇的属性之一是具有生成新词的能力,在经典“三性说”中称之为能产性,有很多学者认为能产性是基本词汇最主要的属性,如符淮清[2]、苏新春[3]都认为有无构词能力是判断一个词是否是基本词的先决条件和重要标准。在词汇语义学中基本词汇的能产性可通过词的组合能
力来观察。一个词的组合能力包括:①构词能力(构成复合词的能力);②构语能力(主要是构成固定短语、准固定短语的能力)。
然而是否所有的基本词都具有能产性,或者说这一集合中每个成员是否都具有组合能力?集合成员的组合能力有无差异?这些差异反映了哪些规律特征?对此,本文将通过量化的方式对基本词汇的组合能力进行具体的考察,并进一步分析基本词汇组合能力的分布特征。
基本词汇是词汇的核心,也是各项语言研究的基础,但对于基本词汇的范围、数量到底是多少还多有争议,没有特别权威的词表集。本文以国内权威的汉语词频词表、教学词表作为提取基本词汇样本集的基础,先取《现代汉语频率词典》[4]、《汉语常用词基本草案》[5]、《汉语水平词汇与汉字等级大纲》(简称《大纲》)[6]中的交集,再从中提取《大纲》甲级词中的单音词,最终确定374个单音词作为基本词汇样本词的基础。再以《现代汉语词典》(第6版)的词性标注为标准确定这些样本词的词类归属,这些样本词的词类分布如表1所示。
表1 374个单音词词类分布
(一)基本词汇组合能力考察的依据
词的组合能力可以用组合力表示,组合力可以根据每个词各义位组合成词语的数量计算出来。然而,一种语言中,以每个义位为核心的组合义场通常有十几万乃至几十万,如何计算每个词的组合能力,需要借助反映这种组合关系的权威的搭配词典。梅家驹[7]主编的《现代汉语搭配词典》(简称《搭配词典》)较为详细地给出了常用词各义位的构词、构语的常用组合信息,可以反映现代汉语常用词的基本组合现状。本文以此为封闭域作为测定基本词汇组合能力的量化基础。
(二)基本词汇组合能力的总体分布特征
基于《搭配词典》对基本词汇样本集中的每一个词的构词能力和构语能力进行了统计,得出每个词的构词力、构语力,并计算出综合组合力。根据统计,374个词中,30个词没有构词能力,占8%;36个词没有构语能力,占10%;组合力为0的有26个(取交集),占7%。可以说,374个样本词在《搭配词典》中所体现出的具有组合能力的词占93%。根据统计,计算出各词类的平均构词力、平均构语力以及平均组合力,如表2所示。
表2 基本词汇(样本集)中各词类组合能力的分布
可以看出,基本词汇样本集各词类的组合能力的分布呈现出如下不平衡特征:
1.实词的组合能力远高于功能词的组合能力
每一类实词都具有组合能力,功能词中只有副词和介词有组合能力,连词、助词、叹词和语气助词这四类功能词没有组合能力,组合力都是0。
2.各词类构词能力和构语能力不一致
从平均构词看,名词构词力最强,平均组合力是85.69,其余词类依次是:形55.42>动41.91>数32.79>介26.93>副19.19>代3.25;从平均构语看,数词构语力最强,平均构语力是70.05,其余依次是:名45.60>副37.19>形32.32>动32.06>介19.64>代9.75。构词能力与构语能力的词类分布的不一致性如图1所示。
图1 基本词汇各词类平均构词力与构语力分布图
从数据和示意图中可以直观地发现,基本词汇(样本集)平均构词线与构语线有较大差异。构词线反映了开放词类的构词能力总体强于封闭词类(数、介、副、代),特别是实词中三大词类(名、动、形)构词能力明显。构语线则反映出部分封闭词类中的构语能力也很高,如数词、副词总体构语能力都很高,主要表现为数词的“一”和副词的“不”,这两个词的构语能力很强,提升了整个封闭词类的构语能力。但综合看,平均组合能力最高的还是名词,
组合力高达131.28,其余依次是:数词102.84>形容词87.74>动词73.97>副词56.38>介词46.57>代词13。
(三)基本词汇中不同词类组合能力的等级分布特征
为进一步深入了解基本词汇的组合能力的差异,我们在词类组合分布分析的基础上对具有组合能力的7个词类,依据组合能力的强弱划分为五个梯度等级,从中可以发现不同词类在组合强度差异中体现出的规律和特点。梯度等级分布如表3所示。
表3 基本词汇(样本集)组合能力等级分布
从表3可以看出基本词汇(样本集)组合能力的强弱呈现如下特征:
1.总体看,组合能力超强和超弱的词极少,多数词语组合能力较弱。超弱的词和超强的词共占4%,68%的词的组合力集中在1~100之间,28%的词的组合力在101~300之间。
2.开放词类中名词组合能力最强。开放词类中,样本集中所有名词都有组合能力,且组合力均在20以上,其中有6个名词组合能力超强。组合力在300以上的分别是:“人、心、水、地、风、天”。数据说明,名词的组合能力是各词类中最强的。动词组合力主要在中低区,只有1个动词“打”的组合能力超强,而动词“得(děi)”没有组合能力,“喝”可以构语,但不能构词,动词总体组合能力较弱。形容词中有1个词“大”组合能力超强,虽然基本词汇中形容词明显少于动词、名词,但形容词总体具有较稳定的组合能力。
3.封闭词类中仅个别词语组合能力强。其中,数词、代词、副词、介词组合能力多数较弱,仅有一两个词组合能力强。这进一步说明封闭类词总体组合能力较弱,其中的功能词则更弱。在构词力和构语力考察中,样本集中名词的构词力最强,组合力也最强,但是构语力弱于数词,因为数词“一、十、百、千、万、三”等词构成的成语很多,提高了数词的组合能力。
(四)基本词汇中不同词语组合能力的分布特征
从上文对基本词汇组合能力的分布看,各个词类具有不平衡性。相对而言,具体每个词的组合能力之间的差异也是巨大的。以组合力位居前20位的词为例,分析这些组合能力较强的词的构词能力和构语能力,如表4所示。
表4 组合能力位居前20位的词
由表4可以看出,组合能力比较强的词中45%是名词,动词占30%,二者占主流。名词中组合能力最高的是“人”,但是构词能力最强的是“水”。作为意识的主体,人类对自身的关注远远多于对其他事物,与“人”相关的各种信息概念反映在词汇语义系统中,使“人”不仅成为汉语中聚合能力最强的词,而且还成为组合能力最强的词,二者具有正相关性。“水”在人们日常生活中具有不可或缺性,具有极高的使用价值。这种价值反映在词语中形成了“水”超强的组合能力,特别是超强的构词能力。之所以“人”的构词能力相对弱于水,是因为可以替代“人”的词语还有很多,如“者、员、民、匠、家、夫”等等这些语素都可以分解“人”的构词能力。总体衡量“人”的组合能力还是强于“水”。动词中组合力最强的是“打”,“打”是汉语中词位最丰富的一个词,多义性最强,《现代汉语词典》(第6版)中给出24个义位(不含介词),“打”构语能力很强。形容词中组合价最高的是“大”,它的构词能力与构语能力都是形容词中最强的。
组合能力位居前三的是数词“一”“千”、副词“不”。前面谈到这几个词的组合能力强,并以此提升了整个词类
的组合力,但是它们的构词能力与构语能力严重不平衡,构语能力远强于构词能力,其余词类差异没有这么大。这三个词的构语能力主要体现在构成成语的能力,其中有一些是具有半开放性的组合,形成了较为稳定的成语格式。如:“一”的半开放组合格式有:一无……,一无所……,以一……,百无一……,千金一……,一言……,一……半……,一……二……,一……两……,一……三……,一……百……,一……千……,一……如……;“不”的半开放格式有:不……不……,半……不……,百……不……,一……不……,不……而……,……而不……,不……之……,不无……,不成……,不容……,不知……,不足……,……不绝,……不平;“千”的半开放格式有:千古……,千里……,千金……,……千古,……万千,千……一……,千……百……,千……万……等等。这种半自由的构语模式,即所谓的“语模”增加了这些词构语的弹性。
相对于组合能力较强的词语,没有组合能力的基本词汇主要集中在以下26个词中:副词“别4、才2、很、就2、没1、也”,助词“的1、地、得、等3、过、了1、着1”,语气助词“啊、吧、啦、吗、嘛、呢、呀”,叹词“哎、喂”,数词“俩”,代词“您”,介词“把”,动词“得1(děi)”。其中功能词占绝大多数,功能词中的连词、助词、叹词和语气助词有较强的句法功能,主要作为语法成分,具有典型的语法意义,但词汇意义较弱,没有组合能力;而副词中有近三分之一的词不具组合能力,基本词汇除这些词其余的词多多少少都具有一定组合能力。
(五)基本词汇中不同义位组合能力的分布特征
一个词的组合力是词位中每个义位组合能力的综合表现,一个词位的不同义位组合能力是不同的,有的强,有的弱。考察一个词的组合能力还应深入每个义位观察其组合能力,而不能只笼统地讲词的组合能力。以组合能力位居第5的“心”为例,如表5所示。
表5 “心”各义位的组合力分布
“心”的基本义位是①,常用义位是②,边缘义位是③。组合能力最强的是常用义位②,其构词与和构语能力差不多,且都具有开放性,还可以继续生成新的词语。基本义位与边缘义位的组合力差不多,且都是构词能力大于构语能力。从自由度上看,边缘义位不能单独使用,是粘着语素;基本义位和常用义位可单用可构词,是自由义位。
一个词的不同变体中,哪些组合能力强,哪些弱,不同的词表现不同。有的表现为基本义位的组合能力较强,边缘义位的组合能力较弱,有的则相反;也有的表现为常用义位的组合能力强,如“心”;还有的词有些义位自由度强,组合性弱,自由度弱,组合性强。因此考察一个基本词的组合力时有必要分清不同义位的组合能力。
通过对374个基本词组合能力的考察,我们发现样本集中7%的词没有组合能力,主要集中在功能词中的连词、助词、叹词和语气助词中。其余各词类组合能力的分布也不平衡,组合能力最强的是开放词类中的名词。样本集中每个词的组合能力差异很大,数词“一”的组合能力最高。此外,每个词各义位的组合能力也有差异,一般而言基本义位和常用义位组合能力较强,边缘义位组合能力较弱。对374个样本词组合能力的分析说明基本词汇多数具有生成能力。因此,关于基本词汇经典“三性说”中的能产性是大部分成员的属性特征,而不是全部成员的属性特征。另外,基本词汇成员的生成能力有强有弱,对有些成员而言这一属性是典型特征,对有些成员而言是非典型特征。
[1] 中国社会科学院语言研究所词典编辑室.现代汉语词典(第6版)[Z].北京:商务印书馆出版社,2012.
[2] 符淮清.现代汉语词汇[M].北京:北京大学出版社,1985: 155-161.
[3] 苏新春.如何划分汉语基本词汇[J].广州学院学报,1994 (4):67-70.
[4] 北京语言学院教学研究所编著.现代汉语频率词典[Z].北京:北京语言学院出版社,1986.
[5] 现代汉语常用词表课题组.汉语常用词表(草案)[Z].北京:商务印书馆,2008.
[6] 国家对外汉语教学领导小组办公室汉语水平考试部编.汉语水平词汇与汉字等级大纲[Z].北京:北京语言文化大学出版社,1992.
[7] 梅家驹.现代汉语搭配词典[Z].上海:汉语大词典出版社, 1999.
(责任编辑、校对:任翠香)
On the Combination Capacity and the Distribution of the Basic Vocabulary of Modern Chinese
SU Xiang-li1, SONG Chun-shu2
(1. Center for Studies of Chinese as a Second Language, Beijing Language and Culture University, Beijing 100083, China; 2. Department of General Courses, Beijing Vocational College of Transportation, Beijing 102618, China)
Based on 374 sample words, the productivity of basic vocabulary of Modern Chinese is investigated by a quantitative analysis of their combination capacity. It is suggested that 93% of the sample words possess combination capacity, which varies with the word’s parts of speech. In a descending order, they are ranged as noun, numeral, adjective, verb, adverb, preposition, and pronoun. It is also found that function words, like conjunction, particle, interjection and modal particle, have no combination capacity. In addition, the combination capacity and sememe of each sample word are of great differences. The productivity is a typical feature to part of the basic vocabulary, but not to the other.
basic vocabulary; productivity; combination capacity; distribution
H031
A
1009-9115(2014)04-0001-04
10.3969/j.issn.1009-9115.2014.04.001
教育部人文社科一般项目(11YJA740090)
2013-12-20
苏向丽(1975-),女,山东泰安人,博士,副教授,研究方向为词汇学、对外汉语教学。