汉语“词”的新定义及其与语素短语界限的探讨

2009-05-13 08:34杨瑞汉
现代语文 2009年11期
关键词:词儿

摘 要:本文对汉语词儿的一些定义进行了探讨,从语义上提出了新的观点,并根据这个定义以“和”插入法来分辨词和词素(语素)及词和短语的界限;这不但有利于解决词、语素、短语词之间的界限纠缠问题,而且还比现有的词儿鉴定方法更为方便。

关键词:词儿 “和”插入法 固定性 连结性 游离的语素 离词缀

一、词儿①定义的讨论

关于词儿在汉语中的定义,不但国内学者认为较难处理,而且一些国外学者也认为词儿的定义在汉语中还未达成共识,从而给中文信息处理带来了一定的困难。例如Fei Xia等(1999)在开发大规模给公众使用的100,000个汉字语料库时,在其文章Developing Guidelines and Ensuring Consistency for Chinese Text Annotation(《中文文本标注的发展指南和确保一贯性》)中就曾指出了四个原因:第一,中文没有分词连写;第二,汉字少有构词记号(如词形变化);第三,一些语言单位有时合在一起,有时又分开(如“离合词”之类);第四,一些语言单位有时是独立的,有时又是黏附性的。从语言学的角度来说,词儿的定义在汉语中可以从语音、语义、语法三方面来讨论。

Hockett(1959:116,167)的语音定义用在汉语里存在许多弊端。语音的停顿处不能用来判定半途稍停或拉长音调的成语或固定短语如“风平^浪静、心花^怒放、男男^女女”等为词儿,更无法判定不能停顿的句尾单位,如“吗、呢、啊”等为词儿。

语义上的定义曾引起过一些争议。例如,王力定义的“语言中最小的意义单位”中的“意义”概念,吕叔湘(2002a:346)就提出过置疑,他认为如果把词儿当作最简单的意义则与语素没有什么差别。朱德熙(1982:11页)也把词定义为“最小的能够独立活动的有意义的语言成分”。在这个定义下,合成词如“牛肉”可变成“牛”和“肉”两个词,因为它们都是最小的,能独立活动的有意义的成分。刘叔新(2005:30)把词儿定义为“完整定型的最小语言建筑材料单位”是对朱德熙先生定义的改善。不过,这个定义的症结在于:附属性的虚单位如“所、地、得、的、了、着、过、们(刘叔新,2005:226)、粒、个、张(刘叔新,2002:167)”等是如何被看成完整的虚词②的。一些游离的语素(见下文解释)也被看成完整的材料,如“他说的话太缪”的“缪”,“不速之客”的“客”。如果这些特殊情形下的省略部分可以当作完整的词儿看待,那么,“港澳同胞”的“港、澳”,“春秋两季”的“春、秋”,“中小学”的“中”也应该属于完整的词儿。那么成语如“亲朋戚友、千言万语、道听途说、兵荒马乱、东奔西跑”等又如何分解?

另一方面,从语法上定义词儿也面临着同样的难题。许多语言学家如张斌(2004:115)、兰宾汉等(2006:213)、邵敬敏(2001:113)、司徒允昌等(2006:56)把词儿看成最小的能独立运用的语言单位;Bloomfield,L(1933)认为词儿是语言的自由(独立)形式的语素;Di Sciullo,A.M.and Edwin Williams(1987)在On The Definition of Word(《词的定义》)第三章中说“词是句法的原子”,即词是句法中不可分割的最小的单位。以上这些语言学家都认为词儿是语法结构的单位而忽略了意义的主体。这个语法中的定义在汉语中很难解释许多具有完整一体意义的单位。例如“灯心草、白菜、牛肉、鸡蛋、黄山、海马、意识形态”等,它们都可分成或扩展成几个可以独立运用的词儿;“港、澳(同胞)”也是两个词儿;而“万籁俱寂、知己知彼、面黄肌瘦、升空、奔月”等因不可分离为几个独立单位而成为词儿。值得注意的是,“们、第、地、的、了、过”③都不能独立运用,但也被定义为虚词,因为这是根据余剩法,即把句子中所有的实词提出,剩下来的如果不是词儿的一部分,就是虚词(符淮青,2004:6)的标准来判定的 。这种方法和词儿在语法上的定义没有什么关系。许多单位如“他谦虚有礼地说”中的“地”如果不被认为是词儿,那该归于哪类?又如“三四个人”的“个”因为附属于短语,因此在语法上必须归于其中的一个词类。单用法把能够独立充当句子成分的单位定义为实词不一定对,而余剩法却加以引申使用:“所有能充当句子成分的余剩单位都是词儿”,这等于说它们都是能独立运用的,笔者认为这是不合逻辑的说法④。

事实上,以上所述的几个实质单位都是处于游离状态的,它们有时像语素,有时又像词儿。例如“春”在“春天”里是语素,在“四季如春”里又是词儿。又如“楼、会(议)、港、澳”等也有类似的情形,正如吕叔湘(2002b:357~361)、符淮青(2004:4)等所说的有时能单用,有时不能单用,及刘叔新(2005:30)所指出的有时完整,有时不完整的例子。这些游离的单位,无论是从语法还是从语义上来说都不能独立运用,因此不应归入词儿。如在“春天是四季的第一季”中,“春”不能单用,一般只单用于成语“四季如春、一年之计在于春”等特别场合里。使用特别场合的语言结构来认定“春”的词儿身份是很勉强的用法。在游离时它们应属于另一类语言单位:离语素。这包括游离的实语素(下称为“离词素”⑤)如“春、楼、港、澳、会”和虚语素(下称为离词缀)如“们、第、地、的、了”等等。

二、词儿的新定义

按照语言的自然产生规律来说,先有词儿,然后才形成语法结构。词儿的产生本来就是用来代表意义或功能的,本质上不是用来代表语法结构单位的。鉴于此,笔者认为最适当的词儿定义应从语义着手。以下词儿的新定义是笔者的建议:

词儿是语言⑥中代表完整一体固定的意义⑦或功能的单位。

“意义”是对实质的概念内容的统称,例如“牛”是代表以下各部分的概念内容:头上有角、体大、反刍、能耕田、拉车等的哺乳动物的统称。“完整”是指能单独代表整体而不是部分意义,不依赖其他单位。例如“平民”是代表整体意义的单位,被分开后的“平”和“民”都不能在语言中代表完整意义,都具有依附性。所谓“一体”是指融合成一个的意思。在单音成分里就是单独整体,与邻近成分在语义和功能上没有连结性(即不彼此依靠);在多音成分里指成分间彼此连结融成一个。例如“牛肉”所代表的是融成一体意义的一个词儿(如化学上的化合物),不是“牛”和“肉”两个个别意义分开的词儿(混合物)。“手表”所代表的是融成一体意义的一个词儿,不是“手”和“表”两个个别意义分开的词儿。“京九”(铁路)代表融合一体的单位,但不完整,须与“铁路”连结才是完整一体的词儿。

在词儿的定义中,“固定”是指稳定、不笼统、不隐含。在多音节片段(尤其是成语、熟语、歇后语)里比喻性的意义绝大多数是笼统的概念,都不固定。例如“造桥铺路”的比喻意义可以是建立公益事业、为后人的益处开路、立下有益的功绩等,但意义笼统不稳定,并且语义内部结构也长短不一,因此不能用来鉴定词儿的身份。我们的定义只考虑各个单位所代表的固定意义:如“造桥铺路”是否可以分为多个意义(指桥梁和道路)?如果可以分则是短语。因为词儿代表的是固定的意义。例如“风雨”如果指“风和雨”就是短语,而如果指“苦难”(引申的固定意义)则是词儿;“头痛”如果指“头和痛”便是短语;如果指“棘手”(引申的固定意义)就是词儿。总之,辨别词儿意义的完整性、一体性和固定性是这一新定义的重点。

以上所讨论的都是具有实质意义的单位(下称实单位)。功能单位是指可以组合或服务于实单位之间关系的非实(语法或虚)单位,例如改变一个或多个实单位的属性、属态(样式状态:时态、情态、语态等)、范围、程度、频度、语气、或影响或否定它的原有意义等等。例如“化”可以把名词性单位“人格”变为动词性单位“人格化”,这是改变属性的功能;“拿了”的“了”有改变动词性时态的功能;“拿到、看到、想到”的“到”有影响(深化)“拿、看、想”的原有意义的功能。这些单位的功能都不是“一体”的,单用时显不出其功能,需要附属于有意义的单位,正如所谓的助词“们、第、地、的、得、了、过、所”等,都属于虚语素的词缀或离词缀。“太好”的“太”有改变“好”的程度的功能,而它本身不附属于“好”,单用时仍然含有语法意义,功能完整一体而固定。

三、“和”插入法

最简单的辨认多音节语段一体性(词儿)或多体性(短语)的方法就是用“和”插入法来分析。即在语段中插入“和”然后提问它是否为多体性(指成分间彼此独立不连结):

“整体意义(实或虚)是否等于被‘和分隔后的个别单位专一的意义(实或虚)的混合?”

问题的关键在于“专一”和“混合”。“专一”表示意义或功能是专有、明确、同一性、不含糊、不附属的。“混合”表示可以分开,分开后在语义上各不连接。两个答案都肯定的是短语,其中有一个否定的就是词儿。有些语段不能分开,如联锦词“蚯蚓、蝴蝶、菲律宾”等;派生词“孩子、作者、老师”等;重叠词“欢欢喜喜、浩浩荡荡”等,因此答案是否定的。有些语段个别单位意义专一,但彼此融合,不能分开,如“口蹄症”不是“口”和“蹄”分别的病症;一些双音成分如“环保、打响、惨叫、暴升、平民”等的个别成分意义不能专一,彼此都融成一体,因此答案都是否定的;而“港澳、吃饱、省油、快走、想见”则可以分开为“港和澳、吃和饱、省(节省)和油(燃料)、快和走、想和见”两个明确不同的意义,各不融合一体,所以都是短语。

在超过两个音节的语段中,“和”的插入必须符合语音的停顿,如在“图书目录”中,“和”必须插入到“图书”与“目录”之间,变成“图书和目录”,而不是随便插入任何一个音节,如“图和书目和录”。以下例子在插入“和”之后整体意义都不等于个别分开的意义,所以都是一体意义的词儿:“万年春=万年和春|黄山市=黄山和市|中华人民共和国=中华和人民和共和国|意识形态=意识和形态。另外,有时还要看语境,如“吃饭”在“他吃饭还是吃粥?”中显然是指两个不同的意义,是短语,但如果指的是一般的进餐便是词儿。

附属性单位如“粒、个、次、张、点”等需要附属于其它数目单位(如“三点”),只能属于“语素”或“离语素”,不能归入词儿。不过重叠单位如“个个都叫好”中的“个个”是代表完整一体而固定的意义,可以算作词儿。

一些单位的组合也可以用“和”插入法来分辨。如“门外”“眼里”各有两个专一分开的意义:“门”和“外”及“眼”和“里”;“家里、海里、地上、来自”都是短语(短语可以包含离词素);“海边、海外、天上、人间、天空、在乎、在于、擅于”都是词儿,因为在实或虚的意义上两个单位都可连结一体,或有的分开后,意义不专一。

在动补VB(V为动词性,B为补语)的形式中,“和”插入法可以分辨词儿或短语,例如:“装满、玩够、猜对、用尽、打倒(东西)、打破(东西)、想通”等都可以被“和”分开,代表两个专一意义(也可用“就”如“装就满”),都是短语;而“看透、听起来、说明、恨死、打倒(贪官)、打破(传统)、高过、不见(“消失”的意思,非“不想见”)、无助”等两个意义连成一体,不能被“和”分开为两个(包括实虚)专一的意义,因此都是词儿。

四、实虚成分的分析

一些有实虚意义或有游离性的语段如“可赞扬、跑得快、所日夜盼望的”等等也可以用“和”插入法来分析。例如“高兴地”,其中“高兴”(修饰性质)连结“地”产生一个意义完整一体的新单位(状态性质);“中小学”中的“中”和“小学”各自代表不同意义的单位,没有连结性,所以是由离词素和词儿组成的短语;“跑得快”中的“得”虽然依附于“跑”,但不能与“跑”或“快”结合成一个完整一体的概念,所以被鉴定为离词缀,整体有两个实质和一个虚质意义,是短语。同样“想见”也是含有两个意义不融合的短语。“可赞扬”的“可”附属于“赞扬”;“所日夜盼望的”的“所”不附属于邻近成分“日夜”,它附属于代表超过一个意义以上的短语“日夜/盼望”,是游离的词素——离词缀(详情见拙作《一些游离元素的新探讨》,《现代语文·语言研究》,2009年第8期)。

五、结束语

从语义角度来定义语素、词儿和短语比较简单,语言中代表实质或语法的意义单位,如果是最小的,是语素;完整一体固定的,是词儿;多体性(成分间不连结)的就是短语;一体而不完整(有连结性,如“春、粒、港、澳”)的,是离词素;单用时完整(功能)而不一体(如“地、的、所”可以单用,但必须附属于短语)的,是离词缀。这种定义可以减少词儿与语素、词儿和短语的界限纠缠。“和”插入法是体现新定义分析语段的具体工具。它操作简单,只要认定“完整、连结一体、附属”的原则就行,比综合利用替代法、单用法、余剩法、扩展法、概念法等等来鉴定词儿更干脆利落。另一方面,这个定义可以适应语言信息处理工作的需要,因为中文信息处理用的是具有固定的语义和语法功能的基本单位(符淮青,2004:9)。

本文承导师蒋冀骋先生悉心指导,特此致谢。文稿中的诸多谬误概由笔者本人负责。

附 注:

①本文一律采用“词儿”来代表现代汉语语言单位的“词”,依据

周有光(《汉语拼音正词法问题》,《周有光语言学论文集》,商务印书馆,2004:215页)的建议。

②朱德熙(1982:12)也认为黏着形式的虚词也是词。

③崔应贤(2004:125)指出一些单位“们、了、着、过、的、地、

得、所”等在目前的语法教学里,多数语言学家都将它们当作虚词看,以胡裕树主编的《现代汉语》以及“系统提要”为代表。而张静在《新编现代汉语》中则把前边四个归入词缀,后边几个归入了连词(“所”字的归属没有明朗表示)。赵元任、王力认为它们都不是词儿,朱德熙(1982:30-31)则认为它们一部分是词儿,一部分不是词儿。吕叔湘(2002c:269-271)本身不能肯定这些是词缀还是助词。郭良夫(1999:16-23)把上例的大部分当作前缀或后缀,还包括“初、第”在内。董秀芳(2004:83,84,96)认为前四个是词缀,包括“第、得”在内;“的”是虚词。

④单用法鉴定词儿的方法:“能够单独运用或充当句子的成分的就

是词儿”不一定对,例如语素“春、楼、港、澳(同胞)”和一些缩略语、常用语、成语如:“四化、不要、知己知彼、如愿以偿”等也能单独充当句子的成分。余剩法和单用法就是这样假定能够单独充当句子成分的都是词儿。另一方面,与单用法有些不同的单说法:“在正常情形下,能够单说的是词儿(实词)”则没有产生什么明显的异议。不过反过来说也不一定正确。

⑤“词素”原本是指组成词儿的要素(不包括能单独成为词儿的语

素),但现在使用这一说法的已很少,一般都用“语素”(morpheme)来代表最小的音义结合体,是构词的要素。笔者在这里使用“词素”这个术语来代表“组成词儿实质意义(包括方位)的单音节要素”,而“离词素”就是指游离着的词素。它是属于离语素的一种。有关游离语素的进一步探讨详情,参见笔者文章《一些游离元素的新探讨》,《现代语文·语言研究》,2009年第8期。

⑥“语言”本身就是音义结合体,故在词儿的定义里不再重申“音

义结合体”。

⑦本文所指的意义都是实质上的意义。如无说明,就不是语法意

义。“功能”才是指语法意义或虚意义。本文没有使用“词汇”字眼来包括实质和功能意义,因为词汇(词的总汇)的意义是以“词”的意义为出发点的,恐怕会在意义上兜圈子。

参考文献:

[1]崔应贤.现代汉语语法学习与研究入门[M].北京:清华大学出版社,2004.

[2]符淮青.现代汉语词汇(增订本第2版)[M].北京:北京大学出版社,2004.

[3]董秀芳.汉语的词库与语法[M].北京:北京大学出版社,2004.

[4]郭良夫.词汇与词典[M].北京:商务印书馆,1999.

[5]兰宾汉,邢向东.现代汉语(上册)[M].北京:中华书局,2006.

[6]刘叔新.现代汉语理论教程[M].北京:高等教育出版社,2002.

[7]刘叔新.汉语描写词汇学(重排本第4版)[M].北京:商务印书馆,2005.

[8]吕叔湘.汉语里“词”的问题概述[A].汉语语法论文集·吕叔湘全集第二卷[C].沈阳:辽宁教育出版社,2002.

[9]吕叔湘.说“自由”和“黏着”[A].汉语语法论文集.吕叔湘全集第二卷[C].沈阳:辽宁教育出版社,2002.

[10]吕叔湘.助词说略[A].汉语语法论文集·吕叔湘全集第二卷[C].沈阳:辽宁教育出版社,2002.

[11]邵敬敏.现代汉语通论[M].上海:上海教育出版社,2001.

[12]司徒允昌,刘莉芳.新编现代汉语[M].上海:上海人民出版社,2006.

[13]张斌.简明现代汉语[M].上海:复旦大学出版社,2004.

[14]朱德熙.语法讲义[M].北京:商务印书馆,1982.

[15]Bloomfield,leonard.Language[M].Newyork:Hole And Company,1933.

[16]Chao,Yuan Ren.A Grammar of Spoken Chinese[M].California:University of California Press,1968.

[17]Fei Xia,Martha Palmer,Nianwen Xue,Mary Ellen Okurowski,John Kovarik,Fu-Dong Chiou,Shizhe Huang,Tony Kroch,Mitch Marcus.Developing Guidelines and Ensuring Consistency for Chinese Text Annotation[A].Philadelphia,PA:University of Pennsylvania; Newark,DE:University of Delaware,etc.,1999.

[18]Di Sciullo,Anna Maria,Edwin Williams.On The Definition of Word[M].Cambridge,Mass.:MIT Press,1987.

(杨瑞汉 马来西亚吉隆坡语文学院;湖南师范大学文学院 410081)

猜你喜欢
词儿
突然忘词儿
看见我,再爱我
某人破门而入
北京话(79)
驴子的苦恼
没词儿,怎么办?
无敌上上签
无敌上上签
汉语中一些游离元素的探讨
古今“您”字