王仁强
(四川外语学院,重庆 400031)
现代汉语词范畴认知研究
——以《现代汉语词典》(第5版)为例
王仁强
(四川外语学院,重庆 400031)
在现代汉语语法研究中,词与非词的区分是一大难点。从认知语言学、词典学、二语习得、语料库语言学等视角,基于“《现代汉语词典》(第5版)词类标注数据库”,对现代汉语词范畴进行深入调研。结果表明,该词典所认可的现代汉语词范畴具有明显的原型效应,因而编者容易准确判断现代汉语词范畴的典型成员,而对其非典型成员则难以做出准确判断。现代汉语中词与非词的区分要以词的恰当定义为理论基础,以基于大型平衡现代汉语语料库的用法调查为操作依据,以方便学习者用户(尤其是对外汉语学习者用户)的语言产出为终极目的。
现代汉语;词范畴;原型效应;《现代汉语词典》(第5版);实证研究
在现代汉语语法研究中,区分词与非词、判断词类是两个老大难问题。区分词与非词和标注词类曾是《现代汉语词典》(试印本,1960)主编吕叔湘先生在该词典“前言”中指出的两大缺憾。现代汉语中词这一级语法单位的存在是词类标注的前提,因为现代汉语词典标注词类的首要原则就是,要在区分词与非词的基础上给词标注词类(钟梫,1980;郭锐,1999,2002;孙德金,2004;符淮青,2004,2006;莫彭玲,2004;王仁强,2006;徐枢、谭景春,2006)。
世界上第一部正式刊行的汉语语法《华语官话语法》(Arte de la Lengua Mandarina,1703)就明确区分了词与非词(其中词包括单音节词和复合词),同时把汉语的词从语法上划分为八大类别。而中国人自己编写的第一部系统的汉语语法著作《马氏文通》(1898)虽然讨论的是字类,但鉴于《马氏文通》探讨的是古汉语,而古汉语中的字多半是词,因而他讨论的实际上是古汉语的词类。而国人真正开始关注汉语中的词是在20世纪初期。1907年章士钊在《中等国文典》中严格区分了书写单位字和句法单位词,并在第1页中指出“一字可为一词,而一词不必为一字”。自从黎锦熙1924年在《新著国语文法》中有意用汉语的词对等表示英语的word以后,字和词这两个术语在汉语中便逐渐分工,并得到包括王力(1943)、吕叔湘和朱德熙(1951)、陆志韦(1957)、赵元任(1968)、吕叔湘(1979)、朱德熙(1982,1985)、邢福义(1981/2003)、符淮青(1985)、胡明扬(1996)、周荐(2005)、郭锐(2002)、陆俭明(2003)、王立(2003)、曹炜(2004)、彭泽润(2007)等在内的绝大多数学者的认可。在有关汉语语法词汇的探讨中,更是时刻离不开词这个术语。国家技术监督局1996年1月22日批准发布、1996年7月1日开始实施并得到《中华人民共和国国家通用语言文字法》(2001年1月1日起施行)法定认可的《汉语拼音正词法基本规则》要求,“拼写普通话基本上以词为书写单位”,从而站在国家法律的高度肯定汉语中词的存在。
然而,正如Halliday和Yallop(2007:1-5)所正确指出的那样,“什么是词?”这个看似简单的问题,要准确回答却并非易事,不仅汉语如此,英语、日语、泰语、阿拉伯语、印地语等也如此。关于汉语中是否存在词这个在20世纪基本解决的问题,近20年来却成为了一个颇具争议的问题。比如,徐通锵从1991年开始发表了10余篇论文和2部著作,提出了“字本位”的观点,否认汉语的基本单位是词,认为汉语的基本单位是字。该理论的提出引起了国内外语言学界、对外汉语教学界、外语教学界的关注,支持者和怀疑者都不乏其人,赞扬声和批评声不绝于耳。皮之不存,毛将焉附?倘若汉语中真的不存在词这样的语法单位,那自然也就不存在语法上的词类问题了,因为从语法上讲,一个语言单位是词就意味着它必定属于某个词类(Halliday&Yallop,2007:4)。
值得庆幸的是,吕叔湘先生当年在《现汉》(试印本)“前言”中提出的在区分词与非词的基础上标注词类这个伟大构想,终于在2005年出版的《现汉》(第5版)中得以实现,这无疑在《现汉》编纂历史上具有重要的里程碑意义,在现代汉语规范化历程中也同样具有重要意义①《现汉》就是根据周恩来总理1956年2月6日亲自签发的《国务院关于推广普通话的指示》,由当时的中国科学院语言研究所负责编写的一部“以确定词汇规范为目的的中型的现代汉语词典”。。那么,《现汉》(第5版)编纂者在对所收条目进行词类标注时,判断词与非词的标准是什么?该词典通过词类标注所展现的现代汉语的词范畴又呈现出什么样的属性特征?为此,文章拟从认知语言学、词典学、二语习得、语料库语言学等视角,对《现汉》(第5版)的词类标注对象进行深入调研,以期能够深化学界对现代汉语词范畴的认识,同时对现代汉语词典如何进一步完善这项工作提出建议。
为实现上述研究目标,我们首先将《现汉》(第5版)中的每一个条目的词类标注情况都录入电脑,建立了“《现汉》(第5版)词类标注数据库”。
需要说明的是,在数据库建设中,对于少量词类标注不明确、涉及参见项的条目,则按照词典“凡例”的解释以及我们对词典中参见项的理解补足其词类标注信息;同时,根据“凡例”有关“单字条目在现代汉语中成词的标注词类,不成词的语素和非语素字不做任何标注……多字条目除词组、成语、熟语等不作任何标注外,一律标注词类”的说明,没有标注词类的条目及其义项被视为非词语法单位,即没有标注词类信息的单字条目(及少量双字条目)或其义项在现代汉语中就被视为语法上的不成词语素,而没有标注词类信息的多字条目被视为语法上的词组②为了统计方便,数据库中的“语素”涵盖该词典中的部分非语素字条目,“词组”则涵盖该词典中的词组、成语和熟语等多字条目。鉴于本项研究的重心在词而不在语素和词组,因而这种处理不会对研究结果产生实质性影响。。
鉴于《现汉》(第5版)并未对其收录的全部条目标注词类,本文把完全标注了词类的条目称为“I类条目”,把部分义项标注了词类的条目称为“II类条目”,把完全未标注词类的条目称为“III类条目”。
《现汉》(第5版)编纂者在区分词与非词的基础上对所收条目中现代汉语的词标注了词类。如表1所示,在整部词典65815个条目中,“I类条目”占78.20%,“II类条目”占3.47%,“III类条目”占18.33%。
表1 《现汉》(第5版)词类标注对象统计总表
那么,这三类条目的内部构成又如何呢?如表2所示,“I类条目”中,比例最高的是双字条目(占82.91%),其次是三字条目(占10.54%)和单字条目(占 5.84%),四字及其以上条目的比例仅占0.71%;“II类条目”中,比例最高的是单字条目(占99.91%),双字条目仅占0.09%,没有三字及其以上的条目;“III类条目”中,比例最高的是单字条目(占46.10%),其次是四字条目(占 44.59%)和三字条目(占4.80%),双字条目最少(占0.05%)。
表2 《现汉》(第5版)三类条目内部构成统计表
表3 《现汉》(第5版)条目字数与条目类型关联统计表
从三类条目的内部构成看,条目的字数似与条目类型(即成词是否)具有密切的关联,而进一步的统计分析无疑清楚地证实了这一点。如表3所示,单字条目的类型归属相对复杂,主要属于“III类条目”(占51.29%),其次属于“I类条目”(占27.71%)和“II类条目”(占 21.01%);双字条目几乎全部属于“I类条目”(占99.98%),其中只有2个属于“II类条目”,6个属于“III类条目”;三字条目主要属于“I类条目”(占90.35%),其次是“III类条目”(占9.65%);四字条目主要属于“III类条目”(占93.92%),其次是“I类条目”(占6.08%);四字以上条目情况类似四字条目,主要属于“III类条目”(占 96.94%),其次是“I类条目”(占3.06%)。
那么,《现汉》(第5版)收录的各级各类语法单位的情况又如何呢?
如表4所示,该词典共收录71932个语法单位①语法单位通常指语素、词、词组等。为便于讨论,本文还对属于词的语法单位进行了细分,因而词典中的一个兼类条目就至少包含两个语法词,而“II类条目”就至少兼属语素和词。因此,文中对语法单位项目数量的统计指的不是语法单位层级的数量,而是指属于各级各类语法单位(即语素、词和词组,其中词细分为各种词类)的数量。项目。其中,成词语法单位项目57579个,占词典语法单位项目总数的80.06%;非词语法单位项目14353个,占词典语法单位项目总数的19.94%。在非词语法单位项目中,语素和词组大致各占一半。
《现汉》(第5版)共收录3479个兼类条目,仅占条目总数的5.29%,绝大部分条目(占条目总数的94.71%)属于单一词类。详见表5。
表4 《现汉》(第5版)中各类语法单位的数量及比例统计表
表5 《现汉》(第5版)条目兼类总体情况统计表
顾名思义,词类标注就是给词标注语法类别。但是,何为现代汉语的词,长期以来是一个众说纷纭、莫衷一是的老大难问题,以至于有的学者根本否定汉语存在词这一级语法单位。王立采用了社会学、社会心理学、心理语言学和社会语言学等学科的研究方法及工作程序,从语感的角度对汉语社团就词的感知进行了调查,结果发现:“汉语的词是自然语言中被语言社团普遍感知和使用的基本单位,是韵律、语义、句法诸因素交互作用的结合体,它始终处在语言系统中韵律、语义、句法诸层面的交汇点上,因而也是语言研究的基本分析单位。”(王立,2003:261)张姗姗等(2006)通过神经语言学试验,对汉语单音节单位的加工差异进行了考察。试验结果发现,相对于字和语素来说,词更应该是大脑词库中的基本语言单位;词在大脑中存在状态比较稳定,非自由语素可能以不稳定的后备信息概念存储或附着在大脑词库中。彭泽润(2007)指出,词是汉语语法的基本单位,音节是语音的基本单位,而字是文字的基本单位,因而那种否认词的存在的所谓“字本位”主张其实是在否认不同的体系应有不同的基本单位。马庆株在彭泽润专著《词和字研究——中国语言规划中的语言共性和汉语个性》的“序言”中明确指出,“词是汉语语法的基本单位之一,是造句基本的备用单位。它是客观存在的,不是从境外进口的。小孩学会了说话,就掌握了词……词的确定不像有的专家想像的那么成为问题。《现代汉语词典》等工具书的成功和《汉语拼音正词法基本规则》的出台,就是明确的证明。”2008年11月,由教育部语言信息管理司组织专家基于现代汉语语料库编制的《现代汉语常用词表》(草案)正式出版,也证明了汉语中作为造句备用单位的词的存在。
《现汉》(第5版)承认现代汉语中存在词,并努力坚持在区分词与非词的基础上给词标注词类。本项调查表明,该词典所认可的词范畴具有明显的原型效应:
(1)总体而言,该词典所收录的现代汉语的语素、词和词组构成一个连续体,词与非词并非泾渭分明:单字条目既包括所有义项都是词用法的“I类条目”(占27.71%),又包括所有义项都是不成词语素的“III类条目”(占51.29%),还包括部分义项是词用法、部分义项是不成词语素用法的“II类条目”(占21.01%);双字条目中也有6个不是词,而是不成词语素或词组(其中“巴巴”、“诺尔”和“兮兮”为不成词语素,“阿门”、“尔耳”和“南无”为词组),还有2个(即“大军”和“归真”)兼属词和词组;三字条目也有10%左右不是词,而是词组;四字及以上条目中少数是词,多数是词组。实际上,这种共时平面上兼属两个语法级阶的新旧形式和用法共存的情况源于语言的渐变性质(Aitchison,2001:112-119)。
(2)现代汉语中最典型的词是双字词,其次是三字词,而单字词和四字及其以上的词为词范畴的非典型成员。双字条目不仅自身成词比例高(99.98%成词),而且在整部词典成词条目总数中所占比例也高(占82.91%)。三字条目中的成词条目尽管在整部词典成词条目总数中所占的比例不高(占10.54%),但自身成词比例高(90.35%成词)。相比之下,单字条目自身完全成词的比例仅为27.71%%,且在整部词典中成词条目总数中所占比例仅为5.84%,而四字及其以上条目成词比例就更低了。整体而言,如图1所示,该词典的成词情况大致呈现出以双字条目为波峰的正态分布。
图1 各类条目成词情况示意图
(3)一个条目可以包含两个以上的语法词或语法单位项目。一方面,单字条目中包括部分义项是词、部分义项是语素的II类条目(共有2278个),另一方面部分I类条目和II类条目兼属两种以上词类(共有3479个)。
既然《现汉》(第5版)中所认可的词是一个具有显著原型效应的范畴,那么这个调查结果是否符合语言学上词的定义?词典中区分词与非词的根本目的是什么?判断词与非词的操作依据又是什么呢?下面逐一回答。
《现汉》(第5版)把“词”定义为“语言里最小的、可以自由运用的单位。”这个关于词的定义源于美国结构主义语言学家Bloomfield(1933),它也是国内外学界引用最广的定义,但这也是一个难以贯彻始终的定义。正如吕叔湘(1979:17)所正确指出的,“词的定义很难下,一般说它是‘最小的自由活动的语言片段’,这仍然不十分明确,因为什么算是‘自由活动’还有待于说明。”其实,不仅汉语如此,英语亦如此,因为英语中也并非所有类似词的单位都符合这条标准。比如,英语冠词a和the并不能独立自由地运用,但通常都被视为词。有鉴于此,语言学家甚至提出了识别词的五类标准(Crystal,1995:91),因为任何单一标准都无法贯彻始终。但是,多标准又存在一个主与辅的问题。尽管如此,有证据表明,词是操本族语者凭直觉普遍承认的一个表达单位(Richards et al,1992;Crystal,2003;王立,2003)。在综合各家观点,结合现代汉语词的具体特点,兼顾专家和普通群众对词的认知结果(即“词感”)之后,曹炜(2004:3)认为,关于词的较好定义应该是:“词是最小的有相对固定的语音形式和适度词长的能独立运用的语言单位。”实际上,在认知语言学原型范畴理论的影响下,语言学家现在意识到,词这个最基础也是最具争议的语言学范畴实际上和世界上大多数范畴一样,并非离散的经典范畴,而是有核心词和边缘词之分的原型范畴(Taylor,2003:203-208)。在一定程度上,正是由于词范畴所具有的这种原型效应,导致学界长期以来难以按照“对内具有一致性、对外具有排他性”的经典范畴观对现代汉语的词与非词进行有效的区分。而且,国际语言学界有关现代汉语词的认识还主要限于赵元任(1968)(参见Dixon& Aikhenvald,2002:32)。目前国内语言学界普遍认同双音节词在现代汉语中是典型的词(吕叔湘,1963;胡裕树,1981;朱德熙,1988;冯胜利,2001;周荐,2005;陆俭明,2003;王立,2003;李宇明和李晋霞,2007)。其实,本项调查所发现的现代汉语词范畴所体现的原型特征在上述有关词的定义中就已经有所体现,比如“自由运用”、“相对固定”和“适度词长”“能独立运用”中着重号所显示的词语都是相对概念。此外,本项调查的发现与2008年11月由教育部语言信息管理司组织研制的《现代汉语常用词表》(草案)所显示的情况大致吻合①尽管《现代汉语常用词表》(草案)与《现汉》(第5版)的收词原则略有不同,最终比例也略有不同,但无疑都显示出现代汉语的词范畴具有明显的原型效应。。详见表6:
表6 《现代汉语常用词表》(2008)分类统计表
不过,在有关词范畴的探讨中,还要特别注意区分语法上的词和词位。鉴于词(word)具有的多义性和模糊性,Crystal(2003)、Jackson&Amvela(2007)等在探讨词的问题时,采用“lexeme”(即“词位”或“词项”)这个术语作为替代,并指出词位相当于词典中的“headword”或者“lemma”(即“词目”)。这样的话,英语中有多种形态变化的词在词典中就可只收录其原形,即词位。诚然,不论是英语词典还是汉语词典,其收录的条目既有语法上的词,也有语法上的粘着语素(词缀)和词组,但主要还是属于语法上的词,即典型的条目依然是词。这似乎意味着用词位来区别于词这个术语对于汉语而言意义不大。我们认为,这种做法其实还是具有两大好处的:(1)词典中的一个条目可以不仅限于一种语法类别,即一个条目可以包含一个以上的语法词;(2)词典中的一个条目可以不仅限于一个语法级阶,即一个条目可以涉及语素、词和词组等三级中的一级以上。第一大好处可以有效解释部分条目兼属多种词类的兼类问题。这是因为词典中的词是语言层面的词,是词位,因而具有表达一个以上意义(其中包括词汇多义性和功能多义性,后者的固化用法即为语法上的兼类)的潜势。统计表明,The A-merican Heritage Dictionary of the English Language(1994)中共有18500条兼类词,约占该词典词条总数的12%(Coughlin,1996)。而第二大好处可以有效解释“II类条目”中兼属不成词语素和词的单字条目。此外,我们认为,既然“II类条目”中的部分单字条目可以兼属不成词语素和词,所谓的“理发”、“上当”、“吃亏”之类的典型离合词在词典中也不妨处理为词和词组两个级阶(如果考虑注音方式的差异,不妨处理为两个同形条目),这种分而置之的做法或许更有利于学习者用户(尤其是对外汉语学习者用户)的语言产出,同时也可以保证同一部词典中的类似现象得到一致的处理。
词典中区分词和非词属于语法上的区分,其中词是基本的语法单位(因而属于基本层次范畴),语素是一种构词单位,词组是比词高一级的语法单位。从语素本身的构词能力看,可以分为自由语素、粘着语素和半自由语素,其中自由语素和半自由语素是成词语素。词典中有的单字条目在某些义项上可以独立成词,但在另一些义项上其自由度已经降低,只能与别的语素组合成词,“II类条目”中的单字条目就属于这种类型,词典中可以分而置之,即属于现代汉语词范畴的标注词类,而不属于现代汉语词范畴的则标注(不成词)语素或不标。词和词组的结构关系非常类似,但词内部语素和语素之间是凝固的,不能分开和随意替换,而词组内部的词和词之间是可以分离和自由替换的。诚然,语素、词和词组并非绝对的离散范畴,而是原型范畴,但这并不意味着区分词与非词是毫无意义的。这是因为,虽然本族人可以轻而易举地习得母语,但是本族人对自身母语的语感(包括“词感”)是隐性的,不自觉的,而根据Schmidt(1990)所提出的关注假设(Noticing Hypothesis),二语习得需要更多的显性语法知识。这种显性语法知识的学习主要通过教材和词典,其中词典是外语学习者自主学习最重要的工具。对外语学习者而言,词典必须提供显性语法知识,其中有关语法单位(如语素、词、词组等)和语法类别(如词类)的知识是必不可少的。在语法单位的知识当中,有关词与非词的显性区分对于外语学习者遣词造句至关重要。因此,汉语词典中词与非词的区分一定要以方便汉语学习者用户(尤其是对外汉语学习者用户)的语言生成为宗旨。
现代汉语的词在使用中存在历史层次和领域层次的分野,其中历史层次可以区分现代白话层次和文言层次,领域层次可以区分日常语言层次和专业语言(包括科技语言)层次(郭锐,2002:45-48)。本项调查表明,单字条目的情况尤为复杂。单字条目中词与非词之所以难以区分,正是因为现代汉语的词在使用中存在历史层次和领域层次的分野:现代汉语中不成词语素条目/义项在文言层次可能成词,但在现代白话层次则不成词,鉴于《现汉》(第5版)在词类标注中关注的是一个条目(或其义项)在现代汉语是否成词,从而出现“II类条目”中有的单字条目部分义项属于词而部分义项属于不成词语素的情况;“金”、“叶”在有关学科领域可以单用(即成词),但在日常语言层次不可以单用(即不成词),鉴于《现汉》(第5版)兼顾日常语言层次和领域层次,从而也出现部分义项属于词而部分义项属于不成词语素的跨越语法级阶的情况。其实,不仅单字条目在使用中存在历史层次和领域层次的分野,双字条目同样如此。正如Givón(1971:413)所言,“今天的词法是昨天的句法。”所谓“理发”、“上当”、“吃亏”之类的离合词之所以兼有词和短语的双重特征,正是因为汉语词组向词演变过程(即词汇化过程)中的两个级阶共存的状态。张斌(2008:160)指出,“对于词和短语的界线以及语素的自由和粘着的界线,既要看到区别之所在,也要承认模糊的一面。其模糊性包括三个方面:①时间:古代—现在;②语体:书面—口头;③用途:特殊—一般。”但是,如果没有大型平衡的现代汉语语料库作为支撑,要准确做出上述判断并非易事。比如,《现汉》(第5版)在单字条目的词与不成词语素的处理上就存在一定不足(符淮青,2006:43),在所谓离合词所涉及的词与词组的区分上也存在一定瑕疵(李慧,2008:114-117)。因此,在判断现代汉语中个体语法单位是否是词的时候,尽管研究者的直觉很重要(研究者直觉可以较为准确地判断一个范畴的典型成员,但不容易准确判断非典型成员),但是基于大型平衡现代汉语语料库的用法调查显得更为重要,因为平衡语料库所揭示的使用模式比研究者个人能够更加准确地反映一个语言社团的语感(Hunston,2002:20)。
总之,现代汉语中区分词与非词既是一个具有重要学术价值的问题,同时也是一个具有重要应用价值的问题。
综上所述,《现汉》(第5版)在区分词与非词的基础上对所收条目中现代汉语的词进行了词类标注,这在《现汉》编纂历史上具有重要的里程碑意义,在现代汉语规范化历程中也同样具有重要意义。本项基于“《现汉》(第5版)词类标注数据库”的调研表明,该词典所认可的现代汉语词范畴具有显著的原型效应。正是由于现代汉语的词范畴具有明显的原型效应,词典编者容易准确判断词范畴的典型成员,而对其非典型成员则容易出现判断失误。《现汉》(第5版)在词与非词的区分上与汉民族的词感大致吻合,与现有汉语语法本体研究的成果基本一致。总之,现代汉语中词与非词的区分要以词的基本定义为理论基础,以基于大型平衡现代汉语语料库的用法调查为操作依据,以方便学习者用户(尤其是把汉语作为第二语言的学习者用户)的语言产出为终极目的。
致谢:四川外语学院张晶、张理志、祝清、郭亮等研究生参与了“《现汉》(第5版)词类标注数据库”的建设工作,特此致谢。
[1]Aitchison,J.Language Change:Progress or Decay?(3rded.)[M]. Cambridge: Cambridge University Press,2001.
[2]Coughlin,D.A.Deriving Part of Speech Probabilities From a Machine-readable Dictionary[C]//Proceedings of the Second International Conference on New Methods in Natural Processing.Ankara,Turkey,1996.
[3]Crystal,D.The Cambridge Encyclopedia of the English Language[M].Cambridge:Cambridge University Press,1995.
[4]Crystal,D.A Dictionary of Linguistics and Phonetics(5thed.)[M].Oxford:Blackwell Publishing,2003.
[5]Dixon,R.M.W.& A.Y.Aikhenvald(Eds.).Word:A Cross-linguistic Typology[M].Cambridge:Cambridge University Press,2002.
[6]Givón,T.Historical Syntax and Synchronic Morphology:an Archaeologist’s Field Trip[J].Chicago Linguistic Society,1971(7):349-415.
[7]Halliday,M.A.K & C.Yallop.Lexicology:A Short Introduction[M].London/New York:Continuum,2007.
[8]Hunston,S.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press,2002.
[9]Jackson,H.& E.Amvela.Words,Meaning and Vocabu-lary:An Introduction to Modern English Lexicology(2nded.)[M].New York:Continuum,2007.
[10]Richards,J.C.,et al.Longman Dictionary of Language Teaching and Applied Linguistics[M].London:Longman,1992.
[11]Schmidt,R.The Role of Consciousness in Second Language Learning[J].Applied Linguistics,1990(11):129-158.
[12]Taylor,J.R.Linguistic Categorization:Prototypes in Linguistic Theory(3rded.)[M].Oxford:Oxford University Press,2003.
[13]曹炜.现代汉语词汇研究[M].北京:北京大学出版社,2004.
[14]冯胜利.从韵律看汉语“词”“语”分流之大界[J].中国语文,2001(1):27-37.
[15]符淮青.现代汉语词汇[M].北京:北京大学出版社,1985.
[16]符淮青.对在现代汉语词典中标注词性的认识[J].语言文字应用,2004(2):41-43.
[17]符淮青.略谈《现代汉语词典》第5版标注词类的作用[J].辞书研究,2006(1):39 -43.
[18]郭锐.语文词典的词性标注问题[J].中国语文,1999(1):150-158.
[19]郭锐.现代汉语词类研究[M].北京:商务印书馆,2002.
[20]胡明扬.词类问题考察[M].北京:北京语言文化大学出版社,1996.
[21]胡裕树.现代汉语[M].上海:上海教育出版社,1981.
[22]李慧.《现代汉语词典》双音节词目拼音分写原则探析[J].辞书研究,2008(2):111 -117.
[23]李宇明,李晋霞.现代汉语词感制约因素的问卷报告[J].汉藏语学报,2007(1):48 -60.
[24]陆俭明.对外汉语教学是汉语本体研究的试金石[C]//张德鑫.对外汉语教学:回眸与思考.北京:外语教学与研究出版社,2000:21-23.
[25]陆俭明.现代汉语语法研究教程[M].北京:北京大学出版社,2003.
[26]陆俭明.有关词性标注的一点意见[J].语言文字应用,2004(2):39-41.
[27]陆志韦.汉语的构词法[M].北京:科学出版社,1957.
[28]吕叔湘.现代汉语单双音节问题初探[J].中国语文,1963(1):347-360.
[29]吕叔湘.汉语语法分析问题[M].北京:商务印书馆,1979.
[30]吕叔湘,朱德熙.语法修辞讲话[M].北京:中国青年出版社,1951.
[31]莫彭龄.词汇的“词”、语法的“词”和修辞的“词”[J].语言教学与研究,2004(6):71-76.
[32]潘文国.字本位与汉字研究[M].上海:华东师范大学出版社,2002.
[33]彭泽润.词和字研究——中国语言规划中的语言共性和汉语个性[M].北京:中国文史出版社,2007.
[34]孙德金.略谈词性标注的目的性问题[J].语言文字应用,2004(2):43-46.
[35]王力.中国现代语法[M].上海:商务印书馆,1943/1944.
[36]王立.汉语词的社会语言学研究[M].北京:商务印书馆,2003.
[37]王仁强.认知视角的汉英词典词类标注实证研究[M].上海:上海译文出版社,2006.
[38]王仁强.现代汉语词类体系效度研究——以《现代汉语词典(第5版)》词类体系为例[J].外语教学与研究,2010(5):380-386.
[39]《现代汉语常用词表》课题组.现代汉语常用词表(草案)[Z].北京:商务印书馆,2008.
[40]邢福义.词类辩难(修订本)[M].北京:商务印书馆,2003.
[41]徐枢,谭景春.关于《现代汉语词典(第5版)》词类标注的说明[J].中国语文,2006(1):74-86.
[42]徐通锵.基础语言学教程[M].北京:北京大学出版社,2001.
[43]张斌.新编现代汉语(第二版)[M].上海:复旦大学出版社,2008.
[44]张珊珊,赵仑,刘涛,顾介鑫,杨亦鸣.大脑中的基本语言单位——来自汉语单音节语言单位加工的ERPs证据[J].语言科学,2006(3):3-13.
[45]钟梫.汉语词典标注词性问题[J].辞书研究,1980(1):68-93.
[46]中国社会科学院语言研究所.《现代汉语词典》五十年[M].北京:商务印书馆,2005.
[47]周荐.汉语词汇结构论[M].上海:上海辞书出版社,2005.
[48]周之上.汉语离合词研究——汉语语素、词、短语的特殊性[M].上海:上海外语教育出版社,2006.
[49]朱德熙.语法讲义[M].北京:商务印书馆,1982.
[50]朱德熙.语法答问[M].北京:商务印书馆,1985.
[51]朱德熙.“汉语”[C]//中国大百科全书·语言文字卷.北京:中国大百科全书出版社,1988.
责任编校:蒋勇军
A Cognitive Study of Wordwood in Modern Chinese Based on The Contemporary Chinese Dictionary(5thedition)
WANG Ren-qiang
The distinction between words and non-words is a hard nut to crack in modern Chinese grammar studies.This paper made an in-depth survey of the category of modern Chinese words as recognized in the 5th edition of The Contemporary Chinese Dictionary(CCD5 for short)based on the Database of the POS Labeling Information in CCD5 from the perspectives of Cognitive Linguistics,lexicography,second language acquisition,and corpus linguistics.It is found that wordhood in modern Chinese as recognized in CCD5 shows prototype effects,and that the compilers of the dictionary judged the prototypical members of modern Chinese words with more accuracy,but had difficulties in judging the non-prototypical ones.It is argued that judgment of wordhood in modern Chinese should be based theoretically on the proper definition of word,and operationally on the usage survey in a balanced large-scale modern Chinese corpus,with the ultimate purpose of meeting the encoding needs of the learners of Chinese(especially learners of Chinese as a second language).
modern Chinese;wordhood;prototype effects;The Contemporary Chinese Dictionary(5thedition);empirical study
H061
A
1674-6414(2011)01-0071-07
2010-07-26
国家社科基金(批准号:08XYY009)和重庆市首批高等学校优秀人才支持计划资助
王仁强,男,重庆人,四川外语学院教授,博士,主要从事词典学、认知语言学和对比语言学研究。