中国语文辞书的分期问题

2017-02-27 03:40李仕春
关键词:常用词多义词辞书

李仕春

(西南大学文学院,重庆400715)

中国语文辞书的分期问题

李仕春

(西南大学文学院,重庆400715)

古今中外辞书的重要差别之一就在于多义词释义方面。以多义词释义体系的不断完善作为参照点,中国语文辞书的发展历史可以分为三个时期:以《说文解字》、《康熙字典》为代表的古代时期,以《新华字典》、《现代汉语词典》为代表的现代时期和运用语料库技术编纂词典的新时期。古代语文辞书的释义特点是:对某些字词的解释很不科学、多随文释义,“义项”的收录重古轻今,多是唐宋以前的,忽视了明清时代的;现代语文辞书的释义特点是:释义科学,义项划分合理,缺点是由于靠语感编纂存在义项漏收的情况;新时期也即语料库时期语文辞书除继承现代时期的释义特点外,还对多义词的义项进行了全面收录。

语文辞书;随文释义;语感;语料库;多义词

罗宾斯指出,中国语言研究“主要是辞书编纂和音韵研究”[1]96。这一评价客观而恰当,真实地说明了一部中国语言学史就是一部中国辞书发展史的特有现象。中国自古以来就是辞书大国,辞书在国人的学习生活中起着举足轻重的作用。在此仅举一例:《现代汉语词典》自问世以来,发行量大、应用面广,世所罕见,特别是进入新世纪以来《现代汉语词典》每年的发行量大概在300万至500万册之间,销售额度在2个亿至4个亿,可见其在国民学习生活中的重要作用,堪称国典。辞书编纂水准的高低直关国运!事关你我他!正因如此,古往今来有多位学者对辞书的作用进行了高度评价。晋代郭璞称赞《尔雅》说:“诚九流之津涉,六艺之钤键,学览者之潭奥,摛翰者之华苑。若乃可以博物不惑,多识于鸟兽草木之名者。”[2]1~2当代学者张志毅说:“辞书大业,惠及天下,功在当代,利在千秋。它是民族思想、科学、文化和语言的结晶,是国运的标志。”[3]1然而,中国辞书编纂的现状却是:“从人才、理论、辞书文本以及产业规模四方面综合取出平均值,我们离辞书强国还有50年左右的距离。”[3]15因此,总结以往中国辞书编纂经验的同时借鉴英美辞书强国的先进理念最终编纂出反映21世纪学术水准的汉语辞书,是繁荣当代中国辞书事业的当务之急。

辞书史的研究对于指导辞书编纂具有重大的意义。虽然中国辞书编纂历史渊源流长,但是对中国辞书史的系统研究直到20世纪70年代末才起步,主要成果有方厚枢的《中国辞书史话》(1979)[4][5]、刘叶秋的《中国字典史略》(1983)[6]、钱剑夫的《中国古代字典辞典概论》(1986)[7]、赵振铎的《古代辞书史话》(1986)[8]、曹先擢和杨润陆的《古代词书讲话》(1990)[9]、林玉山的《中国辞书编纂史略》(1992)[10]、张明华的《中国字典词典史话》(1998)[11]以及雍和明的《中国辞典史论》(2006)[12]等。

研究历史首先遇到的就是分期问题,研究中国辞书历史首先遇到的也是分期问题。目前已有辞书史类论著对中国辞书史的分期大致如下:

刘叶秋把中国辞书发展史分为五个时期:萌芽与奠基期(战国秦汉),继承与演变期(魏晋南北朝),建设与发展期(唐宋元),进化与兴盛期(明清),演变与改革期(近代)[6]。

林玉山把中国辞书发展史分为六个时期:萌芽期(夏商周先秦),奠基期(两汉魏晋南北朝),初步发展期(隋唐宋元),进一步发展期(明清),成熟期(近代和现代),兴盛期(当代)[10]。

雍和明将中国辞典发展史分为四个阶段:中国辞典的萌芽与开创期(西周至两汉),中国辞典的探索与建设期(魏晋至元朝),中国辞典的沿革与成形期(明朝至清朝),中国辞典的沉寂与兴盛期(20世纪)[12]。

上述三家基本遵循时间顺序,以“萌芽—发展—兴盛”的模式对中国辞书史进行分期,虽然划分的具体时间段不同,但都采用了通史性质的写法,注重从辞书编纂体例的角度阐述辞书发展史。我们认为辞书史的研究除了要重视辞书编纂体例的传承关系外,更要关注多义词释义体系在不同时期的传承关系,尤其是语文辞书史的研究更应如此。

陈平原指出:“谈论学术史研究,我倾向于以问题为中心,而不是编写各种通史。”[13]他认为“通史”性质的写史体例往往会使“著述”变成“编纂”,造成部头虽大但创新性见解很少的现象。因此,本文力避已有研究弊病,注重以“问题”为研究中心,从多义词释义体系不断完善的角度研究中国语文辞书发展史。多义词释义体系的不断完善是衡量语文辞书是否发展的根本标准,事实上,古今中外语文辞书最大的差别就在于多义词的释义方面。在中国历代语文辞书中,多义词释义体系经历了一个从无到有、从释义不科学到释义科学、从义项收录不全面到全面收录的过程,按照这个过程,中国语文辞书的发展历史可以划分为三个时期:以《说文解字》和《康熙字典》为代表的古代时期,以《新华字典》、《现代汉语词典》为代表的现代时期,运用语料库技术编纂词典的新时期。

一、以《说文解字》和《康熙字典》为代表的古代时期

汉语辞书的产生可以远溯至周朝,在古代辞书发展的历史长河中,中国先后出现了近千种辞书,大致分为以下六类:义类辞书、字书、韵书、目录(以《七略》、《四库全书总目》为代表)、类书(以《艺文类聚》、《永乐大典》为代表)、政书(以《太平御览》、《册府元龟》为代表)等。其中,以义类辞书、字书、韵书为代表的语文辞书是中国古代语文辞书发展的主流。这段时期,语文辞书集中出现在汉代至清代,形成了三个系列:一是字书,有《说文解字》、《字林》、《玉篇》、《类篇》、《字汇》、《康熙字典》等,以《说文解字》和《康熙字典》为代表;二是义类辞书,有《尔雅》、《广雅》、《通雅》、《别雅》、《比雅》、《叠雅》,以《尔雅》为代表,此外还有《方言》、《释名》等①通常,语言学者把《方言》看成是方言词典、《释名》为词源词典。但是它们的编纂体例和《尔雅》基本一致,事实上《方言》也是按字义分类,按照同一个事物在不同方言区有不同的称谓进行释义;《释名》也是按字义分类,以声训释义。;三是韵书,有《切韵》、《广韵》、《集韵》、《礼部韵略》、《洪武正韵》、《韵略易通》、《韵略汇通》和《中原音韵》等,以《广韵》为代表。古代语文辞书以字书、韵书的应用价值最大、适用范围最广。

在两千多年的发展史中,古代语文辞书的编纂体例渐趋完善,收词不断增加、释义不断丰富,至《康熙字典》集大成。从多义词义项划分的角度来看,这段时期,多义词的发展在汉语辞书中经历了一个从无到有的过程,一词多义的现象首先见于汉代《说文解字》,其释义特点主要是据形释义、一词一义,仅仅是偶尔涉及到一词多义,多义词和单义词的区分并不明显。例如《说文解字》对“人”和“鬼”的解释分别是:

【人】天地之性最贵者也。此籀文象臂脛之形。

【鬼】人所归为鬼。从人,象鬼头。鬼阴气贼害,从厶。此后,经历代字书、韵书的发展,汉语辞书中多义词和单义词的区分越来越明显,至清代《康熙字典》则已收录了大量多义词。我们以《康熙字典》中对“人”和“鬼”的释义为例说明:

【人】《说文》天地之性最贵者也。《释名》人,仁也,仁生物也。《礼·礼运》人者,天地之德,阴阳之交,鬼神之会,五行之秀气也。又一人,君也。《书·吕》一人有庆,兆民赖之。又予一人,天子自称也。《汤诰》嗟尔万方有众,明听予一人诰。又二人,父母也。《诗·小雅》明发不寐,有怀二人。又左人,中人,翟国二邑。又官名。《周礼》有庖人,亨人,浆人,凌人之类。又枫人,老枫所化,见《朝野佥载》。又蒲人,艾人,见《岁时记》。又姓。明人杰。又左人,闻人,俱复姓。《刘向·列女颂》望色请罪,桓公嘉焉。厥后治内,立为夫人。

【鬼】《说文》人所归为鬼。从人,象鬼头。鬼阴气贼害,从厶。《尔雅·释训》鬼之为言归也。《诗·小雅》为鬼为蜮。《礼·礼运》列于鬼神。注:鬼者精魂所归。《列子·天瑞篇》精神离形。各归其真,故谓之鬼。鬼,归也。归其眞宅。又《易·旣济》高宗伐鬼方。《诗·大雅》覃及鬼方。《传》鬼方,远方也。又星名。《史记·天官书》舆鬼鬼祠事,中白者为质。注:舆鬼,五星,其中白者为质。又姓。《前汉·郊祀志》黄帝得宝鼎,冕侯问于鬼臾区。注:黄帝臣也。又国名。《山海经》鬼国在负二之尸北。又乌鬼。《杜甫·遣闷诗》家家养乌鬼。《漫叟诗话》川人家家养猪,每呼猪作乌鬼声,故谓之乌鬼。《梦溪笔谈》夔州图经称,峡中人皆养鸬鹚,以绳系颈使捕鱼,得则倒提出之,谓之乌鬼。《元微之江陵诗》病赛乌称鬼。自注:南人染病,竞赛乌鬼。又《扬子·方言》虔儇,慧也。自关而东赵魏之闲谓之黠。或谓之鬼。

《说文解字》是中国辞书史上第一部真正意义上的辞书,它开中国古代辞书编纂体例的先河,此后的历代字书、韵书都是对《说文解字》体例的丰富与补充,至《康熙字典》集古代辞书之大成,可以说《康熙字典》是古代辞书中编纂体例最完善、最实用的一部辞书。通过这两部辞书,我们可以清楚地看到多义词义项在古代辞书中经历了一个从无到有的划分过程,《说文解字》中的绝大多数汉语常用词只有一个“义项”,而《康熙字典》中绝大部分常用词有了多个“义项”,同时每个“义项”后面附列了书证。用今天的眼光来看,古代辞书对“人”和“鬼”的解释很不科学,如《说文解字》把“人”解释为“天地之性最贵者也”、“鬼”解释为“归也”。《康熙字典》在沿袭《说文解字》释义的基础上,“人”还有仁、君(指一人)、父母(指二人)、左人、中人、翟国二邑、官名、枫人、蒲人、艾人、姓等十几个“义项”,“鬼”还有鬼方、星名、姓、国名、乌鬼(既指猪又指鸬鹚还是乌龟)等“义项”,但是这些意义都是具体语境中的意思,用现代词典学的眼光来看“鬼”和“人”的上述“义项”一个也不能成立!

古代语文辞书的释义缺陷主要有:①对某些字词的解释很不科学。②多随文释义性质。③“义项”的收录重古轻今,多是唐宋以前的,忽视了明清时代的。④古代语文辞书中的“义项”大多数不是现代词典学意义上的义项。

二、以《新华字典》、《现代汉语词典》为代表的现代时期

现代时期指20世纪至今。在这一时期,中国辞书学人有了现代辞书意识,他们在吸取传统辞书释义精华、借鉴西方现代辞书理论的基础上,先后编纂了以语文词典、百科词典、专科词典等为代表的种类繁多的辞书共计一万八千余种①该数据根据张志毅先生的统计,截止到2000年。[3]2~3,其中语文辞书仍是中国现代辞书发展的主流。这段时期形成了三个系列的语文辞书:一是词典,有《王云五大词典》、《王云五小词典》、《国语词典》、《现代汉语词典》、《现代汉语大词典》、《现代汉语规范词典》,以《现代汉语词典》为代表;二是字典,有《中华大字典》、《国音字典》、《新华字典》和《现代汉语字典》,以《新华字典》为代表;三是义类词典,以《同义词词林》、《简明汉语义类词典》、《现代汉语分类词典》为代表。其中,《新华字典》、《现代汉语词典》的应用价值最大、适用范围最广:《新华字典》自1953年出版以来发行4亿册,在当今,几乎每一个识字的中国人都知道它;《现代汉语词典》自1978出版以来发行5000多万册。另外,这一时期还出现了一批大型的历时性语文辞书,主要有《辞源》、《汉语大词典》、《汉语大字典》等。

中国语文辞书的现代化历程始于《中华大字典》(1915年出版)、完善于《现代汉语词典》(1978年出版),与此相应,多义词的释义在现代辞书中也经历了一个从释义不科学到释义科学的过程。现代辞书中多义词的释义多合于现代词典学、语言学理论,具体特征有:①释义科学;②义项划分合理;③严格区分词语的共时性义项和历时性义项,共时性辞书只收某个时期的义项,历时性辞书收录历史不同时期出现的义项。在此以《现代汉语词典》对“人”、“鬼”的释义为例加以说明:

【人】名①能制造工具并使用工具进行劳动的高等动物:男~|女~|~们|~类。②每人;一般人:~手一册|~所共知。③指成年人:长大成~。④指某种人:工~|军~|主~|介绍~。⑤别人:~云亦云|待~诚恳。⑥指人的品质、性格或名誉:丢~|这个同志~很好|他~老实。⑦指人的身体或意识:这两天~不大舒服|送到医院~已经昏迷过去了。⑧指人手、人才:~浮于事|我们这里正缺~。⑨(Rén)姓。

【鬼】①名迷信的人所说的人死后的灵魂。②形对人的憎称或蔑称:烟~|讨厌~|吝啬~|吸血~。③躲躲闪闪;不光明:~头~脑|~~祟祟。④名不可告人的打算或勾当:捣~|心里有~。⑤形属性词。恶劣的,糟糕的:~天气|~主意|~名堂|这~地方连棵草都不长。⑥〈口〉形机灵(多指小孩儿或动物):这孩子~得很!⑦〈方〉对人的昵称(多用于小孩儿):小~|机灵~儿。⑧二十八宿之一。

与古代辞书相比,现代辞书中多义词义项释义科学、划分合理,缺点是由于靠语感确定多义词的义项,因此多义词义项多存在收录不全的情况,主要有以下三种情况:

1.同一个词在不同的汉语类中型语文性词典中存在义项划分不一致的情况,凭借语感我们很难断定这些不一致的义项是否应该收录①大多数汉语常用词的义项在《现代汉语词典》、《现代汉语学习词典》、《现代汉语规范词典》等汉语类中型语文性词典中的释义基本是一致的,由于《现代汉语词典》早出,所以我们说其他词典中常用词的释义基本沿袭了《现代汉语词典》中对应词的释义,因此汉语类中型语文性词典的释义相似度很高。拙文《汉英中型语文性词典释义相似度对比研究》(待刊)就说明了这种情况。我们的研究显示:从历时角度看,《现代汉语词典》(1-6版)对相同所指的释义相似度高于《牛津高阶英语词典》(1-8版)对相同所指的释义相似度,这说明《现代汉语词典》不同版本之间对释义的改动程度小于《牛津高阶英语词典》(1-8版);从共时角度看,汉语类中型语文性词典对相同所指的释义相似度高于英语类中型语文性词典对相同所指的释义相似度,这说明汉语类中型语文性词典之间相互沿袭的现象严重,英语类中型语文性词典则重视原创性研究,最终形成了牛津传统系列词典、朗文传统系列词典、柯林斯传统系列词典等品牌词典。。例如:《现代汉语学习词典》中“果”的第④个义项是“饱;充实”的意思,举例是“食不~腹”,《现代汉语词典》(第6版)和《现代汉语规范词典》(第3版)都没有收录该义项,只是把它作为复合词“果腹”的意义,分别解释为“吃饱肚子|食不~腹”、“吃饱肚子|以野菜~腹”。如果不占有大量语料,我们很难判断“果”在现代汉语中是否有该义项,通过我们对“果”字3万条共计160余万字语料的穷尽性分析,发现现代汉语中“果”没有“饱;充实”的意思,这个意思存在于复合词“果腹”中。

2.一些常用词的义项在历时性的大型词典中有,而共时性的中型语文性词典中没有。例如《现代汉语词典》就没有收录“黄”在《汉语大词典》中的三个义项:①色变黄,枯萎;②指枯萎的枝叶;③黄熟。根据我们的研究,上述三个义项还存在于现代汉语中,只是《现代汉语词典》漏收了它们。

3.更多的是一些常用词的义项没有被汉语类词典编纂者发现。例如:在汉语类辞书中,表示动物的词语仅有龙、牛、虎、猴、猫等少数几个是多义词,像狼、猪、羊、狗、马、蛇、熊、驴、兔、鸡、鱼、龟等动物词语在汉语辞书中都是以单义词的身份出现的,事实上它们都是多义词,之所以在汉语辞书中是单义词主要是因为汉语辞书编纂者在解释这些动物词语时注重了它们的指物特征,忽略了它们伴随的语义特征。

上述现象,在靠语感编纂词典的时代,基本无解。语料库时代的到来,为解决这一难题提供了可能。

三、运用语料库技术编纂词典的新时期

20世纪50年代以前,世界各国词典对多义词义项的划分都经历了一个从无到有、从释义不科学到释义科学的过程。然而,自20世纪五六十年代世界语言学进入语料库时代后,辞书编纂便发生了革命性的变化,也即由过去通过做卡片靠语感确定常用词义项的方法转变到现在通过建立大规模的语料库依靠定量分析的方法研究常用词义项,因此新时期(语料库时期)词典编纂者的主要任务就是用语料库技术的方法研究常用词义项的分布情况,借以达到词典不再漏收常用词义项的目的,最终进一步完善常用词的释义体系。目前英美等辞书强国已经完成了用语料库技术研究英语常用词义项分布情况的工作,而包括中国在内的等为数众多的国家中的辞书还没有开始这项工作,因此,就中国而言,这是一项亟待展开的工作。下文是我们对开展这项工作的一些具体性建议。

(一)语料库技术研究常用词义项分布的可能性

国外:从20世纪80年代开始,语料库技术就已经广泛应用于英语词典编纂与研究中了。目前,占据英语辞书主要市场的牛津、韦氏、朗文与麦克米伦等英语词典,都是在语料库的基础上编成的。英语词典编纂者非常重视用语料库技术发现英语多义词的新义项(为了表述方便,本文以100核心词在汉英中型语文性词典中的平均义项为例做说明),我们的统计显示《牛津高阶英语词典》1至8版中100核心词的平均义项分别是7.55个、7.91个、7.03个、8.25个、8.47个、10.2个、10.47、10.61。由此,我们可以得出以下结论:《牛津高阶英语词典》1至3版分别出版于1948、1963、1974年,这三版中100核心词的平均义项数目基本稳定,这说明此段时间《牛津》词典编纂者还没有利用语料库技术把丰富、补充常用词的义项作为重点修订对象;4至6版分别出版于1989、1995、2000年,这三版中100核心词的平均义项数目有较大的变化,说明《牛津》词典编纂者在这段时间内已经利用语料库技术把丰富、补充常用词的义项作为重点修订对象;6至8版分别出版于2000、2005、2012年,这三版100核心词的平均义项数目基本稳定下来,并且从第6版开始《牛津高阶英语词典》常用词的编纂体例也发生了很大变化,这说明《牛津》词典编纂者在2000年就已经完成了用语料库技术研究英语常用词义项分布情况的工作。在最新出版的英语类中型语文性词典中,100核心词的平均义项分别是:《牛津高阶英语词典》(第8版)10.61个,《牛津简明英语词典》(第10版)12.81个,《麦克米伦高阶英语词典》(第2版)11.68个,《韦氏高阶英语词典》(2009年版)11.43个,《郎文当代英语词典》(第4版)10.35个。

与传统凭借语感编纂的词典相比,建立在语料库技术基础上的英语类中型语文性词典在多义词义项的划分方面更加细化、义项的收录更加全面,在词典编纂史上实现了里程碑式的跨越发展。

国内:20世纪90年代以来,中国相继建设了一批汉语语料库,最有代表性的如北京大学中国语言学研究中心研制的“CCL现代汉语语料库”,截止2015年6月18日规模已达5.81亿字,可以说,目前我国的语料库已经初步具备了词典编纂所需要的规模。尽管如此,在当今中国,用语料库技术发现汉语常用词新义项的方法还没有引起汉语词典编纂者的足够重视。例如:我们的统计显示,《现代汉语词典》1至6版中100核心词的平均义项分别是4.85个、5.20个、5.18个、5.18个、5.20个、5.42个,这表明,《现代汉语词典》1至6版并没有把丰富、补充常用词的义项作为重点修订对象,也就是说《现代汉语词典》第6版对100核心词义项的划分还和《现词汉语词典》第1版基本一致。与《现代汉语词典》同类的其他汉语类词典,如《现代汉语规范词典》(第2版)100核心词的平均义项是5.68个,《现代汉语学习词典》(2010年版)是5.9个,《新华词典》(最新修订版)是4.33个。这说明,汉语类中型语文性词典中100核心词乃至更多常用词义项的划分并没有建立在大型语料库的基础上进行成规模的系统修订,从而导致汉语类中型语文性词典义项的划分比较粗疏,存在义项漏收的情况。

总之,目前我国汉语类词典的编纂者乃至研究现代汉语词汇的学者还没有大规模地运用语料库技术对汉语常用词的义项进行丰富与补充,汉语类词典中常用词义项的编纂水准至今仍处在20世纪五六十年代靠语感编纂的水准。因此,相对于以往辞书中多义词靠语感编纂的情况来讲,充分利用语料库资源和计算机强大的计算功能来统计并分析每个常用词的义项在现代汉语中的分布情况,是一座非常诱人的学术富矿,有着巨大的挖掘潜力。

(二)语料库技术研究常用词义项分布的优点

1.用语料库技术研究常用词义项分布的最大贡献就在于把语料库技术也即把比人工阅读提高上百亿倍速度的搜集语料的方法引进到词汇学、词典学研究中来,这在中国词典学史、词汇学史乃至语言学史上具有里程碑式的、划时代的方法论意义。

以“黑”为例:用语料库检索的方法可以在16毫秒的时间内得出“黑”在北京大学CCL现代汉语语料库中有130831条。假设用人工阅读的方法查找1条含有“黑”字的语句需要用1个小时(实际上有时候不只1个小时),那么要找130831条“黑”字语料则要用130831小时。经过计算可以知道,查找同样多的语料,用语料库技术的方法约是人工阅读的290多亿倍,简直是神速。

2.语料海量。已有汉语类中型语文性词典的释义基本依靠语感通过做卡片的方式编纂,每个词占有的语料非常有限,而用语料库技术的方法对大多数常用词义项的考察都是在下载3万条语料共计160万字的基础上进行的①如果抽取的语料过少就不可能发现其所有义项,如根据我们对“黄”字3万条语料的分析结果显示“黄”字在现代汉语中有15个义项(包括《现代汉语词典》的8个义项),在“黄”的3万条语料中,专有名词大概有14406条(它们基本是无效语料),另外“黄”的表颜色的义项、黄金、黄河、黄帝等4个义项有14037条,其他11个义项加起来只有1557条语料,因此,如果我们抽取的语料条数过少是不可能发现“黄”字的新义项的。相反,如果抽取的语料过多就会做很多无用功。。与语音、语法相比,语义研究的最大困难在于主观性太强,常用词义项的划分也是如此,常常存在仁者见仁智者见智的情况,所以最好安排两人同时进行标注,结果一致最好,如果不一致,要找原因或再安排其他人进行标注直到一致,这就在一定程度上增加了义项划分的客观性。

新理论、新方法是推动一门学科进步的两大引擎,正因为用语料库技术研究常用词义项分布具有划时代的方法论意义,所以把语料库技术和词典编纂结合起来成规模地、系统地研究现代汉语常用词的义项分布规律问题,是一项亟待展开的、需要成千上万人参与的重大基础应用研究项目,它是一项非常宏大的工程。

(三)语料库技术研究常用词义项分布的思路

古今中外辞书的差距主要体现在常用词的释义方面,具体表现为:常用词义项的精细度、常用词义项的释义用语、常用词义项的排列等。虽然目前很多汉语类词典冠以语料库名义编纂,但实际上并没有对已有的辞书释义体系进行根本革新,所谓的更新仅仅是一些细枝末节的更新,如果要进行根本的革新就必须把常用词义项的研究建立在语料库分析基础之上。用语料库技术研究汉语常用词义项分布的具体思路是:

首先,组建学术团队。用语料库技术研究现代汉语常用词义项分布是一项前无古人后有来者、惠及当代泽披后世的重大基础应用研究项目,绝非两三人或十几人就能完成的项目,它需要成百上千甚至成千上万的人参与才能得以顺利完成。因此,完成这样的项目就需要组建学术团队,团队成员在从事该项目之前除了要掌握本课题需要的语料库技术外,还要有辨义能力,这就要求团队负责人事先通读与有关词典学、词汇学等相关的语言学论著,在了解词典释义原则的基础上,理清词义历时演变与共时分布之间的关系、词典中义项划分与义项排列之间的关系、词的意义和词的用法之间的关系等等,然后以集体授课的方式教给团队成员与本项目有关的上述词汇学、词典学知识。

其次,确定研究对象。根据有关字频、词频的统计材料,可以确定常用词的数目在3000个左右,这些词的特点是构词能力强、使用频率高。为了系统地研究多义词在现代汉语中的义项分布情况,应把选好的词系联为三大语义场———动作、名物、性状,然后每类义场再进一步细分。动作义场可细分为上肢动作义场、下肢动作义场、头部动作义场等,名物义场可细分为动物义场、植物义场、人体器官义场等,性状义场可细分为颜色义场、空间属性义场、品性义场等。这样一方面可以详细描写出每个常用词在现代汉语中的义项分布情况,另一方面也可以归纳出同类词在现代汉语中的义项分布规律。

第三,运用抽样统计法从北京大学CCL现代汉语语料库中下载所需要的语料,为每个常用词建立语料库并进行标注,要特别注意新义项的标注。重要的常用词都要分别安排两位课题组成员进行标注,如果标注的义项相同,就不再标注。如果不同则再进行标注,直到取得一致。

第四,发现新义项。以《现代汉语词典》常用词的释义作为基准,通过与《现代汉语学习词典》、《现代汉语规范词典》、《新华词典》等汉语类中型语文性词典中对应词的释义做比较,重点找出《现代汉语词典》中没有而其他词典中有的义项,通过标注语料看《现代汉语词典》中没有的义项是否存在于现代汉语中,如果语料库中有则建议《现代汉语词典》补充;以《现代汉语词典》常用词的释义作为基准,通过与《汉语大词典》、《汉语大字典》、《辞源》等汉语类历时性的大型词典中对应词的释义做比较,重点找出《现代汉语词典》中没有而历时性词典中有的义项,通过语料标注看历时上曾出现过而《现代汉语词典》中没有收录的义项是否存在于现代汉语中,如果语料库中有则建议《现代汉语词典》补充。在此基础上,鼓励团队成员依靠自己的辨义能力,发现汉语类词典中没有而语料库中有的义项,这样的义项为原创性发现。

第五,解释新义项成立的原因。运用词汇学、词典学、语义学等相关学科的理论,解释新义项成立的原因。我们在标注“牛”字语料的时候发现类似“牛吼”、“牛劲”、“牛眼”、“牛饮”中“牛”的意思是现有词典中的义项所不能概括的,例如:

①等送老婆走了,赶到河边,见逃黄水的人正和孙克贤在交钱交货。他牛吼一声:“孙克贤!”(严歌苓《第九个寡妇》)

②扛来啤酒送给他的队友,他的队友冲着他砰砰地打开啤酒,仰着脖子牛饮,有几个顽皮的骑手还朝我扬了扬酒瓶以示致意。(池莉《让梦穿越你的心》)

以汉语为母语的人自然会把“牛吼”、“牛饮”理解为(人)大声叫喊、(人)很能喝酒,但是对于汉语是非母语的外国人来说,他们因为没有中国文化背景,就很难做出这样的理解。如果我们告诉他们在上述词中“牛”有大的意思,则他们就容易理解得多,因此,我们可以考虑为“牛”立一个新义项“大”。这可以用张志毅先生的词义七因素新说来解释:“物象,是事物反映在意识中的群体表象……人们对物的反映可以从物象到物性,也可以舍弃物性,只选取物象。”[14]129在汉族人的群体表象中,“牛”是一种躯体庞大的动物,语言是思维的直接现实,汉族人的这种群体意识就体现在现代汉语“牛”的义项中,于是“牛”就有了“大”的意思。

同样,我们在标注“猴”字语料的时候,发现“猴”字在“猴急”、“猴精”、“猴瘦”等词语中的意思在现有词典中也是查不到的。对母语是非汉语的外国人来说,他们会很困惑为什么汉语中有把人比喻成像猴子那样精的说法?为什么把人的智商比喻成动物的智商?如果我们事先告诉他们“猴”在汉语中有“很”的意思,那么他们就能愉快地接受了。“猴”有副词性用法“很”的意思也可以用词义七因素新说来解释:“物性,是事物反映在意识中的群体特征属性或本质属性。”[14]129在汉族人的意识中,“猴”区别于其他动物的群体特征属性是行动急促、外形像人很精明、与其他动物相比“猴”显得很瘦,经过语义磨损,“猴”的上述语义特征逐渐消失,最终在汉族人的意识中“猴”有了一个很宽泛的副词性用法“很”,这个意义正是“猴”的动物属性在汉语中的显现。

第六,熟悉与汉语常用词相对应的英语单词在《牛津高阶英语词典》、《韦氏高阶英语词典》、《麦克米伦高阶英语词典》、《朗文当代高级英语词典》等英语类中型语文性词典中的释义,借鉴英语词典中常用词义项的编排方式,把它们应用于相应的汉语常用词义项编纂中。例如:《现代汉语词典》(第6版)中“跑”的第一个义项是“两条腿或四条腿迅速前进(脚可以同时腾空)”,但是我们通过语料库标注发现类似“跑”的义项还有“人凭借汽车、火车等交通工具的跑”、“汽车、火车等交通工具自身的跑”、“分子、原子、离子等的跑”、“土、水、风、电等物态东西的跑”等,它们是《现代汉语词典》“跑”的第一个义项所不能概括的。在这种情况下,我们可以借鉴《牛津简明英语词典》中以义项群编排多义词义项的方式,把《现代汉语词典》“跑”的第一个义项设立为主义项①“快速移动”,然后再分别列出次要义项:a.两条腿或四条腿迅速前进(脚可以同时腾空);b.汽车、火车等交通工具自身快速前进;c.分子、原子、离子等快速移动;d.土、水、风、电等物态的东西快速移动①虽然《现代汉语词典》也以义项群的形式编排多义词义项,但其以义项群编排多义词义项的条数明显少于《牛津简明英语词典》。。英语词典中除了以义项群的方式编排多义词的义项外,还有分词性排列义项、以释义提示语的形式释义等等,都值得我们借鉴。

四、结语

目前我国汉语类词典的编纂者乃至研究现代汉语词汇的学者还没有大规模地运用语料库技术对汉语常用词的义项进行丰富与补充,汉语类词典中常用词义项的编纂水准至今仍处在20世纪五六十年代靠语感编纂的水准。因此,相对于以往辞书中多义词靠语感编纂的情况来讲,充分利用语料库资源和计算机强大的计算功能来统计并分析每个常用词的义项在现代汉语中的分布情况,是一座非常诱人的学术富矿,有着巨大的挖掘潜力。张志毅先生指出:“今天的语料库已经成为能量巨大的语言样本集。它正在印证、充实、修订、改写甚至颠覆以往的辞书释语。它也正孕育出、孕育着更现代、更可信的辞书。”[15]42真正建立在语料库技术基础上的汉语词典,必将会在中国辞书史上留下浓重的一笔,成为中国辞书史上具有里程碑式性质的辞书。

[附注]本文还获得了西南大学中央高校基本业务费专项资金创新团队项目(编号:SWU1609105)以及西南大学科研基金项目(编号:SWU1509502)的资助。

[1]罗宾斯.简明语言学史[M].北京:中国社会科学出版社,2012.

[2]尔雅[M].郭璞,注.北京:中华书局,1985.

[3]张志毅,张庆云.理论词典学[M].北京:商务印书馆,2015.

[4]方厚枢.中国辞书史话:上[J].辞书研究,1979,(1).

[5]方厚枢.中国辞书史话:下[J].辞书研究,1979,(2).

[6]刘叶秋.中国字典史略[M].北京:中华书局,1983.

[7]钱剑夫.中国古代字典辞典概论[M].北京:商务印书馆,1986.

[8]赵振铎.古代辞书史话[M].成都:四川人民出版社,1986.

[9]曹先擢,杨润陆.古代词书讲话[M].上海:上海教育出版社,1990.

[10]林玉山.中国辞书编纂史略[M].郑州:中州古籍出版社,1992.

[11]张明华.中国字典词典史话[M].北京:商务印书馆,1998.

[12]雍和明,罗振跃,张相明.中国辞典史论[M].北京:中华书局,2006.

[13]陈平原“.当代学术”如何成“史”[J].云梦学刊,2005,(4).

[14]张志毅,张庆云.词汇语义学[M].北京:商务印书馆,2012.

[15]张志毅,长召其.辞书编纂现代化的新理念——人机接口工具使用的智能发挥[M]//乐嘉民,亢世勇.辞书编纂现代化研究.上海:上海辞书出版社,2009.

[责任编辑:熊显长]

H16

A

1001-4799(2017)01-0109-07

2016-03-20

国家社会科学基金重点资助项目:14AYY018

李仕春(1973-),男,山东莒县人,西南大学文学院教授,主要从事语言学史和词汇学、词典学研究。

猜你喜欢
常用词多义词辞书
体认原型范畴视域下多义词延伸及对学科英语研究生培养的启示
CISHU YANJIU LEXICOGRAPHICAL STUDIES
多义词
大型辞书疑难字考释七则
常用词“怠”“惰”“懒”的历时演变
中、英多义词的翻译识别劣势效应及其影响因素
科举干禄与语文辞书编纂
Enhanced Precision
中国辞书学会第四届领导成员名单
春节用语的英语说法