汉英词典100核心词释义对比研究

2013-12-31 02:04李仕春
中南大学学报(社会科学版) 2013年6期
关键词:现代汉语词典语料库

摘要:文章认为判定不同国家的词典是否属于同类词典的标准有三条:词典性质、词典收词、词典释义。根据上述标准,文章认定《现汉》《牛津》《韦氏》等汉英词典都是中型语文性词典,在此基础上,对这些词典中100核心词的义项数目及其分布做了简要对比,认为与《牛津》《韦氏》等英语词典相比,《现汉》等汉语词典在100核心词的义项划分方面比较粗疏。最后,文章从语料库技术、词典的编纂历史以及语言学理论等三方面,分析了中国词典100核心词义项划分粗疏的原因。

关键词:语料库;《现代汉语词典》(第6版);核心词;义项分布

中图分类号:H164 文献标识码:A 文章编号:1672-3104(2013)06?0252?07

一、词典与核心词的选取

(一) 词典的选取①

本文的“汉英词典100核心词义项数目比较表”中详列有我们选取的词典。其中《现5》指《现代汉语词典》(第5版)[1],《现6》指《现代汉语词典》(第6版,本文简称《现汉》)[2],《现学》指《现代汉语学习词典》[3],《汉大》指《现代汉语大词典》[4],《牛4》指《牛津高阶英语词典》(第4版)[5],《牛7》指《牛津高阶英语词典》(第7版,本文简称《牛津》)[6],《简明》指《牛津简明英语词典》(第10版)[7],《韦氏》指《韦氏高阶英语词典》[8],《郎文》指《郎文高阶英汉双解词典》[9],《麦克》指《麦克米伦高阶英汉双解词典》[10]。

为什么选上述几部词典中的100核心词呢?这是因为除《汉大》②外,上述几部词典的类型基本一致。把同类型而又隶属于不同国家的词典中的100核心词的义项数目及其分布进行对比,易于发现不同国家的词典编纂者对同类词释义的不同处理方法,易于找出不同国度的同类词典在义项划分中的差异,从而达到取长补短的目的。认定词典类型是否一致应从词典的性质及其收词和释义等3个方面分析。

(1) 从词典性质来看,上述词典都是语文性词典。《现汉》《现学》《牛津》《韦氏》等分别是中国、英国、美国的代表性词典,它们都是共时性的所在国的权威性中型语文词典。例如:《现代汉语学习词典》的编者就把该词典定为“是国内第一部真正意义上的‘内向型汉语学习词典,开学生‘学习词典之先河,汉语‘牛津高阶之楷模。” 这表明该词典的编纂者认为《现学》和《牛津高阶英语词典》是同一类型的。

(2) 从词典收词来看,除《汉大》外,上述几部词典收词量基本相当,都以一般词汇为主,同时还收录了大量科技、历史、文学等专业及百科词汇,也收新词语。例如:《现汉》收词69 000余条,词典正文共1 755页;《韦氏》收词65 000余条,词典正文共2 257页;《牛津》收词89 000余条,词典正文共1 780页③。

(3) 从词典释义来看,上述词典的释义都是以语文性释义为主百科性释义为辅,对词的释义以人类的认知经验为参考,适当吸收科学因子。

根据以上3条标准,我们认为,在《牛津》系列词典中,与《现汉》同类型的词典不是《牛津初阶英语词典》《牛津中阶英语词典》,而是《牛津简明英语词典》或《牛津高阶英语词典》。同理,《现汉》和《韦氏》《麦克》《朗文》等以高阶命名的词典是同类词典。

(二) 核心词的选取

美国语言学家莫里斯·斯瓦迪士在二十世纪四五十年代,从统计学的角度通过分析不同的语言(主要以印欧语系语言为主)得出一个有200核心词的斯瓦迪士核心词列表(Swadesh list)。他认为,基本上所有语

言的词汇都应该包含这200个词语,正因为该词表有上述特点,所以我们从斯瓦迪士200核心词列表中选取100个核心词,然后按照语义场理论予以分类,这样就会很容易地通过比较找出这100核心词在《现汉》《牛津》《韦氏》等汉英词典中义项分布的不同,并且也可以在一定程度上比较上述词典对100核心词释义的异同。

词义引申不仅受词义的内部构成要素的影响而且也受词义的外部要素,诸如民族、社会、文化等因素的影响,因此在不同的语言中,词义的引申有同有异,异大于同。共时的分布规律往往显示历史的演变规律,因此,我们还是可以找出不同语言中具有相同特点的一类词的引申往往具有具有一些共同的义项分布规律,相应地隶属于不同国度的同类型词典也应有一些共同的释义规律。本文主要对比汉英100核心词在中、英、美各国的权威性词典中义项数目的不同及其义项分布规律的不同。

二、义项分布对比研究

经过处理,我们得出100核心词在《现汉》(第5版)、《现汉》(第6版)、《牛津》《韦氏》等词典的义项数目④,具体如表1。

据表1我们可以得出以下结论:

(1) 在不同的民族语言中,一些词的本义虽然相同,但由于这些词在各民族的语言中占的地位不同,因此它们的词义引申就有所不同:词在语言交流中占的地位越重要,它的引申义就越丰富越复杂,这种现象反映在词典中就是词在语言交流中的地位越重要它的义项就越丰富。例如:

《现汉》(第6版)、《牛津》(第7版)、《韦氏》等3部词典中:

“花”在《现汉》中有17个义项,与“花”相对应的英语单词“flower”在《牛津》中有7个,《韦氏》有5个。

“吃”在《现汉》中有8个义项,与“吃”相对应的英语单词“eat”在《牛津》中有2个,《韦氏》有4个。

“掷”在《现汉》中有1个义项,与“掷”相对应的英语单词“throw”在《牛津》中有20个,《韦氏》有20个。

(2) 在100核心词的义项数目方面,《现汉》(第6版)义项数目明显少于《牛津》(第7版)、《韦氏》。例如:

《现汉》有17个核心词的义项数目略微多于《牛津》《韦氏》,《现汉》17个核心词的义项总数是156个,平均义项数是9.2个,与《现汉》17个核心词对应的《牛津》有96个义项,平均义项数是5.6个,《现汉》高于《牛津》3.6个;《现汉》有11个核心词的义项数目多于《韦氏》,《现汉》11个核心词的平均义项数是104个,平均义项数是9.4个,与《现汉》11个核心词对应的《韦氏》有66个,平均义项数是6个,《现汉》高于《韦氏》3.4个。

反过来看,《现汉》有83个核心词的义项数目低于《牛津》,《现汉》83个核心词的义项总数是399,《现汉》83个核心词的平均义项数是4.8个,与《现汉》83个核心词对应的《牛津》有个951义项,平均义项数是11.4个,《现汉》低于《牛津》6.6个;《现汉》有89个核心词的义项数目低于《韦氏》,《现汉》89个核心词的平均义项数是451个,平均义项数是5.1个,与《现汉》89个核心词对应的《韦氏》有1077个,平均义项数是12.1个,《现汉》低于《韦氏》7个。

另外,根据“汉英词典100核心词义项数目比较表”,我们还可以得出以《现汉》(第6版)为代表汉语词典的义项数目远远低于以《牛津》(第7版)为代表的英语词典的结论,例如:

《现汉》(第5版)100个核心词共有534个义项,平均5.3个。

《现汉》(第6版)100个核心词共有555个义项,平均5.5个。

《现学》100个核心词共有590个义项,平均5.9个。

《现代汉语大词典》100个核心词共有766个义项,平均7.7个。

《牛津》(第4版)100个核心词共有825个义项,平均8.2个。

《牛津》(第7版)100个核心词共有1047个义项,平均10.5个。

《牛津简明》100个核心词共有1281个义项,平均12.8个。

《麦克》100个核心词共有1168个义项,平均11.7个。

《韦氏》100个核心词共有1143个义项,平均11.4个。

《朗文》100个核心词共有835个义项,平均8.3个。《朗文》100个核心词共有1792个义项,平均17.9个。⑤

表1 汉英词典100核心词义项数目比较表

作 汉 现5 现6 现学 汉大 英 牛4 牛7 简明 韦氏 麦克 朗文

吃 8 8 13 13 eat 2 2 3 4 3 3-16

喝 2 2 2 1 drink 3 5 8 10 7 4-6

唱 3 3 3 6 sing 3 3 8 9 13 5-7

说 6 6 9 7 say 2 7 9 12 13 11-47

咬 7 7 8 8 bite 12 12 15 15 14 15-26

吸 3 3 3 5 suck 5 6 7 6 8 4-7

呼 3 3 3 5 breathe 4 5 7 6 6 4-11

笑 2 2 2 3 laugh 4 5 5 6 3 4-16

看 9 9 11 9 see 17 18 15 13 20 18-46

听 4 4 4 6 hear 5 6 7 4 9 4-16

闻 4 5 5 5 smell 7 9 11 14 11 8-12

读 4 4 4 4 read 12 17 17 16 16 9-19

作 洗 9 9 9 10 wash 12 8 22 14 11 10-17

打 24 24 31 32 hit 9 20 18 17 26 19-36

拿 9 10 8 11 take 39 42 36 48 41 31-47

推 10 10 11 10 push 8 14 16 12 12 12-19

挖 2 2 3 3 dig 4 6 15 7 3 10-11

擦 5 5 5 5 scrape 7 9 13 9 10 6-7

掷 1 1 1 2 throw 16 20 23 20 13 10-38

抓 6 6 6 7 scratch 9 12 17 13 16 8-16

作 跑 6 6 5 5 run 32 54 48 48 50 35-72

走 10 10 10 17 walk 8 10 20 12 19 8-18

站 1 1 2 4 stand 13 28 30 24 30 19-43

坐 11 11 14 11 sit 8 9 13 14 9 6-13

跳 4 4 5 10 jump 15 15 23 24 25 14-28

来 12 13 17 19 come 13 15 16 13 13 12-32

切 2 2 3 10 cut 19 32 30 36 33 23-40

作 玩 3 3 3 5 play 22 25 31 31 19 12-39

睡 1 1 2 2 sleep 5 5 8 7 6 5-16

躺 1 1 2 2 lie 9 9 8 8 9 7-16

住 3 3 6 4 live 15 16 15 9 20 10-36

刺 7 7 7 11 stab 3 5 7 7 10 5-8

杀 6 6 6 9 kill 9 6 13 12 13 8-18

爬 3 3 3 5 climb 6 12 9 7 16 13-14

给 7 9 5 6 give 21 19 21 35 28 21-46

作 爱 5 5 5 7 love 10 9 11 10 13 9-22

想 4 6 6 4 think 8 11 8 9 19 3-6

记 6 6 6 7 remember 6 6 5 5 6 6-8

死 7 7 8 14 die 3 5 8 6 4 5-17

作 浮 8 8 10 10 float 12 13 16 11 18 12-13

游 5 5 5 8 swim 6 7 8 5 7 3-5

落 11 11 14 22 fall 21 21 24 28 29 20-55

流 8 8 10 12 flow 9 12 9 14 14 11-13

飞 6 6 7 24 fly 12 21 20 17 21 18-44

续上表

词 自

物 水 6 6 8 10 water 10 12 19 9 10 15-15

海 7 7 8 7 sea 4 4 4 6 5 2-5

云 1 1 1 1 cloud 8 9 8 8 11 2-12

要素 骨 3 3 3 10 bone 4 4 7 5 4 2-8

蛋 2 3 3 4 egg 3 4 5 3 6 4-7

角 7 8 10 9 horn 5 6 14 7 8 5-9

尾 4 4 6 7 tail 6 9 21 11 8 6-14

羽 3 3 3 6 feather 3 2 6 3 1 1-3

素 手 7 7 8 12 hand 10 12 17 15 12 7-40

脚 4 4 6 9 foot 6 8 13 8 10 5-24

嘴 3 3 3 4 mouth 7 9 11 8 8 5-14

头 13 13 11 17 head 21 25 31 24 20 16-47

耳 3 3 3 3 ear 2 4 3 4 3 3-14

发 1 1 1 5 hair 1 3 3 3 3 4-13

血 4 4 4 7 blood 5 6 8 5 6 4-13

肤 2 2 2 3 skin 6 7 16 9 10 7-15

肉 4 5 4 9 meat 3 2 4 3 3 9-21

属 父 2 2 2 3 father 7 7 13 8 5 8-8

母 5 5 6 7 mother 5 3 9 9 4 4-10

男 2 2 2 4 male 4 6 5 5 6 6-6

女 2 2 3 3 female 5 7 5 7 4 5-5

夫 4 4 4 3 husband 1 2 2 2 1 1-1

妻 1 1 1 1 wife 1 1 2 1 2 1-1

物 蛇 1 1 1 1 snake 2 2 4 5 5 2-3

人 8 8 9 12 people 7 10 8 8 9 5-11

鱼 1 1 1 2 fish 3 6 9 5 6 4-13

鸟 1 1 1 1 bird 3 3 3 3 4 2-7

狗 1 1 1 4 dog 4 8 14 8 6 7-18

虱 1 1 1 1 louse 2 2 5 3 2 2-2

虫 2 2 2 2 worm 3 7 13 6 6 3-8

物 木 6 6 6 11 wood 3 4 5 8 4 4-5

树 3 3 3 5 tree 2 1 7 8 2 2-2

果 2 5 4 1 fruit 5 5 7 3 5 2-8

叶 2 2 2 5 leaf 5 6 7 4 5 5-5

根 10 10 10 8 root 10 13 19 11 12 8-13

花 17 17 15 19 flower 5 7 5 5 6 4-6

种 5 5 2 10 seed 7 8 15 8 9 7-11

草 4 8 8 11 grass 7 6 9 4 7 3-5

词 人

性 好 15 15 16 15 good 23 26 18 37 39 21-73

坏 6 6 7 6 bad 10 16 10 18 14 9-33

美 5 5 5 7 beauty 2 4 5 6 6 3-5

丑 3 5 3 6 ugly 2 2 2 4 4 2-3

新 7 7 7 8 new 5 13 10 13 12 8-18

恶 3 3 4 5 evil 4 6 4 3 8 6-7

色 绿 1 1 1 1 green 13 13 16 13 16 10-16

黑 5 7 8 8 black 14 13 22 13 12 9-13

黄 7 7 9 7 yellow 3 5 10 8 4 3-4

白 9 10 8 9 white 9 7 17 12 14 12-12

红 5 5 7 20 red 6 8 14 8 7 6-13

性 长 6 6 6 7 long 10 11 18 17 18 13-39

宽 5 5 8 9 wide 5 10 12 8 10 8-12

直 10 10 9 9 straight 14 18 17 24 19 18-24

圆 7 7 8 11 round 23 31 37 23 32 14-19

钝 2 2 3 4 blunt 3 4 6 4 4 4-4

尖 8 8 7 12 sharp 12 20 26 21 15 18-20

滑 4 4 4 5 smooth 7 9 8 12 10 11-13

《现汉》(第5版)100核心词中的每个核心词的义项数目平均比《牛津》(第7版)少收5.2个,比《韦氏》少收6.1个;《现汉》(第6版)100核心词中的每个核心词平均比《牛津》(第7版)少收5个,比《韦氏》少收5.9个……

上述现象表明:长期以来中国词典的编纂者乃至研究现代汉语词汇的学者忽视了现代汉语100核心词乃至更多常用词义项的研究。

(3) “汉英词典100核心词义项数目比较表”还表明《现汉》(第6版)的修订者并没有把常用词义项的丰富与补充作为重点修订的对象。

本文所选的100核心词在《现汉》(第5版)、《现汉》(第6版)中义项数目基本一样:《现汉》(第5版)100个核心词共有534个义项,平均5.3个;《现汉》(第6版)100个核心词共有555个义项,平均5.5个。这表明,《现汉》(第6版)并没有把丰富补充常用词的义项作为重点修订对象。

相反,《牛津》词典的历次修订版显示《牛津》词典的修订者一直把丰富并补充常用词的义项作为重点修订对象。根据笔者手头有《牛津》(第4版)和(第7版),由于语料库技术的参与,《牛津》(第7版)中常用词的义项和《牛津》(第4版)相比有了大幅度地增加,《牛津》(第7版)中100核心词的平均义项要比《牛津》(第4版)多2.3个。例如《牛津》(第4版)中run有34个义项,而(第7版)引进语料库技术后,run则有54个,多了20个。

(4) 如果把同类词放在一起比较,更容易发现《现汉》释义存在的问题,本节主要从词类分布这一角度对比。100核心词在《现汉》(第6版)、《牛津》(第7版)、《韦氏》3部词典中,动词44个,名词38个,形容词18个。每类词的平均义项数目分别如下:

a. 动词44个:《现汉》(第5版)共有259个义项,平均5.9个;《现汉》(第6版)共有265个义项,平均6.0个;《牛津》共有591个义项,平均13.4个;《韦氏》共有647个义项,平均14.7个。

在44个动词的义项分布中,和《牛津》《韦氏》相比,《现汉》(第6版)漏收的义项更多,《现汉》(第6版)平均6.9个,《牛津》平均13.4个,《韦氏》,平均14.7个。与形容词、名词相比,《现汉》(第6版)动词漏收的义项最多。例如:

根据我们对英语词典的查阅,发现类似汉语“跑”的“run”在《牛津》中有33个义项,《韦氏》有72个义项,而《现汉》(第6版)仅有6个。《现汉》(第6版)义项①对“跑”的解释是“两只脚或四条腿迅速前进”,而随着自行车、汽车、飞机、轮船等现代化交通工具的出现,现代汉语中出现了大量下列句子“他骑着自行车满大街跑。”,“他开着轿车在公路上跑。”“他坐着飞机全世界跑”,“他开着轮船在海上跑。”等等,很明显《现汉》(第6版)已有“跑”的义项不能涵盖上述“跑”的含义。

b. 形容词18个:《现汉》(第5版)共有118个义项,平均6.5个;《现汉》(第6版)共有123个义项,平均6.8个;《牛津》共有216个义项,平均12个;《韦氏》共有244个义项,平均13.5个。

在18个形容词的义项分布中,和《牛津》《韦氏》相比,《现汉》(第6版)漏收的义项次之,《现汉》(第6版)平均6.5个,《牛津》平均12个,《韦氏》平均13.5个。事实上在现代汉语上述18个核心词的义项并不比英语中少,我们以表颜色核心词的义项为例:

在《牛津》《韦氏》《麦克》《朗文》等英语词典中类似汉语中表颜色词“绿”的green有5个或10个义项,而《现汉》(第6版)中“绿”只有一个义项“① 像草和树木茂盛时的颜色,由蓝和黄混合而成”。根据我们对CCL现代汉语语料库中出现的33 798条、共160万字的“绿”字语料的穷尽性分析,认为按照《现汉》已有释义原则“绿”字条漏收了以下5个义项:“便捷地、快速地”“无公害、无污染;能源损耗低”“泛指绿色植物”“泛指各种颜色。此外,根据我们对现代汉语其他常用颜色词的初步研究,《现汉》(第6版)还漏收了以下义项:“黑”漏收2个义项“脏”和“不光彩”;“白”漏收义项“洁净、纯洁”;“黄”漏收6个义项“娇嫩”“年龄小,涉世浅”“成熟”“枯萎”“(人脸)干枯,(年龄)大”“警告,预警”等等。

c. 名词38个:《现汉》(第5版)共有157个义项,平均4.1个;《现汉》(第6版)共有167个义项,平均4.4个;《牛津》共有240个义项,平均6.3个;《韦氏》共有252个义项,平均6.6个。

在38个名词的义项分布中,和《牛津》《韦氏》相比,《现汉》(第6版)的义项最少,《现汉》(第6版)平均4.3个,《牛津》平均6.3个,《韦氏》平均6.6。在汉英词典中,名词的义项都普遍较少,但是很明显《现汉》(第6版)还是漏收了一些义项,我们以表动物类核心词义项的漏收为例:

“蛇”“鱼”“鸟”“狗”“虱”等表示动物的核心词在《现汉》(第6版)中只有一个义项。但语言中的实际情况是这些词常常发生词义引申,它们常常引申出与之相应的动物的特性以及与它们类似的人或其他动物,动物类核心词的引申规律常常是由物及人,上述引申规律在《牛津》《韦氏》等词典的释义中能够体现出来,而《现汉》(第6版)没有体现出来。在语料库中有大量上述动物核心词的引申义,《现汉》(第6版)应予以补充。

三、核心词义项数出现差异的原因

从理论上讲,汉语的义项应该比英语还要多,这是因为英语是屈折语,有词形变化,所以英语的100核心词中多是动词性、名词性、形容词性兼类,介词性、副词性等虚词的义项往往发生词形变化,成为一个新词,例如:形容词smooth的副词形式是smoothly;名词mouth的副词形式是mouthful。而汉语的100核心词除了动词性、名词性、形容词性可以兼居一词外,介词性、副词性等虚词性义项也可以兼居一词,例如:“死”7个义项,1个动词性义项,4个形容词性义项,2个副词性义项;“拿”有10个义项,其中有3个是介词性义项;“给”有9个义项,只有2个动词性义项,其余的有6个介词性义项,1个助词性义项。

英语的词形变化分担了词性变化引起的义项增加,而汉语不能。因此,从理论上讲汉语100核心词的义项要比英语多才对。

为什么100核心词的平均义项数目在《现汉》等汉语类词典中比同类型的《牛津》《韦氏》等英语类词典少呢?我们认为主要有以下原因:

(一) 语料库技术

国外,从20世纪80年代开始,语料库技术就已经广泛应用于词典的编纂与研究中了。目前,占据英语辞书主要市场的牛津、韦氏、朗文、剑桥、柯林斯与麦克米伦等英语词典,都是在语料库的基础上编成的。

国内,20世纪90年代以来,我国相继建设了一批汉语语料库,如国家语委的“现代汉语平衡语料库”、北京大学中国语言学研究中心研制的“CCL语料库”可以说,目前我国的语料库已经初步具备了词典编纂所需要的规模。

尽管如此,把语料库技术和词典编纂结合起来,用定量与定性相结合的方法把收词、立目、义项排列建立在语料库基础上进行编纂的词典在我国还不多见,这就不可避免地导致我国已有词典在收词和义项取舍方面困难重重,不利于我国词典编纂者对旧词新义或新用的发现和甄别。

(二) 编纂历史

作为一部综合英语词典的前身是塞缪尔·约翰逊编纂的《英语大词典》,该词典最早于1755年由朗文出版公司出版,由此算来朗文词典的历史距今已经有250年的历史了。《牛津简明英语词典》初版于1911年,《牛津简明英语词典》第10版出版于2001年,《牛津高阶英语词典》初版于1948年。《韦氏高阶英语词典》初版于1831年。《现代汉语词典》1978年第1版,如果算上具有现代语言学意义的词典《国语辞典》(1936年开始出版)⑥,中国的词典编纂历史也才有70多年的历史。

由此可见,具有现代意义的词典,中国的词典比英国的词典晚250多年,比美国的词典要晚100多年⑦。相对来讲,词典编纂的历史长积累的历史经验就多,因此英语词典的义项比汉语词典的义项丰富。

(三) 语言学理论

与以欧美语言学为主的世界语言学理论相比,目前中国的语言学理论很是落后,同样与国外词典学理论相比,国内的词典学理论也很是落后。如果我们仔细阅读《牛津》《韦氏》等国外词典,就会发现英语词典的释义与汉语词典相比更加注重规律性和系统性,它们的词典编纂者能够有意识的把诸如词的内涵意义、联想意义、搭配意义、同词反义、词义虚化等词义理论应用于词典义项的划分中,而《现汉》在这方面则稍逊一筹。

在上述3个原因中,语料库技术是最主要的原因。如果把上述100核心词放在语料库中检验,我们会发现汉语中核心词的义项数目基本和英语中相当。例如,笔者撰写的《语料库视野下的现代汉语“绿”义项分布研究》《语料库视野下的现代汉语“黄”义项分布研究》《语料库视野下的现代汉语“跑”义项分布研究》等一系列论文就从事实和理论方面说明了核心词的义项数目在汉语英语中中基本相当的情况。

注释:

① 为了说明本文所选词典是同一类词典,所以在统计表中统计了100核心词在《现汉》《现学》《汉大》《牛津》《韦氏》《汉大》《简明》《麦克》《朗文》等9部词典11个版本的义项数目,在具体比较义项分布规律时,则以《现汉》(第6版)、《牛津》《韦氏》为代表。另外,《郎文高阶英汉双解词典》直接脱胎于《郎文当代高级英语词典》(第3版),这是一部专为中高级英语学习者设计的词典;《麦克米伦高阶英汉双解词典》直接脱胎于《麦克米伦高阶英语词典》,它是由1834年成立于英国伦敦的麦克米伦出版公司出版,是一部专为高级英语学习者设计的词典,由于,笔者没有上述两部辞书的英语版,所以取它们的英汉双解版。

② 《汉大》是指《现代汉语大词典》,其出版说明介绍:“分上下两册,共收单字条目(含繁、异体字)1 500余条,多字条目10万余条,凡850万字,是我国目前同类词典中规模最大、收条最多、信息量最丰的大型语文工具书。”从规模和容量看,《汉大》都是《现汉》等汉语词典和《牛津》等英语词典的两倍之多,从这个方面说,《汉大》100核心词的义项应该非常丰富才是,然而正如“汉英词典100核心词义项数目比较表”显示《汉大》100个核心词的平均义项比《现汉》(第6版)仅高出2.2个,比《牛津》(第7版)少2.8个,比《牛津简明》少5.1个,这说明汉语类词典编纂者忽视了对词典中100核心词乃至常用词义项的丰富与补充。

③ 《牛津》(第7版)封底并没有明确介绍该版收词量是多少,但是《牛津》(第4版明确说明该版收词5700余条,《牛津》(第6版)收词80 000余条,在(第7版中有介绍说(第7版)比(第6版)多收9 000余条,据此我们推断《牛津》(第7版)收词89 000余条。

④ 义项数目统计说明:《现汉》等汉语词典不包括同形同音字的义项,不包括姓氏的义项;《牛津》等英语词典包括同形异义词的义项,在《牛津》等英语词典中,把不属于同一词性的词分列为两个词,但它们是同一个词引申出来的,所以我们看作一个多义词。另外,在《牛津简明英语词典》《麦克米伦高阶英汉双解词典中》在一些主义项下面又分列了次义项,这些次义项我们也计算在内。

⑤ 《朗文》在解释多义词时,如果一个单词在短语中具有独特意义,那么该词典也作为独立的义项列出。因此,《朗文》一列的数字有两个,“-”前的数字是《朗文》不包含短语中具有独特意义的单词的义项数目,“-”后的数字是包含短语中具有独特意义的单词的义项数目。

⑥ 《国语辞典》1936年开始出版,直到1945年编辑完成并全部出齐。尽管中国早在2 000多年前就开始了字典、词典的编纂工作,如东汉许慎的《说文解字》、清代的《康熙字典》等,但它们并不是现代语言学意义的词典。

⑦ 《现汉》(第5版)、《现汉》(第6版)核心词的姓氏义项不计算在内,同形同音词的义项不计算在内。

参考文献:

中国社会科学院语言研究所. 现代汉语词典[Z]. 北京: 商务印书馆, 2005.

中国社会科学院语言研究所. 现代汉语词典[Z]. 北京: 商务印书馆, 2012.

商务印书馆辞书研究中心. 现代汉语学习词典[Z]. 北京: 商务印书馆, 2010.

阮智富, 郭忠新. 现代汉语大词典(套装上下册)[Z]. 上海: 上海辞书出版社, 2009.

霍恩比. 牛津高阶英汉双解词典(第4版)[Z]. 李北达, 译. 北京: 商务印书馆, 1997.

霍恩比. 牛津高阶英汉双解词典(第7版)[Z]. 王玉章, 译. 北京: 商务印书馆, 2009.

韦迈乐. 牛津高阶英语词典(第7版)[Z]. 北京: 商务印书馆, 2007.

德拉·汤普逊. 牛津简明英语词典(第10版)[Z]. 外语教学与研究出版社引进出版, 2001.

梅利亚姆?韦伯斯特公司. 韦氏高阶英语词典[Z]. 北京: 中国大百科全书出版社, 2009.

英国培生教育出版集团. 郎文高阶英汉双解词典[Z]. 何银银,等译. 北京: 外语教学与研究出版社, 2006.

麦克米伦出版公司. 麦克米伦高阶英汉双解词典[Z]. 杨信彰,等译. 北京: 外语教学与研究出版社, 2005.

An investigation of the distribution of meaning items about the 100 core words in the Chinese and English dictionaries

LI Shichun

(Chinese Literature Department, Guangxi University, Nanning 530004, China)

Abstract: This paper first points out that the “the Contemporary Chinese Dictionary”, “Oxford”, “Webster ” etc are the same kind of the dictionary. Second, it briefly compares the 100 core words senses number and their distribution of meaning item. Finally, the author points out that 100 core words sense division is careless in the Chinese dictionary.

Key Words: Corpus; the 6th Edition of the Contemporary Chinese Dictionary; Core Word; the distribution of meaning item

[编辑: 汪晓]

收稿日期:2013?05?29;修回日期:2013?11?24

基金项目:广西大学“211四期区域文化传承创新与交流学科群”研究项目(211QYWH13Z04)

作者简介:李仕春(1973?),男,山东莒县人,广西大学教授,主要研究方向:语言理论,词汇学,词典学.

猜你喜欢
现代汉语词典语料库
基于语料库翻译学的广告翻译平行语料库问题研究
浅谈语料库分类及用途
国内外语料库建设研究简述
运用语料库辅助高中英语写作
现代汉语中艺术类行业语泛化现象研究
《现代汉语词典》字母词收录与修订情况分析
《现代汉语词典》第6版释义部分若干问题商榷
《现代汉语词典》释义与配例的关联性与认知效果分析
语料库与译者培养探索