语料库视野下的现代汉语“龟”字义项分布研究

2015-12-16 06:09赵娇玥
教育教学论坛 2015年48期
关键词:义项例句现代汉语

赵娇玥

摘要:本文运用了语料库的方法,并采用定量研究的方式,对“龟”字在现代汉语中的义项分布情况进行了再次描写和研究,最终建议在《现代汉语词典》等词典释义的基础上增收4个义项。

关键词:语料库;龟;新义项

一、引言

《现代汉语词典(第6版)》(以下简称《现汉》)作为辞书经典,随着时代的发展,难免出现义项收录不完全的现象。由于时代的局限性,其在收词立项方面也有待补充和完善。“龟”字在《现汉》中只有1个义项,与其他汉语类中型语文性词典所收“龟”字义项相比大同小异,基本无变化。本文参照了强利苗(2012)推荐的研究方法——定量定性相结合的方法,在使用CCL(北大语料库语料库)的基础上,建立了“龟”字数据库,并对其逐条标注,研究其在现代汉语中的义项分布情况,发现了“龟”字在现代汉语中还有4个新义项未被《现汉》收录。

二、研究方法及步骤

(一)下载不同类别的语料

本文所用的语料库为北京大学中国语言学研究中心研制的北大语料库——CCL。该语料库分为现代汉语语料库和古代汉语语料库,现代汉语语料又分为当代语料和现代语料,共19类。我们可以下载语料查找“龟”的新义项。“龟”的选取语料:当代语料有:口语、史传、应用文、报刊精选、人民日报、作家文摘、市场报、故事会、新闻报、读书、读者、文学、电视电影、相声小品、网络语料和翻译,现代语料有:文学,共选取17类语料。

为保证下载的语料全面、真实地反映“龟”字在现代汉语中的分布情况,本文将17类语料全部分类下载。下载方法:第一步:打开CCL语料库高级查询页面建立查询表达式。第二步,建立查询表达式,再次点击CCL现代汉语语料库页面的“查找”得出当代语料中“口语”语料25条。用同样的方法得出其他16类当代语料的下载数目:

当代下面“龟”有3565条语料:

当代|口语 “龟”有25条

当代|史传 “龟”有28条

当代|应用文 “龟”有534条

当代|报刊|精选 “龟”有147条

当代|报刊|人民日报 “龟”有388条

当代|报刊|作家文摘 “龜”有122条

当代|报刊|市场报 “龟”有88条

当代|报刊|故事会 “龟”有4条

当代|报刊|新闻报 “龟”有639条

当代|报刊|读书 “龟”有203条

当代|报刊|读者 “龟”有177条

当代|文学 “龟”有774条

当代|电视电影 “龟”有103条

当代|相声小品 “龟”有18条

当代|网络语料 “龟”有133条

当代|翻译 “龟”有170条

现代下面“龟”有50条语料:

现代|文学 “龟”有50条

由于CCL现代汉语语料库里“龟”的语料共有3664条,删除无出处的49条语料,逐类筛选后留下“龟”的语料3615条,其中当代3565条,现代50条,并对其分析。

(二)建立“龟”字数据库并对“龟”字义项进行标注

1.建立“龟”字数据库。首先,建立Access数据库。打开Access数据库,在【文件】→【获取外部数据】→【导入】项目下,将准备好的语料导入Access中,建立“龟”字数据库。接着,对数据库进行相应的设置,打开“龟”字数据库,点击【设计】,在“字段名称”栏中,把字段名称依次改为“序号”、“例句”、“义项”、“复字词”、“备注”、“专名”、“出处”、“文章类别”及“作者”。具体见下表。

2.具体标注方法说明。上表中各栏目具体标注说明如下:(1)《现汉》中已有义项的标注。《现汉》里“龟”的义项只有1个:①名爬行动物,身体长圆而扁,有坚硬的壳,四肢短,趾有蹼,头、尾巴和四肢都能缩入甲壳内,常见的有乌龟。以上义项在数据库“义项”一栏分别标注为:1。(2)新义项的标注。新义项也标注在“义项”一栏,在标注中发现“龟”的新义项(指《现汉》没有的义项)标注为2、3、4、5。(3)专有名词的标注。数据库“专名”一栏的标注:“人名”标为1,“地名”标为2,“官职名”标为3,“其他专有名词”标为4。(4)复字词的标注。凡语料中第一次出现的复字词都标注于此栏的对应位置。(5)数据库中“备注”、“出处”、“文章类别”及“作者”等栏做相应的标注。

三、“龟”字义项的分布情况

(一)“龟”字在《现汉》中已有义项在语料库中的分布情况

名爬行动物,常见的有乌龟。在所建数据库中包含该义项的句子共有1912条,约占所建数据库总数的52.891%。由该义项构成的复字词有:老龟、海龟等。

(二)“龟”字专有名词在语料库中的分布情况

通过对CCL语料库中筛选得出“龟”字的专有名词的语料有831条,约占所建数据库总数的22.988%。

表示人名的语料有224条,约占所建数据库总数的6.196%,复字词:陆龟蒙、彭龟年;表示地名的语料有244条,约占所建数据库总数的6.750%,复字词:龟城、龟山等;其他专有名词语料有363条,约占所建数据库总数的10.041%,复字词:龟船、金龟岩等。

(三)“龟”字新义项在语料库中的分布情况

在所建的“龟”字数据库中,“龟”字在《现汉》中已有的义项共有1912条,约占所有“龟”字语料的52.891%。专有名词的语料有831条,约占所建数据库总数的22.988%。除此之外,还有872条新义项语料,占数据库的24.121%,未被《现汉》所囊括。因此,本文建议《现汉》在再次修订时能够增收“龟”的以下4个义项。

1.名留学归国人员。在所建数据库中包含该义项的句子共有37条,约占所建数据库总数的1.024%。由该义项构成的复字词有:“海[龟]”、洋龟。

例句:也是偶然,参加面试的申请者之中我是唯一一个拥有留洋经历的“海[龟]”。(当代\网络语料\网页\C000022.txt)

2.名骂人的话。在所建数据库中包含该义项的句子共有604条。约占所建数据库总数的16.708%。由该义项构成的复字词有:龟儿子、龟孙子等。

3.名男性生殖器。在所建数据库中包含该义项的句子共有25条,约占所建数据库总数的0.692%。由该义项构成的复字词有:龟头炎、龟头。

例句:要注意阴茎[龟]头部是否有硬结、丘疹、水泡、溃疡,睾丸是否有肿物、结节及疼痛……(当代\应用文\健康养生\沈倩生活健康密码.txt)

4.名方士术数,占卜,星象。在所建语料库中包含该义项的句子共有34条,约占所建语料库总数的0.941%。由该义项构成的复字词有:龟兆、龟蛇、蓍龟。

例句:第四种是蓍[龟],这是中国古代占卜用的两种主要方法。(当代\应用文\社会科学\中国哲学简史.txt)

四、结语

综上所述,本文认为《现汉》“龟”字释义应调整为:①名爬行动物,身体长圆而扁,背部隆起,有坚硬的壳,四肢短,趾有蹼,头、尾巴和四肢都能缩入甲壳内。多生活在水边,吃植物或小动物。种类很多,常见的有乌龟。②名留学归国人员。③名骂人的话。④名男性生殖器。⑤名方士术数,占卜,星象。

本文认为以上论证和分析一方面证明了《现汉》在收词方面的不完善之处,另一方面证明了汉语中语文性词典编纂引进语料库技术的必要性。

参考文献:

[1]胡明扬,谢自立.词典学概论[M].北京:中国人民大学出版社,1982.

[2]张志毅,张庆云.词汇语义学[M].北京:商务印书馆,2010.

[3]黄建华.词典论(修订版)[M].上海辞书出版社,2001.

[4]李仕春.汉英词典中100核心词义项分布研究[J].北华大学学报,2013,(06).

[5]杜翔.时代性 准确性 系统性——论第5版《现代汉语词典》释义的修订[J].辞书研究,2006,(1).

猜你喜欢
义项例句现代汉语
“楞”“愣”关系及“楞”在现代汉语中的地位
评《现代汉语词典》(第6版)
现代汉语中词汇性的性范畴
两用成语中的冷义项
北大版《现代汉语》增订本)出版