李仕春
(广西大学文学院,广西 南宁 530004)
语料库视野下的现代汉语“绿”字义项分布研究
李仕春
(广西大学文学院,广西 南宁 530004)
文章以个案研究的形式,运用语料库技术和语言学中的词义感染理论,对“绿”字在现代汉语中义项的分布情况进行重新分析,认为《现代汉语词典》对“绿”字的解释存在漏收义项、漏收复字词条及其词义等问题。
语料库;词义感染;组合;聚合
以往词典对“绿”的释义,主要靠做卡片式的内省枚举法,这样做往往存在一些问题。例如:尽管现代汉语中的“绿”是一个使用频率很高的词,但是以《现代汉语词典》(第6版,以下简称《现汉》)为代表的汉语类词典中“绿”只有一个义项,真实情况是这样吗?本文以个案研究的形式,在语料库的基础上,通过定量与定性相结合的方法对“绿”字在现代汉语中的义项分布情况进行了描写,并在此基础上对《现汉》“绿”字的义项及其收词进行了献疑。
北京大学CCL现代汉语语料库有18类语料,分别是当代\口语,当代\史传,当代\应用文,当代\报刊\人民日报,当代\报刊\作家文摘,当代\报刊\市场报,当代\报刊\故事会,当代\报刊\读书,当代\报刊\读者,当代\报刊\青年文摘,当代\文学,当代\电视电影,当代\网文,当代\翻译作品\应用文,当代\翻译作品\文学,当代\翻译作品,现代\戏剧,现代\文学。“绿”字在语料库中有33798词次,为了保证语料全面真实并且均衡地反映“绿”字在现代汉语中的分布情况,我们将18类语料全部下载,并导入到Access数据库,建立“绿”字数据库。
打开“绿”字数据库,点击【设计】,在“字段名称”栏中,把字段名称依次改为“例句”、“义项”、“复字词”、“现汉有”、“频次”、“专有名词”、“备注”、和“出处”。“数据类型”栏内选择“文本”,保存设计。再次打开“绿”字数据库,便出现一张表(见表一)。表中各栏目的具体标注说明如下:
一是义项栏的标注。“绿”字在《现汉》中只有一个义项,我们标注为“1”,“0”表示专有名词的义项不能归入本文所列的任何义项。数据库中出现的“绿”字的新义项是指当我们把《现汉》中“绿”字唯一一个义项放在语料库中进行检验时,发现它不能涵盖所有的语料,从而根据实际情况对“绿”的义项进行归纳得出的另外5个义项,分别是:“无公害、无污染”标为2;“节约能源减少损耗”标为3;“便捷地、快速地”标为4;泛指绿色植物标为5(多是单用);泛指颜色标为6。
二是复字词栏目的标注。凡语料中出现的复字词(包括专有名词)都标注于此栏的对应位置,不重复标注,共得出607个复字词。
三是其他栏目的标注。“现汉有”标“y”意思是《现汉》把该复字词立为条目,“s”表示该复字词是词但《现汉》没收;频次表示该复字词在CCL现代汉语语料库中出现的次数;专有名词栏目中,“人名”标为1,“官职名”标为2,“地名”标为3,“其他专有名词”标为4。
通过对CCL语料库中33798词次“绿”字语料的穷尽性分析,我们得出2516条和“绿”字意义无关的语料,在这些语料中“绿”只起记录音节的作用,它们多是专有名词,如绿川英子,贺绿汀等。
在和“绿”字意义有关系的31282语料中,我们分离出绿字组成的607个复字词,本文主要分析字头是“绿”字的复字词:(1)形像草和树叶茂盛时的颜色,由蓝和黄混合而成。构词能力最强,在31282词次语料中,共24462词次,约占78.20%。《现汉》中收的有关该义项的“绿”字复字词18个,使用频次如下:
表1
绿菜花16(表示“绿菜花”在CCL语料库中有16条语料,以下同此)、绿茶377、绿灯982、绿地981、绿豆 498、绿化 3351、绿篱 38、绿帽子 62、绿盘0、绿茸茸23、绿色9754、绿生生 3、绿阴24、绿茵222、绿荫516、绿莹莹32、绿油油263、绿洲693。
《现汉》中没有收录的“绿”字词条:
绿苍苍5、绿草471、绿沉沉4、绿葱葱8、绿丛丛6、绿豆芽18、绿光134、绿乎乎2、绿化带168、绿化费20、绿化林14、绿化率40、绿化区16、绿脸36、绿茫茫1、绿苗苗2、绿蓬蓬1、绿森森5、绿闪闪3、绿树938、绿水392、绿丝丝1、绿苔50、绿汪汪7、绿兮兮1、绿压压1、绿漾漾1、绿意盎然25、绿茵茵64、绿荫荫10、绿盈盈4、绿荧荧7、绿幽幽13、绿悠悠1、绿黝黝2、绿釉13、绿藻39、绿臻臻1。
按照《现汉》的收词原则及“绿”字第一个义项的收词情况,“绿”字第一个义项应补收以下几个复字词:
【绿化带】在语料库中有168词次,应考虑补收,释义为:“种植树木花草的带状区。”
【绿茵茵】在语料库中有64次,使用频次很高,应补收,解释为:“形容浓绿而稠密。”
【绿洲】增补一个义项。《现汉》中“绿洲”的解释是:沙漠中有水、草的地方。
语料库中,“绿洲”出现了969例,其中除作专有名词的有71例外,符合《现汉》释义的有693例,此外还有205例《现汉》的义项难以涵盖,例如:
①难怪那些月球探险者们赞美它是“漂浮于广阔宇宙空间中最美丽的绿洲”。
②经济要发展,书市也要繁荣,神州大地应当成为葱翠的“文化绿洲”。
由实际语料可知,“绿洲”用于以下语境:喻指有希望、有生命力的地方;没有受污染、适宜人居住的地方等。因此,《现汉》所收【绿洲】的义项涵盖不了绿洲的实际用例,应改为:
【绿洲】多指沙漠中有水、草的地方。多用于比喻生机盎然的地方:军营文化绿洲|心灵的绿洲|精神文明的绿洲。
此外,语料库中专有名词和固定词组有3096词次,使用频率约占10.0%,《现汉》收了以下几个专有名词:绿内障1、绿盘1、绿松石80、绿视率1、绿头鸭30、绿柱石3。
《现汉》中没收的由“绿”字组成的专有名词和固定词组有:绿宝石148、绿党118、绿矾12、绿猴4、绿化办13、绿金21、绿卡族4、绿孔雀13、绿鹭1、绿萝20、绿毛龟47、绿脓杆菌19、绿皮书17、绿区154、绿色股票13、绿色银行70、绿丝面2、绿条101、绿线59、绿鳕2。
根据《现汉》收词原则,我们认为《现汉》“绿”字的复字词应删掉使用频次很低且在现代汉语中基本不用的“绿柱石3、绿内障1、绿视率1”3个。增添“绿矾、绿皮书”等。
【绿矾】无机化合物,是含有七个分子结晶水的硫酸亚铁,蓝绿色结晶体。用来制染料、墨水和农药等,又可做媒染剂,医药上用来治疗贫血。
【绿皮书】绿皮书是政府就某一重要政策或议题而正式发表的咨询文件,起源于英美政府。因为报告书的封面是绿色,所以被称为绿皮书。绿皮书被视为政府对国民征询意见的一种手段。[4]
在31282词次语料中,还有3709词次约占11.86%的语料不能归入《现汉》“绿”的上述第①个义项下,为此,我们认为根据实际情况,《现汉》中“绿”还应该补收以下5个义项:
一是无公害、无污染。“绿”的这一义项在语料库中有1992词次,占总数的6.4%,经常应用于以下词语中:绿色食品885、绿色壁垒12、绿色标志24、绿肥156、绿肺6等。
【绿色】在《现汉》中有两个义项:①绿的颜色。②属性词,指符合环保要求,无公害、无污染的。语料库中“绿色”的义项一有9754词次,义项二有2084词次。
【绿肥】《现汉》的释义是:把植物的嫩茎叶翻压在地里,经过发酵分解而成的肥料。但是,大量语料显示,能做“绿肥”的不仅仅是“植物的嫩茎叶”,凡是“绿色植物”都可以做。“绿肥”在语料库中共有137条,其中符合这一义项的有69条,例如:
①春耕前,下山的农民回去了,而采摘了果实后的蕃茄秧、豆秧等被犁到土里,成了绿肥,对水稻的成长有利。
②尽量依靠农作物,秸秆还田、牲畜废肥和豆科作物轮作绿肥,以及场外的有机肥料,矿物肥料来维持。
所以这一义项应修改为:把绿色植物的茎叶翻压在地里或沤在水里,经过发酵分解而成的、对农作物没有害的肥料。另外,“绿肥”还有68条,不属于这个义项,例如:
①贵州广种绿肥弥补化肥供应缺口。
②余下的大种油菜、蚕豌豆、马铃薯、绿肥等。
③他向当地老乡打听,老乡告诉他,这种草叫苦豆子,是一种很好的绿肥。
因此,“绿肥”还可以再加上一个义项:②用作肥料的绿色植物。
“无公害、无污染”本来是复字词“绿色”的一个义项,但是如上文所示“绿肥”、“绿肺”中的“绿”在实际语料中也有“无公害、无污染”义。另外,一些公司,特别是食品公司在取名的时候也用了“绿”的这一义项,例如:烟台绿科高新阻燃材料厂、绿宝产业开发有限公司、绿得八宝粥、绿养康保健制品(深圳)有限公司、“国际绿十字”环保组织等。这些以“绿”命名的公司和以“绿色”命名的公司的用意是一样的,都是取“绿”的“无公害、无污染”义,例如:“北京绿色食品销售中心、北京绿色源泉环境科技有限公司、北京百龙绿色科技企业总公司、北京神龙绿色食品公司”。因此,我们认为“无公害、无污染”不仅仅是“绿色”的比喻义,也应该是“绿”的语素义,是“绿”的一个新义项。“绿”的这一义项的产生是符合词义演变中的词义感染规律的(具体见下文)。
二是节约能源减少损耗。“绿”的这一义项在语料库中有287词次,占全部语料的0.92%。
客观事物在环保的同时,又有节约的功能,当“绿色”经常用来指称具有节约功能的客观事物时,“绿色”也就有了“节约能源减少损耗”之义,例如:
①许宪春介绍说,“绿色GDP”是在GDP基础上把资源耗减成本和环境损失的代价扣除。
②传承奥运精神,展示北京“科技奥运、绿色奥运、人文奥运”的理念,让世界了解中国,让中国走向世界。
③据专家测算,我国如果能在“九五”期间实施“绿色照明工程”,可以减少电力建设投资490-630亿元。
不仅“绿色”有“节约能源减少损耗”义,“绿”也有,例如:“北京飞驰绿能电源技术有限公司、烟台绿科高新阻燃材料厂”等专有名词中的“绿”就有此义,另外近年出现的新词语也有此义,例如:
【绿电】是指利用水利、风力、太阳能、潮汐等可再生能源发电。
①北京地区惟一的风力发电场--官厅风力发电场,43台机组已经组装完毕开始发电,每年向北京提供1亿度“绿电”。
因此,我们认为“节约能源减少损耗”是“绿”的词义,“绿”的这一义项是由“无公害、无污染”义引申出来的。
三是便捷地、快速地。“绿”的这一义项在语料库中有904词次,频率是2.89%。
“绿色”除了上文说过的“无公害、无污染”、“节约能源减少损耗”义外,还有一个“便捷地、快速地”义,主要用在“绿色通道”这个词语中,有172例。此外,绿灯、绿卡、绿点等词语中的“绿”也有“便捷地、快速地”之义,如:
【绿灯】《现汉》的意思是:安装在交叉路口,指示可以通行的绿色信号灯。
然而,“绿灯”在语料库中有541例,其中只有123例用《现汉》解释的义项说得通,其余的391例都是绿灯的比喻义,例如:
①社论一路绿灯通过社领导、总政领导。
②银行信贷等方面对外企一视同仁,让其享受到与内资企业相同的“绿灯”待遇。
③尔后,他先后打了一连串的电话,致使“呼家面”长驱直入,一路绿灯,优先进入了省城的市场。
因此,《现汉》漏收了【绿灯】的比喻义,应该予以补充:比喻办事得到特殊照顾可以畅通无阻。
“绿”在绿灯、绿卡、绿点等词语中,刚开始用其本意:绿灯就是绿色的灯,绿卡就是绿色的卡,绿洲就是沙漠中长有绿色植物的洲,但是后来就偏重于指他们所表示事物的功能,产生了比喻义“便捷地、快速地”。随着使用频率的增高,“绿”本身也就有了“便捷地、快速地”之义。
四是指绿色植物(多是单用)在语料库中有43条,占 0.18%,主要和“植绿”、“护绿”、“爱绿”、“添绿”、“播绿”等词语搭配,例如:
①内蒙古呼和浩特市土默特左旗境内的1000亩大青山山前冲积平原植绿。
根据当代认知语言学中的转喻理论,“绿”由绿色植物的属性“植物的绿色”转指拥有这种属性本体的绿色植物本身,是符合人类认知规律的。
五是泛指颜色。绿的这一义项在语料库中有483条,占1.5%,主要出现在下列词语中:红男绿女、花花绿绿、灯红酒绿、红红绿绿、穿红戴绿。
“绿”在《现汉》中只有一个义项,而本文第3节通过分析语料表明“绿”在《现汉》中还可以增加5个义项。在增加的5个义项中,第4、5个义项是由“绿”已有的义项引申出来的,符合词义引申的规律:义项4由绿色植物的属性“绿色”转指拥有这种属性本体的绿色植物本身,既符合词义引申规律也符合人类认知规律。而义项5“绿”由专指一种颜色——绿色到泛指颜色,也是符合词义由具体到一般的引申规律的。
“绿”新增加的1、2、3个义项和“绿”已有的义项没有关系,它们是不是“绿”字特有的呢?我们来看下文:根据伍铁平(1984)考证:“汉语中的‘夏’本来的意义是‘大’,如诗经中的‘夏屋’的意义就是‘大屋’”。杨雄在《方言》中写道:‘自关而西,秦晋之间,凡物之壮大者而爱伟之,谓之夏。’后来‘夏’感染了‘屋’的意义,本身也表示‘大屋’了。如《楚辞》中的句子‘曾不知夏之为丘兮’。王逸注道:‘夏,大殿也’。”[1]此外,英语中的take,基本义是“拿、取”的意思,当它与“bus,train,boat”等词搭配时,就有“乘、坐”的意思。由此可见,“绿”的上述义项不是孤例,而是语言中一种普遍现象。
针对上述现象,国内很多学者用词义感染或词的搭配义来解释,例如:朱庆之(1980)说:“所谓词义沾染是指不同的词处在同一组合关系或聚合关系而发生的词义上的相互渗透。这种渗透可能导致一方或双方增加新的义项或词义的完全改变。”[2]伍铁平(1984)指出:“词义感染包括‘组合感染’和‘聚合感染’。”“组合感染”是指由于二词相连所产生的词义的感染现象,“聚合感染”(或“联想感染”),即由于词的组成部分跟另一词的组成部分相同,受另一词影响也获得与该词意义相同或相近的意义。[1]章宜华(2011)认为,“语词的意义可以通过搭配关系来表达,即搭配可以生成有别于语词本义的新义”。[3]
无论是感染说还是搭配说,它们的共同点是都只从语言的角度出发认为词的新义来源于与之搭配的另一方的词义。在我们看来,这一说法欠妥,其原因主要在于考察词义生成的角度过于单一。词义感染说、搭配说最早提出者应该是英国学者杰弗里·利奇,他在专著《语义学》中指出:“搭配意义是由一个词所获得的各种联想构成的,而这些联想则产生于与这个词经常同时出现的一些词的意义。”[5]利奇在论证词的搭配意义时特别注重联想在产生这种意义中的作用,而中国的学者在探讨词的搭配义时却忽略了人的主观联想,我们认为词义的生成是客观、主观、语言等多种因素相互作用的结果,而词的搭配义更是如此,我们在探讨词的搭配义时更要特别注意影响词义的主客观因素。例如:
“绿灯”本义安装在交叉路口的绿色信号灯,它的功能是用来指示通行。当用于别的领域时,产生了引申义,这属于功能引申:比喻办事得到特殊照顾可以畅通无阻。如果仅限于此,我们可以说“绿灯”有“便捷地、快速地”之义,但当语言中出现了其他复字词诸如绿卡、绿点、绿色通道等词语并且运用十分普遍的时候,在人们的主观联想中“绿”就有“便捷地、快速地”之义,于是由于人的主观联想的参与“绿”也就产生了比喻义“便捷地、快速地”。我们认为正确的说法应该是“绿”的“便捷地、快速地”义来源于“它修饰的事物的功能义”。
我们立“绿”的“便捷地、快速地”义的另一个根据是《现汉》自身的条例:《现汉》“黄”的义项2指黄金:黄货—黄白之物。根据我们的《语料库视野下的现代汉语“黄”字义项分布研究》[5]一文对“黄”的这一义项的研究,发现“黄”的这一义项仅仅出现在黄货、黄白之物、黄鱼等复字词中,如果现代汉语中只有“黄货”一个复字词,我们可以认为“黄货”的意义是指“黄金或黄金饰物”,但是现代汉语中“黄”作为“黄金”的意思还出现在“黄白之物”、“黄鱼”中。当“黄白”、“黄鱼”等也有“黄金”的意思后,在人们的印象中“黄”便有了语素义“黄金”,因此《现汉》把它立为“黄”的义项:指黄金。“黄”的这一义项和“绿”差不多,所以根据《现汉》自身的条例,我们认为《现汉》也应收“绿”的上述义项,并把它们作为“绿”的语素义。由于语素义由于不能单独运用,所以它们构成的词很少。
另外在第3节中,我们列出的《现汉》漏收的“绿”的“无公害、无污染”、“节约能源减少损耗”等2个义项,也和“绿”的“便捷地、快速地”义形成的原因差不多。在牛津、朗文、柯林斯、韦氏、柯林斯、韦氏等英语词典中类似汉语的“绿”的green有5到10个义项,而“绿”在《现汉》等汉语类词典中只有一个义项“像草和树木茂盛时的颜色,由蓝和黄混合而成”。无论从使用频率看,还是从不同民族的共同心理特征看,现代汉语中的“绿”都不应该只有一个义项,所以我们建议《现汉》对“绿”的释义应该增加“2.无公害、无污染”、“3.节约能源减少损耗”、“4.便捷地、快速地”、“5.泛指绿色植物(多是单用)”、“6.泛指颜色”等 5个义项。
新理论、新方法是推动词典编纂不断进步、不断完善的两大引擎。本文运用语料库技术和语言学中的词义感染理论,对“绿”字在现代汉语中义项的分布情况进行了重新分析,发现《现汉》对“绿”字的解释存在漏收义项、漏收复字词条及其词义等问题。本文的研究证明了张志毅(2005)先生的观点:“今天的语料库已经成为能量巨大的语言样本集。它正在印证、充实、修订、改写甚至颠覆以往的辞书释语。它也正孕育出、孕育着更现代,更可信的辞书。”[6]
[1]伍铁平.词义的感染.语文研究[J].1984(03):191-205.
[2]朱庆之.“敢”有“凡”义及其原因[J].古汉语研究,1980(02):47.
[3]章宜华:基于用户认知视角的对外汉语词典释义研究[M].北京:商务印书馆,2011.
[4](英)杰弗里·利奇.语义学[M].上海:上海外语教育出版社,1996.
[5]李仕春,强利苗.语料库视野下的现代汉语“黄”字义项分布研究[A].第11届全国古代汉语学术研讨会会议论文集[C].2013.
[6]张志毅.辞书编纂现代化的基础理论[A].张绍麒主编.辞书与数字化研究[C].上海:上海辞书出版社,2005.
Corpus-based Study on the Distribution of Meaning Items in Modern Chinese Character"Lv"
LI Shi-chun
(Department of Chinese Literature,Guangxi University,Nanning Guangxi,530004)
In the form of a case study,by using the corpus linguistics technology and the theory of meaning infection,the article studies the distribution of meaning items in modern Chinese character "Lv".By the principle of vocabulary of Contemporary Chinese Dictionary,the research results indicate that Contemporary Chinese Dictionary needs to plus the meaning items of"lv"and to plus its compound words and the meaning items of its compound words.
corpus;theory of meaning infection;combination;polymerization
H146.1
A
1674-0882(2013)05-0062-05
2013-08-15
广西大学“211四期”区域文化传承创新与交流学科群研究项目(211QYWH13Z04)
李仕春(1973-),男,山东莒县人,博士,教授,研究方向:语言理论、语言学史、语言学学术思想史等。
〔责任编辑 冯喜梅〕