基于语料库的示形量词“条”研究

2020-08-14 09:58颜郁澎
现代语文 2020年5期
关键词:语料库

颜郁澎

摘  要:示形量词是能显示所称量名词的外形特征的一类量词。构建示形量词的原型范畴,有助于解释量词的超预期用法,为词典编纂、汉语教学提供参考。基于BCC语料库的统计数据,依据与“条”共现率高的名词离其原型更近的原则,从事物类别和语义特征两个维度,构建示形量词“条”的原型范畴模型。量词“条”与“道路类”事物的搭配最为常见;具备[+个体]、[+扭曲]、[-生命]、[+具象]、[+方向]等特征的名词,分布在范畴更内层的位置。日常生活相关度、认知转换难度、意象图式清晰度等因素,都可能影响“条”原型范畴的分布。

关键词:示形量词;“条”;语料库;原型范畴

名量词中有一类能显示所称量名词外形特征的量词,通常被称为示形量词。示形量词在与名词进行双向选择时,其原型范畴可能会发生动态变化,于是就出现了一些超预期的量名短语,如“一条心”“一条汉子”等,非长条状的名词也被量词“条”称量了。基于真实语料,对示形量词称量的名词进行统计归纳,构建该量词的原型范畴模型,将有助于探究超预期搭配存在的合理性。本文拟以常用的典型示形量词“条”为例,对此试作探讨。

量词“条”历史悠久,早在东汉时期就已从本义“树木细长的枝条”和引申义“条令、条款”开始虚化出量词含义[1]。在现代汉语中,“条”的使用频率很高,在《2018年年度媒体高频词汇表》中排在第208位(前0.77%)[2]。朱晓军[3]、史天冠[4] 都对量词“条”做过定性研究,他们认为,通过隐喻、暗喻、意象图式等认知机制转换得到的搭配,是“条”范畴的边缘成员。与量词“条”共现率更高的名词在人脑中更容易被激活,更能代表汉语使用者对“条”的认知印象,距离“条”原型范畴核心也越近。

本文基于名词和“条”的共现率,建立“条”的原型范畴模型。考虑到语料语言的规范性,在BCC语料库《人民日报》目录下检索“‘条+名词”的搭配,共获得10000条语料;然后进行人工核对,剔除非量词用法和无法判断“条”称量哪个名词的语料,又得到9714条语料。对这些语料进行分类统计,从所搭配名词的事物类别和语义特征两个维度,建立“条”的原型范畴模型,并对范畴内分布作出解释[5]。

一、量词“条”的基本义项

量词“条”有2个基本义项:“条1”称量具象条状物,虚化后的“条2”称量抽象条状物。前人对“条1”的

研究比较充分,划分出更细致的小类,并探讨小类义项与本义“枝条”的关系、出现时间和发展历史。对“条2”则不再进行细分和讨论,或只解释“条2”称量虚化的“分项”。比如,孟繁杰将“条1”划分为地理、布帛、木质、金属、动物、人体、其他等多类,但对“条2”并没有划分,文中解释是因为“条2”

搭配的名词不多[1]。

通过统计发现,语料中“条1”共出现7729次,“条2”共出现1985次。乍看之下,“条2”搭配的名词的确不多,约占总数的20%,但这只是不剔除重复项的数据。许多名词或词根反复出现多次,如果把真正能被“条”称量的词根提取出来,进行同项合并,如将“路子”“铁路”“成功之路”等合并为“条+路”一个项目类别,那么,“条1”共搭配了201个名词,“条2”共搭配了140个名词,后者约占总数的41%,其比重大大增加。由此可见,“条2”能搭配的名词并不少,只是使用频率较低,因此,“条2”有进一步细分的必要。

通過对语料的考察,本文认为,“条2”称量的名词除了“分项”之外,还有一类“符号串”。“分项”是被从一个有机整体里分出来的某个条目,常常还有与之并列的若干其他条目,它是整体的一个有机组成部分。“符号串”则是由许多字符或其他符号排列成的条状抽象物,可以独立存在,没有一个需要依附的整体。例如:

(1)因此1998年宪法附加了几条临时条款……

(2)《干部任用条例》规定的六条原则……

(3)《孙子兵法》邮票全套5枚,每枚各选一条警句……

(4)那就发一条语音短信吧。

例(1)中的“条款”不是独立存在的,它们附属于“宪法”这一整体;例(2)中的“原则”也是相互依存的,都属于“条例”的一部分。事实上,通常情况下,“条款”“条例”“规定”很少只有一条,而是隶属于某份有一系列条目的文件;即使是单独的补充条目,还是可以与已颁发的条目形成整体。例(3)、例(4)则与之不同。在例(3)中,每“一条警句”之间是互相独立的;在例(4)中,“一条语音短信”也与其他语音短信无关。它们都不属于一个更大的整体。“警句”“语音”“短信”等跟“条”搭配的基础是,它们是由多个单一的文字或语音符号连成的符号串,而符号串则可以视为长条物。

二、量词“条”原型范畴的模型构建

(一)“条”事物类别原型范畴

我们不妨将具象量词“条1”和抽象量词“条2”所搭配的名词,按照事物类别进一步细分。“条1”所搭配的名词可分为八类,包括道路(3563)、线绳(2154)、生物(796)、山川(629)、纺织(340)、工具(187)、建筑(49)、天象(11)。“条2”所搭配的名词大致可分为两类:分项(1405)和符号串(580)。括号中的数字则代表该类事物在样本语料中出现的频次。基于以上数据,我们从事物类别的维度来构建“条”的原型范畴,具体如图1所示:

从图1可以看出,在具象条状物中,位于范畴最核心的是“道路类”事物,约占样本总数的37%,它主要包括交通线路、工程线路、理论道路等。例如:

(5)一条公路

(6)1000万条塑料包装袋工程

(7)一条经济、社会、生态效益三统一的发展道路

其次是“线绳类”事物,约占样本总数的22%。除了绳索、丝线之外,还有一些由点连成线的事物,也可以归在此类。例如:

(8)一条金项链

(9)一条绿色的屏障

接着是“生物类”,约占样本总数的8%,它主要包括人、动植物及其器官。例如:

(10)一条好汉

(11)几条蛇

(12)一条腿

(13)半条黄瓜

然后是“山川类”,约占样本总数的6%,它主要包括河流、沟壑等。例如:

(14)数条支流

(15)这条山谷

再外层是“纺织类”,约占样本总数的4%。例如:

(16)一条飘带

再往外是“工具类”,约占样本总数的2%,它主要包括交通工具、家具、农具、兵器等。例如:

(17)四条渔船

(18)一条板凳

(19)一条扁担

(20)十来条枪

较为边缘的是“建筑类”和“天象类”,两者加起来约占样本总数的1%。例如:

(21)一条拦河坝

(22)一条彩虹

在抽象条状物中,位于范畴较内部的是“分项类”,约占样本总数的14%,如例(1)、例(2)。位于范畴较外部的是“符号串类”,约占样本总数的6%,如例(3)、例(4)。

整体来看,“道路”是最符合人们认知中量词“条”形象的原型,其次是“線绳”。“条2”称量的抽象事物“分项”虽然需要认知转换才能呈现“长条形”,也处于较中心的地带;但是以“条”的本义“枝条”为代表的植物,实际仅有19条语料,反而移到了范畴边缘。本义代表的事物“枝条”可能是“条”最初的范畴原型,但不一定是现代汉语“条”形象范畴的核心。从这一点可以看出,示形量词的原型范畴分布不一定与认知机制转换必然相关,范畴核心不一定就是本义,甚至是不固定的,原来位于范畴边缘的名词有可能往更核心的地方移动,原来位于范畴核心的名词也可能被淘汰到边缘。

(二)“条”语义特征原型范畴

从语义特征的角度来看,量词“条”所搭配的名词具有五个主要区别特征。除了区分“条1”“条2”的[±具象]之外,“条1”称量的名词还有[±个体]、[±扭曲]、[±生命]、[±方向]四个区别特征,“条2”称量的名词有[±个体]的区别特征。基于具备某一特征的名词在样本中所占的比例,我们再从区别特征的维度来构建“条”的原型范畴,具体如图2所示:

总体上看,搭配“条1”的[+具象]名词占所有语料的80%,如例(5)~例(22);而搭配“条2”的[-具象]仅占20%,如例(1)~例(4)。

就分义项而言,“条1”称量的具象名词中,具备[+个体]特征的名词占了绝大多数,如例(23);而[-个体]仅有36个,如例(24)。

(23)一条街

(24)一条烟

具备[+扭曲]特征的名词高达97%,如例(25);而[-扭曲]仅占3%,如例(26)。

(25)一条麻绳

(26)三条肋骨

具备[-生命]特征的名词高达90%,如例(27);而[+生命](基本等于生物类)仅占10%,如例(28)。

(27)一条短裤

(28)两条耕牛

具备[+方向]特征的名词占了68%,道路类、山川类基本都是,其他类别如例(27)~(30);而[-方向]占了32%,线绳类、天象类基本都是,其他类别如例(18)、例(26)、例(31)、例(32)。

(29)一条耕地的铁犁

(30)一条坎儿井

(31)两条毛巾

(32)一条枕木

在“条2”称量的抽象名词中,具备[+个体]特征的名词(即分项类)占71%,如例(1)、例(2);而[-个体](即符号串类)仅占29%,如例(3)、例(4)。与具象名词一样,抽象名词也是[+个体]多于[-个体]。

从图2可知,具备 [+个体]、[+扭曲]、[-生命]、[+具象]、[+方向]等特征的名词,在“条”原型范畴中位于靠近核心的位置,而具有相反特征的名词则位于靠近边缘的位置。

在多对区别特征中,占比差距更大的,即在图2中跨度更大的,是更明显的区别特征,更能影响名词在“条”原型范畴中的位置。一个名词能被“条1”称量,最重要的是具有[+具象]的特征,接下去依次是[+个体]、[+扭曲]、[-生命]、[+方向]等特征。如果一个名词是[-具象]的,那么它一般不能进入“条1”的范畴。如果一个具象名词是[-个体]的,那么它可能位于“条1”范畴的边缘位置;只是特殊原因使它进入了这个范畴,人们在语感上会觉得它是特例。如果一个具象名词是[-方向]的,它可能会位于范畴较中间的位置,不会让人觉得它与“条”搭配很突兀。换句话说,一个名词能不能被“条1”称量,跟它是不是具象的、是不是个体关系很大,跟它能不能扭曲、有没有生命关系比较大,但跟它区分不区分方向关系不大。同理,被“条2”称量的名词最重要的是[-具象],然后才是[+个体],后一特征并不是特别重要。

三、量词“条”原型范畴的影响因素

在基于实际用法的研究范式下,通过统计示形量词与名词的共现率来构建示形量词的原型范畴模型是合理的。不过,高频共现只是表象,形成这些高频搭配的背后原因才是影响范畴分布的本质所在。影响“条”的原型范畴模型分布的因素主要有三个,它们之间不分主次,都有可能成为影响分布的主因。

(一)日常生活相关度

与人们日常生活息息相关的事物更容易被人们提及,因此,与“条”搭配使用的几率更大、频率更高。比如,“条”的本义“枝条”分布在原型范畴边缘,这可能与在现代化社会的语境下,“枝条”和当代人生活的关联度下降有关。在新媒体时代,代表经济建设的“道路”、各种组织社团的“规定”、媒体的“新闻”、通讯的“消息”等,显然是大家更为关心的,人们经常谈论这些与自己休戚相关的事物,所以这些名词更为常用,与“条”的搭配也更多。与此相对的是,在农业社会时期十分重要的“枝条”,现在就很少能进入人们的关注视野。代表现代文明的词汇与量词“条”高频共现,形成“预制单位”储存进人们的大脑,更容易一起被激活。因此,“道路”等词语逐渐取代“枝条”这一最初形象,占据了当下汉语量词“条”形象范畴更核心的位置。

猜你喜欢
语料库
语料库辅助英美文学教学模式初探
可比语料库的建立及翻译教学研究
基于语料库翻译学的广告翻译平行语料库问题研究
护理英语语料库建设探索
如何利用语料库语言学提高英语教学
浅谈语料库分类及用途
近5年语料库应用于外语教学的研究综述
国内外语料库建设研究简述
运用语料库辅助高中英语写作
关于“nothing succeeds without a strong will”的语料库研究