外向型汉语词典中的词语搭配研究

2021-04-06 20:10
文艺生活·下旬刊 2021年1期

赵 羚

(北京外国语大学 中国语言文学学院,北京 100089)

一、引言

词语搭配研究是语言学本体研究和应用研究的主要领域之一。就汉语作为第二语言习得而言,邢红兵(2013)指出从留学生习得汉语词汇的情况来看,词语搭配上的问题是最突出的问题。由此可见,词语搭配在二语研究中意义重大。

词典是辅助外语学习的有效工具,促进词汇记忆和提高阅读理解能力。汉语学习词典中词语搭配存在诸多问题,很多学者认为应该充分发挥语料库在词典的词语搭配处理上。有的学习词典参考了汉语母语者语料库,这可以体现汉语使用的真实情况。但是从“用户视角(user perspective)”(章宜华,2007)出发,学习者在词语使用过程中出现的偏误或者急需的搭配也需要纳入词典编纂中来,然而这部分研究却很罕见。

到目前为止,我国仍没有一部学习词典中的词语搭配信息是基于大规模语料库且从学习者角度出发的。这与汉语研究在语法等方面的研究成果和对外汉语教学在全球的发展趋势是极不对称的。

因此,本研究从汉语母语者语料库出发,获取真实的词语搭配及其使用情况;联系中介语语料库,总结汉语学习者在词语搭配上的需求,做到以用户为中心的词典编纂理念;结合母语者语料库和中介语语料库,反观现有两部部汉语学习词典中的词语搭配编纂情况,概括现有词典在搭配处理上的不足,提出相关建议。

二、研究设计

本研究试图结合母语者语料库、中介与语料库以及现有词典构建汉语学习词典词语搭配编写的模式。

(一)概念界定

在语料库语言学理论下,词语搭配与类联接为一组概念,前者是后者的下位分类。“词语搭配(collocation)是在文本中为实现一定的意义从而以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的机率共现。”(杨惠中,2002:107)

卫乃兴等(2005)指出“类联接”是词语搭配发生其中的语法结构和框架,如”V+N”表示一个类联接,“吃饭”等是实现“V+N”类联接的搭配实例之一。

(二)研究对象

王仁强(2013)指出,兼类问题在现代汉语词典中的处理尤为棘手。词汇学习本就不易,兼有多种词性的兼类词更是汉语学习者的难点所在。本文选择其中1种兼类词予以研究,即动名兼类,主要原因是:在汉语中,名词、动词实词的使用频率高于其他词类,汉语词类的多功能现象主要表现在这两大类实词上;此外,动名兼类十分常见,纳入考察对象具有一定的研究价值。

(三)资源及其处理

对兼类词的选取,我们参考《现代汉语词典》(第7版)(以下简称为《现汉》)的词性标注,从《汉语水平词汇与汉字等级大纲(修订本)》(以下简称《大纲》)中的甲级、乙级词中根据使用频率选出1个兼类词,即“希望”,一方面使用率高,另一方面需要确保学习者使用目标词。

对语料库的选择,母语者语料库选取的国家语委语料库,该语料库涉及领域多样,是能比较真实地反映汉语面貌的大型通用语料库。中介语语料库采用的是北京语言学动态作文语料库(简称HSK语料库)。

对词典的选择本研究选取两部外向型汉语学习词典作为考察对象,分别为《当代汉语学习词典》和《商务馆学汉语词典》,这两部词典受众广、知名度高,具有较强的代表性。

(四)研究步骤

首先,从母语者语料库中下载含有目标词的句子,进行分词并完成词性标注。使用BFSU PowerConc1.0工具观察目标词的显著搭配词、类联接情况。

其次,从中介语语料库中获取含有目标词的句子,观察正确使用的显著搭配词及类联接分布,将之与母语者语料库对比,发现两者的异同。

最后,回归至两部词典中,观察词典中目标词的搭配信息与上述从语料库中得到的信息的异同,以此反观词典编纂的科学性及有效性。

三、研究数据及分析

(一)母语者语料库中“希望”词语搭配

根据《现汉》(第7版)中对“希望”一词的解释,本研究将“希望”作动词时标为“希望v”,作名词时标为“希望n”。

母语语料库中“希望”一词共出现1952次,语料共计61388个字符。其中“希望n”共出现569次,占比29.1%①;“希望v”共出现1383次,占比70.9%。由此可见,汉语母语者使用“希望v”更多。接着使用BFSU Power.Conc1.0分别对节点词“希望”左、右侧进行搭配词的提取、过滤,分析其类联接型式,结果发现:

当“希望”作为动词时:

(1)搭配方向为左搭配中类联接“形容词+希望v”使用最多,如“热切/衷心希望”,其他类联接包括“副词+~”;(2)右搭配中“希望v+助动词”使用最多,如“希望能……”,其他类联接包括“~+动词短语”及半固定搭配“所字短语”。

当“希望”作为名词时:

(1)左搭配中“动词(短语)+希望n”使用最多,如“充满希望”,其他包括“形容词 +~”“名词 +~”“数量短语 +~”“方位短语+~”;(2)右搭配中“希望 n+ 与 + 名词”,如“希望与信心”,其他包括“~+动词短语”“~+名词”及半固定搭配“把~+动补短语”。

为了解目标词的典型搭配类联接间的分布是否具有显著性差异,利用SPSS25.0软件进行卡方检验,结果发现:(1)“希望v”典型类联接间的分布差异性极为显著(P<0.01,df=4,χ2=305.655a),即具有相对优势结构。(2)“希望n”典型类联接间的分布差异性极为显著(P<0.01,df=8,χ2=152.046a),即具有相对优势结构。

综上,从整体搭配而言,在动词、名词词性下,“希望v”“希望n”均具有相对的优势结构。所谓的优势结构,理论上来更容易被学习者注意到,这有助于学习者更好地掌握目标词的搭配形式。反之,当兼类词某一词性下类联接形式多样,且不同结构分布相对均匀的情况下(即不同结构间的分布不具有显著性差异)。由此猜想,该词性下并不存在具有优势的类联接形式,这可能对汉语学习者造成一定的困扰。

(二)中介语语料库中“希望”词语搭配

在随机下载的500条语料中,“希望”一词共出现512次,其中“希望 v”出现413次,占比 80.6%;“希望n”出现 99次,占比19.4%,表明留学生使用“希望v”的情况要远超“希望n”,这与本族语语料库中“希望v”“希望n”的使用频率较一致。

“希望v”的正确搭配(84.7%)所占比重高于“希望n”(75.8%),“希望v”(15.3%)偏误搭配所占比重低于“希望 n”(24.2%),这说明学习者对“希望n”的词语搭配掌握比较薄弱。下面我们具体分析调查中发现的一些问题:

“希望v”较之于本族语语料,“~+动词短语”“副词+~”两种类联接在学习者语料中被过度使用,且均有显著性差异(p<0.01)。“形容词 +~”“ ~+助动词(+动词短语)”及半固定搭配“所字短语”三种类联接在学习者语料中使用偏少,且差异性均极显著(p<0.01)。

“希望n”较之于本族语语料,“(代)名词+~”这一类联接在学习者语料中被过度使用,且差异性极显著(p<0.01);“方位短语+~”“ ~+动词短语”“~+与+名词”“~+名词”并没有正确地出现在中介语语料中,且“~+与+名词”类联接在中介语语料库及本族语语料库中的使用具有显著性差异,本族语使用最多,但中介语中使用很少。

经过对中介语语料的考察发现:“希望”用作名词时,“(代)名词+~”占比高达60%,这些名词或代词多为“母亲”“父亲”“妈妈”“爸爸”“我”“我们”“你”“你们”等可以互换的成分,这并不属于母语者认为的典型搭配结构,反而本族语语料库中典型搭配名词“光明”“未来”均未出现;针对“方位短语+~”“~+动词短语”“~+与+名词”“~+名词”四种类联接,笔者在所下载的中介语预料中并未发现符合此四种类联接的用法②。

概而言之,在正确的搭配视角下,留学生关于“希望v”“希望n”类联接的使用情况与母语者存在较大的差距:部分典型类联接形式未出现;多种典型类联接形式偏少使用;少许类联接形式过度使用。不仅如此,典型搭配词出现频率低或未出现。

(三)词典中“希望”的处理

“希望”一词,在《当代》《商务馆》中的配例信息如下:③

1.《当代》

(1)动词:我很~明年到中国学习汉语。|这是我送给你的生日礼物,~你喜欢。|~你能来我家和我们一起过新年。|天气这么好,真~出去玩儿玩儿。(4条)④

试验中当水力旋流器内颗粒粒径小于50 μm时,经过计算可知,传播系数为2.42,中位径为33.16 μm,由此可以得出颗粒粒径累计分布函数表达式见式(3):

(2)名词:老师的~也是我对自己的要求。|获得第一名是我们球队全体队员的~。|他有一个~,就是要自己当老板。|我真高兴,我的~变成真的了。|她是一个很有~的演员。(5条)

2.《商务馆》

(1)动词:老师~所有的同学都能取得好成绩。|我~能找到一份好工作?|父母非常~他能出国留学?|妹妹从小就~能成为一名画家。(4条)

(2)名词1:我的~一定能成为现实。|别放弃~,只要有一份~就应该尽全部的努力。

(3)名词2:所有的孩子都是父母的~。|年轻人是国家的未来和~。|改革是全厂职工的~。(5条)⑤

对比“希望”一词在本族语语料、中介语语料中的类联接形式及所占比重,就词语搭配处理而言,可以得出以下几点:

优势所在:

(1)《商务馆》词语搭配的复杂性稍难于《当代》,这在一定程度上恰巧体现了《商务馆》具有一定的高阶性,《商务馆》定位 中级汉语水平学习者,《当代》则定位初级汉语水平学习者,两部词典目标用户水平不同,这决定了它们词语搭配的难易程度有所差异。

(3)《当代》《商务馆》关于“希望n”的配例数都多于“希望v”,这意味着“希望n”的搭配信息数量多于“希望v”,可见编纂者关考虑到了不同词性的实际使用特征,这也是非常值得肯定的。

不足之处:

中介语语料中,“希望”用作动词时,“形容词+~”“~+助动词(+动词短语)”及半固定搭配“所字短语”三种类联接在学习者语料中均被偏少使用,且差异性均显著。“希望”用作名词时,“~+与+名词”并没有正确地出现在中介语语料中,且具有显著性差异;“动词(短语)+~”在学习者语料中均被偏少使用,且具有显著性差异。

《当代》《商务馆》都缺失了学习者偏少使用且在两库中具有显著性差异的典型类联接形式。如“希望”作动词时,两部词典的配例中都缺失了“形容词+~”及半固定搭配“所字短语”这两种搭配形式;“希望”作名词时,“~+与+名词”及“半固定搭配“把/将~+动补短语””在两部词典中均未出现。需注意的是,考虑到《当代》适用于初级汉语水平学习者,故半固定搭配“所…希望v的”这一搭配形式不予以呈现有一定的道理,但其它容易发生偏误或被偏少使用且具有显著差异性的典型搭配形式应该覆盖。

从类联接的数量上来看:“希望”作动词时,本族语中典型搭配类联接占比最高的为“~+助动词(+动词短语)”,且这一类联接形式在中介语语料中的正确搭配占比率并不高,从这一角度而言,学习词典应该凸显这一类联接形式。但该类联接在《商务馆》中所占比重尚可,但在《当代》中的所占比重仅为11.1%,占比过低。这为学习者掌握母语者最常使用的类联接造成极大的困难,不利于学习者掌握最真实的汉语用法。

某一类联接在学习者语料中被偏少使用,这可能由多种因素造成,如与学习者语料中的习作要求有关,或者与其表达习惯有关,但如与族语语料的使用情况具有显著性差异,最大的可能是学习者并没有掌握这一搭配结构,陷入了一种想用却不会用只能回避,或者根本不知道有此种结构的表达困境。

作为重要的学习工具,学习词典在词目单位的搭配处理上,应重点呈现学习者偏少使用且在两库中具有显著性差异的典型结构。

四、建议

(一)语料库的使用

语料库在语言学各领域研究的价值已达成普遍共识,搭配研究从语料库入手,抓取当代中国民众使用频率高、交际能力强、真实自然的词语搭配进入学习词典中可以帮助学习者更好地学习汉语,满足其交际需求。然而,国内的汉语学习词典至今尚未出现基于语料库的从学习者角度出发的词语搭配处理,这可能是导致学习者认为现有词典搭配信息不实用、不能找到所需要的搭配的原因。

因此,学习词典的搭配处理可以基于语料库的真实自然语言,采用语料库语言学的相关研究方法统计、描写、归纳、解释学习者所需的词语搭配。

(二)“母语者-学习者-词典”的词语搭配编写模式

从学习者角度出发构建汉语学习词典中汉语作为第二语言教学视角的词语搭配设计框架,本研究一方面探析兼类词对汉语学习者的搭配习得影响,另一方面将所得规律与外向型汉语学习词典中兼类词的搭配处理进行对照分析,可以更深入地揭示汉语学习词典中词语搭配处理所存在的问题,为其词语搭配处理提供更多的思路。

“母语者-学习者-词典”这一分析模式可以扩展到词典中其他词性的词语搭配编纂中,为外向型汉语学习电子词典中词语搭配信息的选取、编排和呈现服务,更好地满足二语学习者对词典中汉语词语搭配知识的需求。

注释:

①占比=某一词性出现的次数/该词出现的总次数.

②就正确搭配视角下,某一类联接在学习者语料中出现频次为0,大概有两种情况,其一:学习者没有使用过这一类联接;其二,学习者偶有使用,但都使用错误,无一正确,均存在于偏误语料中。经过仔细考察,在随机下载的500条语料中,笔者并未发现此四种类联接的用法。

③只引词性说明和配例,其他信息略去。

④这里的“4条”意为配例条数,下文同。

⑤《商务馆》中“希望”作名词时,义项有2个,即名词1和名词2,本文不研究义项问题,故将名词1和名词2下的搭配处理全放在“希望n”框架下考察。