基于语料库的“做”与“作”用法辨析

2013-04-29 00:44:03蔡强凌征华
时代文学·上半月 2013年6期
关键词:语域辨析语料

蔡强 凌征华

摘 要:人们在写作或翻译的过程中往往会混淆、错用“做”与“作”这两个词,传统的词语辨析方法存在语料不够充分且大多依靠直觉经验等不足之处。本文基于兰卡斯特汉语语料库,采用WordSmith Tools 5.0工具,调查了“做”与“作” 在不同语域中的词频分布、搭配词信息和语义韵倾向,客观全面地对这两个词进行了辨析。本研究的结果有助于这两个词的区别使用,研究过程能为相关语言研究带来一定的有益启发。

关键词:语料库;“做”与“作”;词语辨析

一、 引言

现代汉语中,由于“做”与“作”的发音在绝大多数情况下相同,意义和用法在某些语境中也相似,人们在写作或翻译的过程中往往对如何区分它们感到困惑,经常混淆、错用这两个词。本文运用语料库语言学的研究方法,在大规模语料的基础上对“做”与“作”的用法进行多角度分析,以期进一步研究这两个词的区别使用并为相关语言研究带来有益的启发。

二、 语料库与词语辨析

语料库是指按照一定的语言学原则, 运用随机抽样方法,收集自然出现的连续语言运用文本或话语片段而建成的具有一定容量的大型电子文本库(杨惠中,2002:33)。而语料库语言学则是建立在语料基础上进行语言研究的一门学科。随着计算机技术的发展,语料库语言学不断得到发展。通过借助计算机软件和统计工具,在大量真实语言材料的基础上,语料库帮助人们观察和掌握语言的事实,分析和研究语言使用的规律,为语言研究提供了崭新的角度和方法。

就词语辨析而言,语料库具有其独特的优势。主要体现在:(1)语料库中的材料都是来自于生活中实际使用的话语或文本,不是凭感觉或规则主观臆造得来,语料的真实性确保了词语辨析的真实可靠。(2)语料库融合了计算机技术。借助计算机应用软件,语料库能方便快捷地帮助人们发掘有价值的语言使用信息用于词汇辨析。(3)语料丰富且具有代表性。随着计算机和网络技术的发展,语料的获取变得更加便捷,语料库的容量越来越大,同时在建库过程中语料库专业人员要反复论证并对语料进行严格分类和筛选, 确保语料的典型性和代表性。这些特点对于词语辨析都是非常有利的因素。

基于大量的真实语言证据,语料库检索结果能够展示词语丰富的用法例句和语境,通过软件的系统分析和研究者的归纳总结,研究者能够比较和掌握词语之间细微的语义和语用差异,客观全面地描述词语的具体用法。语料库对词语的辨析方法主要是考察词语在不同语域中的词频分布差异、统计分析词语的搭配词特征以及通过观察检索行发掘出词语的语义韵特征等。

三、 所用的语料库及研究方法

语料库出现于20世纪60年代的欧美,自被介绍到中国后,不少学者开始创建汉语语料库进行语言研究,国家语委现代汉语语料库、北京大学《人民日报》标注语料库和北京大学汉语语料库(CCL)等相继建成。这些语料库能够提供网络检索服务,但目前还没有完全对公众开放。本研究采用肖忠华博士2003年建立的兰卡斯特汉语语料库(The Lancaster Corpus of Mandarin Chinese,简称LCMC)。LCMC是一个现代汉语书面语平衡语料库,有 100万词次,选取的是1989至1993年间中国大陆的出版物。它按照FLOB的模式,从15个文体类型(见下表1)中选取500篇2,000词左右的样本构建。LCMC采用Unicode (UTF-8)进行编码,在语料深加工方面,采用中科院计算所开发的“汉语词汇分析系统” 切分工具对LCMC的语料进行切分和标示词性,在通过大量的手工校对后,库中词性标注的正确率达到了98%以上(肖忠华,2012:35-42)。该语料库完全免费提供,读者可以通过创建者提供的网址下载。LCMC的建成和完全免费开放有助于研究者从事基于语料库的汉语单语或汉英(英汉)双语的对比研究。

基于兰卡斯特汉语语料库,本文将采用WordSmith Tools 5.0 等工具,调查“做”与“作” 在不同语域中的词频分布,统计词语搭配的不同相互信息值,揭示“做”与“作” 不同的搭配关系和语义韵等语言特征,客观全面地描述这两个词的差异。

四、结果与讨论

1.“做”与“作” 在不同语域中的词频分布比较

语域指的是语言使用的功能变体,即因使用的不同语境而产生的语言形式变化。不同的语域往往在选词、造句和结构等方面体现出各自突出的特点,表现为不同的语体风格、用语格调等。不少同义词由于其意义和用法的不同,往往突出分布在不同的语域中,因此统计它们在不同语域中的频率差异,将有助于对它们进行区分使用。

表2显示了“做”与“作”在兰卡斯特汉语语料库中的宏观分布情况。从表2可知:①在百万词次的同一个库中,“做”用得更多,共计763个,而“作”的个数只有417,两者差异显著。② 比较而言,“做”的使用语域差别不明显,而“作”的使用语域差别显著。“作”在表达较自由的小说中用得少,在社论、报道等文体中用量增多,在表达正式严谨的科技纪实类文本中用得最多。③ 在绝大多数的语域中,“做”要多于“作”,学术、科技和宗教语域中除外。分析词频在不同语域的宏观分布事实有助于语言使用者优先考虑在某种语境中是用“做”还是“作”,在做出判断和选择时更加理性和高效。

2.“做”与“作”的搭配词信息比较

通过对词汇的搭配研究可以获得词汇用法的许多重要信息。语料库的研究方法之一就是将所研究词汇(也称节点词)的所有搭配词从语料库中提取出来,采用统计手段测算各搭配词与该词汇共现的显著程度大小,确定彼此间相互吸引的程度,从而提取所研究词汇的典型搭配。常用的统计手段是观察 Z值和MI值(MI3值)。Z值表示节点词与搭配词之间相互吸引的程度,Z值越高,搭配词与节点词共现的频数越高,搭配词与节点词间存在着越强的搭配关系。MI值也可以测量词语间的搭配强度,MI3值是对MI值进行的调整。Z值、MI值和MI3值通过语料库检索软件WordSmith Tools 5.0都能够顺利得出。

首先分析“做”的搭配情况。运行WordSmith Tools 5.0,得到“做”的搭配词信息,包括这些词在库中出现的总频数、出现的文本数、与节点词“做”共现的频数、MI值、Z值与MI3值等(篇幅所限,数据在此省略)。通过综合考察发现,更多与“做”频繁搭配的是一些表具体意义的词,而且这些词动作性较强,如生意、功课、手术、广告、运动、工作等。另外跟“做”显著搭配的状语常是一些表程度的词,如大量、完、好、些等。从感情色彩来说,这些高频搭配词偏向于褒义与中性,如褒义的有“好事”、“贡献”、“事业”等。

接着分析“作”的搭配词信息。与“做”相比,跟“作”搭配强的名词的数量已大量减少,只是一些表抽象意义的词如“斗争” 、“贡献” 、“准备” 、“决定”等。同时我们注意到,“作”与表具体意义的词“汇报”的搭配虽然数值较高,但只出现在一篇文本中。此外,“作”与“做”都和“贡献”有较强的搭配,而且数值还比较接近。跟“作”显著搭配的状语常也是一些表程度的词,如“进一步” 、 “点” 、“一些”等。从目前的数据来看,与“作” 搭配强的词感情色彩不明显。

“做”与“作”的搭配词信息值分析结果与之前有些学者如周春水(2006)、祝清亮(2009)等所做的研究结果基本一致。而语言大家吕叔湘(1999:708)对“作”“做”的用法辨析为“习惯上,具体东西的制造一般写成‘做,如‘做桌子,做衣服,做文章,抽象一点的、书面语言色彩重一点的词语,特别是成语里,一般都写成‘作如‘作罢,作废,作对……”。这些学者治学严谨,在大量考证的基础上得出的结论与基于大型语料库得到的结果相一致,这同样也说明语料库的研究具有较大的语料基础和数据支撑,是词语用法辨析的一种有效方法。

3.“做”与“作”的语义韵比较

“语义韵”(semantic prosody)指具有相同语义特点的词项受到某些关键词的习惯性吸引反复与这些关键词在文本中共现,后者被“传染”上了有关的语义特点,使整个语境内弥漫了一种特殊的语义氛围 (卫乃兴2011:82-94)。语义韵揭示了说话人的态度和交际意图,能够发掘出文本的深层意义。语义韵大体上可以分为积极、中性和消极三类 (Stubbs1996:176)。它所关注的重点不是词语本身具有何种程度的积极意义或消极意义,而是整个搭配表现出来的语义倾向。语义韵的研究通常使用数驱动的方法,即从语料库中寻找语言学证据进行客观科学的描述。

根据4.2有关的搭配词信息,得出与“做”搭配的高频词偏向于褒义与中性,而与“作”搭配的高频词的感情色彩不明显。以下我们将从兰卡斯特汉语语料库中随机提取使用这两词语的索引行,参照“做”与“作”最常用的词性用法,对它们进行语义韵描述。根据4.1得出的词频分布信息,“做”在该库中出现的频次是763,“作”出现的频次是417,现采用每隔10行随机提取“V+N”结构进行检索行分析。

首先分析含有“做”的符合 “V+N”结构的54个检索行。其中“做”吸引的具有积极意义的搭配词汇有“贡献”、“好事”、 “准备”、“运动”、“工作”等,共35个,占64.8%;中性意义的搭配词汇有“早餐”、“选择题”、“泥水活”、“设计”、“衬衣”等14个,占25.9%;消极意义的搭配词汇有“同伙”“土匪”“亏心事”“说客”“白日梦”这5个,占9.2%。因此“做”所吸引的词汇大多数具有积极意义,由此形成了一种积极的语义氛围,具有较明显的积极语义韵倾向。再看含有“作”的符合 “V+N”结构的36个检索行。其中“作”吸引的具有中性意义的搭配词汇有“分析”、“报告”、“肥料”、“文章”、“分析”、“修改”等26个,占72.2%;积极意义的搭配词汇有“牺牲”、“贡献”、“决定”、“后盾”等7个,占19.4%;消极意义的搭配词汇有“曲解”“劳役”和“海阔天空(在句中用作贬义)”这3个,占8.3%。因此“作”所吸引的词汇大多数具有中性意义,由此形成了一种中性的语义氛围,具有较明显的中性语义韵倾向。以上基于检索行“做”与“作”语义韵的分析与4.2的搭配词信息分析结果相一致。

四、 结语

通过基于兰卡斯特汉语语料库的综合分析,最终得出针对“做”与“作”辨析的结果:除了在学术、科技和宗教语域,在其它绝大多数的语域中,“做”的用法要明显多于“作”,而且“做”的使用在语域间差别不明显,“作”则差别显著,“作”在表达较自由的小说中用得少,在社论、报道等文体中用量增多,在表达正式严谨的科技纪实类文本中用得最多。 通常与“做”频繁搭配的是一些表具体意义的词,而且这些词动作性较强,而跟“作”搭配强的是一些表抽象意义的词。“做”具有较明显的积极语义韵倾向,而“作” 具有较明显的中性语义韵倾向。需要说明的是,以上主要是针对“做”与“作”的主要用法,即做动词后接宾语所做的辨析,这两个词的其它用法还有待于进一步探讨。

参考文献:

[1]StubbS,M.Texts and Corpus Analysis. [M].Oxford:Blackwell Publishers,1996

[2]刘书龙.“作”与“做”的用法辨析[J].编辑之友, 2002 (6)37-38

[3]吕叔湘. 现代汉语八百词[M]北京:商务印书馆,1999

[4]卫乃兴.语义韵研究的一般方法[J].外语教学与研究2002(4)300-307

[5]卫乃兴.词语学要义[M]上海:上海外语教育出版社,2011

[6]肖忠华.英汉翻译中的汉语译文语料库研究[M]上海:上海交通大学出版社,2012

[7]杨惠中.语料库语言学导论[M]上海:上海外语教育出版社,2002.

[8]祝清亮.“作”与“做”辨析[J].编辑之友,2009(8)106-107

[9]周春水. 现代汉语中的“作”与“做”的辨析[J]. 深圳职业技术学院学报,2006(2)64-68

本文系江西省2012年教育科学规划课题“基于科技论文摘要汉英双语语料库的数据驱动翻译教学效能研究”(12ZD060)阶段性成果。

(作者单位:江西理工大学外语外贸学院)

猜你喜欢
语域辨析语料
怎一个“乱”字了得!
——辨析“凌乱、混乱、胡乱、忙乱”
“论证说理”与“沟通说服”:高考论述类与实用类写作之异同辨析
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
意义隐喻与语域的关系——基于自建英语新闻语料库的研究
“征、伐、侵、袭、讨、攻”辨析
语文知识(2014年1期)2014-02-28 21:59:05
浅析语域的特性及教学模式探讨
科技视界(2013年23期)2013-08-15 00:54:11
“assess”和“evaluate”辨析与翻译