基于语料库的中国《政府工作报告》英译本词汇特征研究

2010-12-07 03:29陈建生崔亚妮
当代外语研究 2010年6期
关键词:政府工作报告英译本实词

陈建生 崔亚妮

(天津科技大学,天津,300222)

经过三十年改革开放和社会主义现代化建设,中国在世界的经济和政治地位有了空前的提高,成为国际社会关注的焦点。中国的《政府工作报告》(以下简称《报告》)正是外界了解中国形势和政治主张的最权威来源之一。《报告》是中华人民共和国政府的一种公文形式,由国务院总理在全国人民代表大会上宣读,其结构一般包括三部分:一、回顾并总结上一年的政府工作情况;二、归纳当前政府各项工作,汇报这一年政府的工作总体部署;三、政府自身建设以及这一年的主要任务。为满足外界了解中国政府工作的需求,达到对外宣传的目的,《报告》还被译成多种外文,因此《报告》的翻译有着举足轻重的作用。

《报告》属政论文体,此类文体用词讲究分寸,庄重严谨,准确规范。我国资深翻译家程镇球(2002)曾指出,在政论体汉英翻译中,译者应竭力忠实于原文,要忠实于原文的字句,更要忠实于原文的精神。其次,译者要有高度的政治责任感和严肃认真的工作态度。目前国内对《报告》翻译的研究越来越多,但大多是针对某一年的单个文本,对词汇或句子的翻译进行定性分析,还鲜有对于《报告》英译本词汇总体特征的研究。本文采用语料库语言学研究方法,对近几年我国《报告》英译本中的词汇特征进行研究,并与同一体裁的美国《国情咨文》(以下简称《咨文》)作对比分析,找出两者之间的差异,探讨产生差异的原因。

1. 归化和异化翻译理论

美国翻译理论家韦努蒂(Lawrence Venuti)于1995年在《译者的隐身》(TheTranslator’sInvisibility)中提出了归化(domestication)和异化(foreignization)翻译理论。韦努蒂认为,归化法是采取民族中心主义的态度,使外语文本符合译入语言的文化价值观,把原作者带进译入语文化;异化法是对这些文化价值观的一种民族偏离主义的压力,接受外语文本的语言和文化差异,把读者带入外国情景。换言之,归化法要求译者向译入语读者靠近,按照译文读者的表达习惯和阅读心理来传达原文的内容;而异化法则主张译者向原作者靠拢,在译文中完全依照原文的表达法,尽量保持原作的异域风格。

《报告》的翻译要求译者既要保留其本身所具有的严肃性和准确性,同时又要反映中国政治和文化等的特点;译者在传达原作者意图、达到对外宣传目的的前提下,也要努力向西方读者介绍中国文化。因此,《报告》的翻译理应结合归化和异化两种策略。为了使译文便于理解,在句法和篇章方面,较多地采用归化的译法;然而在词汇方面较多采用异化的译法,尽量保持原文的中国文化等特色。

2. 语料库语言学与翻译研究

语料库语言学是一门结合语言学、计算机科学、认知语言学和应用语言学的新兴交叉学科。语料库语言学为语言学研究提供了一种全新的研究方法,它以真实的语言数据为研究对象,从宏观的角度对大量的语言事实进行统计,然后通过宏观和微观的、定量与定性相结合的分析方法,从中寻找语言使用的规律。自20世纪90年代中期以来,许多学者致力于翻译语料库的研究与设计,其中以Mona Baker的影响最大。Baker是第一个倡导把语料库应用于探究翻译现象的学者,开辟了一条以语料库方法开展翻译研究的道路,即广泛收集真实的翻译材料,借助现代化的手段建立大型资料库,挑选出各种资料样本进行分析,以此来描述翻译的真实面目和性质,揭示翻译中可能存在的规律,并为翻译操作提供范式(赵晴2008)。

3. 本研究使用的语料库

本文是一项基于语料库的研究,所使用的语料库包括一个双语平行语料库(bilingual parallel corpus)和一个可比语料库(comparable corpus)。其中,《报告》双语平行语料库的规模约为20万字词,其中中文约11万字,英文约9万词,收录了从2004到2009年的《报告》的原文及译文。中文文本和英文译文都来自由中国政府授权新华网发布的正式文本。两种语言的文本采用半自动的方法在句子水平上对齐。

可比语料库由《报告》英译本(94,022型符)和1994至2008年美国公开发表的《咨文》(92,488型符)两个子库构成。

此外,根据研究的需要,这两个语料库都使用CLAWS词性附码器做了词性附码。采用的是分类详细的CLAWS7词性附码集①。

4. 结果与讨论

本文针对文本中词语的总体特征对《报告》英译本和《咨文》进行对比,并进行具体分析。将从平均词长、词汇密度、类符形符比、高频词和动词名词化现象五个方面对词语特征进行研究。

4.1 平均词长

平均词长是一个文本中全部单词字母的总数与单词总数的比值,而词长标准差则是指单词长度在平均词长左右浮动的程度。平均词长是反映文本文体特点的一个重要因素。正式文体的文本常常使用长词来突出其文本的文体特征以区别于非正式或口语化文体的文本。以Brown语料库中三类不同文体的文本为例,报刊类文本(Categories A,B,C)的平均词长为4.73,标准差为2.59;学术类文本(Category J)为4.93,标准差为2.87;而各类小说(Categories K,L,M,N,P,R)为4.31,标准差为2.18。这三类文本相互间平均词长差异的独立样本t检验结果都存在显著的差异。学术类文本在这三类文本中文体最正式,其次是报刊类,然后才是小说类文本。由此可见,平均词长和文本正式程度有着密切的关系。表1是《报告》英译本和《咨文》两个子语料库的平均词长和标准差。

表1 《报告》英译本和《咨文》两个语料库的平均词长比较

表1中《报告》英译本的平均词长及标准差都高于《咨文》。两个语料库中文本的平均词长的t检验结果证明这个差异非常显著(t=65.63,p<0.0001)。

此外,还统计了两个语料库中长词(≥10个字母)在各自语料库总词数中所占的百分比(见表2)。

表2 两个语料库中长词(≥10个字母)总数和百分比

表2数据表明,《报告》英译本中长词所占的百分比明显高于《咨文》,说明译者在翻译时使用长词较多,如一些较长的派生词:qualification,reconsideration,practitioners,uncompromisingly,internationalization等等。因此,从词长角度看,《报告》英译本比《咨文》文体更为正式。

4.2 词汇密度

词汇密度是指文本中实词在总词数中所占的比例。英语的实义词(lexical word或content word)指具有稳定词汇意义的词语,与之相对的是功能词(grammatical word或function word),指不具备稳定词义或意义模糊而主要起语法功能作用的词语。根据胡壮麟(2002)对实词和虚词的分类,实词的主要组成部分包括名词、动词、形容词和副词;虚词主要包括连词、介词、代词和冠词。词汇密度被认为可以反映篇章的信息容量和难度。词汇密度偏高说明该篇章的实词比例较大,因而信息量也较大,难度也相应增加。相反,词汇密度偏低则说明篇章难度相对较低,容易理解。本文采用的是Ure(1971)和Stubbs(1986)提出的词汇密度计算方法:词汇密度=实词数÷总次数×100%,旨在通过语料库考察《报告》英译本和《咨文》信息量上的差异和难度的大小。表3是按照公式计算出的两个语料库的词汇密度,为了更清楚地反映造成词汇密度不同的原因,还分别统计了名词、动词、形容词、副词的词数。

从表3的数据可作出以下分析:《报告》英译本的词汇密度比《咨文》高,说明《报告》信息量较大,难度较高。从实词词数比较情况来看,《报告》英译本中名词和形容词数量比《咨文》多(经χ2检验证实两个语料库的名词和形容词数量差异相当显著),其中形容词差异更大;前者动词数量低于后者;两者副词数量相当。因此可以把造成两者词汇密度差异的原因归结于《报告》英译本中名词和形容词数量较多。其原因可从两方面进行分析,即汉英语言的差异和译者在汉译英过程中使用的翻译策略。由于《报告》中对过去一年的工作总结是建设具有中国特色社会主义的成就,提出的方针和政策都是针对中国国情的,其中有很多中国特色的词汇在英文中无对应词,因此译者要作出相应的解释性翻译,这就造成在其译文中名词数量相对国情咨文较多,所传达的信息量较大。如:

原文:“三农”

译文:agriculture, rural areas and farmers;

原文:“西电东送”

译文:transmission of electricity from the west to the east;

原文:“两个确保”

译文:“two guarantees” (guaranteeing that the living allowances for workers laid off from state-owned enterprises and that the pensions of retirees are paid on time and in full);

原文:“五个统筹”

译文:“five balanced aspects” (balancing urban and rural development, balancing development among regions, balancing economic and social development, balancing development of man and nature, and balancing domestic development and opening wider to the outside world).

以上词汇都表现中国特有事物,译者在翻译此类词汇时采用归化的翻译策略,并作出适当的解释,因此加大了政府报告译文的名词数量。

由于汉语注重意合,在汉语中句法形式区别的手段相对比较单调,除了少数名词和数量词之外,大多数的定语都是形容词。相比之下,英语的句法形式和修辞限定性手段就要复杂得多,除了形容词之外,名词、介词词组和从句都可以担当定语来修饰限定主语(刘宓庆1992)。形容词的使用在《报告》原文中呈现高频率。此外,政治文件的翻译对忠实原文的要求十分严格,译者在翻译中采用直译的手法,把原文中的形容词直译为相应的形容词,尤其是形容词后直接搭配名词,其结构简单,形容词和中心词关系明确,且形容词在名词之前,同时也符合英语中形容词的习惯用法。这两方面的原因造成《政府》英译本中形容词数量多于《咨文》。如:

原文:面对复杂多变的国际形势、突如其来的非典型肺炎疫情和频繁发生的自然灾害,

译文:In the face of a complex and volatile international situation, the unexpected outbreak of the severe acute respiratory syndrome (SARS) and frequentnaturaldisasters,

原文:不断满足人们日益增长的物质文化需要,是社会主义现代化建设的根本目的。

译文:The fundamental goal of our socialist modernization drive is to continually meet the growingmaterialandculturalneedsof the people.

例句中划横线的部分都是直接用形容词修饰名词的形式,斜体部分“自然灾害”和“物质文化需要”在汉语中是名词短语,但是翻译时也用形容词修饰名词的形式,分别译为naturaldisasters和materialandculturalneeds。

4.3 类符形符比

类符形符比(Type/Token Ratio,简称TTR)是指在特定语料中类符(type)和形符(token)的比率。所谓类符数是指文本一共有多少个不同的词形,而形符数是指文本中一共有多少个词。单纯的类符数和形符数不能反应文本的本质特征,但两者的比率在一定程度上反映了文本的某种本质特征,即用词的变化性(杨惠中2002)。一般情况下,超过1,000词的语料要使用标准化类符形符比,即按一定的长度(通常是1,000个形符)分段计算文本的类符形符比。表4是WordSmith分别统计的两个语料库中类符数、形符数和标准化类符形符比。

表4 两个语料库的类符形符统计

从表4可以看出,《报告》英译本语料库和《咨文》语料库的形符数比较接近,而前者的类符数小于后者,其标准化类符形符比(40.32)小于本族语语料库(43.05)。该差异表明《报告》英译本的词语变化程度低于《咨文》。由此可知,《报告》英译本的词汇密度高于《咨文》。《咨文》由英语本族语者所撰写,《报告》英译本中用词多样化不及国情咨文。《报告》英译本在理解程度上较《咨文》更难一些,但这并不意味着其用词变化多,而是由于其中重复使用难度较高的词语。

4.4 高频词比较

词频统计是语料库研究的一个基本统计手段。Sinclair(1991)指出,语料库中频率最高的那些词的分布是稳定的,因此如果在排列顺序上出现任何显著的变化都可能是有意义的。一般情况下,一个语料库词表中的高频词绝大多数是功能词(或称虚词),实词的出现则表明该实词所指的人、事物或行动等是语料关注的焦点,因此才会被反复提到。

表5列出了《报告》英译本和《咨文》两个语料库按词频从高到低排列的前20个高频词、其频率以及在总词频数中所占的百分比。

表5 两个语料库的词频表中前20个高频词的比较

表5数据显示,《报告》英译本词频表前20个高频词中有8个实词(40%),虚词仅有12个(60%),而《咨文》前20个高频词中没有实词。这两个高频词表的差异在一定程度上反映出《报告》所关注的焦点比《咨文》更为集中和明确。统计《报告》英译本前100个高频词中出现的实词,我们可大致了解从2004到2009年期间中国政府的工作重点,如development(发展),system(制度),rural(农村的),people(人民),reform(改革),land(土地),progress(进步)等。《咨文》前100个高频词中的实词也能反映出美国政府所关注的焦点,如people,America,congress,nation,economy,peace,citizens,freedom等。但是,这些实词在前100个高频词中出现的次数和百分比明显低于《报告》英译本中的实词,说明《咨文》所关注的问题较多且比较分散。此外,《咨文》高频词中出现代词I和you,这表明虽然两者同属于政论文体,但《报告》英译本比《咨文》更正式,而后者则表现出一定的口语化倾向。

4.5 动词的名词化

英语动词名词化是指由动词转化为名词或起名词作用的词的现象,其过程就是其动作逐步从动作动态静化为抽象概念甚至涉及与该动作相关的人或事物的过程。英语很多名词都是由动词变化而来,这类名词有和其他名词相同的句法功能,但在意义上指示一种行为,具有动态的含义,常用来表示动词含有的动作、行为、变化、状态、品质、情感等概念(王武兴2003)。

就形态变化而言,英语动词的名词化通常由两类词缀组成:一类为动词的进行体形式-ing,用于动词的词尾,另一类则是因动词而异的后缀,如:-tion,-sion,-al,-ment,-y等。句法研究通常把前者称为动名词或动作名词,后者为动词派生名词(Quirk 1985)。英语中动词添加后缀构成名词的方式较多,本文未能把所有的动词名词化现象都概括在内,只针对动词名词化常用的几个后缀进行统计,包括-ence,-sion,-tion,-ment,-al和-ing。表6是统计结果:

表6 两个语料库中的动词名词化现象

表6数据表明,《报告》英译本的动词名词化现象明显多于《咨文》。两个语料库中出现的动词名词化的例子包括occurrence,expansion,transmission,combination,construction,implementation,development,revival,rebuilding,upgrading等。使用这种表达手段的原因在于:英语动词的名词化具有诸多功能,包括使语篇正式化、客观化、简洁化和起衔接功能。名词化程度越高说明文本越抽象、越正式、越书面语化。名词化有利于表达客观事实,使信息密集,从而使语篇更简洁紧凑。由此可见,《报告》英译本的书面语特征比《咨文》更明显,文体更正式,表明译者在翻译过程中注重译文的紧凑性,旨在用较少的语句传达更多的信息。如:

原文:促进中部地区崛起的政策开始实施

译文:We beganimplementationof the policy to boost the development of the central region.

如果这个句子译作We began toimplementthe policy...,其书面语特征就不明显了。

5. 结语

通过以上基于语料库的分析与对比,可以看出《报告》英译本的词汇具备以下特征:(1)平均词长较长,文体正式;(2)词汇密度较高,所传达的信息量较大,文本难度相应较高;(3)在词汇使用上变化不明显,表明译者在翻译时集中使用了某些词汇;(4)高频词中实词所占比重较大,说明文章主题明确而且侧重点集中;(5)名词化现象显著,文体正式。

由于所研究的文本是由《报告》翻译而来,因此其词汇特征在很大程度上受到《报告》原文的影响。《报告》属于一种特殊的文体,具有书面语特征。译者在翻译时力求与原文文体特征保持一致,用词严谨,译文词汇多用长词,名词化现象较多。另外,译者翻译中应采用归化和异化相结合的翻译策略,对中国特有事物进行解释性翻译,造成译文文本信息量增大。与此同时,为了达到对外宣传的目的,《报告》英译本总体词汇特征应接近于本族语中同体裁的文本词汇特征,被目的语读者接受。因此,根据与《咨文》对比所得结论,我们建议,《报告》的翻译应在保持原文意思的基础上,遵循简洁的原则,尽可能在词汇使用上靠近本族语者的阅读习惯。如多使用定语后置修饰名词;根据不同的语境,尽量用不同的英文词汇或表达方式翻译原文中同一词语,以提高用词多样性;注重虚词的使用等等,避免由于实词量大或用词过于正式而减弱文本的可读性。

附注:

① 有关CLAWS词性附码器和CLAWS7词性附码集的详细情况,请访问以下网址:http:∥ucrel.lancs.ac.uk/claws/trial.html。

Baker, M. 1995. Corpora in translation studies: An overview and some suggestions for future research [J].Target7(2): 223-243.

Hu, Zhuanglin. 2002.Linguistics:AnAdvancedCourseBook[M]. Beijing: Beijing University Press.

Quirk, R., S. Greenbuam, G. Leech & J. Svartvik. 1985.AComprehensiveGrammaroftheEnglishLanguage[M]. London: Longman.

Sinclair, J. 1991.Corpus,Concordance,Collocation[M]. New York: Oxford University Press.

Stubbs, M. 1986.Languagedevelopment,lexicalcompetenceandnuclearvocabulary[A]. In K. Durkin (ed.).LanguageDevelopmentintheSchoolYears[C]. London: Croom Helm.

Ure, J. 1971.Lexicaldensityandregisterdifferentiation[A]. In G. Perren & J. L. M. Trim (eds.).ApplicationsofLinguistics[C]. London: CUP: 443-452.

Venuti, Lawrence. 2004.TheTranslator’sInvisibility[M]. Shanghai: Foreign Language Education Press.

成昭伟.2007.新汉英翻译实务[M].北京:国防工业出版社.

程镇球.2002.翻译论文集[C].北京:外语教学与研究出版社.

刘宓庆.1992.汉英对比与翻译[M].南昌:江西教育出版社.

王武兴.2003.英汉语言对比与翻译[M].北京:北京大学出版社.

杨惠中.2002.语料库语言学导论[M].上海:上海外语教育出版社.

曾庆敏.2006.英语中的名词化隐喻及其语篇功能[J].重庆工学院学报(3):125-128.

赵晴.2008.国外基于语料库翻译研究述评[J].重庆交通大学学报(7):83-100.

猜你喜欢
政府工作报告英译本实词
基于语料库中英译本译者主体性的对比分析——基于韩国作家韩江的《素食主义者》中英译本平行语料库
文言文实词词义推断的基本策略
瑞典文《红楼梦》译介源流考*——兼驳霍闵英译本转译论
杨宪益-戴乃迭《红楼梦》英译本后四十回底本考证
功能对等理论下《醉翁亭记》英译本的对比研究
文言实词50例
文言实词推断法
《政府工作报告》圈定今年重点
《政府工作报告》诞生记
《政府工作报告》里的潜台词如何驱动中国