基于自建语料库的英汉网络新闻文本显化特征研究

2015-03-26 06:55:42连小英林馥嫌
关键词:源语代词语料库

连小英,林馥嫌

(福建医科大学 外国语学院,福建 福州350108)

在全球化、信息化的今天,通过网络新闻获取信息已经成了人们生活中不可或缺的一部分,对网络新闻文本的研究有助于读者更好地阅读新闻,拓宽视野,增加知识,了解世界,获取信息。笔者通过自建的英语源语新闻语料库、汉语译语新闻语料库、汉语源语新闻语料库的对比研究求证新闻文本翻译中的显化程度,并分析显化的主要手段和原因,探索新闻文本翻译中的规律性特征。

一、显化与显化假说

显化(explicitation)也称外显化、明朗化、明晰化、明示等,这一概念最早由Vinay与Darbelnet共同提出,他们从法语与英语文体对比角度的研究基础上指出,显化是一种文体翻译技巧,指在目标语中对源语中隐含的但可以从语境或情境中推断出的信息加以明确说明的过程[1]。最早对显化进行系统研究的则是Blum-Kulka。她运用话语分析理论,分析了部分英语与法语互译的译文实例并提出,成功的翻译需要对语篇和话语进行复杂的处理,译者对原文的阐释可能导致译文冗余程度提高,使译文的衔接关系比原文更明晰。这就是著名的“显化假说(the explicitation hypothesis)”[2]。一 些 学 者 对此假说提出了质疑并做出进一步补充。Seguinot通过英语和法语互译进行实例分析后提出,该假说定义范围过于狭隘,显化的表现形式不仅局限于语篇衔接层次的文本冗长,还包括在通过聚焦、强调、词汇选择等手段凸显原文成分;另外,显化特征不一定是翻译过程本身固有的,也有可能是由语言体系差异所致[3]。

1993年,以Mona Baker为标志,显化特征研究由前语料库时期进入了基于语料库研究时期,后者最显著的特征在于以各种大规模的翻译语料库为基础,通过数据统计及大量的实例分析对显化相关假说进行实证研究。Baker提出了“翻译普遍性假说”,认为“翻译普遍性”是指“翻译文本而不是原话语中出现的典型语言特征,并且这些特征不是特定语言系统干扰的结果”,并明确提出构成“翻译普遍性假说”特征的种类至少包括“显化(explicitation)、简单化(simplification)、规范化(normalization)、整齐化(leveling-out)[4]。自此,显化假说被纳入了翻译普遍性的研究范畴,并确立了语言学翻译普遍性思想在翻译研究核心中的一席之地[5],显化假说研究也得到了一些专家学者的充分重视和研究[6-9]。

在我国,翻译普遍性的研究起步较晚,但引起了学者浓厚的兴趣,作为翻译普遍性重要特征之一的显化得到了广泛的关注。我们以explicitation为关键词进行搜索获得的CNKI学术趋势图中可见一斑(图1)。国内对于explicitation的研究在2003年前几乎为零,2003年的收录量为1篇,随后逐年递增,在2011年收录量井喷,达到20篇,然后有所回落,但依然是目前一个重要的学术研究重点,也从侧面反映了该研究的重要意义。

图1 “explicitation”学术趋势图

北京外国语大学的王克非教授应用自行研制的英汉双语平行语料库从宏观上考察英汉、汉英语句对应现象,结果发现,无论英译汉或汉译英,都呈现目标与文本扩展特点,不同类型的文本在扩增程度上有差别[10],其他学者也对小说、散文、戏剧等文本进行了实证研究[11-17]。但是至今为止,基于语料库的新闻文本的研究相对较少,而基于语料库的新闻文本的显化研究更是寥寥无几。对网络新闻文本的研究有助于更好地阅读新闻,拓宽视野,增加知识,了解世界,获取信息。笔者采取自建语料库对英语源语新闻、汉语源语新闻和汉语译语新闻进行对比研究,阐述英汉新闻文本显化的程度、手段及原因。

二、语料库的建立与总体特征分析

为了充分研究英汉新闻翻译显化特征,将依照代表性、平衡性等建库原则自建三类语料库,即汉语源语新闻语料库(Chinese-Source News Corpus,CSNC)、汉语译语新闻语料库(Chinese-Translation News Corpus,CTNC)、英语源语新闻平行语料库(English-Source News Corpus,ESNC),其中英语源语新闻语料库与汉语译语新闻语料库为英汉新闻平行语料库。

(一)自建语料库的原因及设计

目前,国外已经建成的大型新闻英语语料库主要包括由英国路透社开发建立的路透社语料库(Reuters Corpus),英国谢菲尔德大学开发的对比语料 库METER语 料 库(Measuring Text Reuse Corpus),美国宾夕法尼亚大学组织开发的北美新闻文本语料库(North American News Text Corpus),另外还有美国国防部先进研究项目局(Defense Advanced Research Projects Agency)收集的《华尔街日报》口语语料库和剑桥大学版英国口音的《华尔街日报》口语语料库,目的用于语音识别系统研究等。国外这些现成的新闻英语语料库都有知识产权保护,即使是开放使用的语料库,在搜索引擎方面也做了限制。这些语料库搜索引擎在分析方法、输出类型、分析范围等方面的局限性导致许多语言学问题不可能或是很难通过现成的分析软件做成答案[18]。国内的语料库建设多数属于中国英语学习者语料库,如CLEC,SWECCL,COLSEC,PACCEL等,且基于语料库的中介语研究过多,专门的新闻英语语料库可谓凤毛麟角。因此,自建语料库可以最大限度满足研究的需要。

自建汉语源语新闻语料库(CSNC)的语料全部来源于国内主流新闻网站,即网易新闻、百度新闻等;而双语平行语料库语料主要来源于主流英语学习网站上的双语新闻,如新东方网、中国日报网等。这些主流网站上的双语新闻之英语新闻主要来源于英美主流全国性报刊,如卫报、华盛顿邮报、经济学人等,且汉语译语相对可靠。语料抽样主要依据统计学概率中的等距抽样和分层抽样原则进行。新闻语料库抽样存在两个难点:一是网络新闻的一个重要特点在于,当遇到热点新闻事件时,如“马航飞机失踪事件”“斯诺登棱镜门事件”时,在某个时间范围内各大主流网站都会持续报道该新闻,从而影响语料库的多样性和内容均衡性。二是新闻语体的定义与分类呈多样性特点。在理论研究上,许多学者按照不同标准对新闻进行了分类,如按照新闻事件发生的地域和范围可分为国际新闻、国内新闻和地方新闻;按照报道的内容可划分为政治新闻、外交新闻、经济新闻、娱乐新闻等;按照新闻事件的性质可划分为硬新闻/时事新闻(hard/straight news)或软新闻/新闻特写(soft/feature news)。在实际运用上,各大主流网站的新闻分类并不一致,从而给新闻语料内容的抽样带来了难度。为了更好地体现语料的代表性和平衡性,语料库中的新闻语料收集时间跨度从2011年9月-2013年9月,采用等距抽样原则,每篇新闻时间间隔约1个星期;在新闻内容抽样标准方面主要参照Biber所建的LSWE语料库(Longman Spoken and Written English Corpus)新闻子库的分类标准。该语料库将新闻分为主类别和次类别,主类别包括艺术/娱乐、经济、国内、国外、政治、社会、体育新闻等;次类别包括科技、建筑、生活、健康、天气、地产等。考虑到主类别在新闻文体中的比重较大,且自建语料库的规模的局限性,为更好地达到语料研究的代表性,收集语料以主类别为主,各语料库分别收集686篇,共855 774词。

(二)语料库总体特征分析

在对收集的新闻语料进行分词、赋码等加工之后,通过检索与统计即可获得各语料库的总体特征数据。从这些数据可以看出:第一,在英译汉的新闻中,汉语译文的形符(指文本中所出现的所有词的总数)比英语源语的形符多23 294,说明汉语译文文本使用的词汇数量更多,这是显化的一个重要特征;第二,汉语译文的类符(指文本中不同的词,排除重复并忽略大小写)比英文原文少。类符是指全文中独特单词的数量。根据语言学专家研究结论,句子以及文章中独特单词越多,专业术语和复杂内容一般就越多,最后导致全文理解困难度提高。换句话说,类符越少,表明词汇密度小,词汇的丰富性较弱,文章越好理解。所以,汉语译文比原文更容易理解,说明在翻译过程中译文发生了显化;第三,汉语新闻译文比英语新闻文本句子更长,这也是显化的一个体现。第四,汉语译文新闻的句子数比英语原文新闻的句子数多,即从语句层面的对应比例来看,英译汉新闻文本并非达到1∶1的对应比例,而是1∶1.08。因此,从定量分析上看,英语新闻在汉译的过程中发生了显著的显化(表1)。

表1 ESNC、CTNC、CSNC语料库的数据统计

三、显化手段特征分析

显化的分类依旧众说纷纭。Vinay与Darbelnet将显化简单分为词汇显化与信息显化[1];Perego考察了两幅匈牙利语电影机器意大利语字幕提出,显化现象包括“文化(cultural)”“符号间转化(intersemiotic)”和“基于简化需要(reduction-based)”三类,形式表现为“插入(addition)”和“替换(specification)”两种[6];Klaudy则研究了显化形成的原因,将显化系统分为:强制性显化(obligatory)、选择性显化(optional)、语用显化(pragmatic)和翻译固有 显 化(translation-inherent)[9]。胡 开 宝 等 根 据Halliday提出的功能理论,将显化分为概念功能信息显化、人际功能信息显化和语篇功能信息显化[17]。由于新闻文本特殊的传播功能,笔者采用胡开宝教授的显化功能分类法,对新闻文本的显化手段进行分析。

(一)语篇功能信息显化

胡开宝教授等认为,语篇功能信息显化是指译者将源语文本隐含的语句之间的关系显化[17],在新闻文本中主要表现为人称代词、指示代词、关系代词显化;逻辑关系明晰化,等等。现举例加以说明。

1.人称代词、指示代词、关系代词等显化。在构句层面上,英语和汉语存在着显著的语法差异。英语为了避免重复,会大量使用人称代词、指示代词、关系代词,而汉语则是尽量减少这些词的使用。因此,在英语新闻汉译的过程中人称代词、指示代词、关系代词信息外显化,更符合汉语的语法习惯。

例1:"It's a great help.It will increase people's awareness of Mandarin as a language they can learn,"she said.

译:她说:“这无疑大有帮助。首相的呼吁让人们意识到汉语也是他们需要学习掌握的语言之一。”

析:在一篇关于英国首相大卫·卡梅伦呼吁英国学生多学中文的新闻中,一所名为“马可波罗学院”的中英双语小学的创始人之一劳拉·陈(Laura Chan)对该呼吁进行了评价。原文中用了两个it。译者把第一个“It”直译为了“这”,而显化了第二个“It”,译出了两个it所替代的具体事物,即“首相的呼吁”。

例2:An anonymous survey by Harvard's newspaper has revealed a surprising pattern of academic dishonesty among students entering the US university.

译:哈佛大学的报纸进行的一项匿名调查揭示了一个出人意料的事实,那就是进入美国大学的学生中存在学术不端的行为。

例3:In an email to NBC News,Jeff Neal,a Harvard representative,explained that a committee,made up of faculty,staff and students had been established to tackle cheating,which"is a national problem in American education".

译:哈佛大学的代表杰夫尼尔(Jeff Neal)在给NBC(美国国家广播公司)新闻部门的一封电子邮件中解释说,已建成一个由教职员工和学生组成的委员会,目的是整治作弊现象。作弊已成为美国教育中的一个全国性问题。

析:这两句例句均取自英国美国电讯报在2013年9月17日一篇题为《哈佛大学调查结果显示近半本科学生作弊》的新闻。例2英文原句只是一句简单句,如果直译过来应该是哈佛大学的报纸进行的一项匿名调查揭示了美国大学学生存在学术不端这一出人意料的事实,而译者则采用重组句段的方法,先强调了该调查解释了一个出人意料的事实,然后用“那就是”来回指事实,使表达更加符合汉语的语法习惯。例3的英文原句看起来虽然长,但也只是一句复合句。在译文中,通过标点符号可以很清楚地看出,为了符合汉语的表达习惯,译者通过重组句段的方法,将该句分成了两句话,将关系词“which”显化为“作弊”,另外把一些隐含的语法含义也加以显化,如to tackle cheating,译者译成“目的是整治作弊现象”,而非直译为“来对付作弊”。

2.逻辑关系显化。从表达习惯上看,英语重“形合”,汉语重“意合”,该特点在形式上很重要的特征为英语大量使用连词,但是翻译的过程中,译者不一定根据汉语表达习惯将逻辑关系隐化。

例4:"We don't feel our mistake was someone else's responsibility but obviously it is quite a large amount so any assistance we can get would be helpful."

译:“我们不认为我们的错误是其他人的责任,但很明显账单数额巨大,所以对我们的任何帮助都很有用。”

析:这句话出自一篇关于澳洲一位女婴早产,医疗费高达数百万美元的新闻。该原文如果对因果逻辑关系词加以隐化,即省略“所以”则更符合汉语表达习惯。但是在译文中,译者采用了直译,甚至连逻辑关系词全部显化,以求“保持原汁原味”。这一特点也存在于在其他许多新闻中。

以因果关系连词为例,在三个新闻语料库中检索进行定量分析,可以清楚地看出汉语新闻语料库中因果关系连词仅使用了520次,而英语原文新闻语料库中因果关系词则高达973次,而在汉语译语语料库中因果关系词使用情况则接近与英语源语语料库,使用因果关系词817个(表2)。这说明,新闻译者在翻译的过程中,并没有根据汉语表达习惯将因果关系词隐化,而是将英语新闻中的因果关系词显化。

表2 三语语料库中因果关系词使用情况表

(二)人际功能信息显化

人际功能信息显化是指译者将原文隐含的人际关系、语篇中人物的语气和态度(情态意义)以及语篇中人物的情感、对事物的判断和评价(评价意义)等显化[17]。

1.隐含的人物身份、人际关系显化。在有些新闻中,源语读者对于一些新闻人物的身份、人际关系非常熟悉,因此作者在撰写源语新闻的时候做了隐化处理。在翻译的过程中,为了增强文章的可读性,译者需要将这些隐藏的人际功能信息显化。

例5:Charles and Camilla manage to get a seat on the tube in network's 150th year.

译:查尔斯王储夫妇乘地铁庆通车150周年。

析:这是出自英国卫报《The Guardian》2013年2月1日的新闻。该新闻中提到了Charles和Camilla两个人物,英国的读者对这两人非常熟悉,因为在原文中并没有点明这两人的身份。而在译文中,译者通过“王储”“夫妇”两个词既说明了查尔斯的身份,也说明了二人的关系。译文通过将人物身份及人际关系显化,增强了该新闻标题在中国读者中的可读性。

2.人物的语气和态度显化。在英语新闻的翻译过程中,新闻人物语气和态度的强烈程度受译者因素影响,添加如语气副词等词汇可增加译文的句子长度,从而造成了显化。

例6:Jonathan Brown,spokesman for the Merseyside Civic Society,said:“We fought against Prescott’s scheme and it’s great to have won all these years later.

译:默西赛德郡公民协会发言人乔纳森·布朗表示,“我们一直反对普雷斯科特的计划,经历了这么多年的抗争能取得胜利也算是大快人心。”

析:这句例句出自英国《太阳报》2013年2月22日的新闻。原文中该发言人说:“我们反对普雷斯科特的计划,经历了这么多年后能取得胜利真好。但译文中增加了“一直”“抗争”,显化了这个胜利背后的努力,而“大快人心”一词的使用则说明该计划的不得人心和该胜利令许多人心理感到痛快。

(三)概念功能信息显化

概念功能信息显化指译者将源语中隐含的概念功能信息明晰化[17],在新闻文本中主要表现为:译者通过注释或解释等翻译手段将隐含的文化信息显化;译者将一些修辞手法或表达含蓄的语句的语用含义显化。

1.隐含的文化信息显化。由于文化差异,源语读者所熟知的新闻背景信息对于译语读者则可能是陌生的。译者通过注释或解释等翻译手段将隐含的文化信息显化,有助于降低阅读难度,吸引更多的读者。

例7:U.S.Spies on Undersea Fiber Cables.

译:“棱镜”计划兄弟项目曝光,美监控海底光缆收集情报。

析:这是美国《华盛顿邮报》7月10日的一篇新闻标题。这个译文不仅直译出了“美监控海底光缆收集情报”,同时还交代了背景信息。“棱镜计划兄弟项目”说明了美国监控海底光缆收集情报的手段,同时说明了该计划与“棱镜计划”规模不相上下,“曝光“二字说明了该信息长期以来都是秘密进行的,也说明了该计划是不可见人的丑闻。

2.修辞手法或表达含蓄的语句含义显化。修辞手法或表达含蓄的语句含义和信息的显化,更符合目的语读者的文化习惯,方便目的语读者的理解。

例8:"You Should Use Both,"the slide said,in an apparent message to NSA personnel.

译:除了“棱镜”计划外,美国情报机构还有一个名为“上游”(Upstream)的监控项目,通过美国周边的海底光缆搜集情报。这篇报道公布了一张美国国家安全局的机密幻灯片,其中对“棱镜”计划、以及与之平行展开的“上游”计划有所介绍。

析:这句话出自美国《华盛顿邮报》的新闻《U.S.Spies on Undersea Fiber Cables》的开头部分。英语原文采用拟人的口吻说明了美国收集情报计划曝光是由于一张幻灯片外泄。由于英语原文正文前有插图说明,美国的读者很容易就能明白原文的意思。译者如果采用直译的方法,中国读者必然感到困惑,不明所以。因此,译文详细介绍了“both”的具体含义,即“棱镜”计划和美国情报机构另一个名为“上游”(Upstream)的监控项目,从而达到了信息显化。同时,译文将专有名词NSA加以显化,译为“国家安全局局”;同时对于slide(幻灯片)的相关信息进行了显化,说明该幻灯片是美国国家安全局的机密幻灯片。显化这些隐含的语句含义和信息增强了该新闻在中国读者中的可读性。

例9:"There is an opinion that A-quality guys will find B-quality women,B-quality guys will find C-quality women,and C-quality men will find Dquality women,"Huang Yuanyuan,a confident and single 29-year-old who works in a Beijing radio station,told the BBC."The people left are A-quality women and D-quality men,"she said.

译:黄圆圆(音译)今年29岁,在北京一家广播电台工作,是个自信的单身女孩。她告诉英国广播公司的记者说:“人们认为,A男(条件最好的男子)会找B女结婚,B男会找C女结婚,C男会找D女结婚。”她说:“剩下的是A女(条件最好的女子)和D男(条件最差的男子)。”

析:这篇出自英国《每日邮报》(Dailymail)的新闻报道了关于中国剩女的话题。通过英国广播公司(BBC)对一剩女的采访讲述“剩女”的原因,该剩女把未婚男女分成了A-quality,B-quality,C-quality,D-quality四类。在译文中,译者并没有直译为A,B,C,D四类,而是采用显化手段,将A-quality译为条件最好的,D-quality译为条件最差的,更符合中国读者的文化习惯,因为中国文化中在讨论结婚对象常常比较的是“条件如何”。

四、显化动因分析与结论

通过自建的英语原文新闻、汉语译语新闻和汉语源语新闻等三语语料库的分析发现,译者在翻译英语新闻的过程中普遍采用显化处理,语言与文化差异、新闻文本特定的属性以及译者对于翻译策略的选择是主要的动因。

(一)语言与文化差异

首先,英语和汉语两种不同的语言体系存在较大的文化规范差异。英语重“形合”,汉语则重“意合”。英语为了避免重复,会大量使用人称代词、指示代词和关系代词,而汉语则是尽量减少这些代词的使用,而采用显化的手段,明示代词所指代的具体含义,避免了概念模糊、逻辑关系不清等问题,从而更加符合汉语的语言表达规范。

其次,文化差异是显化的又一重要原因。语言是文化在载体,新闻英语蕴含着大量的文化背景信息。在撰写新闻的过程中,源语作者经常隐化读者熟知的语言信息和文化信息。为了增加译语新闻的可读性,符合译语的文化习惯,译者需要将这些信息显化。

(二)新闻文本的二次传播属性

信息是新闻传播者和受传者之间社会互动的介质,翻译新闻文本决定了译者既是新闻信息的受传者,也是新闻信息的二次传播者。在获得源语新闻信息的基础上,译者对源语新闻进行显化处理,然后进行二次传播。以受众为对象,有效而快速地促使受传者获取所需的新闻信息是新闻传播者的主要目的之一,而不同的受众必然导致了二次传播的作者即译者采用不同于源语作者的写作手段,通过显化一些语言信息、文化信息,符合译语受众的语言文化习惯,满足译语受众获取信息需求。

(三)译者因素

译者是翻译的主体,译者对于译文的显化程度的影响是巨大的。首先,译者个人的语言使用习惯不同,个人的世界观和价值观不同,从而忠实于原文的程度也不同;其次,译者对于语言翻译策略的选择也不是随心所欲的,受多种因素影响。译者在英语新闻翻译中的显化处理,一是使译语新闻符合译语读者的语言文化习惯,增强了文本可读性;二是把自己的或是赞助人的主张巧妙地融入译文中,影响了读者。

综上所述,通过自建英语源语新闻语料库、汉语译语新闻语料库和汉语源语新闻语料库,对英汉网络新闻文本进行对比研究发现,英汉网络新闻文本翻译过程中存在着显著的显化特征,译者通过人称代词、指示代词、关系代词、逻辑关系、隐含的人物身份、人际关系、人物的语气和态度、隐含的文化信息、修辞手法或表达含蓄的语句含义的显化,增强了译语新闻的可读性,方便了读者理解;显化的主要原因在于语言与文化差异、新闻文本特定的二次传播属性以及译者因素的影响。英汉网络新闻文本的显化特征研究不仅有助于读者更好地阅读新闻,拓宽视野,增加知识,了解世界,获取信息,也是对翻译共性研究的有益补充。

[1]Vinay J,Darbelnet J.Comparative stylistics of french and English:A methodology for translation[M].Philadelphia:John Benjamins Publishing Company,1958:24.

[2]Blum-Kulka S.Shifts of cohesion and coherence in translation[M]//Venuti L.The translation studies reader.London:Routledge,2004:84-93.

[3]Seguinot C.Pragmatics and the explicitation hypothesis[J].TTR:Traduction,Terminologie,Redaction,1988,1(2):106-113.

[4]Baker M.Corpus linguistics and translation studies:implications and applications[M]//Baker M.Text and technology:In honor of John Sinclair.Philadelphia:John Benjamins Publishing Company,1993:233-250.

[5]Mauranen A,Pekka K.Translation universals:Do they exist[M].Amsterdam:John Benjamins Publishing Company,1958:24.

[6]Øverås L.In search of the third code:An investigation of norms in literary translation[J].Meta,1998(4):571-590.

[7]Olohan M,Baker M.Reporting that in translated English:Evidence for subconscious processes of explicitation[J].Across Languages and Cultures,2000(1):141-158.

[8]Laviosa S.Corpus-based translation studies:Theory,findings,applications,Amsterdam:Rodipi.2002:1-14.

[9]Klaudy K.Explicitation[M]//Baker M.Routledge encyclopedia of translation studies,London:Routledge,2008:80-85.

[10]王克非.英汉/汉英语句对应的语料库考察[J].外语教学与研究,2003(6):410-416.

[11]贺显斌.英汉翻译过程中的明晰化现象[J].解放军外国语学院学报,2003(4):63-66.

[12]柯 飞.翻译中的隐与显[J].解放军外国语学院学报,2005(4):303-307.

[13]黄立波.基于英汉/汉英平行语料库的翻译共性研究[M].上海:复旦大学出版社,2007.

[14]黄立波.基于双语平行语料库的翻译文体学探讨——以《骆驼祥子》两个英译本中人称代词主语和叙事视角转换为例[J].中国外语,2011(6):100-106.

[15]刘泽权,侯 羽.国内显化研究现状概述[J].中国翻译,2008(5):54-58.

[16]姚 琴.基于平行语料库的《红楼梦》意义显化翻译考察——以霍译本林黛玉人物特征为例[J].外语教学与研究,2013(5):453-463.

[17]胡开宝,朱一凡.基于语料库的莎剧《哈姆雷特》汉译文本中显化现象及其动因研究[J].外语研究,2008(2):72-80.

[18]Bieber D,Susan C,Randi R.Corpus linguistics[M].Cambridge:Cambridge University Press,1998:254.

猜你喜欢
源语代词语料库
复合不定代词点拨
代词(一)
代词(二)
《语料库翻译文体学》评介
这样将代词考分收入囊中
释义理论指导下的口译教学新模式探究
关于卡特福德翻译理论的思考
把课文的优美表达存进语料库
英语翻译中悖论的发现与理解
源语概念对英语专业学生隐喻词汇习得的影响研究