基于语料库和数据驱动学习的翻译实践研究

2014-02-28 02:35苏宝英
关键词:术语语料语料库

苏宝英

(郑州成功财经学院 外语系,河南 郑州 451200)

一、引言

中国的《政府工作报告》(以下简称《报告》)是中华人民共和国政府的一种公文形式。《报告》由各级政府的办公机构拟稿,交政府领导审阅后,正式在“两会”上由国务院总理宣读。《报告》结构通常由三部分组成:一是回顾并总结上一年来的政府工作情况;二是归纳当年政府各项工作,回报这一年政府的工作计划和目标;三是政府自身建设。

《报告》属政论文体,此类文体用词讲究分寸,庄重严谨,准确规范。[1]程镇球(2002)指出,在政论体汉英翻译中,译者应竭力忠实于原文,要忠实于原文的字句,更要忠实于原文的精神。其次,译者要有高度的政治责任感和严肃认真的工作态度。为满足外界了解中国的形势和政治主张,达到对外宣传的目的,报告对应的英文翻译就显得十分重要。

二、数据驱动学习

数据驱动学习(Data-driven Learning,简称 DDL)由 Tim Johns于1991年提出,这种语言教学模式“让学生自己使用语词索引软件去查询本族语者口语或书面语的语料库,给他们提供语言使用的真实样例,而不是一些语法书中设计出的例子”。[2]这种基于语料库的学习模式体现了“以人为本”的教育思想,它能够根据学生各自的程度、需求和兴趣,利用检索分析工具,发现式或者验证式地进行学习,是其他非语料库学习模式所难以实现的。[3]DDL广义上隶属于语料库语言学范畴,着重于语料库对促进学生发现式学习起到的积极作用,强调要从学习者的角度对语料库进行有不同针对性的检索,并利用检索结果来辅助学生的自主学习,让语言教学更有效、更灵活。[4]

早期的DDL最常用于ESL教学中的词汇教学,如对某个领域术语的理解与运用,或是对情态动词、助动词、介词和连词等的掌握(Johns et al 1991)。随后DDL亦扩展运用于其他语言单位的学习,包括掌握句子的各种连接形式,不同类型语篇模式的规律等 (Granger 1996;St.John 2001;Schmied 2003;Pereira2004,etc)。国内学者也对数据驱动学习模式进行过相关的理论探讨(许葵花、张卫平2003;王金铨2004;甄凤超2005),但将这一模式应用于翻译实践研究的很少。本文将以《政府工作报告》为例,具体分析如何将语料库和数据驱动学习相结合并应用于翻译实践中。

三、语料库翻译研究的现状

语料库在翻译研究中的运用主要包括以下几个方面:

一是翻译共性研究,即通过语料库试图探寻翻译语言的整体特征。近年来对翻译共性的讨论包括显化(explicitation)、隐化(implicitation)、简化(simplification)、范化(normalization/conventionalization)、集 中 化 (convergence)、整 齐 化 (levelling out)、非典型搭配(untypical collocations)、干扰(interference)、独特项(unique items)等,方法上则是从具体语言因素入手,采用语际、语内或两者结合的对比模式,以概率和统计为手段,尝试从语言之间相互作用在语言层面的表现探索翻译语言的规律性特征,并从语言内、外加以解释。[5]

二是译者风格研究,Baker倡导的基于语料库的译者风格研究有三个特点:第一,目标文本导向(target text-orientedness)。译者风格研究中,目标语文本整体是分析的焦点,分析过程通常不考虑对应的原文本。第二,译者下意识的语言行为。译者风格考察的各类特征是译者下意识或习惯性选择的结果,而非针对原文本的有意识反应行为。第三,区别性。数据统计分析的结果能将译者的风格与其他译者区分开来。[6]

三是翻译过程研究,即译者大脑中转换活动的过程研究,试图解释翻译过程中译者的思维过程。目前主要采取的策略是有声思维法(think-aloudprotocol)——一种文本数据采集方法,以此来记录译者翻译思维过程。Englund-Dimitrova(2005)借助有声思维法和计算机记录书写过程等手段,对俄语-瑞典语翻译中转折连词在译文中显化与否进行了考察,这种方法可以将记录翻译过程的原文本(meta-text)与翻译文本本身结合起来考察翻译过程。

四是翻译应用研究,此类研究主要体现在译者培训、翻译教学(教学内容设计、语料库课堂运用、语料库辅助翻译教学、语料库翻译搭配教学等)及相关软件的开发(语料库检索工具、机辅翻译工具、专门对应语料库的研制及语料库的加工、术语库的创建等)(王克非,2007;Olohan,2004;Pearson,2003 等)。

四、基于语料库和数据驱动学习的翻译实践

双语平行语料库(bilingual parallel corpus)的研究在翻译教学和实践中得到了广泛的应用。TM(Translation Memory)本身就可以看做是一个以字段为单位对齐的双语平行语料库,可以查看、调用语料,辅助翻译教学。[7]翻译记忆系统可以将翻译完成后的翻译记忆库导出为句对齐的双语平行语料库。翻译过程中,译文会在后台自动保存,这样译者在翻译过程中可能会看到并选用其他较好的译文,从而逐步提高自身的翻译能力。

在所有TM软件中,德国著名翻译软件公司Trados软件应用最广泛。据统计,“目前,塔多思在国际翻译工具市场中占有绝对领先地位,市场份额高达70%以上,已成为众多翻译人士、企业解决方案供应商及国际大公司的首选。”。[8]Trados不是一种机器翻译软件,而是一种翻译记忆软件。译者利用已有的原文和译文,建立起一个或多个翻译记忆库,在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落等),给出参考译文,使用户避免无谓的重复劳动,同时改进和提高翻译质量。简言之,就是将译员做过的工作,用Trados提供的工具存储起来,放到两个主要的数据库(记忆库)中,一个是句料库(用WinAlign工具制作),另一个是术语库(即Multiterm)。

本文是一项基于语料库的研究,所使用的语料库是一个双语平行语料库。笔者收录了从2007到2011年的《报告》的中文及译文(来自中国日报)利用Trados软件建立成一个小型平行语料库,规模约为16万字词,其中中文约9万字,英文约7万词,两种文本采用半自动的方法在句子水平上对齐。旨在帮助译者提供一种有效地翻译实践手段。下面针对笔者建立的《报告》语料库,对2012年《报告》的翻译实践进行详细介绍:

(一)词汇检索,参考译文针对性更强

在翻译过程中,大多数学习者或者翻译人员针对生词的处理,更喜欢使用词汇的直接意义或者词典中的意义,这种情况在汉英翻译中普遍存在。实践表明,使用词典意义虽然比较容易得到词语的表面意义,但往往与语境相脱节,致使译文表达不准确、不恰当,不符合原文风格。而Trados建立的平行语料库可以自动搜索翻译记忆库中相同或者相似的词语或句子,给出参考译文,恰当地解决了这一问题,从而提高了翻译的准确性和效率。

图1:Trados的词汇检索结果

如上图所示,针对“各位代表”一词在所建语料库中进行检索可显示出图中结果。左列为汉语语料,右列为英文语料,译文匹配显示100%。该语料库不仅能显示出该词语对应的英文表达,而且能够给出该表达使用的语境,这样翻译人员可以根据自己的需要,选取同等语境下该词语的表达。

(二)术语搜索,大大提高翻译效率

对于科技翻译的文体特点,纽马克指出“科技翻译因科技术语而从根本上有别于其他类翻译,这类术语占到了5%~10%”。[9]而航天、计算机、工程等专业领域的翻译资料的重复率一般都达到了20~80%,[10]对于技术翻译来说,术语的准确性和一致性是确保翻译质量的关键要素之一。[11]有效利用Trados软件,计算机便能够自动为翻译人员提供对应的术语译文,大大提高了工作效率,同时又能保证专门用途汉译英文本术语的一致性。

图2:Trados的术语搜索结果

如上图所示,对“热钱”一词在术语库中检索结果得知其对应英文为“hot money”。使用Trados可以保证术语在前后文本中的翻译一致。在满足“等值”要求的同时,Trados还能避免重复劳动,提高翻译效率。根据SDL公司的数据,应用Trados解决方案后,用户的翻译工作效率可以提高30%~80%,翻译成本降低30%~60%。“翻译记忆和术语管理有助于保证不同译者的术语一致性,起到了良好的辅助作用。”[7]从而帮助翻译人员提高翻译质量和效率,更加有效地应对专门用途体裁的翻译。

(三)文本匹配,提供更多的语境信息

Trados软件中WingAlign可以让用户重复利用现有资源,通过翻译记忆技术再次利用用户已翻译过的资料,对原语料和目标语文本进行分析,精确找出相对应的句子和段落,自动地将源语文本与目标语文本匹配对应。将找到相同或类似的语料同其翻译一起显示出来,如有与所存文本不同的词或短语,这些词或短语将被突出地标出。用户翻译时可对其进行修改、接受或放弃。再次修改或重新翻译的文本将被保存在翻译记忆中,以便翻译人员进行之后的工作。

图3:Trados的句子检索结果

如上图所示,针对“我们将坚定不移地贯彻‘一国两制’、‘港人治港’、‘澳人治澳’、高度自治的方针,全力支持香港、澳门发展经济,改善民生,推进民主。”一句,Trados自动检索到类似的句子同其翻译一同显示出来,并提供了丰富的语境信息。结果显示将要翻译的句子与翻译记忆库中的句子匹配率达到84%,翻译人员只需将突出显示出的不同词语稍作修改即可完成。

同时附带显示出目标语句中出现的术语,“一国两制 (one country,t wo systems)”、“高度自治(with a high degree of autonomy)”、“民生(wellbeing)”等的翻译,这样不仅提高了翻译工作的效率,而且提高了翻译的质量。

图4:术语识别结果

四、结语

基于语料库和数据驱动学习的翻译实践,在词汇检索、术语搜索及文本匹配等层面有其独特的优势。数据驱动学习基于语料库,要求语言学习者带着问题,运用检索软件,在对大量真实语料进行观察和分析的基础上,由学生从真实的语言使用实例中归纳总结出语言使用特征,并最终将问题解决。[12]

这种发现式学习方法鼓励译者发散性思维,充分调动了译者的翻译兴趣,对专门用途体裁的汉英翻译,尤其对于《报告》这一特殊的文体,为了达到对外宣传的目的,其英译文本应在保持原文意思的基础上,遵循简洁的原则,尽可能靠近本族语者的表达习惯,从而被目的语读者接受。通过这种方法不仅可以大大提高译员的翻译效率,而且对今后的翻译教学和翻译学习者自主学习也有一定的指导意义。

(注:本文系河南省教育厅人文社会科学研究项目“基于英语口译语料库和数据驱动学习的多维度语块研究”,项目编号:2013-QN-537)

[1]陈建生,崔亚妮.基于语料库的中国《政府工作报告》英译本词汇特征研究[J].当代外语研究,2010,(6):39-43.

[2]Meyer Charles.English Corpus Linguistics[M].Port Chester:Cambridge University Press,2002.27.

[3] 何安平.语料库与外语教学[J].国外外语教学,2001,(3):15-19.

[4]李德超,王克非.基于双语旅游语料库的DDL翻译教学[J].外语电化教学,2011,(1):20-26.

[5]王克非.语料库翻译学探索[M].上海:上海交通大学出版社,2012.18.

[6]黄立波,王克非.语料库翻译学:课题与进展[J].外语教学与研究,2011,(6):91-923.

[7]王正,孙东云.翻译记忆在翻译教学中的优势与局限性[J].外语界,2009,(2):16-22.

[8]汪溶.翻译质量瓶颈的重大突破——TRADOS翻译解决方案的巨大贡献[J].中国科技翻译,2002,(1):42.

[9]Newmark.Approaches to Translation[M].上海:上海外语教育出版社,1988.151.

[10]冯志伟.机器翻译研究 [M].北京:中国对外翻译出版公司,2004.65.

[11]袁亦宁.翻译技术与我国技术翻译人才的培养[J].中国科技翻译,2005,(1):51-54.

[12]吴进善.基于多媒体语料库的数据驱动学习模式研究[J].当代外语研究,2010,(6):44-47.

猜你喜欢
术语语料语料库
《语料库翻译文体学》评介
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势
语料库语言学未来发展趋势