《语料库翻译研究的新方向》评介

2016-02-11 22:23侯林平
天津外国语大学学报 2016年5期
关键词:语料语料库平行

侯林平

(山东科技大学 外国语学院,山东青岛 266590)

《语料库翻译研究的新方向》评介

侯林平

(山东科技大学 外国语学院,山东青岛 266590)

C. Fantinuoli & F. Zanettin. 2015. NewDirections in corPus-bAsed TrAnslAtion Studies. Berlin: Language Science Press, 167.

一、引言

德国柏林语言科学出版社于2015年出版了由Claudio Fantinuoli和 Federico Zanettin主编的《语料库翻译研究的新方向》(NewDirections in corPus-bAsed TrAnslAtion Studies)一书。本书由七篇独立成章的论文组成,围绕多语语料库建设与多重复合分析议题展开,汇集了多语语料库建设及其在翻译研究中应用的前瞻性成果,代表了本领域研究的新进展,特撰文概述与评析这两个主要议题。

二、多语语料库建设

根据所含语言种类的多寡,语料库一般可以分为单语语料库和多语语料库。在语料库语言学文献中,以语言研究为目的的多语语料库主要指同一文本及其译文通过编辑和对齐而成的双语或者三语书面语平行语料库(Schmidt & Wörner,2012:xi)。在自然语言信息处理研究和开发中,多语语料库也是以双语平行语料库居多(常保保、詹卫东、张华瑞,2003)。而平行语料库所涉及的语言可以多达几十种(Čermák & Rosen,2012)甚至上百种(ChristodoulouPoulos & Steedman,2015)。本书中的多语语料库是适合不同翻译研究项目所建成的语料库,既有双语或者三语平行语料库,又有两种以上语言建成的可比语料库。

1 平行语料库

Serbina等、Mouka等及Zubillaga等学者分别创建了适合其研究目的的多语平行语料库。Serbina等整合运用translog(一款能够通过点击键盘和鼠标生成中间译文的击键记录软件)产生的实验过程数据与最终产品数据开发了击键记录翻译语料库(keystroke logged translation corPus),以期探索译者的不同认知特征与再现模式。语料来自一个研究语法复杂性的翻译过程数据。该语料库由原文子库、过程/中间译文子库和目标译文子库构成,并且进行了多层标注和复杂对齐等加工。首先使用已有的工具对原文和目标译文进行自动标注和对齐,然后再与标注过的过程文本进行对齐。过程文本采用2013年最新研发的半自动对齐工具进行对齐,主要包括:(1)击键记录的一组行为(如插入/删除字符和点击鼠标等)与过程文本中表达词汇意义的语符对齐;(2)语符与原文/译文中的词汇对齐;(3)短语层面上对齐;(4)语法功能层面上对齐。过程文本采用XML进行多层标注,主要包括:(1)实验受试者身份、译文的版本和受试者组别等元信息;(2)词性、句法剖析和语法功能等语言信息;(3)停顿时长和回车次数等行为信息。该语料库的建立为翻译过程和结果结合的研究提供了蓝本。

Mouka等则描写英语、希腊语、西班牙语三语字幕翻译语料库的创建。为了更好地研究电影字幕翻译中种族主义话语的语域转换策略,Mouka等将有关种族主义主题的五部英语电影转写后与希腊语和西班牙字幕文字进行对齐,并且在采用XML进行多层标注时综合利用了多种语料库加工工具。采用eLAIN及GATe 平台,eLAIN标注说话者的信息,并且同步视频与音频的播放时间,GATe平台标注语域转换方式、态度类型及强度等语言信息。就语料选择而言,该平行语料库或许是第一个从交际情景来选择语料而建成的有关种族主义的多模态话语语料库。

为了探讨强势/弱势民族文学翻译现象,Zubillaga等创建了德语、西班牙语、巴斯克语三语平行语料库(Aleuska)。该库分工合作,采用XML进行多层标注,在句子层面进行对齐。在共享研究目的、研究框架和建库工具的前提下,Zubillaga等分别建立了詈语和语气词的儿童/青年文学子库、惯用语/词组的叙事子库和出版审查制度的哲学子库,并且按照研究重点进行

分别标注。在标注文本元信息时,各子库均标注了四类翻译信息,即直接翻译、间接翻译、假定直接翻译和假定间接翻译。值得一提的是,由于现有的建库工具无法应用到此语料库建设中,Zubillaga等与IT专家合作开发了符合本项研究特制的对齐工具(TRACe-Aligner 3.0)和搜素引擎。作者对建库资料的选择、信息标注和对齐都体现出了创新。

需要指出的是,除了自建平行语料库进行翻译现象研究之外,本书中还探讨了Doms基于现有的英语、荷兰语平行语料库,探讨give和show的非人称主语如何转译到荷兰语中的问题。

2 可比语料库

为了实现了不同的研究目的,LaPshinova-Koltunski和Pontrandolfo分别自建了可比语料库。通过显化、简化、范化/透过效应和趋同化四个译文特征,探索同一英语原文采用不同翻译方法而产生多个不同德语译文的变异现象,LaPshinova-Koltunski创建了名为VARTRA-SMALL的可比语料库。VARTRASMALL包括六个子库:一个英语原文子库、一个现成的人工德语译文子库、一个机助德语译文子库和三个利用不同机器翻译系统而产生的机译德语译文子库。各子库均通过有关软件进行自动语符化、词元化、词类标注和句子切分。除人工子库在句子层面与原文对齐外,其他子库未对齐。

为了探索复杂介词、二联词/三联词、词汇搭配和常用程式化结构等司法用语在英语、意大利语和西班牙语中的频率分布模式,Pontrandolfo自建了刑事判决语料库(CoSPe)。CoSPe文本采集标准统一,遵循体裁和使用域一致的原则。该语料库中的文本属于不同的司法体系,无需进行语言标注和对齐加工,却仍然能实现其为法律译者和法律专家提供可利用资源以及提高司法用语能力的目的。

三、多重复合分析

除了根据实际研究需要自建语料库之外,本书均采用了语料库翻译研究的多重复合分析模式,即通过平行语料库和可比语料库系统比较和对照,在语言、文化和/或认知层面/维度上研究翻译现象,如译者处理语法复杂性的方式、译者的价值判断与接受、译文变化的波动现象等。

Serbina等创建的击键记录翻译语料库不仅含有原文和目标译文,而且包含了多个过程/中间译文。通过此语料库,Serbina等定量分析了英德翻译(多个)中间译文中的同一个语符的不同词汇选择、同一个语义、不同词类替换或者在短语和小句层面的转换、同一个词的词汇屈折变化和同义词替换现象,从而探讨了译者在语法复杂性方面的处理方式。Serbina等的研究体现了语料库翻译研究从产品取向研究转向产品和过程整合认知研究的新方向。在整合批评话语分析和系统功能语言学中利用人际意义的评价理论探讨种族主义话语的语域转换时,Mouka等作者对相关理论进行了改造,使之符合特定的研究目的,并且具有可操作性。通过自建的多模态平行语料库及其与参照语料库分析,Mouka等发现种族主义话语的负面态度意义在翻译转换中呈现弱化的总体趋势。该文通过多层次/多维度的语料库翻译分析为我们提供了整合多语多模态语料库和参考语料库探讨种族主义语域转换研究的先例。

在自建平行语料库和参照语料库基础上,Zubillaga等研究了德语与巴斯克语直接/间接翻译模式,发现德语与巴斯克语直接翻译和间接翻译都符合Toury(1995)描写翻译研究的标准化法则和干扰法则。该文对基于语料库的强势与弱势/少数文学翻译研究极具借鉴意义,此类课题的进一步系统实证研究将为翻译教学、词典编纂、对比语言学和相关领域提供参考价值。值得一提的是,基于现有英语、荷兰语平行语料库,Doms在句法和语义层面探讨英荷译者对give 和show的非人称主语的翻译方式。与其研究假设相反,该研究发现荷兰语译文受到原文干扰,译文中give 和show的主语分布模式为非人称>无人称>人称,Doms从语言的句法和语义层面进一步阐释了其中的原因。该文的研究体现了复合式研究的特征,体现了对比模式与因果模式相结合的新趋势。

通过自建VARTRA-SMALL可比语料库,LaPshinova-Koltunski通过词汇语法模式和词频统计指标,探讨了人工译文、机助译文和机器译文的显化、简化、范化/透过效应和趋同化特征变异现象。研究结果表明,除趋同化之外,作者基于前人人工翻译研究基础上的研究假设均不成立。需要指出的是,在综合比较研究不同翻译方式产生的译文特征变化方面,该文尚属首例。在自建CoSPe可比语料库和参照语料库基础上,Pontrandolfo综合研究了司法用语的特征,数据分析显示,与参考语料库相比,CoSPe的司法用语出现频率高,体现了该体裁在词汇和句法方面的区别性特征;在标准化程度和司法用语使用频率方面,英语子库低于意大利语子库和西班牙语子库;法律语篇中典型出现的一系列惯用法似乎证明法律/司法语法的存在。该文的研究实现了语料库驱动的翻译研究目的,即为法律译者、法律专家和词典编纂者提供资源,提高司法用语能力。

四、研究背景与特色

一般认为,语料库语言学在描写翻译研究中的应用发轫于Baker(1993)的研究,即翻译研究将得益于语料库基础上的比较和对比研究。基于大型单语翻译语料库和非翻译/目标语参考语料库,Baker及其同事进行了译文取向的语言特征描写研究,主要探讨翻译共性假设。在语料库翻译研究中,Kenny(2001)

等学者则认为,能够进行语际比较研究的双语平行语料库是对单语可比语料库研究的有益补充。平行语料库基础上的原文取向翻译研究重获新生,并且不断向过程取向和功能取向拓展(Xiao & Yue,2009),出现了适合特定研究课题(如译者风格和意识形态)的自建小型双语语料库。最近十年来语料库语言学方法在翻译研究中的应用呈现上升趋势,语料库翻译研究取得了长足发展,在翻译研究中占有重要地位(Zanettin,Saldanha & Harding,2015)。

尽管语料库翻译研究在翻译共性、意识形态、译者风格和翻译教学等方面发表和出版了一批价值颇高的研究成果,但是与单语语料库相比,多语语料库的建设和在翻译中的应用进展缓慢。语料库建设需要投入大量工作,其设计应该与应用目标相一致。“语料的收集、语料的构成以及对语料的加工应该紧紧围绕语料库的应用目标进行。”(常保保、詹卫东、张华瑞,2003)本书中的语料库主要是符合特定翻译研究课题而自建的小型多语语料库,具有以下特色:(1)在语料的收集和加工方面紧紧围绕其研究目的而设计;(2)均采用当前流行的XML标记语言进行标注,符合资源重复利用原则;(3)文本类型和数据类型涵盖广,主要有科技、电影字幕、文学和法律等多样化的文本类型和多语种、多模态、行为数据和机译数据等多种数据类型;(4)代表了语料库创建的不同新方向,如翻译产品与过程整合的平行语料库、字幕翻译多模态平行语料库、直接/间接翻译平行语料库和人工/机器翻译可比语料库等;(5)自行研发的语料库加工工具开辟了利用文本和研究材料的新途径,拓展了语料库应用范围。

目前国际上语料库翻译研究方法出现了转向,由单语类比研究模式转向了双语平行研究模式,双语平行研究模式正在转向多重复合分析模式。多重复合分析模式是采用原文子语料库+(多语/多个)译文子语料库+非译文子语料库构成的平行语料库和可比语料库系统比较和对照的方法,可以多层次和多维度研究翻译中语言、文化或认知现象(Mcenery & Xiao,2002;肖忠华,2012:5)。多重复合分析模式突破了语料库翻译研究的单纯双语平行研究模式和简单双语平行+类比研究模式,这种研究新趋势“是复合式的对比模式,并向过程和因果模式过渡”(黄立波、王克非,2011)。在根据实际研究需要自建语料库基础上,本书各项研究均体现了多重复合分析模式的新趋势,突破了单一类比研究模式、单纯双语平行研究模式和简单双语平行+类比研究模式的研究,并且在语言、文化和/或认知层面/维度上注重与过程模式和因果模式结合进行研究。本书采用的多语平行语料库和多语可比语料库复合研究方法体现了方法论意义上的新进展。

综上所述,本书体现了语料库的前沿研究,具有鲜明特色。语料库紧紧围绕其研究目的而进行设计,符合资源重复利用的原则,涵盖多种文本/数据类型,代表语料库创建的不同新方向。在根据实际研究需要自建语料库基础上,本书各项研究均进行多层面/维度的复合分析,体现了多重复合分析模式的新趋势。

五、商榷与展望

尽管本书在多语语料库建设和多语语料库翻译研究方面体现了语料库建设的新动向及其研究方法的新突破,但是总体上和个别研究中也存在值得商榷和有待完善之处。本书探讨了七种欧洲语言(巴斯克语、荷兰语、德语、希腊语、意大利语、西班牙语和英语)的多语语料库建设与应用,缺少其他欧洲语言和非欧洲语言的语料库建设和应用。多模态口译语料库的建设和研究是语料库口译研究新动向(黄立波、王克非,2011),本书缺少此类语料库的建设和研究,尽管Mouka等的多模态字幕翻译平行语料库建设对多模态口译语料库的建设极具借鉴作用。本书中的自建语料库规模小,缺少语料或者(半)自动加工软件。

本书中的个别研究中存在有待完善之处。尽管Mouka等提供了多语多模态电影字幕语料库的多层标注方法以及种族主义在电影字幕翻译中语域转换研究的先例,但是就翻译方向和积极话语分析方面而言,我们发现Mouka等未曾涉及到其转换特点与规律。不同翻译方向的积极话语分析应当是进一步探索的领域。尽管LaPshinova-Koltunski开创了探讨译文变异现象的新方法,即将不同翻译方式产生的译文进行综合比较研究,但是研究也存在不足,如未能将译者经验和机器翻译记忆系统纳入此研究中,并且探讨译文特征研究的文献相对较多。Doms的研究价值在于正本清源地描述和解释了译者实时进行翻译选择的事实。由于语言差异,译者在理论上会作出符合译入语取向的选择,但是译者在实践上往往会在源语和译入语之间左右摇摆。该文注重语言分析,缺少社会文化和认知要素的分析。我们认为,翻译生态环境(如翻译方向、源语地位、原文语体、译者翻译能力、译文读者和出版审查制度等)会影响译者的选择,同时翻译认知加工经济机制也是关键要素。这些都是该文未曾探讨的方面。

展望本书的研究,我们认为,科学技术进步和研究方法革新的有机结合是语料库翻译学不断发展的推动力,从而使描写翻译学、理论翻译学和应用翻译学研究出现跨越性发展。随着语料的不断丰富和加工工具的研发与完善,若书中提到的各类语料库规模不断扩大,其应用前景可观。科技技术进步使翻译研究超越了Holms(1972)和Toury(1995)所倡导的描写翻译学的界限(Carl,Bangalore & Schaeffer,2016:3),突破了原有的语料库翻译研究范式。如前所述,多语语料库建设和研究工具的开发及多重复合翻译研究模

式中的多层次对比分析、因果探讨和过程探索,部分承担了理论翻译学建构的使命,同时为应用翻译学提供了理论和应用支持,如成果可以开发为培训口笔译者的材料/工具,以期提高译者的翻译能力。科技进步和研究方法的革新应当有机结合在一起。研究方法的选用并非生硬地移植或者组合,而应当与研究目的相适应。本书中的研究方法选择适当,均与其研究目标一致。正如本书编者所言:“语料库建设和研究主要取决于可获得的语料资源和合适的语料处理工具,两者紧密结合是探索语料库翻译研究新方向的关键。”(Fantinuoli & Zanettin,2015:9)

除了起决定性作用的研究工具/方法之外,语料库翻译研究的进一步发展同样离不开研究团队的内部合作以及跨地域、跨国界合作。不同领域和地域的学者取长补短,互利合作,是语料库翻译学乃至整个翻译学学科建设和发展的重要保障。这是由语料库翻译学的跨学科性决定的。展望未来我们有理由相信建设性的地域或者国际联合研究项目既可以保证科学技术进步和研究方法革新的有机结合,也有望在语料库规模、语料类型、数据深加工、纵深拓展研究领域以及其应用价值等方面继续探索,以期实现创新研究和其价值最大化。

经过 20 年左右的发展,语料库翻译学出现了产品—功能—过程与单语—双语—多语的跨越发展,研究成果不断涌现。多语语料库建设与多语语料库基础上的翻译研究成为语料库翻译学的一大亮点和新趋势。尽管存在一定的不足,但是本书体现了语料库翻译学研究的新方向,在多语种和多模态语料库的开发、深化旧课题(如翻译共性、译者风格、意识形态和翻译教学等)和拓展新课题(如译者的认知努力和译者的专业能力等)的研究、多视角/多层次的多重复合研究模式(如对比、因果和过程等整合研究模式)等方面推动了翻译学科的建设和发展。

[1] Baker, M. 1993. CorPus Linguistics and Translation Studies: ImPlications and APPlications[A]. In M. Baker, G. Francis & e. Tognini-Bonelli (eds.) TextAnd Technology: In Нonour of John SinclAir[C]. Amsterdam: John Benjamins Publishing ComPany.

[2] Carl, M., S. Bangalore & M. Schaeffer. 2016. Introduction and overview[A]. In M. Carl, S. Bangalore & M. Schaeffer (eds.) NewDirections in EmPiricAl TrAnslAtion Process ReseArch:ExPloring the cRITT TPR-DB[C]. Cham: SPringer Interrnational Publishing AG.

[3] Čermák, F & A. Rosen. 2012. The Case of InterCorP, a Multilingual Parallel CorPus[J]. InternAtionAl JournAl of corPus Linguistics, (3): 411-427.

[4] ChristodoulouPoulos, C. & M. Steedman. 2015. A Massively Parallel CorPus: The Bible in 100 Languages[J]. LAng Resources & EvAluAtion, (49): 375-395.

[5] Fantinuoli, C. & F. Zanettin. 2015. NewDirections in corPus-bAsed TrAnslAtion Studies[C]. Berlin: Language Science Press.

[6] Holmes, J. 1972. The Name and Nature of Translation Studies[R]. Translation Section of the Third International Congress of APPlied Linguistics, CoPenhagen.

[7] Kenny, D. 2001. Lexis And creAtivity in TrAnslAtion[M]. Manchester: St. Jerome Publishing.

[8] Mcenery, A. & R. Xiao. 2002. Domains, Text TyPes, AsPect Making and Chinese Translation[J]. LAnguAges in contrAst, (2): 211-231.

[9] Schm idt, T. & K. Wörner. 2012. MultilinguAl corPorA And MultilinguAl corPus AnAlysis[C]. Amsterdam: John Benjam ins Publishing ComPany.

[10] Toury, G. 1995. DescriPtive TrAnslAtion Studies And beyond[M]. Amsterdam: John Benjamins Publishing ComPany.

[11] Xiao, R. & M. Yue. 2009. Using CorPora in Translation Studies: The State of the Art[A]. In P. Baker (ed.) contemPorAry corPus Linguistics[C]. London: Continuum.

[12] Zanettin, F., G. Saldanha & S. Harding. 2015. Sketching LandscaPes in Translation Studies: A BibliograPhic Study[J]. PersPectives: Studies inTrAnslAtology, (2): 1–22.

[13] 常保保, 詹卫东, 张华瑞. 2003. 面向汉英机器翻译的双语语料库的建设及其管理[J].术语标准化与信息技术, (1): 28-31.

[14] 黄立波, 王克非. 2011. 语料库翻译学:课题与进展[J].外语教学与研究, (6): 911-923.

[15] 肖忠华. 2012. 英汉翻译中的汉语译文语料库研究[M].上海:上海交通大学出版社.

(责任编辑:于 涛)

2016-03-28;

2016-04-11

侯林平,男,副教授,博士生,研究方向:语料库翻译学、认知神经翻译学

猜你喜欢
语料语料库平行
向量的平行与垂直
平行
基于归一化点向互信息的低资源平行语料过滤方法*
逃离平行世界
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
再顶平行进口
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入