小型双语平行语料库的研制以及在翻译教学中的应用

2016-11-17 09:16张立柱
湖北第二师范学院学报 2016年9期
关键词:译本平行语料库

张立柱

(中国矿业大学 外文学院,江苏 徐州 221116)



小型双语平行语料库的研制以及在翻译教学中的应用

张立柱

(中国矿业大学 外文学院,江苏 徐州 221116)

语料库技术与翻译教学的结合是翻译教学领域里的一次革新,逐渐成为一种新的研究范式。文章论述了语料库在翻译教学中的优势以及自建小型双语平行语料库的过程和方法,并以此为基础尝试运用语料库驱动的方法开展大学英语翻译教学模式的改革。

双语平行语料库;语料库驱动;翻译教学

现代信息技术对教育发展具有革命性影响,语料库是其中的重要组成部分。它以前所未有的巨量语言信息储备、高速精确的计算机提取方式和鲜明突出的语境共现界面取胜,一方面为语言教育教学提供大量优质资源,另一方面可创设大信息量、多维演示的立体教学和人机互动的优质教学平台[1]。自20世纪90年代以来,语料库已经逐渐应用到翻译研究的各个层面,成为一种新的研究范式。其中,语料库与翻译教学的结合是翻译教学领域的一次革新,随着计算机的日益普及和互联网的不断发展,利用语料库开展翻译教学将具有巨大的发展潜力。

一、语料库在翻译教学中的优势

在国内,传统翻译教学多基于教师的经验式、感悟式、师徒式的传授方法,在翻译教材、课堂讲授和学生自主学习等方面都存在不足之处。语料库的出现在某种程度上恰好能弥补这一不足。在语料库教学环境中,学生通过发现式学习和数据驱动的学习方式训练掌握翻译技巧、提高翻译技能、熟悉翻译职业特征[2]。

Zanettin指出了小型双语语料库在翻译课堂教学中对于促进原文理解和译文表达能力的价值[3]。Bowker认为语料库可以帮助翻译教师评判译文质量,指导翻译教学[4]。黎士旺论证了基于语料库的翻译教学与传统的翻译教学模式相比,具有文本电子化、学习直观化、分析多元化、结论科学化、成果有机化等五大方面的优势[5]。胡开宝认为基于语料库的翻译教学模式具有一些不可替代的优势,可以提高学生在翻译教学中的参与程度,以学生为中心进行翻译教学,强调翻译理论与翻译实践的有机结合,并能实现翻译教学的真实化和社会化[6]。

平行语料库(也称为对应语料库或双语对应语料库)是“由原文文本及其平行对应的译语文本构成的双语语料库,其双语对应程度可有词级、句级和段级几种”[7]。胡开宝认为双语平行语料库与翻译教学的关系最为紧密,它为翻译教学提供了丰富的教学资料和便捷的教学手段,可以提供动态语境,帮助学生学习翻译策略并形成自己的翻译观以及验证教师自己的语感[6]。王克非等更加肯定了语料库的作用,指出双语语料库与翻译教学存在天然切合点,语料库可为学习者提供经验数据,学习者可以藉之自主学习、发挥潜能,提升学习的效率和效果[8]。王克非总结了平行语料库在翻译教学中运用的基本原则,那就是观察先于归纳、呈现先于讲解、学生自导先于教师指导,指出了与传统翻译教学模式相比的优势是把学习者视为是发现者,甚至是研究者,更易于加强学习者学习的自主性和主动性[9]。

依赖语料库的研究方法可以分为三类,分别为语料库指导的方法(corpus-informed approach),基于语料库的方法(corpus-based approach)和语料库驱动的方法(corpus-driven approach)。其中在语料库驱动的方法中,研究者可以根据自己的兴趣在语料库中观察语言现象,对数据进行分类和归纳,最终得出自己的结论,数据驱动学习的基本理念符合“以学习者为中心”的思想[10]。利用平行语料库,开展翻译教学中的数据驱动学习将有利于充分发挥学习者的主观能动性,解放教师,实现课堂真正意义上的“翻转”。

二、根据翻译教学需求自建小型双语平行语料库

目前,国内虽然已经建成了一些大型双语平行语料库,如北京外国语大学的“汉英对应语料库”,北大计算语言研究所开发的“Babel汉英平行语料库”,英国兰卡斯特大学的“巴比伦英汉平行语料库”,但由于版权等原因这些语料库并没有完全免费开放或实现在线检索。此外,这些语料库有些主要是用于语言对比、翻译研究、词典编撰等,而不是翻译教学,并不能直接拿来用于课堂教学。因此,很多时候,翻译教师有必要根据不同教学研究的需要,自建小型语料库。

肖维青很早就曾指出,“翻译教师自建小型语料库并不是天方夜谭,建设者只要有一些基础计算机知识,并学会一些语料库检索软件,就可以建立应用于翻译教学的平行语料库并不断扩容,纵深开发”[11]。

由于互联网的普及,通过网络搜索获取资料变得越来越便捷,教师在备课的时候可以通过查找,收集原文以及不同译文的电子版本,尤其是一些经典文学著作,通常会有很多译本, 建立一次性语料库(disposable corpus)用于课堂的教学展示或课外学习任务,也可以指导学生自己建库,用于以后的翻译自学。由于语料库提供真实环境下的语言材料,不仅可以使学生掌握语言技巧和翻译技巧,还可以使他们在社会文化和语言交际背景下获得关于翻译的感悟和体验[6]。

文章将以朱自清的经典散文《匆匆》的三个译本为例,阐述如何制作小型双语平行语料库用于课堂教学。

三、小型双语平行语料库的制作过程

1. 收集文本

通过网络检索、文本电子扫描(OCR)、网上数字图书馆以及人工录入等方式采集所需要文本的电子版,由于网络上的资源良莠不齐,需要教师予以仔细甄别、把控文本质量。比如,通过网络检索,很容易就能找到朱自清《匆匆》的原文和三个译本的电子版,而且三个译本都已经在正式刊物或出版社发表,具有权威性,质量比较有保证。按照时间顺序,分别为朱纯深1994年发表于《中国翻译》上的译作“Rush”,张培基1999年译注的《英译中国现代散文选》一书中的“Transient Days”以及张梦井等1999年编译出版《中国名家散文精译》中的“Days Gone By”。这三个译本都是同一个年代的,所以可以基本排除时间因素对译本的影响。

如果所获取的文本不是word或txt格式的,还需要对其进行格式转换。ABBYY FineReader是一款实用并且功能强大的软件,可以把网上大部分pdf以及图片格式的文件扫描转换成word格式。获取文本之后,把原文以及三个译文分别命名,使用ANSI编码保存成四个txt格式的文件,为下一步文本清洁做准备。

考虑到不同学生的水平和接受程度不同,收集完文本后,可以用一款Paul Nation开发的Range软件初步分析英文译文的词汇难度是否适合课堂教学[10]。该软件包含三级词汇底表,其中前两级词表包含比较常用的两千词簇(word families),第三级词表包含570个源自“学术英语词表”的词簇。第三级和词表外词汇,特别是第三级词表对文本整体的词汇难度有较好的判别能力。通过使用Range软件对《匆匆》的三个英文译文分析得出,朱纯深、张培基、张梦井译本中第三级词表词簇分别为14、17、15,类符百分比分别为7.02%、7.98%、7.77%。由此可见,三个译本的难度相当,都不算大,比较适合大学英语翻译课的教学。

2. 文本整理与清洁

由于所收集文本的电子版可能存在多余的空行、空格、标点符号全角半角混乱等格式问题,人工整理非常耗时耗力,可以使用一款名为“文本整理器”的免费软件。根据不同的文本,需要采用不同的整理方案,该软件有一个“批量整理”功能,包含“空格”、“段落”、“标点”、“内码”、“调整”、“替换”等方案,使用者可以自己根据所需选择设计不同的方案。通过观察,笔者所收集的这几个文本基本符合要求,不需要做过多调整,但由于下面所使用的对齐软件ParaConc不能识别中文的全角标点符号,所以首先需要把中文版《匆匆》中的所有标点从“全角”转换为“半角”。此外,因为ParaConc默认的句子定界符标记(delimiter)标注为“seg”,为了实现句子的初步对齐,可以在所有文本的句末标点后插入标注“”。可以通过“文本整理器”的“替换”功能,把所有文本里的 “.”“!”“?” 批量替换为“.”“!”“?”。如果不加标注直接对齐,很可能出现错误,却找不到错误。

3. 文本分词与标注

由于中文的字词之间没有空格,ParaConc不能识别,所以需要对中文语料进行分词处理,可以使用中国科学院计算技术研究所研制的ICTCLAS软件。如果同时需要词性标注,可以分词与标注同时进行。英文语料一般不需要分词,如果需要词性标注可以使用一款名为TreeTagger的免费软件。

4. 文本句子对齐

以上准备工作做完之后,就可以使用ParaConc进行文本的对齐。ParaConc一次能同时加载四个文件,可以实现一个原文分别和另外三个译本的两两对齐。由于已经在所有的句子末位插入了标注“”,对齐格式可以选择定界符(delimiter)对齐,很容易就实现了《匆匆》的中文版与三个英文版分别在句子层次上的对齐。由于英汉差异较大,译者常采用不同的方法如合并、拆分或融合等来处理句子,原文和译文并不能完全按照句子一一对应,还需要人工完成精确的对齐处理。ParaConc也提供了非常方便的人工处理工具,可以合并或切分句子。

对齐后,每一句都会用横线隔开,如果对齐单位是两句话或以上,ParaConc会用不同的颜色显示不同的句子,所以非常方便观察。如果在课堂上给学生演示的时候,也可以通过改变中文或英文文本的字体格式以达到最佳显示效果。接下来,就可以利用ParaConc进行关键词的平行检索、搜索热词、进行不同译本的词频统计等。

比如,以助词“的”为关键词,运用ParaConc进行检索,可以方便快捷地看到三位译者所采用的不同处理方法。

图1 朱自清散文《匆匆》平行语料库中“的”字检索结果截图

四、 三个译本的比较分析

如果是布置给学生作为课外自学材料,以上句对齐工作完成后基本就可以布置任务了,比如观察原文结构助词“的”字的翻译方法或带有时态助词“了”字的汉语句子翻译成英语句子所用的时态。但如果要在课上讲解分析,还需要教师提前观察译本,做好数据的整理和分析。

在词汇层面上,可以通过对高频词的检索来观察分析不同译本的差异。例如,根据词频统计,在原文所用的实词里“匆匆”属于高频词,除了标题外,正文中一共出现了四次。通过ParaConc进行检索,可以清楚地比较三个译本的差异。

朱纯深:Rush(标题),swift in such a rush,haste,rush,rush

张培基:Transient Days(标题),swift,fleeting presence,live a transient life,fleeting days

张梦井:Days Gone By(标题),hurried,hurriedly,hurry,hurried days

在句子层面上,运用ParaConc也可以非常直观清楚地观察到译文对原文句子所做的调整。例如,原文开头的第一句话:

原文:燕子去了,有再来的时候;杨柳枯了,有再青的时候;桃花谢了,有再开的时候。

张培基译文:If swallows go away, they will come back again. If willows wither, they will turn green again. If peach blossoms fade, they will flower again.

这里,张培基把原文的三个分号转换成了三个句号,而其它两个译本则保留了原文的三个分号,还是译成了一句话。

五、结语

“工欲善其事必先利其器”。自制的小型双语平行语料库为翻译教师提供了有效的教学工具,更贴合翻译课堂教学的实际,有利于开展数据驱动学习,使课堂教学实现“以教师为中心”向“以学生为中心”的转向,从而实现“翻转课堂”和教学效果的提高。

[1] 何安平. 语料库辅助英语教学入门[M]. 北京:外语教学与研究出版社,2010.

[2] 穆雷, 刘康龙. 语料库与译者培养:导读 [R]. F. Zanettin, S. Bernardini, D. Stewart(编). 语料库与译者培养[C]. 北京:外语教学与研究出版社,2007:vii-xii.

[3] Zanettin, F. Bilingual Comparable Corpora and the Training of Translators [J]. Meta,1998, 43(4):616-630.

[4] Bowker, L. Corpus-based Applications for Translator Training: Exploring the Possibilities [A]. In Granger et al. (eds.). Corpus-based Approaches to Contrastive Linguistics and Translation Studies [C]. Amsterdam: Rodopi,2003:169-183.

[5] 黎士旺. 语料库与翻译教学 [J]. 中国科技翻译,2007,(3):46-49.

[6] 胡开宝. 语料库翻译学概论[M]. 上海:上海交通大学出版社,2011.

[7] 王克非等. 双语对应语料库:研制与应用[M]. 北京:外语教学与研究出版社,2004.

[8] 王克非,秦洪武. 论平行语料库在翻译教学中的应用[J]. 外语教学与研究,2015,(5):763-772.

[9] 王克非. 语料库翻译学探索[M]. 上海:上海交通大学出版社,2012.

[10] 梁茂成,李文中,许家金. 语料库应用教程[M]. 北京:外语教学与研究出版社,2010.

[11] 肖维青. 平行语料库与应用翻译研究 [J]. 中国科技翻译,2007,(3):25-28.

责任编辑:陈君丹

Construction of Small-sized Bilingual Parallel Corpora and Related Application to Translation Teaching

ZHANG Li-zhu

(School of Foreign Studies, China university of Mining and Technology, Xuzhou Jiangsu 221116, China)

The combination of corpus technology and translation teaching is an innovation and has gradually become a new paradigm in the field of translation. The paper expounds the great advantage of applying corpora to translation teaching and the procedure as well as related methods pertaining to the construction of small-sized bilingual parallel corpora, which forms the basis of the following corpus-driven approach to the reform of college English translation teaching.

bilingual parallel corpora; corpus-driven approach; translation teaching

2016-05-03

中国矿业大学教育教学改革与建设基础课项目(2015JC10)

张立柱(1982-),男,河南周口人,讲师,硕士,研究方向为语料库翻译学、翻译教学。

G642.4; H315.9

A

1674-344X(2016)09-0129-04

猜你喜欢
译本平行语料库
向量的平行与垂直
平行
逃离平行世界
《语料库翻译文体学》评介
《佛说四人出现世间经》的西夏译本
《通玄记》的西夏译本
再顶平行进口
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
《孙子兵法》俄译本简介