张 宏
(绍兴文理学院外国语学院,浙江绍兴312000)
个人平行语料库的创建与翻译辅助教学
张 宏
(绍兴文理学院外国语学院,浙江绍兴312000)
英汉平行语料库在英汉对比、翻译教学等领域的作用日显突出。从较为实用的如何创建个人平行语料库入手,介绍创建的具体步骤,包括使用的软件,以及如何将平行语料库运用到翻译课堂教学,从而提高学生的翻译意识,激发学生对翻译的兴趣。同时,也对创建个人平行语料库的局限性与不足进行反思,旨在利用平行语料库,更好地辅助翻译教学。
个人平行语料库;创建;翻译;教学
平行语料库(也称为对应语料库或双语对应语料库)是“由原文文本及其平行对应的译语文本构成的双语语料库,其双语对应程度可有词级、句级和段级几种”[1]。近几年,国内对平行语料库的关注度越来越高,创建的平行语料库越来越多。英汉、汉英双语语料库已经在一些高校中建立起来,如燕山大学的《红楼梦》双语语料库的创建[2]。有些双语语料库正在建设之中。在线共享双语语料库的建设备受关注(http://www.icl.pku.edu.cn/icl_groups/parallel/concordance.asp;http://www.luweixmu.com/ec-corpus/;http://corpus.usx.edu.cn/)。关于个人小型语料库的创建,谢家成[3]、赵宏展[4]、何莲珍[5]都有自己的著述。平行双语语料库在英汉对比、翻译教学等领域的作用日显突出。在翻译教学的过程中,教师不妨可以利用余暇创建一些英汉、汉英翻译的平行语料库。一方面便于课堂教学,一方面用于教师自我学习与提高。本文从如何创建个人平行语料库入手,介绍创建的具体步骤及使用的软件,并探讨如何将平行语料库运用到翻译课堂教学中,从而增强学生的翻译意识,提高翻译教学的效果。
平行语料库的创建耗时费力,个人如果要创建这样的语料库,建议使用简单的段落对齐或者句级对齐,不能划分过细。即便是句子的划分,有时很难界定;划分过细后,标准、尺寸往往难以把握。比如像词性的标注,虽然英汉相关的标注软件都有,标注成功率也有90%以上,但余下的10%处理仍成问题。这10%可能分布在语料库各种地方。其发现、更正最终恐怕仍需要100%人工干预。而且句级以下的切分、标注,用于定量分析尚可;用于翻译教学,句级层面的划分就已经达到目的。笔者参与了绍兴文理学院外国语学院“汉英语料大世界”的创建,在创建的过程中,摸索出一套较为务实的创建程序。在翻译教学余暇,搜集素材、整理、购买软件,创建了一些个人平行语料库。具体的创建步骤如下:
英汉双语的素材,可来源于书本,也可来源于互联网。互联网资源,如果是书本扫描上传的pdf格式,也可视为书本;但如果是可编辑的txt、doc、PDF文件,则只能作为参考。
先将纸质文本扫描成PDF或者JPEG格式。汉、英语言电子化需要使用不同处理软件,以便取得最优化效果。汉语扫描后保存为JPEG文件,利用软件“尚书七号”或者“汉王OCR”进行处理,得到txt文本文件,识别率在96%以上。英语扫描后保存为PDF文件,利用软件“Omnipage”进行处理,可以得到txt文本文件,或者Word的doc文件,识别率99%。如果扫描后,单页既有汉语也有英文,就保存为图像文件。利用扫描仪自带图像软件裁剪,分别得到汉语、英语的图像文件。再用“尚书七号”和“Omnipage”处理(omnipage可以将JPG或者PDF文件转换为可编辑文件),得到文本。导入word文档,利用查找替换功能,根据需要,使用通配符,去除句子断点,增加段落标记等。最终完成书本电子化,得到两个文档:一个是汉语原文;一个是英语译文。
由于创建的是句级层面的平行语料库,国内外双语语料句级对齐的软件不少。但无论是Paraconc还是Textprocessing,都无法做到令人满意的信度和效度。至于Trados的Aligner,如果语料库偏大,电脑易死机。建议先将英语和汉语两个文档文件进行“文本转换成表格”,“文字分割位置”用“其他字符”,“其他字符”就用“#”,利用通配符不包括省略号“…”。转换列数为2列。分别得到汉语原文和英语译文两个表格文件,将行数较少的表格拷贝到行数较多的表格中,完成句级初对齐。如果想要达到一定的精度和信度,完全的句子切分和手动操作必不可少。以英汉平行语料库为例。如果英文一句正好对应一句汉语译文,那就没有问题。如果英文一句对应几句汉语或者半句、几句半汉语(跨句),如何处理这些问题?如何统一标准?现以Moment in Peking(《京华烟云》)[6]和张振玉的译本为例[7],采用的是绍兴文理学院外国语学院语料库创建的标准,具体方法如下:
(1)一对一:一句英文对应一句汉语,需要在译文前加标注序号#1。如:
?
(2)一对多:即一个英文句子对应多个汉语译句,则汉语需要标出序号“#1...#2...#3...”。如:
?
(3)跨句现象:一句译文包含了两句及以上英文内容。则用英文不动,译文用“-#”连接。如:
?
(4)顺序颠倒现象:译者在翻译的时候,没有根据英文顺序翻译,而是根据汉语表达需要作了调整。这时被调整的译句要用“^”标注。如:
?
(5)一对零:即汉语句子在译文中找不到对应的句子。则在译文对应处用“[sic]”标注。如:
?
(需要说明的是,以上范例中,§为段落符号。对齐过程中,中文始终不变,包括顺序、句子划分。汉语对齐要以英文为参照;省略号不作为单独一个句子处理,中英皆如此处理。总之,维持句子切分的统一性。§、#符号,均可利用word的替换功能加到段落、句子的前面。汉英平行语料库的创建亦然。
个人平行语料库资源可以word或者excel格式,保存在教师的电脑中,或者备份刻成光盘,主要用作翻译辅助教学,尤其是运用于英汉、汉英对比与翻译和译文的赏析。当然,也可以另存为XML文档,方便以后用于语料库的标注和检索,以及网上发布。
平行语料库的分类,可以根据自身需要,进行不同的分类。不同作者、不同文体,分别建立独立的文件。比如,可以根据文体分类成文学、科技、报刊、记者招待会的平行语料库等。也可以根据不同作者来分类。比如可以建立以作者为类别名的文件名,像张培基翻译的作品,也可以建立作家冰心、萧乾、何为、余光中、季羡林等为类别的平行语料库。
根据上述分类,可以用AntConc或者Wordsmith软件检索相应的关键字、词,用于字词、语段、文体的分析。至于标注的问题,可以用CLAWS或者TreeTagger 2进行相应的POS(Part of Speech词性)标注,方便统计分析。但词性标注,用于统计、分析学生译文中的数据尚可,用于辅助翻译教学,实际意义并不大。个别教材已经收录了一些定量分析的方法,也介绍了一些词性标注方法,但应用在具体的翻译教学中时,学生反响不大。
目前,个人平行语料库在翻译辅助教学上发挥了越来越大的作用,下面拟以笔者主持创建的《京华烟云》英汉一对二平行语料库的使用为例,说明平行语料库在汉语文化特色词语翻译教学中的辅助作用。
《京》的原文是英文,译文为汉语,但鉴于林氏早年企图传播博大精深的中华文化,翻译《红楼梦》未果,转而创作《京》。在创作《京》的过程中,字里行间流露出中华文化的痕迹。利用倒译法,借鉴他人译文来看林氏原文,即是对中华文化很好的诠释。
文化特色词语,富含民族文化信息,常用的翻译就是音译(transliteration)。比如,“观音”的翻译,学生查阅电子词典及思考过后,或许会说是“Guanyin”。首先应当肯定学生的译文,同时告诉他们:词典上的译文并非都是最好,翻译只有更好,没有固定译文。然后将“例1”给出。
例1
Now every woman knew the Kuanyin,or Goddess of Mercy,by her longer title“The Great Spirit of Great Kindness and Great Mercy,Saving the Afflicted and the Distressed.”#1每个女人都知道观音菩萨的全名是“大慈大悲救苦救难观世音菩萨”。
指出林先生对观音的理解,使用的手法即是音译加解释,音译为“Kuanyin”(韦氏拼音,和现代汉语拼音略有不同),解释为“Goddess of Mercy”(慈悲女神),是典型的“translation couplet”。既有音译,保留了汉语中该文化特色词语的发音,也给出了西方人容易接受的解释,便于他们更好地理解中华文化。《汉英词典》[8]收录的“观音”也是这样翻译的。
提及骂人的话,英汉语言中都不乏此类词语。汉语中多与“狗”或者“长辈”有关,英文中多是“four-lettered words”(四个字母的单词)。课上先说一些此类的话语,学生较感兴趣。然后问他们“王八”怎么翻译。有的学生用汉语拼音“wangba”;有的学生用“wangba,a cursing word”或者“wangba,a four-lettered word”,也有人用《汉英词典》上的“tortoise”或者“cuckold”。对会用“translation couplet”的学生,给予积极的评价,并给出林氏对“王八”的诠释(例2)。
例2
?
说明“王八”一词的来源。“王八”本为“忘八”即忘记“孝悌忠信礼义廉耻”这八种美德中第八个“耻”,就是“无耻”的意思,也看出该词现在的确和“tortoise”(乌龟)有某种关系,有时表示为“cuck-old”(戴绿帽子的男人),通过林氏版本,可以帮助学生对“王八”词源和意义的理解,日后根据该词出现的上下文选用合适的译文。再看一例:
提及“吃奶的劲”如何翻译,学生总是腼腆。《汉英词典》收录为“strain every muscle”,也有学生翻译为“use all one’s strength”。给出例3,学生哄堂大笑。
例3
§ Amei ran with all the energy of her mother's milk,up the steps round a bush.#1§阿眉用尽吃奶的劲跑,跑上一个矮树丛周围的石头台阶。§Silverscreen began to fight and shriek with all her mother's milk-energy.#1§银屏把吃奶的劲都使出来,又打又叫。
林氏在传播中华文化上做了种种尝试。但对于此词的翻译学生总觉得难以接受,总喜欢归化的翻译,觉得这样更加地道。给出英文中已有的短语“use every(last)ounce of strength”,可以让学生自行思考,给出自己的判断。
汉语文化特色词语中,谚语、习语、俗语的比例很高,翻译的时候,用直译还是意译,有时很难说出两种译文的优劣。换句话说,就是采用异化(foreignization)还是归化(domestication)的翻译手法,孰好孰坏。异化更利于传播原语文化,归化方便译语读者,很难区分高下。课上,给出归化、异化的版本,让学生从两个视角看翻译。试看一例。
课上,提问学生“谋事在人,成事在天”如何翻译。有学生给出“Man proposes,Heaven disposes.”;也有人给出《汉英词典》中的“Man proposes,God disposes.”或者“the planning lies with man,the outcome with Heaven.”两种译法前者为杨宪益的译本,用的是异化,保留“天”的文化;后者是David Hawkes的译本,用的是归化,把“天”译为“上帝”。虽然仅仅只是一字之差,到底是翻译原文文化,还是更多考虑译语读者的文化,这反映出翻译的目的不同。两个译本都很精彩。还有没有其他的译本呢?林氏的理解如例4:
例4
The way it happened seemed to have a touch of irony in it,and Mulan was later convinced that"men strive,but the gods decide,"as the proverb says.#1那种变化似乎含有一种讽刺的味道。#2后来,木兰才深信“谋事在人,成事在天”这句谚语。He believed that men contrive,but the gods decide;and he was willing to take things as they came.#1他相信谋事在人,成事在天,要听天由命,要逆来顺受。
林氏就有两种译本:一个是“men strive,but the gods decide”;另一个是“men contrive,but the gods decide”。解释“propose”“strive”“contrive”的含义,“strive”和“contrive”比“propose”在“千方百计设法做某事”的程度上更为强烈,此之为上佳译本。再看一例:
“酒逢知己千杯少,话不投机半句多”如何翻译?给出《汉英词典》中的解释“for a congenial friend a thousand toasts are too few;in a disagreeable conversation one word more is too many”,也给出林氏版本“When one meets an old friend,his wine intestines widen”。而林氏的翻译则为例5。
例5
Mr.Yao and Mr.Fu were both good drinkers and as the saying goes,"When one meets an old friend,his wine intestines widen."#1姚先生与傅先生喝起酒来,都是海量。#2正如俗话说:“酒逢知己千杯少。”
有些译本不好评价好坏,平行语料库的素材只是提供多一种看原文的角度。诚然,有时译文并非尽善尽美。要求学生有宽容心,不要因为一两句错译、误译或者简译,就对翻译大家的翻译能力抱有怀疑。人无完人,还是金圣华一语中的,“努力寻找经典名译百分之一的错,倒不如学习那百分之九十九的对”[9]。
汉语古诗词,富含意象,难以翻译。试看下面两例:
例6
§The trees desire repose,but the winds will not be still; #1 § 树欲静而风不止§The son wishes to serve,but his parents are no more! #1 § 子欲养而亲不待
例7
§So dim,so dark, -#§寻寻,觅觅,§So dense,so dull, -# § 冷冷,清清,§So damp,so dank,so dead! -#§凄凄,惨惨,戚戚!§The weather,now warm,now cold, #1 § 乍暖还寒时候,§Makes it harder than ever to forget. -#§最难将息。
“树欲静而风不止,子欲养而亲不待(在)”反映出晚辈对早逝长辈深深的愧疚,对人生的无奈。《汉英词典》如是说“the tree may crave calm,but the wind will not drop—things take their own course regardless of one’s will”。给出林氏译文(例6),说明林氏在留学过程中,父亲去世,这就是为什么林氏在《京》中多次提及这句诗词。两个版本,对比分析,供学生参考。李清照的《声声慢》,主要以赏析为主,主要是汉语叠词的翻译。给出林氏版本(例7)。此版本为众多翻译教材收录,值得推荐。同时,强调诗歌的翻译更是“戴着镣铐跳舞”,受到原文意象、押韵、字数等方面的限制,虽看似“不可译”,但林氏通过重复使用“so”,以及借用修辞 alliteration(首韵、头韵)(dim、dark、dense、dull、damp、dank、dead),达到某种程度的补偿,这恰恰是诗歌的可译性所在。
由于是个人创建语料库,基本属于个体单干,时间、精力有限,语料收集的素材难免有限。其次,根据个人喜好与偏爱,收集的平行语料也会因人而异。再者,由于个人的资源有限,想实现一对二、一对多的平行语料库也绝非易事。另外,语料的整理耗时费力,即便耗费大量的时间、精力,所建的语料库还是难免有细微的错误。用于句级的对比分析尚可,用于定量分析,数据可能还不够准确。
在国内,英-汉翻译教师懂得英文,但大都不懂计算机编程,尤其是如何运用Java、XML Editor软件,或者如何对国外同类软件进行相应的改良,用于汉语语料的分析(大部分软件适用于检索、分析英文),用于平行语料库的建设,用于翻译辅助教学;而精通计算机编程的人,往往局限于英文的瓶颈,很难设计出较为令人满意的语料库创建程序。既熟悉中英文翻译、又懂得计算机编程的人少之又少,这也需要国内翻译界和计算机界联手解决这一问题。北京外国语大学等高校已经开始尝试,效果不错。建议继续推广,使得翻译教师不断熟悉、掌握基本编程方法,更好地用来创建平行语料库。
教师在平行语料库创建的过程中,需要有意识地对一些翻译课上要用到的语料进行标记,方便日后检索,用于翻译教学。在这个阶段,教师的翻译意识也会逐渐增强,更利于促进翻译教学。但由于个人语料库素材来源有限,个人语料库只能作为一种辅助翻译教学的手段,等到语料库规模很大,可以考虑更大比例地投入到翻译教学中。
个人语料库的建设永无止境。收录素材越多,可比的范围就越大,相同的词语、短语、句式就会有更多的译本供参考、供选择,也为学生碰到类似情况该如何处理提供理据,至少多一种选择的角度。翻译老师在教授学生的过程中,自身也会受益匪浅,增强对语料库创建软件的掌握,增加对原文、译文的理解能力,拓宽自己的翻译视野。由于个人的精力、时间、能力有限,创建的平行语料库一般规模较小,积累较慢。但还是可以尝试像“中国汉英平行语料大世界”的创建那样,每个教师负责一个子语料库的创建,上传网络,《京华烟云》在学院老师的共同努力下,已经上传网络(http://corpus.usx.edu.cn/jinghuayanyun/index.asp)。高校老师可以相互交流个人资源,实现资源共享,方便翻译辅助教学,激发学生的翻译兴趣,增强他们的翻译意识,提高翻译教学的效果。
[1]王克非,等.双语对应语料库:研制与应用[M].北京:外语教学与研究出版社,2004:6,27.
[2]刘泽全,田璐,刘超朋.《红楼梦》中英文平行语料库的创建[J].当代语言学,2008(4):329-339.
[3]谢家成.自建英汉平行语料库与翻译教学[J].广西教育学院学报,2008(1):73-76.
[4]赵宏展.小型翻译语料库的 DIY[J].中国科技翻译,2007(2):31-35.
[5]何莲珍.基于汉、英语平行语料库的翻译数据库设计[J].现代外语,2007(2):191-219.
[6]Lin Yutang.Moment in Peking[M].Beijing:Foreign Language Teaching and Research Press,1999.
[7]林语堂.京华烟云[M].张振玉,译.西安:陕西师范大学出版社,2005.
[8]汉英词典(修订本)[M].北京:外语教学与研究出版社,1997.
[9]金圣华.桥畔译谈——翻译散论八十篇[M]北京:中国对外翻译出版公司,1997:34.
On Personal Parallel Corpus Construction and Corpus-aided Translation Teaching
ZHANG Hong
(College of Foreign Languages,Shaoxing University,Shaoxing 312000,China)
Bilingual parallel corpus between English and Chinese has been playing a more and more significant role in the aspect of comparing Chinese and English as well as translation teaching.From a practical perspective,this paper introduces the detailed procedures on how to construct personal parallel corpus including the usage of different types of software and how to apply such corpus into classroom so as to enhance the students translation awareness and interests.In the meantime,the paper also aims to make best use of such personal corpus in helping translation teaching in consideration of a few limitations of building it.
personal parallel corpus;construction;translation;teaching
H315.9
A
2095-2074(2011)06-0040-05
2011-10-03
μ张宏(1971-),男,安徽定远人,绍兴文理学院外国语学院讲师,文学硕士。