蒋丽平
(广州大学华软软件学院 外语系,广东 广州510990)
IT文本英汉平行语料库辅助翻译实践的实证研究
蒋丽平
(广州大学华软软件学院 外语系,广东 广州510990)
由于IT英语语体、词法以及句法特征的特殊性,IT英汉平行语料库在辅助翻译实践时能否提高翻译质量和效率,还存在疑问。该研究基于自行创建的IT文本英汉双语平行语料库,以某IT学院的大三软件开发专业学生为实验对象,检索工具为ParaCon,实验采取60分钟限时翻译的形式。实验结束后,对收集的多项数据进行统计分析研究,基于数据的统计结果,得出结论:在当前条件下,平行语料库在翻译实践中,很难提高IT人士的翻译速度和工作效率,但是,平行语料库可以提高IT翻译质量。
平行语料库;IT翻译;实证研究
平行语料库(parallel corpus)、可比语料库(comparable corpus)和多语语料库(multilingual corpus)是目前用于翻译研究最主要的三种语料库[1],在这三种语料库中,与翻译实践结合得最紧密的当属平行语料库,在辅助翻译实践时,平行语料库备受学者的推崇[2-5]。一般情况下,人们在翻译实践时对于不会译的字、词,一般都会借助翻译工具书,最常用的当属双语词典,双语词典里有比较丰富的释义和例句,可以为译者提供很好的参考。但是语言通常是变化的,随着时代的发展,双语词典里的词条释义可能不够丰富、完善,从而无法满足翻译的需求。而平行语料库辅助翻译具有比较明显的优势,具体体现在: 辅助准确翻译术语,译文更加地道自然,适应目的语的文体风格,帮助译者研究借鉴前人的翻译策略[2,5]。在前期研究中,我们搜集了500万字符的IT文本双语语料[6],并对部分语料进行了加工和标注,建成了20万左右字符的IT文本平行语料库,根据平行语料库的词频统计,该平行语料库是以IT为主题的平行语料库。IT文本平行语料库作为一种新的资源和方法,在涉及IT领域的翻译实践中,正在不断发挥、利用其作用。 国内有学者认为,使用平行语料库不仅提高了翻译质量[7-9],而且翻译的 “速度大大提高”[8];还有的研究认为平行语料库能提高翻译效率[10]。由于平行语料库在辅助翻译实践方面的结论不一,再者,IT英语在语体、词法以及句法特征方面具有比较鲜明的特点,与文学等体裁的语言之间存在比较明显的语言差异[11-12],因此,借助平行语料库,通过实证研究的方式检验IT平行语料库是否可以帮助译者提高IT翻译的速度、效率和翻译质量,具有一定的积极意义。
1.研究对象
在前期研究基础上,本研究试图利用IT文本平行语料库辅助翻译实践,探索IT平行语料库在提高IT翻译速度、效率和质量方面所能发挥的作用。本研究的实验对象为某学院大三第二学期的软件开发专业的80名学生,这80名学生全都选修过《IT英语》课程,对IT英语专业词汇、IT翻译等有一定的了解。为使两组实验对象的英语翻译能力保持客观平等,我们参照了他们大三第一学期的大学英语四级考试(CET4)的翻译题的成绩进行了分组:实验组40人(使用教材配套语料库资源辅助翻译)和参照组40人(使用双语词典等常规参考资料进行IT翻译)。在实验进行之前,我们对实验组的研究对象进行过两个小时的语料库软件使用培训,以确保他们都能掌握软件使用方法。实验安排在第二学期的第15教学周进行。
2.研究内容
IT英语翻译实验的条件为:实验组的学生利用IT平行语料库进行辅助翻译,参照组学生利用词典进行辅助翻译。为方便对实验组和参照组的数据进行比较,我们对实验的变量进行了控制,翻译实践时间为60分钟。除使用的参考工具不一样外,其他条件完全相同。此次翻译实验采取的形式为英译汉形式。为了解翻译过程中,参考资源的使用情况,翻译完后,我们对学生进行了翻译实验相关的访谈,最后利用SPSS软件对实验的相关数据进行统计分析。
3.研究采用的平行语料库、和实验翻译原文
本次实验采取的是我们自己研制的中英句级对齐的IT文本英汉平行语料库,其中标注的中文语料110,465字符,英语语料库133,657字符。 出现频率最高并有实际意义的实词分别为:windows,use,network,information,[6:91]从文本涉及的主题来源来看,本实验采用的语料库为IT文本平行语料库。平行语料库采用的免费软件为ParaConc V1.0,本检索软件可以进行词和短语的检索,还可以进行跨距的句型检索。翻译实验的原文选用的是紫光教育专业组编著,外文出版社出版的《软件与服务外包英语》中的一篇英语文章,英文字数460,此文章未包含在IT平行语料库中,通过软件检索,此实验原文的六个主题实词与IT平行语料库出现频率在前二十位的主题实词一致,所以该实验短文属于IT主题文本,符合我们实验目的。
4.实验环境
翻译实验的环境为配备了接入互联网的多媒体电脑的教室。每个学生被告知,在规定的时间内从内网FTP文件区下载翻译原文,IT平行语料库和检索工具。翻译结束后,每个学生被要求将译文通过网络上传到教师教学平台。本次实验除实验工具不同外,其他实验条件都完全一样。
根据实验目标,我们收集和统计了受试译文在翻译效率和翻译质量方面的数据,然后利用SPSS软件进行统计学分析。
1.反映翻译效率的数据
翻译效率主要体现在完成翻译任务的学生数比、完成的翻译任务量和IT专业术语翻译结果上。根据实验组和参照组的数据对译文进行分析,收集了3组数据,分别从3个不同角度进行考察。分别见表1、表2和表3。
表1 完成翻译任务的人数比
表2 完成翻译任务的量比较
表3 IT专业术语翻译统计表
根据表1,在全部完成翻译任务的学生数方面,实验组要落后于参照组。这可能是由于实验组的学生在翻译的时候需要不断借助检索软件查找语料库,这个过程相对比较耗时,其次,虽然在实验前有教授实验组学生如何使用平行语料库,但是在具体实操过程中,有些学生对操作方法和科学利用方面还不是很熟练。根据表2的结果,利用SPSS软件进行统计分析发现,实验组和参照组在完成翻译总字数方面存在显著差异。
由于IT术语的翻译是否准确可以作为验证翻译质量的一个重要标准,同时也可以作为平行语料库的一个重要优势[5][9]。所以我们将两组译文中的IT专业术语(22个,其中重复的2个)翻译情况进行比较,借此用来对两组的翻译质量进行统计和评估。从表3中可以发现,实验组和参照组在IT专业术语翻译方面具有一定的差异。经过SPSS软件进行统计分析发现,P 大于等于0.05,无显著性差异。
2.反映译文质量的数据分析
在数据统计学原理下,有两个参数可以用来评价翻译质量:一是术语翻译的准确率,二是句子翻译的完整性。见表4。
表4 IT术语翻译的正确率对比
实验采用的原文是一篇主题为IT软件服务外包的英语段落,英文原文呈现句式完整、论述客观、结构严谨具有很强的科技英语特征。由于英汉语言在构建句子的方式上的差异,由于汉语语言特点,在将原文翻译成中文译文时,基本呈现无明显人称代词、少主语的特点,因此,在将英语原文转换成中文译本的时候,需要根据具体情况确定句子的主语并补充相应的人称代词,并且主动语态使用频率高[13]。这是翻译时候的一种翻译策略,能否顺利运用这一策略,将对译文产生很大的影响。如果是句对句的逐词翻译,则中英文句子数量应该很接近,其次,根据IT文本英汉平行语料库的中英文句子数量,可知,中文句子数量要远低于英文句。为方便对两组数据进行比较,需要统计各自完成译文句子的总数和运用相应翻译技巧构建译文句子的数量。见表5。
表5 运用翻译增词构建译文句子的数据统计
从表5中可知,P小于0.05,实验组和参照组的数据有显著性差异,再利用SPSS进行卡方检验,实验组翻译术语的准确性要较参照组有优势。其次,从表5的数据中看出,实验组在翻译时,句子转换策略构建的合法中文句子方面具有明显优势。
由于实验对象的实际英语水平以及他们的翻译能力,术语准确率以及句子的完整性可以做为区别译文高低的重要参数。所以,根据实验的数据判断,我们认为平行语料库在一定程度上可以提高IT译文的质量。我们认为原因有三:首先,由于平行语料库有比双语词典更多的优势,不仅仅可以为翻译提供对译词语的双语检索,而且对IT术语和词汇翻译具有促进作用。 其次,由于本次实验采用的的语料库和翻译原文文本的主题内容基本一致,相关性比较高,实验组的学生在利用平行语料库时,辅助翻译效果比较明显。最后,语料库对原文中的术语覆盖率比较高。为证明这一假设,我们对实验文本中的22个IT术语查全率做了统计。见表6。从表中的数据可以看到,完全可以查到和部分可查的术语占了90.9%。 换句话说,这些IT术语可以从所提供的IT平行语料库中查找。其次,不仅仅是IT术语,一些出现在翻译原文中的IT高频动词也都可以从语料库中查到对应翻译。见表7。
表6 抽查的IT专业术语查全率统计
表7 原文中10个动词在IT平行语料库中的频率
与双语词典相比,平行语料库覆盖面广,译文范例众多,具有很强的时效性[9:21],所以在IT词语、IT语和短语方面的翻译上具备明显优势,这一点在实验研究中得到了证实。另一方面,由于IT平行语料库提供了大量丰富而翔实的语境,可以帮助译者通过上下文确定选词,还可以帮助译者翻译一些IT词语、IT术语和短语方面无法对应的内容。在IT平行语料库的帮助下,实验组的学生就能很好的将英文句子转换成相对完整的中文句子。
在句子层面,由于中英文在句子结构上存在很大的差异,英文属形合语言,句式上比较完整,讲究句法结构完整,主语和人称比较齐全。而汉语属于意合语言,在句法形式上不太受约束,在对于非专业的译者来说,要实现两种语言自由顺利地转换,难度比较大。然而,IT平行语料库可以为译者提供大量丰富的语言环境,译者可以从上下文中得到启发,从而运用相应的翻译策略,从而顺利地实现了翻译。
比如实验原文:“The company has been developing a self intellectual property SOA middle ware platform product in the last ten years called Resource One and there were four major versions that have been upgraded.”在语料库中搜索该文本中的“developing”时,有275个实例(包括屈折形式),其中和“developing”右边第一个搭配“一套”完全匹配的结果就有20个。
下面的例句1-2均来自语料库的原文和译文,通过观察这两个例子。可以帮助IT译者确定词语对应的翻译单位,还能帮助译者找出句子结构之间的差异,进而帮助译者准确进行翻译选词,然后采用相应翻译技巧,转换成对应的完整、符合语法的译文。
例 1:To portray human emotions, they rely on a unique facial animation system developed at PDI/DreamWorks.
译文:为了表现人类的感情,他们靠的是PDI/梦工厂研发出来的一套独特的脸部动画系统。
例 2:The company has been developing a self intellectual property SOA middle ware platform product in the last ten years called Resource One and there were four major versions that have been upgraded.
译文:去年,公司研发了一套自主知识产权的SOA中间件平台产品,叫做中间件软件R1,并对版本进行了四次升级。
在翻译实践中,如果只使用词双语词典辅助翻译,也能查到部分术语的对译词,但更多的是直接将词典中的意义照抄进译文,而没有考虑到由于语境不同,句子结构和意义也可能也不一样。通过本次实验,实验组与参照组的翻译结果正好验证了这一点,究其原因,主要和翻译实验对象的英语水平有关,其次还与双语词典缺乏相应的句子语境有关。
由于IT英语在语体、词法以及句法特征方面具有比较鲜明的特点,IT文本英汉语料库在辅助翻译实践时,在翻译的质量和效率方面,具有一定特殊性。通过本次翻译实验,我们可以得出两个结论。结论一,实验组在翻译效率方面落后于参照组,没有优势。这一结果符合理论推理,但是与一些学者研究的结果[8,10]有出入,但与[14]研究结果一致。平行语料库的语料具有海量、最新的IT语料,在借助相关软件的帮助下,可以为译者提供翻译辅助,语料越丰富,译例也越丰富,从理论上来说,应该可以大大的促进翻译效率,但是从本次实验结果来看,结果却截然相反。原因可能是:首先,由于平行语料库提供的译文范例过多,给译者的挑选造成了很大的困难,而且过程非常耗时。再次,很多实验组的学生反映,由于对软件的使用不熟练,导致最后放弃对一些术语或者词组的检索,这反而使检索软件成为了一种累赘。结论二,IT译者在翻译中碰到的IT词组、IT术语可以借助IT平行语料库的帮助进行研究和思考,从而有可能提高翻译质量,这点与研究结果[14]保持一致。此次翻译实验验证了平行语料库具有提高IT译文质量的作用,而且平行语料库的主题内容与翻译材料的相关性越高,译文的质量也越高。本次实验也有一定的局限性,首先,平行语料库的IT语料获得比较困难,而且语料加工、句级对齐和实现标注尤其繁杂[15],其次,由于本次实验的对象是本科院校IT专业大三学生,本次实验的结论不一定具有普遍性,要使结论具有普遍性,实验对象还需要多样化,最后,IT翻译质量评价的模式还需要增加评估的参数,以便使得数据更为可信和权威。
[1] 甄凤超. 语料库语言学在中国的成长与发展[J]. 当代外语研究,2010,(2):36-40.
[2] WILLIAMS A. A translator’s reference needs: dictionaries or parallel texts [J]. Target, 1996,8(2): 277-299.
[3] ASTON GUY. Corpus use and learning to translate [EB/OL]. [2009-10-28]. http://www. sslmit. unibo. it/~guy/ textus.htm.
[4] ZANETTIN FEDERICO. Corpora in Translation Practice [EB/OL].[2012-10-28]. http://www. ifi. unizh. ch/cl/yuste/postworkshop/repository/fzanettin. pdf.
[5] OLOHANM. Introducing corpora in Translation Studies:An Introduction[M].London and New York:Routledge, 2004.
[6] 蒋丽平. IT文本英汉平行语料库的研制与应用[J],广州大学学报,2013,(8):88-93.
[7] 谢家成.“一……就”的英译——兼谈英汉平行语料库辅助汉译英调查[J].中国科技翻译,2004,(2):27-29.
[8] 韦瑶瑜,雷 蕾.双语平行语料库辅助中国英语学习者翻译实践[J].基础教育外语教学研究,2006(4):28-30
[9] BOWKER, LYNNE. Using Specialized Monolingual Native-Language Corpora as a Translation Resource: A Pilot Study[J]. Meta,1998, (4),631-651.
[10] SOMERS H. Computers and translation: A translator’s guide[M].Amsterdam: John Benjamins,2003.
[11] 程世禄 蒋丽平. IT英语语体的语言特征—基于IT英语语料库的分析[J].广州大学学报,2012,(10): 54-58.
[12] 桂诗春,杨惠中.中国学习者英语语料库[M]. 上海: 上海外语教育出版社,2003:11.
[13] 蔡 军. 英语被动结构与系补结构句法语义对比研究[J].中南林业科技大学学报(社会科学版),2013,7(3):158-162.
[14] 贺文照. 平行语料库辅助翻译实践实证研究[J].嘉兴学院学报,2013, (3):64-69.
[15] 王克非. 新型双语对应语料库的设计与构建[J]. 中国翻译,2004,(6):73-76.
An Empirical Study of IT Text Parallel Corpus Assisting Translation Practice
JIANG Li-ping
(Foreign Languages Department, South-china Institute Software Engineering, Guangzhou 510990, Guangdong, China)
This study is based on an IT specialized Chinese-English parallel corpus with a specially designed concordancer for bilingual searching. These subjects are from the Software engineering majors who are in the their college year, required to fi nish the translation in 60 minutes. Data collected are calculated and analyzed after the experiment before the conclusion has been drawn that it is diff i cult for IT professionals to raise their translation production by using the IT text parallel corpus, however,the experiment shows the justif i cation that the IT parallel corpus can improve translation quality.
parallel corpus; IT translation practice; empirical study
H315.9
A
1673-9272(2014)04-0000-00
2014-05-28
广东省教育科研“十二五规划”课题(编号:2012JK169);北京外国语大学中国外语教育研究中心第六批中国外语教育基金资助“IT文本英汉双语平行语料库的开发与利用”(编号:ZGWYJYJJ2012A39);校级教科研课题“专用平行语语料库在提高IT翻译能力中的应用” (编号:ky201305)。
蒋丽平(1978-),男,湖南溆浦人,广州大学华软软件学院讲师,硕士,研究方向:语料库英语语言学,英语翻译理论与实践,商务英语教学。
[本文编校:罗 列]