韩娜高军
(上海理工大学外语学院,上海200093)
对任务型团队式英语教学效果的一次实证调查及其解读
韩娜高军
(上海理工大学外语学院,上海200093)
本文在分析谷歌译者工具包特点的基础上,介绍了它的翻译记忆、术语库、自动翻译和协同校译等功能,然后以科技文献的翻译为例,呈现了各项功能在翻译实践中的具体应用,指出了自动翻译存在的不足,并提出相应的人工改译方法。
谷歌译者工具包;翻译记忆;术语库;自动翻译;人工改译
苏联科学家Petr Smirnov Troyanskii在二十世纪三十年代提出,机器翻译系统的开发有三个阶段:(1)懂得源语的人分析文本中的词汇,根据句法功能将其转换为基本形式;(2)机器将基本形式的源语重新编排为对等的目标语;(3)熟悉目标语的另一名编辑对粗略翻译的目标语进行修订 (Craciunescu 2004)。
随着信息技术的进步,因特网为翻译系统提供了海量的语料库,使其以加速度的方式向前发展。对于机器翻译已有了理智的定位,不是翻译“神器”,而是翻译“助手”。2009年谷歌推出的一个比较成熟的在线翻译辅助系统,谷歌译者工具包(Google Translator Toolkit)(以下简称GTT),相当于翻译辅助软件的网页版。
目前它支持编辑和翻译50多种语言,整合了谷歌翻译、所见即所得编辑器、开放的评定系统、分享系统、维基百科以及Knol。该系统还为各类翻译人员提供了翻译记忆库、术语和词汇表的上载复用机制以及全球翻译记忆库”(谷歌2009)。
GTT是一个信息的无缝整合系统,其中自动翻译仅仅是一个组成成分。本文基于GTT的特点,介绍其翻译记忆、术语库、自动翻译和协同校译等功能,并通过Digital Teaching Platforms(Walters,Richards&Dede 2009)文献的汉译为例,呈现了其各项功能在英译汉中的应用,并评介了其自动翻译的质量,探讨了译者在译后编辑过程中担当的角色,目的是通过人机分工,在两者之间找到一种恰当的平衡。
1)免费(申请专业翻译除外):只要登录Gmail邮箱,即可享受GTT免费服务,就这点而言,相对于塔多思,雅信而言,占有优势;
2)移动性强:GTT无需安装,只要可以上网,即可实现随时随地办公。实现电脑,手机等现代化移动设备的无缝对接;
3)操作简单:术语库、翻译记忆库和工具栏等一目了然,辅之谷歌详尽的帮助说明,节约了译者学习软件的时间;
4)界面优化:GTT翻译界面舒适,原文和译文共享一个界面,段落清晰,并有高亮提示(徐彬2011),还可以实时更新、显示翻译进度,人性化的设计可以提高译者的工作效率;
5)存储安全:GTT的存储模式是云端存储,因此无需担心因电脑设备故障等不可抗力的原因而导致译文丢失;
6)兼容性强:GTT可翻译的内容类型包括文档,视频,AdWords广告等。
3.1 翻译记忆
翻译记忆(translationmemory),简称TM,是计算机辅助翻译的关键组成部分。翻译记忆是指由(划分区段、对齐、句法处理并分类后的)多语文本组成的多语文档案库,允许使用者对这些多语文本区段进行存储并在多种搜索条件下提取(EAGLES 1996:140)。这些已翻译好的区段仍然是人工翻译的结果。它的特点是能够将翻译流程中设计纯粹记忆的活动,比如术语的匹配和自动搜索提示、高度相似句子的记忆和复现交给计算机来做,免除翻译人员反复查找术语之苦,使其能全力对付语义的转换和传递(徐彬,郭红梅,国晓立2007:82)。
GTT的TM与MT(machine translation)相辅相成,在缺少翻译记忆的情况下,GTT为用户提供谷歌统计式机器翻译的结果。谷歌的优秀翻译品质在NIST评比中屡获第一(王正、孙冬云2009:73)。与此同时,全球用户的译文也可为Google统计式机器翻译添砖加瓦。GTT的翻译记忆库可自行保存译文,当遇到相近或相同的文字或句段时,翻译记忆就会自动搜索,比对和匹配,选出系统设定值范围内的译文作为参考译文。而译员也可发挥主观能动性,选择接受,或修改译文,改译的文字随即被存入记忆库中,以备下次参考之用。和其他计算机辅助翻译工具不同的是,GTT的翻译记忆库是可以全球共享的,成为谷歌翻译分析的语料,谷歌翻译通过现有的模式分析和云学习技术对语料进行选择、分析,GTT还支持译者对推荐的例句进行评分,高质量的译文被推荐的机率就会加大,可分析的语料越多,谷歌翻译也就愈加精准。
使用GTT的译者可选择全球公用记忆库还是专属自己的记忆库,记忆库可设置为公用,还是非公用。翻译记忆库设为公用,则为全球共享,否则只有译者及其明确授权共享访问权限的用户才能搜索。
3.2 术语库
现代术语学的创始人欧根·维斯特(Wüster 1991)认为“术语是一个专业领域的概念指称系统,它包括了所有的专业表达,这些表达是一般的、常见的。”而这种专业表达的显著特点是具有“固定的、被概括到一个定义中去的效果。”
国际化标准组织ISO对于术语(terminology)则提出了以下观点:
“Terminology:Producing a terminology requires understanding the conceptualization that underpins human knowledge in a subject area.Because a terminology always deals with special language in a particular field of knowledge,the concept shall be viewed not only as a unit of thought but also as a unit of knowledge.In nature language,concepts can take the form of terms,appellations,definitions or other linguistic forms.”
无论对于译员个人,翻译公司还是委托方来说,术语的一致性,准确性都是举足轻重的。GTT中包含一个术语库管理工具,译者可根据需要创建一个或多个术语库,翻译时,GTT会自动采用术语库中词汇的翻译方法,从而保障了术语的统一。
3.3 自动翻译
自动翻译是GTT一个功能模块,其原理是:运用n元语法(n-gram)对大规模的源语言与目标语言的双语文本,即“双语平行语料库”进行句子拆分并加以统计分析,构建“翻译模型”。与“基于规则的方法”的传统翻译软件相比,谷歌自动翻译是“基于统计的方法”,所以效果略胜一筹(王峰,彭石玉,严丹2010:66)。
褚东伟(2010:10)认为谷歌翻译的成功体现在以下两方面:(1)能够提供具有一定可读性的译文,给绝大多数的人提供了跨语言检索和使用外文文献的机会。(2)具有超级检索能力,可以为专业翻译提供参考。
3.4 协同校译
GTT为用户提供了即时通信功能,相当于在线实时聊天工具。在翻译校对过程中,由于对技术方面的问题认识有限,遇到不解之处时,需要与委托方相关技术人员及时沟通。此时无需开启其他聊天工具,只需在GTT页面点击即时通信,既可进行语音聊天、环聊或群聊。及时有效的沟通有利于快速准确地解决问题。
随着译作的发表形式越来越数字化,网络由“阅读式”向“读写式”转化(叶琼丰2001:60),读者常常通过博客、论坛、微博等网络话语渠道介入到翻译内容、策略的选择中,参与翻译的评价与修改,使翻译成为“互动式翻译”(interactive translation),译本成为“开放性文本”(textwith no end)(Gil&Pym 2006)。GTT就为用户提供了类似的网络互动,协同校译的平台,而且赋予了译者选择的权限,并非所有用户都可以参与,或参与全部功能,只有收到译者邀请的用户才具有译者赋予的权限。译者可点击GTT工具栏中的“与朋友分享”,邀请委托方的技术人员,审校人员协同校对。可设置的权限包括:拥有者、编辑、评论、阅读。既可以让技术人员、审校人员感受动态的译文,又赋予了他们提出宝贵意见的权限,以便译者总结经验教训,同时又为译文的质量提供了保障。
鉴于上述特征,GTT的潜在用户群体较为广泛,包括一般用户,翻译爱好者,专业译员及翻译公司。首先,对于译文要求不是很高的翻译来说,比如,用户只是想获取文本的主要信息,GTT是理想的选择。其次,GTT协助翻译爱好者跨越一些语言障碍,并提供了全新的体验,如:翻译平台,项目流程管理,协同校译等,激发了他们的翻译兴趣,满足了他们的需求。与此同时,针对轻型,或重复率较高的翻译任务来说,GTT也为个人译员及翻译公司提供了高效便捷的服务,为译文的质量提供了保障。译文的生成不再是一个独立的活动,而是辅以翻译记忆,术语库,自动翻译,人工编辑,协同校译,归档等一系列的集成过程。GTT的竞争对手是空白页面而不是人类译员,就翻译感受而言,所谓“有胜于无”,粗糙的译文优于零译文。译者工具包和译员的关系是和谐共存,相辅相成的。
本文将以Digital Teaching Platforms(Walters,Richards&Dede 2009)文献的翻译为例,呈现译者工具包辅助翻译的过程。
4.1 添加翻译记忆库
有时翻译项目涉及安全性问题,从而不会对外开放共享,因此,在翻译前需设置专属的记忆库,首先进入谷歌主页面,访问GTT,登录谷歌的电子邮箱Gmail账户,选择工具选项中的翻译记忆库,设置记忆库名称,选择翻译记忆库为非公用。点击添加TM,即可创建空的翻译记忆库。或者可将预翻译的文档转成TMX格式(大小不得超过50MB)。系统仅支持符合TMX1.0或更高版本规范的TMX文件,翻译记忆库一旦创建,就无法再更改其中的设置。
4.2 制作上传术语库
在上传术语库前,需按照GTT规定的格式进行编辑。GTT术语库相对于其他翻译软件的术语库(例如:DéjàVu X的专用术语库“Lexicon”,可供当前项目使用,译者可对此进行术语提取和后续处理。SDL Trados的MultiTerm,是基于DOS操作平台的术语管理工具。)来说,功能并不强大,它是只读文件,需要利用其它工具事先编辑好,才能上传。根据谷歌的官方文档介绍,GTT术语库应该是UTF-8编码的CSV格式文件,其行和列应符合一定的规范。译员可以使用Excel来编辑术语库,然后将其保存成符合规范的格式。制作步骤如下:
1)术语库的第一行包含三个部分:locale,(比如,英语:en;简体中文:zh-CN等),pos(可选),description(可选);
2)从第二行开始就是数据行,将相对应的术语填写到各自所在的locale列;
3)完成所有的术语编辑后,将该表格另存为CSV格式的文件。这时生成的文件一般是ANSI编码,并不符合GTT术语库所要求的UTF-8编码,还需用文本编辑器(比如Windows自带的记事本)打开该文件,在另存为对话框中选择UTF-8编码,再覆盖原文件,这样就完成了GTT术语库的编辑。
4.3 编辑自动翻译
GTT的研发人员将本公司的谷歌自动翻译融入其中,使它成为该翻译软件的一大亮点,为用户提供了实时翻译的便利。将翻译文档上传至GTT账户后,谷歌自动翻译首先对文档进行预翻译,用户在此基础上可以逐句修改译文(徐彬2010:92)。当用户针对翻译结果提出建议时,自动翻译即可更新其语料库,随着全球用户不断地贡献,谷歌自动翻译的质量也在不断地提高。译后编辑的重心在于调整自动翻译输出的结果,尽可能地使之忠实于原文。
自动翻译存在的不足及人工改译列举如下:
4.3.1 词汇层面
1)专有名词漏译
(1)As co-director at Harvard Project Zero and senior research associate at TERC,he has directed numerous research and development projects.Project Zero的哈佛大学和高级研究助理TERC共同主任,他曾执导过无数的研究和开发项目。
改译:他是哈佛大学零点方案的主任及教育技术研究中心的高级研究助理,负责了无数的研发项目。
(2)Newton MA.牛顿MA。
改译:牛顿,马萨诸塞。
(3)At CS4Ed he provides strategic planning,research and business solutions for the education technology industry.在CS4Ed他提供战略规划,研究和商业解决方案,为教育科技产业。
改译:他就职于教育咨询服务公司,为教育技术服务行业提供战略规划,研究及业务解决方案。
2)词义误译
(4)Mr.Jones teaches 5th grade and he is preparing for tomorrow’s math lesson on finding common denominators.琼斯先生教五年级,他正准备为明天的数学课上找到共同点。(名词误译)
改译:琼斯先生教五年级,他正在备课,明天数学课上教公分母。
(5)This is a new fractions concept for the class,so he plans to use the T2K fraction bar applet to have students explore fractions of equal value.这是一个新的分数为班级的概念,因此,他计划使用T2K分数线的小程序,让学生探索价值相等的分数。(名词误译)
改译:对学生来说,这是一个关于分数的新概念,因此,他计划使用T2K分数线的小程序让学生找出等值的分数。
(6)First,they select a denominator,and the applet creates a horizontal bar with the corresponding number of boxes.首先,他们选择了一个分母,小程序创建了一个单杠,与相应的箱数。(名词误译)
改译:首先,他们选择一个分母,程序就生成一栏相应数量的方框。
(7)Students use it to create fractionswith different numerators and denominators.学生使用它来创建不同的分子和分母的分数。(动词误译)
改译:学生用这个程序,组合不同的分子分母。
(8)Jones previews the applet and then adds it to his lesson,along with some questions to guide student discussion.琼斯预览的小程序,然后将其添加到他的课,伴随着一些问题,引导学生讨论。(副词短语误译)
改译:琼斯先生预览了这个程序,并把它添加到课程中,同时还添加了些问题,引导学生进行讨论。
(9)The Technology In the Classroom技术课堂(介词短语误译)
改译:技术在课堂中的应用
(10)Before class the teacher uses planning tools to prepare;during class he usesmultimedia to introduce a topic,an applet to explore amathematics concept,and practice exercises.上课前,老师用规划工具,以备在课堂上,他用多媒体引入课题,探索出了一条数学概念,一个applet和实践练习。(冠词误译)
改译:课前,教师使用规划工具做准备,课上,使用多媒体介绍内容,运用程序探讨数学概念,并展开辅助练习。
(11)Because each student uses a laptop during class,the teacher can monitor individual progress and communicate with each studentunobtrusively.因为每个学生在课堂上使用一台笔记本电脑,老师可以监控个人的进步,并与每一位学生悄悄地沟通。(连词误译)
改译:课上,每个学生都使用笔记本电脑,教师可以监控每个人的进程,并可以与他们私下沟通。
3)词性误译
(12)Students can also click on a filled box to remove the color and decrease the numerator.学生也可以单击填充的框中删除的颜色和减少分子。
改译:学生还可以点击已上色的方框,清除颜色,分子随之变小。
(13)On their student desktop,they see the activity,several practice exercises,and some guiding questions for class discussion.在学生桌面上,他们看到的活动,有几个练习,课堂讨论的问题和一些指导。
改译:学生在电脑上看到了任务,几道练习题,和一些为班级讨论准备的引导性问题。
(14)The students are familiar with the interface,and they immediately open the activity and begin work.同学们都熟悉的界面,他们立即打开活动,并开始工作。
改译:学生熟知这个界面,他们立刻打开任务开始练习。
(15)The Time To Know Digital Teaching Platform contains a comprehensive curriculum of guided learning sequences that include applet activities,multimedia presentations,practice exercises,and games.数字化教学平台的时候就知道引导学习序列,包括applet的活动,多媒体演示,实际操作练习,游戏中包含的综合课程。
改译:T2K数字化教学平台涵盖一个全面的课程导学序列,包括程序任务、多媒体演示、练习题和游戏。
4.3.2 句法层面
谷歌自动翻译的单位是词或词组,而非完整的句子。从词汇层面上看,自动翻译的译文相对可靠,但从句法层面上看,其译文存在的问题较多。
1)语序问题
自动翻译在语序处理上,有时比较机械,缺乏对目标语语序习惯的考量。有时又比较随意,背离了原语的句意,造成误译。例如:
(1)The hardware used in the Digital Teaching Platform—laptop computers and a wireless network— is less than 10 years old.使用的硬件在数字化教学平台——笔记本电脑和无线网络——不到10岁。(同位语未换序)
改译:硬件设施包括笔记本电脑及无线网络应用于数字化教学平台的时间还不足10年。
(2)The Digital Teaching Platform supports teachers and students in classrooms equipped with technology that approaches one-to-one computing.数字化教学平台支持教师和学生在教室里配备接近一到计算技术。(状语未换序)
改译:在配备了一对一电脑运算技术的课堂中,数字化教学平台为师生提供了教学及学习上的帮助。
(3)The vignette illustrates the use of this platform in a fifth-grade classroom.小插曲说明了如何使用这个平台,在五年级的教室。(状语未换序)
改译:这个示例展现了教学平台在五年级课堂中的使用情况。
(4)The study examined the student scores on the Massachusetts statewide examination (the MCAS)and found a significant improvement in the technology classrooms across a two-year span.(Babell&Kay 2008)该研究的学生的分数在马萨诸塞州全州考试(MCAS)跨越一个为期两年的跨度和技术教室发现了一个显着的改善。(状语换序不当)(Babell and Kay 2008)。
改译:研究调查了马萨诸塞全州统考(the MCAS)的成绩,发现配备了笔记本电脑的学生在两年里成绩有显著提高(Babell and Kay 2008)
(5)Students see only the activities that they are assigned,so they are not distracted by materialsmeant for others or by activities thatwill be used later.学生只看到他们被分配的活动,所以他们并不意味着对他人的材料或活动,稍后将被用来分心。(定语从句换序不当)
改译:学生只能看到布置给他们的任务,不会受到其他干扰,如,发给他人的材料,或以后要完成的任务。
(6)Thus the computer becomes a valuable and timely resource for teaching and learning in the classroom.因此,计算机在课堂教学和学习资源变成了宝贵和及时的。(前置定语换序不当)
改译:因此,对于课堂教学和学习来说,计算机成为课堂中适时而宝贵的资源。
2)语态问题
自动翻译通常会直译英文的被动语态或处理不当,不符合汉语的语言习惯。
(7)Students see only the activities that they are assigned.学生只看到他们被分配的活动。
改译:学生只能看到布置给他们的任务。
(8)A research team from Boston College has evaluated a wireless initiative in western Massachusetts in which studentswere equipped with wireless laptop computers.从波士顿学院的一个研究小组已经评估了在马萨诸塞州西部的学生都配备了无线笔记本电脑无线主动。
改译:波士顿大学的研究小组评估了马萨诸塞州西部的无线网络方案,在那里给学生配备了无线笔记本电脑。
(9)Was the technology used effectively?技术有效利用?
改译:技术被有效利用了吗?
(10)The hardwaremust be accomplished by changes in teaching,testing,and professional development.硬件必须完成的教学,测试和专业发展的变化。
改译:硬件设施的作用必须通过教学,测试,专业发展的变革得以实现。
3)断句问题
在英文文献中,复杂长句也是比较多见的,然而长句翻译是自动翻译的软肋,机器很难分析长句错综复杂的关系,不能恰当处理断句问题,从而影响了译文的质量和可读性。
(11)Independent evaluations in Israel,where Time To Know has been used for over two years,find improved student engagement and performance,deeper understanding,and more independent learning.独立评估,已经使用了两年多时间知道,在以色列找到提高学生的参与和表现,更深入的了解,更独立学习。
改译:Time To Know在以色列已投入使用超过两年。独立开展的评价表明这种教学平台有助于提高学生的学习兴趣及成绩,增强学生的理解力及独立学习的能力。
(12)In traditional settings,individualization can be logistically complicated and can disrupt the flow of instruction,butwith technology individualization is straightforward and can be handled before class begins.在传统的设置,个性化可以后勤复杂,可以扰乱流的指令,但技术个性化很简单,在开始上课前,可以处理。
改译:在传统模式中,个性化教学实施起来相当困难,而且会影响教学进程。但是有了技术,个性化教学就变得简单,可在课前完成。
(13)Technology offersmany opportunities to orchestrate the choreography of classroom management,and the discussion below shows how the features of the T2K have been designed to aid the teacher in each of these areas.技术提供了许多机会,协调课堂管理的编舞,并在下面的讨论中显示的功能是如何的T2K已在上述各领域,旨在帮助老师。
改译:技术可以妥善协助课堂管理。接下的论述也说明了T2K的设计是如何在各个方面帮助教师管理课堂的。
(14)When students open their laptops,they quickly begin to navigate their assignments,even though the activities in those assignmentsmay be completely new to them.当学生打开自己的笔记本电脑,他们很快开始浏览他们的任务,即使在这些任务中,他们可能是完全新的。
改译:学生打开笔记本电脑,就很快开始设法解题,即便题目对于他们来说是可能全新。
(15)Students often become frustrated when they are working on assignments that are too hard,and they are bored when their assignments are too easy.学生往往变得沮丧时,他们太硬的分配工作,他们无聊的时候,他们的任务是太容易了。
改译:如果作业太难,学生往往会感到沮丧,相反,若太容易,他们又会感到厌倦。
4.4 展开协同校译
在翻译过程中,运用GTT的即时通信功能,与技术人员有效沟通,确定正确的表达方式。译后,通过分享平台邀请相关技术人员,审校人员协同校译,从而确保译文的质量。
综上所述,GTT为个人译员和翻译公司提供了便利的翻译平台,其翻译记忆、术语管理、自动翻译和协同校译等功能起到了辅助翻译的作用。但同时也应意识到GTT存在的不足之处,批判性地加以利用,取长补短,相得益彰,减少重复劳动,从而提高翻译的效率与质量。身处信息时代的译员,需不断更新自身的专业知识结构,学习先进的技术,与时俱进。译员不只是担当改译、校对等角色,与此同时,也在为GTT的潜在发展提供更多的选择。在训练有素的专业译员、术语学家以及软件开发人员的共同努力下,GTT将会加快更新速度,提供更有效的辅助工具,将促进翻译逐步走向“数字化”,走向“云端”,使译者拥有更为广阔的空间来发挥自己的知识与技能。
参考文献:
Babell,D.&Berkshire,R.K.(2008).Wireless Learning Initiative Year 3 Evaluation Results[M].Boston MA:Boston College.
Craciunescu,O.,Salas,G.C.&Keeffe,S.S.(2004).Machine translation and computer-assisted translation:a new way of Translating?[J].Translation Journal(3).
EAGLES.(1996).Evaluation of Natural Language Processing Systems?[DB/OL]Center for Sprogteknologi,Copenhagen. 1996[2013-07-16].http://issco-www.unige.ch/projects/ewg96/ewg96.htm l.
Gil,J.&Pym,A.(2006).Technology and Translation(a pedagogical overview)[A].In A.Pym et al(eds.).Translation Technology and its Teaching[C].Tarragona:Intercultural Studies Group.
ISO/TC 37/SC 1.ISO 704:2000.TerminologyWork—Principles and Methods[S].
Walters,J.,Richards,J.&Dede,C.(2009).Digital Teaching Platforms:A Research Review.[EB/OL][2013-07-20].http:// www.timetoknow.com/white-papers.
Wüster,E.(1991).Einfürung in die Allgemeine Terminologie und Terminologische Lexikographie [M].(3rd ed).Auflage Bonn:RomanistischerVerlag.
褚东伟 (2010).常规对应、数据关联与谷歌翻译评价 [J].广东外语外贸大学学报 (4)。
谷歌(2010).译者工具包[DB/OL]维基百科.[2013-07-18]。http://zh.wikipedia.org/wiki/Google%E8%AF%91%E8%80% 85%E5%B7%A5%E5%85%B7%E5%8C%85.
王峰,彭石玉,严丹(2010).基于Google新功能辅助汉译英的研究[J].上海翻译(4)。
王正,孙冬云 (2009).统计机器翻译系統在网络翻译教学中的应用 [J].上海翻译 (1)。
徐彬(2011).谷歌翻译工具包(GTT)的优点[DB/OL].[2013-07-18].http://wenku.baidu.com/view/cea72014a2161479171 1289a.html.2011-11-04.
徐彬,郭红梅,国晓立 (2007).21世纪的计算机辅助翻译工具 [J].山东外语教学(4)。
徐彬 (2010).计算机辅助翻译研究 [M].山东:山东教育出版社。
叶琼丰 (2001).时空隧道——网络时代话传播 [M].上海:复旦大学出版社。
2014-03-10
韩娜,上海理工大学硕士,研究方向为科技翻译研究;
高军,上海理工大学教授,研究方向为英汉对比与翻译研究。