信息化时代的计算机辅助翻译技术
——资源整理与介绍

2018-10-08 07:57马新强李清平中南大学
外语与翻译 2018年3期
关键词:译员术语译者

马新强李清平中南大学

【提 要】自上世纪80年代计算机辅助翻译(Computer Aided Translation,CAT)技术问世以来已有近30年时间,在国际语言服务行业已成遍地生花之势。而面对市场的热度,国内文科背景出身的译员或高等院校翻译院系的师生们往往对CAT以及这些技术资源的获取无从着手,有雾里看花之感。本文拟从CAT的概念界定入手,系统梳理和介绍当前市场上的CAT工具和云翻译平台,并阐述其在技术形式的嬗变,以期为译员以及翻译院系的师生掌握和熟悉该技术提供一定的参考。

1.引言

信息化时代背景下,信息的传播数量以及速度都以几何倍数增长。全球化和本地化服务需求的激增推动着翻译行业呈现爆炸式发展。传统作坊式的翻译模式已经难以满足信息化时代市场对“海量”信息迅速传递的要求。从上世纪90年代开始,翻译服务行业开始顺势而行,计算机辅助下的翻译方式逐渐成为一种热点。进入21世纪,翻译开始展现全新的特征:全球化、信息化、技术化、本地化、职业化、项目化(傅敬民、谢莎 2015:37)。“计算机辅助翻译甚至机器翻译已经成为大规模语言服务的主要方式,一些较成熟的翻译软件、翻译语料库等已经广泛地应用到一些语言服务企业之中”(仲伟合 2015:11)。

2.计算机辅助翻译技术的概念与界定

计算机辅助翻译(Computer Aided Translation,CAT)是一项有异于机器翻译(Machine Translation,MT)的现代翻译技术。国内外翻译技术研究者普遍将计算机辅助翻译定义区分为广义与狭义两类。广义而言,所有在翻译过程中使用到的,能够帮助规范翻译流程,提高翻译质量和效率的计算机工具都隶属这一范畴,如“译前的编码处理、可译资源提取、字数统计、任务分析、术语提取等;译中的片段复用、搜索验证、术语识别、进度监控;译后的格式转换、模糊匹配、自动化质量保证、语言资产管理等;语料自动对齐及其翻译、语音输入、语言翻译等技术”(王华树2014),均可称为CAT技术。从狭义角度来看,CAT工具指翻译过程中专用于提升翻译效率和质量的计算机终端软件。如果说机器翻译是一种“无人状态下”计算机主导的全自动化翻译手段的话,那么CAT则是一种以人为主、机器为辅的翻译技术。它的工作原理是借助翻译记忆库(Translation Memory,TM)以及术语库(Term Base,TB)由计算机负责翻译过程中的重复性工作,从而大幅减轻翻译工作者的脑力和体力劳动,提供工作效率,使译员从繁重的翻译工作中解放出来(吕立松、穆雷 2007:37)。

2.1 广义的计算机辅助翻译技术

随着上世纪40年代计算机技术的发明与应用,美国和英国的研究者就立刻提出了用计算机进行翻译的设想,这充分说明人们对于计算机在改良翻译模式以及提升翻译质量和效率方面优势的认可。国内学者桂文(1992)和周光父(1998)曾撰文讨论计算机对翻译效率的提升。不过,早期对于计算机可以提升翻译效率和质量的认识多停留在由纸质化进入电子化所带来的变化,如存储方式、输入法、拼写检查、语法检查、格式转换等,这也是CAT广义概念产生的源头。

计算机时代为翻译所带来的变化堪称改头换面。在计算机辅助下,翻译过程不再是一支笔、一沓纸的“刀耕火种”的手工作坊模式,译者会选择在Office等办公软件支持下进行翻译,输入字符,审阅后直接打印成稿,清晰美观,快速无误。相对于早期传统的翻译工作方式,这已经让译者感慨为一种巨大的进步了。我们将翻译流程宏观地分为译前、译中、译后三个阶段,应该说,信息化时代的今天,计算机通用软件在这三个阶段的介入和使用变得越来越普遍,它们对翻译效率和质量提升效果十分显著。在译前准备工作中,译者可以通过扫描仪这样的设备将纸质原文电子化;之后利用光学字符识别(Optical Character Recognition,OCR)软件,例如 Abbyy Finereader,Nitro Pro PDF,云脉文档识别、清华紫光等来识别已经通过扫描仪获得的纸质图书或者被加密的文档,将其转换成CAT软件能够识别的文件格式;通过SDL Multiterm Extract,CrossTerm,TermStar、语帆术语宝等进行术语提取和管理,制作前期术语表;除利用Word进行文本编辑外,译者还可以利用“超能文本处理器”等其他一些专门的文本编辑工具对原文文本批量地排序、删除、替换、分割、大小写转换、加字符、合并、计算长度等,以主导译前的字数统计、任务分析,为翻译工作进度规划以及资源调配做好准备;对于团队协作任务,翻译项目经理还可通过 Microsoft Project,Open WorkBench,OpenPlan等项目管理软件为整个翻译项目制定计划、分配资源、跟踪进度、管理预算和分析工作量,此类软件并非翻译项目管理专用,往往也适用于其他领域的项目管理工作。在译中阶段,电子词典、百科全书等是译者使用频率最高的查词工具;而对于电子词典难以提供较为满意或详尽信息的一些专有术语、谚语、典故、背景知识等,译者往往可以借助搜索引擎,而类似谷歌的精确搜索功能可以帮助译者大幅缩减检索时间,节省精力,提升效率和准确度;随着语料库在21世纪发展为第四代,亿万级、多语种、携带语义和语用标记的大型语料库也开始被译者用于词义查询、词汇比对,大幅提升了翻译质量;译者可以通过Evernote,有道云笔记、Onenote等信息管理类软件对自己的翻译笔记、双语参考文档、任务进展、图片、影音等资料进行整合管理,以便后续的学习和研究之用。在译后阶段,译文的质量管理(Quality Assurance,QA)是在所难免的一道程序。译者通过一系列的QA工具可以大幅提升译后审校和编排的效率,如国外的ApSICXbench,D.O.GErrorSpy,Yamagata QADistiller,PalexVerifika,Lionbridge SharpKit,SDL HTML QA 以及国内的HuaweiOneCheck、黑马校对等。即使是Word本身,如果能够妥善利用它自身集成的各种功能模块,如“拼写和语法检查”、“修订”、“宏”、“比较合并文档”、“版本”、“拆分”、“文本表格互转”、“并排比较”,译文的审校以及译后的编排无论是质量还是效率都可以得到极大提升。

2.2 狭义的计算机辅助翻译技术

20世纪末,机器翻译生产的译文质量始终差强人意,进而导致人们开始意识到自然语言规则仿真系统建设的难度,提出翻译过程中人的“创造性”不可替代。“毫无疑问,技术的产物无论怎么复杂,都不能和人脑的创造能力相媲美”(Snell-Hornby1988/1995)。而如何使机器翻译的质量达到甚至赶超人工翻译?这也被称为翻译技术发展中的“哥德巴赫猜想”(陈光火1999:44)。面对这一困局,CAT技术应运而生,翻译技术开始由早期“人辅机译”的机器翻译模式转向“机辅人译”的计算机辅助翻译模式。由人来主导翻译过程中的创造性工作,而计算机负责翻译过程中大量重复性劳动,如重复句段翻译、术语前后统一、数字输入、非译元素、复杂单词输入等,大幅提高翻译工作效率和质量,这也是狭义的CAT技术的源头。

狭义的CAT技术主要指那些以翻译记忆技术为核心,专为提升翻译质量和效率、优化翻译流程而开发的计算机应用软件,王华树曾将之称为“专用计算机辅助翻译软件”。翻译记忆机制主要由两部分构成:翻译记忆库(TM)和术语库(TB)。在翻译过程中,计算机会自动将已完成的译文和原文一起以句对形式存储,从而形成翻译记忆最小的翻译单元(Translution Unit,简称 TU),它包括已经对齐的源语句段和译语句段,其本质上属于一种双语平行语料库,如图1所示,该图例来自于CAT工具SDL Trados 2017。

图1 翻译记忆库

翻译过程中,计算机依照预设的匹配率自动搜索翻译记忆库,给出参考译文。译者可以保留符合条件的译文,对于有差别的译文译者可以经过修改后保留或完全弃用。修改后的译文又作为新的翻译单元储存于翻译记忆库中。循环往复,随着翻译实践的增加,翻译记忆库中的翻译单元不断增加,后续类似素材的翻译工作也会变得越来越简单,效率和质量均大幅增强。而术语库则是一种收集、编辑、整理、维护术语的工具,在翻译中,术语库可以自动识别原文中的术语,允许译者将相应的译文直接插入译文区。同时,术语库允许译者将翻译过程中遇到的新术语进行添加保存。就本质而言,术语库是一种译者的自编词典,不过它更有针对性,如图2所示,图例来自于CAT工具SDL Multiterm 2017。在高质量的术语库支持下,CAT软件可以将翻译效率提升20%左右。

图2 翻译术语库

对于行业技术性这样重复率达到20%到70%的文本,在翻译记忆库和术语库的辅助下译者的翻译效率可以提升50%左右(钱多秀2009:52)。尽管大多研究者认为,翻译记忆技术适用范围相对狭窄,仅适合政治、经济、军事、航天、计算机、通讯等半技术性及高度技术性文本(奕风2000:11;Austermuehl 2006;Quah 2008),然而目前研究表明,通过严格缜密的翻译流程设定,采用机器翻译与人工校对与修订的方式,计算机辅助翻译软件在非技术类文本,如文学作品的翻译效率提高方面同样大有作为(徐彬、郭红梅2015:71)。

3.国内外“主流”CAT工具

自上世纪80年代计算机辅助翻译技术出现至今,国内外已经出现了众多的计算机辅助翻译软件。通过查阅文献、搜索翻译技术网站和论坛,我们发现在国内外的公司企业、政府部门、国际组织、译员、翻译公司中使用较为广泛的“主流”CAT工具有以下10种。

《中国企业“走出去”语言服务需求调研报告(2016)》(王立非2016)显示,具有语言服务需求的公司企业以及政府部门所使用的CAT软件主要为Trados(41.3%),Transmate(39.7%),VisualTran(11.1%),Across(3.2%)以及雅信(1.6%)。此外,还有25%的企业使用了自主开发的CAT工具。根据《中国语言服务业年度发展报告(2014)》,在语言服务提供商中使用最广泛的CAT工具为Trados,SDLX以及Worldfast,分别占比36%、11.4%以及9%,而 Catalyst,Passolo,MemoQ,雅信 CAT,Déjà vu,StarTransit均为5%左右。北京大学计算机辅助翻译专业的侯晓琛、颜玉祚(2008)就中国翻译行业CAT应用状况所进行的网络调查显示,受测的译员中有66%在使用CAT工具,而在他们当中,使用Trados的达到了85.8%,雅信CAT达到了29.68%,Déjà vu为26.45%,Wordfast占比 20.65%。英国帝国理工大学《2006年翻译记忆系统调查》(Translation Memories Survey)数据显示,国外使用最广泛的 CAT 软件为 TRADOS(51%),Wordfast(29%),SDL Trados 2006(24%),Déjà vu (23%),SDLX(19%)以及StarTransit(14%)。

表1 “主流”CAT工具

TRADOS是由1984年成立于德国的一家公司开发的,2005年被SDL公司收购后,TRADOS、SDLX、SDL Passolo都已整合进了SDL Trados产品中,因此我们在此仅将SDL Trados作为一个统计项。在所有用户群体中,SDL Trados都是使用率最高的CAT工具,这说明了它的市场主导地位。对于翻译人员,尤其是翻译技术学习者而言,市场的技术风向往往对于学习哪一种CAT软件具有重要影响。当然,市场中CAT工具选择的多样性也决定了在SDL Trados这样的主导产品之外我们需要另外多学习和掌握几款工具。Across,Déjà vu,MemoQ,VisualTran以及Transmate(桌面版)这样可以提供免费版本的CAT软件就成为了不错的选择。对于自由译员而言,毕竟在收入水平难以令人满意的情况下(传神翻译2007),动则数千甚至上万的售价还是令大多数人望而却步。而对于高等院校的CAT教学而言,以SDL Trados等这样的市场“主流”软件为主,再辅以其他适当的免费软件,学生所掌握的CAT技术同样能够较好地满足语言服务市场的需求。一方面,CAT实训平台或翻译技术实验室的搭建对于经费有限的文科院系而言负担不小,完全没有必要重复建设引入两套付费系统;其次,当前的CAT软件工作机制大同小异,只是在操作界面和个别功能方面略有差异。对比视角下讲授数个CAT软件,让学生掌握其工作机制,将来面对其他CAT软件的工作环境,他们完全可以通过自学在很短的时间内上手。

4.“小众化”CAT工具

CAT工具虽然没有像其他计算机通用软件一样,云屯雾集,难以计数,但除上述10种“主流”CAT软件之外,可供企业用户、自由译者以及高校教学选择的同类软件同样也不少,我们姑且称之为“小众化”CAT软件,如表2所示。之所以称其“小众化”,是由于它们相对于主流翻译软件因为发布时间和地域等原因市场占有率不高,在CAT软件商业领域扮演着市场追随者的角色。而事实上,这些软件之中,如 Omega T、Okapi、Idiom、雪人、传神等,因其全面的功能以及实行部分免费的获取方式而在自由译者以及CAT技术研究人员中有着良好的口碑和巨大的潜力(周兴华2013:94)。

表2 “小众化”CAT工具

在这些“小众化”CAT工具中,除了Appletrans、Babylon仅适用于Mac OSX系统外,其他软件均适用于当前主流的Windows平台,而且一般都可以跨平台使用。而它们当中,有着更多的免费软件可供译员和翻译技术学习者选择。值得一提的是,这些免费软件中,Omega T,Okapi,Open Language Tools,Tansolution均为开源软件。开源软件赋予了用户极大自由,使他们能够按照自己的业务需求定制软件,有利于一些企业用户削减开支和人力成本,用户的挑错和改进反过来对开放源码软件包的完善也可以提供反哺,正可谓相得益彰。一些付费软件也同时提供丰富的免费版本,如 MetaTexis,AidTrans Studio Basic、朗瑞等均提供了免费试用版,MemSource Editor拥有免费的个人版和学术版,雪人提供了免费的单机版和服务器版。不过,这些软件的免费版本往往在功能上都受到了一些限制。

无论是“主流”CAT工具还是“小众化”CAT工具,随着时间的推移,它们都不断地根据用户的需要进行版本的更新和优化。在软件操作方面,大多CAT工具变得越来越简单便捷,例如,除Trans Whiz,Logoport,Omega T,MetaTexis,Wordfast,Logoport、火云译客iCAT等少数几款CAT工具外,大多CAT工具均开始抛弃以往嵌入到文字编辑软件中的工作方式,转而采用独立的表格工作界面,原文和译文以句对形式显示在表格之中。这种工作模式具有“集成度高、稳定性好、界面整洁等优势”(徐彬、郭红梅2012)。这些变化既降低了掌握CAT工具的难度,提升了CAT工具在译者群体和学习者之中的接受度,同时也避免了因为软件操作复杂导致翻译效率下降。毫无疑问,这对于CAT工具的进一步推广和普及具有良好的推动效应。

5.云时代的翻译技术———云翻译平台

随着云计算技术的发展,翻译技术提供商以及翻译服务公司很快抓住了这一技术演变的方向标,开始纷纷投入云翻译平台开发的阵营,众多“云端”的CAT技术开始应运而生,如表3所示。

云翻译平台是云计算技术和CAT技术完美结合的一种产物。狭义来看,云翻译平台是一种在线的CAT技术,也就是将CAT工具放置于“云端”,以在线的形式供用户注册使用。而通过对表3中的云翻译平台进行实际对比调查,笔者发现除Google Translator Kit,Systran 网 络 版 ,MateCAT,SmartCAT,芝麻翻译,Wordfast anywhere等属于纯粹的在线CAT工具外,其他平台往往同时兼具三种特性:在线CAT技术、翻译项目管理(TMS)以及翻译众包。

表3 云翻译平台

在线CAT技术将翻译过程中需要的CAT工具安装于云服务器,免费供译员使用,降低了译员对于计算机硬件的依赖以及高昂的软件购置费用负担。只要连接互联网,译员随时随地就可以开展翻译。与此同时,在线CAT工具均提供了良好的协同翻译功能。与以往传统的CAT工具不具有协同翻译模块或需要付费购买服务器版才可以开展区域性协同翻译不同,大多云翻译平台均免费开放该项功能。对于任何一个翻译项目而言,项目的发布者或平台开发商都可以根据翻译项目要求和译员的资质自由邀请译员加入翻译团队。翻译项目负责人根据要求将同一个翻译任务进行拆分,然后分配给不同的译员,每一位译员的工作进度均在线显示。这种同步性减轻了翻译项目的管理负担。而翻译过程中,译员们可以使用同一个翻译记忆库和术语库,也避免不同译员分别建库、不同翻译记忆库和术语库的相互交换、合并等重复性工作,大大提升了翻译效率。将原来传统CAT技术环境下依然需要人工完成的步骤交由机器完成,大型翻译项目管理的效率呈倍数增长,这种工作模式对于翻译公司或者大型翻译项目团队无疑具有巨大的吸引力。在互联网的帮助下,云翻译平台将地球两端的译员连接了起来,充分实现了协同翻译的“全球化”。

云翻译平台的翻译项目管理特性更加注重整个翻译产业链中各个环节的有效链接与统一,它不仅包括翻译流程的管理,如翻译项目发布、任务上传、任务分析与拆分、任务认领与分配、进度监控、质量管理、产品交付,还包括翻译提供商管理、译员管理、翻译记忆库和术语库管理等。云翻译平台将翻译项目管理由线下搬到了线上,利用互联网的便利大大提升了管理的时效性,能够更好地应对当前信息化时代翻译项目大型化和快速化的要求。

翻译众包是通过互联网将翻译项目拆分后分配给不同的译员完成。译员可以采用在线协同翻译的方式,也可以在线下独立完成。云翻译平台的翻译众包模式引领着语言服务行业由传统的线下模式转入线上模式,实现了译员和客户之间的无缝对接,很好的解决了译员资源调配以及大型项目对翻译效率的要求。与此同时,也为翻译爱好者和翻译专业的学生提供了良好的翻译实践渠道。不过,这种众包形式也存在多种隐患,如译员良莠不齐、管理难度较大、质量风险难以控制等,这些都有待今后进一步优化与完善。

6.结语

CAT技术在提高翻译质量和效率、降低成本、统一译文风格和术语表达一致性方面有着无可比拟的优势。而借助互联网的发展,CAT技术甚至打破了计算机硬件配置的束缚,这种便捷性也必然进一步推动着它在翻译行业中的普及程度。但需要注意的是,尽管CAT技术已经成功地让译员从繁重的体力劳动中得到了一定的解放,但在这一模式下的翻译过程中,人依然是工作的主体,创造性的内容依然无法由机器所替代,译员能力的高低才是决定译文质量乃至翻译任务成功与失败的关键。虽然CAT工具附带的QA功能可以提升翻译质量,但这种提升毕竟有限。CAT工具的质量检测参数主要集中在句段验证、不一致、标点符号、数字、长度验证等这些“硬错误”,而对于语用等这类“软错误”更多地还需要人工进行发现纠正。故而,CAT模式下的翻译依然要依赖于译员的翻译能力:双语能力、通识知识、翻译技巧。无论是译员还是翻译院系的师生,还需要强调的是计算机只是辅助翻译的一种工具,翻译能力依然是这一技术条件下翻译过程中难以替代的基本要素。

猜你喜欢
译员术语译者
生态翻译学视角下译者的适应与选择
论新闻翻译中的译者主体性
医疗口译中口译人员角色的动态转换
英文摘要
英文摘要
口译中的“陷阱”
译员扮演何种角色?
译员与翻译企业的劳资关系及其和谐发展
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势