信息化时代的计算机辅助翻译技术研究

2014-03-20 07:57北京师范大学王华树
外文研究 2014年3期
关键词:术语译者工具

北京师范大学 王华树

1. 引言

纵观历史长河,人类社会进步和发展,包括每一次重大社会变革,都与科学发现和技术发明息息相关。19世纪六七十年代开始,以发电机技术为代表的科技革命推动人类进入了电气时代;20世纪四五十年代开始,以电子计算机、网络技术为代表的第三次科技革命,将人类带入了信息时代。科学革命是技术革命和产业革命的先导和源泉,技术革命带来了产业革命,每一次科技革命都推动了社会生产力的空前发展。近年来,云计算、物联网、大数据等颠覆性的技术不断涌现,正在改变全球的经济、社会发展以及人类的生产方式。在信息技术驱动的变革时代,翻译技术迅猛发展,广泛应用于语言服务的各个层面,对传统的手工翻译模式产生了巨大的冲击。

2. 计算机辅助翻译技术概况

以计算机、网络和通信技术为主体的信息技术革命,已渗透到社会的各个领域,科技的力量已经影响到社会生活的方方面面。长期以来,语言学家和自然语言处理专家一直致力于追求人工智能的梦想,让计算机实现全自动化的翻译技术,解决与日俱增的语言翻译和交流的问题,计算机辅助翻译(Computer Aided Translation,简称CAT)技术和工具应运而生。

关于计算机辅助翻译的概念,国内外诸多学者均有论述,国外的如Melby(1983), Kay(1997), Kenny(1999), Hutchins(1986), Bowker(2002), Somers(2003), Quah(2006)等,国内的如袁亦宁(2002)、徐彬(2004)、张政(2005)、苏明阳(2007)、钱多秀(2009)、俞敬松和王华树(2010)、王华树(2012)等。归结起来,大致可分为狭义和广义。狭义的计算机辅助翻译技术通常是指利用翻译记忆的匹配技术提高翻译效率的翻译技术。它利用计算机模拟人脑记忆功能的机制,将翻译过程中简单、重复性的记忆活动交给计算机来做,将译者从机械性的工作中解放出来,以全力关注翻译本身的问题。计算机辅助翻译是以人为主体进行的翻译活动,区别于全自动化的机器翻译,前者可以称为“机助人译”,后者可以称为“人助机译”。国外的SDL Trados、 DéjVu、 Wordfast、 MemoQ、 STAR Transit等主流的计算机辅助翻译工具,以及国内的雅信CAT、传神TCAT、朗瑞CAT、雪人CAT等工具均属于此类技术范畴。广义的计算机辅助翻译技术则不限于此,可以涵盖译者在翻译过程中可能用到的提高翻译效率的信息技术,例如,译前的编码处理、可译资源提取、字数统计、任务分析、术语提取等;译中的片段复用、搜索验证、术语识别、进度监控;译后的格式转换、模糊匹配、自动化质量保证、语言资产管理等;以及语料自动对齐、机器翻译、语音输入、语音翻译等技术。本文主要探讨翻译记忆、翻译质量控制、格式处理、翻译协作以及现代翻译管理等代表性的技术应用。

3. 计算机辅助翻译技术的主要作用

现代翻译项目动辄几十万上百万字,涉及多语种、多领域以及多学科,而手工作坊式的翻译模式存在一系列问题(如资源分配、风格统一及术语一致性等),翻译效率极其低下,不适应时代的发展。随着翻译技术突飞猛进,翻译工具的功能不断改善,在一个追求效率的产业化时代,计算机辅助翻译技术在现代翻译工作中的作用日益凸显。

3.1 复用语言资产

在计算机辅助翻译环境下,对于翻译过程中重复出现的内容,翻译记忆系统会自动识别并插入译文区,节省了重复输入和语言组织的时间。这在翻译产品文档、客户支持指南等包含有大量重复性内容的文本时可以极大地节约时间。在实际使用过程中,翻译记忆库从原有的翻译数据库中提供“100%匹配内容”(完全匹配内容)或“模糊匹配内容”(相似但不相同的匹配内容)来帮助译者进行翻译。不完全匹配的内容会以其他颜色标注出来。当不匹配内容为数字时,可以自动替换成新数字使其完全匹配。对于同一个类型的项目来说,在翻译记忆库中存储的内容越多,翻译后续内容的速度将越快。在非文学翻译过程中,存在着大量的重复翻译,CAT工具能够取代大量非必要的人力重复劳动,效率的提升可以直接带来收入的增加。此外,利用语料对齐技术(如 SDL Trados WinAlign),可批量回收双语语料,将配对后的平行语料导入翻译记忆库中,在遇到相关文本时,可调用原有的翻译,重复利用语言资产节省翻译的时间与成本。

3.2 控制翻译质量

在翻译质量控制花费时间越多,翻译成本就越高。在当今全球化竞争日益激烈,规模较大的语言服务提供商已经深刻认识到这种两难选择,借助CAT技术,可在很大程度上实现翻译质量检查的自动化。在翻译过程中,系统会自动进行拼写检查、语法检查、数字、单位、日期、缩略语、标签以及多种格式检查等。在翻译之后,对于校对量非常大的稿件,比如客户要求每天校对 30 种语言1000页的文字,如果完全由人工校对,所花费的时间成本和人员投入成本,将非常之高。利用自动化校对工具,如SDL QA Checker、 QA Distiller等工具,可在很短时间内完成大型项目的自动化检查。

影响译文质量的一个关键因素是术语统一的问题。如果术语表中总词条在几十个之内,由人工来校对,还是可能保证的,但是如果客户提供的术语表高达数千条,很难依靠人工进行术语校对。加载术语库之后,可以在翻译过程中,保持术语在同一个文章或同一个项目中的一致性。(王华树2013:24)

3.3 简化翻译格式

在传统翻译模式下,对于文档中的分栏、文本框、页眉、页脚、脚注等复杂格式编辑,以及INDD、FM、PDF、HTML等各种格式类型转换等方面,需要耗去译者大量的时间。传统的方式处理图文并茂的PowerPoint格式文件,通常采用单纯的删除原文后再键入译文的模式,在编辑与排版上就浪费了大量的时间。借助CAT软件,译者主要关注翻译的是文字内容,基本上不涉及太多格式。例如,利用SDL Trados Studio 处理PPT文件,原文中的文字被自动提取出来,大段文字被分割成一目了然的短句,以一个一个翻译单元的形式井然有序地排列在原文区。在译文区输入对应的汉语翻译时,SDL Trados会基本上自动保持与原文相同的字体和字号,对于特殊格式的文字,原文中会出现紫色的标签,翻译时只需要按顺序将标签插入译文中对应的位置即可。在翻译过程中,SDL Trados Studio还可智能处理如时间、数字、网址、单位等非译元素,译员无需手动输入,减少了劳动量。诸如SDL Passolo、 Alchemy Catalyst等本地化工具,会自动解析软件程序中的可译元素,保留非译元素,译者在翻译过程中,只需翻译可译元素,不会破坏源程序,不用进行重新编译。翻译完成之后可直接导出原文格式的文件,省去了文档类型转换的麻烦,减少了译者非生产性的工作时间。

3.4 辅助翻译协作

许多现代的翻译记忆系统,不仅能帮助单个的译者保持术语一致,还能帮助翻译机构保持大型翻译团队术语一致,即便这个团队成员之间的地理距离十分遥远,借助网络技术,也可以共享同一份术语表。(徐彬 2010: 32)

现代化的项目通常需要很多译者协作,而且同一文档中还会有很多重复的内容,不同译者很难做到翻译的结果完全一致,同一译者前后的翻译也很有可能出现差别。科技、法律、金融等含有大量专有名词的文本对术语及文风等方面的一致性要求极为严格,风格和术语的不一致将导致译文返稿,项目失败。

利用C/S或B/S架构的协同辅助翻译系统,全球各地译员可同时协作翻译一个项目,给译文和术语的一致性提供了有力的保障。在诸如Lingotek、 Wordfast Anywhere、 XTM等在线CAT系统中,不同译员分配到不同的任务,但是任务之间有紧密的联系。第一个译员翻译某个在下文复现的句子之后,并添加到在线记忆库中,那么其他译员在下文遇到此句话的时候,翻译记忆窗口就会提供已有译文,可直接采用,同样的内容只有唯一的一种翻译,确保内容的一致性。通常,翻译记忆库和术语库可以存储在网络服务器上,系统对断句规则、翻译记忆、术语库以及双语文档进行协同处理,可实现实时共享和更新。大型项目周期短,工作量大,为了按时保质完成任务,通常需要翻译和审校同步,借助上述系统,译员翻译完一个片段之后,审校可在后台进行校对,或者译者和审校及时沟通,确保译文的质量,极大地提升了翻译效率。

3.5 辅助翻译管理

在现代语言服务行业中,翻译管理能力是翻译从业人员必备的核心能力,能力的高低直接影响翻译项目的成败。(王华树2014: 54)在非计算机辅助翻译环境中,要处理字数分析和报价、重复率计算、工作量统计、文档合并拆分、流程管理与进度控制等多项任务,需要耗费大量的时间。借助SDL Trados 2011等CAT工具,可快速实现项目分析、重复率计算、文件切分、资源分配、项目打包、工作流程控制等功能,可优化工作流程,提高译者的翻译管理效率。

根据国际知名翻译社区Proz.com(2012)发布的《2012年自由译者报告》数据显示,在促进译者效率提高方面,计算机辅助翻译技术发挥的作用高达65.3%。又据SDL(2013)的统计,利用自动化的辅助翻译技术,可降低30%到50%的翻译成本,翻译内容市场投放时间可缩短 50% 以上。2009年,国际语言服务调查机构Common Sense Advisory调查显示,利用HAMT(Human Aided Machine Translation)技术,翻译效率比纯粹人工翻译提高了两倍,成本降低了45%。计算机辅助翻译技术的作用不限于上述讨论,在翻译实践中,配合其他文本处理技术、翻译管理系统以及内容管理系统等,计算机辅助翻译技术可发挥更大的作用。

4. 计算机辅助翻译技术的发展趋势

信息技术飞速发展为翻译技术和工具的发展插上了腾飞的翅膀,语言市场的全球化和商业化进一步加大了对翻译技术的庞大需求,翻译技术和工具得到长足发展,在最近5年出现了重大变化(Choudhury & McConnell 2014: 12),云翻译、语联网、敏捷翻译等新型商业模式和生产方式随之涌现。(崔启亮2013:38)

4.1 计算机辅助翻译工具功能不断整合

计算机辅助翻译工具从最初基本的模糊匹配和编辑功能,发展到译中自动文本输入和自动拼写检查,到译后的批量质量保证,再到翻译项目切分、项目打包、财务信息统计、过程监控、语言资产管理等,功能越来越多,呈现出整合的趋势。如当前的Across、 SDL Trados、 XTM等CAT工具,不再局限于翻译本身,其功能涵盖技术写作、术语管理、文档管理、内容管理以及翻译和产品发布等环节,体现了将翻译技术同翻译流程各个环节整合的趋势。

4.2 计算机辅助翻译技术可视化程度越来越高

计算机辅助翻译工具利用标签技术将待译文档的格式信息隐藏起来,因为格式越复杂,预览效果越差,甚至不能预览翻译结果,会影响译者判断和翻译的速度,于是可视化(What You See Is What You Get,简称WYSIWYG)翻译技术应运而生。例如,在Alchemy Catalyst和SDL Passolo及其类似的翻译工具中,译者关注的是“文本”本身,并可在翻译同时很直观地看到本地化的界面和功能效果(张霄军等 2013: 114)。未来,更多的技术提供商会将可视化翻译技术无缝整合到翻译流程中,从翻译过程到项目管理,从本地化工程到测试过程,整个过程中实现无阻力的可视化,为翻译人员提供各种便利,全面优化翻译环节,节省成本,增强公司的竞争。可视化本地化技术的发展已经成为国际本地化软件工具的一种诉求,未来可视化技术的发展前景广阔。

4.3 开源计算机辅助翻译技术异军突起

市场需求的变化必定导致对翻译工具需求的变化,如何在成本范围之内提高效率是很多用户首先考虑的问题。互联网和计算机技术的突飞猛进,开源社区蓬勃发展,人们对开源 CAT 系统的关注越来越多,一大批开源工具如Anaphraseus、 Okapi、 OmegaT、 Open Language Tools、 Pootle、 Translate Toolkit、 Transolution和Virtaal涌现到翻译和本地化市场。由于其成本低,灵活可靠,安全性高,而且没有许可证引起的麻烦,自由和开放源码软件(FOSS)在翻译和本地化行业越来越受欢迎。同商业的 CAT 系统相比,用户几乎不需要花费任何代价,可以节省购买翻译工具的成本;开源的 CAT 系统具备商业的 CAT 系统的基本功能,如兼容 TMX 标准、模糊匹配、术语管理等,而且这些功能同封闭性的商用 CAT 系统相比具有明显的优势(张霄军等 2013:293)。从某种程度来看,开源的工具已经赶上并正在超赶商用的 CAT 系统。2010年,IBM将多年来仅供公司内部使用的 TM/2开源化,并改名为 Open TM2,兼容标准TMX格式,进一步增强了开源翻译技术阵营,给自由译者更多的选择,很大程度上打破了昂贵的商业CAT工具垄断的壁垒,进一步促进了翻译行业生产效率的提高。

4.4 “CAT+MT+PE”模式将会广泛应用

信息化时代促进了机器翻译的快速发展,机器翻译在商业翻译中广泛应用。机器翻译的主要优势体现在其批量翻译速度上,最大的不足之处是不能很好地理解自然语言,所以高质量的翻译仍需要人来主导。作为机器翻译的必要补充,译后编辑(Post-Editing)是提高机器翻译质量的重要途径。越来越多CAT工具提供商开始将机器翻译引擎内置于CAT工具之中。当翻译记忆库中没有匹配的时候,翻译记忆系统会自动调用内置的机器翻译引擎,翻译引擎快速提供备选译文,译者再根据初始译文进行编辑和加工,修改确认之后的内容可及时进入翻译记忆库,供后续循环使用。如SDL TRADOS 2011、 WordfastPro、 DéjVu X2、 MemoQ 6、 Fluency Translation Suite等CAT工具已经将Google、 Bing、 Systran、 Microsoft MT等主流机器翻译引擎内置在系统当中,为译者提供了非常有用的参考。Google Translator Toolkit是此种模式的典型代表,它不仅可用Google机器翻译直接翻译,还可支持翻译记忆和术语库,译员上传的术语库可以干涉和改善机器翻译的结果。2012年全球自由译者报告显示,54%的译者继续以某种形式在其翻译项目和与翻译有关的项目中使用机器翻译,其中32.8%是为译后编辑产生翻译初稿。(Proz 2012)

4.5 智能语言识别与翻译技术发展迅猛

在未来Web 3.0时代,语音识别和即时语音翻译技术将会极大发展,智能语音翻译及应答系统等如雨后春笋迅速蔓延移动应用市场,如Siri、 Vocre、 SayHi Translate,以及百度语音助手、搜狗语音助手、讯飞灵犀语音助手等已经深入人们的移动生活,帮助人们甩掉复杂的键盘,通过识别语音中的要求、请求、命令或询问做出正确的响应,既可克服人工键盘输入速度慢,极易出差错的缺点,又有利于缩短系统的反应时间。2012年10月,微软研究院主席瑞克·拉希德在“21世纪的计算大会”上演示了即时英译汉口译系统,利用“深层神经网络”(Deep Neural Network)技术,模拟人脑,可以将英语口语翻译成中文口语,同时也会保留语调和节奏,翻译准确率维持在80%-90%之间,这可谓是智能语音翻译发展的方向。国际上知名企业,如AT&T、Google、日本NTT DoCoMo等都在进行相似的语音识别和翻译软件开发项目。随着人工智能技术、语音识别和自动翻译系统不断整合,机器和人之间的交流将会更加自然,智能语音翻译将在信息网络查询、医疗服务、银行服务等领域以及移动翻译工作中大显身手。

4.6 云翻译技术前景广阔

随着翻译信息化程度日益深入,云计算技术迅速得到应用,对翻译行业产生了重要的影响(Muzii 2014)。云计算技术应用于现代语言服务行业,催生了云翻译技术。以云计算为依托,可快速搭建定制化的机器翻译系统,并且实现跨系统、跨设备、无安装的互联网服务访问。目前国内外很多机器翻译项目已经利用了云计算,如Google Translate Toolkit、 Microsoft Bing、 Microsoft Translator Hub、 EU LetsMT!、 Xcelerator KantanMT、 Lionbridge GeoFluent、 SDL BeGlobal等等。基于云计算的语联网技术,集成了基于云计算的计算机辅助翻译和机器翻译引擎的翻译管理平台,将“私有云”、云计算接口(API)、云共享资源平台和云语言服务产业链整合,能大幅度提升翻译生产效率,降低成本(韦忠和 2013)。云计算同智能机器翻译技术相结合,融合基于大数据建构的语义信息和深层语言学知识,将会大幅度地提升机器翻译的质量,是未来翻译技术发展强劲的驱动力。

5. 结语

现代翻译技术正在以自己的方式“挑衅”着传统的翻译世界。计算机辅助翻译技术的问世与发展,加快了翻译速度,优化了翻译流程,降低了翻译成本,提升了行业整体翻译生产效率,传统的手工翻译模式以及落后的生产工具即将被信息技术的洪流淹没,逐渐退出翻译的历史舞台。信息技术风起云涌,在云计算和大数据的驱动之下,一场新的语言技术革命浪潮已经来临,将会重塑语言服务产业链经济结构和语言服务产业增长模式。

此外,根据许钧、穆雷(2009)、文军和任艳(2011)等人的统计,我们发现研究者对翻译信息化的诸多现象和特点不甚关注,对计算机辅助翻译技术研究的深度和广度远远不够。在信息技术发展迅猛的今天,翻译的对象、流程、环境、技术等都发生了巨大的变化,翻译理论要全面发展就必须与时俱进。作为信息化时代发展的产物,计算机辅助翻译为当代译学注入了新鲜的血液,是现代翻译理论创新和发展的一个着眼点。计算机辅助翻译技术的深入研究,对于进一步认识翻译的本质,扩大翻译研究视野,拓展翻译研究范围,完善现代翻译学科建设等都具有极其重要的意义。

Bowker, L. 2002.Computer-AidedTranslationTechnology:APracticalIntroduction[M]. Ottawa: University of Ottawa Press.

Choudhury, R. & B. McConell. 2014. Translation Technology Landscape Report [OL]. [04-28]. https://www.taus.net/reports/taus-translation-technology-landscape-report.

Hutchins, J. 1986.MachineTranslation:Past,Present,Future[M]. Chichester: Ellis Horwood Limited.

Joseph, D. 2013. White House challenges translation industry to innovate [OL]. [09-28]. http://www.businessweek.com/innovate/content/oct2009/id2009101_196515.htm.

Kay, M. 1997. The proper place of men and machines in language translation [J].MachineTranslation12(1-2): 3-23.

Kenny, D. 1999. CAT tools in an academic environment: What are they good for? [J].Target11(1): 65-82.

Melby, A. 1983. Computer-assisted translation system: The standard design and a multi-level design [A]. Association for Computational Linguistics (ed.).ProceedingsoftheFirstConferenceonAppliedNaturalLanguageProceedings[C]. 174-177.

Muzii, L. 2014. Cloud translation [OL]. [07-24]. http://www.slideshare.net/muzii/cloud-translation.

Proz.com. 2014. State of the industry: Freelance translators in 2012 [OL]. [07-24]. http://www.proz.com/industry-report/2012.

Quah, C. K. 2006.TranslationandTechnology[M]. Hampshire/New York: Palgrave Macmillan.

SDL. 2013. SDL公司收购Language Weaver公司 [OL]. [09-28]. http://www.giltworld.com/E_ReadNews.asp?NewsID=689.

Somers, H. (ed.). 2003.ComputersandTranslation:ATranslator’sGuide[M]. Amsterdam/Philadelphia: John Benjamins Publishing Company.

崔启亮. 2013. 产业化的语言服务新时代[J]. 中国翻译(增刊): 33-39.

钱多秀. 2009. “计算机辅助翻译”课程教学思考[J]. 中国翻译(4): 49-53.

苏明阳. 2007. 翻译记忆系统的现状及其启示[J]. 外语研究(5): 70-74.

王华树. 2014. MTI“翻译项目管理”课程构建[J]. 中国翻译(4): 54-58.

王华树. 2012. 信息化时代背景下的翻译技术教学实践[J]. 中国翻译(3): 57-62.

王华树. 2013. 语言服务技术视角下的MTI技术课程体系建设[J]. 中国翻译(6): 23-28.

韦忠和. 2013. 语联网到底是什么?[EB/OL]. [09-28]. http://blog.sina.com.cn/s/blog_76476f1401019f3y.html.

文 军,任 艳. 2011. 国内计算机辅助翻译研究综述[J]. 外语电化教学(5): 58-62.

徐 彬. 2010. 翻译新视野——计算机辅助翻译研究[M]. 济南: 山东教育出版社.

徐 彬. 2004. 计算机技术在翻译实践中的应用及其影响[D]. 硕士学位论文. 山东师范大学.

许 钧,穆 雷. 2009. 中国翻译学研究30年(1978—2007)[J]. 外国语(1): 77-87.

俞敬松,王华树. 2010. 计算机辅助翻译硕士专业教学探讨[J]. 中国翻译(3): 38-42.

袁亦宁. 2002. 国外计算机翻译的发展和近况[J]. 上海科技翻译(2): 58-59.

张霄军等. 2013. 计算机辅助翻译: 理论与实践[M]. 西安: 陕西师范大学出版社.

张 政. 2005. 计算机翻译研究[M]. 北京: 清华大学出版社.

猜你喜欢
术语译者工具
生态翻译学视角下译者的适应与选择
译者生存与翻译存在关系的生存论建构
波比的工具
波比的工具
论新闻翻译中的译者主体性
准备工具:步骤:
“巧用”工具
元话语翻译中的译者主体性研究
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势