张旭 姜诚
【摘 要】进入21世纪以来,科技的飞速发展带动着CAT工具的不断发展。而作为译员在享受着便利的同时,也面临着翻译效率的挑战。本文从软件对比的角度出发,基于计算机辅助翻译软件对文本格式的转换,以SDL Trados 2014、memoQ 2015、Déjà Vu X3这三款主流翻译软件为例,比较其在处理文本格式时的优势和劣势,试图为译员和语言服务商在选择CAT工具时提供参考。
【关键词】CAT工具;文本处理;软件对比
中图分类号:H059 文献标志码:A 文章编号:1007-0125(2017)23-0205-02
译前编辑是指在机器翻译之前对需要翻译的文本或文档进行有针对性的修改编辑以提高机器翻译产出的质量(冯全功等,2017:63)。如今市面上的计算机辅助翻译工具如雨后春笋般不断涌现,这些CAT工具在相当程度上帮助译员提高了翻译效率,加速了翻译流程。但正如《软件本地化》(王华伟、崔启亮,2005:268-293)一书中第十三章提到的翻译质量控制问题,本文同样发现如今种类繁多的文件格式所带来的格式转换问题在不断影响着译文质量。虽然现在市面上的CAT软件可以兼容多种文本格式,但并不都能完美地转换各种文本格式。许多经验不足的新译员往往会因为这些问题而困扰。因此,针对CAT工具处理文本格式的比较研究非常具有价值。
一、计算机辅助翻译工具
计算机辅助翻译工具是运用计算机技术来提高译员的翻译效率和译文质量,人在这一过程中仍然起着决定性的作用(朱玉彬等,2013:69)。从广义上来说,计算机辅助翻译工具是指所有能够帮助翻译人员进行翻译的计算机工具,其中包括文字处理软件、语法检查软件、电子邮件和互联网等(Bowker,2002: 6)。从狭义上来说,它“专指为提高翻译效率,优化翻译流程而设计的专门的计算机翻译辅助软件”(徐彬等,2007:79)。
(一)广义上的计算机翻译工具
1.OCR软件。OCR即光学字符识别(Optical Character Recognition)。对于许多译员来说,在翻译时不少情况下拿到手上的是原文件是纸质版或者是由相机、扫描仪识别出的图片。由于无论是相机还是扫描仪识别出的图片都无法直接使用CAT工具进行翻译,而手动输入的方式又费时费力。因此,译员则需利用OCR软件的图像文字转换功能,将图片中的文字转换为可编辑的状态。国内目前OCR软件中,汉王和文通这两款OCR软件在汉语识别方面独树一帜。而本文中使用的则是应用最为广泛的ABBYY FineReader 12以及Nitro Pro 10。
2.在线翻译软件。如今在线翻译软件几乎成了人手必备的一种翻译工具,得到了不少翻译初学者的喜爱。与传统的电子辞典或下载使用的翻译软件相比,这类在线翻译软件无需使用者下载便可进行使用。常见的在线翻译软件有:有道词典、金山词霸、Google翻译等。使用便捷、无需注册激活、在翻译简单文本时较为精准,不少还可在没有网络的情况下单机使用。这些在线翻译软件因而得到了翻译初学者的广泛使用。
(二)狭义上的计算机翻译工具
专业翻译软件的出现可追溯到上个世纪70年代,不过真正意义上的投入市场是上世纪90年代。目前国际上较为知名的计算机辅助翻译软件有:SDL Trados、Wordfast、Deja Vu、memoQ等。随着上个世纪末国外大批计算机辅助翻译软件进入市场,中国也有许多公司推出了自己的计算机辅助翻译软件,雅信CAT于1999年出现在了国内市场上,随之而来的是雪人CAT、传神、Transmate等国产计算机辅助翻译软件的出现。根据2013年由专业译员网站proz.com关于译员CAT工具使用情况的调查问卷(图1),国外目前最广泛使用的翻译软件有:SDl Trados、Wordfast、memoQ、Deja Vu、Across等。而本文主要比较的是使用较多的三款:SDL Trados 2014、memoQ 2015和Déjà Vu X3。
图1 译员CAT工具情况
二、比较基础
目前已有诸多国内外学者针对计算机辅助翻译工具作了很多有价值的研究。例如:Kenny(1999)和Bowker(2002)介绍了计算机辅助翻译和CAT工具的基本定义;吕立松等(2007)从CAT教学与翻译市场需求相结合出发,指出新时代的译者应该关注翻译市场,熟练掌握各种翻译工具,以更好地适应翻译市场的要求;高志軍(2013)针对计算机软件的质量评价模型和计算机辅助语言教学软件的评估进行了研究。但这些研究在CAT工具文本转换方面却鲜有探究。因此,本文打算以译员常见有关文本转换的问题为出发点,结合笔者CAT工具使用经验来比较上述CAT工具的优缺点。以便为译员在选择CAT工具时提供帮助。
三、不同CAT工具在文本转换时的比较
(一)PDF格式的转换
SDL Trados 2014、memoQ 2015和Déjà Vu X3均可兼容多种文本格式并可按照原文的排版输出译文。通常情况下,这几款CAT工具处理Word、Excel等格式通常不构成问题。因此,本文选取了一份扫描版的PDF文件以考察这几款CAT工具对原文的识别,句段切分以及译文的版式等。
如图2所示,本文选取的原文件的格式为PDF。而由于SDL Trados 2014、memoQ 2015和Déjà Vu X3这三款软件均支持PDF,所以在这三款软件中直接导入原文件(所有项目名均为例一)。但将PDF格式的原文件直接导入后,三款软件均无法识别出原文。
图2
三款软件的翻译编辑器界面只能显示“Scanned by CamScanner”(扫描软件CamScanner的水印)。故分析主要原因应为原文在扫描时所采用的OCR软件与主流CAT所采用的扫描插件不同。因此,决定先使用OCR软件对原文件进行格式处理,本文先选用的是ABBYY Finereader 12这款OCR软件,在将原PDF分别导入该软件并转换为doc格式。在使用ABBYY Finereader 12处理原文时,本文发现无论是将原文中的化学式区域设置为图片还是文本进行读取,ABBYY Finereader 12都无法识别出化学式。于是本文使用Nitro Pro 10来对原文进行处理,而从观察Nitro Pro 10转换出的doc文件结果,Nitro Pro 10可以很好地识别出原文件中的化学式。
将由Nitro Pro 10转换出的doc文件分别导入SDL Trados 2014、memoQ 2015、Déjà Vu X3中,三款软件的编辑器均能正常识别出原文内容,可直接進行翻译。
在本文所使用的原文中,还有类似的化学式。如果不使用OCR软件进行译前处理,而是直接导入到CAT工具中,都出现了原文无法正常读取的情况。因此,译员需要根据原文件的格式和内容来确定是否对原文进行译前处理。这一点对于译员之后的翻译进度和能否按时交付有很大影响。
正如本文所对比的两款OCR软件ABBYY Finereader 12与Nitro Pro 10一样,没有一款软件可以做到尽善尽美。SDL Trados 2014,Déjà Vu X3,memoQ 2015这三款深受欢迎的CAT工具,虽然都能兼容各类文本格式,然而,这并不意味着这三款CAT工具能够完美解决译员翻译时遇到的各种文本处理问题。作为译员,在翻译过程中如果遇到软件无法直接识别复杂文本的情况,应当灵活选择其他适合的辅助软件来解决问题,完成任务。
(二)句段切分
在使用CAT工具时,工具首先会使用“文件过滤器”将原始文件中需要翻译的内容抽取出来,并对抽取出来的内容进行句段切分(高志军,2013:70)。而句段的切分和译员的翻译速度有直接联系。本文继续以图1所示的PDF扫描件为例,比较三款CAT工具对于句段的切分。
上述文件在三个软件当中产生的格式码的数量大致相同。但按原格式码完成翻译后,三款CAT工具输出的译文在版式上却存在着明显区别。由于原PDF文件的句段有许多是由硬回车切分的。而CAT工具则以句段为翻译单位,因此如果原文硬回车切分句段较多,译员则需调整翻译编辑器中的句段的顺序。
但本文在使用Trados 2014的过程中发现,即使在项目设置中勾选了“允许编辑原文”选项后,翻译编辑器内由硬回车切分的句段仍然无法合并。而Déjà Vu X3和memoQ 2015对句段处理给予了较高的自由度,译员可以灵活切分硬回车句段。因此,Déjà Vu X3和memoQ 2015导出的译文格式比Trados 2014导出的译文格式更清晰。译员在使用Trados 2014处理硬回车问题的时候,只能对原文硬回车句段进行译前处理或对导出译文进行译后处理。在句段合并这一方面,Trados 2014较其他两款CAT工具还需改进。
四、结语
在科技飞速发展的时代背景下,译员面对不断推陈出新的各类CAT工具时,应当通过比较CAT工具的优缺点来选择真正适合自己的CAT工具。在翻译过程中,应根据所使用CAT工具的特点,结合如OCR软件、音频识别软件等辅助软件对原文进行相应的处理,从而保质保量地完成客户的翻译任务。总之,本文所对比的三款CAT工具,都能有效地帮助译员提高翻译效率,解决某些复杂文本格式的问题。但这些CAT工具在处理这些复杂文本格式时也不是万能的。作为译员,面对翻译流程的不断加快和日益严格的客户要求,应当学会灵活应用其他的广义上的计算机辅助翻译工具来帮助自己提高翻译效率及自身的竞争力。
参考文献:
[1]Bowker,L.Computer-aided Translation Technology:A Practical Introduction[M].Ottawa:University of Ottawa Press,2002.
[2]Kenny,D. CAT tools in academic environment: What are they good for? [J].Target,1999(1).
[3]冯全功,高琳.基于受控语言的译前编辑对机器翻译的影响[J].当代外语研究,2017(2).
[4]高志军.计算机辅助翻译工具测评框架初探[J].中国翻译,2013(5).
[5]吕立松,穆雷.计算机辅助翻译技术与翻译教学[J].外语界,2007(3).
[6]王华伟,崔启亮.软件本地化[Z].北京:电子工业出版社,2005:268-293.
[7]徐彬,郭红梅,国晓立.21世纪的计算机辅助翻译工具[J].山东外语教学,2007(4).
[8]朱玉彬,陈晓倩.国内外四种常见计算机辅助翻译软件比较研究[J].外语电化教学,2013(149).