◆周兴华
(鲁东大学外国语学院)
教育部2006年批准设置翻译本科专业(BTI),2007年批准设置翻译硕士专业学位(MTI),之后不少高校在本科阶段开设了《计算机辅助翻译》课,这符合翻译本科阶段的培养目标“……能熟练运用翻译工具,了解翻译及其相关行业的运作流程……”翻译专业硕士的培养目标强调“高水平、应用型、专业性”,计算机辅助翻译被列为一门选修课。如今翻译公司招聘或现代语言服务人才素质要求都包括计算机辅助翻译工具的使用能力。
雪人CAT是一款国产计算机辅助翻译软件,分为免费版、标准版、服务器版。官网提供免费版、标准版升级文件、标准版操作手册以及中文视频教程下载。相较于其它主流 CAT 软件,如 SDL Trados,Déjà vu,Wordfast,memoQ,雅信CAT等,雪人CAT的学习曲线并不陡峭,但功能又毫不逊色,加上软件本身的人性化设计和简单易用的特性使它成为CAT教学的首选入门软件。本文拟对雪人CAT 1.29中英标准版的特色功能做一系统的评析,以期为《计算机辅助翻译》课堂教学提供参考。
雪人CAT即雪人计算机辅助翻译软件(Snowman Computer Assisted Translation Software),是一款充分利用计算机的超强运算能力、记忆能力和人的创造能力相结合的人机交互的辅助翻译软件。与其它CAT软件一样,雪人CAT也是由译员把握翻译质量,计算机提供辅助,能够优质、高效、轻松的完成翻译工作。下面笔者就对雪人CAT 1.29中英标准版的特色功能做一系统的评析。
雪CAT创建项目的操作非常简单,一般一遍之后便能清楚的记住。安装雪人CAT中英标准版后,双击桌面的快捷键图标即可打开软件。在菜单栏单击文件-新建即可创建项目。雪人CAT提供了三种项目供译者选择:英译中项目、中译英项目、双语对齐项目。英译中项目和中译英项目只是原文语言与译文语言不同而已,双语对齐项目可以创建翻译记忆库。
首先以英译中项目为例,点击确定后,会弹出项目设置窗口。记忆库最小匹配度默认为最小值0.5,最大值为1,译员可以根据需要调整,增大数值则匹配度增加。将默认的不使用在线词典前面的勾去掉,同时勾选首字母大写和识别大写词语。标准版携带60个专业1200万词汇的系统词典,译员可以根据原文的专业领域勾选不同的专业词典,非常方便。用户词典可以添加雪人格式的词典(DIC)。记忆库设置可以添加雪人格式的翻译记忆库(STM)。添加多个词典或记忆库时,优先级由上到下排列,即排在最上面的优先级最高。特别注意这里添加的是外部词典和外部记忆库,不是新建项目的项目词典和项目记忆库,翻译时不能实时更新,软件通过引用的方式来使用它们,这样做的好处是可以减少项目文件的大小和对系统资源的占用。这也是雪人CAT翻译记忆库的一大特色。
完成上述设置,软件会自动生成一个项目文件、一个项目词典、一个项目记忆库。右击项目文件,弹出导入文件对话框,可以导入原文。一个项目文件最多可以导入200份原文。原文的格式可以不同,比如Word,PPT,Excel等。新建的项目词典和项目记忆库是空的,可以分别右键导入词典和记忆库。导入的速度极快,且能删除重复的句子或词语。但笔者建议尽量通过“添加”引用外部的词典和外部的记忆库,而不要“导入”项目词典和项目记忆库,原因前文已说,不再赘言。项目设置完之后,还可以通过菜单栏上的项目管理-项目设置进一步修改调整。
总之,雪人CAT创建项目的过程十分简单,加上导入的速度快,还可以使用添加的方式引用外部词典和记忆库,所以大大减少了创建项目的时间,提高了工作效率。
左键单击原文,即可打开翻译工作区,默认输入界面是对照模式,即原文、译文以左右对照的表格方式排列,这种界面简洁高效、条理清晰,对审稿、校稿尤其方便。另一种输入界面是单句模式,在该模式下可以预览原文、译文,也可以自动取词翻译,鼠标点击即可输入译文,减少了击键次数。这种界面直观、整体性强,对样式复杂的文档和公式、化学式等尤其适用。这两种模式可以随时切换,软件会保持当前的翻译位置不变,但拆分句子、合并句子只能在对照模式下进行。
真正逐句翻译之前,有3个工作要做:预翻译、预提取字体样式、词频统计。预翻译既是将待翻译原文与翻译记忆库中的翻译单元(Translation Units)对照,看100%匹配的情况。100%匹配的句段即是不需要翻译的内容,匹配率越高则译员需要翻译的内容越少。因此,预翻译对于客户报价,译员工作量统计都非常有意义。预提取字体样式,是在原文格式比较复杂的情况下,译前一次性的提取所有的字体样式,翻译的时候样式控制码就很少,也不存在任何的等待时间,因为如果没有预提取字体样式的话,翻译句段时会逐句自动提取字体样式,但往往会有短时的等待。需要注意的是该功能只用于提取字体的样式,对于图片等其它样式在导入时就已自动处理,而且该功能只对Word 2007及以上版本才有效,对于Word 2003版无效。这样就能保证导出的译文在格式上和原文完全一致。词频统计将原文中高频词统计出来,可以提前统一译法,从而提高了翻译效率和质量。
无论是传统的翻译方式还是使用普通CAT软件进行翻译,译者都离不开词典、在线翻译和在线搜索引擎。雪人CAT在翻译工作区下方集成了自动翻译、在线词典和在线搜索。自动翻译即机器翻译,雪人CAT嵌入了Google,Bing,Youdao,Baidu等多个自动翻译引擎,逐句自动给出“在线自动翻译”的译文供参照。前面提到雪人CAT标准版自带60多个专业,1200万词汇的系统词典,雪人CAT还嵌入了Bing,BaiduDict,Youdao,iCIBA等10多个在线词典,译员只要在原文处划选某词语后,立即会显示查找的结果,点击即可切换到其它在线词典查看。雪人CAT还嵌入了Google,Wikipedia,Baidu,Hudong等在线搜索引擎,查找与原文相关的信息非常方便,不用再另外打开浏览器,如果嫌窗口太小,双击在线词典或在线搜索标签后窗口可以扩展到全屏,设计非常人性化。
逐句翻译时,疑难词汇可以通过系统词典的智能屏幕取词功能结合在线词典共同解决,背景信息可以通过在线搜索解决,记忆库根据匹配值提供参考译文,自动翻译则逐句自动提供参考译文。由于记忆库完全匹配的句段并不多,因此雪人CAT还增加了一个片段搜索功能,只需用鼠标在原文划选某片段后,在下方的片段搜索窗口立即会显示出搜索的结果,搜索结果还提供了两种显示模式:列表模式(List Mode,L)和文本模式(Text Mode,T),列表模式显示的句段多,文本模式能够完整显示句段信息。以上全部翻译辅助功能都在同一个翻译工作区显示,在保障翻译质量的同时,大大提高了翻译效率。
尽管雪人CAT在导入原文时对句子进行了非常准确的划分,但翻译时还是会发现个别句子需要合并或拆分。前文提到合并和拆分句子都需要在对照模式下进行。把光标移到需要拆分的地方,按Enter键,就把当前的句子拆分为两个句子;把光标移到需要合并的第一句话的末尾,按Delete键,就把当前句和下一句合并成了一个句子。这对于熟悉电脑操作的用户来说再熟悉不过了。
翻译过程中,定义术语与定义新词也是非常必要的。术语一般是指专业的词汇,也是整个翻译项目中需要统一译法的词,一般情况下一个术语只对应一种解释,定义为术语的词在翻译时会以蓝色提示,同时也会自动出现在右侧的术语提示区。定义新词指的是定义为普通的词汇。定义新词有两种方法,第一种方法分别在原文和译文区划选对应的词语和意思,然后到屏幕的右下方按定义新词按钮即可;第二种方法对照模式下在原文区划选词语或单句模式下在词语自动翻译区划选词语,下方的自动翻译窗口立即出现其译文,不准确还可以修改,按自动翻译窗口右边的定义新词按钮即可。定义术语有三种方法,第一种方法类似于定义新词,在原文和译文分别划选词语和意思,然后到屏幕的右下方按定义术语按钮即可;第二种方法点击屏幕左侧的项目词典,选择要定义为术语的词汇,按F5键即可;第三种方法直接在项目词典上点右键-设为术语,则整个项目词典里的词汇被定义为术语。项目词典里术语以粗体显示。原文翻译完后,可以在项目词典上点右键,将添加的术语和新词导出DIC格式的词典文件,以后可以通过添加或导入的方法供新翻译文件使用。
翻译时,译者可能会感觉原文和译文的字号较小,希望调大,这时可以点击菜单栏上的工具-软件设置。向右拖动滚动条可以使字体变大,但需要重启软件后才能看到效果,如果能即时看到字号大小变化就更方便了,这算是雪人CAT的一点不足。在字体大小的右边,是自动保存时间间隔默认是10分钟,但只有译者在将项目存盘后,自动保存才起作用,否则到时间后会弹出自动保存提示窗口“当前文件未保存,自动存盘功能在存盘后生效”。软件设置中的其它选项,如以文本方式显示搜索结果、精确匹配时自动填写译文、显示单行对比窗口,译者可根据实际需要选择。这里提示一点,单句对比功能采用一一对应的显示方式,可以非常清晰的对比当前句子与记忆库中句子的异同。可以在菜单栏的视图中选择打开单行对比,也可以在软件设置窗口将其设为默认打开选项。
雪人CAT另外还有几个与翻译相关的特色功能。(1)利用剪切板翻译各种格式的文档,比如网页、PDF、PPT等一切可以编辑的文件格式(即任何可以复制、粘贴出来的内容)。雪人CAT工具栏上有三个剪切板常用按钮,粘贴为新文件、粘贴内容、导出到粘贴板。三个按钮功能相当于导入新文件、增加原文内容、导出译文。该功能确实非常的方便。(2)EBMT(Example-Based Machine Translation,基于实例的机器翻译)和TM(Translation Memory,翻译记忆)两种技术相集合,使翻译记忆库的作用充分发挥。既能实现一般的替换翻译,也能实现增词替换翻译和减词替换翻译,还能创建高质量的模版型记忆库。(3)词语的整批替换,在雪人CAT的菜单栏上点击词语管理-查找和替换,查找和替换窗口即被打开。在原文查找框内输入要查找的原文,在译文查找框内输入对应的译文,点窗口右下方的搜索,则符合条件的句子都列出来了。此时更换译文,点窗口右下方的译文替换,则可以整批的替换原来的译文。(4)正则表达式,词语的整批替换只是对简单的词汇进行查找、替换,还有一个更强大的查找功能是正则表达式,它是用于描述查找符合某些复杂规则的字符串的代码。利用正则表达式可以实现复杂条件下的精确查找。雪人CAT中用到的正则表达式相对比较简单。限于篇幅这里就不举例说明了。
在系统词典、在线词典、记忆库、自动翻译、在线搜索、片段搜索的辅助下,原文大都会优质、高效、顺利的翻完,但原文翻译完之后的质量检查和译文审校也是不容忽视的重要环节。雪人CAT提供了非常强大的质量检查功能。点开翻译工作区下方的质量检查标签,就能看到检查的具体项目:术语、拼写(未识别词和错词)、样式码、非译成分(数字、符号、网页地址、电子邮件)、标点符号(句尾和匹配)、译文长度(未翻译、长度比例、忽略序号)、一句多译、忽略已校对的例子等。检查涉及到译文的方方面面,很多工作堪称细微但又极其重要,而全靠译员又往往疲于应付,所以如此细致的质量检查使译稿的质量更有保障。
具体操作也很简便。在质量检查窗口上方有3个按钮,分别是向前检查、向后检查、校对词典。建议译者在完成整篇翻译之后,再打开质量检查窗口,单击向后检查,雪人CAT便开始逐句检查有问题的句子,光标停在有问题的句子上,译者修改错误后,再点击向后检查按钮,直接跳到下一个有问题的句子。
质量检查是CAT软件来查找问题,但审校却是要由人来完成。如果说质量检查是处理客观技术性问题,那么审校就是处理主观创造性问题,译员翻译完后将项目文件发给审校人员进行审核。雪人的项目文件包括在翻译过程中形成的项目词典和项目记忆库等。审校人员打开项目文件,如果觉得当前句段的译文准确,就可以按下F9键,在该句段的第一列(状态列)出现一个绿色的√,表示审校通过;如果感觉译文有问题,则按下F4键,在当前句段的第一列出现一个红色的X,表示审校未通过,同时可以在备注列里写明未通过的原因。审校结束将项目文件重新发回给译者。译者打开该项目文件,根据第一列的图标及备注信息修改错误,某句段的错误改正后按F4键,原来的X变成黄色图标,表示修改完成,按Ctrl+N可以直接跳到下一个红色X的位置直接修改,非常方便。
翻译完且经质量检查和审校无误的译文就可以导出了。点开项目文件,在翻译完的文件上点右键,在弹出的窗口可以看到雪人提供了三个选项:导出译文、导出双语对照文件、导出编译文本。导出译文就是单纯将翻译完的译文导出来,另存为Word格式。导出双语文件又有四个选项:段落对照Word文件、句子对照Word文件、Unclean格式双语文件、HTML文件。段落对照格式和HTML(网页对照)格式的双语文件非常方便校稿。Unclean格式是与TRADOS兼容的双语文件。导出编译的文本就是导出已翻译的译文,不一定是全部译文。有时需要了解原文的概要信息,只需将相关的句段翻译出来即可,导出编译文本时只导出翻译的译文,未翻译的句段不会保留原文导出。
CAT软件要充分发挥作用离不开专业化、高质量、大型翻译记忆库的支持。翻译记忆库既可以通过译员个人翻译逐渐积累,也可以直接将自己已翻译过的或是收集到的他人的双语文本制作成翻译记忆库。主流CAT软件都集成了双语对齐工具,雪人CAT也不例外。雪人CAT的双语对齐功能非常强大,利用它可以很轻松的创建大型记忆库。
启动雪人CAT,依次点击菜单栏上的文件——新建——双语对齐项目。此时会弹出同新建翻译项目一样的“项目设置”对话框,这里可以直接按确定。此时弹出“导入双语文件”对话框。默认的对齐项目名称为align,译者可以根据实际情况更改。左侧是英文对齐框,右侧是中文对齐框,最右边是读入英文、读入中文、双语粘贴、导入双语等按钮。最底部是使用词典辅助对齐、识别软回车、使用段落信息、不合并句子选项,译者可以根据具体情况选择,恰当选择比不选择的对齐效果要好很多。
读入英文和读入中文适合中英完全分开的文章的对齐,比如一篇英文原文,一篇中文译文,将这两篇文章进行句级对齐的情况。双语粘贴适合中英混排在一起的文章对齐,全选复制后按双语粘贴按钮,雪人CAT会自动将混在一起的中英句子分开。导入双语适合处理其它CAT软件(如Trados和雅信格式)的译稿,将翻译过的文件直接导入进行句级对齐。三种情况导入后,直接按确定,自动对齐工作瞬间完成,对齐的准确率非常高。
尽管雪人CAT的自动对齐效果惊人,但也不都是百分之百的准确,有时还是会出现不正确的情况,这时就需要译者人工修正。自动对齐后的原文、译文都可以再修改、编辑。断句、合句与前文翻译项目中的处理方法一样,首先将光标插入需要断句的地方,然后按Enter键即可。但此时的译文并没有发生改变,所以还需要在译文对应的位置插入光标并按Enter键将译文也断开。左右两边对齐后还可以按F9键将两句锁定,这时句段前会出现一个√,表示该句段已经锁定,左右会一起移动,不会再错位移动了。选中某句段后按F2键,该句段变成蓝色长光标浏览状态,按Delete键可以整行删除;或者按F4键句段前出现X,表示该句不会导出到记忆库中。
双语对齐项目的最后一步也是导出,可以导出记忆库,也可以导出双语对照文件。在对齐后的文件上点右键-导出记忆库,可以保存为四种格式:STM(雪人格式记忆库)、TMX(CAT软件记忆库标准格式)、XLS(Excel格式)和TXT(文本文件格式)。为了保留原文的顺序和篇章的整体性方便日后的阅读,雪人CAT支持导出双语对照文件,导出的文件是HTML格式,可以直接用IE等浏览器打开,也可以用EXCEL打开。
C.K.Quah提到翻译软件的评估标准包括几个“hows”和“whats”,国产雪人CAT软件都有上佳的答案。雪人CAT的操作比较简单、界面友好,较短时间内就能学会使用,与其它软硬件的兼容性很好。软件各功能界面的设计也很合理。软件更新较快、升级简便。对系统要求不高,但处理文件的速度很快,稳定性超强,价格还不贵。全中文的界面、人性化的设计、简单易操作的特点和毫不逊色的强大功能,使其作为入门CAT软件教学的首选。课堂讲授雪人CAT可以同时解释CAT相关的术语,比如翻译记忆、术语库、对齐、预翻译、完美匹配、模糊匹配等。也可以将雪人CAT的翻译辅助功能和传统的全人工翻译过程进行比较,可以看出作为一个集成的翻译工作平台,雪人CAT集成了传统翻译时需要的全部功能,如词典、机器翻译、搜索引擎等。合理设计安排雪人CAT演示讲解的步骤,可以使学生了解专业译者或自由译者完整的翻译工作流程,充分体现CAT软件的功效。由于水平有限,文中错失之处在所难免,恳请专家、同行批评指正。
[1]穆雷.高等学校翻译专业本科教学要求.中国翻译,2011,(3).
[2]仲伟合.翻译硕士专业学位教育点的的建设.中国翻译,2007,(4).
[3]文军,穆雷.翻译硕士(MTI)课程设置研究.外语教学,2009,(4).
[4]雪人计算机辅助翻译(CAT).
[5]C.K.Quah.Translation and Technology翻译与技术.上海:上海外语教育出版社,2008.