赵昌彦, 武 俊
(淮阴师范学院 外国语学院, 江苏 淮安 223001)
20世纪80年代末,随着第三次科技革命的迅猛发展,以计算机信息技术为代表的新兴行业逐渐兴起。传统的翻译领域开始尝试与计算机信息技术相结合,通过计算机技术来辅助翻译任务。新技术的运用极大地提高了翻译效率,给翻译界带来了一场重大的革新。中国,这一最具活力的经济体,在全球市场举足轻重。亚投行、“一带一路”、人类命运共同体……中国在发展自己的同时不断向世界贡献中国力量和智慧。为推动全球贸易的发展,中国投入大量资金引进并研发计算机辅助翻译技术,即CAT(Computer-aided Translation),用于国家间经济与文化交流所需文献资料的翻译。其中以Trados、雅信、Wordfast、DejaVu等为代表的计算机辅助翻译软件因其省时高效迅速占领了全球翻译市场。联合国、欧盟等国际组织,以及微软、大众、英特尔、华为、中兴、联想等全球大型跨国公司为提高效率,纷纷使用CAT软件进行文献间的翻译工作。CAT技术能在翻译领域的广泛运用与蓬勃发展,翻译记忆库即TM(Translation Memory)功不可没。TM作为CAT软件的核心模块CPU(Central Processing Unit),是产出高质量高数量译文的关键。然而中国译界对翻译记忆库的研究却相对滞后。有鉴于此,文章对TM技术在中国的研究情况作了仔细梳理与反思,以引起中国译界对CAT软件中CPU模块—TM研究的重视,从而带动CAT技术在整个中国翻译领域的大发展,进一步助推国家经济、贸易、文化的交流与繁荣。
翻译记忆库如同电脑的中央处理器,是诸如Trados等计算机辅助翻译软件的核心模块,是“译者运用计算机程序部分参与翻译过程的一种翻译策略”[1]。其工作原理是:“译员利用已有的原文和译文,建立起一个或多个翻译记忆库,在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如短语、句子、段落等),然后给出参考译文供译员选择, 对于给出的参考译文,译员可以完全照搬,也可以修改后使用,如果觉得不满意,还可以弃之不用。这样译员就可以避免无谓的重复劳动,专注于新内容的翻译。而翻译记忆库同时在后台不断学习并自动储存新的译文,变得越来越聪明,效率越来越高”[2]。所以,从某种程度上来说,记忆库质量的高低直接决定了译文质量的好坏。拥有门类齐全、质量上乘的记忆库可以有效提高翻译效率,降低译员及公司的翻译成本。因此,记忆库的开发及研究尤为重要。
笔者在中国知网CNKI期刊全文数据库(1998—2017年)中分别输入“计算机辅助翻译”“翻译记忆”“Trados”词频依次进行篇名、主题及关键词三种类别的精确检索,检索结果统计情况如表1所示:
表1 1998—2017年不同词频分类检索结果统计
计算机辅助翻译技术经过30多年的发展,已成为全球翻译市场的翘楚,尤其是以Trados等为代表的辅助软件更是行业的佼佼者。但是在中国译界对它的研究却相当滞后。上表中以“计算机辅助翻译”为篇名的研究文献共有105篇,而以“Trados”为篇名的仅为23篇。这与中国的经济发展水平与规模远不相称。尤其是对TM-CAT的CPU模块的研究现状更是不容乐观。笔者对20年间的研究成果用“翻译记忆”一词作了篇名的词频检索,结果25篇文献按照理论研究、技术探讨、工具介绍、教学研究、应用研究进行分类,统计结果如表2:
表2 “翻译记忆”为篇名的文献分类结果统计
1.2.1 理论层面
国内有关TM的理论研究相对薄弱。苏明阳[3]详细梳理了现有的翻译记忆系统,介绍了翻译记忆的历史与发展现状,指出当前翻译记忆技术的局限性,总结其发展趋势,并对中国翻译记忆方面的研究与应用提出建设性建议;王正[4]从语境角度研究翻译记忆的匹配机制。这些方面的研究可以拓宽我们的视界,指导我们的TM翻译实践。虽然数量很少,但意义重大。
1.2.2 技术层面
技术层面的研究体现在对TM技术具体模块功能及与平行语料库技术的对比研究及探讨方面。如武晓山[5],王正、孙东云[6],李毅鹏[7]等人主要集中探讨了平行语料库与翻译记忆库的差异。翻译记忆库具体模块功能的研究表现为:吴松林[8]探讨翻译记忆库中非标准化TMX文件格式的使用;周文、徐国梁[9]探讨了翻译记忆库中语句相似度的计算方法;徐小娟、黄新、徐帮耿[10]从语义的角度分析了翻译记忆系统的设计;徐小娟、徐国梁、黄新[11]从知识本体CSO来探讨匹配率的提高途径;赵善祥、刘万军[12]主要探讨了几种数据筛选方法来提高翻译记忆的相似度;王菁[13]探讨了影响翻译记忆中相似度的因素;塔依尔江、尼加提等人[14]探讨了维文—中文记忆库的创建与设计。
1.2.3 工具层面
工具层面的探讨主要集中在TM的工作原理、特点、应用及与MT的差异比较方面。作为Trados公司驻京代表的施韵涛[15]从翻译资料的重复率角度介绍了使用TM技术的便利性及使用TM技术的Trdoas软件的功能推介;专业译员弈风[16]则聚焦于TM系统的强大功能的介绍及其给译员所带来的巨大便利上;《中国信息界》编辑部[17]在杂志首页概述了TM技术的发展演变及其相关功能;王金铨[18]比较了MT与CAT技术中的TM的异同,着重论述了翻译记忆软件的工作原理、特点及应用;傅彦夫[19]在比较了MT与TM异同的同时着重论述了基于翻译记忆技术的几款常用软件的工作原理、特点及应用。
作为技术与工具层面的研究所占比例超过了50%以上。这一方面的研究很多涉及专业技术领域,需要专业领域及翻译行业的共同合作。对TM功能模块的探索有利于其软件系统的推广、更新与完善,从而有利于进一步推动翻译产业的发展。
1.2.4 教学层面
教学层面的研究与探讨的文献数量相对不多,反映出TM技术在教学方面研究的不足。武晓山[20]主要探讨了TM技术应用于英语专业翻译教学的必要性及对相关软硬件设施的要求;王正、孙东云[21]分析了TM技术在教学中的优势与局限性;梅冰[22]介绍了TM系统在翻译教学中的必要性、可行性、操作流程及优缺点;王梅[23]从必要性方面探讨了TM系统在教学中的应用。这些研究成果目前虽然相对较少,但是随着中国翻译本科和硕士专业的开设,这方面的研究成果会逐渐增多。
1.2.5 应用层面
TM技术在实践层面的应用研究涉及领域广泛。如《民用飞机维护领域中的机器翻译、翻译记忆与电子文档》[24]、《翻译记忆库在科技翻译中的运用以及雅信软件中翻译记忆库的评估》[25]以及吕春艳[26]探讨了翻译记忆软件在具体企业的实施方案及取得的实际效果。随着翻译记忆库的日趋完善、使用TM系统的CAT技术的不断发展及翻译本地化与全球一体化的交流与合作,TM技术在具体领域的实践应用方面的探索会越来越多。
TM作为CAT的核心模块系统伴随着CAT软件在中国的广泛使用而日益引起译界研究上的重视。从1998年到2017年的20年间,研究的重点主要集中于TM相关理论研究的探索、技术工具本身的工作原理、特点及应用介绍、TM与教学关系的磨合上以及在一些具体领域的实践应用等方面,虽然文献的数量相对较少,但是意义重大,为TM及基于TM的CAT软件在中国的发展进行了大胆有益的尝试。这些研究也暴露出TM技术一些需要改进与完善的地方,值得译界反思。
译文的质量是众多国际机构及跨国公司将翻译任务外包时对翻译公司提出的硬性要求。有的甚至直接要求外包翻译公司必须使用CAT软件进行翻译。“100%的制造业企业都会优先选择使用CAT软件的翻译服务供应商,80%以上的机械企业在翻译外包过程中要求翻译服务供应商必须使用CAT软件”[27]。之所以要选择CAT软件,他们正是看中了CAT软件的“翻译质量有效提升、翻译效率提高、解决术语统一”[28]这些功能。而完成所有这一切的前提必须得有一个高质量的翻译记忆库。翻译记忆库的获得可以通过以下几种方式:一是客户自行提供给翻译公司,翻译公司只需通过网络协同系统将之导入CAT操作平台;二是翻译公司组织人力分工协作,译前建立记忆库;三是从第三方购买记忆库;四是从公开的免费语料库平台获取。第一种情况下,利用客户提供的记忆库,译文的质量相对要高。但是,并非所有的客户都会提供记忆库给翻译公司。第二种情况下,相比较而言,会增加翻译公司的成本,同时对记忆库的质量产生某种程度上的影响。第三种情况下,由于行业保密协议及知识产权的原因,很多大公司的翻译记忆库一般都不对外公开,一些公开的要么价格不菲要么就是质量不过关。第四种情况下,记忆库的质量就更难保证了。
因此,记忆库的来源及其质量控制是摆在每一个翻译公司及个体译员面前首要的难题。由于牵涉的因素众多,不可能仅依靠某一方就能单独解决,需要各方的共同努力。中国译联可以借助行业联合会的优势整合分散的翻译行业,投入相关人力与财力加强对翻译记忆库的规范建设与有效运作。
对于翻译公司来说,无论是自主建立某个项目的记忆库抑或是从第三方购买,都是一笔不小的开支。而对于个体译员来说,成本就更高了。对于从网络免费共享语料库平台获取的记忆库资料,涉及门类旁多,需要筛查甄选、排版对齐、归类建档。后期的定期更新与维护也需要一定的人力与财力。这些也是摆在每一个翻译公司及个体译员面前的又一难题。
翻译记忆库的强大记忆功能在减轻译员繁重负担的同时,也容易使译员滋生一种对技术的依赖性,过于相信与依赖记忆库,会限制译员创造性思维的培养与发展。在教学实践中,主要表现为会限制学生主动性及创造性的发展,不利于培养适用性强的研究型翻译人才。这一点在培训和使用CAT技术时务必要明确,技术只是辅助性工具,而不应成为译员创造性思维的羁绊。
就某一翻译项目而言,翻译记忆库要么是客户提供给翻译公司或个体译员,要么就是翻译公司或个体译员自行组织人力在译前或译中构建。当该翻译项目结束时,就会产生翻译记忆库版权归属的问题。翻译记忆库的版权到底是属于翻译公司或个体译员,还是属于客户,往往会产生法律纠纷。一些大型跨国公司或国际组织出于行业保密的原因,往往会和翻译公司或个体译员签订保密协议,要求他们删除或不允许在其他项目中使用自己提供的翻译记忆库。但翻译公司或个体译员自行构建的记忆库能否在以后的其他类似翻译项目任务中使用,是一个急需解决的问题。翻译记忆库版权归属问题解决的妥善与否直接影响着翻译记忆库长远的建设与发展。
CAT技术作为一种全新的翻译形式,自20世纪80年代产生以来,解决了传统人工费时低效甚至不可能完成的“互联网+”大数据时代的翻译任务,极大地减轻了译员的负担,提高了翻译效率,创造了巨大的经济效益,增进了国家间的融合与发展。虽然对于CAT技术核心CPU模块—TM的研究尚有不尽如人意需要改进与提高的地方,但是相信在广大技术研发人员、语言工作者及所有相关部门的共同努力下,其建设与维护会日趋完善,它也会为国家间经济文化交流提供更大的助力。