翻译记忆技术助力下的航空文本翻译

2024-06-26 13:57华道阳胡妮
电脑知识与技术 2024年14期

华道阳 胡妮

摘要:文章探讨了翻译记忆技术在航空文本翻译中的应用,以航空文本《2021年民航行业发展统计公报》为翻译实例,使用计算机辅助翻译工具SDL Trados,展示了翻译记忆技术在航空文本翻译中的实操步骤,包括翻译记忆库的建立和应用,证明了翻译记忆技术有助于提高翻译的效率。文章旨在为航空领域的译者和研究者提供一定的参考和借鉴,同时也为翻译技术的发展和推广做出一定贡献。

关键词:翻译记忆技术;SDL Trados;航空文本翻译

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2024)14-0120-03 开放科学(资源服务)标识码(OSID) :

0 引言

翻译记忆(Translation Memory,TM) 技术是计算机辅助翻译(Computer Aided Translation,CAT) 技术的主体[1],它可以存储和重复使用以前翻译过的文本句段,从而提高翻译的速度、质量和一致性。翻译记忆技术已经广泛应用于各个领域的专业翻译,如法律、医学、工程、商务等,为译者和客户带来了诸多好处。然而,翻译记忆技术在航空文本翻译中的应用却鲜有研究,由于航空文本具有高度的专业性、规范性和重复性,由此,非常适合使用翻译记忆技术来提高翻译效率和质量。航空文本的翻译对于促进国际航空合作、保障航空安全、推动航空发展具有重要的作用。然而,航空文本的翻译也面临着一些挑战。航空文本的翻译不仅要面对航空术语的多种多样和复杂难懂,还要应对航空文本的数量庞大和更新频繁等问题。因此,航空文本的翻译需要借助先进的翻译技术,如翻译记忆技术,来提高翻译的效率和质量,保证翻译的一致性和准确性。本文首先对翻译记忆技术进行了相关概述,然后对计算机辅助翻译工具的选取进行了说明,最后以《2021年民航行业发展统计公报》[2]为翻译实例,介绍了使用SDL Trados建立和应用翻译记忆库的详细过程,并通过文本中的具体案例展示翻译记忆库是如何在翻译过程中提高翻译效率的。

1 翻译记忆技术概述

翻译记忆技术利用已有的原文和译文,建立一个或多个翻译记忆库,用于存储和重用之前翻译过的文本(如句子或段落)。翻译记忆库是一种“用于储存原文本及其译文的语言数据库”[3]。翻译记忆技术充分利用了数据库的强大功能,注重提高已有翻译资料的复用,从而无需重复翻译相同或相似的内容。因此在资料重复度高达20%~70% 的专业翻译领域中,翻译记忆能大量消除译者的重复劳动,避免相同句子出现多种翻译结果,极大地提高了工作效率[4]。翻译记忆的基本原理是:根据输入内容在翻译记忆库中检索与其最相似的句子,并将该句子的翻译,作为参考翻译提交给译者进行后编辑[5]。它的主要优点是可以提高翻译的速度、质量和一致性,以及降低翻译的成本。

翻译记忆技术主要涉及文本句段的划分、存储和匹配,一般都遵循以下几个步骤:1) 划分:将原文和译文按照一定的规则或算法切分成若干个句段,通常以句子为单位,也可以是段落等;2) 存储:将切分好的原文和译文以一定的格式存储在翻译记忆库中,形成一对一的翻译单元。常用的格式有 TMX格式(翻译记忆交换格式),可以实现不同系统之间的兼容和转换;3) 匹配:当译员在翻译一个新的句段时,系统会根据一定的算法或标准,从翻译记忆库中检索出与之相同或相似的句段,并给出相应的译文。相似度通常用百分比表示,100% 表示完全匹配,低于100% 的表示模糊匹配。译员可以根据需要接受、修改或拒绝系统提供的译文。

翻译记忆的研究和应用已经有了几十年的历史,目前已经成为计算机辅助翻译的主流技术之一,广泛应用于各种领域和场合,如技术文档、法律文本、网站本地化等。翻译记忆的发展也面临着一些挑战和问题,例如,如何提高翻译记忆库的质量和覆盖率,如何与其他技术(如机器翻译、术语管理、语料库分析等)结合和协同,如何适应不同的语言和文化等。

2 计算机辅助翻译工具的选取

研究选取SDL Trados作为计算机辅助翻译工具,主要基于其在专业领域翻译中的广泛应用以及其对于航空文本翻译的显著应用优势。根据王华树在2018年—2019年展开的一项问卷调查结果显示,译员目前使用最多的三款CAT 工具依次为SDL Trados、memoQ 和Déjà Vu,分别占比53.71%、25.52% 和18.4%[6],可见SDL Trados最受译员的欢迎。作为一款被众多专业翻译人员和翻译公司信赖的翻译工具,SDL Trados在各行业中积累了丰富的经验。其成功应用于航空、医学、法律等领域,尤其是在处理大规模项目和专业术语时表现出色。对于《2021年民航行业发展统计公报》这样包含大量专业术语和存在一定行业标准的文本,SDL Trados的专业性和可靠性使其成为优选工具。

SDL Trados在航空文本翻译中的显著应用优势表现为它的翻译记忆功能可以极大地提升航空文本的翻译效率。航空类文本经常包含大量重复或相似的内容和术语,而SDL Trados能够存储并重复利用先前翻译过的内容,从而提高翻译效率。这不仅减少了翻译人员的工作负担,还确保了文本中相同表达的一致性。

因此,鉴于SDL Trados在专业领域的广泛应用和其强大的翻译记忆功能,在此次针对翻译记忆技术在航空文本翻译中的应用的探究中,笔者认为它能够提供高效和可靠的工具和技术支持。

3 翻译记忆技术的在航空文本翻译中的实际应用案例

翻译记忆技术的实际应用流程主要包括翻译记忆库的建立和应用。翻译记忆库的建立需要对原始文本进行对齐和存储,以形成翻译单元。翻译记忆库的应用需要利用计算机辅助翻译软件将源语言文本与记忆库中的翻译单元进行比较,找出最合适的翻译候选项。

3.1 翻译记忆库的建立

在对《2021年民航行业发展统计公报》展开翻译之前,需先将在《2020年民航行业发展统计公报》的中文版本和官方英文译本制成翻译记忆库。 具体步骤包括:1) 格式转换;2) 文本清洗;3) 新建翻译记忆库;4) 导入双语文件;5) 对齐。以上五个步骤的具体说明如下:

格式转换:由于《2020年民航行业发展统计公报》为PDF格式的文件,但并不是所有PDF文件都能被SDL Trados完美识别和处理,而PDF转换为Word格式可以确保文件在SDL Trados中的兼容性,因此可使用合适的格式转换工具将其转换为Word格式,从而更好地保留原文的格式和结构。

文本清洗:文本清洗是指对文本数据进行预处理,去除其中无用或者冗余的部分,避免影响翻译记忆库的整洁性。文本清洗包括去除HTML标签、特殊符号、空格等非文本内容以及图表等无法导入翻译记忆库的内容;

新建翻译记忆库:点击SDL Trados“翻译记忆库”视图下的“新建”选项,在“新建翻译记忆库”界面设置记忆库名称、存储路径、源语言和目标语言,最后点击“完成”。在此次翻译项目中,该翻译记忆库的名称为“民航行业发展统计公报TM”。

导入双语文件:在“对齐文档”模块下点击“对齐单一文件对”,导入待对齐的源文件及目标文件,即《2020年民航行业发展统计公报》的中文版本和官方英文译本。

对齐:在完成“导入双语文件”操作后,翻译记忆库中会呈现左右对照的原文和译文格式。通过“红色”“黄色”“绿色”的虚线条呈现自动对齐的结果。其中,红色、黄色和绿色分别代表对齐质量“较差”“一般”“良好”。对于质量较差或一般的对齐句段,应先点击“断开连接”操作,然后再“重新连接”。连接方式为分别点击左右两侧“序号列”,再点击“连接”,即可将两侧意思对应的原文和译文连接在一起,此时,重新对齐后的句段将以“绿色”实线连接。然而,并不是所有对齐都能按照1:1连接。由于存在一行原文对应多行译文的情况,因此应进行“一对多”连接。具体方式为按住ctrl键后再在序号列点击相应译文的所有序号,从而一次性将多行译文选中,然后再与原文句段连接即可。最后,在点击“确认”所有句段均按照原文和译文一一对齐后,翻译记忆库“民航行业发展统计公报TM”则成功建立完成。

3.2 翻译记忆库的应用

翻译记忆库的应用是翻译记忆技术在翻译实践中应用的最重要的一个环节,而在SDL Trados中,翻译记忆库在实际翻译项目中的应用主要包括预翻译和译后编辑两个阶段。

3.2.1 预翻译

“预翻译”是指基于翻译记忆库和设定好的匹配率对翻译项目进行自动翻译[7],即Trados的翻译记忆系统会自动检索翻译记忆库中的内容,对于翻译项目中内容相同或相似的句段,翻译记忆系统会自动填充记忆库中的译文。根据匹配率的不同,翻译记忆库的匹配分为100% 匹配、上下文匹配、模糊匹配和零匹配,100% 匹配是指翻译项目的某一句段与翻译记忆库中的句段在内容和格式上均一致地匹配,上下文匹配指在满足100% 匹配的情况下,上下文内容也相同的匹配,模糊匹配即为匹配率低于100% 的匹配,该匹配下的翻译项目的内容或格式相比记忆库存在或多或少的差异。对于100% 匹配和上下文匹配,译者可无须修改译文,而对于模糊匹配的译文,则仍需对照原文进行相应的修改。

在对《2021年民航行业发展统计公报》翻译项目“预翻译”之前,首先需要对该项目进行项目设置,包括添加翻译记忆库和设置最低匹配率值。添加翻译记忆库的具体步骤包括“点击项目设置-选择翻译记忆库和自动翻译-使用文件翻译记忆库-启用”。对于最低匹配率的设置,为了达到更好的匹配效果,一般设置为70% 或以上为佳。经过对翻译项目的“预翻译”,生成了如图1所示的“预翻译报告”。该报告的分析结果包括已翻译句段及其百分比、未翻译句段及其百分比。根据该报告,翻译项目《2021年民航行业发展统计公报》的字数共计4035 字,经预翻译处理后58.87% 为“已翻译”,41.43% 为“未翻译”,这意味着在应用翻译记忆库后,该项目的一半以上内容与翻译记忆库中的内容相同或相似,在后续的译后编辑阶段则可在很大程度上避免重复内容二次翻译,从而显著缩短翻译时间,大大提高翻译效率。

3.2.2 译后编辑

“译后编辑”是指对匹配度低于100% 的模糊匹配句段的预翻译译文进行人工修改的过程。SDL Trados 翻译记忆库匹配的译文一般默认显示于编辑视图左上角的“匹配结果”一栏,方便译者将正在翻译的内容与记忆库中的内容进行快速比对。而对于不同之处,“匹配结果”一栏会呈现不同颜色,方便译者迅速定位二者原文的不同之处,然后进行“对症”翻译。例如:

翻译记忆库原文:“其中,大中型飞机平均日利用率为6·.61 ··小时,比上年减少2· .88 ··小时;小型飞机平均日利用率为4· .14 ··小时,比上年减少2· .25 ··小时。”

翻译记忆库译文:Specifically, the rate of mediumand large sized aircraft was 6.61 hours, down by 2.88hours from a year earlier, whereas that of small sized air?craft was 4.14 hours, down by 2.25 hours.

项目原文:“其中,大中型飞机平均日利用率为6·.77 ··小时,比上年增加0·.16 ··小时;小型飞机平均日利用率为3·.78 ··小时,比上年减少0·.36 ··小时。”

项目预翻译译文:Specifically, the rate of mediumand large sized aircraft was 6.77 hours, down by 0.16hours from a year earlier, whereas that of small sized air?craft was 3.78 hours, down by 0.36 hours.

在以上例子中,项目原文和翻译记忆库原文的内容基本相同,除数字不同外,只有表示趋势的两个词汇,即“ 增加”和“减少”存在差异。在SDL Trados编辑试图中,“匹配结果”一栏会默认以不同颜色区分存在差异的内容。如在该例子中,翻译记忆库原文中的“减少”二字会显示为红色,项目原文内容中的“增加”则显示为绿色。译者根据颜色提示即可迅速判断出项目译文中需要进行译后编辑的精确位置。

根据项目预翻译译文所示,经预翻译后,由于SDL Trados会自动复制原文数字至对应译文框,因此译文与原文数字已自动保持一致,且其他相同的内容也都已自动调用了翻译记忆库的翻译结果,因此均无需进行人工译后编辑处理。但项目原文“增加”二字的翻译却仍为“down”,这显然是错误的,因此还需对其进行轻微的译后编辑,即将“down”改为“up”,从而保证项目译文的准确性。这样译后编辑后的准确译文则为:Specifically, the rate of medium and large sizedaircraft was 6.77 hours, up by 0.16 hours from a year ear?lier, whereas that of small sized aircraft was 3.78 hours,down by 0.36 hours.

上述例子表明,对于与翻译记忆库相同或相似的内容,译者仅需通过轻微的译后编辑即可完成句段的准确翻译,避免了重复工作,大大节省了翻译时间,保留了以往的翻译风格和习惯,提高了翻译的效率。

4 结束语

翻译记忆技术在翻译行业中已经成为一种主流的翻译辅助技术,可以为翻译工作者带来显著的效益,包括提高翻译质量、保证语言一致性、节省时间和成本等。航空文本专业性强、格式规范、重复度高等特点使得翻译记忆技术在航空文本翻译中具有较高的适用性。本文通过一个具体的翻译案例,详细地介绍了如何使用SDL Trados软件的翻译记忆功能来提升航空文本的翻译效率,并对SDL Trados软件的操作方法进行了详细说明。本文旨在帮助航空领域的译者了解和掌握翻译记忆技术在实际翻译项目中的应用方法,同时也为其他领域的译者提供了一种参考和借鉴的翻译技术。最后,翻译工作者应该积极地适应翻译市场的变化,主动地转变翻译观念,拥抱翻译技术,以提高自身的翻译水平和竞争力。

参考文献:

[1] 王正,孙东云. 利用翻译记忆系统自建双语平行语料库[J].外语研究,2009(5):80-85.

[2] 中国民用航空局. 2021年民航行业发展统计公报[EB/OL].(2022-5-18)[2024-1-8]. http://www. caac. gov. cn/big5/www.caac. gov. cn/XXGK/XXGK/TJSJ/202205/P020220518569126412044. pdf.

[3] BOWKER L.Computer-aided translation technology:a practical introduction[M].Ottawa [Ont.]:University of Ottawa Press,2002.

[4] 周文,徐国梁. 翻译记忆中语句相似度计算方法的研究[J].计算机应用,2007,27(5):1210-1213.

[5] 汪昆,宗成庆,苏克毅. 统计机器翻译和翻译记忆的动态融合方法研究[J]. 中文信息学报,2015,29(2):87-94,102.

[6] 王华树,李智. 人工智能时代笔译员翻译技术应用调查:现状、发现与建议[J]. 外语电化教学,2019(6):67-72.

[7] 王华树,李智. 人工智能时代的翻译技术研究:内涵、分类与趋势[J]. 外国语言与文化,2020,4(1):86-95.

【通联编辑:李雅琪】

基金项目:江西省研究生创新专项资金(省级项目)(YC2022-s733) ;江西省教育科学“十四五”规划2023 年度重点课题“新时代大学生用外语讲好中国故事能力培育实证研究——以南昌航空大学为例”(23ZD017) ;江西省高等教育学会2023 年度重点课题“教育数字化时代大学英语课程思政教学评一体化研究与实践”(ZX4-B-006) ;新文科背景下航空文化多语种平行语料库及教学案例库建设(231004296280839)