机器翻译译后编辑能力体系构建
——基于国家标准的探讨与分析

2023-12-30 00:44羿
关键词:客户文本人员

陈 羿

(广东理工学院 外国语学院,广东 肇庆 526100)

当前,以谷歌翻译(Google Translate)和DeepL Translate等为代表的神经网络机器翻译(Neural Machine Translation,NMT)在翻译质量和速度上获得了极大提高,得到了市场和客户的青睐。同时,越来越多的翻译服务提供商也在特定的应用场景中使用机器翻译服务,以满足不同类型文本和不同客户的翻译需求。对于当代翻译工作者而言,掌握一定的翻译技术并充分利用翻译工具的便捷性服务自身翻译工作显得愈发重要和迫切。基于人工智能和深度学习技术的神经网络机器翻译虽然在自然语言处理上取得了巨大突破,但受到源语文本词汇、结构、语系和文化等综合因素的影响,译文质量同高质量人工翻译相比仍然存在一定的差距。因此,基于“机器翻译+译后编辑”(Machine Translation Post-Editing,MTPE)的工作模式受到普遍认可,译后编辑能力也成为衡量翻译工作者综合能力素养的另一个重要标准。

一、文献综述及问题提出

机器翻译问世以来,针对改进机器翻译结果的译后编辑活动受到学界普遍关注,并对译后编辑能力结构内涵进行了充分探讨。对于译后编辑能力要素的早期研究主要围绕源语、目标语、主题领域等知识和能力[1-3]层面展开。后续的相关研究开始将受控语言写作、术语管理、机器翻译知识纳入译后编辑能力研究的范围[4]。如,Rico、Torrejón从语言、工具和核心3个维度进一步规范了译后编辑能力结构,认为语言技能包括掌握两种以上语言及文化的交际和语篇能力、跨文化交际能力、主题领域能力;工具能力包括机器翻译知识、术语管理能力、机器翻译词典维护、基础编程技能;核心能力主要是指态度及心理/生理能力、策略能力等[5]。Koponen围绕一般能力(语言、语篇、主题、跨文化等能力)、技术能力(软件应用、快速学习、工具评估等能力)、编辑能力(改正机器误译之处)和策略能力(满足客户要求和开展高效编辑等)展开论述,构建了译后编辑能力框架[6]。Nitzke等人将机器翻译译后编辑能力划分为核心和附属两大能力:前者包括风险评估、策略、协商、服务4个层面能力;后者涵盖双语、语言外、工具、检索、修订、翻译、机器翻译、译后编辑8个维度[7]247-250,此举进一步丰富了译后编辑能力要素构成。国内针对译后编辑能力的探讨可以参见崔启亮[8]、冯全功和张慧玉[9]、冯全功和刘明[10]、仲文明和舒超[11]等人的研究。其中,冯全功和刘明从认知、知识和技能3个不同的维度探讨了相关要素构成,构建了机器翻译译后编辑的三维模型,认为3个维度之间有机关联:在认知维度的调控作用下,相关知识得以转换为技能,从而实现译后编辑的目的[10]57,为译后编辑能力培养提供了较为切实可行的理论指导。

不难发现,译后编辑能力已经由最初单一的语言和主题知识方面的要求逐步扩充至更为丰富的工具使用、服务、策略等层面。本质原因是译后编辑活动内容和能力要求已经随机器翻译技术的发展而发生变化。尤其是基于神经网络的机器翻译在翻译效率和质量层面都实现了巨大突破,使得译后编辑活动与传统意义上的译后编辑工作内容相比存在较大差异。当前,神经网络机器翻译以其巨大的优势正悄然将译后编辑职业化,成为语言服务市场中的新生力量,催生了译后编辑产业化时代的到来。现有译后编辑活动内容及其能力要素的界定已不再完全适用于译后编辑职业化发展的趋势。职业化视域下理解译后编辑能力内涵有助于译者跟进时代发展需求,及时掌握语言服务市场需求的相关能力[12]。因此,针对贯穿译后编辑全流程所需具备的综合能力素养进行的探讨,十分必要和迫切。鉴于此,本文将以国家标准GB/T 40036—2021《翻译服务 机器翻译结果的译后编辑要求》为参照,厘清译后编辑生产前、生产中、生产后3个环节覆盖的具体活动,以期在译后编辑职业化这一新的范畴下重新界定译后编辑的能力要素,助力译后编辑行业的发展和人才培养。

二、译后编辑国家标准解读

GB/T 40036—2021《翻译服务 机器翻译结果的译后编辑要求》(以下简称GB/T 40036—2021标准)由中国标准化研究院、中国翻译协会、北京邮电大学、信息技术企业和翻译服务企业共同起草修订,再由国家市场监督管理总局和国家标准化管理委员会于2021年4月30日发布,并于2021年11月1日起实施[13]。

(一)制定背景

中国翻译协会(Translators Association of China,TAC)发布的《2022中国翻译及语言服务行业发展报告》显示,国内翻译服务企业和译员对机器翻译抱有积极的态度,机器翻译的使用变得越发普遍[14]。翻译自动化用户协会(Translation Automation User Society,TAUS)的研究也表明,Google Translate每月为超过5亿用户提供服务,每天提供1 400亿字翻译服务,神经网络机器翻译在适用文本范围和翻译质量上得到了极大提升。换言之,目前仅谷歌翻译(Google Translate)一天内翻译的单词数量就比世界上所有人工译员一年翻译的数量还多[15]。

为了满足翻译和本地化行业日益增长的需求,机器翻译系统的使用愈发普遍。在时间和预算有限的情况下,机器翻译为完成特定翻译项目提供了可行性方法,能有效缩短翻译产品交付周期、提高翻译效率。但是,当前机器翻译效果无法完全等同于人工翻译,机器译文最终质量还有赖于人工译员及其译后编辑能力。因此,亟需一套系统的机器翻译译后编辑国家标准来规范获得机器翻译输出结果后的人工操作流程,为译后编辑能力提升赋能。

(二)译后编辑目的与层次

根据GB/T 40036—2021标准,译后编辑目的在于检查机器翻译结果的准确性,发现错误及时更正,以提高文本的可读性、可理解性。依据编辑程度可分为轻度译后编辑(light post-editing)和深度译后编辑(full post-editing)两个层次,译者需要基于译文用途和客户要求选择合适的编辑策略。以下为两种不同层次译后编辑的具体要求:

轻度译后编辑适用于无需发布、只要求掌握核心信息的文本,编辑结果可理解和准确即可,对文本风格也未作过多要求。因此,该层次的译后编辑应当尽可能保留原始机器翻译的输出结果,译后编辑人员的主要任务是检查源语文本信息没有增添或缺失以及修改不当的相关句子或内容。

深度译后编辑在文本准确性、可理解性、语言风格、语法句法以及标点符号等方面有着更高的要求,其目的是确保产生接近于高质量人工翻译的结果。因此,译后编辑人员除了要履行轻度译后编辑人员的相关义务外,还应当确保译文语义、语法、句法正确;术语应用准确;拼写、标点符号和断字无误;文本风格恰当;排版格式规范;等等。

(三)译后编辑工作流程

GB/T 40036—2021标准详细阐述了机器翻译译后编辑生产前、生产中、生产后的相关流程和工作内容。本文根据以上3个环节及其内容绘制了译后编辑工作流程图,如图1所示。

图1 译后编辑工作流程图

生产前,翻译服务提供方应先明确客户要求,分析源语内容机器翻译的适用性,再选择恰当翻译方式(人工或机器翻译),就价格、参考资料可用性等细节进行沟通,以明确各自义务和权利等。生产中,译后编辑人员基于协商要求开展译后编辑活动,具体内容包括:文本的译前编辑处理,使源语文本更适用于机器翻译并获得更为准确的翻译结果;基于文本和不同类型机器翻译选择合适的机器翻译系统;针对机器翻译结果结合文本类型和客户要求等开展轻度或深度译后编辑。生产后,应核验译后编辑结果,确保符合项目预期要求,并等待客户反馈。客户对结果满意则项目完成,否则需要进一步完善。

另外,在实际的译后编辑过程中,对于翻译服务提供者是否采用机器翻译以及采用何种层次译后编辑的问题,有必要从多维度进行综合考量和决策。对此,Nitzke等人从机器翻译利弊、机器译文可用性、目标读者、质量要求、文本敏感等级等方面出发,绘制了译后编辑决策树模型[7]246,为是否采用译后编辑以及采用何种程度的译后编辑提供了较为详细的参照,详见图2。

图2 译后编辑决策树模型

(四)译后编辑人员资格、能力和培训

GB/T 40036—2021标准不仅从受高等教育程度和专业翻译年限等方面界定了译后编辑从业人员资格,阐释了包括掌握翻译技术知识、机器翻译系统常见错误、计算机辅助翻译工具知识、译后编辑可行性分析能力、修订译后编辑内容技巧等在内的专业素质要素,还提出了译后编辑人员应具备翻译能力、语言能力、文字处理能力、信息获取与处理能力、文化能力、技术能力、领域能力等方面的专业技能;译后编辑培训应涵盖翻译记忆库和机器翻译技术、深度术语工作、高级文本处理技巧、轻度和深度译后编辑实践、质量工具使用等方面的内容。本文将基于译后编辑生产前、生产中、生产后这一时间脉络,逐步探讨和厘清各个环节的能力要求,并构建能力体系模型。

三、译后编辑能力体系构建

基于译后编辑工作流程的梳理,译后编辑人员需要参与译后编辑生产前、生产中、生产后3个环节的相关活动,图1总结了各环节所涉及的具体活动内容,下面将逐一详细解构。

(一)生产前

开展译后编辑工作前涉及的主要内容包括客户要求、译者分析、方式选择和协商沟通4个部分,具体内容如下:

1.客户要求。客户要求通常包括翻译价格、翻译语言、交稿时间、质量预期、试译体验等。这一环节对服务意识和服务能力提出了要求,翻译服务同其他服务行业一样都应将为客户提供优质服务作为衡量工作的重要标准,以赢得客户信任和维系良好的客户关系。

2.译者分析。本环节要求综合考虑客户要求和其他因素,以提供可行的翻译服务,包括文本类型、机器翻译可利用性、机器译文可接受性、译文受众群体、文本敏感等级、交付时间、质量要求等。根据客户的文本使用目的及其对译文质量需求,崔启亮和雷学发将文本分为参考级、常规级和出版级3个层次,并结合机器翻译、计算机辅助翻译和人工翻译的特点,确定了适当的翻译策略,即机器翻译主导、人机交互翻译、人工翻译策略,以实现译文质量、效率和成本的平衡[16]。这一环节要求译后编辑人员需要具备文本分析、风险评估、项目管理(时间和质量把控)能力。

3.方式选择。译后编辑人员需要就翻译方式作出决策,包括机器翻译主导、机器翻译+译后编辑、人工翻译。同时,译者应知晓机器翻译常见错误类型,能预判机器翻译结果的总体质量,并结合客户需求选择保留纯机器翻译输出结果或采用轻度或深度译后编辑。无疑,译后编辑人员应具备一定的机器翻译知识和决策能力,同时也应对机器翻译抱有积极态度。

4.协商沟通。将分析结果告知客户,并就价格和交付日期等进行沟通,明确和制定责任划分、保密、争议解决等条款。因此,具备翻译和法律等行业知识以及拥有良好的协商沟通能力也是译后编辑能力的重要组成要素。

(二)生产中

在译后编辑生产过程中,译后编辑人员主要参与了文本处理、机器选择、译后编辑3个方面的工作。

1.文本处理。文本处理主要是指对源语文本进行译前编辑。根据GB/T 40036—2021标准,译前编辑是指在机器翻译前修改源语言内容,其目的是为了便于机器处理,提高机器翻译质量,进而减少译后编辑的工作量。广义上,译前编辑活动包括拼写检查、标记或删除无需翻译的内容、格式整理、使用受控自然语言写作等。其中,格式整理是指将文档中的图片、各类表格数据、公式等非纯语言文字进行整理编辑。受限于技术壁垒,当前机器翻译尚无法自动翻译图片内文字,也无法翻译并自动生成符合目标语言格式要求的数据表格和公式。因此,需要译后编辑人员提前编辑和整理,以便提高机器翻译效率和质量。而基于受控语言的译前编辑可以有效降低原文本身的复杂性与歧义性,提高机器翻译的可识别度(原文本身的可翻译性),减少(充分)译后编辑的工作量[17]。正如胡清平所言,翻译软件的研发和受控语言的推广是改进机器翻译质量的两个方向[18]。GB/T 40036—2021标准也明确若要将一个文件翻译成3种以上语言,则强烈建议进行译前编辑,以确保获得最佳机器翻译结果、降低译后编辑的时间成本等。因此,具备译前编辑等必要的文本处理能力是胜任译后编辑工作的有力保障。

2.机器选择。鉴于机器翻译系统在处理不同语言对(language pair)上存在一定的质量差异,译后编辑人员应熟悉各类系统的特点,并基于语言类型选择最佳机器翻译系统,以提高翻译效率和质量。除此之外,考虑到机器翻译技术和系统不断更新迭代,译后编辑人员还应具备较强的学习能力,确保及时知晓不同机器翻译系统的最新特点,更好地服务译后编辑活动。

3.译后编辑。如前所述,译后编辑包括轻度和深度译后编辑,这是基于文本类型、客户需求、目标受众等因素综合考量决定的结果。开展译后编辑生产活动,译后编辑人员应具备丰厚的语言与文化知识,以修改目标语言中可能存在的问题,如语法错误、语义缺失、标点误用、拼写错误、不当衔接等。译后编辑人员必须是一名合格的译者,应掌握必要的翻译理论知识和翻译技能,以修正机器翻译不规范表述,如使用注释法翻译文本中的文化负载词。译后编辑人员还应具备领域知识,即能够主动学习源语文本所属领域(如农业、医学、法律等)的主题知识,以确保专业术语翻译准确、句式表达和语言风格等符合规范。此外,强烈的责任心和契约精神不可或缺,是依循协议开展翻译和编辑活动的保障,主要体现在以下几个方面:确保译文未添加和遗漏信息;遵循客户和领域专业术语规范;遵循格式或拼写、标点、断字规则;检查其他不正确或不规范内容。除掌握机器翻译系统外,译后编辑人员要善于利用术语管理系统和翻译记忆工具等辅助译后编辑生产活动,根据需求多渠道快速检索和获取所需各类信息,提升译后编辑效率。

(三)生产后

译后编辑结束后的活动包括产品交付、客户反馈和项目终结3部分。产品交付前应当对照相关协议条款,对译文进行终检,确保质量符合要求。对于客户不满意之处或者提出的新要求,译后编辑人员需要重新修改。另外需要注意的是,翻译项目的难易程度与持续周期等并非一成不变,所以译后编辑人员在面对交付周期短或难度较大的项目时,还需具备一定的生理和心理承受能力。项目结束后,译后编辑人员应妥善处理源语文本和译语文本,确保不泄露文本信息。

基于译后编辑生产前、生产中、生产后3个环节相关工作内容的深入探讨,本文发现当前译后编辑已然超脱传统概念中机器翻译结果修改这一单一范畴,而是个体在译后编辑工作中全体活动的总和,涵盖沟通、决策、修改、服务等多项职业活动;胜任译后编辑职位所需具备的综合能力素养可以从态度、知识和技能3个维度进行概述。其中,态度关乎职业道德、伦理、意识和作风;知识是职业活动的基础架构和根本保障;技能则是进行职业活动的必要条件。据此,本文构建了一套译后编辑能力模型(见图3),认为:(1)译后编辑人员应对机器翻译前景抱有积极乐观的态度,能够容忍机器翻译的不足;具备强烈的契约精神,积极履行双方协商达成的各项条款;主动学习机器翻译和主题领域等知识,提升译文质量;将自我激励和服务意识贯穿于整个项目以提供高质量翻译服务。上述内容构成了译后编辑人员的态度能力。(2)译后编辑人员应掌握目标语和源语的语言和文化知识;学习和了解文本内容的领域知识;熟知机器翻译原理和常见错误类型等机器翻译知识;掌握风险评估知识和法律知识,以明确双方义务和责任,最大可能杜绝潜在商业风险。以上是译后编辑人员的知识素养。(3)具备文本分析、文本编辑、翻译技能、信息获取、工具应用、受控语言写作、项目管理和沟通交流等技能是开展译后编辑活动的基本条件,共同构成了译后编辑技能要素。态度、知识和技能并不是孤立的存在,它们彼此关联、互相影响:正向的认知和态度促进知识体系的构建,知识累积则是技能获得的前提和保障,而技能习得同样有利于提振译后编辑人员的信心,促成更为积极的工作态度。

四、结束语

人工智能时代,翻译技术素养是翻译能力的重要组成部分已成为翻译学界的共识。神经机器翻译作为当下热门且使用广泛的翻译技术,针对其翻译结果进行的编辑活动受到了普遍关注。本文以GB/T 40036—2021标准为参照,以译后编辑生产前、生产中、生产后3个阶段为主线,梳理了机器翻译译后编辑工作中所需的知识、技能和态度,构建了机器翻译译后编辑能力模型,以期助力机器翻译译后编辑能力研究和译后编辑人才培养。

猜你喜欢
客户文本人员
灵活就业人员参保如何缴费
在808DA上文本显示的改善
让刑满释放人员找到家的感觉
基于doc2vec和TF-IDF的相似文本识别
为什么你总是被客户拒绝?
如何有效跟进客户?
做个不打扰客户的保镖
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
急救人员已身心俱疲
23