张姝雯
(上海大学 外国语学院,上海 200000)
机器翻译是国家语言开发能力的评价指标之一[1],经过了从传统的统计机器翻译向神经机器翻译的发展,机器翻译与人工翻译相辅相成,各具优势。前者更适用于规范化和信息性文本[2],而对于具有表现性质的文本则需人工翻译介入。因为机器翻译主要专注于字面内容,无法准确传达文字背后所蕴含的思想、情感和观点[3],再现文史经典中蕴含的哲理与美感[4]。此外,机器翻译仍面临一些难以解决的技术障碍,生成的译文无法达到出版质量,还需要人或编辑器对机器翻译系统生成的目标语言进行编辑操作[5],即译后编辑。
在分析机器译文的词汇时,当前以语言学为背景的研究通常只关注术语翻译[6]或词汇计量特征[7]。术语翻译通常只涉及专业词汇和有限的结构;词汇计量特征也尚不能充分说明译文的词汇使用是否符合目标语的表达习惯。英语中的词(word)和汉语中的词并不完全对应,汉语中还有字的单位,这会对词汇丰富度和密度、词长、词性和词频的计算结果产生干扰。
词汇使用根植于一门语言的语音文字系统特点、母语者的思维方式和美学心理,不同语言文化之间存在根本差异。为了使译文更易于接受和传播,机器翻译的译后编辑需要回溯目标语言和源语言的根本差异,以此指导译文词汇润色。因此,本文以英汉词汇对比为理论基础,考察机器翻译对汉语中重复词汇的处理效果,并提供相应的译后编辑策略。本文的研究结论有助于为进一步改善机器翻译系统的性能提供词汇处理方面的思路,进一步提升译文的质量和可读性。同时,本文还提供了译后编辑人员在润色机器译文时的策略,帮助机器翻译的用户提升翻译体验,获得更优质的译文。
汉语在句子和篇章中会频繁地重复使用同一词语,以满足节奏、构词方式和篇章连贯性的需要,常通过重叠、重复以及对偶排比得以实现。相比之下,英语中虽然也存在重复的现象,但多处于修辞、惯用语或叠音词中,远不及汉语普遍。英文中通常避免出现音节、词语、句式和意义的重复,在口语和书面表达中常使用替代、省略和变换的手段[8]。
由于英语和汉语对重复的不同态度,英汉互译时也需要考虑这种差异的转化。汉译英时,可以使用显性的形态变化替换源语言中重复的词语,以符合英语作为形合语言的特点;还可以使用复合词、代词、同义词、上下义词、抽象词等减少源语言带来的重复。如果忽视这些处理,汉译英的译文就会冗余过多,降低可读性。特别在中国公开发表的工作报告和政论性文章中,诸如“坚持”“加强”“充分”等词经常重复出现,起强调作用或增加气势,而译成英文时就可能出现问题。机翻是否完全无法处理汉语中的用词重复?不同机翻软件的处理是否存在差异?人机合作翻译时应遵循怎样原则对译文词汇使用进行润色?为了思考这些问题,本文以英汉词汇对比理论为研究框架,观察一篇中国外宣文本的各种机器英译本对汉语中词汇重复现象的处理情况及效果。
采取案例分析的定性研究方法,本文聚焦于中国出席第77届联合国大会立场文件,分析了机器翻译如何处理重复,处理是否妥当,并给出译后编辑策略。具体研究对象由该文件的中文原文和三篇英文译文构成,三篇译文分别来自于百度翻译、Deep L翻译以及ChatGPT(基于GPT-3.5架构)。在对比分析各机器译本时,本文以中华人民共和国常驻联合国代表团官网的译文为参考,以避免研究者个人的翻译偏好对分析过程产生影响。
对于重复的处理在翻译中起着重要的作用,能够提升译文的质量和可读性。有效地处理重复可以使文本更加流畅、清晰,并帮助读者更好地理解内容。本文就汉语中三种常见的重复现象,讨论不同机器翻译的处理及效果。
通过重叠,可以使得汉语音节匀称,或者赋予新意义和感情色彩。“一带一路”是数量词的重叠,官方将这个术语翻译为the Belt and Road Initiative(BRI),而并没有保留数字“一”的重复。因为汉语中的数字可以用来表示每个、许多、或某种感情色彩,如一草一木,而英文中的数字强调数量而淡化属性,所以One Belt,One Road的译法只突出狭义上的两条线路,使读者忽略丝绸之路更宽广的外延。如例(1)所示,三个机翻版本中,只有Deep L保留数字重复,其他版本都能按照规范翻译。但是当这个术语在同一句话中重复出现时,只有ChatGPT使用代词it进行替代,官方译文则是使用缩写形式,避免重复。
(1)截至2022年7月,已有149个国家签署共建“一带一路”合作文件,“一带一路”已成为当今世界规模最大、广受欢迎的国际合作平台。(原文-16)
As of July 2022, 149 countries have signedthe “the Belt and Road”cooperation document, andthe “the Belt and Road”has become the world’s largest and popular international cooperation platform.(百度)
As of July 2022, 149 countries have signedthe “Belt and Road”cooperation document, andthe “Belt and Road”has become the largest and most popular international cooperation platform in the world today.(Deep L)
As of July 2022, 149 countries have signed cooperation agreements related tothe Belt and Road Initiative, makingitthe world’s largest and most popular platform for international cooperation.(Chat GPT)
As of July 2022, 149 countries had signedBelt and Roadcooperation documents with China, makingthe BRIthe largest and widely welcomed platform for international cooperation in the world.(官方)
“共商共建”“互联互通则属于并列式的重叠”。几个译本在翻译后者时都只用一个单词connectivity或interconnection表示,规避重复。而翻译“共商共建”时,却出现了分歧。这个短语在立场文件中出现了三次,其中两次以“一带一路”的原则“共商共建共享”出现,是固定术语。词汇重复最少的是Deep L,但对两次固定术语的翻译都不一致,易造成理解混乱。而ChatGPT既确保了术语前后一致,又在非术语的地方有所变化,用抽象名词effort替换“商”和“建”的意思。百度翻译重复最多,几近死板地将“共”对应joint,“商”对应consultation,“建”对应construction,缺少变化,在同一个短语中还出现两次joint,最不符合英语的表达习惯。官方译本由于追求在节奏上尽量贴合汉语原文,也存在术语不一致、重复过多的问题。综合来看,ChatGPT的处理最值得参考。
立场文件的语体风格正式,原文用汉语书写时已经尽量规避语法重复,不过出于修辞目的的重复现象仍有很多。例(1)就是回环(chiasmus)反复,前一个句子的末尾和后一个句子的开头重复,形成语义的接续连贯,在翻译成英文时要使用代词或其他形态变化替换重复。例(2)中体系、秩序、规则分别形成了间隔反复,一是为了制造押韵,二是以不变的部分强调变化的部分。
(2)世界只有一个体系,就是以联合国为核心的国际体系;只有一个秩序,就是以国际法为基础的国际秩序;只有一套规则,就是以联合国宪章宗旨和原则为基础的国际关系基本准则。(原文-3)
There is only onesystemin the world,whichis the internationalsystemwith the United Nations at its core; There is only oneorder,whichis based on international law; There is only one set ofrules,whichis the fundamentalnormsof international relations based on the purposes and principles of the United Nations Charter.(百度)
The world has only onesystem, the internationalsystemwith the United Nations at its core; only oneorder, the internationalorderbased on international law; only one set ofrules, the basicnormsof international relations based on the purposes and principles of the UN Charter.(Deep L)
There is only one globalsystem, centered around the United Nations; only oneorder, based on international law; and only one set ofrules, founded on the purposes and principles of the United Nations Charter.(ChatGPT)
In the world, there is only one internationalsystem, i.e. the internationalsystemwith the United Nations at its core. There is only one internationalorder, i.e. the internationalorderunderpinned by international law. And there is only one set ofrules, i.e. the basicnormsgoverning international relations underpinned by the purposes and principles of the UN Charter.(官方)
但如果翻译成英文还保留这个重复,就会让句子包含无用信息。从这个视角来看,ChatGPT的译文最简洁明了,不仅没有重复原词,还进一步省略了后置定语的标志which,用非谓语结构充当后置定语。
相较于前两种重复,立场文件更多地使用对偶和排比。如例(3)中“以……为”构成句式重复,“根本遵循”和“重要原则”构成意义重复,两者一起组成了对偶的修辞。三个版本的机器译文都重复使用了principle,不仅没有规避意义重复,还增加了形态重复。官方译本则用requirement代替其中一个principle,但仍未解决信息的冗余问题。因此,本文认为更为合适的译文应为take/with mutual respect and indivisible security as the fundamental principle。
(3)以相互尊重为根本遵循,以安全不可分割为重要原则,(原文-7)
withmutual respectasthefundamental principle, and the indivisibility of securityastheimportant principle,(百度)
takesmutual respectasthefundamental principleand the indivisibility of securityasanimportant principle,(Deep L)
followsthefundamental principleof mutual respect, andregardsinseparable securityasanimportant principle.(ChatGPT)
takesmutual respectasthefundamental requirementand indivisible securityastheimportant principle,(官方)
例(4)也证明了相同的结论,即机器翻译尚不能准确识别汉语中的同义异形词语,在翻译时不能做到省略同义近义表达来避免重复。“不是……,才是……”构成句式重复,这一点机器可以识别;“解决问题”与“化解分歧”“根本之道”与“有效途径”构成意义重复,机器翻译却没有做到语义的合并。此外,这个对偶结构的使用突出了非重复的部分,即“战争和制裁”“对话协商”,英文中则可以用强调句式来体现原文的意图。因此,更合适的译本可以是It is dialogue and consultation,not war or sanctions,that are fundamental solutions to differences。
(4)战争和制裁不是解决问题的根本之道,对话协商才是化解分歧的有效途径。(原文-8)
War and sanctions are not thefundamental waystosolve problems, but dialogue and consultation are theeffective waystoresolve differences.
War and sanctions are not thefundamental waytosolve problems; dialogue and consultation are theeffective waytoresolve differences.
it is essential to recognize that war and sanctions are not thefundamental solutions, and that dialogue and negotiation areeffective meanstoaddress differences.
Wars and sanctions are notfundamental pathstoresolving problems; only dialogue and consultation offereffective waystoaddressing differences.
由上文可知,机器翻译在处理汉语对偶句中的意复现象时差强人意,那在排比句中是否亦是如此。如例句(5)所示,机器译本在处理“而不”的重复时,均拘于源语言,缺少变化。而官方译文则使用“replace A,B,C with D,E,F”,将三个短语的意思融合起来,减少用词的冗余,最具有参考价值。例句(6)中机器译本将三个“以对话”重复呈现,弱化了其他关键信息的视觉存在感,像官方译文那样合并翻译为佳。
(5)走一条对话而不对抗、结伴而不结盟、共赢而非零和的新型安全之路。(原文-7)
... follows a new path of security that is dialoguewithoutconfrontation, partnershipwithoutalliance, and win-winrather thanzero sum.(百度)
... follows a new security path of dialoguerather thanconfrontation, partnershiprather thanalliance, and win-winrather thanzero-sum.(Deep L)
It seeks to forge a new path of security featuring dialogueinstead ofconfrontation, partnershipinstead ofalliance, and win-win cooperationinstead ofzero-sum games.(ChatGPT)
... in order to foster a new type of security thatreplacesconfrontation, alliance and a zero-sum approachwithdialogue, partnership and win-win results.(官方)
(6)以对话建互信,以对话解纷争,以对话促安全(原文-8)
build mutual trustthrough dialogue, resolve disputesthrough dialogue, and promote securitythrough dialogue(百度)
build mutual trustthrough dialogue, resolve disputesthrough dialogue, and promote securitythrough dialogue(Deep L)
build mutual trustthrough dialogue, resolve disputesthrough dialogue, and promote securitythrough dialogue(ChatGPT)
build trust, resolve disputes and enhance securitythrough dialogue(官方)
例(7)所展示的排比现象则是关于汉语中的一个常用的名词或形容词后缀“-化”,表示属性或状态。英语中同样有-ize/-ise、-ify、-ate、-en等。因此,可以择取合适的英语后缀直接翻译。百度翻译试图确保四个词组都是“修饰语+名词”的结构,于是“多极化”和“多样化”并没有使用合适的英文词缀来翻译。Deep L虽然实现了词缀的统一,但主语部分过长,句子头重脚轻。ChatGPT则经过更加复杂的思考,为英译文提炼出了一个无灵主语the world。同样把world提为主语,官方译文则将“……化”理解为形容词后缀,在形式上相较ChatGPT版更简洁,也没有完全拘泥于汉语原文的音律节奏。
(7)世界多极化、经济全球化、社会信息化、文明多样化持续深入发展(原文-2)
the world’smultipolarity, economicglobalization, socialinformatization, and culturaldiversitycontinue to deepen,(百度)
themultipolarizationof the world, economicglobalization, socialinformatizationanddiversificationof civilizations continue to develop in depth,(Deep L)
the world continues to experience deepeningmultipolarity, economicglobalization, socialinformatization, and culturaldiversity.(ChatGPT)
the world is becoming increasinglymulti-polar, economicallyglobalized,digitizedand culturallydiversified.(官方)
总体而言,不同的机器翻译系统在处理汉语原文中重复用词时存在差异。新兴的ChatGPT翻译相较于已广泛使用的百度和Deep L翻译,在处理重叠词和形态重复的词时已经展现出明显的优势。然而,机器翻译系统难以准确识别并处理对偶排比句中形态上不同但意义相同的重复表达,无法进行同义合并和省略操作。当重复出现在词汇的内部结构,如词缀的重复时,机器翻译系统无法灵活地转换词性和词形,以使得句法和词法层面都符合目标语言的表达习惯。因此,机翻译文还需要人或编辑器进一步提升对重复用词的处理。
译后编辑的首要任务是,识别机器翻译中不符合目标语言习惯的错误和问题。为此,译后编辑者需要结合机器翻译普遍存在的不足,寻找提升译文质量的切入点。
其一,依据词汇的具体语境转变去重复方式。英语中规避重复的手段有很多种,而机器翻译只能有限地调动这些经验。由于汉语的词形变化较少,许多语义或者用法上的差异并不会通过形态变化直接体现,机器就无法判断两个形态相同的词是否发挥了不同的社会文化功能。如,当在文本中多次出现某个专业术语时,一般使用约定俗成的翻译,使读者快速理解术语的含义。例如,没有规范译文,则须确保术语使用前后一致。为了避免重复,可以使用代词将该术语替换为it或this,或使用缩略词。在读者可以通过上下文理解的情况下,可以直接省略该词。然而,当该词在其他语境中作为通用词汇出现时,如仍使用术语译法,则会使译文生硬,也增加了不必要的重复(表1)。此时,译后编辑应根据需要使用同义词、上义词或抽象词替代来代替原词,以实现表达的多样性和丰富性。不过选择替代词时需要谨慎,确保其准确性和适用性。
其二,融合或省略对偶排比句中的重复语义。对汉语来说,对偶和排比中的重复不仅涉及同一个字、同一个词,还包括字数相等、结构相似,以及意义的相类、相似、相反。在处理汉语原文的对偶句和排比句时,应注意融合或省略那些互相补充、互相映衬、互相对照的成分,以简化译文。特别是本文所分析的政治类外宣文本,非常依赖重复的词语、重复的结构和重复的意义来体现独特的中国气场。如果在英文中直接保留这些结构,不仅失去了气场,反而干扰了信息传递的流畅性。
其三,处理汉语词缀的重复时发挥英语的派生优势。中文中的具有形态学变化的派生词虽然不多,但也存在一些词缀,如表示对立的前缀“反-”,表示使……变化的后缀“化”等。特别是在现代汉语和政治性文本中,并列短语中同一词缀的重复,能够直观地捆绑几个词语。比如,“单边主义、保护主义、霸权主义抬头”这句话中,“单边”“保护”“霸权”原本是三个独立的现象,借助“……主义”这个结构有了共生共现之感。要想在英文译文中也传达这种感觉,就必须要使用统一的派生词缀。这种做法并不会增加译文中的重复,因为对两个英语派生词来说,词缀只决定词性,而词根才决定词义。机器翻译一般无法兼顾句法和词法结构。有时候为了语法正确,机器翻译会把相同的汉语词缀翻译成不同的英语词缀,这种做法反而破坏了意义的黏合性。因此,译后编辑者需要灵活运用英语中的派生词,尽可能统一汉语词缀的翻译。
机器翻译和译后编辑时需要对重复词汇进行处理。本文以英汉词汇对比为理论指导,分析四个常见机翻系统处理重复词汇时的方法、效果和问题,并提出相应的译后编辑策略。通过对案例的分析讨论,本文发现机器翻译系统在处理重叠、反复现象方面取得了进步,但在处理对偶和排比现象时仍存在局限性。通过依据词汇的具体语境转变去重复方式、融合或省略对偶排比句中的重复语义、处理汉语词缀的重复时发挥英语的派生优势,译后编辑可以有效提升译文的质量和可读性。在处理重复词汇时,机器翻译系统和译后编辑人员需要相互配合,结合语言特点和文化差异,以提供准确、流畅和可读的译文。