机器翻译与文本编辑:进展与展望

2015-05-30 18:20董妍
现代语文 2015年10期
关键词:机器翻译创造力人工

摘 要:全球化进程的加快,促使国际交流变得日益重要,这不可避免地把口笔译者推向了高需求的平台,基于其承担着连接不同语言国家交流的任务并充当重要角色。然而,在实现这一跨语言交际的过程中,很多的障碍随之显现,涵盖领域也较广,从经济问题、语用学及一致性问题到翻译速度的问题。换言之,大笔的资金和大量的精力需要投入到翻译之中,以保证翻译的速度和质量。事实上,人力固然可以做到很多,但翻译文本各方面都要达到完美却不可强求,而此时,基于電脑的工具和MT(机器翻译)便应运而生,以最大限度的满足翻译需求。从字面意思来理解机器翻译:由电脑来完成的翻译,其工作原理遵照一套体系——首先,“分析源语言以建立内部表征(internal representation),然后用特有的方法运用这些内部表征来最终生成目标语言”。

关键词:机器翻译  人工  创造力  翻亿库

一、电脑和人工翻译的关系

在翻译的历史中,电脑和人工翻译之间的关系可追溯到17世纪,可谓源远流长。然而直到20世纪50年代第一个机翻系统才诞生,可以说机翻的发展成熟非常缓慢。最初,机翻的文稿质量偏低以至于无法采纳。当时,机翻系统只收录有限几种语言的字典。后来,随着在线资源的日益丰富,机翻的质量逐渐提高并开始广为所用。尽管机翻曾经给人们的印象是只要按一下按钮就可以了(Hutchins,2003),这种翻译方法确实为翻译事业提供了很多帮助和便捷。如下图所示(Wu,2012):

显然,在翻译过程中,鉴于机翻与人工翻译的关系以及他们各自独立翻译时的表现,不可否认的是,电脑在做简单翻译时比人工更胜一筹。然而,当源语言文件的复杂程度逐渐提高时,机翻的质量也随之下降,因此可以看出,文件的复杂性仅仅对人工翻译产生不明显的影响。也就是说,对不同文本(从简单到适中再到复杂)的翻译,人工的表现更平衡一些。当翻译复杂文本,如诗歌、理论和谚语时,在文体学、语义学和语用学方面人工表现更灵活自然。更重要的是,从上图可得知,在电脑的辅助下,人工翻译的质量得到了显著改善。正如Wu所提“不同的翻译文本要使用不同的翻译工具,对症下药(Right tools for right tasks)——在某种程度上,电脑对人工翻译起到了补充作用。(Wu,2012)

既然电脑与人工翻译的关系得到了印证,那么他们之间如何有效合作并做出高质量的翻译被纳入议题。如下图(Matthiessen,2001:114):

从上图可以看出电脑和人工在翻译过程中的工作分配,在图表的最上端可以看到电脑扮演的角色是“行动者”而人的角色是“受益者”,也就是说在这一阶段,电脑做了主要的翻译工作。然而整个图表显示出电脑与人工的关系在不同阶段产生了变化——当电脑承担了主要的翻译工作而没有人工介入时,人便是“受益者”;当电脑做部分的翻译时,人是决策者,也要做一些前期编辑和后期编辑,这些会在本文后部分讨论;当人工做所有的翻译时,电脑变为“工具”,而人则是“行动者”,例如关键词和字典的翻译。

二、前期编辑和后期编辑

前文提到,在做机器翻译时,前期编辑和后期的翻译需要人工完成,因为电脑的智能程度与人类相差甚远,它们无法保证对每个字、词进行恰当合适的翻译,也就是说,一个单词在一种语言内是多义的,因此,在翻译时语域和具体概念要进行相应的考量,这是电脑无法实现的。因此,在为机翻做前期编辑和准备工作时,人们需要对句子进行“分割以处理复杂的意群、可能产生歧义的语义模糊的词汇和其他类似的情况”(MacDonald,1979:91-143)。Hutchins也指出前期编辑可应用于不同情况,例如:“某个单词是否具有特定含义、某个名称是否需要翻译以及复合名词的界限”,以插入“标点符号”或者把“长句分割为短句”(Hutchins,2003)。除了对源语言的翻译加以注意外,尽管有拼写和语法检查器,人工翻译时也应该避免误拼的现象,因为“个别的单词可能无法为电脑识别,一旦发生错识将会对后期的翻译产生很大的影响”。如果前期编辑打下良好的基础,后期编辑的工作量将会有显著的减少。Hutchins还指出,理论上,在做前期编辑时,人们无需对目标语言有广泛的了解,然而事实上,一定的了解还是必要的,这对后期的翻译有一定的帮助。但是,前期编辑也有一些弊端仍然被认为是权宜之计。(MacDonald,1979:91-143)

完成前期编辑之后,电脑就可以自主进行翻译,尽管仍然会有一些小的误翻。前期编辑主要专注于一些省略、代词和一致性等问题。Hutchins认为后期编辑的工作量是可以减少的——“文稿越标准化”,术语和陈词滥调越多,文稿就越老套且缺乏创造性,机翻的准确性就越高,这样一来,后期编辑的校正工作也就相应减少了(Hutchins,2003)。电脑最擅长的工作就是标准化的翻译,所以它更擅长处理一些规矩的句子,因为创造性的翻译没有程序可遵循,且不可预见。换言之,翻忆库(翻译记忆库)——一种“存储所谓的句子‘片断的数据库,例如句子或类似于句子的语言单位——标题、题目或者列表的各项,这些片断都是现成的可参考的翻译”,(翻译记忆库,2012)它的研发者不可能输入所有单词的所有意思,因此,当面临创造性或不常见的词组或句子结构时,翻忆库的存储数据就显得不足。

与前期编辑不同,后期编辑一般由译者来完成,因为双语技能的获得是靠时间积累而来,这一点专业译者比非专业译者更具优势(Hutchins,2003)。因此,人工在翻译中被引入,也就导致“翻译成本提高”(McDonald,1979:91-143)。当然,这其中也包含前期编辑的费用。另外,译者们在做后期编辑时需要保持一致性,因为不同的译者对于某些词汇或句子结构有其更倾向的翻译,这样最终在翻译过程中可能会导致文体或词汇选择的不一致。

不可否认的是,机翻可以做到对概念、重复和常见的句子结构的翻译保持一致。但是,Hutchins提出后期编辑的另外一个弊端——如果翻忆库中存储的是不恰当的字或句子翻译,做后期编辑的译者就要不停的修正这些问题,这样人们的工作就是辅助电脑而不是机翻的受益者。他也因此提出一项解决方案,有一定翻译技能的后期译者可以代替专业译者来做后期编辑,他们也可以接受一定的培训以提高翻译水平。当然后期译者的佣金可能会相对低一些。(Hutchins,2003)

三、后期编辑提升翻忆库质量

为了提高机翻质量,人工和电脑的合作至关重要,因此基于语言本身一直在变化(新词,创造性用法的不断出现),人们在翻译的过程中要做出一定的调整。Bar-Hillel列举了一些例子:“字典自动存储和检索的问题 ”和“微语言学意义和微语法”。尽管这些例子在几十年前就己经提出,但到现在仍然适用,因为语言一直在变化,这导致翻译的质量也一直提升没有终点(Bar-Hillel,1960:91-163)。Josselson也提出了類似观点:扩大字典涵盖的方面和丰富语法对于提高机翻的质量十分必要,这包括:“设计出符合双语的形态学的、句法的和语义的编码、句法分析的规则、自动的句子语法分析规则和多选规则”。他还认为在机翻过程中,对比分析最适合产出高质量的翻译。通过比较目标语言的不同译本,翻忆库的研发者就可以有不断丰富的数据资源以翻译在源语言中出现的创新的表达、词汇组合(Josselson,1971:1-53)。同时,随着科技发展,自动的后期编辑可以由电脑来完成,但同样,这是对未来发展的展望。

具体说来,近年来,评估电脑自动后期编辑的项目层出不穷。由此,研究人员通过结构分析可以寻找更多有益于提高翻译质量的方法。Doyon等人在2008年做过一个名为《通过后期编辑提高自动机翻质量的技术:分析师和译者经验》的研究项目。这个项目的研究人员比较了由电脑和人工分别做出的后期编辑的译本,发现前者的翻译的质量“低于译者和分析师认可的可被采纳的标准,而所有的人工做出的后期编辑都处于甚至高于此标准”(Doyon et al,2008)。从这一研究结果得知机翻始终不尽人意,即其在辅助人工翻译方面还有很长的路要走。他们还做了一个调查,结果显示一旦经过人工的后期编辑,人们还是更倾向于使用机器翻译,而且当时在阿拉伯语和英语机器翻译中并无不可采纳的自动后期编辑译本。该项目的实验有一定的局限性,但是,Ariadna得出了相似的结论——大多数的机翻系统与后期编辑的配合并不如翻忆库数据和SDL系统的Multerm默契。她提出了两个改善建议:第一,“在线翻译校正工具”对“简单的错误诊断和不明显的错误分类”是有帮助的;第二,“自动的翻译规则完善工具通过追溯译文的错误到原始的翻译规则和词条录入,进行修正多数属于词汇和形态句法的错误”,例如“用词顺序错误或未遵循语言间转换规则”(Ariadna,2009)。然而无论如何,大多数时候,人们在机翻的过程中仍然发挥着不可替代的作用,因为很多不同领域的调整,从功能语法到对翻忆库的扩充,都需要人为完成,并且人工智能程度是电脑无法企及的,况且不同语言的表达方法也不可预知。

四、机器翻译的未来

尽管机翻有一段相对较长的历史,机翻软件还是处于初级阶段且人们可以想像人工翻译的未来也许是“电脑输出较对”和机器可以做一些人工的翻译工作且具有一定的准确性(Champollion,2010)。尽管实践证明人们在搜索信息时使用的机翻软件有很强的包容性,但机翻是否可以满足广大的市场需求仍依赖于语言本身和市场规模(Bracken,2011)。考虑到如上因素,在某种程度上,电脑在未来可以很好地辅助人工翻译,尽管在前期或后期编辑过程中仍需要有少量或无人工介入。

五、结语

本文介绍了电脑在辅助人工翻译方面的功能,并做了一些文献回顾和讨论,以明确双方如何相互作用。事实上,尽管电脑在某些特定领域己经可以替代人工做很大一部分的翻译工作,例如一些技术性的或简单的无创造性的文章,但其范畴仍然是受限的,特别是在一些语言方面——电脑对“某种语言的翻译质量要明显高于其他语言”(Bracken,2011),这种现像表明机翻发展的不平衡性。此外,机翻的现状是在前期编辑,甚至是后期编辑过程中仍然需要人工的介入。从另外一个角度讲,电脑翻译的文本可以看作是“草稿”而人工进行的后期编辑则可以看作是“校对”,这个前文提及的“电脑输出较对”意味着在追求高质量翻译的同时,人们的工作量将大大减少。尽管有人认为由于在完成并完善“草稿”的过程中,人工的大量投入,看起来人们是辅助电脑而不是接受帮助的一方,然而恰恰相反。人们在完善机翻系统的同时,提高了其翻译的质量,这恰恰有助于提高人们以后的翻译质量。这样一来,实现无需大量人力和大笔物力投入的高质量翻译蓝图的可能性将提高。因此,电脑与人类是互惠合作关系。把Bracken的话作为本文的结尾再适合不过:“除却所有的进步之外,在主流翻译中,机器在替代人工的路还有很长一段要走,但是事实也证明了机翻的自身价值,即所有的语言服务提供商对机器翻译的态度都是承认其可行性而非排斥。”(Bracken,2011)

参考文献:

[1]Ariadna,FL.Automatic Improvement of Machine Translation

Systems[D/OL].[2012-06-16].http://gradworks.umi.com/32/85/3285855.html.

[2]Bar-Hillel,Y.The PresentStatus of Automatic Translation

of Languages[A].Alt FL.Advances in Computers[C].New York:Academic Press,1960.

[3]Bracken,C.Machine Translation:where is it now,and

where is it headed?[Z/OL].2011[2012-06-16].http://www.andovar.com/blog/machine-translation/.

[4]Champollion,Y.MachineTranslation(MT),and the Future

of the Translation Industry[J/OL].2010[2012-06-16].http://www.bokorlang.com/journal/15mt.htm.

[5]Doran,C,Doyon.J,Means,CD & Parr,D.Automated Machine

Translation Improvement Through Post-Editing Techniques:Analyst and Translator Experiments[DB/OL]. 2008[2012-06-16].http://www.mt-archive.info/AMTA-2008-Doyon.pdf.

[6]Durgesh,DR 1998,Machine Translation:A General

Introduction[DB/OL].1998[2012-06-15].http://www.ias.ac.in/resonance/July1998/pdf/July1998p61-70.pdf.

[7]Hutchins,J.Eds.MachineTranslation and Computer-based

Translation Tools:whats available and how its used.from transcript of presentation[M].Valladolid:University of Valladolid,2003.

[8]Josselson,M.Eds.Automatic Translation of Languages

since 1960:a linguists view[A].Advances in Computers[C].1971.

[9]MacDonald,RR.The Problem of Machine Translation[A].

Henise-Dostert,B,Macdonald,RR & Zarechnak.Machine Translation[C].The Hague:Mouton Publishers,1979.

[10]Matthiessen,C.The Environments of Translation[A].

Steiner,E & Yallop,C.Exploring Translation and Multilingual Text Production:beyond Content[C].Berlin,New York:Mouton de Gruyter,2001.

[11]TranslationMemory[DB/OL].2012[2012-06-15].http://

en.wikipedia.org/wiki/Translation_memory.

[12]Wu,CZ.Lecture 1,PowerPoint slides[DB].Sydney:

Macquarie University,2012.

(董妍  澳大利亞麦考瑞大学人文科学学院)

猜你喜欢
机器翻译创造力人工
人工3D脊髓能帮助瘫痪者重新行走?
创造力从哪里来? “捣蛋专家”告诉你
以生成性培养创造力
人工,天然,合成
人工“美颜”
激发你的创造力
激发你的创造力
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
新型多孔钽人工种植牙