人工智能时代机器翻译经典文学作品质量对比研究与思考

2019-01-14 02:32邓良艳
文教资料 2019年31期
关键词:机器翻译双城记对比研究

邓良艳

摘    要: 近年来,随着人工智能技术的进步,作为人工智能一部分的机器翻译取得了突飞猛进的发展,特别是基于神经网络的机器翻译,与以往机器翻译相比,具有更快速、效率更高、更准确等优点。本文通过对当前常用的几款机器翻译软件对文学作品译文质量进行分析和对比,了解机器翻译的发展现状与水平,探讨机器翻译在文学类作品方面存在的不足,展望人工智能背景下机器翻译的发展趋势和方向。

关键词: 人工智能    机器翻译    对比研究    《双城记》

随着《新一代人工智能发展规划》的出台,人工智能的不同领域取得了爆发式发展,作为其子领域的机器翻译得到了飞速的进步,从基于规则的机器翻译发展到现在的基于神经网络的机器翻译,功能越来越强大,译文质量越来越高。面对机器翻译的迅猛发展,人们不禁会问,机器翻译是否会完全取代人工翻译?本文以经典文学作品《双城记》为例,从中选取一些经典的例子进行机译和人译的对比,分析现有发展水平下机器翻译存在的不足之处,同时展望在人工智能背景下机译发展的前景和方向。

1.人工智能

1.1人工智能(Artificial Intelligence,简称AI)的概念

人工智能(AI),也叫机器智能,属于计算机科学的一个分支,它是用于描述模仿与人类思维相关的认知功能的机器,本质是利用计算机做只有人能做的工作,与人的自然智能形成鲜明的对比。

1.2人工智能的发展历程

“人工智能”一词最早由资深计算机科学家John McCarthy在1956年夏天在达特茅斯学院举办的研讨会上提出,这次会议被认为是人工智能成立的标志。作为一门学科,人工智能的发展历程主要经历三个阶段:人工智能的黄金岁月、人工智能的寒冬和人工智能的快速发展。

1.2.1人工智能的黄金岁月

1956年—1974年是人工智能学科发展的黄金岁月,对于大多数人来说,在这段时间内开发的程序无疑是令人惊讶的:计算机正在解决代数词问题、证明几何定理和学习说英语。当时很少有人相信机器的这种“智能”行为是可能的。研究人员表現出强烈的乐观态度,预测将在不到二十年的时间内建成一台全智能机器。

1.2.2人工智能的寒冬

在二十世纪七十年代后期,人工智能受到了批评和金融挫折。由于当时计算机的存储空间有限及计算能力的不足,人工智能程序只能解决一些十分简单的问题。同时,由于研究人员的盲目乐观情绪,一些人工智能项目并未达到人们的预期,以失败告终。于是,美国国防部高级研究计划局终止对人工智能项目的资金支持,人工智能进入第一次寒冬。到了八十年代,世界各地的企业采用一种称为“专家系统”的人工智能程序,给人工智能研究带来新一轮发展。然而,人们很快发现“专家系统”维护成本太高且更新困难,同时,政府拨给人工智能的研究经费越来越少。于是,人工智能又陷入第二次寒冬。

1.2.3人工智能的快速发展

自二十世纪九十年代中后期以来,由于计算机能力的提高,人工智能开始再次复苏。谷歌公司研发的人工智能围棋软件Alpha Go战胜了世界围棋冠军李世石,引起了全球对于人工智能的关注。此外,大数据的发展,深度学习的算法推动了人工智能在图像识别和语音识别方面的发展,人工智能进入快速发展阶段。

2.机器翻译

2.1机器翻译(Machine Translation,简称MT)的概念

机器翻译,俗称机翻,是计算机语言学的一个子领域,本质是利用计算机程序将文字从一种自然语言(源语言, target language)翻译成另一种自然语言(目标语言, source language)。机器翻译试图用计算机模拟人的翻译能力,是人工智能的重要研究领域。

2.2机器翻译的发展类型

机器翻译这一想法最早由法国科学家阿尔楚尼(G.B.Artsouni)在二十世纪三十年代初明确提出。经过几十年的长足发展,大致经历以下三个发展类型:基于规则的机器翻译、基于语料库的机器翻译和基于神经网络的机器翻译。

2.2.1基于规则的机器翻译

规则法(Rule-based method)机器翻译主要有三种类型:辞典法(Dictionary-based)、转化法(Transfer-based)及中间语法(Interlingua-based)机器翻译。辞典法翻译即直接翻译,将源语言与目标语言之间的词汇进行一一对应翻译;转化翻译对源语言的分析独立于目标语言,在对目标语言的转化过程中,会考虑与源语言的上下文、结构的差别;中间语言翻译即假定存在有中间语言(interlingua),先把源语言翻译成中间语言,再把中间语言按照目标语言的规范翻译出来。

2.2.2基于语料库的机器翻译

基于语料库(Corpus-based)的机器翻译可以分为基于范例的方法(Example-based)和基于统计的方法(Statistics-based)。所谓范例法,即基于实例的翻译方法。基本思路是电脑模拟大量翻译实例(翻译语料库),进行有效替换的翻译策略。统计机器翻译的基本思想是通过对大量的平行语料库进行统计分析,构建统计翻译模型,使用此模型进行翻译。

2.2.3基于神经网络的机器翻译

神经机器翻译(Neural Machine Translation,简称NMT),它使用人工神经网络提高翻译的流畅度和准确性。自2013年以来,随着深度学习的研究取得较大进展,相比较前面两种机器翻译类型,基于人工神经网络的机器翻译具有明显的优势。它可以自动从语料库中学习翻译知识,实现“理解语言,生成译文”的翻译方式,使译文更加符合语法规范、流畅,容易理解。

3.A Tale of Two Cities简介

A Tale of Two Cities(《雙城记》)是英国作家查尔斯·狄更斯创作的一部长篇历史小说,首次出版于1859年。故事以法国大革命为背景,情节感人肺腑,是世界文学经典名著之一。双城指的是巴黎和伦敦,故事将这两大城市连接起来,讲述了巴黎医生曼奈特的故事。他因打抱不平,受到埃夫雷蒙侯爵兄弟的迫害,在巴士底监狱被关押了18年。出狱后,曼奈特之女露西却与仇家的儿子达尼坠入情网。于是,在法国大革命的漩涡中,一幕幕家族的恩怨情仇隆重上演。善恶生死在冲突中交融,在转瞬间变换。在断头台上,卡尔登为了爱情,从容献身。

A Tale of Two Cities结构严谨,语言凝练,狄更斯对革命与人性的深刻思考和令人叹为观止的写作才华,在其中得到淋漓尽致的展现。本文选取文中极具代表性的经典语句进行翻译对比分析,研究神经网络机器翻译软件是否对经典文学作品进行准确的翻译,探讨人工智能背景下神经网络机器翻译是否取代人工翻译。

4.机器翻译A Tale of Two Cities质量对比研究与思考

4.1基于神经网络的机器翻译软件

目前市场上口碑较好的几款人工智能机器翻译软件有谷歌翻译、百度翻译和有道翻译。这几款翻译均采用基于神经网络的机器翻译系统,实现多个语言的随时互译,因此本文将采用这三种机器翻译系统样本进行分析和研究。

4.2三款机器翻译软件译文与人工译文对比

4.2.1源语言文本

句子1:

A day wasted on others is not wasted on ones self.

句子2:

Never frown, even when you are sad, because you never know who is falling in love with your smile.

句子3:

It is a far, far better thing that I do, than I have ever done; It is a far, far better rest that I go to than I have ever known.

句子4:

A wonderful fact to reflect upon, that every human creature is constituted to be that profound secret and mystery to every other.

句子5:

It was the best of times, it was the worst of times. It was the age of wisdom, it was the age of foolishness. It was the epoch of belief, it was the epoch of incredulity. It was the season of light, it was the season of darkness. It was the spring of hope, it was the winter of despair.

4.2.2人工译文

句子1:

在别人身上浪费一日,并非在自己身上浪费一天。

句子2:

纵然伤心,也不要愁眉不展,因为你不知道谁会爱上你的笑容。

句子3:

我现在已做的远比我所做过的一切都美好;我将获得的休息远比我所知道的一切都甜蜜。

句子4:

每个人对别的人都是个天生的奥秘和奇迹——此事细想起来确实有些玄妙。

句子5:

那是最美好的时代,那是最糟糕的时代;那是智慧的岁月,那是愚昧的岁月;那是信仰的年代,那是怀疑的年代;那是光明的季节,那是黑暗的季节;那是希望的春天,那是失望的冬天。

4.2.3谷歌翻译译文

句子1:

浪费在别人身上的一天不会浪费在自己身上。

句子2:

纵然伤心,也不要愁眉不展,因为你永远不知道谁会爱上你的笑容。

句子3:

这比我做过的事情要好得多;这比我所知道的要好得多。

句子4:

一个很好的事实要反思,每个人类的生物都构成了彼此深刻的秘密和神秘。

句子5:

这是最好的时代,它是最糟糕的时代,它是智慧的时代,它是愚蠢的时代,它是信仰的时代,它是不可思议的时代,它是光明的季节,它是黑暗的季节,它是希望的春天,是绝望的冬天。

4.2.4百度翻译译文

句子1:

浪费在别人身上的一天不是浪费在自己身上的。

句子2:

纵然伤心,也不要皱眉,因为你不知道是谁爱上了你的笑容。

句子3:

这是我做过的一件远比我做过的好得多的事情;这是我去的一个远比我所知道的好得多的休息。

句子4:

一个值得反思的奇妙事实是,每一个人类生物都被构成了彼此之间那种深奥的秘密和神秘。

句子5:

那是最好的时代,那是最坏的时代,那是智慧的时代,那是愚蠢的时代,那是信仰的时代,那是怀疑的时代,那是光明的季节,那是黑暗的季节,那是希望的春天,那是绝望的冬天。

4.2.5有道翻译译文

句子1:

浪费在别人身上的一天并不等于浪费在自己身上。

句子2:

纵然伤心,也不要愁眉不展,因为你不知是谁会爱上你的笑容。

句子3:

这是我做过的一件比以往任何时候都好的事情;我所得到的休息比我所知道的要好得多。

句子4:

一个值得深思的奇妙事实是,每一个人的生命都是如此的神秘莫测。

句子5:

这是最好的时代,这是最坏的时代,这是智慧的时代,这是愚蠢的时代,这是信仰的时期,那是怀疑的时期,这是光明的季节,这是黑暗的季节,这是希望的春天,这是绝望的冬天。

4.3对上述三款机器翻译软件的译文质量分析

对句子1“A day wasted on others is not wasted on ones self.”的翻译,三款软件的译文都与人工译文基本相同。

第二句话“Never frown, even when you are sad, because you never know who is falling in love with your smile.”中,谷歌翻译和有道翻译与人工译文意思相近,frown一词都翻译成“愁眉不展”,百度翻译直接译为“皱眉”,缺少文采,后半句“because you never know who is falling in love with your smile”,百度译为“因为你不知道是谁爱上了你的笑容”,与人工译文稍有区别。

句子3“It is a far, far better thing that I do, than I have ever done; it is a far, far better rest that I go to than I have ever known.”对这句话的翻译,三款软件的翻译虽然都有不足之处,但是把原文的基本意思都传达出来。有道翻译的译文质量要更好一点,谷歌和百度对后半句话中的rest一词翻译不够准确。

对句子4“A wonderful fact to reflect upon, that every human creature is constituted to be that profound secret and mystery to every other.”的翻译,人工译文采用语序调换的策略,把前半句话放到后面进行一个解释说明,三款机器翻译均未对语序进行处理,不过从直译的角度看,百度翻译和有道翻译的译文要比谷歌翻译的译文更为顺畅和符合中文的表达习惯。后半句对“every human creature”一词的翻译,谷歌和百度都直接译成“每个人类生物”,读起来明显很奇怪,而有道翻译为“每一个人的生命”,略微准确一些。总体来看,三款机器翻译对这句话的翻译均不是特别准确,译文看后有种不知所云的感觉。

句子5的内容是《双城记》中的经典开头段落,可谓是脍炙人口,总体来看,因为这段话的结构简单,三款机器翻译的译文都很准确地表达了原文的内容,但是一个缺憾就是,三款机器翻译对原文特有的节奏美、韵律美却很难表达出来。

4.4人工智能時代机器翻译对文学作品翻译的思考

通过对目前市场上常用的三款机器翻译软件译文与人工译文的分析可以知道,对于文学作品的翻译,如果是一些简单的句子表达,那么机器翻译能够做到准确地表达原文的意思,甚至与人工翻译不分伯仲。面对一些句式比较复杂、语法结构比较难的句子,机器翻译的质量还有待提高,因此,机器翻译对文学作品的翻译处理还是任重而道远。

5.结语

虽然在目前的人工智能背景下,机器翻译的译文质量仍存在一些不足之处,但是不能否认与传统的机器翻译系统相比,当前基于神经网络的神经机器翻译的译文质量已经有质的提升。诚然,就目前来看,人工翻译仍然占据主导地位,但是,未来翻译的发展必然是人工翻译和机器翻译相结合,机器翻译辅助人工翻译,提高翻译效率。因此,随着人工智能的进一步发展,机器翻译的质量一定会取得新的突破和提升,使人类更快更便捷地沟通和交流。

参考文献:

[1]冯志伟.机器翻译研究[M].北京:中国对外翻译出版公司,2004.

[2]Charles Dickens. A Tale of Two Cities[M].上海:上海外语教育出版社,2018.

[3]陈海峰.谷歌——人工智能引领未来[J].互联网天地,2017(1):38-41.

[4]刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017(54):1147.

[5]胡开宝,李翼.机器翻译特征及其与人工翻译关系的研究[J].中国翻译,2016(5):10-14.

猜你喜欢
机器翻译双城记对比研究
俄罗斯双城记之北方有座城
俄罗斯双城记之遇见莫斯科
双城记:垃圾大作战,给地球“瘦”个身
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
诗歌里的低诉,苍凉中的守望
传统中药学与生药学的对比研究
《双城记》人道主义中的善与恶