崔林艳,虞金芳
(1.安徽农业大学 经济技术学院,安徽 合肥 230036;2.安徽农业大学 经济管理学院,安徽 合肥 230036)
人类语言种类繁多,全世界大约有6000~7000种语言[1]。随着人类文明的进步和经济全球化,跨语言的沟通和交流对世界各地的人们来说都变得越来越重要。为了克服语言的障碍,曾经有人提出使用人类通用语言(lingua franca)来替代各种不同语言的想法。但是,这样的想法显然是很难实现的[2](P2)。
机器翻译一直被公认为是人工智能领域最难的课题之一。让机器理解人类的语言,进而实现不同语言之间的无障碍翻译,不仅是科学家们奋斗追求的梦想,也寄托着全人类实现自由沟通交流的美好愿望。本文通过对目前市场上常用的几款人工智能机器翻译软件翻译结果与人工译文的对比分析,展望未来人工智能背景下机器翻译的发展前景与方向。
机器翻译就是利用计算机把一种语言(源语言,source language)翻译成另外一种语言(目标语言,target language),实现各种自然语言之间的自动转换,是人工智能和自然语言处理领域的重要研究方向之一。
机器翻译的研究历史可以追溯到20世纪30年代。20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年,苏联发明家П.П.特洛扬斯基设计出把一种语言翻译成另一种语言的机器,并在同年登记了他的发明。但是,受到当时技术水平的限制,他的翻译机没能成功。1946年,第一台现代电子计算机 ENIAC 诞生。随后不久,信息论的先驱、美国科学家 W. Weaver 和英国工程师A. D. Booth 在讨论电子计算机的应用范围时,于1947年提出了利用计算机进行语言自动翻译的想法。1949年,W. Weaver 发表《翻译备忘录》,正式提出机器翻译的思想。
机器翻译系统的发展类型主要分为三种:基于规则的机器翻译系统、基于语料库的机器翻译系统和基于人工神经网络的机器翻译系统。
1.3.1 基于规则的机器翻译系统
主要分为三种类型:第一类是直接翻译系统,设计原理是根据源语言和目标语言之间的词汇单元的对应关系,缺点是针对性过强;第二类是转换翻译系统,源语言的分析独立于目标语言,源语言的分析一般只在句法平面上进行,用目标语言单元替换源语言单元时要考虑上下文,转换时还要考虑源语言与目标语言的结构差别;第三类是中间语言翻译系统,把源语言的文本用人工设计的无歧义的中间语言(interlingua)表示出来,然后再把中间语言所表达的意义用目标语言的词汇和句法结构表示出来。
1.3.2 基于语料库的机器翻译系统
主要分为两种类型:一种是基于统计的机器翻译系统,另一种是基于实例的机器翻译系统。这两种系统都使用语料库作为翻译知识的来源,所以统称为基于语料库的机器翻译系统。区别在于:基于统计的机器翻译系统,知识的表示是统计数据,翻译知识的获取在翻译之前已经全部完成;基于实例的机器翻译系统,翻译知识的获取在翻译之前没有全部完成,翻译过程中还要查询语料库。
1.3.3 基于人工神经网络的机器翻译系统
基于人工神经网络的机器翻译系统——神经机器翻译(Neural Machine Translation,简称NMT)。2013年以来,随着深度学习技术取得的较大进展,基于人工神经网络的机器翻译系统逐渐替代了过去基于规则和基于语料库的机器翻译系统。神经网络机器翻译系统受启发于人类自己的生物学神经网络系统,通过端到端的神经网络直接实现自然语言之间的翻译。神经机器翻译系统改进了以往机器翻译系统的不足,通过对上下文信息的充分比较,完成句子的整体编码和解码,由此产生的译文更顺畅、自然、准确。
人工智能是相对于自然人的天然智能而言,即利用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科。
从1956年正式提出人工智能学科算起,人工智能技术取得了长足的发展,尤其是近十年来发展迅猛, 已经广泛应用于社会各个学科和领域,成为一门广泛的交叉和前沿学科。人工智能的发展历程主要分为三个阶段:人工智能的起源、人工智能的二次低谷和人工智能的快速发展期。
2.2.1 人工智能的起源
1950年,一位名叫M. L. Minsky(后被称为“人工智能之父”)的大学生与他的同学D. Edmund一起,建造了世界上第一台神经网络计算机,这被看作是人工智能的一个起点。1956年,在Dartmouth会议上,计算机专家J. McCarthy首次提出“人工智能”术语,这标志着“人工智能”这门新兴学科的诞生。
2.2.2 人工智能的二次低谷
从1956年正式提出人工智能学科之后一直到20世纪80年代末期,人工智能的发展经历了二次低谷。第一次低谷是到了70年代,由于科研人员在人工智能研究中对项目难度预估不足,导致与美国国防高级研究计划署的合作计划失败,让大家对人工智能的前景蒙上了一层阴影,人工智能遭遇了长达6年的科研低谷。到了80年代初期,卡耐基梅隆大学为DEC公司设计了一个专家系统,能够自动为购买电脑软件的用户匹配对应的芯片、驱动、数据线和接口,不但效率比销售人员高,每年还能为公司节省几千万美金。许多公司效仿,人工智能研究迎来了新一轮高潮。但很快科学家们发现,系统虽然有用,但应用领域过于狭窄,系统中所需的知识需要预先输入,但当时想要获取计算机能理解的知识并不容易,而且系统的维护费用也较高。于是,人工智能的研究又陷入了第二次低谷。
2.2.3 人工智能的快速发展期
1993年,随着计算机性能的飞速发展、海量数据的累积和人工智能研究者们的不懈努力,人工智能研究领域不断取得突破,迎来了快速发展时期。2006年,Jeffrey Sinton提出深度学习的算法,借助这种算法,科学家们不断在众多领域取得研究突破。人工智能的发展进入了快速发展时期。
目前百度、科大讯飞、Google、有道等公司纷纷研发出基于神经网络翻译引擎技术的人工智能机器翻译系统。
3.1.1 百度翻译
2015年,百度率先在机器翻译系统中采用深度神经网络技术,推出全球首个神经网络赋能的机器翻译服务,并在同年实现了基于神经网络的离线翻译,机器翻译质量由此有了质的提升。百度自然语言处理部首席科学家、技术委员会主席吴华认为,“神经网络的应用是推动机器翻译真正落地的重要里程碑,在神经网络的框架下,我们能够在多个语言对之间共享语义表达,无须为每个语言对单独构建编码器或解码器,这意味着可以在没有语料库的情况下也能提高翻译质量。”[3]
3.1.2 科大讯飞翻译
2018年4月,科大讯飞推出最新人工智能机器翻译研究成果—讯飞翻译器2.0。该款翻译器可以实现中文与33种语言的即时互译、拍照翻译和方言口音的识别功能。基于神经网络的方言识别技术,就算是用方言或带方言口音的非标准普通话,也可轻松实现即时翻译功能。目前该款翻译器可以支持粤语、四川话、东北话、河南话等;对英语方言也可以识别,比如伦敦腔、美国乡村腔、日本腔英语、印度腔英语等,均可以清晰分辨。
3.1.3 Google翻译
Google 翻译是谷歌公司提供的一项免费翻译服务。功能主要包括:即时翻译,只需输入文字,即可在超过100多种语言之间随时互译;拍照翻译,可使用相机将拍摄的文字即时互译;点按翻译,在任何应用中点按文字,系统即会弹出相应翻译;语音翻译,支持32种语言的即时语音互译;离线翻译,即使没有连接到互联网,也能翻译52种语言;手写翻译,以手写方式输入93种语言的字符,无须使用键盘输入;翻译收藏夹,点击星标可收藏翻译的内容,供日后参考。另外,一些词典上查不到的俚语、俗语等,也可通过Google翻译搜索,即使查不到直接的解释,也可以通过搜索到的上下文内容来猜测其含义。
3.1.4 有道翻译
2018年4月,网易有道在全球移动互联网大会(GMIC)上发布了基于离线神经网络翻译技术(YNMT)的实景AR翻译技术,可以支持中、英、日、韩四种语言,整个翻译过程可实现动态离线完成。目前有道翻译的主要功能还包括:支持107种语言的翻译、拍照翻译、语音翻译、同传翻译、在线翻译、离线翻译、网页翻译和逗趣的表情翻译等。
3.2.1 源语言文本
句子1:世界那么大,我想去看看。
句子2:生如夏花之绚烂,死如秋叶之静美。
句子3:幸福和美好未来不会自己出现,成功属于勇毅而笃行的人。
句子4:当今世界正处于大发展大变革大调整时期,世界多极化、经济全球化、社会信息化、文化多样化深入发展,各国相互联系和依存日益加深。同时,国际形势中不稳定不确定因素增多,单边主义、保护主义、逆全球化思潮抬头。
句子5:世人都晓神仙好,惟有功名忘不了,古今将相在何方,荒冢一堆草没了。世人都晓神仙好,只有金银忘不了,终朝只恨聚无多,及到多时眼闭了。世人都晓神仙好,只有娇妻忘不了,君生日日说恩情,君死又随人去了。世人都晓神仙好,只有儿孙忘不了,痴心父母古来多,孝顺儿孙谁见了。
3.2.2 人工译文
句子1:The world is so big, I want to see it.
句子2:Let life be beautiful like summer flowers and death like autumn leaves.
句子3:Happiness and a bright future do not appear automatically. Success only belongs to those who are brave and persevering.
句子4:The world is undergoing major development, changes and adjustments. The trend toward multi-polarity, economic globalization,IT application and cultural diversity is deepening. Countries are increasingly interconnected and interdependent. Meanwhile, the world is witnessing growing instabilities and uncertainties, with unilateralism, protectionism and de-globalization on the rise.
句子5:All men long to be immortals, Yet to riches and rank each aspires, The great ones of old, where are they now? Their graves are a mass of briars. All men long to be immortals, Yet silver and gold they prize, And grub for money all their lives, Till death seals up their eyes. All men long to be immortals, Yet dote on the wives they’ve wed, Who swear to love their husband evermore, But remarry as soon as he’s dead. All men long to be immortals,Yet with getting sons won’t have done, Although fond parents are legion, Who ever saw a really filial son?
3.2.3 机器翻译译文3.2.3.1 百度翻译译文
句子1:The world is so big, I want to see.
句子2:Life is like summer flowers, death is like autumn leaves.
句子3:Happiness and a bright future do not appear on their own. Success belongs to those who are brave and committed.
句子4:Nowadays, the world is in a period of great development, great change and great adjustment. With the deepening development of world multipolarity, economic globalization, social informatization and cultural diversity, countries are increasingly interconnected and dependent on each other. At the same time, there are more uncertainties and uncertainties in the international situation. Unilateralism, protectionism and anti-globalization are on the rise.
句子5:Everyone knows that immortals are good, but their fame and fame will never be forgotten. Where will the past and the present be? There is no grass in the mound. The world knows that immortals are good. Only gold and silver can not be forgotten. Eventually, they only hate to gather together, and their eyes are closed for a long time. Everyone knows that immortals are good. Only a lovely wife can’t forget them. On your birthday, you say kindness, and you die with others. Everyone knows that immortals are good. Only children and grandchildren can’t forget them. They have been obsessed with their parents for a long time. They are filial to their children and grandchildren.
3.2.3.2 科大讯飞翻译译文
句子1:The world is so big, I want to see it.
句子2:Life is like the glory of summer flowers, and death is like the beauty of autumn leaves.
句子3:Happiness and a bright future will not appear automatically. Success only favors those with courage and perseverance.
句子4:The world today is undergoing a period of great development, great changes and major adjustments. The world is multi-polarized, economic globalization, social information, and cultural diversity are deepening, and countries are increasingly interconnected and dependent. At the same time, uncertainties and uncertainties in the international situation have increased, and unilateralism, protectionism, and counter-globalization have risen.
句子5:The world knows the gods well, but the fame can’t be forgotten. The ancient and the modern will be where they are, and the ridiculous pile of grass is gone. Everyone knows that the gods are good. Only gold and silver can’t be forgotten. In the end, they only hate to gather together, and for a long time they close their eyes. Everyone knows the gods, and only the wife can’t forget. On the birthday of Jun, he said that he was kind, and he died. Everyone knows the gods are good, only the children and grandchildren can’t forget, the infatuated parents have come from many times, and the filial sons and grandchildren have met.
3.2.3.3 Google翻译译文
句子1:The world is so big, I want to see it.
句子2:Life is like the glory of summer flowers, and death is like the beauty of autumn leaves.
句子3:Happiness and a bright future will not appear on its own, and success is a person who is brave and limp.
句子4:The world today is undergoing a period of great development, great changes and major adjustments. The world is multi-polarized, economic globalization, social information, and cultural diversity are deepening, and countries are increasingly interconnected and dependent. At the same time, uncertainties and uncertainties in the international situation have increased, and unilateralism, protectionism, and counter-globalization have risen.
句子5:The world knows the gods well, but the fame can’t be forgotten. The ancient and the modern will be where they are, and the ridiculous pile of grass is gone. Everyone knows that the gods are good. Only gold and silver can’t be forgotten. In the end, they only hate to gather together, and for a long time they close their eyes. Everyone knows the gods, and only the wife can’t forget. On the birthday of Jun, he said that he was kind, and he died. Everyone knows the gods are good, only the children and grandchildren can’t forget, the infatuated parents have come from many times, and the filial sons and grandchildren have met.
3.2.3.4 有道翻译译文
句子1:The world is so big, yet I owe it a visit.
句子2:Let life be beautiful like summer flowers and death like autumn leaves.
句子3:Happiness and a better future do not come by themselves. Success belongs to the brave and earnest.
句子4:The world today is undergoing major development, major changes and major adjustments. The trend towards a multi-polar world, economic globalization, social informatization and cultural diversity is gaining momentum, and countries are increasingly interconnected and interdependent. At the same time, factors of instability and uncertainty are on the rise in the international situation, and trends of unilateralism, protectionism and anti-globalization are on the rise.
句子5:The world all know the immortal is good, but the fame can not forget, ancient and modern phase in where, a pile of grass barren mound. People all know the gods are good, only gold and silver can not forget, eventually only hate to gather no more, and to many eyes closed. The world all xiao fairy good, only the wife can not forget, your birthday said kindness, you died with the people. The world all xiao immortal good, only the children can not forget, spoony parents ancient, filial son who saw.
对句子1“世界那么大,我想去看看。”的翻译,四款软件的译文都比较准确通顺,其中百度、讯飞和Google的译文与人工译文基本相同。
第2个句子“生如夏花之绚烂,死如秋叶之静美。”是印度诗人泰戈尔《飞鸟集》中的一句诗,原文是英语,由我国翻译家郑振铎翻译成中文。四款软件的译文基本都将原文的意思传达清楚,并且语法正确。科大讯飞和Google的译文相同,有道的译文则与英语原文完全一样。
对句子3“幸福和美好未来不会自己出现,成功属于勇毅而笃行的人。”的翻译,四款软件的译文虽然都有不足,但是原文的意思基本都传达出来了。科大讯飞的译文相对其他三款软件的译文质量更好一点,Google翻译对“成功属于勇毅而笃行的人”这句话的原文意思理解有误,导致译文错误。
句子4的内容选自2018年12月“中国对欧盟政策文件(China’s Policy Paper on the European Union )”,人工译文是该文件的官方英文版本。按照严复“信、达、雅”的翻译原则来看,上述四款机器翻译软件对句子4的翻译都可以做到“信”的标准,“达”的标准也基本可以满足,但都还有些欠缺。比如说对于“国际形势中不稳定不确定因素增多”中的“不稳定不确定因素”的翻译,人工译文是“instabilities and uncertainties”,百度、讯飞、Google的翻译都是“ uncertainties and uncertainties ”,有道的翻译是“ factors of instability and uncertainty ”。还比如对“逆全球化思潮抬头”中“逆全球化思潮”的翻译,人工译文是“de-globalization”,百度和有道的翻译都是“ anti-globalization ”,讯飞和Google的翻译都是“ counter-globalization ”。由此可见,对于一些常见的句子和表达方式,机器翻译虽然各有不同的翻译版本,但基本都可以做到忠实准确地传达原文的内容,但是对于一些原文意思较接近的词语和表达方式,机器翻译目前还不能做到准确识别它们的区别。
句子5的内容是曹雪芹《红楼梦》中的《好了歌》,人工译文是杨宪益、戴乃迭翻译的版本,译文虽然能将原文的意思忠实传达,但是原文特有的节奏美、韵律美却很难传达。对句子5的翻译,上述四款机器翻译软件的质量都不是很好,译文让人看后有种不知所云的感觉。由此可见,对于文学作品的翻译,目前对机器翻译来说还是一个很大的挑战。
通过对当前市场上常用的四款机器翻译软件译文与人工译文的对比分析,我们可以发现,虽然目前机器翻译对于文学作品和一些专业性较强的文本的翻译质量还不尽如人意,但是对于一些简单常见的文本的翻译,机器翻译的质量几乎和人工翻译不相上下。
人工智能技术在机器翻译领域的应用与发展,为机器翻译质量的提升带来了新的跨度。当前基于神经网络的神经机器翻译系统,翻译的准确度和流畅度都比传统机器翻译系统有了一个很大的提升。Google全球技术总监、中国上海研发院院长陈晓认为,“这个提升的跨度比近十年来在原来系统中所有的质量优化所提高的总和还要多, 也看到某些语言已经达到了人工翻译的水平,相当喜人。”[4]同时人们也开始担心随着人工智能技术的飞速发展,未来的人工智能机器翻译是否会替代人工翻译?
通过对上述四款常用机器翻译软件译文与人工译文的对比分析,我们可以发现,目前的机器翻译软件还无法完全替代人工翻译。这主要是因为对于一些翻译质量要求较高的翻译,比如高端的商务活动、专业论文或是文学作品等的翻译,目前机器翻译还无法胜任,只能依靠人工翻译。目前机器翻译最胜任的是简单的旅游外语翻译,因此目前机器翻译与人工翻译还不构成竞争关系,机器翻译仅仅可以替代翻译过程中的一些初级和简单的翻译工作,但是还无法替代高端翻译人才。
苏州大学熊德意教授认为,“机器翻译效果仍需通过不断研究来去提高,未来机器翻译研究人员一定会找到新的课题。而做人工翻译的人也不用担心,但要掌控人机协同技术。机器翻译可以提升效率,做以前做不了的事情,会挖掘出更多的翻译需求。翻译公司可以拥抱机器翻译,尝试与AI技术企业去合作。”[5]
尽管目前人工智能技术背景下的机器翻译质量仍有不足之处,但是当前基于神经网络的神经机器翻译系统的翻译质量已经比传统机器翻译系统有了一个很大的提升。从目前来看,人工翻译仍有着机器翻译无法替代的地方,未来的机器翻译将会朝着机器翻译与人工翻译相结合的方向发展,更好地辅助人工翻译,提高翻译效率。相信随着技术的深入发展,人工智能必将再次赋能机器翻译,机器翻译的质量定会取得新的突破与提升,为人类的融合与交流做出更大的贡献。