凌锌燕 罗 淦
(江西科技师范大学,江西南昌 330038)
机器翻译作为翻译领域的人工智能,从基于规则的机器翻译、基于统计的机器翻译发展到如今的神经网络机器翻译,已成为应用于翻译领域的主流技术。随着计算机计算能力的提升、多语言信息的爆发式增长、各大互联网巨头推出的翻译API,使得机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。百度翻译软件在海量翻译知识获取、翻译模型、多语种翻译技术等方面取得重大突破,实时准确地响应互联网海量、复杂的翻译请求。百度翻译所研发的深度学习与多种主流翻译模型相融合的在线翻译系统以及基于“枢轴语言”等技术,处于业内领先水平,在国际上获得了广泛认可。
笔者在此选取两组英汉语言的句子和语篇材料,利用百度翻译进行在线英汉互译。通过下方翻译结果可以看出,首先,采用神经网络机器翻译技术的百度翻译的翻译结果存在一些问题,同人工翻译相比有待提高。第一个问题是漏译,下表中笔者认为源语有些词没有被翻译出来,甚至有的时候输入一个长句子有逗号分隔,有几个子句都没有翻译出来。另个一问题是语篇翻译。当前的机器翻译是单句对照级翻译,不考虑上下文,这就导致译文显得生硬不连贯。但同传统机器翻译结果比较,百度翻译契合受众群体,句子及篇章翻译符合汉语语法规则、表达习惯和汉语受众的认知习惯;同时在语义、语法、语气等方面的准确度有明显提升,翻译结果的实用性也较高。无可置否的是,神经网络翻译技术在翻译简单、真实的句子时的质量还是不错的。如果人类对理解一个句子的意思比对翻译的质量更感兴趣,像百度翻译这样的人工智能翻译软件会非常有帮助。神经网络翻译使用一种机械的、统计的过程来翻译不同的语言。它会标出目标与严重单词和短语出现时的不同模式,并尝试在翻译的时候选择最方便的模式。而语言是一门博大精深的艺术,一个生活中的笑料、一个双关语或是一个带有暗示性的语言,对机器翻译来说是最难克服的障碍。机器翻译的固定模式有时会导致翻译质量变差,从而使我们的表达变得很糟糕;而人工翻译会考虑语言的文化和语境及文字背后的历史及文化背景,同时再对单词翻译前还会对主题进行研究,人工翻译还会就翻译能力习得等人文方面不断地进行自我要求来提高自我。总的来说,人工翻译是一个较为复杂的过程。但当前人工智能背景下的机器翻译仍然缺乏常识和抽象地解决问题的能力,使它能够完全自动化掌握人类语言的学科。
尽管神经网络的机器翻译技术很大程度上提高了翻译的质量,使机器翻译有了质的飞跃,但是在处理感情色彩深厚的复杂文章时,机器翻译与人工翻译的质量的悬殊让人难以接受。一个重要的原因是,当前的神经网络翻译技术其实是模拟人脑处理一些简单的信息,但由于人脑的复杂性,在信息识别和处理、情感认知方面,技术还是无法模仿,更无法复制。中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出,要提升机器翻译的质量,首先要解决的是语言本身问题而不是程序设计问题,如果只是靠一些程序来做机器翻译,是没有办法提高机器翻译质量的。所以,开发人员需要考虑是机器对文本的认知,对翻译文本的选择。
Source language Baidu translation世上本无事,庸人自扰之Nothing in the world is to be bothered by mediocrity.I bundled her up in a blanket and gave her a hot drink. 我把她裹在毯子里,给了她一杯热饮。Source languageBaidu translation The basis of social interactions might change, too, from a set of commitments founded on trust to calculations of risk and reward derived from the information a computer attaches to someone’s face.社会交往的基础也可能发生变化,从建立在信任基础上的一系列承诺,到从计算机附在某人脸上的信息中得出的风险和回报的计算。中方一贯倡导树立共同、综合、合作、可持续的新安全观。我们希望美方能够摒弃零和思维,放弃以对抗视角看待大国关系,顺应和平与发展的时代大潮。China has always advocated the establishment of a new security concept of common, comprehensive, cooperative and sustainable development. We hope that the United States can abandon the zerosum thinking, abandon the view of confrontation on relations between major powers, and conform to the tide of the times of peace and development.
Model Front在这方面可能为人机翻译的结合提供了新的思路。Model Front是对机器翻译句子是否正确的风险预测平台。它使用深度学习和非常大的数据集,采用了一种完全不同的机器翻译风险预测方法,在平衡机器的规模和人工翻译质量方面开辟了许多新途径。首先,不同于BLEU和Meteor等用于在语料库级别评估引擎的质量评估,Model Front可进行实时风险预测,实现客户端应用程序可根据其用户的翻译速度、规模和质量目标决定如何对每个译句的翻译风险做出反应。Model Front还可以让用户立即使用良好的机器翻译,并仅将有风险的翻译发送给人工翻译。其次,也可以按风险对翻译结果进行优先排序,以便人工翻译首先处理风险最高的翻译。
Model Front还可比较来自多个API的翻译以选择最佳译文,用户可以同时对比百度翻译及谷歌翻译等API的译文,优先选择最好的翻译结果。Model Front将Auto ML Translation(利用最新的神经机器翻译技术将字符串翻译成任何支持的语言)的转换与默认翻译API的转换结果进行比较,为每个句子选择最佳转换。该功能为各行业缺少AI经验的企业和开发者提供更好的渠道进行翻译。另外,如果用户知道多种语言,可以使用Model Front控制台将翻译与不同语言进行比较,最终选择控制台所显示的最佳语言。Model Front控制台的诸多功能不仅可以降低人工成本,也可以增强用户,特别是职业译者的信心。比如,当一个翻译团队的成员使用机器翻译文本回复用户或客户评论或电子邮件时,可以在发送之前使用Model Front控制台检查翻译是否存在风险,从而增加对业务工作流程中的机器翻译阅读和撰写的信心。其次比较翻译文本的功能会帮助译者进行筛选,改进译文质量。这些可说明一点,正确使用当今的人工智能技术,其实许多机器翻译的错误是可检测且可预防的。译者也能充分发挥人类的语言优势,花费较少的精力专注于纠正错误的机器翻译结果方面,努力在利用好机器翻译技术的情况下实现译文的“信”、“达”、“雅”,进一步促进人工翻译与机器翻译理性而高效地结合起来。
当前,我们可以看到,机器翻译提高了使用人类语言任务的速度,也减轻了人类大脑的负担。但就现阶段而言,神经网络翻译技术还未成熟,在处理一些语篇和复杂句时,其结果不尽人意。机器翻译与人工翻译的结合也尚不完全,所以,本文想说通过对神经网络翻译技术、翻译风险预测技术及人工翻译的三方结合的可行性分析,实现了一种新型的人机翻译模式的新的可能性,极大概率地减少和修正翻译错误,这种人机翻译更高层次的结合也许才是不断提高翻译质量的可行性路径。