刘琢
摘 要:语言在沟通中所起到的重要作用已是世所公认的事实。在这种情况下,能够兼顾高质量与高速度的翻译需求开始日益迫切,而机器翻译的出现就很好地满足了这种需求。机器翻译的设想被提出,并且在时间的推移与技术的变革中不断衍进。本文将主要探讨机器翻译研究的起源和发展与展望机器翻译的未来发展趋势。
关键词:机器翻译;机器翻译研究
1 引言
机器翻译(Machine Translation)想必是大家最耳熟能详的人工智能应用之一了,它不仅是计算语言学(Computational Linguistics)的瑰宝,同时也是居家旅行的必需品。机器翻译,又称计算机翻译,是指利用计算机将一种语言符号转换成另一种语言符号。(胡开宝、李翼,2016)
机器翻译的雏形最早可以追溯到1933年,一位苏联科学家利用卡片、打字机和旧式胶片相机发明了一个简易的机械式翻译器。然而,这个发明并没有引起任何人的注意,也没有留下实物或照片。1946年,第一台电子计算机 ENIAC 诞生之后,美国科学家 Warren Weaver 就开始思考如何更好地利用计算机“为人民服务”。图灵在二战期间利用机器破译密文的事迹给了他机器翻译的灵感,即翻译也可以看成是一种编码和解码的过程。
而机器翻译(machine translation,MT)的研究始于20世纪50年代,其目的是自动翻译俄美文本,以便在冷战中快速获取对方的科学情报。恰逢冷战初期,翻译外文(尤其是俄文)的情报与文献是美国的一个刚性需求。在政治与科技的历史进程的双重推动之下,1949年,Warren 正式在《翻译备忘录》中提出机器翻译的思想。1954年,美国 Georgetown-IBM 实验室成功利用 IBM 701 计算机将60句俄文句子翻译成了英文。彼时计算机的运算能力和存储能力相对较弱,美国、俄罗斯、法国、德国、意大利和日本的研究人员花费了30年时间为它奠定计算基础,而它现在正在改变世界的交流。自20世纪80年代开始,机器翻译在快速处理海量翻译内容上的作用日益突显出来。
2 机器翻译的发展
此后机器翻译的发展,大体可分为四个阶段:基于规则的机器翻译(Rule-Based Machine Translation,RBMT)、基于例句的机器翻译(Example-Based Machine Translation, EBMT)、统计机器翻译(Statistical Machine Translation, SMT)、神经机器翻译(Neural Machine Translation, NMT)。
基于规则的机器翻译以源语的分析规则、源语和目的语之间的转换规则以及目的语语言的生成规则的描写为基础。这些规则的分析涉及词汇、语法、语义等语言层面。(胡开宝、李翼,2016)
基于短语的统计机器翻译模型具有原理简单、性能优异、鲁棒性高等诸多特点, 受到研究与应用人员的广泛青睐, 在当今真实的翻译任务中得到广泛应用。 短语翻译系统使用短语对作为翻译的基本单元, 传统的启发式短语对抽取算法抽取所有与词对齐保持一致的短语对。(李强、李沐、张冬冬、朱靖波,2016)基于统计的机器翻译方法建立在大规模双语及单语语料的基础上。
在2017年的《机器翻译市场报告》中,我们着眼于机器翻译市场中不同类型的参与者,特别关注了新近出現的神经机器翻译。神经机器翻译是近几年兴起的机器翻译方法。(Koehn P, Och F J, Marcu D.,2003)神经机器翻译的核心思想是使用一个循环神经网络将源语言句子编码为一个稠密向量,然后从该向量解码出目标语言句子。(哈里旦木·阿布都克里木、刘洋、孙茂松,2017)尽管面临很多挑战,机器翻译乃是大势所趋,我们依然期待这项技术被广泛应用。
3 总结与展望
当然,任何一个成熟的机器翻译工业产品都不可能只靠一种模型,而应该是多种策略组合的结果。机器翻译相关的研究一直以来都是推动计算语言学发展的最主要的动力之一,这四个阶段的发展与计算语言学整体的走向也是一脉相承。尽管机器翻译有时的效果不尽如人意,但是忽视或否认它所带来的积极作用是不明智的。现在,机器翻译已成为人工翻译过程中的一环,用来补充或替代过去的翻译记忆工具。而近期出现的神经机器翻译则更向前迈进了一步,将机器学习的潜能与现存数据量和计算速度相互融合,以期达到完美的翻译效果。最后,引用报告中的一段话:机器翻译正在商品化,而影响商品化经济增长的主要因素则体现在语言数据上。机器翻译是“使能者”,也是“融合时代”的重要组成部分。机器翻译赋予了沟通交流以全新的展现形式,包括可穿戴技术、搜索、社交媒体、物联网、聊天机器人等等,当然还有更多的其他应用领域。
参考文献
[1]胡开宝,李翼.机器翻译特征及其与人工翻译关系的研究[J].中国翻译,2016(5)
[2]李强,李沐,张冬冬,朱靖波. 统计机器翻译中实例短语对研究[J].北京大学学报(自然科学版),2016(1)
[3]Koehn P, Och F J, Marcu D. Statistical phrase-based translation //Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology-Volume 1. Edmonton: Association for Computational Linguistics, 2003
[4]哈里旦木·阿布都克里木,刘洋,孙茂松.神经机器翻译系统在维吾尔语-汉语翻译中的性能对比[J].清华大学学报 (自然科学版),2017(8)