贺丽媛
摘 要:21世纪技术领域的重大变革使“人工智能”一词逐渐为我们耳濡目染,这无疑是一个很宽泛的话题。从几乎人手必备的智能手机到无人驾驶汽车的试运行,当今我国人工智能在人脸识别、语音识别、安防监控、智能音箱、智能家居等领域均走在国际前沿,无一不令人叹为观止。深度学习即成为当下热门研究领域,文章以该领域下的一个重要应用分支—机器翻译为实例,探讨人工智能的发展现状、技术特点以及当前存在的一些弊端。
关键词:人工智能;深度学习;机器翻译
人工智能即旨在使机器能够胜任一些通常需要人类智能才能完成的复杂工作。近年来,大数据、物联网、云计算这些IT行业最新的技术发展趋势正推动着这一学科的兴起,并使其广泛应用于语音识别、图像识别、自然语言处理以及专家决策等研究领域。因其实力差异,人工智能又可分为弱人工智能、强人工智能和超人工智能,但强人工智能和超人工智能还未真正实现。当下我们身边随处可见的生活助手、智能家居、智能建筑等其实都是一种弱人工智能的体现,即专注于实现某一特定方面的功能,并可以与人类媲美甚至超越人类。从深蓝到战胜围棋世界冠军的AlphaGo,它们采用的核心技术就是深度学习算法。作为机器学习的诸多方法之一,深度学习的灵感来源于人类大脑的结构和功能,通过模拟神经元间的互联关系从而构建人工神经网络以进行反复“训练”直至输出期望值,本文要探讨的机器翻译正是基于这种原理。
1 机器翻译的发展现状
在人工智能技术尚未发展成熟之前,传统人工翻译一直扮演着举足轻重的角色。直至当今,诸如Google翻译、阿里翻译、百度翻译等AI行业巨头推出的翻译平台逐渐凭借其翻译过程的高效性和翻译结果的准确性占据了翻译行业的主导地位。其中,Google公司提供的机器翻译已经将汉译英的正确率和专业化程度提升到了一个新的高度,并受到社会各界人士的认可。一项在20世纪需要语言专家连续工作若干小时才能完成的翻译工作在今天或许只要在机器前守候几秒钟即可呈现出完整的翻译结果,这是一种跨时代的技术飞跃。
总而言之,机器翻译的问世实则是生产力大幅度提高的一种体现[1]。首先是节省了资源成本,不像传统人工翻译要求大量人力参与,且后期还需反复校对核查的繁琐流程,机器翻译全程仅需要一台计算机和电源即可,且不会出现拼写遗漏等低级错误,其工作的高效性是人工所不能媲美的。其次,因其背后的大数据支持和拥有强大的计算机系统作为支撑,机器翻译能够在确保正确率和即时性的条件下表现出与时俱进的特性。通过不断“训练”以自动完善和优化内部网络结构,从而进一步提高翻译质量。
2 机器翻译的技术特点
机器翻译因工作原理的不同可分为基于规则的机器翻译、基于统计的机器翻译和基于神经网络的机器翻译。基于规则的机译系统以词典和语法规则库作为知识提取源,并结合语言学领域的专家知识以进行源语种到目标语种的转换,其实也可以说是一种符号的变换。因为它更多时候是在对语法进行剖析的基础上展开翻译工作,而不曾深入到语义层面,实为一种“直译”。基于统计的机器翻译实则是一种基于语料库的机译系统,不同于前者,它的语料库已经过严格划分并加以标注,其工作原理可以类比为一种语言信息在信道传输的过程。机器会默认源语言库中的任何一句话都可能与目标语言库中的某句话形成映射关系,不同的只是这种关系的产生概率,因而其目标就是寻找概率最大的句子作为译文予以呈现,这其实也是一种统计学思想。
当下深度学习的热潮已席卷全球,循环神经网络及其重要变型、卷积神经网络等具有不同拓扑结构的人工仿生网络在自然语言处理上均具有突出效果。这里将着重对后者,即通过构建人工神经网络,采用深度学习算法以实现的机器翻译模型进行探讨。在该种翻译模型中,诸如词汇、短语、句子等自然语言的基本组成单位均采用连续空间来表示,其中的人工神经网络则用于实现由原文至译文的直接映射,而无需经过依存分析、规则抽取、词语对齐等基于统计的机器翻译才涉及的处理过程。在实际语句转换过程中,原文语言序列的输入由编码器读入并以一定维度的语义向量作为输出,再由解码器对其进行解码,进而输出目标语言序列,即翻译后的结果[2]。这种采用编码—解码形式的机器翻译能够自发地从语料库中学习语言特征,而无需在深度学习算法中设定相关特征值以阐述翻译规律,因而在对自然语言的处理过程中省去了特征设计的工作,其模型架构如图1所示。
3 机器翻译暴露的弊端
正如任何事物都是作为矛盾统一体而存在,机器翻译也是一把“双刃剑”。当我们采用辩证的眼光去看待它时,其背后的技术支持也并非没有缺陷。高级翻译领域向来都是以“信”“达”“雅”作为标准[3],而机器翻译要想完美复现这3种“译境”,还有待时间的考证。
3.1 语义转换的专业性不足
机器翻译对于基本词汇和常用词组的把控能力不容置疑,但当它用于翻译一些外文文献时,因同一个专业术语在不同学科领域所指代的含义存在差异性,使得机器翻译在该情况下的语义转换还未实现真正的智能化。而人工翻译则能有意识地去判断文献所在的学科领域,并通过查阅相关资料进一步确定其深层含义,从而使译文所阐述的内容与原文不会有太大出入,确保了翻译过程的专业性,此所谓“信”之译境。
3.2 复杂句式处理效果欠佳
限于当前的科技水平,机器翻译对于一些简单句型的处理可谓是得心应手,但一旦碰到复杂句子结构或层层句式嵌套的情况,机器翻译会机械地将其分解为各个子句再进行排列组合,这就是一种断章取义的表现。而人工翻译则会根据具体情况分析其中的逻辑关联再予以拆分,显然后者呈现出的翻译结果将更加自然流畅,此所谓“达”之译境。
3.3 缺乏一定的感情色彩
机器翻译归根到底还是一种无意识的行为,而语言作为文化的载体,它更需要字里行间的情感流露。尤其是诸如诗词歌赋之类的翻译材料,机器翻译的表现不免有些生硬、乏味,甚至会让读者心生一种不食人间烟火的感觉,而人工翻译在这方面的处理则远胜于机器翻译。毕竟语言是人类创造的,通过结合译者丰富的社会经验和生活阅历[4],人工翻译将会使译文的呈现更为生动、形象并颇具情感色彩,进而激发读者的情感共鸣,此所谓“雅”之译境。
4 结语
纵然人工智能在机器翻译领域的应用依旧存在些许弊端,但在对自然语言的处理上,AI科学无疑已经取得了较大突破。我们作为科技成果的体验者,亦不得不承认它的诞生的确为我们的日常生活、工作和学习提供了极大的便利。相信随着AI科学的进一步发展,通过深度学习将有望使机器逐渐掌握各种技能以适应人们的美好生活需求。这场21世纪的伟大技术革命注定会推动弱人工智能向着强人工智能过渡,进而引领人类开創超人工智能时代的历史新纪元。
[参考文献]
[1]张诗博.以机器翻译为例分析人工智能技术的应用[J].农家参谋,2019(5):211.
[2]高明虎,于志强.神经机器翻译综述[J].云南民族大学学报(自然科学版),2019(1):72-76.
[3]徐艳平.人工智能翻译应用前景分析[J].合作经济与科技,2018(19):78-81.
[4]宋仕振.试论机器翻译与人工翻译的未来关系[J].未来与发展,2019(2):25-30.