郭明阳, 张晓玲, 唐会玲, 孟庆端,任龙波
(河南科技大学 a.外国语学院;b.信息工程学院;c.电气工程学院, 河南 洛阳 471023)
1 人工智能在机器翻译中应用的研究意义
人工智能(artificial intelligence,AI)是指研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着计算机技术与信息技术的快速发展,人工智能对机器翻译进行了整体阐述,主要包括自然语言处理、机器人学和知识系统等方面。机器翻译是自然语言处理技术的一个分支,注重利用计算机技术实现一种人类语言(源语言)到另外一种人类语言(目标语言)的自动翻译或转换。例如,借助于人工智能技术,翻译者和技术人员可以首先对机器的整体翻译方案开展均匀抽样;然后采用蒙特卡罗等方法模拟具体文本的翻译过程,计算每种排布方式下的机器翻译效率,从而生成大数据翻译样本供人工智能算法学习,进而采用人工神经网络高效地拟合出翻译架构排布与机器翻译效率之间的关系;最后结合遗传算法寻找机器翻译的最优排布方式。人工智能技术已经应用于以谷歌翻译、百度翻译为代表的网络即时翻译和以译星、雅信译霸为代表的专业翻译系统中。
人工智能技术虽然尚处于发展阶段,但其应用前景是非常明晰的。2017年7月,国务院发布了《新一代人工智能发展规划》,人工智能已经成为重要的国家战略。各大经济体均处于同一起跑线上,对人工智能的研究和应用均处于投入探索阶段[1]。结合中国国际贸易高端人才不足、知识经济生产力发展亟待提速等问题,在新经济时代人工智能技术给了中国难得的赶超机会。翻译能力的核心在于与翻译过程中的各方保持积极的活动关系,并生产出符合客户要求的译文[2]。人工智能以及机器翻译的各项技术加速发展,正在不断地提升人类对于各种语言信息的处理能力,弥补人工翻译在速度和成本方面的不足。智能语音、深度学习、神经网络机器翻译等技术越来越成熟,人工智能给许多行业带来了重要影响和挑战[3]。
伴随着人工智能的进一步发展,机器翻译能够更好地满足大多数一般性翻译需求,但面对专业、多元、细致并蕴含人文情感的复杂沟通翻译任务,机器翻译目前仍然难以替代人工翻译。当前人工智能发展中显现出互为镜像、互为嵌入和互为信息的人机关系趋势[4]。因此,目前机器翻译会和人工译员一起协同工作。但是,在这种协作翻译的关系中,以前简单的“机器辅助翻译”模式已经越来越多地被人工智能交互翻译(artificial intelligence interactive translation,AIIT)所取代,这是翻译技术能力的进步[5]。机器翻译和计算机辅助翻译的很多工作,也将会由日益完善的人工智能交互翻译来完成。
人工智能在机器翻译中的广泛应用程度与人工智能技术的进步和机器翻译功能的提升有关,这一点在专业翻译中体现得尤为明显。严格意义上来讲,计算机网络信息本身是一个庞大的数据信息库,而这个数据库又是由海量的子数据库构成的[6]。有些翻译语料所涉及的领域很多,技术性和专业性都很强,而且语料内容信息丰富,因此文本内容会经常出现重复现象。根据相关统计数据显示,有些需要机器翻译的技术资料相关内容重复率能达到40%以上。针对这种情况,人工智能可以依据机器翻译的基本原理——翻译记忆自动对重现的语料成分进行翻译,例如对前文翻译过的语句或者语段部分进行快速比对,然后高速呈现翻译结果,这样就极大地提高了机器翻译的工作效率,并且能够保证机器前后翻译内容具有一致性,从技术层面上保证了译文具有更高的质量。
出于提升翻译效率和确保翻译内容一致性的考虑, 人工智能在机器翻译的应用系统中,通常会设置系统翻译组件,例如翻译记忆库和术语管理组件。翻译记忆库主要是指人工智能在机器翻译系统中所构建的语料原文和翻译内容相对应的等值语料库。当机器翻译系统开始进行翻译工作时,人工智能会自动对需要翻译的文本资料在翻译语料库中进行存储和比对,在整个翻译过程中,人工智能通过对程序代码进行扫描,发现有相似或相近的翻译内容时,人工智能系统会自动将其与翻译语料库内容进行匹配,通过语境和语言使用系统进行确认后,就可以快速将最终翻译结果呈现在用户界面。随着人工智能技术的不断提升,能够支持模糊匹配的机器翻译系统也在不断升级,人工智能系统通过对算法的不断改进,可以自动设置语料原文和译文之间的最小匹配值(如60%或者80%)。然后,通过模糊匹配程序搜索翻译记忆库中的语料,即便是对于那些不能实现完全匹配的句型,人工智能也可以通过机器翻译达到相似的内容确认,再通过语言使用系统或者人工译员进行确认,实现人工智能与人工译员的互动互助。目前,这样的工作模式既能够保证高水平的翻译质量,又能够让机器翻译通过人工智能的自我学习程序提升翻译的质量和效率。
未来,学习能力和数据处理能力更加强大的人工智能系统将帮助机器翻译更好地完成工作。现有的翻译记忆库通过人工智能的自我学习程序也可以不断更新,并能够自动识别和存储新语料。随着翻译记忆库数据的不断扩大,在大数据技术的支持下,人工智能能够使机器翻译的工作效率不断提升。通过网络共享功能,人工智能可以通过对海量网络翻译数据进行精确算法分析,从而提升人工智能的自我学习能力,使机器翻译越来越接近人工翻译的质量。
进入21世纪以来,人工智能技术快速发展,应用领域也越来越广泛,尤其是专家系统技术、人工神经网络和智能决策支持系统在机器翻译的研究和应用中取得了显著进步。
3.1.1 专家系统技术在机器翻译中的应用
从近些年人工智能研究的成效来看,知识库专家系统和知识工程成为人工智能研究领域最具有实践意义的成果,并进行了商业化运作,经济效益初现。所谓专家系统,是指一种基于知识的系统,其实质是使系统的构造和运行都基于控制对象和控制规律的各种专家知识的数据积累。这种人工智能的电脑程序构建了一套具有某个专业领域专家的知识和经验水平的集成系统,并具备解决实际专业问题的能力。发展专家系统的关键在于表达和运用专家知识,即来自人类专家的且已被证明能够解决某领域内典型问题的有用的事实和过程[7]。随着专家系统和翻译大数据技术的不断完善,人工智能可以根据多位翻译专家分享的翻译领域知识、工作经验进行有效地推理和判断, 模拟翻译专家决策的过程来解决那些翻译实践中遇到的各种复杂问题。
(2)力学性能检测 试件按照ASME IX卷要求进行取样和力学性能试验,取样位置如图1所示,各项检测结果如表6~表9所示。
专家系统技术在机器翻译中的应用主要基于翻译专家的专业知识和实践经验,采用知识表达翻译技术,建立翻译模型和翻译数据库,利用语言知识和以往的翻译工作经验进行语义推理,制订翻译决策控制机制,为机器翻译提供最优控制以及决策支持等。翻译专家系统的出现,改变了过去传统翻译单纯依靠字对字、词对词翻译的落后局面,使知识模型与翻译大数据进行了有机整合,将知识信息处理技术与控制技术相结合,使机器翻译的效率和准确率都有了很大程度的提升。
3.1.2 人工神经网络在机器翻译中的应用
神经网络的信息处理是由神经元之间的相互作用实现的:知识与信息的存储主要表现为网络元件互连间分布式的物理联系[8]。近年来,人工神经网络在机器翻译中的应用领域取得了很大的进步,具体体现在机器翻译算法、语言学习等方面,并在文字符号处理、语音识别、最优计算、语言信息智能处理、翻译模式识别等领域不断取得进展。例如谷歌公司的神经机器翻译(Google’s neural machine translation,GNMT)系统,由带有8个编码器和8个解码器的深度长短期记忆(long short-term memory,LSTM)网络组成,并采用了残差连接对梯度、位置信息等进行传递,在英-西、英-中和英-法等多个语对中,与之前的基于短语的机器翻译(phrase-based machine translation,PBMT)系统相比,翻译错误率降低了60%,已经与人类中级译员的水平不相上下。
随着中国“一带一路”倡议的提出和逐步实施,客观上沿途各国间的交流沟通有了更广泛的需求,尤其是在语言转换处理和商务信息交流方面为机器翻译提供了广泛的市场需要,也蕴含着巨大的市场价值。随着机器翻译功能的不断提升,在文化教育交流和商务洽谈中需要使用机器翻译功能的应用场景也越来越多,互联网上语言翻译的市场需求也愈来愈大,要对机器翻译系统进行有效管理,提升机器翻译的效率,保证翻译的质量就需要人工智能,尤其是人工神经网络。为了使机器翻译的各项系统正常运转且能降低运行成本,提高经济效益,就要不断提升机器翻译的自动控制水平、语言信息快速处理能力和翻译系统运行管理水平。人工智能的自主学习和深度学习功能,为具有快速学习与自适应能力的人工神经网络在系统控制方面提供了监督与非监督操练。人工神经网络在机器翻译中的应用包括练习语言输入与输出集合、调节神经元加权系数、语言信息的分类与自组织,并为机器翻译系统的高级控制奠定了坚实的基础。
在人工智能的控制下,机器翻译能够按照不同的数学建模方式,采用多元化的翻译策略,根据不同的信息运算和处理原理进行实际运作。例如,机器翻译能够自主研究不同语言符号的特征,构建出准确有效的翻译算法,并且通过适时调节翻译参数来确定不同的翻译标准,以适应译文的文化和语言特征,并能够在人工神经网络的控制下,对于智能机器翻译设备的实时运行动态和语言信号处理进行有效地检测、调节及故障诊断,进而研制出具有高效自主学习能力、自主适应功能和自主管理功能的创新性的智能自动化控制系统。这一系统在机器翻译设备上的有效应用极大地提高了机器翻译的效能。同时,机器翻译控制需要准确的语言结构仿真模型,以及准确、灵活的信息处理系统。由于早期机器翻译模式的非互联性,机器翻译的语料信息不能及时更新,机器翻译的控制系统无法实现在线运行和实时更新。而在新的人工神经网络语言信息翻译处理模型中,由于采取动态学习更新建模的方式,提升了翻译模型的运转效率。并且这类机器翻译产品在投放市场时,能够根据不同消费群体的需要和物价承受能力,采用个性化、差异化的机器翻译资源和硬件配置,更好地控制了硬件部分的花费,满足了更多消费者不同的翻译需求。尤其是更新的神经网络学习策略搭载性能具有更强大的信息处理芯片,实现了真正意义上的神经网络运算和人工智能控制,使机器翻译产品的性能不断提升。由此可以看出:带有人工神经网络的机器翻译产品,在未来的实际生活使用中能够更加贴切地满足个人用户和个性化需求。同时智能化的机器翻译系统预示出了人工智能语言学习模式的更新,提升了以往机器翻译产品的运算速度和翻译质量。这一崭新的机器翻译和语言学习模式的研发,将会给不同文化背景和语言使用者带来高效率、低花费的应用体验。
3.1.3 智能决策支持系统在机器翻译中的应用
伴随着超级计算机运算技术、网络数据库技术和物联网技术的高速发展,智能决策支持系统在机器翻译中也开始了部分翻译场景的应用。网络数据库技术、云计算和深度学习使智能决策这一人工智能技术控制机器翻译成为可能,尤其是分布式数据库和网络互联计算技术的发展,更有利于将智能决策系统融入到机器翻译智能化系统集成中,使得机器翻译实现智能化。
智能决策支持系统整合了超级计算机技术、人工智能技术和管理科学的相关研究成果,是一种有利于提升机器翻译效度和信度的创新性的信息管理技术。这项人工智能信息管理技术依托运筹学、管理科学和控制论行为科学的最新研究成果,积极采用最新的计算机信息挖掘技术,在处理半结构化和非结构化的翻译决策问题中成效显著。在对译文翻译质量的最终控制方面,智能决策支持系统能够进行有效的决策活动,为机器翻译最终产品的呈现提供决策所需要的数据、信息和资料,并能够明确决策目标。在针对不同机器翻译问题时,智能决策支持系统也能够对遇到的翻译问题进行快速地甄别和认知,并建立和整改决策计算模型,提供尽可能多的翻译备选译文。智能决策支持系统可以帮助翻译机器对各种翻译技术方案进行优化,并能够分析、区分出不同质量的翻译作品,不断提升机器翻译的决策能力、决策质量和决策效益,以产生更大的经济效益和社会效益。
3.1.4 人工智能技术在机器翻译中的应用场景及优缺点对比分析
基于人工神经网络技术的机器翻译优势在于翻译反应速度快、用户花费少,可应用于工作量大的翻译项目,但其自身也存在着一些问题。例如,神经网络翻译系统一般包括两个递归神经网络(recurrent neural network,RNN),其中一个主要用来接受输入文本,将输入的源语言文本转化为表征空间中的向量,另一个递归神经网络主要是将其转化为目标语句。可以将其视为一个语言模型来预测目标语言的下一个词汇文本信息,而且其概率依赖于源语言,并通过注意力网络连接。但这样的架构需要海量的计算资源,而且人工神经网络翻译系统在应对专业术语和非常用翻译文本方面表现乏力。很多情况下只能对原文进行复制,而没有进行任何翻译操作。在处理冗长文本信息时,基于人工神经网络的机器翻译会出现文本信息丢失的现象,甚至会遗漏重要的文本信息。所以人工神经网络一般应用于网络即时翻译场景,主要为了满足一般性的翻译需求。神经网络翻译技术还在不断发展,例如,随着大数据技术和波束搜索等技术的发展,其翻译准确率也在不断提升。谷歌的神经机器翻译系统宣称,在多个主要语言对的翻译中将翻译误差降低了55%~85%。
专家系统技术在机器翻译中的应用,有效解决了人工神经网络机器翻译存在的许多问题,例如,目前的人工神经网络在文本翻译时过多地只关注单词和句子信息的翻译,而忽视段落结构及文本上下文语境信息的连接,词汇文本信息在不同语境下的语言含义搜索和识别效率不高。但专家系统自身也存在着信息更新速度慢、系统构建要求高、建设费用投资大、建设周期长、应用领域过于细化等问题,所以专家系统技术多应用于专业领域的高端翻译场景,在高级译员培训、复杂语言信息识别、翻译技术信息库建设和翻译技术资源网站开发等方面应用比较广泛。
随着经济发展模式的不断创新,新的翻译需求也呈现多样性和定制化的特点。智能决策支持系统在垂直领域以及机构定制化机器翻译系统中得到了应用。翻译市场对于机器翻译的实用性和灵活性的要求不断促使智能决策支持系统对机器翻译、CAT工具、术语管理等翻译技术进行整合,尤其是对本地化工具、翻译管理系统、计算机辅助翻译等组件进行架构重组。但由于人工智能技术还处于不断发展的阶段,智能决策支持系统的发展还不甚完善,其建设过程还面临着很多技术挑战,例如人工智能技术的不确定性发展、人机信任机制建立等具体问题,所以,目前智能决策支持系统主要应用于机器翻译译后编辑(machine translation post-editing, MTPE)和机器翻译辅助工具的开发。图像翻译也有望进入智能决策支持系统的应用场景。
人工智能在机器翻译中的具体实现主要包括3个领域:(1)研究会听、说、读、写和译的电脑程序, 实现自然语言处理;(2)研制智能化的翻译机器,具有视觉和听觉程序处理能力, 并能识别周围环境,灵活应对遇到的翻译问题;(3)开发通过符号识别来模拟人类翻译专家行为的程序, 即翻译专家系统。从研究的本质来说, 人工智能一般可分为理论研究和工程研究两个领域。理论研究主要是指依据有关开发和理解人和机器智能方面的理论进行前瞻性研究和探索, 而工程研究则主要是研发人工智能的工具和类似翻译专家系统这样的实用商品。人工智能在机器翻译中的具体实现模式包括: 对于翻译信息和相关知识的人工智能处理、翻译文字符号的智能处理以及人工智能对于翻译问题的智能化处理等方面。可以说, 人工智能在机器翻译中的具体实现模式,就是一种具有灵活信息处理能力和信息演示能力的结合体。
专家系统、人工神经网络和智能决策支持系统技术应用于机器翻译技术的开发,能够有效提升机器翻译的效率。例如,基于人工神经网络技术的机器翻译建设方案,有望解决传统的基于短语的机器翻译系统运作效率不高的缺点。翻译准确度和速度是翻译效率的重要观测点。通用的机器翻译方法主要有两种:基于规则的机器翻译方法和基于语料库的机器翻译方法。乔姆斯基(Chomsky)的转换生成语法理论是基于规则的机器翻译方法的理论基础,这种技术方案主要是采用语言规则来对自然语言的内部结构规律进行描述, 并对自然语言进行形式化的处理。首先,要对输入的句子进行分析,获得其句法分析树;然后,根据转换规则把源语言句子结构映射到目标语句子结构上;最后,根据目标语句子结构对生成的译文进行最终的语言加工,并可采用直接翻译法、中间语言法和转换法等模式对源语言进行机器翻译。人工智能技术的高感知和高速运算能力对于上述这些机器翻译模式意义重大。
语料库语言学是基于语料库的机器翻译方法的基础,需要获取大量语料来建立语料库,这就要求通过大规模整理互为译文的双语语料,并由这些语料的电子格式来建立支撑机器翻译的语料库,这些语料信息将作为获取翻译知识和统计数据的依据。也可以直接采用语料库进行机器翻译中的语料分析、转换和生成。从技术层面来看,基于语料库的机器翻译方法主要有两种:基于实例的机器翻译和基于统计的机器翻译(statistical machine translation,SMT)。其中,基于实例的机器翻译方法主要是指在双语语料库中,通过编辑或查找与需要翻译的源语言类似的参考实例来对源语言进行翻译。基于统计的机器翻译方法主要是指在双语语料库中,通过使用从语料库中建造的概率模型来对输入的需要翻译的源语言自动搜索出一个相似度概率最高的译文。这种方法的难度取决于对源语言和翻译目标语进行句对的对齐,并通过词汇同现可能性的方法将源语言的词汇映射到目标语言词汇的比对概率进行计算,进而形成与源语言词汇表达意义概率学上最接近的翻译文本。无论是高速运转的可靠的语料库的构建和管理,还是进行比对概率的高速运算,都离不开人工智能技术的不断创新。例如,在处理冗长文本信息的翻译工作时,谷歌的神经机器翻译引入了注意力机制,将解码器的底层连接到了编码器的顶层,从而使机器翻译系统能够更为准确高效地应对这些复杂信息。残差连接技术的应用实现了通过提升并行性来降低机器翻译训练时间的目标。在推理计算过程中,采用低精度运算方案,从而能够更快地为用户呈现出翻译结果。
机器翻译在实际运用过程中要处理很多复杂问题,尤其是要时刻应对语言知识复杂性和文化背景多样性的挑战。在应对这些翻译难题时,要利用现代技术手段[9]。从技术层面上来看,机器翻译要同时处理两种或者两种以上的语言信息符号,这就需要翻译机器能够对源语言进行语言分析,这是第一步要做的。基于语法或者语义的中间结构在理解分析源语言过程中发挥着重要作用。之后,翻译机器要对介于源语言和目标语言的中间语言结构进行进一步分析,为下一步进行目标语言的语法或者语义的中间结构的转换打好基础。在完成上述程序后,才能最终进行语言符号的梳理转换,形成最终的目标语言的呈现表述。由此可见,语言分析对于机器翻译作用明显,语言分析的能力直接影响着机器翻译的质量,毫无疑问,具有人工智能的机器翻译在进行语言分析时,具有更多的优势。
不同语言之间一般具有明显的差异性,尤其体现在语法规律和表达习惯上,不同语言文字符号系统在词汇、句子、语法、语义和语境等语言学信息方面表现出了信息量表述不对称性的特点,这就使机器翻译工作面临着诸多挑战,也需要借助日益发展的人工智能技术来解决翻译实践中出现的很多具体问题。从某种层面上来说,具有人工智能的翻译机器是在不断认知不同语言系统间各自的运作规律,深入学习和辨识篇章、段落、句群在内的各种语境信息,并对上述相关信息进行快速准确地解码和编码的过程。除了语言内部系统的差异,机器翻译还要在人工智能的控制下考虑到因为文化背景差异, 导致不同自然语言系统对一些类似或相近语义信息表达时出现相当大的差异性。除此之外,机器翻译还需要处理不同语言词汇之间相近意义表述的翻译,不同语言文化中隐喻的认知,不同语言系统对于不同使用习惯的词汇表达的信息处理,容易拼写错误或者翻译存在误差的词语的使用,词语使用和语言的不同搭配习惯,在不同语境下同形异义词的使用等问题。语言搭配是指词语或者固定短语之间自由组合并具有规律性呈现的语言现象。在机器翻译等自然语言处理任务中,语言搭配发挥着重要作用。机器翻译的质量往往和语言搭配语料资源的质量和应用相关。高效且容量较大的语料库搭配资源能够极大地提升自然语言处理的效率。
翻译能力的发展是一个动态的互动过程,与语言学习一样[10]。翻译不是单纯由渐次输入引导的线性过程,而是充满高峰、低谷、前进、倒退、停滞、甚至跳跃式前进的动态系统行为[11]。机器翻译在认知和处理不同语言中的隐喻现象时,往往遇到极大的困难。这不仅仅是由于隐喻是一种语言修辞方法,而且还是一种思维模式,它体现了不同人群进行思维和行动的观念系统的本质特征,是不同人群认知、思维乃至语言表述和写作的基础。机器难以具备直觉能力、想象能力、灵感和审美能力[12]。由于文化背景、宗教信仰、 生活生产方式、神话传说、认知模式、社会风俗、文学作品和自然环境等存在差异,不同语言系统对于隐喻的理解也存在着巨大差异。这就需要具有高速运算能力的人工智能能够快速辨认、认知、理解、储存、比对这些隐喻信息,并将这些海量语言信息进行高速数据处理,建立语法隐喻模式集和词汇隐喻模式集,并通过常规或实例的方法, 或是推理和统计的方法进行隐喻信息数据计算,从而帮助翻译机器有效地辨识和理解不同语言中存在的隐喻现象,进而更好地完成翻译任务。
机器翻译的语义理解能力直接与翻译产品的质量密切相关。人工智能可以很大程度上提升机器翻译的语义理解能力。一般认为,语义理解能力包含3个方面:(1)基于相关语言知识基础的语言层级理解;(2)基于人类知识系统基础的知识面层级的知识层次理解;(3)基于当时参与语言交流的人员的语用层次理解。在多种语言认知和处理过程中可以发现,针对同一种事物,不同自然语言对其表述存在很大的差异。也就是说,自然语言语义对应存在着很多语义偏移现象,即一种事物在一种自然语义中的映射与其在另外一种自然语言中的语义模块存在偏移,并不是一一对应的。由此可见,能否对这些现象进行快速准确有效地理解和辨析,并能够进行相对应的翻译处理,考验着机器翻译的工作能力。目前,感知智能的发展已经比较成熟, 它通过数学建模和基于大数据的深度学习等方法对人类感知能力进行模拟, 辅助人类完成任务[13]。人工智能可以很好地帮助机器翻译应对这些挑战。因为语言分析能力在机器翻译能力构建中具有重要作用,所以通过人工智能来加强语言的对比分析并研究相应的人工翻译技术体系,是机器翻译的重点研究领域。原有的机器翻译具有很多局限性,例如,对于自然语言的语言描述与语言知识分析准确度不够高,无法有效地理解并消除语言歧义的现象,对于隐喻的辨识能力不强或者根本无法辨识,对于不同自然语言形式描述过于粗糙、达不到精准描述的层级等,这些问题制约着机器翻译能力的提升。尤其是能否让翻译机器快速识别并处理容易误解、误译词语的形式化研究,是一项亟待解决的技术难题。这些问题的最终解决,离不开人工智能技术的发展,因为人工智能具有强大的学习能力。学习是人类智能的重要特征,是获得知识的基本手段,而机器学习也是使计算机具有智能的根本途径[14]。在现有技术基础上,人工智能通过不断学习已经在一些机器翻译技术研究方面取得了显著进步。例如,在加强词对齐技术的研究与应用方面,提升了从源语言词汇到目标语言词汇映射研究的精度和广度,并构建了词对齐技术的统计模型。 通过数据挖掘技术,能够从文本数据中自动获取高质量的映射信息,并通过相应的算法把猎取的映射数据运用到自然语言处理工作中。人工智能技术还可以帮助翻译机器通过单词对齐的搭配技术自动匹配相应的算法,取得词汇搭配概率、位置扭曲概率和词汇繁殖度概率,并将这些数据信息通过相应的匹配运算整合到同一个统计模型中,以便更加高效地寻找句子中有可能存在的相关词汇搭配的可能性。人工智能技术也可以帮助翻译机器在整理和寻找双语词对齐中,经过预估词组内部的搭配概率来研判该词组是否有可能成为一个整体对齐,来制约双语词对齐中多词单元的对齐。在机器翻译工作中,人工智能技术能够经过计算来感知短语与待翻译句子里上下文之间的搭配关系,判定短语与待翻译句子的匹配程度,并能够以此为基础构建出数据量大、质量高、可扩充的语料库。在这个语料库中,包含有语义语法模式集、固定搭配以及变量库、短语模式集、字面意义模式集、带有句法语义变量的翻译模板、句法语义变量和语义类型树等子系统,这些系统的建立为机器翻译的能力提升打下了良好的基础。由此可见,一台计算机若不会学习,就不能被称为是具有智能的计算机[15]。通过人工智能自身学习能力的提升,机器翻译的能力也在不断增强。
人工智能技术使得世界一体化的翻译市场的形成成为可能[16]。根据人工智能技术发展的现状,以及人工智能在机器翻译应用的趋势,可以看出现有基于人工智能技术的机器翻译系统主要包含以下组件:(1)基于人工智能技术的机器翻译系统的核心组件和主界面是工作空间,它赋予了机器翻译具有跨领域应用程序的集成能力,这就使翻译用户可以在现有常用浏览器风格的界面中集中控制所有机器翻译组件, 并能在人工智能技术的控制下对所有的翻译项目和工作流程进行有效地管理。(2)基于人工智能技术的机器翻译系统构建一般也会有一个翻译者工作台,能够与MSWord XP/2010/2018等软件操作系统进行无缝对接,现有的运算能力能够支持多种语言之间的多向互译。翻译用户可以在微软公司的Word软件运行中进行相关交互翻译。在人工智能技术的支持下,翻译者工作台能够适时有效地使用后台运行能力强大的神经网络数据库,为翻译工作者和产品用户储存并管理源文本和翻译好的作品,并已经实现对源文本的自动翻译。基于人工智能技术的机器翻译系统也已经实现为用户动态提示相关译文语句,自动保留源文本格式,并与其他文本处理应用软件有着良好的兼容性。(3)术语管理组件也是机器翻译系统的重要构成组件,其主要功能是通过人工智能技术扫描原文中出现的术语,并由计算机在机器翻译的专业语料库中进行搜索和比对。现代信息技术和互联网的高速发展推动着术语和计算机技术的结合日益大众化[17]。基于人工智能的机器翻译技术的原理,决定了其应用效率与需要翻译的文本的内容重现率有关。例如,若是源文本前后内容表述具有术语的一致性或短语的一致性等特点,人工智能技术会通过扫描在机器翻译语料库中相对应的术语,并自动匹配出合适的参考译文。术语管理组件的功能主要是为了保持相同术语翻译的统一性,其翻译内容的质量与计算翻译中专业语料库的质量和规模有密切关系。这些组件的工作效率随着人工智能技术的进步也在不断提升。(4)为了能够对机器翻译系统中的语料库系统进行适时更新,也为了机器翻译的作品能够适应不断变化更新的语言使用现象,人工智能技术支持机器翻译系统具有术语抽取能力。这一系统能够在各种海量文本数据中自动抽取翻译项目所需的术语,并通过人工智能强大的自运算能力和高效的数据运算模型,实现单语或双语术语表的自动生成。(5)机器翻译系统中也会包括匹配建库系统组件,这一功能组件主要是使用户能够在人工智能技术的帮助下对以往的翻译成品资料实现回收,其实际使用意义是为了将源文本和译文作品进行相关数据的适时对比和分析,以计算出相关匹配值,并将具有高匹配值的语言翻译模块或者单语或双语术语表输入到机器翻译系统自建的翻译记忆库中,及时反馈给翻译者工作台系统使用。在人工智能的管理下,机器翻译系统还能够集成微软Word软件的字典功能,从而为更多的语言使用和翻译者提供功能更为强大的书写自检服务。
随着全球化和信息化进程不断推进,海量的翻译需求给全球语言服务行业带来了前所未有的机遇和挑战[18]。在面对多语言翻译任务时,机器翻译应用面临的一大挑战就是如何快速高效地挖掘不同语言系统的内部运作规律。语言服务业相信人机交互才是未来的发展趋势[19]。人工智能能够帮助翻译机器高效率地发掘语言系统内部的运行关系,从而实现帮助机器翻译提升工作效率的目的。其工作原理是通过广泛挖掘数据,包括句群、段落、篇章、体裁在内的各种语言信息的原始数据,并在设定好的各种语境状况下对这些信息进行编码或解码。 互联网与人工智能蓬勃发展,信息技术对翻译工作的渗透程度日益深化[20]。人工智能支持在机器翻译中发挥其语言分析的作用,并通过寻找、定位、解析语言运行的各项特征,在经过高速运算后对语言特征进行有目的的对比分析,创新性地研究词对齐技术,并将之应用到机器翻译的工作过程中,实现通过具有高速运算能力的人工智能来重新构建词对齐技术的统计模型。这一模型包含了大规模、高质量、可扩充的语义单元库,这些单元库或者语料库能够推动机器翻译的不断发展。若是将相应的人工翻译技术体系全面应用到机器翻译系统中,能够极大地提升机器翻译的响应速度和工作效率。在大数据时代,搜集和利用网络上庞大的数据资源已经成为亟待解决的问题[21]。下一阶段,人工智能在利用大数据技术帮助机器翻译结果更符合母语使用者习惯和特征方面,将会发挥更大的作用。