石旺君
摘 要:为了提高机器翻译中英语语言转换的自动化和智能化水平,提出了一种基于深度学习和语言转换错误特征提取的机器翻译错误消除方法,其核心差分语义修正方法。建立了英语语言转换翻译中错误排除的语义相关检测模型,并通过语法分析,建立了英语语言转换翻译中错误排除的语义树。提取了英语语言转换的语义相似度特征。根据语义相似度的不同组合,对英语语言转换中的语义分配和机器翻译错误特征进行了分析。采用深度学习方法建立了英语转换的树形主题词表,并根据树形主题词表中的语义修改目标调整了英语转换的句子结构。为了消除英语转换过程中的翻译错误,计算出每个小句的最佳语义相关特征,并采用深度学习算法对英语转换过程中的翻译错误进行自动优化。仿真结果表明,该方法精度高。
关键词:深度学习;语言翻译;英语;语义学;英语机器翻译;翻译错误;错误消除
中图分类号:TP 391
文献标志码:A
文章编号:1007-757X(2020)11-0055-04
Abstract:In order to improve the level of automation and intelligence of English language conversion in machine translation, a machine translation error elimination method based on deep learning and language conversion error feature extraction is proposed. Its core bit difference semantic correction method establishes a semantic correlation detection model for error elimination in English language translation. Through grammatical analysis, it establishes a semantic tree for error elimination in English language translation. The semantic similarity features of English language conversion are extracted. According to different combinations of semantic similarity, the semantic distribution and machine translation error features in English language conversion are analyzed. A deep-learning method is used to establish a tree-shaped thesaurus in English conversion, and the sentence structure of English conversion is adjusted according to the semantic modification target in the tree-shaped thesaurus. In order to eliminate translation errors during the English conversion process, the best semantically relevant features of each clause are calculated, and deep learning algorithms are used to automatically optimize the translation errors during the English conversion process. Simulation results show that the method has high accuracy.
Key words:deep learning;language translation;English;semantics;English machine translation;translation errors;error elimination
0 引言
隨着自动翻译软件的发展和成熟,对机器翻译软件的翻译和校准的准确性要求更高。在机器翻译环境中,语义分析需要与自动翻译软件的上下文特征结合起来[1-2]。根据语义相似度,进行自动翻译和标定,以提高自动翻译的语义分配精度。在语义异构的条件下,机器翻译的自动校准主要通过语义相似度的概念分析来实现[3-4]。摘要自动翻译文本的相关性特征和语义相似性特征,根据相似语义对存在的语义异构性进行消除,实现英语翻译过程中的知识结构图分析,并构建语义概念树[5-6]。提高翻译错误消除能力。机器翻译错误消除方法的研究对于提高机器翻译的智能水平具有重要意义。机器翻译错误消除方法的相关研究引起了广泛关注。
在传统方法中,粒子群优化和遗传进化主要用于消除英汉翻译中的翻译错误[7]。由于本体模型之间的普遍差异,标定的准确性不高,语义异质性问题严重。提出了一种基于深度学习和语言变换错误特征提取的机器翻译错误消除方法。运用差异化语义修饰法构建了英语转换翻译中错误排除的语义相关检测模型,并通过语法分析构建了英语转换翻译中错误排除的语义树。通过深度学习的方法建立了英语转换的树主题词表,并根据树主题词表中的语义修饰目标对英语转换的句结构进行了调整。实现了英语转换翻译错误的消除和主题词的注册。采用深度学习算法进行自动优化,实现了英语转换翻译错误的消除。最后,对实验结果进行了测试和分析得出了结论。
1 英语翻译中语义本体模型及消错映射关系
1.1 英语转换翻译中错误消除的语义本体模型
为了构建一种基于深度学习的方法,采用语义相似度分析和自适应模板注册技术,构建了一种基于语义相似度分析和自适应模板注册的英语转换翻译错误消除语义本体模型[8]。利用关联维映射的方法,分析了英语转换中翻译错误消除语义本体模型中关联词汇信息的特点,建立了基于深度学习的语义本体结构模型。利用主题词和介词的包含映射方法,构建了机器翻译中上下文本体的映射机制。在英语语言转换过程中,利用机器语言的自适应学习方法构建语义本体的映射模型,如图1所示。
在上述语义本体模型的基础上,构建了词典数据库。基于大规模本体扩散映射方法,建立了一个英语语言转换过程中翻译错误消除的词典数据库。为消除英语转换中的翻译错误,提出了一种综合评价模糊决策函数如式(1)、式(2)。
式中,ρ是领域知识(Domain knowledge,DK)模型之间的相似性特征,ρ∈[0,1]和ρ=0.23。
语义泛化映射关系由两组相似的结构片段建立。如果GD表示本体间的语义关联规则特征,则将英语转换翻译消错的泛化映射函数M表示为M:C*C′→图像,并在相关映射过程中建立语义交叉映射。选择机器翻译语义注册的可靠性特征,构造一种可行的语义映射关系分析方案。在本体结构中,采用语义互操作方法分析语义泛化特征[9]。结合本体模型的定义,利用概念节点的深度学习方法,建立了英语转换翻译中消错的语义本体模型。用于构造上下文模糊推理的元组O={C,HC,R,I,A}使用两组本体片段θ来解释翻译错误排除概念在英语语言转换中的扩展,如式(3)。
因此,采用概念编辑的方法构建了中文翻译过程中的模糊语义本体映射,并采用差分语义修改的方法构建了英语翻译错误排除的语义相关检测模型。通过语法分析,建立了英语转换翻译中的语义消错树,结合模糊相关匹配方法,建立了机器翻译的概念格,并对两种异构本体进行了深入研究。英语语言转换中的关系本体映射关系由以下元组表示:O=
表示语义信息之间的特征提取关系模型,当Cs和Ct′之间存在最大相关特征集时,Cs和Ct′之间的语义信息的特征提取关系模型可以由表示。根据上述映射关系,构建了语义映射本体和概念树模型,以消除英语转换翻译中的错误。
1.2 语义映射关系
根据语义相似度的不同组合,分析了英语语言转换中的语义分配和机器翻译错误,并采用深入学习的方法建立了英语语言转换的树形主题词表。构建了一个用于英语翻译中排除错误的语义映射模型[10],如图2所示。
在图2所示的英语转换翻译消错语义映射关系模型中,根据两个异构本体中的每个概念信息,进行关联规则映射,并采用模糊特征分析方法。建立了语义概念分析的结构映射关系,利用语义实现了英语语言转换过程
概念名的分词是通过词与专业名词的连接来表示的一个区间概念。在最优标定模式下,通过关联规则分析实现概念词的自组织映射。词库中的词汇分布如式(5)。
给出概念上下文的形式映射集,提取目标子句中关联规则的特征量。在词汇语义计算中,利用语义相关特征分析方法,建立了最大语义相关度的映射模型。英语目标词汇转换的自动选择与模糊控制。
2 英语转换中翻译错误消除算法的优化
2.1 语义相似度特征分析
在利用差分语义修正方法构建英语转换翻译中消错语义相关检测模型的基础上,对机器翻译中的消错方法进行了优化,在此基础上设计了语义相关检测模型和相关映射关系
模型。本研究提出了一种基于深度学习和语言转换错误特征提取的机器翻译错误消除方法,并通过语法分析建立了英语转换翻译错误消除的语义树。提取了英语语言转换的语义相似度特征,并将语义关联度模糊决策函数描述如式(6)。
基于語义相关值分析方法,建立了英语语言转换逻辑词典数据库模型。选取语义关联度最大的词作为连接词,采用逗号等效约束分析法对目标子句进行分析。在计算最大语义关联度的过程中,简单语义单元的相对贴近度函数,如式(7)。
设(sk,ak)表示为二进制语义。根据语义相似度的不同组合,进行了英语语言转换中的语义赋值和机器翻译错误特征分析,并采用深度学习方法建立了英语语言转换的树形主题词表。关联规则特征集用sk表示,语义原语集用S表示,关联关系,如式(8)。
计算出目标子句的语义规则集,并将介词表示为语义相似度的组合形式。在最优语法分析模型下,得到了分句的权重系数。采用分词逻辑表示方法,对英语转换翻译中的纠错过程进行了全局优化。相似性特征表示为β∈[0,T],如式(9)。
根据语义相似度的不同组合,对英语语言转换中的语义分配和机器翻译错误特征进行了分析。例如:-Fi(Semanticassignment)=Abstract#1∨Area#2,为了提高英语语言转换中消除翻译错误的能力,在每个语法分析方案中测量语义关联度,并进行复合表达以提高英语语言转换中消除翻译错误的能力。结合以上分析,得到语义相似度特征提取过程,如图3所示。
从图中可知,在树状图中,任意两个节点之间的路径只有一条。所以路径的长度可以看成一种为两个词语之间的相似度的度量。随着路径的变长,所包含的语义信息也越丰富,所以词语间语义相似度越小。
2.2 深度学习与翻译错误消除的自适应控制
采用深度学习的方法,建立了英语语言转换的树形主题词表。根据树形主题词列表中的语义修改目标,调整英语语言转换的句子结构,选择目标从句。定义机器翻译误差
消除的标签模型表示为(s1,a1),(s2,a2),…,(sn,an),将目标从句推广到词汇表中,得到英语语言转换中从句的权重系数为KS=1,并利用深度学习方法对简单句进行自动优化。根据深度学习的方法,通过最佳语法分析的中心向量C(Y)得到关联规则的相似度,关联规则的相似度如式(12)。
假设普通实词的语义修饰结构为L→AAPDAB,根据树形主题词表中的语义修饰目标,调整英语转换的句子结构,提高英语转换中翻译错误的消除率。下面介绍一种基于深度学习的消除阴影翻译错误的方法。
(1) 通过语法分析方案确定了英语语言转换中翻译错误排除的语义规则集O,并采用模糊相关匹配方法得到了主题词在语义单元中的特征量。选择语义关联度最大的特征作为连接词;
(2) 对目标子句进行特征分解,用S,V,O分解英语转换的语义块,根据词汇语义修改不同的关联规则集,确定上下文的模糊匹配集;
(3) 计算模糊语义特征。根据名词和介词短语的词义修饰,计算出最佳语义相关值,定义为f(I):={o∈O|A∈I,oKR};
(4) 考虑到词的上下文,假设L的语义结构为:L→AAPDAB,根据树型主题词表中的语义修改目标调整英语转换的句子结构,得到最佳的语义匹配集;
(5) 根据深度学习调整收敛性;
(6) 当满足约束条件时,结束。
3 实验测试分析
为了验证该方法在消除英语转换中翻译错误方面的效果,进行了实验。实验采用Matlab进行设计,用OAEI语言表示英语语言转换的关联规则集。简单语义单元集为2000,样本训练量集为120,迭代次数为200,语义属性集为85,相似度语义特征分布实例数为120,深度学习次数为200,收敛步长为30,以查全率和查准率为检验标准指标计算如式(13)、式(14)。
根据上述仿真环境和参数设置,消除了英语转换中的翻译错误,并测试了语义特征的分布,如图4所示。
根据图4所示语义特征分布的测试结果,进行了英语语言转换的翻译误差消除优化控制,如图5所示。
该方法的精度和校正能力对消除英语转换翻译中的错误是很好的。英语语言转换的翻译误差消除精度较高,且翻译校准的相关性强。
进一步测试了机器翻译中的错误消除率,如表1所示。
本研究所提的机器翻译的消错率高于传统文献中所提的机器翻译方法。
4 总结
为了消除英语转换中的翻译错误和主题词的错误,提出了一种基于深度学习和语言转换错误特征提取的机器翻译错误消除方法。利用差异化语义修饰方法,构建了英语转换翻译中错误排除的语义相关检测模型,并通过语法分析构建了英语转换翻译中错误排除的语义树。提取了英语转换的语义相似性特征。通过深度学习的方法建立了英语转换的树主题词表,并根据树主题词表中的语义修饰目标对英语转换的句结构进行了调整。计算每个子句的最佳语义相关性,并使用深度学习算法自动优化英语转换中的错误。仿真结果表明,该方法准确度高,翻译标定的相关性强。该方法在机器翻译的智能化设计中具有良好的应用价值。
但本研究仍然存在一些不足之处,如算法运行时间较长,在对于某些稀有词翻译以及一词多义等特定情况时,仍然存在翻译错误,导致结果的准确度不高。因此这也是未来工作方向之一。
参考文献
[1] 李晖.语义分析在翻译中的应用研究[J].海外英语,2018(19):125-126.
[2] 王曉雷,陈云杰,王琛,等.基于Q-learning的虚拟网络功能调度方法[J].计算机工程,2019,45(2):64-69.
[3] 黄登娴.英语翻译软件翻译准确性矫正算法设计[J].现代电子技术,2018,41(14):170-172.
[4] 哈斯高娃. 蒙汉神经机器翻译中的未登录词处理研究[D].呼尔浩特:内蒙古师范大学,2019.
[5] 季春元,熊泽金,侯艳芳,等.基于人机交互的网络化智能翻译系统设计[J].自动化与仪器仪表,2019(8):25-28.
[6] 吴承凤,刘涛.机器翻译中的多模糊语义自动判断方法研究[J].现代电子技术,2017,40(14):75-77.
[7] 张锋. 基于粒子群优化算法的汉英语句对齐研究[D].重庆:重庆大学,2012.
[8] 王琳. 知网机器翻译系统的分析与知识库扩展[D].沈阳:沈阳航空航天大学,2017.
[9] 贾君枝,李捷佳.基于关联数据的语义互操作研究[J].情报理论与实践,2017,40(8):131-134.
[10] 梁娟.英语翻译器语音识别系统的设计及功能实现[J].微型电脑应用,2018,34(12):46-48.
(收稿日期:2020.04.27)