英汉机器翻译中的英语动词汉译研究

2016-09-08 09:23李侠
电子设计工程 2016年13期
关键词:汉译语句语义

李侠

(咸阳师范学院 外国语学院,陕西 咸阳 712000)

英汉机器翻译中的英语动词汉译研究

李侠

(咸阳师范学院 外国语学院,陕西 咸阳 712000)

机器翻译是一项非常重要且困难的工作,动词因其形式多样且使用较为灵活,是机器翻译过程中的重要环节。本文针对机器翻译过程中的动词翻译进行研究,先对语义语言理论进行介绍,进而对动词语义进行分析,然后在动词语义模式的基础上对动词进行详细的研究。在对语义进行归纳总结以后,将动词的语义模式分为三类,再将动词语义模式库进行搭建,最后设计出一种以语义、句式以及变量为基础的翻译方法,该汉译方法适用于英语句子当中的动词翻译过程中。

机器翻译;动词;语义模式;语义类型;变量

随着计算机的普及,人们希望它能实现更多的功能,同时,现今社会当中,各民族之间的交流也日益增加,随之而来的就是语言障碍问题,那么,为了保证各个语言国家之间的交流顺利,且提高相互交流效率,使用计算机来进行翻译就势在必行了。然而,现有的机器翻译系统远远满足不了语言的复杂性和人们对语言使用的不规则性,所以,高效的机器翻译系统就非常有必要了。机器翻译系统是针对句子进行翻译,而句子是由不同词性的词汇组成,其中,动词是句子中的重要组成部分,对动词翻译的准确性影响着对句子翻译的质量。对于同一个词汇,在不同环境中所表达的意义可能有所不同,所以,在机器翻译过程中,对同一动词而言,要针对不同环境来选择不同的含义。现今对动词翻译的研究还处于研究过程阶段,对动词翻译的准确性提高也会提高句子翻译的质量,有利于机器翻译系统的扩充和完善[1-2]。

1 机器翻译概述

机器翻译是指利用计算机将一种语言翻译为另一种语言的技术。这种技术非常复杂,它将语言学、计算机学、心理学等各个学科相互结合,是一项非常困难的研究课题。它的特点是[3-5]:

1)涉及多个学科领域,必须将不同学科的领头人相互合作才可能完成机器翻译系统的实现。

2)翻译过程可计算,也就是说,必须利用计算机相关技术才可以实现机器翻译。

3)翻译过程困难,因为机器翻译的是人类自然语言,会因人对语言理解不同而有所不同,无法实现对语言的可操控性。

4)具有实用价值。

2 语义语言和语义单元

2.1语义语言

语义单元表示的是在任意一个自然语言中所表述的一个含义的单元。语义单元又可以组成语义语言,其形式通常可表示为:(A、B、C、D、E)。其中,A表示完结符,B表示变量标志符、C表示语义单元集合,D表示类集,也就是说每个语义单元都与一个类集一一对应,E表示变量代替法则。

通常可将语义语言分为三层,分别是语言层、知识层以及语用层。比如,“把这瓶水倒入那壶浓硫酸里”,这一句话是由“这”、“瓶”、“水”、“那”、“壶”、“浓硫酸”六个语义单元所组成,可以归结为“把倒入里”,N表示的是名词。

将上述例子用语言层理解,就是分别找到两个N表示的名词,然后再根据语句命令将这个N倒入那个N中,而不会考虑会出现什么后果。

若用知识层来理解,就是知道将水倒入浓硫酸中会发生爆炸,会产生严重的后果,那么会对该命令进行提醒并警告。

所以,综上所述,针对不同层次理解,所得到的信息是不一样的,但是在本文中,仅仅是针对语言层来理解语义单元[6-7]。

2.2基于语义单元的机器翻译方法

以语义单元为基础的机器翻译方法可分为两部分,分别是统一的机器翻译软件和多个语言单元库[8-9]。该机器翻译流程图如图1所示。

图1 基于语义单元的机器翻译系统流程图

3 动词语义模式

3.1动词语义模式的提取方法

动词语义模式的提取原则主要有以下几点[10-11]:

1)动词语义模式是按照一定的排列次序,将变量和实量排列组成,并且该排列结构可以有效的反应出句子中的内部排列次序。其中,实量是语义当中的最小语义单元,变量根据其处于句子当中的不同位置由多种语义代替。

2)在提取过程中,动词是作为实量来进行提取,并将与动词搭配的词汇定义为相关词组,也视为实量进行提取。

3)对动词及相关词组的含义会产生异议的部分定为变量来提取。

4)因为汉英句子的结构排列次序不同,所以变量的提取也不必要求一一对应。

5)将动词语义库中的语义模式类型用来代表句子中的句法形式,使得动词可以被代替。

6)动词语义模式当中的变量既可以表示形容词,也可以表示动名词、句子等形式。

7)表示同一个语义的变量可用相同的动词语义模式来替换。

3.2动词语义模式库

动词语义模式库分类如图2所示。由图2可看出,动词语义模式库由VO语义模式库和V语义模式库组成,其中,VO语义模式库又可以分为VO相邻语义模式库和VO非相邻语义模式库两种。VO语义模式表示的是动词与其他属性的实量根据不同排列顺序所构成的语义模式,动词与相邻的实量一起组成的语义模式称为VO相邻语义模式,反之则为VO非相邻语义模式。V语义模式是指由一个动词构成R部。不同的语义模式组合构成不同的语义模式库[12-13]。动词语义模式库结构如表1所示。

图2 动词语义模式库分类

表1 动词语义模式库结构

4 常用动词的汉译方法

4.1常用动词的汉译方法的选择

常用动词的汉译方法主要有[14]:

1)统计法:在所要求翻译的句子中,根据上下问中频繁出现的并且与所要求翻译的词较为类似的译文,通过统计的方法来确定目标词汇的译文。这种方法需要较大的工作量,并且需要大量的语句库作为参考,而且语句库的翻译质量会对最终的翻译结果产生较大的影响。

2)实例法:与统计法较为相似,也是通过在语句库中大规模的找寻与目标语句较为相似的句子,将该句子提取出来做适当修改以后作为输出结果。

3)语义模式法:首先要先创建语义模式库,并且创建过程必须有一定的限制条件才可以。在对目标语句翻译中,先从库中找出与之相符的语义模式,然后再根据目标语句的语境找出最符合的语义模式,最后再输出结果。

4.2汉译算法的实现

对英语中动词的翻译算法流程图如图3所示。步骤如下:

图3 算法流程图

1)先对开始输入的英语句子进行初始化;

2)将初始化的句子与固定句式库中的语句匹配,若成功,则输出结果,若失败,则转3);

3)0将初始化句子再与VO相邻语义模式库进行匹配,若成功,转到4),若失败,则转到6);

4)去句子中的右边的词N,将N与VO相邻语义模式库进行匹配,若成功,转5),若失败,转6);

5)根据语义模式匹配算法将匹配成功的N在相邻语义模式库中进行匹配,若成功,转11),若失败,转6);

6)将句子与VO非相邻语义模式库进行匹配,若成功,转7),若失败,转9);

7)再去句子中从右边取除了N以外的词,分别与VO非相邻语义模式库进行匹配,若成功,转8),若失败,转9);

8)利用匹配算法匹配语义,若成功,转11),若失败,转9);

9)将句子与V语义模式库进行匹配,若成功,转10),若失败,则输出结果失败,结束过程。

10)用匹配算法匹配语义模式,若成功,转11),若失败,则输出结果失败,结果过程。

11)分别输出英语和汉语的语义模式;

12)输出的汉语语义模式即英语的译文。

5 结束语

机器翻译是一项非常重要且困难的工作,动词在句子中是重要部分,它的复杂多变性是机器翻译过程中需要攻克的难点。文中先对语义语言进行介绍,提出了基于语义单元的机器翻译方法,然后再对动词语义模式的提取方式进行了大致的阐述,并对动词语义模式库详细的进行了分析和介绍,最后对汉译方法进一步解释,提出了一种汉译的算法流程,并对这种方法的过程进行详细的研究。根据这种方法,进一步可以提高英语动词汉译的准确性和高效率。

[1]赵铁军.机器翻译原理[M].哈尔滨:哈尔滨工业大学出版社, 2001.

[2]Gao Q S,Hu Y,LI L,et al.Semantic language and multi一language MT approach based on SL[J].JournalofComputer Science&Technology,2003,18(6):848-852.

[3]高庆狮,高小宇,胡明.基于语义的机器翻译系统及方法:中国,01131689.6[P].2001,12,27.

[4]胡明,高小宇,高庆狮.多语言机译系统中高质量语义单元库形成方法[J].北京科技大学学报,2008,30(6):698-703.

[5]HutchinsJThedevelopmentanduseofmachinetranslationsystemsand computer-based translation tools[C]//Proceedings of International Conference on Machine Translation&Computer Language Information Proeessing.June26-28,1999,Beijing, China.1999:1-16.

[6]王小捷,常宝宝.自然语言处理技术基础[M].北京:北京邮电大学出版社,2002.

[7]俞士汉.现代汉语语法信息词典[M].北京:北京大学计算语言学研究所,2000.

[8]陈群秀.信息处理用现代汉语语义分类词典的设计与实现 [M]//曹石琦.辉煌二十——中国中文信息学会二十周年学术会议.北京:清华大学出版社,2001:148-155.

[9]冯志伟.中国语料库研究的历史与现状[J].Journal of Chinese Language and Computing,2002,12(1):43-62.

[10]俞士汉.计算语言学的应用研究与基础研究[M]//曹石琦.辉煌二十年——中国中文信息学会二十周年学术会议.北京:清华大学出版社,2001:54-65.

[11]周强,詹卫东,任海波,等.构建大规模的汉语语块库[M]//黄昌宁,张普.自然语言理解与机器翻译.北京:清华大学出版社,2001:102-115.

[12]高小宇,高庆狮,胡明,等.基于语义单元表示树剪枝的高速多语言机器翻译[J].软件学报,2005,16(11):1909-1919.

[13]高庆狮,李莉,刘宏岚.基于语义单元表示树剪枝的关键字过滤方法[J].北京科技大学学报,2006,28(12):1191-1195.

[14]BuscaldiD,RossoP,PlaF,e al.VerbSenseDisambiguationUsing Support Vector Machines:ImpactofWordNet-ExtractedFeatures[C]//7th International ConferenceonComputationalLinguisticsand Intelligent TextProcessing,February19-25,2006,MexicoCity,Mexico.Springer,2006:192-195.

A study on English translation of English verbs in English and chinese machine translation

LI Xia
(Foreign language college,Xianyang Normal University,Xianyang 712000,China)

Machine translation is a very important and difficult task,because of its diverse forms and the use of a more flexible, is an important part of the machine translation process.In this paper,we study the verb translation in the process of machine translation,first introduce the theory of semantic language,then analyze the semantics of the verb,and then make a detailed study of the verbs in the semantic model.After summarizing the semantics,the semantic patterns of verbs can be divided into three categories,then the verb semantic pattern base is set up.Finally,a translation method based on semantics,syntax and variable is designed.

machine translation;verbs;semantic patters;semantic types;variable

TM933.4

A

1674-6236(2016)13-0013-03

2015-11-27稿件编号:201511273

陕西省社会科学基金项目(13K045)

李 侠(1978—),女,陕西韩城人,硕士,讲师。研究方向:英语教学与英语翻译。

猜你喜欢
汉译语句语义
《李尔王》汉译的序跋研究
重点:语句衔接
语言与语义
再论汉译“突厥”名称之起源
再论汉译“突厥”名称之起源
“社会”一词的语义流动与新陈代谢
“上”与“下”语义的不对称性及其认知阐释
“吃+NP”的语义生成机制研究
谈谈柯尔克孜语中“bay”、“-bay”和“bek”、“-bek”的汉译
如何搞定语句衔接题