原文预处理法在汉英机器翻译中的应用

2016-11-03 19:18宋广波
关键词:可读性汉英宾语

宋广波

(山西大同大学煤炭工程学院,山西大同037003)

原文预处理法在汉英机器翻译中的应用

宋广波

(山西大同大学煤炭工程学院,山西大同037003)

随着机器翻译技术的发展,越来越多的人尝试使用机器翻译来完成或辅助完成翻译任务。然而,由于当前机器翻译技术存在局限性,导致了机器翻译质量尤其是汉译英的翻译质量低下,准确性和可读性往往较差,从而限制机器翻译的应用范围。我们要根据汉英基本句型对应理论以及简洁性原则,只需对原文进行快速、简单的预处理,即可大幅度提高译文的准确性与可读性,从而大幅度地提高机器翻译的质量。

汉译英;机器翻译;基本句型;预处理;翻译质量

一、当前机器翻译技术的应用及局限性

用计算机自动完成翻译任务是人类长期以来的梦想。如今,机器翻译已经成为职业和非职业译者、翻译机构不可或缺的得力帮手。[1]机器翻译是建立在语言学、数学、信息学、计算机科学等学科基础上的多边缘学科。[2]然而,由于中西语言、文化等差异以及当前机器翻译发展水平的局限性,汉英机器翻译质量总的来说不够理想,准确率不高,可读性差,可用率低,后期处理难度高、工作量大。从某种意义上讲,机器翻译似乎该为晦涩难懂、低质量的译文泛滥“负全责”。

那么,机器翻译真的是“低质量译文”的代名词吗?对此,笔者进行了针对性的探索,通过大量的理论研究和对比实验,发现汉英基本句型对应关系对于机器翻译质量的研究具有基石作用。鉴于在国内汉译英的应用者一般为受过良好中文教育的国人,中文理解、表达能力相对较强是一大优势,利用这个优势,在保持原文意义不变的情况下,根据这两种语言之间的基本句型的对应关系,只需花少量的时间和精力先改写中文的句型结构,并尽量简化词句的表达方式,然后再放入翻译引擎中进行翻译,即可得到准确性、可读性均大幅度提高的译文,为后期的修改、润色及其他后期处理提供了莫大的便利。[3]可以说这个方法省时省力,效果好,具有明显的推广价值。

二、基于汉英基本句型对应理论的机器翻译预处理法

中文是东方的象形文字,英文却是西方的拼音文字,似乎两者之间无任何“默契”可言。而一些渊源相近的语言,例如法语和英语之间的互译用机器翻译来做又快又好。笔者在浏览法语、德语网页的时候,往往会利用“百度翻译”等网络翻译引擎把这些网页翻译成英语而不是汉语进行阅读,这是因为西方语言和汉语在语法等方面差异实在太大了,机器翻译的结果往往令人费解,给人的感觉往往是既不准确,也不可靠。

幸运的是,当前语言学者的研究成果表明,经过“格式化”的汉语和英语在语法结构上也有惊人的相似性。这些基本对应的句型有主谓结构、主谓宾结构、主系表结构、双宾语结构以及主谓宾补结构。[4](P57-64)为了更好地说明这个基本句型对应理论,笔者在下面给出各种基本句子结构的例句。为了便于对照,各例句主语用着重号表示,谓语用斜体表示,宾语用下划线表示,宾语补足语用波浪线表示,表语用虚下划线表示。鉴于状语明确性高,为了简便起见,例句中的状语一般予以省略。

(一)主谓结构对应关系

1.船沉了。→The ship sank.

2.他们消失了。→They disappeared.

3.价格已经下降了。→The price has dropped.

(二)主谓宾结构对应关系

1.我爱你。→I love you.(宾语为代词)

2.爱丽丝讨厌蚂蚁。→Alice hates ants.(宾语为名词)

3.他们喜欢爬山。→They like climbing mountains.(宾语为动名词)

4.他想喝一杯啤酒。→He wants to have a glass of beer.(宾语为动词不定式)

5.我们不知道他喜欢什么。→We don't know what he likes.(宾语为从句)

6.她在看着那个玻璃杯。→She is looking at the glass.(不及物动词+介词结构可以看成等同于及物动词)

7.彼得擅长数学。→Peter is good at math.(系动词+形容词+介词结构可以看成等同于及物动词)

(三)主系表结构对应关系

1.她(是)漂亮(的)。→She is pretty.(表语为形容词)

2.我是一名学生。→I am a student.(表语为名词)

3.汤姆(是)在图书馆里。→Tom is in the library.(表语为介词)

4.目的是帮助其他人。→The purpose is to help others.(表语为不定式)

5.它不是你所喜欢的。→It is not what you like.(表语为从句)

需要注意的是在汉语中形容词可以直接做谓语,而在英语中一般不可以。因此一个翻译引擎若出现无法有效识别形容词做谓语的情况,原文应该改写为标准主系表结构,以便机器识别。

(四)双宾语结构对应关系

1.我教他英语。→I teach him English.

2.他递给我一只钢笔→He passed me a pen.

3.那个男人抢走了他的手表。→That man robbed him of his watch.

第三组例句中“of his watch”构成了介宾结构,可以看成是双宾语结构的变形。

(五)主谓宾补结构对应关系

主谓宾补结构即主谓宾+宾语补足语结构,用法非常灵活,表达能力极强。在英文中,宾语补足语成分可以由多种词性充当。

1.他让我生气了。→He made me angry.(宾补为形容词)

2.我们选举他为总统。→We elected him president.(宾补为名词)

3.他叫我过来。→He asked me to come.(宾补为动词不定式)

4.我看见她在读一本书。→I saw her reading a book.(宾补为现在分词短语)

5.让窗户关住。→Keep the window closed.(宾补为过去分词,表示被动)

6.汤姆发现她在图书馆里。→Tom found her in the library.(宾补为介词短语)

基本句型对应关系是所有机器翻译引擎的基础。由于技术限制,机器翻译中的长句中断句、断词往往不够准确,造成误译或译文晦涩难懂,但是翻译引擎依然擅长处理简单句。因此,从理论上说,在使用机器翻译进行汉译英前,花少量时间把汉语句子尽量改写为机器可识别的最基本句型并尽量简化表达方式,即可大幅度提高译文质量。这个方法,笔者称之为“基于汉英基本句型对应理论和精简原则的预处理法”。具体的做法是:1、如果主句或从句过于复杂,内含多个从句或者修饰、限制成分,则拆分为最多包含一个从句的基本句型;2、如果有成分省略,则予以补全。3、生僻、绕口、晦涩或机器难以识别的表达方式,更改为简单、直接的表达方式。

三、原文预处理法举例

中文原文:曾经看到那些假日垂钓者,独钓一天,空手而归。

百度翻译结果:Ever see those holiday anglers,fishing day,empty handed.

原文预处理后:以前我经常在假日看到那些垂钓者,他们劳动了一整天,可是他们空手而归。

百度翻译结果:I used to see those holiday anglers,they work all day,but they left empty handed.

后期处理、润色结果:In holidays,I used to see those anglers who worked all day but left emptyhanded.

四、机器翻译原则及质量评估标准

由于机器翻译往往用于辅助翻译,或用在要求不太高的场合,如网页即时翻译等,因此,机器翻译给传统翻译的普遍性原则“忠实、通顺”赋予了更多的含义。为了更好地进行量化以便打分评估,在此笔者采用“准确性”和“可读性”两大指标来量化这个翻译标准。[5]所谓准确性,主要在于信息的完整性,既不添加多余的信息,又不遗漏重要的信息和必要的细节,不会造成读者误解。所谓可读性,主要指译文的阅读难度。越容易阅读,可读性就越高;而句子结构越复杂,可读性就越低。有趣的是,中英5种基本句型都是最简单的句型,天生就具有很高的可读性,因此看起来简单,却值得深入探讨、研究。

五、相关实验与结果

为了更好地说明本文中所提出的方法的实效性,笔者以准确性和可读性两大指标,设计了汉英机器翻译质量对比实验。准确性主要由笔者和从事英语教学的同事把关、打分(共5人),而可读性主要由笔者和其他4名以英语为母语的、受过高等教育的英、美、加拿大籍人士通过互联网打分(共5人)。分值为去掉最高分、最低分后的平均分。这两个指标均采取百分制。为了简化实验,不牵涉其他问题,专业词汇由专业词典提供,不计入准确性考察范围。本实验建立在知名度较高、应用较为广泛的“百度翻译”引擎的基础上,一共对比了10段不同题材的汉译英翻译质量,每段原文大约为80至120个汉字。

应用“预处理法”后,汉英机器翻译质量明显提升。

表1 利用预处理法前后机器翻译质量对比表

六、结论

机器翻译有着广泛的应用前景,技术进步不但需要人工智能专家的算法改进,还需要语言学者对语言规律的深入挖掘。通过本文实验表明,在汉英机器翻译过程中,只需花很短的时间,用很少的精力对汉语原文进行“预处理”,就可以大幅度地提高翻译质量,得到较为满意的翻译结果。译文准确率更高,可读性更强。对于辅助翻译的译者来说,仅需要进一步勘误和加工润色,即可最大程度地提高翻译效率,降低翻译成本。

[1]范文.机器翻译.原理、方法与应用[J].广西师范学院学报(哲学社会科学版),2015(05):106.

[2]戴新宇,尹存燕,陈家骏等.机器翻译研究现状与展望[J].计算机科学,2004,31(11):176-183.

[3]崔启亮.论机器翻译的译后编辑[J].中国翻译,2014(06):68-73.

[4]宋广波,黄月花,赵伟宁.大学英语笔译教程[M].长春:吉林大学出版社,2015.

[5]周光父,高岩杰.论机器翻译质量的评估[J].上海科技翻译,1989(04):16.

A Study of a Pre-processing Method in Improving the Output Quality of Chinese-English Machine Translation

SONG Guang-bo
(School of Coal Engineering,Shanxi Datong University,Datong Shanxi,037003)

With the development of Machine Translation Technology,more and more people try to apply it to fulfill or help fulfill translation tasks.However,due to the limitations of current technology,Machine Translation suffers from low output quality,with poor accuracy and readability,which in turn limits the application of Machine Translation.This article is based on the theory of“Equivalence of Basic Sentence Patterns”and simplicity principles,as long as a pre-processing method is employed,which is fast and simple,the accuracy and readability of the output can be dramatically improved,which ultimately improves the translation quality in a large scale.This study also provides a new thinking for the development of Machine Translation technology in the perspective of linguistics.

Chinese-English translation;Machine Translation;basic sentence patterns;pre-processing;translation quality

H315.9

A

1674-0882(2016)05-0074-03

2016-06-30

宋广波(1972-),男,江苏沭阳人,硕士,讲师,研究方向:翻译理论与实践、英美文学。

〔责任编辑 裴兴荣〕

猜你喜欢
可读性汉英宾语
可读性
连词that引导的宾语从句
宾语从句及练习
中考试题中的宾语从句
汉英倍数表达形式比较及其类型学考察
话题链在汉英篇章翻译中的统摄作用
对增强吸引力可读性引导力的几点思考
浅谈对提高党报可读性的几点看法
汉英文字的幽默修辞功能浅探
在增强地方时政新闻可读性上用足心思