英汉亲属称谓语的机器翻译调查及存在问题
——以cousin为例

2018-09-26 05:42涂王贝唐尔龙
巢湖学院学报 2018年4期
关键词:英汉亲属语料库

涂王贝 唐尔龙

(安庆师范大学,安徽 安庆 246133)

1 引言

亲属称谓语是指以本人为中心确定亲族成员与本人关系的名称,是基于血亲、姻亲基础上的亲属之间相互称呼的名称和叫法。由于亲属称谓语在社会交际和文化交流中的重要作用,学术界对其语义、语用功能和翻译策略等都有一定的研究[1-4]。相比较人工翻译,机器翻译的优势在词汇翻译上,当机器翻译遇上语义丰富的亲属称谓语,是否能发挥机器翻译的优势,目前对此进行研究的不多见。cousin一词涵盖的亲属关系丰富多样,可指近亲,也可指远亲;可指男性,也可指女性;可指平辈,也可指长辈;可以说是英文里语义最为广泛的亲属称谓语。因此,本文以cousin为例来研究英汉亲属称谓语的差异及讨论机器翻译的质量问题较为典型。

2 英汉亲属称谓语的语义对比

2.1 语义完全对等

由于历史、社会、文化的长期影响,英汉亲属称谓语有着极大的区别。无论从书面语或是从口语分析,汉语亲属称谓系统都堪称世界上最丰富、最复杂的亲属称谓系统之一。汉语文化强调男女有别、长幼有序、主次分明,汉语的称谓语数量众多且繁杂,清楚地显示了亲属的宗族、血缘、婚姻和家庭关系。西方自进入现代社会以来,家庭组织形式就逐渐发展为以父母为核心的小家庭形式(nuclear family),其成员一般只有两代人,即父母与儿女,儿女长大成人建立自己的家庭后也便脱离父母,自立门户。这种小家庭形式像一个个小的细胞体一样,构成了社会的大的有机体,他们不仅家庭结构比中国单一,而且家庭成员住得也比较分散[5]。因此,英语文化中,除核心家庭成员外的都属于亲属,没有血缘、姻亲或者年龄等区别。英汉两种语言的亲属称谓语中,只有核心家庭成员的称谓语所表达的语义是完全对等的,如 father(爸爸)、mother(妈妈)、son(儿子)、daughter(女儿),husband(丈夫)、wife(妻子)。

2.2 语义不对等

汉语亲属称谓语清楚、具体、多样化,且血亲与姻亲、父系与母系、直系与旁系、宗族与外宗族、长辈与晚辈、年长与年幼、男性与女性、近亲与远亲等都详细区分。而英语称谓系统相对简单许多,其中缺少了区别长幼、亲缘、父母亲属和内外亲四个系统。因此,如下表所示,英语称谓语的语义往往涵盖了多个汉语称谓语的语义内涵。

表1 英汉称谓语的语义对比

由表1可见,英语称谓语和汉语称谓语之间存在“一对二”或者“一对多”的特点,英语称谓语的概括性决定了其数量远远少于汉语称谓语,数量上的不对等必然给翻译带来语义选择的难题。通过比较发现,cousin在中英文中语义差别最大,在翻译成中文时需根据上下文区别亲疏关系、区分性别,乃至辈分。cousin既可以指同辈的亲属,也可以指不是同一辈分的亲属,这是英语文化的独特现象,值得研究。因此,cousin一词最能体现英汉亲属称谓语的表达差别。

3 以cousin为例的机器翻译调查

词典里对cousin的解释是 “the child of your uncle or aunt”[6],意指堂或表兄弟姐妹,都是同辈亲属,细分一下指“堂兄、堂弟、堂姐、堂妹、表兄、表弟、表姐、表妹”8种亲属关系。而维基里对cousin的定义是“A cousin is a relative with whom a person shares one or more common ancestors”[7],意思是和本人有一个或更多共同祖先的亲属,这个内涵就丰富得多。根据维基里的详细解释按照其亲属关系细分,可以指同辈的表亲如first cousin(祖辈相同的孩子),second cousin(曾祖辈相同的孩子),third cousin,fourth cousin,fifth cousin和sixth cousin等;也可以指不是同辈的远房表亲,如 first cousin once removed(兄弟姐妹的子女和孙子辈,辈分差了一辈),first cousin twice removed,first cousin thrice removed等等差一个辈分或者几个辈分的亲戚。这一点是英语文化里独有的现象,在汉语文化里是不存在的。

这种现象在原语中是否普遍以及对应的翻译问题,笔者分别调查了cousin在英语中的使用频率和汉语的翻译情况,并进行了比较分析。

3.1 原语中的使用情况

笔者选取了美国当代英语语料库(COCA)和英语国家语料库(BNC)两个最有代表性的英语语料库来分别调查cousin一词在美式英语和英式英语中的使用情况。COCA (Corpus of Contemporary American English)[8], 含有 5.2 亿词汇,是当今世界上最大的英语平衡语料库。BNC(British National Corpus)[9]包含了 1 亿词汇,涵盖了英国各个年龄段、各个阶层、各种形式的语言。

表2 cousin在美式英语和英式英语中的使用频率

通过调查和比较可以看出,cousin在两个语料库中出现的频率最高,但是按照血缘关系细分为first cousin、second cousin等之后,其出现频率锐减,血缘关系更远的third cousin、fourth cousin等可谓屈指可数,尤其是在英式英语里,更是寥寥无几。语言是文化的产物,亲属关系是社会文化的重要组成部分,普遍存在于不同的社会文化中,因此,应从文化差异理解亲属称谓的差别。西方人在日常生活中对于亲属之间的关系分得并不是很清楚,所有的有血缘关系的非直系亲属都统称为“cousin”,因此,cousin一词在两个语料库中出现频率最高。而具体的血亲关系如“first cousin、second cousin”等,只是在继承遗产时,才会按照血缘关系的亲疏远近来细分,因此,在这一点上,英语的称谓语比汉语称谓语划分得更加细致,汉语里没有“fifth cousin,sixth cousin”这类远房亲属称谓语。汉语文化除了直系亲属有财产继承权外,表亲或者血缘关系疏远的亲属是没有财产继承权的。

如,《傲慢与偏见》里的Mr.Bennet说的话:“It is from my cousin,Mr.Collins,who,when I am dead,may turn you all out of this house as soon as he pleases.”

译文:信是我的表侄科林斯先生写来的。我死了以后,他可以什么时候高兴就把你们撵出这座房子[10]。

这涉及到英国的一个古老的继承制度,叫做限定继承(entail),即土地的继承权仅限于男性后代,如无男性后代,必须要传给同宗的男子。限定继承只适用于土地,并不适用于其他财产。从原著中可以得出,Mr.Collins的父亲和Mr.Bennet有血缘关系,二人姓氏不同,译者可以推测出老Mr.Collins和Mr.Bennet的关系可能为first cousins(表兄弟),非亲兄弟或堂兄弟。Mr.Collins是Mr.Bennet的second cousin,是Bennet五个女儿的表兄,因此译文中翻译成“表侄”是合适的。

3.2 译文的翻译情况

从上文可以看出,cousin一词的语义极其丰富,可以说,能够代指一切堂亲、表亲、远房亲戚,这就给翻译带来了不小的挑战。译文要根据上下文确定其血缘关系、性别、年龄和辈分。如著名小说《Cousin Bette》,就有译成《贝姨》和《表妹贝蒂》等多个版本。人工翻译cousin一词,尚且需多方考证,机器翻译的质量想必不尽人意。机器翻译是利用计算机把一种自然语言转变成另一种自然语言的过程,用以完成这一过程的软件叫做机器翻译软件,是完成机器翻译的载体。根据翻译软件的特点和使用情况,笔者选取了几款翻译软件进行测试。句酷是全球最大的双语例句搜索引擎,其中文词语处理技术较为领先。爱词霸优势在词汇量巨大,声称收录200本词典,数百万词条,覆盖几十个专业领域。百度翻译和有道翻译的最大特色在于翻译引擎是基于搜索引擎,也就是说它所翻译的词释义都是来自网络,能及时反映最新的语言动态。因此,笔者选取了这几款机器翻译软件调查cousin的翻译情况。

表3 cousin在机器翻译软件中的翻译情况

4 发现的问题

4.1 译文错误

由表3可以看出,含有cousin的亲属称谓语,机器翻译的错误比比皆是。如“first cousin”基本翻译正确,但是百度翻译给出的译文是“第一个表妹”,而其提供的网络译句是正确的。“second cousin”有道翻译成“二表妹”,而百度翻译是“二表哥”;“cousin removed”被百度翻译和爱词霸翻译成“表妹删除”。相比较而言,由于其中文词语处理技术的优势,句酷的正确率较高,没有出现这类错误。百度翻译和有道翻译这类基于搜索引擎的翻译类软件,其优势在于强大的网络资源,因此,虽然其译文错误,但是提供的网络例句却能弥补不足,提供完整的语境和正确的译文,供译者参考。比如在有道翻译中查询含有“cousin removed”的短语,没有得到对应的中文释义,但是网页却提供了大量例句,供译者参考。例如:

The website,based in Provo,Utah,also discovered that Mr.Obama was a 10th cousin once removed from Rush Limbaugh,the conservative talk radio host and one of the president′s most virulent critics.

总部位于犹他州普罗沃的这家网站还发现,奥巴马还是守旧派谈话类电台节目主持人拉什·林堡的第十代隔代表亲。拉什·林堡是奥巴马最辛辣的批评者之一。(来源于www.chinabaike.com)[11]

这里出现的亲属关系更为久远,“10th cousin once removed”是指第十代的表亲,而且还是隔代的。

4.2 语义模糊、内涵不清

在英语里,cousin一词使用的范围要比relative、kinsman等小,但是也不仅仅指堂、表兄弟姐妹。而在很多情况下,如表3所示,多个翻译软件都是指“堂兄弟姐妹、表兄弟姐妹”。关于cousin一词的语义,傅雷先生在《贝姨》一书的《译者弁言》里已做了详尽的阐述:“欧洲人所谓的cousin(法文couisne多指女性)包括:1、堂兄弟姐妹,及其子女。2、姑表、姨表、舅表的兄弟姐妹,及其子女。3、妻党的堂兄弟姐妹,及其子女;妻党的表兄弟姐妹,及其子女。4、夫党的堂兄弟姐妹,及其子女;夫党的表兄弟姐妹,及其子女。”[12]

对英汉双语词典来说,提供明白的解释是责无旁贷的。但是对于cousin这个词,笔者查阅了几个版本的词典,如朗文、牛津等提供的释义都没有涵盖全部语义。

5 译后编辑提升译文质量

基于网络的机器翻译确实在词汇、存储等方面有着人工翻译不可比拟的优势,但是,本文以cousin为例的调查证明,机器翻译的质量目前良莠不齐,需加大力度改善其翻译质量。虽然各大翻译软件都表示收录了多部权威词典,有的甚至宣称收录了200多部词典,但是如何收录,是否收录完整,用户无从得知。从本文以cousin为例调查发现,各大翻译软件收录的释义并不完整,引申含义及拓展含义都未收录。这就导致其翻译质量不高,准确性有待提高。软件开发者应注重在软件开发源头把关,努力扩大语料库的收录范围和语义的完整性,而对于译者而言,在享受机器翻译的便捷的同时,应积极参与翻译过程,提升机器翻译的译文质量,这其中最重要的策略就是要注重译后编辑。

5.1 译后编辑实现语用对等

译后编辑研究起源于20世纪80年代中期,传统意义上的译后编辑是对机器翻译输出的初始译文进行修改与加工的过程[13]。在称谓语研究中,本文的调查可以看出机器翻译无法保证翻译的准确性,译者需根据语境来判断称谓语的语义,实现其在两种语言中的语用功能对等。cousin一词在赛珍珠的《大地》中多次出现,cousin指的是first cousin还是second cousin呢?是男是女?是平辈还是长辈呢?都要译者根据上下文及人物关系进行推理。例如:

And the boy looked about him and said desperately,seeing that his father would choke him if he did not answer,"He has been away three nights altogether,but what he does I do not know,except that he goes with the son of your uncle,our cousin."[14]

译文:这孩子看了看四周。心想,如果他不讲出来,父亲会把他掐死的。他绝望地说:“他已经整整三夜没在家了。他去干什么,我不知道,只知道他是和你叔叔的儿子,也就是我们的堂叔一起出去的。 ”[15]

根据其人物亲属关系,“the son of your uncle,our cousin”,判断出这里的 cousin不是指 first cousin,而是second cousin,对应到中文里的称谓是“堂叔”。只有译者实行译后编辑,根据语境和人物关系才能推断出 “cousin”在此处的语用所指,从而得出正确的译文,单纯依靠机器翻译是无法完成的。

5.2 译后编辑体现文化内涵

关于机器翻译译后编辑的ISO 18587草案标准(ISO,2014)将译后编辑的输出分为两个级别:快速译后编辑(Light post-editing)、完全译后编辑(Full post-editing)[13]。 无论是快速译后编辑还是完全译后编辑,“修改文化差异的译文”都是译后编辑的主要内容之一。在倡导中国文化走出去的大时代背景下,将中国特有文化融入目的语文化中,译者的重要性毋庸置疑,译后编辑必不可少。

《红楼梦》中纷繁的人物关系和传统文化中典型的称谓语使得学者对作品里称谓语和翻译关注颇多,已成为红学研究中重要的一部分。原著中频频出现的“姐姐、妹妹”,并不是和英语文化中 “sister”一样指亲姐妹,因此不可直译为“sister”。从亲属关系来分,对于贾宝玉而言,除了贾元春、贾探春外,其他的“姐姐、妹妹”都是堂姐妹或者表姐妹。所以,霍克斯译本里“林妹妹”就译为“cousin Dai”或是“cousin Lin”,“宝姐姐”则是“cousin Chai”或是“cousin Bao-chai”。如第九回中,宝玉要去上学,向林黛玉辞行。

黛玉忙又叫住问道∶“你怎么不去辞辞你宝姐姐去?”

As he was going she suddenly called after him so that he stopped∶"Aren′t you going to say good -bye to your cousin Bao-chai?"[16]

6 小结

亲属称谓就是以说话人为中心对其亲属的关系定位,在交际中它具有鲜明的指向性,是反映社会文化的重要方面。英汉亲属称谓语的不同折射出英汉两种文化的差异,如本文研究的cousin这一称谓语就反映出英汉文化中的人际关系的巨大不同。机器翻译虽然在词汇存储、方便快捷等方面有优势,但是面对如此复杂的称谓语翻译时还是难以招架,译者的参与和译后编辑必不可少,机器翻译的质量有待提高。

猜你喜欢
英汉亲属语料库
《语料库翻译文体学》评介
什么?亲属之间不能相互献血?
基于COCA语料库的近义词辨析 ——以choose和select为例
English Abstracts
基于JAVAEE的维吾尔中介语语料库开发与实现
浅谈英汉习语的文化差异及翻译方法
狗也怕醉汉
精神分裂症患者一级亲属认知功能调查
浅谈音乐风格对英汉歌曲翻译的制约
英汉反身代词长距离约束的语用分析