当前机器翻译在日本文学翻译方面的缺陷与对策

2021-06-28 07:44李佳钰
读书文摘(下半月) 2021年2期
关键词:日本文学机器翻译自然语言处理

李佳钰

[摘  要:通过应用机器学习和自然语言处理技术,机器翻译正处于飞速发展的阶段。本文以百度翻译的《在城崎》译文为例,旨在通过分析机器翻译目前的不足之处,提出改进意见,为推动机器翻译在跨语言、跨文化交流方面的发展贡献力量。

关键词:机器翻译;日译汉;日本文学;自然语言处理]

一、引言

“机器翻译是利用计算机把一种自然源语转换成另一种自然目标语言的过程。机器翻译研究如何利用计算机实现自然语言之间的自动翻译,是人工智能和自然语言处理领域的重要研究方向之一”(刘洋,2017)。当前,随着经济全球化的深入发展,各国在经济、贸易、环境、教育、文化方面的交流与合作日益频繁,语言互通的需求愈加强烈。机器翻译的快速发展,不仅在外语学习中发挥着越来越大的作用,也正在为跨语言、跨文化交流带来便利。

在关于机器翻译的先行研究中,英汉互译的相关研究占多数,而日汉翻译方面的研究尚且为数不多。随着中日两国不断加强交流,深化合作,两国在生产、贸易、教育、文化等领域的交流越来越密切,日汉翻译的需求也在不断扩大。文学作品是加强对彼此文化理解的重要途径,机器翻译能够快速翻译大量文本,具有便利高效的特点。

根据艾瑞PC Web指数,从2020年2月到2021年2月,百度翻译持续位列国内在线翻译平台的月度覆盖人数第一名。根据统计数据可得,百度翻译月平均覆盖人数约4000万人,最高可达4600万人,是目前国内使用人数最多的在线翻译平台。本文以百度翻译代表,考察机器翻译在日本文学方面的译文质量,指出不足之处并提出改进建议。

二、机器翻译在日本文学方面的质量实证考察

现代机器翻译应用机器学习和自然语言处理技术,通过学习大量数据语料不断改善。目前,机器翻译在书面文章类翻译正确率很高,会话类则较低。(郭亚军 徐芮,2020)。志贺直哉的心境小说《在城崎》全篇没有对话,为记叙和作者关于生死的议论。本文通过《在城崎》的百度翻译例文为例,分析机器翻译的不足之处,归纳错误类型并列出具有代表性的错误例句。

(一)名词误译

1.照搬汉字作为翻译

(1)原文:山女が沢山集まっている。

误译:聚集了很多山女。

确译:聚集着很多马苏大麻哈鱼。

「山女」指马苏大麻哈鱼,可译为鳟鱼或马苏大麻哈鱼。

(2)原文:植込みの八つ手の花が丁度咲きかけで……

误译:花丛里的八只花正在盛开……

确译:花丛里的八角金盘树的花刚刚盛开……

「八つ手」指八角金盘树。

此外,百度翻译译文中还出现了将「屋守」“壁虎”译为“屋守”;「雨樋」“檐漕”译为“雨樋”的误译。

2.名词识别错误

(1)原文:いもりだ。

误译:是阴天。

确译:是蝾螈。

(2)原文:いもりは力なく前へのめってしまった。

误译:蝙蝠无力地向前倾倒。

确译:蝾螈无力地向前倒下。

(3)原文:いもりと自分だけになったような気持ちがしていもりの身に自分がなってその気持ちを感じた。

误译:我有一种只剩自己一个人的感觉,在森林里自己也感受到了那种心情。

确译:似乎世间只剩下我和蝾螈,我感到自己变成了死去蝾螈的替身。

本句中「いもり」一词出现了两次,第一次百度翻译将其漏译,第二次误译成森林。

「いもり」指蝾螈,在文章其他出现了「いもり」的句子中,百度翻译正确地将其翻译为蝾螈,证明语料库中有「いもり」一词,但在上述四个误译句中,百度翻译没能将「いもり」完整识别进而翻译出来,而是错误识别成假名拼写相近的「くもり」(阴天)、「こうもり」(蝙蝠)、「もり」(森林)等词。

3.名词词义翻译错误

(1)原文:兎に角要心は肝心だからといわれて、それで来た。

误译:总之重要的是因为重要,所以来了。

确译:(医生说)总之重要的是要注意身体,所以来到了这里。

「要心」的意思是留心,注意。

机器翻译出现了将汉字直接作为译文或词义翻译错误,以及识别错误的情况。

(二)动词误译

1.动词词义翻译错误

(1)原文:それは大きな鼠を川へなげ込んだのを見ているのだ。

误译:那是在看大老鼠掉进河里了。

确译:那是在看被扔进河里的大老鼠。

「なげ込む」扔进,投入。

2.动词活用形翻译错误

(1)原文:仕舞に殺されて墓の下にいる、その静かさを……

误译:被杀在墓下的那种安静……

确译:最终被杀死后,在墓中长眠的安静……

(2)原文:自分は下へいってそれを暫く見上げていた。

误译:我往下看了一会儿那个。

确译:我走到下面,仰着头看了一会它。

句中的动词て形表示停顿和动作的先后顺序,翻译时应注意将动词活用形翻译准确。

(三)形容词、形容动词误译

(1)原文:フェータルな傷……

误译:淡雅的伤……

确译:致命的伤……

「フェータル」是外来语,致命的,命运的。

(四)拟声拟态词误译

(1)原文:カチッカチッと石垣に當って跳ね返った。

误译:喀嚓一声撞到石墙上反弹了起来。

确译:石头咯当咯当地撞到石墙上反弹了起来。

(2)原文:スポッ、スポッと石が水へ投げ込まれた。

误译:哗的一声,石头扔到了水里。

确译:“扑通”、“扑通”石头被扔进水里。

连续的拟声词表示动作持续的状态,而“……一声”只描述了一个动作,与原文不符。

(五)代名词误译

(1)原文:それは三日程その儘になっていた。それは見ていて、如何にも静かな感じを与えた。

误译:那个维持了三天左右。那个看着,给人一种安静的感觉。

确译:死去的蜜蜂在那里待了三天,看起来有一种极其安静的感觉。

(2)原文:自分はそれに対し、感謝しなければすまぬような気もした。

误译:我觉得必须要感谢那个。

确译:我感到自己必须对此心怀感谢。

代名词翻译与其他词性的词的翻译不同,并不依靠语料库,而是需要联系上下文进行理解判断,但机器翻译只机械地将「それ」、「これ」等代名词译为“那个”“这个”等,造成语意不通、语意生硬等问题。

(六)句型翻译错误

1.句型判断错误

(1)原文:半分意識を失った状態で、一番大切な事だけによく頭の働いた事は自分でも後から不思議に思った位である。

误译:在失去了一半意识的状态下,正因为是最重要的事情,所以脑子里经常工作的事情,自己后来也觉得不可思议。

确译:在近乎失去意识的状态下,竟还能在脑海中想着最重要的事情,事后自己想起来都觉得不可思议。

「……に頭が働く」精神在……方面活动,「一番大切な事だけによく頭の働いた事」即“脑海中只想着最重要的事情”之意,百度翻译将句型识别为「だけに」“正因为……”,导致整句译文偏离原意。

(2)原文:或所迄来ると橋だの岸だのに人が立って何か川の中の物を見ながら騒いでいた。

误译:到了某个地方,明明是桥或岸边却站着人,一边看着河里的东西一边吵闹着。

确译:走到某个地方,只见桥上和岸边挤满了人,一边看着河里的东西一边喧闹着。

原句中出现的句型是「……だの……だの」,表示列举,“又是……又是……”,原句的意思是“人们站在桥上和岸边”,但百度翻译错误识别为「のに」“明明……”,导致译文错误。

2.未识别出句型

(1)原文:然し今は、それが本当に何時か知れないような気がして来た。

误译:但是现在,我觉得那个真的不知道什么时候来了。

确译:但是如今,却渐渐觉得何时死亡确实是不可预测的。

「気がしてきた」是「気がする」的变形,百度翻译误将「きた」单独拆开,误译为“来了”。

(七)定语误译

1.定语所修饰的名词判断错误

(1)原文:虎斑の大きな肥った蜂が天気さえよければ、……

误译:虎斑肥大的蜂只要天气好……

确译:带有大片虎斑的肥大的蜜蜂在天气晴朗的时候……

「虎斑の大きな肥った」是「蜂」的定语,但百度翻译误将「肥った」当成「虎斑」的定语,导致翻译错误。

2.定语翻译错误

(1)原文:自分は自分の怪我の場合、それに近い自分になった事を思わないではいられなかった。

误译:如果自己受了伤,就不能不想起和自己相近的事情。

确译:我不由得想起自己受伤时,也是像那只老鼠一样非常拼命的。

「それに近い」是「自分」的定语,所以直译应为“和那相近的自己”,百度翻译误译为“和自己相近”。

(2)原文:自分は円山川、それからそれの流れ出る日本海などの見える東山公園へ行くつもりで宿を出た。

误译:我准备去东山公园,那里能看到圆山川,还有从那里流出的日本海。

确译:我打算出门去东山公园,在那里能观赏到圆山川和它汇入的日本海。

「それの流れ出る」是名词「日本海」的定语,即「円山川が流れ出る」“圆山川流向的”之意,百度翻译颠倒了流向关系。

(八)主语宾语判断错误

(1)原文:自分はいもりを驚かして水へ入れようと思った。

误译:我吓了一跳,想把它放到水里。

确译:我想把蝾螈惊到水里。

动词「驚かす」的宾语是「いもり」,主语是「自分」,百度翻译错把主语当成了宾语。

(九)主动被动语态翻译错误

(1)原文;そしてそういわれても……

误译:即使那样说,……

确译:即使被这样告知……

(2)原文:死んだ蜂は雨樋を伝って地面へ流し出された事であろう。

误译:死去的蜂是通过雨樋流到地面上的吧。

确译:死去的蜂顺着檐漕被冲到地面上了吧。

文中「いわれて」、「流し出された」都是被动态,百度翻译中主动被动语态翻译错误。

(十)肯定否定判断错误

(1)原文:然し気分は近年になく静まって、落ちついたいい気持がしていた。

误译:然而,心情却近年来安静下来,心情平静下来。

确译:心情却是近年来没有的宁静、平和的好心情。

「なく」是「ない」的活用形,表示否定。

(十一)多义词误译

(1)原文:脇が玄関の屋根で、それが家へ接続する所が羽目になっている。

误译:旁边是玄关的屋顶,与家连接的地方成了窘境。

確译:旁边是玄关的屋顶,与房间的木墙板相连。

「羽目」有“木墙板”和“窘境”两个语义,在本句中应采用“木板墙”之意。

(2)原文:それが一層そういう気分に自分を誘って行った。

误译:那个更加邀请了那样的心情自己去了。

确译:这又进一步引发了这种感觉。

「誘う」有“邀请;引诱;引发、促使”三个义项,在本句中应采用“引发、促使”的意思。

(3)原文:最初石が当たったとは思わなかった。

误译:我没想到第一次碰到石头。

确译:最开始完全没想到是石头打中了它。

副词「最初」有“最初,起先;第一次”等意,文中应采用“最初,最开始”的义项。句中动词「当たる」有“猜中;击中;中奖”等多个义项,但文中的意思应为“击中,打中”。

(十二)漏译

1.谓语漏译

(1)原文:頭の上に三寸程、咽喉の下に三寸程それが出ている。

误译:头上有三寸左右,喉咙下面有三寸左右。

确译:鱼签子在老鼠的头上方、喉咙下方各露出三寸左右。

2.定语漏译

(1)原文:……時考える事は矢張り沈んだ事が多かった。

误译:……的时候,思考的事情还是很多的。

确译:……此时此刻想的也多是令人不快的事。

「事」前的定语「沈んだ」被漏译。

(2)原文:外界にそれを動かす次の変化が起るまでは死骸は凝然と其処にしているだろう。

误译:在外界发生下一次变化之前,尸体会凝固在那里吧。

确译:蜜蜂的尸体大概会一直待在那里,直到下一次外界发生搬动它的变化为止。

「変化」前的定语「それに動かす」被漏译。

3.状语漏译

(1)原文:植込みの八つ手の花が丁度咲きかけで……

误译:花丛里的八只花正在盛开……

确译:花丛里的八角金盘树的花恰好正盛开着……

修饰动词「咲きかける」的状语「丁度」被漏译。

日语的语序将动词放在句尾,且多用定语,百度翻译在翻译长句时易漏译句中的定语、状语和句尾谓语。

(十三)没有补译或补译错误

1.没有补译

(1)原文:山の手線の電車に跳ね飛ばされて怪我をした、……

误译:被山手线电车撞伤,……

确译:我被山手线电车撞伤,……

百度翻译没有补译主语“我”。

(2)原文:顔の表情は人間にわからなかったが動作の表情に、それが一生懸命である事がよくわかった。

误译:虽然人类不知道脸上的表情,但是从动作的表情中,我明白了那是非常拼命的。

确译:虽然人类无法理解老鼠脸上的表情,但是从老鼠的动作上,我明白了它在拼命挣扎。

「顔の表情」、「動作の表情」的主语都是老鼠,补译后句意更加完整便于读者理解。但百度翻译的译文没有适当补译。

2.补译错误

(1)原文:それは見ていて、如何にも静かな感じを与えた。淋しかった。

误译:那个看着,给人一种安静的感觉。我很寂寞。

确译:它看起来有一种极其安静和寂寞之感。

句中的「淋しかった」的主语不是“我”,而是“蜜蜂的尸体”。

(2)原文:いもりはしっぽをそらし、高く上げた。自分はどうしたのかしら、と思って見ていた。

误译:蝾螈把尾巴向后仰,高高舉起。我在想自己是怎么了。

确译:它的尾巴向后卷起来,高高地竖起着。我正想着蝾螈这是怎么了,继续在旁边看着。

原文中「どうしたのかしら」“(蝾螈)这是怎么了”,省略了主语蝾螈。百度翻译误将主语补译成“我”,导致译文错误。

(十四)没有拆译

(1)原文:他の蜂が皆巣へ入って仕舞った日暮、冷たい瓦の上に一つ残った死骸を見る事は淋しかった。

误译:在其他蜂都进了巢的日暮,看到在冰冷的瓦上留下的一具尸体很寂寞。

确译:日暮时,其他蜂都归巢了,独留那一具蜜蜂的尸体躺在冰冷的瓦片上,看起来十分寂寞。

(2)原文:狙ってもとても当らない程、狙って投げる事の下手な自分はそれが当る事などは全く考えなかった。

误译:就算瞄准了也根本打不中,不擅长瞄准投出的自己完全没想过会中。

确译:我知道自己准头极差,就是瞄准了投也打不中,所以完全没想到自己刚刚的随手一扔能打中。

翻译遇到较长的定语时,一般进行拆译使之符合汉语的语言习惯。但百度翻译处理例句中的体言「日暮」、「自分」前的定语时,直接按照原文语序进行翻译,没有拆译,使译文不流畅自然。

(十五)语序不当

(1)原文:自分は自分の怪我の場合、それに近い自分になった事を思わないではいられなかった。

误译:如果自己受了伤,就不能不想起和自己相近的事情。

确译:我不由得想起自己受伤时,也是像那只老鼠一样非常拼命的。

动词“想”应放在句首主语后。

(2)原文:自分は偶然に死ななかった。いもりは偶然に死んだ。

误译:我没有偶然死去。蝾螈偶然地死了。

确译:我是偶然活下来的。蝾螈是偶然死的。

“偶然”应放在否定之前,即“偶然地没有死去”,也就是“偶然地活下来”之意。

(十六)搭配不当

(1)原文:……道幅が狭くなって路も急になる、流れも同様に急になって、……

误译:……道路就变窄了,路也变陡了,水流也同样变陡了,……

确译:……道路就变窄了,路也变陡了,水流也变得湍急,……

“水流”的对应搭配应该为“湍急”。

(十七)语意不通顺

(1)原文:鼠はどうかして助かろうとしている。

误译:老鼠无论如何都要救过来。

确译:老鼠拼命想活下来。

「助かる」即「死を免れる」在文中应译为“活下来”。

(2)原文:傍の洗場の前で餌を漁っていた二三羽の家鴨が石が飛んで来るので吃驚し、……

误译:在旁边的洗浴室前捕饵的两三只家鸭飞来石头,吓了一跳,……

确译:两三只鸭子正在旁边的洗手池前觅食,被砸过来的石头吓了一跳,……

“家鸭”后接“飞来石头”语意不通顺,应适当调整译文顺序。

三、机器翻译的改进意见

(一)更新并检查语料库

实时更新语料库,检查语料库的正确性。完善词语、句型,并注意动词活用形的用法。不断输入时事新词,尤其要注意动植物类名词、人名等专有名词和外来语、流行语。

(二)提高识别准确度

即使语料库中存有词语和句型,但若是识别不准也会导致翻译错误。因此,提高识别的精准度也是提高翻译正确率的一个重要方法。

(三)完善翻译算法

机器翻译通过大量数据语料归纳出算法模型并不断完善,再将算法模型应用到翻译中。目前,机器翻译的算法模型在以下几个方面较为薄弱,需要改善加强。

1.拟声拟态词翻译。将拟声拟态词翻译为对应的象声词,并注意译文句式灵活,贴近原文。

2.定语翻译。准确判断定语修饰的体言。

3.准确判断句中的主语宾语、主动被动关系、肯定否定关系。

4.减少漏译。完整翻译句子各成分,尤其注意句尾的谓语、句中的定语和状语。

5.应用拆译的翻译手法,特别在翻译定语句和长句时,使译文更符合汉语的语言习惯。

(四)加强对汉语译文的检查

大量输入汉语语言语料,完善汉语语言模型。利用语言模型检查翻译出的汉语译文是否存在语序不当、搭配不当、成语运用不当、语意不通顺等问题并进行改正。

四、結语

本文以《在城崎》百度翻译译文为例,分析了机器翻译目前的不足之处并提出改进意见,期待机器翻译今后继续不断改进,提高翻译准确率,在突破汉日语言壁垒的道路上继续向前迈进,在跨语言、跨文化交流方面发挥越来越大的作用。

参考文献

[1]顾明耀.标准日语语法(第二版)[M].北京:高等教育出版社,2004.

[2]刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,(6).

[3]孙泽方.当前日译汉机器翻译的缺陷及对策——以特朗普就职演讲日文版的“Baidu 翻译”译文为例[J].现代语文(语言研究版),2017,(5).

[4]郭亚军,徐芮.Baidu翻译日译汉中存在的问题与对策 ——以《综合日语》为例[J].吉林广播电视大学学报,2020(9).

[5]王钰.自然语言处理及其在机器翻译中的应用[J].现代语文,2019(5).

[6]祝朝伟.机器翻译要取代作为人的译者了吗?--兼谈翻译人才培养中科技与人文的关系[J].外国语文,2018,(3).

[7]杜金华,张萌,宗成庆,等.中国机器翻译研究的机遇与挑战——第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,(4).

西北大学  陕西  西安  710127

猜你喜欢
日本文学机器翻译自然语言处理
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
基于组合分类算法的源代码注释质量评估方法
大数据背景下石油科技翻译
大数据背景下石油科技翻译
比较视野中的日本艳情文学观
论日本文学
文化视野下日本文学作品中女性形象探究
浅论日本文学中的“物哀”倾向
机器翻译不可盲取