郭亚军 徐 芮
(长安大学外国语学院,陕西 西安 710064)
随着中日两国政治、经济及文化交流的日益频繁,日汉翻译的需求也与日俱增。在信息技术和人工智能技术飞速发展之际,机器翻译应运而生,并在人们的日常生活中扮演着越来越重要的角色。现代社会几乎人人都拥有智能手机,非常便于使用各种机器翻译应用软件。许多日语学习者,特别是初级水平的学习者,都会频繁使用手机机器翻译工具。但是,机器翻译的效果到底如何,能不能完全依赖于它的翻译结果等,这些问题的答案都尚不明确。
目前研究机器翻译的文章有很多,但主要集中在日英翻译(吉見,2001;吉見,2003;小田,2019)和汉英翻译(何,2018;冯,2001;梁,2018;张,2019;张,2008),很少有关于汉日翻译的研究。并且选择研究的文本数量较少,文本题材也较局限,多为科技类(陈,2005)、报纸类(张,2019)、演讲稿类(孙,2017;)等,几乎没有以日常生活类文本作为研究对象。此外,提出的对策多从机器翻译开发者(王,2007;谢,2004)和职业翻译工作者(董,2019;陈,2019)的角度出发,很少有从日语学习者和日语水平较低者的角度进行分析。
本文选择Baidu 翻译为研究对象,以大学日语权威教科书《综合日语第一册》为翻译文本,以教育部2006 年发布的《机器翻译评测规范》为参考准则,通过比较分析文本的Baidu翻译结果与教师参考书中的翻译范本,评估Baidu 翻译的日汉翻译特点与质量,找出机器翻译的问题并提出对策。
根据艾瑞PC Web 指数,2018 年10 月到2019 年10 月,Baidu 翻译持续位列在线翻译领域月度覆盖人数第一名。数据分析可得,Baidu 翻译月平均覆盖人数约为4167 万,最高可达4600 万,且整体呈上升趋势,是当前在中国使用人数最多的在线翻译平台,知名度较高,使用范围较广,接入产品较多。
笔者对长安大学日语专业学生Baidu 翻译平台的使用状况进行了问卷调查,发放问卷78 份,回收78 份,其中有效问卷78 份。问卷结果表明,78 名受访者中,关于Baidu 翻译的使用频度,所有的学生均表示在日语学习过程中使用过Baidu 翻译或其合作方的翻译功能;关于Baidu 翻译的质量,有20%的学生对Baidu 翻译质量表示满意,68%的学生认为Baidu 翻译的结果一般,仅12%的学生表示不满意。由此可见,日语学习者对于Baidu 翻译总体接受度较高,但对其翻译质量持中立态度较多。那么Baidu 翻译的质量究竟如何,笔者选取《综合日语第一册》作为语料库进行了考察。
本文将《综合日语第一册》的Baidu 翻译结果与《综合日语第一册教师用书》会话课文的译文进行对比分析,以2006年教育部发行的《机器翻译系统评测规范》为打分标准。满分为5 分,根据翻译质量的优劣对翻译结果打分。具体标准如下表1:
表1 《机器翻译系统评测规范》
《综合日语第一册》共有十五课,前四课无课文,因此本文选择第5-15 课课文展开研究,每课第一、二单元为会话文,第三单元为读解文;共计22 篇会话文,11 篇读解文。具体得分如下表2:
从表2 可以看出,读解文的平均分数为4.64 分,会话文的平均分数为3.91 分。换算成百分比即读解文的平均准确率为92.8%,会话文的平均准确率为78.2%。从得分数据可以看出,读解文分数较高,会话文分数较低。即Baidu 翻译对相对正式的文本翻译非常准确,而在较口语化的日常会话文本中,水平较低。就总体而言,机器翻译结果得分均为3 及以上,即准确率为60%及以上。大部分译文传达了原始文本的大概含义,与原文在局部上有所不同。在大多数情况下都可以参考原文,迅速纠正错误。有时甚至无需参考原文也可理解译文的含义。
1、读解类文章
读解类的问题主要是部分词汇翻译不准确。例如中日同形词「大学院」的翻译结果仍然是“大学院”,但在中国,并不使用“大学院”一词,而是“研究学院”。「歴史学部」一词的机器翻译是“历史学部”,但是中文常使用的是“历史系”。「大学祭」的翻译结果是“大学祭”,中文中没有这样的词,应翻译为文化节。
虽然读解类的文章存在一些问题,但大多数都是不符合汉语习惯、可忽略的小错误,不会影响读者的理解。无需看原文也可猜测到大致意思。因此本文的研究重点主要集中在会话类文章。
2、会话类文章
会话类文章的翻译结果扣分的主要问题如下:
表2 文章类得分统计数据
(1)语气词误译。
①原文:鈴木:あれ?知り合いですか。
Baidu 翻译结果:那是我认识的人吗?
参考书翻译:咦?你们认识呀?
例文选自第5 课第1 单元,会话场景为:高桥对小王说:“昨天的事情对不起。”于是一旁的铃木问小王:“咦?你们认识呀?”机器翻译却译为“那是我认识的人吗?”这里「あれ」的翻译不正确,此处为语气词,表达了说话人轻微的惊讶,应该译为“咦”,而不是指示词“那个”。人们可以根据上下文区分「あれ」的不同用法,而机器翻译却无法做到,常常在翻译语气词时出现错误。
②原文:あ、そうですか。
Baidu 翻译结果:啊,是吗?
参考书的翻译:哦,是这样啊!
例文选自第5 课第2 单元,会话场景为高桥又拿出来另一张照片,指着照片上的小狗说她的恋人是这个,名字是太郎。小王看完后说:“哦,是这样啊!”此处说话人是一种恍然大悟的语气。Baidu 翻译的结果是一种疑问、不确定的语气“啊,是吗”。
(2)省略部分误译。
①原文:王:おばあさんは、お母さんのお母さんですか。
高橋:いいえ、父の母です。
Baidu 翻译结果:王:奶奶是妈妈的妈妈吗?
高桥:不,我是爸爸的妈妈。
参考书的翻译:王:奶奶是母亲的母亲吗?
高桥:不,是我父亲的母亲。
例文选自第5 课第2 单元,会话场景为小王指着照片上的老奶奶,问高桥是她母亲的母亲吗?即确认是否为高桥的外婆。参考书翻译是“不,是我父亲的母亲。”Baidu 翻译结果是“不,我是爸爸的妈妈。”日语原文中高桥的回答省略了主语“奶奶”,因此正确的是“不,(这个照片上的老奶奶)是我父亲的母亲。”机器翻译对省略部分的处理往往不能达到令人满意的效果。
②原文:王:朝8 時からです。午後はだいたい5 時50 分までです。
高橋:そうですか。きょうも?
王:いいえ、きょうは7 時50 分までです。
Baidu 翻译结果:王:早上8 点开始。下午大概5 点50 分。
高桥:是吗?今天也要尝试一下。
王:不,今天7 点50 分结束。
参考书的翻译:王:早上8 点开始。下午大概5 点50 分。
高桥:是吗?今天也是这样吗
王:不,今天7 点50 分结束。
例文选自第6 课第2 单元,会话场景为小王和高桥走在校园里,高桥问中国的大学每天的第一节课几点开始,小王回答,从早上8 点开始到下午大概5 点50 分结束。高桥问,是吗,今天也是这样吗?小王说,不是的,今天7 点50 结束。Baidu 翻译把高桥第二次的提问「きょうも?」翻译成“今天也要尝试一下”,但这里的意思是“今天也是这样吗?”当省略谓词时,机器翻译会自己进行补充,但补充部分常常出错。
(3)人物性别误译。会话中人物被默认译为男性。
原文:ああ、その人は姉の婚約者です。
Baidu 翻译结果:啊,那个人是姐姐的未婚妻。
参考书的翻译:啊,那个人是姐姐的未婚夫。
例文选自第5 课第2 单元,会话场景为两个人正在讨论各自的家庭,指着照片上一位男士说那个人是姐姐的未婚夫。对于日语中「婚約者」一词,机器翻译无法判断男女,但根据文中“姐姐的婚约者”可以判断为男性,应该翻译成未婚夫。机器翻译则判断为女性,错译成未婚妻。日语中的许多词都没有性别区分,如「先輩」、「後輩」、「さん」。这种情况在汉语中也会出现,如“雨神”这个词,日语中有男女之分,「雨男」、「雨女」。这是由于词汇分布的不均匀性导致的。
(4)人称翻译生硬。
原文:「高橋さんは鈴木さんのガールフレンドですか。」
Baidu 翻译结果:高桥是铃木的女朋友吗?
参考书的翻译:高桥是你的女朋友吗?
例文选自第5 课第1 单元,会话场景为小王悄悄问铃木,高桥是不是他的女朋友。当在对话中与熟识的人面对面交谈时,机器翻译会直接翻译对方的名字,但是从中文的角度来看,这样的翻译非常生硬。最好翻译成第二个人称“你”或“您”。这里的小王和铃木面对面交谈,“鈴木さん”直接翻译成铃木较为生硬。
(5)特殊词汇误译。
原文:「チーズ!」
Baidu 翻译结果:奶酪!
参考书的翻译:茄子!
例文选自第10 课第1 单元,会话场景为几个人正准备在北京的一处景点拍照,一起喊「チーズ」,Baidu 翻译结果中被翻译成“奶酪”。但实际情况是拍照喊的口号。因此这里应该翻译成中国人拍照时喊的“茄子”。
(6)专有名词误译。
原文:それは、トンポーロウです。
Baidu 翻译结果:那是龙猫。
参考书的翻译:那是东坡肉。
例文选自第10 课第2 单元,会话场景为小王品尝一下正宗的中国菜,其中的一道菜名「トンポーロー」被翻译成“龙猫”,实际意思为“东坡肉”。东坡肉为菜名,是固有词汇。语料库中未包含,因此翻译错误。
(7)多义词误译。
①原文:何時に大学を出ますか。
Baidu 翻译结果:几点大学毕业?
参考书的翻译:几点从学校出来?
例文选自第8 课第2 单元,会话场景为小王问高桥几点从学校出来,Baidu 翻译的结果把这里的动词「出る」翻译成毕业的意思,即离开学校步入社会。但实际上这里的含义是“出来,外出去别的地方”。类似的还有第13 课第1 单元中,原文是「寮は女性が入っていてもいい」。这里的意思是“女性可以进入”。却被翻译成“女性可以入住”。
②原文:高橋:ああ、ここですね。あのう、すみません、それから…
趙:はい。
Baidu 翻译结果:高桥:啊,在这里呢。那个,对不起,还有…
赵:好的。
参考书的翻译:高桥:啊,在这里呢。那个,对不起,还有…
赵:你说吧。
例文选自第6 课第1 单元,会话场景为图书馆里,赵媛媛想问高桥洗手间在哪里。高桥有点不好意思,所以先说「あのう、すみません、それから…」,即表示有事情想询问,赵媛媛回答「はい」,即你说吧。这里的「はい」是一种应答、回应,而不是对前面事情的肯定。翻译多义词时常常会发生错误,将错误的释义放入句子中会导致整个文本产生违和感。
机器翻译的优点是可以快速翻译大量文本,但其翻译结果仍然需要检查,质量和准确性也依然落后于人工翻译。在核对翻译结果时,尤其要注意专有名词,特殊用法词汇,中日同形词,人称,多义词和人物性别。在会话类译文不通顺的情况下,要通过关联上下文,判断句子的语气和省略。日语学习者不可盲目依赖于机器翻译,如果可以做到合理地利用机器翻译工具,则可以节省大量查字典的时间。
通过分析翻译结果,可知Baidu 翻译在翻译指示代词,人称,专有名词,中日同形词,多义词和特殊用法词汇时的翻译准确度较低,在判断人物性别和语气上仍存在较大问题,从而导致整个文本的翻译质量下降。因此,有以下四种方法可以提高日语机器翻译的准确率。首先,应扩充语料库的容量,有必要在语料库中添加更多专有名词,例如人名,地名,菜名和书名。其次,对于日语中的多义词、惯用句和中日同形词等容易出现错误的地方需要添加特殊的语言规则。此外,在人物性别无法判断时,应设置规则使机器翻译直译人物名称,不翻译带有男女性别的称谓。最后,机器翻译对于语气的判断仍有较大问题,应该把基于统计的机器翻译方法与传统的基于规则的机器翻译方法结合起来。
本文分析了《综合日语》中33 篇文章的Baidu 翻译结果,通过统计数据可以看出书面文章类翻译正确率很高,会话类则较低。因此,日语初学者及水平较低者应根据文章的种类科学合理地使用机器翻译工具,不可过度依赖机器翻译,要将机器翻译容易出现错误的地方与原文再次核对。开发者应对目前出现不足的领域进行改善,提高翻译精度。