经验人:胡 伟
“百度翻译”是互联网上常用的一款免费在线翻译工具,对英汉翻译起到一定的辅助作用,笔者利用该工具将若干不同层次的英语语句翻译成中文,对结果进行人工评测,并给出初步改进策略,希望对读者有一定帮助。
“百度翻译”(网址:http://fanyi.baidu.com/#auto/zh/)是互联网上常用的一款免费在线翻译工具,现实中越来越多的用户依赖于该翻译工具进行翻译,并希望有较好的准确性。笔者将若干难易程度不同的英语句式分别用该翻译工具进行翻译,并对结果进行分析和评述,进而提出基本改进策略,希望能进一步提高“百度翻译”的翻译质量。
首先打开“百度翻译”网页,将待翻译的英语源语言输入左边的方框,点击翻译按钮,软件会自动将中文翻译结果显示在右边的方框中。如果点击右边方框中的中文翻译结果会出现一个下拉菜单,显示若干条其他备选翻译结果供参考。例如在左边方框中输入英文“She is under the weather.”点击翻译按钮后显示的中文翻译为“她在天气下”,点击该语句将显示其他可能的翻译结果,如下截图所示:
有时给出的中文翻译不一定是最准确的,可以点击该中文句子显示下拉菜单查看是否有更佳的翻译。
首先对比较简单的英语语句进行翻译,输入以下两个英文语句:
(1)I want to buy a cartoon book tomorrow.
(2)She is used to staying up late.
给出的首选翻译结果分别为:
(1)我明天要买一本卡通书。
(2)她习惯熬夜了。
对于此类简单的英语语句,百度翻译能给出较好的翻译结果,可以识别 be used to,stay up late 一类比较经典的短语词组。
由于客观条件限制,笔者选取了约30 条含有常用英语习语或成语的语句进行测试,备选结果中都能找到基本正确的中文翻译,例如以下面四个带有英语习语或成语的语句在“百度翻译”中进行翻译的结果为例,这四个英文句子是:
(1)She is under the weather.
(2)He is all thumbs.
(3)You shouldn’t pass the buck.
(4)an old flame。经过翻译,从“百度翻译”提供的备选结果中均可以找到基本正确的对应中文,较佳的翻译结果分别如下:
(1)她心情不好;她不舒服。
(2)他笨手笨脚。
(3)你不应该推卸责任。
(4)旧情人。
可见对于比较常用的习语或者成语,“百度翻译”的正确率还是较高的。不过对于少数不常用的习语“百度翻译”只能按照字面意义进行翻译,例如对如下两个习语:Cordelia’s Gift(女性真诚的声音),be a Jason(薄情郎),“百度翻译”给出的所有中文参考结果基本都是按照字面进行翻译,无法识别隐含的意义,从而与正确的中文本意有实质性差别。
首先尝试对英文“All the teachers did not attend the meeting yesterday”进行翻译,这是一种比较特殊的否定句,all 与not 构成的否定句往往表示部分否定,有时not 可以后置于谓语中,属于英语习惯表达方式,该句实际上等价于“Not all the teachers attended the meeting yesterday.”对应的正确中文意思是:“不是所有的老师都参加了昨天的会议。”但是“百度翻译”翻译的结果为:“所有的老师都没有参加昨天的会议.”备选结果中也没有部分否定的表达,与原句意思有实质性差别,可见没有识别出其中部分否定的特殊结构。
再对英文“You can not be too careful in choosing friends.”进行翻译,“百度翻译”翻译的结果为“在选择朋友时,你不能太小心。”或其他错误表达。这又是典型的按照字面翻译导致谬误的实例。Cannot…too(much)…这种特殊否定结构往往表示强烈的肯定语气,表示“无论怎么样…都不为过;要非常的…”。所以该句对应的正确中文意思是:“你选择朋友时越小心越好。”
再看英文“I will stay here for 3 more months.”,该句的正确中文意思是:“我将在这里再多待三个月。”说话人打算在原来逗留的时间上再另外延长三个月,而“百度翻译”给出的所有备选结果都与原意差别很大,其中最好的翻译结果为:“我会在这里待三个多月的。”可见没有识别出3 more 这中特殊表达,而误以为是more than 3,导致翻译成3 个多月。
最后对英文“She will make him a good wife.”进行翻译,“百度翻译”给出的中文结果如下截图所示:
从中发现一个有趣的现象,“百度翻译”对make him a good wife 这个句式即按照宾补结构又按照双宾结构分别进行了翻译,所以出现两个大相径庭的中文表述,一个是:“她会让他成为一个好妻子。”另一个是:“她会成为他的好妻子。”显然第一种表述有明显的现实逻辑错误,男性的他是不可能成为妻子的。而第二种表述基本符合本意。由于有客观现实逻辑的约束,此处make 引导的只能是双宾结构,实际上该英文等价于“She will make a good wife for him.”,正确的中文翻译是:“她会为他成为一个好妻子。”
通过以上测试可见,百度翻译对于一些特殊句式不能很好识别与翻译,并且缺乏基于客观现实的逻辑判定程序,进而对于某些特殊句式构成的句子也就不能排除干扰项给出准确的翻译。
通过以上分析不难看出,“百度翻译”对于较简单的句式和固定表达,翻译的正确率较高,对于不常用的习语成语或某些特殊的句式结构,不能有效识别深层含义从而导致翻译结果失真,可以通过以下方面改进翻译质量。
1.进一步加大自身语料库建设,可以通过开放性输入平台的方式最大程度收集英文固定表达形式及对应的中文意思,定期由英汉语料库数据员加以筛选确认纳入语料库,以尽可能多的识别具有固定表达形式的英语习语、成语、惯用语等。
2.借助百度自身搜索引擎(https://www.baidu.com/)的优势,对需要翻译的英语语句在互联网中进行模糊匹配搜索,找出其他网页或者数据库中的关联信息,作为翻译的参考。比如Cordelia’s Gift(女性真诚的声音),“百度翻译”未能给出正确的隐含意义,但是通过百度搜索引擎可以找到涉及该短语的网页(参见:http://zhidao.baidu.com/link?url=h0QpBZmypFnm LnijUUyfZ8K5XMuUPkVLv -g3NVKYZVIgsPX4sN GzL3eP5VPFK4dndJNESI5V1CnSk7OT5EhnaJ -mCdbfEocrFQqRu_ZCQ4_;
http://wenku.baidu.com/link?url=oI8oBGPkF3 v4WjRWpwvIyLXz4Arj4kbrdP3k8jsOMnkcERxx1Iy 1SJ5KMDwdDY9UJvQ6oPnFM7RwsrfXRYeZBVa 1zfPEfvAlvXAHHANcOtu;),从中可以清楚的了解到该短语的意义,并且在有道在线字典中(http://dict.youdao.com/)对 Cordelia’s Gift,be a Jason 都有正确的注解,从而可以借助这些网页或数据库的信息修正百度翻译自身的翻译结果。
3.引入基于知识库和专家推理的算法,从而可以避免有明显知识错误和逻辑错误的翻译结果。
笔者通过实例对“百度翻译”英译汉质量进行了初步评述。总体上,对简单英语句和常用英语短语翻译结果正确率较高,对不常用短语和某些特殊句式不能进行正确翻译,并给出了改进策略,希望对读者有一定帮助。