蒙洁琼
(广西中医药大学外语部,广西壮族自治区 南宁 530200)
近年来,随着信息技术的不断提高及跨语言网络资源爆炸式的增长,机器翻译以前所未有的速度在发展。早在2012年9月举行的第八届全国机器翻译研讨会上,中国电子信息产业发展研究院的肖健研究员就指出,“机器翻译是未来需求的发展趋势”,未来“只有10%的任务需要人工翻译,70%的文档需要机器翻译,而中间的20%的信息则会采用译后编辑方式进行翻译”[1]。2016年9月,谷歌在汉语-英语方向上推出了神经翻译系统替代其旧版所使用的基于短语的翻译系统,标志着机器翻译进入了一个新时代。
神经机器翻译(neural machine translation)是指直接采用神经网络以端到端方式进行翻译建模的机器翻译方法[2]。实验表明,以 BLEU(bilingual evaluation understudy)值为评测指标,神经机器翻译与传统的基于短语的统计机器翻译相比具有压倒性的优势,而且在涉及汉语的翻译任务上性能提高尤其显著[3]。人工测评亦发现,相比基于短语的机器翻译,神经机器翻译能够减少词法错误 (morphology errors)、词汇错误 (lexical errors) 和词序错误(word order errors)[4]。因此,神经机器翻译一经推出,就引起全球科研人员的广泛关注,并在应用研究领域获得迅猛发展。
互联网的飞速发展以及大数据的广泛应用给机器翻译发展和应用创造了很好的条件,包括谷歌翻译、百度翻译、必应翻译和有道翻译在内的各种国内外在线机器翻译系统纷纷亮相。其中,谷歌翻译和百度翻译作为主流的神经机器翻译系统,使用人数众多,非常具有代表性。
谷歌翻译,是由谷歌公司研发的免费多语种互译平台,可以对包括中文、英语、西班牙语、德语、法语、意大利语、日语在内的103种语言进行即时翻译。现已开发有网络版、手机移动客户端,各版本功能强大,使用方便。谷歌翻译2016年推出部分语种的神经网络机器翻译引擎,使译文质量大大提高,尤其是目的语为英语时,译文质量尤为出色。
百度翻译是由百度发布的免费在线翻译服务,支持包括中文、英语、日语、韩语、西班牙语、泰语、法语、俄语、德语在内的28种热门语言互译。同样开发了网页版及手机移动客户端,可以对文本、网页、语音、图像等进行即时翻译。2015年,百度翻译引入神经网络机器翻译技术,这一应用比谷歌还早一年。百度翻译研发的基于深度学习与多种主流翻译模型融合的翻译技术,使其翻译准确率大大提高,并在国内外获得广泛认可。
表1 谷歌和百度翻译译文比较
百度翻译与谷歌翻译的网页版使用人数最多,且二者界面相似,都是在选择源语和目标语语种后输人原文,即可进行自动翻译。不过,二者在不同文本类型、不同语言方向等方面各有所长,译员可以根据实际需求,灵活运用不同的翻译机器进行工作。
目前,我国中医科研论文摘要主要采用加拿大临床流行病学和生物统计学教授Haynes搏士于1990年提出的结构性摘要格式[5],即要求论文摘要按照目的、方法、结果和结论的顺序分项陈述。此类型摘要的英译文本在词汇、句子及语篇层面上都具有自己独特的特点。在谷歌翻译和百度翻译译文对比基础上,下文将探讨两者在中医论文结构性摘要英译中的使用策略,为相关科研人员及翻译人员提供参考和建议。
2.1 词汇层面翻译策略 在词汇上,中医论文结构性摘要英译文本既具有中医科研论文的特点,又具有一般医学论文结构性摘要的用词特点。主要表现在两方面,一方面摘要包含大量中医术语且这些术语大多有标准化的译法,如“风”“热”“燥”“湿”译为“wind”“heat”“dryness”“dampness”。另一方面,包含一般医学论文结构性摘要的大量常用语且同样有约定俗成的译法,如“治疗组”“对照组”译为“the treatment group”“the control group”。以下文为例,原文中包含了中医术语13个,医学结构性摘要常用语10个。
例1(原文)目的:探讨原发性肝癌中医临床用药规律,为临床用药提供启示。方法:建立原发性肝癌中医临床用药的数据库,对中医临床用药归类、用药频次和用药剂量进行聚类分析。结果:补虚药为最常用药,清热药、活血化瘀药为较常用药。结论:益气健脾、疏肝理气、清热利湿、活血化瘀、滋阴解毒为中医治疗肝癌的主要原则。
从表1中可以看出,在中医论文结构性摘要的常用语如“归类”“频次”“剂量”等词的翻译上,谷歌翻译与百度翻译译文比较理想且一致。区别仅在于,百度翻译将“临床用药”译为“clinical medication”,比谷歌的译法“clinical use”和“clinical drugs”,更为统一、专业,且谷歌漏译了“聚类分析”一词。
相比而言,二者在中医术语的译文上区别较大。首先,在“补虚药为最常用药,清热药、活血化瘀药为较常用药”一句中药名称的翻译上,谷歌翻译采取了分译法 , 译 为 “ tonic medicine”“ heat-clearing medicine”“stasis-removing medicine”,比较清晰明了;百度翻译则采取合译的方式,译为“the medicine of clearing heat,activating blood circulation and removing blood stasis”,可能造成歧义,让人误以为同一种药有清热和活血化瘀的功能。百度翻译还漏译了“补虚药”一词。其次,在“益气健脾”“疏肝理气”“清热利湿”等中医治疗原则的翻译上,谷歌全部采取音译的方法,译文质量很不理想;而百度“Supplementing Qi and strengthening spleen”“soothing liver and regulating qi”“clearing away heat and removing dampness”的译法比较有效。
造成以上区别的根本原因在于双方基于的语料库不同。百度翻译是中国本土翻译系统,语料库在中文上有优势,因此大多数中医术语在系统里能被识别;而谷歌翻译的语料库在英文上有优势,能识别的少数中医术语译法地道自然,如“tonic medicine”“heat-clearing medicine”“stasis-removing medicine”,而无法识别的外来术语只能统一采取音译的机械译法。
总体而言,在中医论文结构性摘要中常用词汇的翻译上,百度翻译和谷歌翻译不相上下,而在中医特有术语的翻译上,百度翻译比谷歌翻译表现更好。百度翻译不仅在中医术语的识别上有明显优势,而且还在翻译框下方将原文中出现的专业词汇及短语等给出注释,为译者的译后编辑提供有效参考和建议。更为高效的策略是同时使用百度翻译和谷歌翻译,将两者译文进行对比,择优选择,并对不同的译文仔细辨析,引入第三方翻译引擎进行多方查询验证,以保证译文的质量。
2.2 句子层面翻译对比 中医论文结构性摘要的目的、方法、结果及结论四个部分内容都有固定的句型。例如,目的部分用于说明文章写作目的,常用句型有“The purpose/objective/object/aim of this study/investigation is to...”或者使用不定式“to study/investigate...”;方法部分用于阐述文章的研究方法、分组方式、每组患者的治疗方法、时问与观察指标等,常用句型有“the curative effect of...was detected/observed/studied...”等;结果部分用于说明文章研究所取得的成果,常用句型有“The result showed...”“it is obvious that...”“It proved...”等;结论部分总结论文研究成果,提出观点、建议,常用句型有“the author holds that...”“it is suggested that...”“the suggestion includes...”等。对此,谷歌翻译和百度翻译的翻译结果如以下各例:
例2(原文)目的:观察穴位磁疗治疗心绞痛的临床效果。
(谷歌译文)Objective:To observe the clinical effect of acupoint magnetic therapy for angina pectoris.
(百度译文)Objective:To observe the clinical effect of acupoint magnetic therapy on angina pectoris.
例3(原文)方法:将70例风热感冒患儿随机分为治疗组与对照组。
(谷歌译文) Methods:70 children with wind-heat flu were randomly divided into treatment group and control group.
(百度译文)Methods:70 children with wind fever and cold were randomly divided into treatment group and control group.
例4(原文)结论:穴位磁疗对心绞痛有较好的治疗效果。
(谷歌译文) Conclusion:Acupoint magnetic therapy has a good therapeutic effect on angina pectoris.
(百度译文)Conclusion:acupoint magnetic therapy has a good therapeutic effect on angina pectoris.
可见,谷歌翻译与百度翻译都使用了结构性摘要的常用句式,如“to observe...”“...were randomly divided into treatment group and control group”以“...has a good effect on...”,在短句、简单句的翻译上都获较理想的结果,且二者译文区别不大,如例1中差别只在介词for和on的选择,例 2只在“children with wind-heat flu”和“children with wind fever and cold”的区别,而例3只在首字母大小写的区别。不过,在长句及复杂句的翻译上,两者的区别较明显,如以下各例:
例5(原文)选取我院内科门诊2016年1月—2017年1月期间收治的54例失眠症患者,采用安神失眠方进行治疗,采用中医症状计分量表、PSQI(匹兹堡睡眠质量量表)分别于治疗前、治疗后打分并进行对比。
(谷歌译文) A total of 54 patients with insomnia admitted to our department of internal medicine from January 2016 to January 2017 were treated with Anshen Insomnia.①The TCM Symptoms Scale and PSQI (Pittsburgh Sleep Quality Scale)were used.②Score and compare before and after treatment.③
(百度译文) 54 patients with insomnia treated in our hospital from January 2016 to January 2017 were treated with Anshen insomnia prescription.① The symptom score scale of traditional Chinese medicine (TCM) and PSQI(Pittsburgh sleep quality scale)were used to score and compare the scores before and after the treatment.②
例6(原文)4周为1个疗程,治疗3个疗程,观察治疗前后两组患者主要中医证候积分和胃黏膜病理组织学变化,并比较其安全性差异。
(谷歌译文) 4 weeks was a course of treatment, and 3 courses of treatment were performed.The main TCM syndrome scores and histopathological changes of gastric mucosa were observed before and after treatment,and the safety differences were compared.
(百度译文) 4 weeks for 1 courses of treatment, 3 courses of treatment,before and after the observation of the two groups of the main TCM syndrome scores and gastric mucosal histopathology changes,and compared their safety differences.
例5中,谷歌翻译将原文的长句处理为3个短句,短句③出现句子结构破碎问题,而百度翻译则利用被动语态将谷歌译文中的②和③合并,译文较为理想。例6则相反,谷歌翻译利用被动语态和连接词“and”将各分句很好地连接在一起,而百度翻译则出现结构破碎问题。
可见,在处理中文长句中各分句之间的内在逻辑关系上,谷歌翻译和百度翻译都存在不稳定性。此时,译员可以采取译前编辑的策略。译前编辑的目的是为了让文本简洁可控、逻辑清晰,利于被机器分析理解,从而产出高质量的机器译文,减少译后编辑的工作量。如例6中,简单地将第二个逗号“,”改为句号“。”,再次使用百度翻译即可得到以下较为理想的译文:
(百度译文2) 4 weeks were 1 courses, and 3 courses were treated.Before and after treatment,the scores of main TCM syndromes and histopathological changes of gastric mucosa in two groups were observed and compared.
2.3 语篇层面翻译对比 中医科研论文属于科技文章的范畴,所以英译中医论文结构性摘要也具有科技文体的语篇特点,主要体现在三方面:首先,常用时态为一般现在时和一般过去时。一般现在时用于描述论文目的、作者结论及观点,而一般过去时描述已完成的研究工作和过程。其次,多使用被动语态,避免使用人称句,以侧重述事推理,强调客观准确。最后,语气正式,文理清晰,描述准确,而且注重英语语言的统一性、连贯性和简洁性。
将百度翻译和谷歌翻译的30篇译文进行对比研究发现,二者的译文总体上能保持中医论文结构性摘要的语篇特点,且双方译文在大多数情况下处理结果一致,只在摘要中方法部分的时态和语态选择上偶有差别,如以下各例:
例7(谷歌译文) Methods:Collecting the history of traditional Chinese medicine literature,famous theoretical experience and experimental results.
(百度译文) Methods:to collect the literature of traditional Chinese medicine,the theoretical experience of the famous family and the experimental results.
例8(谷歌译文)Methods:Through the China Knowledge Network and Wanfang database,the literature on TCM treatment of senile constipation in the past 6 years was reviewed
(百度译文)Methods:through the CNKI and Wanfang database,we reviewed the literatures of TCM treatment of senile constipation in the past 6 years.
例7中,谷歌翻译采用了动词ing形式,而百度翻译采用了不定式;例8中,谷歌翻译采用了被动语态,而百度翻译则使用了第一人称“we”的主动语态。
总体而言,谷歌翻译和百度翻译在中医论文结构性摘要英译上基本可以保持此类文本语篇上的特点,对于一些系统稳定造成的问题,需要译员采取译后编辑的策略,进行必要的人工审核及修改,以保持译文的科学属性。
翻译实践发现,基于神经网络引擎的百度翻译和谷歌翻译在中医论文结构性摘要的英译上可以取得比较理想的结果,译员可以将两者结合使用,通过对比两者的译文,选择更理想的译文,并以此为基础进行必要的译前编辑和译后编辑,以期在提高翻译速度的同时保证译文的质量。