控制性语言对提高技术规范文本机器翻译质量的实证研究

2014-06-26 06:52:50
关键词:可读性控制性译文

刘 毅

(广东白云学院外国语学院,广州 510450)

一、控制性语言研究现状

作为一种交际方式,书面语应尽可能做到清晰简洁。然而,由于自然语言(natural language,NL)的随意性(arbitrariness),交际过程中会出现表达含混不清的情况。于是,语言工程(linguistic engineering)创造了控制性语言(controlled language,CL)。维基百科给控制性语言的定义是:“人为定义的且属于自然语言(通常为英语)的子集,控制性语言在词、句及语义方面都受到限制。”(A controlled language is an artificially defined subset of a natural language(usually of English),in which terminology,syntax,and/or semantics are constrained.)B rockmann认为:“依据其定义,受控语言具有句法和术语前后一致的特点。”①Brockmann,Daniel.Controlled Language and Translation Memory Technology:a Perfect Match to Save Translation Cost.In TC - Forum.4 -97.1997:10 -11.

国外有代表性的CL研究与应用主要有BASIC English(由Charles Kay Ogden于1932年发布)、Caterpillar Fundamental English(由 Caterpillar于1970年开发)、ASD Simplified Technical English(AECMA,1995)等。其中ASD Simplified Technical English发展最为成熟,从当初仅适用于航空工业,覆盖到许多其他行业(如医疗、石油、保险、汽车和计算机行业等)。随着科技的飞速发展与全球化进程的加快,简化英语越发引起重视,华为公司就曾在2010年底邀请Frans Wijma(简化科技英语设计师,STE)对员工提供了简化英语培训。

设计控制性语言主要出于两个目的:一是让使用控制性语言书写的文本更易理解,如欧洲航天设备制造商协会简化英语(ASD Simplified Technical English)的设计就是要让飞机维修程序更易理解,尤其是更易被不以英语为母语的技术人员理解;另一个目的是为了让机器更容易处理以控制性语言书写的文本,即机器翻译。

二、使用CL的益处与必要性

在当今商务活动中,清晰、连贯的表达已经成为一种必然。目前英语是各领域技术文本使用的主要语言,但由于其形式的多样性及复杂性,如复杂的句式,多义词、同义词的使用,很容易造成理解困难[1]。最为紧要的是,由于很多技术文本的最终读者英语水平很难达到技术文本创作者或工程师的水平,理解以自然语言书写的技术文本比较困难。因而,业内一般认为,不使用控制性语言可能会导致安全风险增加、操作或维护过程中造成设备损坏、产品本地化成本上升、翻译满意度降低、技术培训成本增加、客服效率降低、由于沟通不畅导致产品召回而致使成本增加[2]。

(一)使用控制性语言的益处

第一,更容易理解,一个单词只对应一条词义。第二,可以做到写作风格前后一致,跨文化交际过程中更易接受。第三,可以降低因模糊表达而引起的产品责任风险。第四,CL作为电子商务中提供客户支持的一门全球性语言,可提高客户满意度。第五,使文件的后期处理和再利用更加容易。第六,使机器翻译更快速,译文更连贯、更优质,同时可降低人工编辑的时间与成本。使用简洁、清楚的语言书写可大大提高机器翻译质量。

(二)使用控制性语言的必要性(案例分析)

为了验证使用控制性语言编辑后的源语(SL)的机器翻译结果可读性更高,从而证明使用控制性语言的调整的必要性,以一段技术规范文本为翻译材料,使用谷歌翻译软件做实例分析。原文(ST)是关于注塑机模型(Injection Molding Machine Model)的操作提示。

从表1可以看出,对比STa和TTa,主要的问题在于语序不妥,属于人工调整的范畴,即便译者不具备专业知识,稍作调整,可读性立刻大大提高。STa中的for表示原因,其后译文可读性基本上不成问题,其中suggest译为“显示”,倒不如人工调整为“意味着”,consumption处理成“消费”也不及“消耗”更贴近。这是措词的范畴,但也有深层次的原因。如果按照控制性语言“一词一意”(one word,one meaning)的书写规则,将 suggest(v.意味着;建议)替换成 mean(v.意味着),则“each press suggests grease consumption foraboutone month”变为“each press means grease consumption for about one month”,经谷歌翻译软件处理后得到译文“每按一下表示油脂消耗约一个月”。经操控或控制(manipulated or controlled)后,“表示”明显比“显示”更符合汉语表达习惯。

对比STb和TTb,发现汉语“的”字出现3次,“报警的”、“不充分的油的容器”,但分析后并未发现ST相应成分之间有修饰关系或所属关系,这一影响因子由于不具典型性,故而只需人工调整即可解决。

STc和TTc也存在措词方面的问题。其中fill同燃油或油脂等搭配时,应为“加注”之意,根据语境,circuit也应为“线路”而不是“电路”。在 ST中,“堵塞”同“润滑不足”为先果后因的关系,而汉语倾向于先因后果,即因果关系。基于以上分析,调整后的TTc应为:请加注干净油脂,以防止因润滑不足而导致线路堵塞。

从以上分析可以看出,仅从可读性角度来评价译文质量,由于存在一词多义、语序不当等因素,机器翻译结果并不令人满意。因而,要想得到理想的译文,译前对原文进行编辑是必要的。

表1 技术规范文本翻译实例

三、汉英主要差异

汉语属汉藏语系,英语属印欧语系,二者在词汇、句法、语义等方面都存在差异,而最大的差异莫过于英语繁复的“曲折变化”,而汉语曲折变化少,主要用词序和一些虚词来表示各种语法关系。我国著名语言学家王力先生曾经说过:“就句子的结构而论,西洋语言是法治的,中国语言是人治的。”[3]35关于中英差异的论述比较多,概括起来,主要有以下8个方面:分析vs综合、主动vs被动、意合vs形合、动态vs静态、流散vs聚集、人称vs物称、具体vs抽象,重复vs替代。

事实上,由于汉语重前置修饰,而英文多后置修饰,根据这一差异,表1中STa只要按照汉语的规则稍作调整,将表示方式的副词randomly和表示地点的状语 in operational panel调整至动词press的前面,则STa改写为STa1:Do not randomly in operational panel press the lubrication button.再将STa1交由谷歌翻译软件处理,得到TTa1:不要随意按操作面板的润滑按钮。

因此,作为具有主观能动性的译者,应该了解汉英主要差异,因为这是译前编辑的参考依据,也会直接影响到译文质量,进而决定了译后编辑的工作量。因为从译前准备的角度来说,准备工作越充分,译后编辑越省力,翻译的效率与质量也会大幅提高。

四、控制性语言的书写原则

设计控制性语言需考虑汉英两门语言的差异,为了使翻译更加流畅,汉英在结构上应力求相近,最好是相同的语序。举例来说,“我不吃鸡了”、“鸡我不吃了”和“我把鸡吃了”分别对应SVO、OSV和SOV结构,后两种结构在英语中极其罕见,因而,设计控制性语言(CL)时,理应遵循SVO结构。总的来说,设计控制性语言的终极目的是要让机器翻译更加容易,可读性更高,因而书写时要避免含混不清。

(一)控制性英语的书写原则

一是多写短句,避免长句。见表2。

表2 长短句翻译结果对比

很明显,谷歌翻译软件处理后的译文进一步证实了短句和长句的优缺点,长句经翻译软件处理后可读性大大降低。

二是避免歧义句,一句一意。如:a)Flying planes can be dangerous.

b)Planes that are flying can be dangerous.

可以看出,a)是歧义句,既可理解为“飞行中的飞机可能是危险的”,也可以理解为“驾驶飞机可能是危险的”。而b)只表达“飞行中的飞机可能是危险的”一个意思。

三是选择相同的词、句表达同样的意思,保持前后的连贯性。见表3。

表3 词句异同对照实例

表格左边关于打印机和扫描仪的安装说明在句型方面前后完全一致,变换的只是printer和scanner这两个设备名。而表格右边则采用不同句法手段表达相同意思,从商业角度来看,不利于安装人员阅读,因而不利于产品的推广使用;单纯从机器翻译的角度来看,也不利于计算机处理。

四是写完整句(complete sentence)。如:

a)Do you wish to continue the installation of the software?(完整句)

b)Continue installing software?(非完整句)技术文献作为一种比较正式的语体,类似于b)这样的非完整句显得比较口语化,属于非正式语言。

五是语法结构简单化。如:

a)Show that you can organize your thoughts by using a simple sentence structure in your texts.(句法结构简单)

b)You,in your texts,to show that you can organize your thoughts,should use a simple sentence structure.(句法结构复杂)

六是多用主动句。如:

a)The program manager will send a summary of all questions to the responsible coworkers.

b)A summary of questions will be sent to the responsible individuals.

这同自然语言(natural English),尤其是书面语多用被动句并不矛盾。事实上,英语被动句经翻译软件处理后,可读性远远不及主动句的翻译结果。

七是尽量重复,少用代词。

a)You must check the spelling of your text before you publish your text.

b)You must check the spelling of your text before publishing it.

为避免重复,英语多用代词替代,甚至省略,但翻译软件尽管可以提高效率,多数情况下却无法识别代词所指与被省略的内容。本例中,a)中的从句重复了“your text”,而 b)则使用了代词“it”,代替“your text”。从机器翻译的角度来看,a)更符合控制性语言的书写规则。

八是避免使用生僻词汇(大词,big words)。如:

a)Avoid ambiguity.

b)Eschew obfuscation.

这两句为同义句,a)中的两个单词均为常用词,易于识别与理解。b)中的两个单词均属于生僻词,不易识别,难于理解。

九是拼写务必正确。如:

a)Texts that contain spelling errors complicate the translation process.

b)Texts that contein speling misstakes complicate the translation procces.(单词 contein,speling,misstakes为拼写错误)

(二)控制性汉语的书写原则

一是名词前加冠词或数词。二是为了表达不同的时间,必须加“了”、“过”、“在”、“将”、“会”等表达过去、现在和将来的助词。三是以“许多”、“大量”、“一些”等数量形容词表示复数概念。四是两个动词之间使用“以”表示目的。五是尽量使用名词化结构。六是尽量将时间、地点、方式等状语后置。七是尽量使用被动式。八是还原SVO结构。九是少用无主句,多用完整句。

前三条原则反映了汉语少曲折变化的特点,这样的书写要求充分考虑了译入语(English)的特点,尽可能照顾英语丰富的形式变化,即按照译者所期待的译文要求去控制汉语的生成。

五、控制性语言与机器翻译的质量问题

机器翻译(machine translation,MT)即由电脑自动完成翻译。我国的机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都在进行机器翻译的研究。中国机器翻译系统的规模正在不断地扩大,内容正在不断地完善。然而,由于机器翻译运用语言学原理,机器自动识别语法,调用存储的词库,自动进行对应翻译,但因语法、词法、句法发生变化或者不规则,出现错误在所难免,如《大话西游》中“给我一个杀你的理由,先”之类状语后置的句子以及“最是那一低头的温柔,像一朵水莲花不胜凉风的娇羞”的文学性较强的句子,机器翻译是无能为力的。

由于英汉之间的巨大差异,谷歌翻译的译文质量远比印欧语系之间的机器译文质量差。为了使机器译文达到可知可解或全知全解的程度,减少后期的编辑工作,我们就必须进行译前编辑,也即有目的地控制译出语,将文本中的自然语言(NL)改成控制性语言(CL)。见表4。

从表4可以看出,自然汉语的很多四字结构被浓缩成具体的含义,整个字数减少到86字,原来的一个长句变成了五个短句,增加了主语“我们”,增加了表示时间的“将”。译文单词数相同,但编辑后的源语译文可读性(readability)大大提高。但也存在一些问题:第一,谓语动词“is”同补语“goals”在数方面不一致;第二,句式过于单一,这主要受SL写作风格的影响;第三,长安新工业的“长安”译文“Changan”错误。因而,为进一步提高译文质量,译者还需经历机器译文后编辑阶段。从多年的实践经验来看,机器翻译的问题主要表现为语序、误译、漏译以及篇章连贯性等方面,这说明机器无法替代人脑[4]。

表4 控制性汉语前后译文对比

六、问题与思考

控制性语言固然能够在词汇和句法层面减少甚至消除自然语言给机器翻译带来的障碍,但是由于控制性语言的书写对作者的要求较高,是否意味着作者的创造性或自主权因此受到了限制,进而影响到产出的文本数量,频繁使用控制性语言是否会导致自然语言能力的退化,这些疑问还需进一步采取实证研究的方法加以验证。但有一点是肯定的,如果将控制性语言的使用限制在某一特定领域(domain-specific),那么双语甚至是多语之间的机器翻译,无论是效率还是准确率都会得到大幅度提高,文中使用谷歌翻译软件对受控汉语的翻译也证实了这一点。但无论机器多智能,也无论译者花了多长时间做译前编辑工作,未成功翻译的文本还是占有一定比例,我们不能完全依赖机器翻译,还需进行机器翻译后的编辑。在当今信息化的时代,科技迅猛发展,需要翻译的技术文本与日俱增,使用基于控制性语言的机器翻译是提高技术文献翻译质量与效率、降低成本的一条有效途径。

[1] 王致华.以句法为基础的机器翻译的研究现状及其展望[J].重庆三峡学院学报,2013(5).

[2] 陈友勋.TM还是MT?——谈CAT软件设计中的认知理据[J].重庆工商大学学报:社会科学版,2013(2).

[3] 王力.中国语法理论[M]//王力文集:第一卷.济南:山东教育出版社,1984.

[4] 杨宪泽.汉英机器翻译中短语处理与译文生成研究[J].西南民族大学学报:自然科学版,2013(3).

猜你喜欢
可读性控制性译文
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
损伤控制性手术在创伤治疗中的应用综述
译文摘要
水利经济(2020年3期)2020-02-22 11:38:33
分析小城镇控制性详细规划编制
I Like Thinking
对增强吸引力可读性引导力的几点思考
新闻传播(2015年11期)2015-07-18 11:15:03
浅谈对提高党报可读性的几点看法
新闻传播(2015年9期)2015-07-18 11:04:12
七氟醚在颅内动脉瘤夹闭术中控制性降压的应用
在增强地方时政新闻可读性上用足心思
中国记者(2014年2期)2014-03-01 01:38:34
控制性超排卵与子宫内膜容受性