基于英语新疆游记的新疆风景语料库建设

2022-01-01 06:35
科教导刊·电子版 2021年13期
关键词:导游词游记语料

龙 澄 董 伊

([1]新疆大学旅游学院 新疆·乌鲁木齐 830046;[2]新疆大学外国语学院 新疆·乌鲁木齐 830046)

1 研究背景

长期以来,新疆旅游从业人员在对外推广旅游产品时面临着缺乏参考资料的问题。当双语导游用英语撰写导游词时,唯一的参考为谢旭升的《英语妙语说新疆——英语导游手册》一书。除此之外,他们只能在网上搜寻英语使用者在旅行后写的游记。景区导览词的英文翻译也缺乏参考资料。相关管理者通常会把语言团队审好的中文导游词交与翻译人员或翻译引擎,以得到逐字逐句的翻译。目前旅游外宣资料的英译本还存在诸多问题,有的译文甚至错误百出,损害了新疆的对外形象。部分译者为了忠实原文,未考虑译文能否被目标语读者接受,译文缺乏沟通性,其传播效果不佳。

由于英语读者对旅游译本的期待与本国读者不同,汉英篇章的叙述视角、风格也存在一定差异,例如:英语主语突出,汉语主题突出;英语常用无灵主语,汉语多用有灵主语;英语叙述多呈静态;汉语叙述多呈动态;英语组句多焦点透视,句式呈树式结构,汉语组句多散点透视,句式呈竹式。随着中英比较研究的深入,翻译界目前的共识是:景区导览词的外译在保证功能对等的情况下更适合编译,即以目标语受众思维习惯为准对宣传文本进行改写。在改写的过程中,译者必须熟谙用英语表达的习惯,所生成的文本需具有和汉语导览词、导游词相匹配的文学美感。提文学美感最好方法就是精读、模仿主题相似的高质量英语文段。因此,为景区导览词、导游词英译人员提供体裁、主题、甚至描写对象相同、相似的文本作参考对提高译文质量是有一定辅助性的。然而,为译好一篇景区介绍而从众多原文书籍中寻出话题相同的英文原文参考句是非常耗时的。针对这一问题,我们设计研发了基于YiCAT协同翻译系统的新疆风景汉英语料库。翻译从业人员在使用YiCAT翻译协同系统将新疆风景类景区导览词、导游词译成英文的时候,可以从TMX语料商城获得并调用该语料库;在进行译后编辑的时候,他们除了可以获得机器翻译的结果,还可以获得与每一句汉语原文相对应的、且话题、描写对象相似、相同的若干英语参考句,以便对机译结果做译后编辑和润饰。

2 语料库的创建

本课题拟构建的属于单项对应平行语料库(uni-directional parallel corpus),即由英语文本和将其译成汉语的文本构成的平行语料库,即语料库中的所有汉语语料都是由英语文本翻译而成的。该库的创建共分为如下七个步骤:

(1)源语料的选择:本研究选取的语料为英语新疆游记,即西方国家人士游历新疆或中亚地区时用英语写成的游记。由于中亚地貌具有相似性,因此上述游记中与新疆相似的中亚地貌、景色的书写也在研究范围内。东方学兴起于19世纪末,因此西方人士来疆考察主要集中在19世纪末和20世纪初,且以英国人为主。在这些游记中,有一部分属于考古调查报告,较少涉及地貌、景色描写,如斯坦因的著作(Aurel Stein)。相比之下,类似登山家埃里克西普顿和其妻子戴安娜西普顿(Eric Shipton and Diana Shipton)的著作包含最多的地貌、景色描写。本研究选择的游记包括:The Antique Land(《古老的土地》)、The Six Mountain-Travel Books(《登山六记》)、The Duab of Turkestan(《突厥斯坦杜阿卜地区游记》)、Turkestan Solo.One Woman's Expedition from Tien Shan to the Kizil Kum(《女独探突厥斯坦:从天山到克孜库姆》)、Sand-buried Ruins of Khotan(《沙埋和田废址记》)、That Untraveled World(《人迹罕至的世界》)、Chinese Turkestan(《中国的突厥斯坦》)、Through Asia(《穿越亚洲》)、和《外交官夫人的回忆》10本书为研究对象。

(2)语料电子化:语料的来源主要为书籍等印刷制品和电子书。印刷制品的文字转写工作如果由纯人工完成需要花费大量的时间,本研究采用了一种比较高效的方法:全能扫描王高清扫描、OCR字体识别、进行格式及文字校对。经试验,OCR软件字体识别的正确率可以达到95%以上,可以大大提高印刷制品的文字转写效率。网络文本主要涉及文字校对与格式整理,相对而言比较简单。

(3)电子化语料的分类:从所有游记中挑选出描写景色的篇章,之后按照题材将其分为九中类:沙漠、戈壁、湖泊、草原、冰山、绿洲农田、城市、河流、山谷(山区森林或灌木)。

(4)将选段译成汉语。

(5)以句为单位将双语文本对齐:语料对齐指将源语语料与译语语料分别保存,并使两个文本中的语料按段与段或句与句的关系一一对齐。由于英汉语言在表达、句式方面的差异,实际的翻译过程中并非全部以句为单位。所以本研究首先由人工通过Word工具完成段与段对齐的工作,进一步通过TMXmall网站对齐软件粗略达到句与句对齐,再由人工审查,最终达到句子层级的对齐。将对齐的语料输出语言方向为汉译英的tmx文档,命名为“新疆风景汉英语料库”。该语料库库容16万字,所收集到的新疆汉英双语风景语料中大多为南疆边境山区,其中沙漠、冰川、山谷三类所占的比重超过65%,而城市、绿洲、河流等类别语料占比较少。

(6)语料输入和测试:进入到TMXmall网站YiCAT界面,将语料导入到记忆库中;在项目管理中创建翻译项目,选择一篇中文新疆导游词为译后编辑对象,目标导游词共8篇,话题别分涉及喀纳斯、喀什古城、泽普金胡杨林、吐鲁番葡萄沟、天山天池、交河故城、乌鲁木齐国际大巴扎和那拉提草原;选择腾讯翻译君进行预翻译,选择调用“新疆风景汉英语料库”为记忆库,匹配率设置为8%以上;进入译后编辑界面,得到一个包含汉语源文本—预翻译文本—记忆库文本的界面以便编辑,其中,一句汉语源文本对应一句预翻译文本以及若干条出自记忆库的相似句以供参考;研究成员对各源文本—预翻译文本—记忆库文本项目进行评查。

(7)将“新疆风景汉英记忆库”上传至TMXmall语料商城,供用户使用。

3 风景语料库的测试结果

例1:在翻译喀纳斯导游词的过程中,源文本为:“四周群山环抱、峰峦叠嶂、森林密布、草场繁茂,碧水蓝天、青山白云、雪岭草甸浑然一体,湖光山色美不胜收,”预翻译结果为“Surrounded by mountains,stacked peaks,dense forests,lush grasslands,clear water and blue sky,green mountains,white clouds,snow-capped meadows,lakes and mountains are incomparably beautiful.”一条匹配率为14%的记忆库参考句为:“The mountains are coloured here on a grand scale,one of them being quite purple,with patches of luscious green grass kept fresh by water trickling from large strips of white snow.”(群山色彩斑斓,其中一座色泽偏紫,大片雪化成了水滴,滋润着甘美绿地。)

例2:在翻译天山天池导游词的过程中,源文本为“全球第三次气候转冷,天山山区孕育了颇为壮观的山谷冰川运动,冰川挟带着砾石缓慢下移,巨大的冰川像一把巨铲对山体进行着强烈的挫磨和雕凿,形成了多种冰蚀地形,山谷成为巨大的凹地冰窖,冰舌前端则因挤压而消融,融水下泄,所挟带的岩屑砾石逐渐停积下来,成为横拦谷地的冰碛巨垅;随着气候的转暖,冰川消退,四周雪峰上不断消融的雪水在这里蓄水成湖,形成了我们今天看到的天池,天池北岸的天然堤坝就是一条冰碛垅。”其预翻译为“the climate turned cold for the third time in the world,and the Tianshan Mountains gave birth to a spectacular valley glacier movement.The glaciers slowly moved down with gravel,and the huge glaciers were like a giant shovel to strongly grind and carve the mountains,forming a variety of ice erosion land forms.The valley became a huge concave ice cellar,and the front end of the ice tongue melted due to compression,melted water,and the debris gravel gradually stopped to accumulate.Become a huge moraine ridge across the valley.As the climate warms up and the glaciers recede,the melting snow water on the surrounding snow peaks forms a lake here,forming the Tianchi we see today,and the natural dam on the north bank of Tianchi is a moraine ridge.”一条匹配率为10%下的记忆库参考句为:“The lakes follow each other,strung together like a chaplet,with great glaciers stretching down to their very waters,like a Greenland landscape.Among them,two glaciers face each other and almost join,their steep black moraines overhanging a lake of unimaginable turquoise-green,in which the shimmering outlines of the glacier are mirrored.”(湖泊彼此相连,像花环般串联。巨大的冰川一直延伸到它们的水域,就像格陵兰岛的风景。其中,两座冰川几欲相融,陡峭的黑色冰川突显在一个难以想象的青绿色湖泊之上,冰川闪闪发光的轮廓在湖面上映衬着。)

例3:在翻译乌鲁木齐国际大巴扎导游词的过程中,源文本为“大巴扎由六个楼群组成。在建筑风格上,准确使用最本质、最有生命力的因素,采用土黄色为主色调,融合了希腊、古罗马、西亚、中亚建筑因素,使之成为乌鲁木齐的标志性建筑之一。”其预翻译为:“The Grand Bazaar consists of six buildings.In terms of architectural style,it accurately uses the most essential and the most vital factors,using earthen yellow as the main color and integrating the architectural factors of Greece,ancient Rome,West Asia and Central Asia,making it one of the landmark buildings of Urumqi.”一条匹配率为10%下的记忆库参考句为:“A glorious sunshine,pouring through the shaky tattered awnings that connect the houses and shops flanking the street,gave brilliancy to all the gaudy wares exhibited in the booths from which I selected mementoes.The old skill of the Khotan workmen still shows its elfin the quaint articles of dress which form a prominent feature of the Bazar stores.”(街道两侧的房屋和商店搭着昔日旧遮阳篷,灿烂的阳光从篷中倾泻而下,把我挑选纪念品所在的货摊上陈列的各种艳丽商品都照得闪闪发光,和田工匠古老的技艺仍然体现在古色古香的服饰上,构成了巴扎商店的显著特征。)

例4:在翻译喀什古城导游词的过程中,源文本为:“著名的艾提尕尔清真寺周围辐射状街巷上,密布着国营商店和个体手工业店铺与摊贩,经销着国内外的名贵商品。”其预翻译经过去误编辑后为“The radiation-shaped(误;应为wheel-shaped)streets and alleys around the famous Attila(误;应为Id Kah)Mosque are dotted with state-owned shops and self-employed handicraft shops and vendors,selling valuable goods at home and abroad.”一条匹配率为 10%下的机译库参考句为“Mosques are more elaborate,with wooden pillars and latticed windows carved to make the whole building cleaner and more majestic.”(清真寺更是精心修建,木制的柱子和格子窗棂精雕细琢,衬托地整个建筑愈发干净雄伟。)

4 讨论及意义

(1)经过逐句对比机器预翻译结果和记忆库参考句,不难发现,机器所使用的的词汇和句型的多样性比后者要低,且存在误译。(2)记忆库参考句多为焦点透视,即第一人称常人视角,而机译结果则遵循汉语,多采用散点透视,即第三人称上帝视角。(3)而由于语料库库容有限,描写对象为人文景观的参考句的匹配度比对象为自然景观的低,因此参考价值也低。这说明,译者在编译汉语新疆风景类景区导览词、导游词的时候,可以从参考句中获得更为准确的词汇和更为丰富的句型,也可以考虑将散点透视切换为焦点透视。

猜你喜欢
导游词游记语料
莫把游记写成导游词
地心游记(十)只剩我一个人
黄山导游词
颐和园导游词
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
学写导游词
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法