基于自建语料库的旅游英语文体特征类比研究

2015-11-18 07:20韩江洪夏蓓洁
关键词:源语时态英译

张 苇,韩江洪,夏蓓洁

(1.合肥学院 外国语言系,合肥 230601;2.合肥工业大学 外国语学院,合肥 230009)

一、引言

旅游业作为影响经济发展的重要因素,日新月异,蓬勃发展。作为载体,旅游语言在创造“旅游者的凝视”方面起着重要作用,而对旅游文本进行分析和理解是了解旅游语言特点的重要前提,对于从事旅游文本翻译的人士来说,尤其重要。许多学者对此作出研究,旨在丰富旅游文本的文体研究以及指导旅游文本的翻译。旅游平行文本比较模式有利于译文与目标语平行文本达到“文本内连贯”[1]。侯晋荣、秦洪武利用关键词分析旅游文本的文体特征[2],高存、张允通过问卷调查,揭示英美读者对旅游英译本的期待和汉英篇章规范的差异,总结出汉英旅游翻译的一般规律[3]。近年来,信息的数据化使研究者们对旅游多媒体文本倾入了更多的关注,熊力游、刘和林在分析国内外旅游网页文本特点的基础上,提出了旅游网页编译策略[4]。

近三十年来,语料库语言学蓬勃发展。作为一种新的网络资源,语料库通过对真实情况下使用的自然语言进行大规模抽样,组成有代表性的真实语言材料的组合。1993年英国学者Mona Baker发表了“语料库语言学与翻译研究:启示与应用”一文,她在文中提出:利用大型的原文加译文的语料库,加上语料库研究方法的探讨,将使翻译研究者得以揭示翻译文本作为沟通媒介的本质[5]。基于语料库的研究立足于大量真实的语言材料,对文本语言贴近观察研究,研究结论确凿可信,因而备受青睐。但时至今日,较具规模的旅游文本语料库并不多见。国外的旅游专门语料库主要有三个,分别为英国、日本和芬兰学者研制。英国埃塞克斯大学研究生Carlota Alcanart研制的英语旅游文本语料库总词数为37 795,研制目的在于总结英语旅游文本写作中常见的词汇和短语,以帮助旅游学院的教师更有效地教授旅游词汇。日本大学的Kiyomi Chujo等研制的“京都旅游语料库”收集的855个文本均为京都一些旅游景点的英文介绍,总词数为42 025,供日本大学不同程度的英文学习者使用。芬兰萨翁林纳研究学院的英语教师Michael Wilkinson研制的约67万词的英语旅游文本语料库主要供芬兰学生将芬兰旅游文本英译时使用,以检验译文用词是否地道[6]。国内有香港理工大学李德超主持研制的容量约为200万词的新型双语旅游语料库,该语料库规模大,设计精细,标注全面,能有效地用于英汉旅游翻译的教学与研究。但是这些语料库并不对外开放,大众能接触到的少之又少,无法满足人们对旅游语言学习和研究的需要。

二、研究方法

鉴于现有旅游文本语言特征和翻译研究存在的问题,本研究以自建的英语旅游文本可比语料库为基础,通过比较可以发现英语源语语料库(Corpus of Original English Tourist Text,简称COETT)与汉语英译语料库(Corpus of Translated English Tourist Text,简称CTETT)文体特征的不同,一方面丰富了对旅游英语语言特点的研究,另一方面为后续的汉语旅游文本英译研究提供了真实客观的依据。同时结合旅游文本可比语料库提供的数据,可以分析目前汉语旅游文本翻译中普遍存在的问题。

1.语料来源、规模及语料的处理

为本研究自建的语料库包括英语源语语料库和汉语英译语料库。语料库所收录的文本来源于以下三种途径:网上的电子文本,以纸质形式出现的印刷品、书籍、宣传页,以及拍摄下来的有关景区的介绍。英语源语语料主要来自美国旅游者网站(www.usatourist.com),其余选自正式出版的英美景点介绍的画册、手册或在景区拍摄的景点介绍。汉语英译语料一部分来自旅游景点官方网站的英译文,另一部分出自旅游景点宣传册的英译文或拍摄的景区英文介绍。自建的语料库为英语旅游文本单语可比语料库(monolingual comparable corpus),包含两个子库,即英语源语语料库和汉语英译语料库。单语可比语料库是指某一语言的原创文本和翻译文本组成的语料库,通常子库所涉及的领域、语言变体和时间跨度相似,而且库容也大致相当。为保证语料的可比性,两子库的取样框架趋于一致,取样均为完整篇章样本,单个样本大小为500-1 200个英文词。目前两子库规模分别达到108 784词和109 981词。通过网络、手工录入以及扫描方法获得的文本存在各种不合规范的符号、格式等,所以对采集到的语料用软件“文本整理器”进行清理,从而得到清洁语料。所有语料均以UTF-8编码纯文档格式存储。本研究根据需要对语料库进行了词性赋码。赋码软件TreeTagger是德国斯图加特大学计算语言学研究所(the Institute for Computational Linguistics of the University of Stuttgart)Helmut Schmid研究设计的,是在Unix系统下运行的,而本研究所使用的赋码软件是由北京外国语大学梁茂成教授在不改变其性能前提下,对程序进行简化,非常方便地在Windows 环境下操作的TreeTagger赋码器。其准确率在96%-97%之间[7]。

2.分析工具

索引工具是基于语料库分析的必备工具。根据研究目的,研究者需通过语料库的检索获得用来分析的相关数据。目前,较常用的索引工具有WordSmith Tools,AntConc,TACT,MicroConcord 等。本研究根据需要,采用AntConc索引工具。AntConc是日本早稻田大学Laurence Anthony开发的绿色免费软件,其版本在不断更新。它由一开始只是作为简单的索引工具,逐渐发展成为一个文本分析工具。在AntConc主界面上的常用工具中,有一个功能强大的检索(Concordance)功能,以KWIC 的形式展现,使用者只需要在检索框中输入需要检索的词或短语,语料文本中所有包含该词或短语的语境便会即刻出现在右边的窗口中,并且列成排序清单,十分便于使用者了解词汇或短语的使用频率、使用方法和常见搭配形式。软件具有界面简洁和操作方便的优点,有助于语料库语言学研究的深入。

三、研究过程

1.词汇特征数据采集与分析

(1)词汇密度 Halliday认为,一个句子中的词语分为两类:一类是语法项,又称功能项,指不具备稳定意义或意义模糊而主要起语法功能作用的词语,主要包括代词、介词、连词、冠词和助动词等词类;另一类为词汇项,或称实义词,指具有稳定词汇意义的词语,包括名词、动词、形容词和大多数副词[8]。Ure提出词汇密度的计算公式为实义词数除以词汇总数得到的百分比,即:词汇密度=实义词数/词汇总数×100%。由于实义词传递大部分信息,文本中实义词越多,词汇密度越大,信息量越大,反之,信息量就少[9]。表1显示了通过AntConc3.2.1对COETT 源语库和CTETT 译文库中实义词的统计结果:

表1 COETT 和CTETT 语料库实义词统计结果

从表1我们可以看出,COETT 和CTETT 的词汇密度分别为56.1%和51.3%,英语源语旅游文本语料库词汇密度要大于汉译英旅游文本语料库,说明源语语料库实词比例高,因而传递的信息量也较翻译文本语料库要大。COETT 中名词数和形容词数分别为38 391 和10 427,远远高于CTETT 中的35 913和8 812。更多名词和形容词的使用使得景点介绍更加客观、充实、优美和准确,再现了世间景物之美,从而吸引人们前往观光旅游。COETT 中实义动词(lexical verb)的使用与CTETT 几乎相当,但常用的实义动词的使用频率却远远高于CTETT。在朗文英语口语和笔语语料库中,每百万词出现频率超过1 000次的有say,get,go,know,think,see,make,come,take,want,give,mean。这12个常用实义动词在COETT 和CTETT 里出现的频数为655和445,分别占语料库实义词总数的7.48%和4.91%。12 个实义动词中,其中get,go,know,make,come,take,give 为行为动词,know,think,see,want,mean为心理动词,say 为交际动词[10]。旅游文本属于“呼唤型文本”,英语源语旅游文本在劝导人们时用词平实明快、简洁明了,表达直观通俗,呼唤游客去行动,去思考,去感受。

(2)人称代词使用 大多数语言中都存在着由三个人称构成的人称代词体系,如英语中的I(we),you(you)和he,she,it(they);汉语中的我(我们),你(你们)以及他、她、它(他们)。Halliday指出,人际意义包含在人称系统之中。在人际交往中,说话人可以用人称或物主代词赋予自己或其他人一个角色[11]。表2显示了通过AntConc3.2.1检索得出的人称代词在COETT 和CTETT 中分布情况:

表2 COETT 和CTETT 中人称代词分布对比

从表2可知,COETT 源语库第一人称和第二人称代词和相应的物主代词的使用数明显高于CTETT 译文库,分别为3.06倍和1.92倍,而第三人称代词和相应物主代词的使用数则低于CTETT译文库。使用代词的某种形式可以表示亲密性或权势,而“在某一特定情形下,有意的代词选择是研究说话人对听众所持态度和两者之间关系的线索”[12]。COETT 中代词的使用具有交互性,或将读者(游客)定格为第一人称(I或we),或采用游客介入的视角,即常用“you”引导句子。这些都会让人产生人际交往和沟通及时性的印象,有利于在旅游文本和游客之间建立对话,创造一种亲密的交流氛围,缩短两者之间的心理和社会距离,最终促使旅游行为的发生。在大多数情况下,第一人称和第二人称属于文外照应,第三人称属于文内照应,COETT 和CTETT 的第三人称使用数远远高于第一人称和第二人称,同时CTETT 的第三人称多于COETT,因为在指代景点时,CTETT 反复使用代词,而COETT 善于使用同语反复来建立共指关系。

2.句法特征数据采集与分析

(1)语态使用 人们用语言和其他人进行交往,用语言来建立和保持人际关系,影响别人的行为或表达对世界的看法。虽然“语气”和“情态”是人际功能的重要组成部分,但是它们必须在一定的“语态”中去体现。“语态”是说话者观察事物的立场和叙述角度,人们在表达自己的思想时,总是根据自己的交际意图,选择适当的语态[13]。表3列出了通过AntConc3.2.1对COETT 和CTETT 中被动语态使用的统计结果:

表3 COETT 和CTETT 中被动语态使用的统计结果

从表3可知,CTETT 语料库中的被动句式占句子总数的31.3%,而COETT 语料库中的被动句式只占17.8%,远远低于CTETT。语态的选择归根结底取决于语言使用视点的选取。视点是“叙述者在叙事时通过文字表达或流露出来的立场、观点、语气和口吻”[14]。一般说来,东方人注重悟性思维,主观意识较强;而西方人注重理性思维,逻辑严密。语言是思维的载体,思维的差异往往在语言上有所体现,因此在描述事物上汉语主要从人称视角出发,体现人的主观意识;英语则更多从物称视角出发,注重客观叙述。但在特定的语篇中,语言的使用视点会有所变化,视点决定句子的主语,而句子的主语决定动词的语态形式。COETT 从游客角度出发,加强与读者的交流,循循善诱,极少有大量叙事的成分,而以诱导型话语居多。比如“you”和“visitors/guests/tourists”是语料库中最为显著的词汇,“you”设置面对面交流的场景,瞬间缩短与读者的心理距离,是以读者为中心的体现;而“visitors/guests/tourists”给游客提供清晰明确的指示,对旅游活动有极大的指引作用。CTETT 多用被动句式引出景点名称,注重对景点的地理和政治位置重要性的介绍,突出旅游资源的社会身份特征,如社会影响、历史沿革、发展业绩,更突出旅游资源的风光景色和人文特色,尤其是史书和文学作品及诗歌对于景点的颂扬和描述占了较大篇幅,较少从受众角度,即游客方面考虑,因而被动语态较多地被使用。

(2)时态使用 时态是语言的范畴,不同的语言有不同的时态系统;时间是独立于语言的概念,具有普遍性,但时态又与时间有关,在句法中英语时态用于表示句中围绕动词所表示的动作或状态的各种时间关系。但我们不应该将视野束缚在单一的时间平面上,而是应该揭示每一种时态的语法意义的实质。有专家认为现在时态的实质是“现联性”,它表示动作或状态在时间或心理方面与现在时点有联系;过去时态的实质是“距离性”,它表示动作或状态与说话时刻存在着某种距离性关系,或逆时针方向的时间距离,或与真实性的距离,或心理方面的距离[15]。表4显示了AntConc3.2.1对COETT 和CTETT 现在时态和过去时态使用情况的统计结果:

表4 COETT 和CTETT 现在时态和过去时态使用的统计结果

表4显示,COETT 和CTETT 语料库现在时态的使用都多于过去时态。CTETT 语料库中现在时态使用为过去时态的2.06倍;而在COETT 语料库中,这个比例更高,达到5.34。旅游语追求的是通过对目的地的文字、图像、标识等介绍,试图说服或吸引数以万计对旅游感兴趣的人们,旅游文本旨是“吸引注意、保持兴趣、创造欲望、立即行动”[16]。而现在时作为英语时态系统中的一个范畴,具有“表实”功能,游客看到它所描述的内容是真实的,因而产生认清现在、追寻过去和探究未来的想法,并有可能付诸于实践。同时旅游文本利用现在时态的想象时间关系来喻指想象动作状态(这里指事实或场景)与客观真实性之间的联系,即把过去的事实拉回现实之中,就像影视摄影师通过特写镜头把过去的画面拉至观众眼前一样,使读者犹如亲临其境,对所述事实/场景产生不可不信之感。因此英语旅游文本无论是在介绍旅游景点或所提供的服务方面还是在宣传某一旅游公司或旅行社方面,一般说来均会使用现在时。

3.语篇特征与分析

语篇可长可短,从结构方面看,“语篇”是大于句子的最高级的语言使用单位,统驭词素、词、词组、短语、分句、小句等,但从功能方面看,语篇是使用中的语言,在交际过程中,语言的意义是根据语境来确定的。在翻译实践和翻译研究中,语篇概念应把上述两点结合起来考虑,一方面语篇具备特定语境中的交际功能,另一方面语篇是超越句子语法的范畴,因而翻译中的语篇概念应是“连贯而完整的较大的语言交际单位,如段落、整篇文章、会话等”[17]。旅游语篇具有多功能性,其最终目的是通过对旅游景点和景区的细致描写,增强文章的感染力,给读者(潜在的旅游者)提供丰富的信息,带来美的享受,并使其产生一睹为快的欲望。

旅游语篇通常具有指示功能、信息功能和描写功能。指示功能是发出指令或诱导性信息,直接刺激旅游者的参观欲望;信息功能主要是为旅游者提供丰富的旅游资讯,其中包括位置、路线、设施、费用等实用信息,以及文化、历史等人文信息;描写功能,即传达外表和态貌等形象信息的功能[18]。通过对COETT 和CTETT 两个语料库的观察,英语旅游文本原创语料库和英语翻译语料库在篇章方面存在着显著差异。英语原创语料库的指示功能和信息功能贯穿于整个语篇,描写功能只是体现在语篇的局部。这些旅游文本为旅游者发挥了传递信息、提供咨询的功能,其中包括位置、路线、设施、费用、旅游建议、文化、历史等信息。而英语翻译语料库整个语篇描写功能表现明显,寓景于情、情景交融、旁征博引、层层铺垫,直至结尾处才揭示出焦点信息。

例(1):The Great Smoky Mountains,part of the Appalachian Mountain Range,stretch over 800 square miles,from the western border of North Carolina to Gatlinburg,Tennessee.They got their name from the Cherokee Indians.They called the mountains,Shaconage,for the blue-gray haze that veils the summits.

One of the largest protected land areas east of the Rocky Mountains,the Great Smoky Mountains National Park has over 500,000acres of forest.It has beautiful streams and numerous waterfalls,vir-gin forests of red spruce,and hundreds of miles of developed hiking trails.It is also home to more than 50species of mammals,including black bears,white-tailed deer,foxes and bobcats.The Great Smoky Mountains rise from 800feet to 6,643feet,with Mount LeConte being the highest peak.

例(1)是COETT 英语原文库中The Great Smoky Mountains(大雾山)的景点介绍开头部分,短短127个词的开始部分给读者提供了大量信息,大雾山的地理位置、名字由来、海拔高度以及大雾山国家公园的概况。随后,网页先后以“The most visited park in the USA”“A scenic drive with spectacular views”“Hiking,backpacking,bicycling and camping”为标题,对大雾山展开介绍。除对大雾山美景作介绍外,网页还给那些徒步者、背包客、骑行者以及露营者提供了相关信息。这个景点介绍把丰富的旅游资讯提供给读者,为读者提供真实、客观的景点描述,同时这些信息具有指令性和诱导性,体现了旅游文本是“呼唤型”文本的特点,激发读者的旅游欲望。

例(2):Of all the notable mountains in China,Yellow Mountain(Mt.Huangshan),to be found in the south of Anhui province,is probably the most famous.Originally known as Mt.Yishan,it was renamed Mt.Huangshan in 747AD in recognition of the legendary Huang Di,who was the reputed ancestor of the Chinese people and who made magic pills for immortality here.Yellow Mountain can boast not only of its magnificence but also its abundant resources and great variety of zoological species,for which it has been listed as a World Natural and Cultural Heritage Site.The strange pines,absurd stones,sea of clouds and hot springs are the four wonders of Yellow Mountain(Mt.Huangshan).

Strange Pines:Yellow Mountain (Mt.Huangshan)pines are seen in every corner of Yellow Mountain.You will be amazed by their vitality and strength.The seeds fall into the crevices where they take root and grow with great vigor.The uneven terrain prevents the pines from growing upright.Instead they become crooked and even downward…Every pine is unique though:Guest-Greeting Pine(in front of the stone lion of the Jade Screen Pavilion in the Jade Screen Scenic Area),Guest-Goodbye Pine(to the right of the Jade Screen Pavilion),Cushion Pine at Lotus Valley,Phoenix Pine at the Sky Sea,Chessboard Pine at Pingtian Stone Bridge,Kylin Pine between Bei Hai Hotel and the Refreshing Terrace,Black Tiger Pine and Sea Exploring Pine are among the most famous ones.

例(2)是CTETT 译文库中安徽黄山景点介绍的部分内容。在对黄山的地理位置和名称由来简单介绍之后,就转入对Strange Pines(奇松),Absurd Stones(怪石),Sea of Clouds(云海)和Hot Springs(温泉)浓墨重彩的描写。这些描写性的篇章由于受到源语汉语的影响,语言优美,极力表达“黄山四大奇景”美妙绝伦之处,同时融入了浓郁的人文色彩,把景物的内在意蕴依附于外在的表象之上,努力做到情景交融、意境相谐,但是却忽视了旅游文本的主要功能——指示功能和信息功能。景点文本侧重于特殊景点的描写,相比之下,缺乏与黄山旅游信息相关的内容,如旅游路线、设施、住宿以及费用,因此游客看完介绍后脑中留存下来的只是朦胧的、模糊的黄山印象。

四、研究发现

本研究基于英语源语旅游文本语料库和汉译英旅游文本语料库,对两类英语旅游文本的语言特征进行了比较分析。研究发现,英语源语文本和汉译英文本在词汇、句法和语篇语言特征使用方面既有共同点又存在差异。在词汇方面,源语语料库词汇密度高于英译语料库,源语语料库中名词、形容词以及常用的表达“行为”“心理”的实义动词数明显高于英译语料库,这表明源语语料库里的旅游文本景点介绍更加客观真实,更能抓住读者心理。两个语料库中第三人称的比例都要高于第一人称和第二人称,但源语语料库更多地使用了“I”“we”“you”,这些代词的使用拉近了与读者(潜在的游客)距离,使读者有亲近感,可能增加旅游行为的发生。在句法方面,主动句式在两个语料库中均占据主导地位,但源语语料库中被动句式使用比例远远低于英译语料库。语言视点选择决定语态使用。源语语料库从游客角度出发,以诱导性、指示性话语居多,因而被动语态使用较少;而英译语料库更多地突出游客之外的方面,如风光景色、历史沿革等,因而被动语态较多地被使用。同时源语语料库现在时使用为过去时的5.34倍,远远高于英译语料库的2.06倍。现在时态的表实功能使它被更广泛地应用于旅游文本中。在语篇方面,源语语料库和英译语料库里的文本都体现了指示功能、信息功能和描写功能,但两者侧重点不同,源语语料库中的文本指示和信息功能贯穿于整个语篇,描写较少;而英译语料库中的文本描写占据主要篇幅,通常只是在文本开头和结尾部分才给出相关的旅游信息。

五、结束语

汉语旅游资料的英译受到诸多因素的影响,因而译文质量常常良莠不齐,除了简单的语言层面的错误外,更多问题是译文没有深入旅游文本的内在,即文体特征和语篇功能,忽视了译文文本的预期目的,从而导致译文“死译”现象较多。

基于语料库的研究,其最大优势在于使用真实语料描述语言特征,从语言现象入手,更加客观准确地揭示文本本质。所以本研究基于自建的类比语料库,对比分析旅游文本语言特征和语篇功能,目的是以源语语料库为标杆,找出汉语英译旅游文本存在的问题,提高英译文本的语言质量,使语言表达、行文等方面更加符合译入语英语的规范,同时在现代翻译理论指导下,提出切实可行的翻译原则和方法,从而达到推介旅游景观、唤起游客兴趣、激发旅游行为发生的目的。本研究所得结论只是抛砖引玉,汉语旅游资料的英译需要语言学专家、相关的翻译人员、旅游业相关部门以及对旅游文化感兴趣的人的共同努力,不断提高。

[1]李德超,王克非.平行文本比较模式与旅游文本的英译[J].中国翻译,2009,(4):54-58.

[2]侯晋荣,秦洪武.利用关键词分析旅游文本的文体特征:一项基于语料库的实证研究[J].外国语文研究,2012,(1):73-84.

[3]高 存,张 允.旅游文本的英译——问卷调查与策探[J].上海翻译,2005,(3):22-25.

[4]熊力游,刘和林.旅游网页文本的编译策略[J].中国翻译,2011,(6):63-67.

[5]Baker M.Corpus Linguistics and Translation Studies:Implications and Applications[M].M Baker,G Francis,E Tognini-Bonelli(eds).Text and Technology:In Honour of John Sinclair.Amsterdam:John Benjamins,1993:235.

[6]王克非.语料库翻译学探索[M].上海:上海交通大学出版社,2012:210.

[7]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010:53.

[8]Halliday M A K.Spoken and Written Language[M].Oxford:Oxford University Press,1985:88.

[9]Ure J.Lexical Density and Register Differentiation[C]//Applications of Linguistics:Selected Paper of the Second International Congress of Allied Linguistics.G E Perren,I L M Trim(eds).Cambridge:Cambridge University Press,1971:443-452.

[10]Biber D.Longman Grammar of Spoken and Written English[M].London:Longman,1999:373.

[11]Halliday M A K.An Introduction to Functional Grammar[M].2nd Edition.London:Arnold,2000:191.

[12]何兆熊.新编语用学概要[M].上海:上海外语教育出版社,2000:63-66.

[13]陈明芳.英语语态问题:两种语言流派的比较研究[J].外语与外语教学,2002,(12):18-20.

[14]申 丹.叙述学与小说文体学研究[M].北京:北京大学出版社,2001:175.

[15]易仲良.英语动词语义语法学[M].长沙:湖南师范大学出版社,1999:15-66.

[16]熊力游,刘和林.旅游网页文本的编译策略[J].中国翻译,2011,(6):63-67.

[17]李运兴.语篇翻译引论[M].北京:中国对外翻译出版公司,2001:16.

[18]康 宁.从语篇功能看汉语旅游语篇的翻译[J].中国翻译,2005,(3):85-89.

猜你喜欢
源语时态英译
摘要英译
超高清的完成时态即将到来 探讨8K超高清系统构建难点
摘要英译
要目英译
要目英译
释义理论指导下的口译教学新模式探究
关于卡特福德翻译理论的思考
英语翻译中悖论的发现与理解
源语概念对英语专业学生隐喻词汇习得的影响研究
“一找二看三注意”,妙解动词时态题