基于语料库的旅游文本语言特征及语篇分析*

2011-12-22 06:28侯晋荣
菏泽学院学报 2011年6期
关键词:语料库语篇词汇

侯晋荣

(菏泽学院外国语系,山东菏泽 274015)

基于语料库的旅游文本语言特征及语篇分析*

侯晋荣

(菏泽学院外国语系,山东菏泽 274015)

目前,旅游文本的研究多从跨文化、文本类型、目的论等角度入手,缺乏深入细致全面的分析。基于类比语料库的研究表明,源语文本注重呼唤功能,用词平易、丰富,通俗易懂;翻译文本依然存留汉语文本的某些特征,表现为数量表达使用过于频繁,常用隐性衔接,有时过度突现目的语英语的特征,如冠词、关系代词使用偏多等。因此,在汉语旅游文本英译时需要强化呼唤功能,加强语篇衔接,同时要注意语言运用质量,以实现旅游推介的目的。

旅游文本;类比语料库;语篇分析

林璋先生说:“转换是翻译行为的本质,也是翻译学研究的支点,整个翻译学都是围绕着转换展开的。”[1]翻译转换不仅仅是考察词汇和句子层面的对应,还应注意更高层面语篇的布局。因为“语篇是有效交际的最终单位”。[2]本文尝试运用语料库手段,广泛搜集旅游文本语料,进行量化对比分析,总结英语源语和汉英翻译旅游文本的语言特征,考察旅游文本翻译过程,并利用Hatim和Mason的语篇分析方法探讨旅游文本汉英翻译应注意的问题。

一、研究方法和思路

为探讨旅游文本的语言特征,笔者创建和使用了类比语料库,通过语料量化分析,找出英语源语旅游文本和汉英翻译旅游文本之间的差异,探究旅游文本翻译过程。为了确保语料来源可靠,所选语料全部来自中国及英美旅游官方网站。该库库容12万词左右,由英语源语旅游文本和汉译英旅游文本两个子库构成,每个子库含有人文景观与自然景观语料,比率大致相当。参照语料库采用美国国家语料库旅游手册的子库,共179篇,约100万词。①

所选文本以完整篇幅收录,以txt文本格式存放,并使用CLAWS②进行词性标注。通过Wordsmith 5.0③统计分析有标准形符/类符比、平均词长、平均句长、词类。在源语文本和翻译文本语言特征对比分析的基础上,采用Hatim和Mason的语篇理论对文本进行结构分析,探讨翻译文本语篇重构,达到最终交际目的。

表1 旅游文本类比语料库的构成

二、旅游文本的对比分析

1.宏观语言特征

以下是使用Wordsmith5.0得到的统计结果。统计对象为标准化类符/形符比(STTR)、平均词长(Mean WL)、平均句长(Mean SL)。

表2 旅游文本宏观语言特征

统计显示源语文本标准化类符/形符比(STTR)为44.75,翻译文本为43.70,参照文本为48.40。源语文本与翻译文本的STTR都低于参照文本,这与库容有关,库容越大,标准化类符/形符比越高。在类比语料库内,源语文本与翻译文本比例相当,源语文本STTR较高,说明源语文本用词丰富,翻译文本词汇重复率偏高。

源语文本平均词长(Mean WL)为4.84,翻译文本为4.71,参照文本为4.81。源语文本与参照文本平均词长相近,翻译文本平均词长较短,说明较之源语文本,翻译文本选词简单。类符/形符比和平均词长对比显示,翻译文本词汇不够丰富且选词简单,有“简化倾向”[3]。

源语文本平均句长(Mean SL)为19.64,翻译文本为20.06,参照文本为17.84。翻译文本平均句子最长,源语文本次之,参照文本句子最短。说明在旅游文本汉英翻译过程中,句子呈现“显化”倾向[3]。

2.高频词汇对比分析

Laviosa把高频词定义为“出现频率高于0.1%”的词汇。[4]如若翻译文本有简化倾向,则词汇重复率高,高频词汇所占比重较高。

图1 高频词汇对比

源语文本高频词汇累计频率46.41%,翻译文本为48.97%,参照文本43.01%。三者之中,翻译文本高频词汇所占比重最大,词汇重复率最高,用词不够丰富,这与标准化类符/形符对比所得结论一致。

3.POS对比分析

本文使用CLAWS对两个子库的文本进行了POS标注,基于该类标注,本文统计了词类的分布情况,结果如下:

名词(包括专有名词)、形容词、动词、实义副词是信息的主要承载体,在词类统计中划为实义词,其他计入功能词。实义词与词汇总数的比重为文本的词汇密度[5]。源语文本词汇密度高于翻译文本(53.50 & 52.49),说明源语文本实义词较多,信息量较大。

根据表3,源语文本与翻译文本呈现出不同的文本特征,具体如下:

①动态与静态

源语文本动词、副词使用频率较高,翻译文本名词、形容词使用频率较高。这说明,源语文本注重动态描述,语言形象生动,文体平易;而翻译文本偏于静态描述,文体书面化,语言华丽。

表3 词类的出现频次、频率

例1:

Toronto Music Garden provides a great venue for intimate concerts and a lovely place to relax and enjoy the beauty of the waterfront.(源语文本)

Huangshan must be one of the best ways of enjoyment and relaxation.(翻译文本)

②衔接与限定

源语文本限定词的使用频率较高,翻译文本介词、连词、助动词较多。这说明二者都重视文本的衔接与连贯,且翻译文本呈现“显化”特征。

③指代差异

翻译文本指代词使用频率总体高于源语文本,但二者侧重点不同。翻译文本指代多用it,这说明在指代景点时,翻译文本反复使用代词,而源语文本善于使用同语反复来建立共指关系。如:

例2:

Out of all of America's symbols,none has proved more enduring or evocative than the Statue of Liberty.This giant figure,torch in hand and clutching a stone tablet,has for a century acted as a figurehead for the American Dream…(源语文本)

实际上,每个词都有一定的情感语义信息,合理使用求雅替换(elegant variation)[6]既有助于提供密集的景点信息,又能吸引目标读者的注意力。

④指导性的强弱

Hatim和Mason把语篇划分为说明文、论说文和指导文。[2]旅游文本属于指导文,这就决定了旅游文本指导性较强,富有感染力。源语文本you的使用频率远远高出翻译文本(404&190)。You多用于即时交际场景,可拉近言者和听者之间的距离,增加感染力。源语文本突出了读者的中心地位,缩短了与读者之间的心理距离,指导性较强。

以上说明,翻译文本与源语文本还存在较大的差距,文本在汉英翻译过程中应注重旅游文本交际功能和呼唤功能,加强文本内部衔接,改善词汇的使用,增加语言生动性。同时减少不必要的景色渲染,慎用指代。

三、语篇分析

Hatim和Mason认为语篇是结构的最高层面,是有效交际的最终单位,“语篇是一个连贯和衔接的单位,由一个或一个以上的序列组成,而序列又包含彼此相关的成分,它们为共同某一个修辞目的服务”。[2]不同的语言倾向于不同的语篇结构,在语篇转换时,要以实现源语交际目的为修正标准。因此在翻译过程中,要加强译者干预,消除语篇中谋篇布局的缺陷,保证语篇的连贯性,达到成功交际的目的。

图2 翻译过程

Bell对翻译过程进行了描述(图 2)。[7]在发送者(sender)和接受者(receiver)的交流中,译者的转换作用尤为重要,把握译文的可接受性(acceptability),传递有效信息,实现等效交流,是译者的首要任务。实现语篇的翻译,译者需要考虑语篇结构的三个层次:成分—序列—语篇。对源语语篇的结构、信息排列、意义层次、篇内连贯及逻辑修辞等方面进行调整,以适合译文读者的思维方式和阅读习惯,否则译语语篇的可接受性就会大大降低。

下面是源语文本对黄石公园的介绍,利用Hatim和Mason语篇分析法分析如下:

例3:

成分①为历史追溯和社会定位;成分②为地理定位,这两个成分都属于背景信息;成分③④介绍观赏内容,介绍黄石公园的野生动植物,属于主题信息,是语篇的核心,其中使用 a large variety of,extraordinary这样具有夸张成分的词汇增加感染力;成分⑤是建议提示,属于附加信息。序列1和序列2以公园为叙述主位,序列3以You(游客)为叙述主位,主题突出醒目,语篇按照背景信息—主题信息—附加信息层层推进,既突出主题信息,又兼顾其他信息,大大增加了文本的可接受性,能够实现信息有效传递。

下面是翻译文本对西山公园的介绍,对比分析如下:

例4:

加信息——3

上述对西山公园的介绍分析如下:成分①西山公园地理定位,介绍背景信息;成分②③观赏内容,西山公园包括西山、隐山,山边有西庆林寺,属于篇章的主题信息;成分④西庆林寺历史背景,从唐代起就有很多朝圣者,事实上,就是介绍这是个佛教圣地,是背景信息;成分⑤观赏内容,西山和隐山的雕塑、壁画,是主题信息。分析发现,观赏内容中包含历史背景,导致篇章前后联系不紧密,主题转换频繁,叙述混乱。没有针对游客的附加信息,忽视了与游客的人本关怀。现对其进行修改如下:

The West Hill Park is a holy land of Buddhism ever since Tang Dynasty①.Located a mile west from downtown②,it comprises the West Hill and Hidden Hill③.On the cliff of the hills there exist 200 marvelous statues and frescos④.Around the hills is a lake,by which stands a famous temple called Xi Qinglin⑤.You will have a peaceful time here.⑥

成分①②西山公园历史背景和地理定位,属于背景信息;成分③④⑤观赏内容,以西山、隐山为主题,介绍雕塑、壁画,以及西庆林寺;成分⑥附加信息,加强与游客的沟通交流。

其中,增加“佛教圣地”使历史背景明晰化,hold改为comprise更为确切,描述雕塑增加形容词marvelous,描述西庆林增加famous,提高吸引力和感染力,并且补充附加信息,突出游客的主体地位。

汉译英旅游宣传文本在语言使用特征上靠近英语源语文本,这是考虑目标受众的期待视野和接受偏好,实现宣传效果而做出的合理选择。事实上,大多数的语言特征差异并非是此有彼无的问题,而是用量多寡和频率高低的问题。所以,某些语项能使人产生源语语言的印象,它们的使用频率既能验证译本的规范程度,又能反映一个翻译文本的质量。[8]

四、结语

本文通过语料库及实例分析,发现翻译文本与源语文本存在较大差异,旅游文本在英译时需要注意以下几点:1.从宏观内容入手,适当调整篇章布局。2.注意词汇的选用,减少不必要的渲染,慎用指代,增加建议指令等实用信息,增加与目标读者的交流。3.要充分考虑汉英文化差异,关注目的语的表达习惯和目标读者的阅读期待,力求行文活泼、通俗易懂,增强文本的呼唤功能,以实现有效翻译,达到成功交际对外宣传的目的。

注释:

①参照旅游文本采用美国国家语料库(American National Corpus)下面命名“berlitz”的子库,是关于旅游指南(travel guide)的文章,共计179 篇,共1,012,496 词

②CLAWS全称the Constituent Likelihood Automatic Word-tagging System,英国兰卡斯特大学计算语言研究中心研制,用于BNC英国国家语料库的标注,正确率达到96%。

③WordSmith Tools是由Scott研制的词法分析工具,有具有词语检索、生成词表和主题词三个主要工具,1996年牛津大学出版社出版,目前已更新到第五版。

④对数似然率,又称对数似然比(Log-likelihood ratio),计算二元因变量之间的差异性和显著性,本文采用对数似然率来观察源语文本和翻译文本之间的差异。

对数似然率 P值(Probability)可能性3.84 0.05 1 in 20 6.63 0.01 1 in 100 7.9 0.005 1 in 200 10.83 0.001 1 in 1,000 15.15 0.0001 1 in 10,000 19.5 0.00001 1 in 100,000 23.9 0.000001 1 in a million 37.3 0.000000001 1 in a billion

[1]林璋.论翻译学的基础研究[J].外国语,1999(6).

[2]Hatim,Basil& Ian Mason,Discourse and the Translator[M].Shanghai Foreign Language Education Press,2001

[3]Baker,Mona.Linguistics and Cultural Studies:Complementary or Competing Paradigms in Translation Studies[A].?bersetzungswissenschaft im Umbruch:Festschrift für Wolfram Wilss[C].Tübingen:Gunt er Narr 1996.

[4]Laviosa,Sara.Core patterns of lexical use in a comparable corpus of English narrative prose[J].Meta.1998.(4).

[5]Stubbs,Michael.1986.Lexical density:A computa-tional technique and some findings[A].In Coultard M.(ed.)Talking about Text:Studies Presented to David Brazil on His Retirement[C].Birmingham:English Language Research,U-niversity of Birmingham.

[6]Leech,Geoffrey N and Michael H.Short Style in Fiction:A Linguistic Introduction to English Fictional Prose[M].London& New York Longman,1981.

[7]Bell,Roger T.Translation and Translating:Theory and Practice[M].Foreign Language Teaching and Research Press,2001.

[8]Tirkkonen-Condit,Sonja.Translationese – a myth or an empirical fact?A study into the linguistic identifiability of translated language[J].Target,2002(2):207 -220.

A Corpus-based Research on Language Features and Textual Analysis of Tourism Promotional Texts

HOU Jin-rong

(Foreign Languages Department of Heze University,Heze Shandong 274000)

So far,most of the studies on tourism texts are based on cross - culture,text type and skopos,which are not comprehensive.The research based on the comparable corpus found that original English tourism texts(OETT)are more vocative,more variable in words and easier to understand.On the one hand,translated English tourism texts(TETT)display some hints of Chinese,such as strikingly frequent use of numerals and recessive cohesion.On the other hand,TETT exaggerate features of target language,such as overuse of articles and relative pronouns.Considering that,TETT should strengthen the vocative function,enhance textual cohesion and improve translation quality to ensure communication and publicity.

tourism texts;comparable corpus;textual analysis

H 059

A

1673-2103(2011)06-0124-05

2011-07-20

侯晋荣(1983-),女,山东郓城人,菏泽学院外国语系讲师,硕士。研究方向:语料库语言学与翻译。

(责任编辑:谭淑娟)

猜你喜欢
语料库语篇词汇
新闻语篇中被动化的认知话语分析
本刊可直接用缩写的常用词汇
一些常用词汇可直接用缩写
《语料库翻译文体学》评介
本刊可直接用缩写的常用词汇
基于JAVAEE的维吾尔中介语语料库开发与实现
从语篇构建与回指解决看语篇话题
语篇特征探析
本刊一些常用词汇可直接用缩写
语料库语言学未来发展趋势