王 宏
(浙江旅游职业学院 外语学院,浙江 杭州 311231)
从研究手段和途径的视角,对于旅游文本文体风格的探讨可以分为以引述例证为基础的定性研究和借助语料库的量化数据为基础的定量研究。前者如白玛德吉等从功能主义理论出发分析西藏旅游文本和英美旅游文本的风格差异,发掘西藏旅游文本英译过程中的问题,为西藏旅游文本的英译提供策略建议。[1]当代语料库研究的兴起始于上世纪90年代,对于语料库的研究多集中于如何科学的自建语料库和利用语料库来提高翻译教学效果。把语料库引入旅游文本风格的研究分为两类:一类是平行语料库(Parallel corpora)研究,如唐芳(2011)[2]认为旅游文本汉语译语具有区别于汉语源语的词汇特征,考察了英语源语对其汉语译语的影响,证明了译语特征与源语影响之间的相对独立性。另一类是类比语料库(comparable corpora)研究,如王慧(2020)[3]通过自建日语旅游文本类比语料库,从词汇、句法结构两方面对比了翻译文本和源语文本,为日语文本翻译提供参考和借鉴。本文以分析杭州旅游外宣网站语料库和Leeds&Boston旅游网站语料库两个自建类比语料库为基础,从词汇和句法两个维度,从类符形符和类形符比、高频词汇、词汇长度、指示代词、词性以及句数和平均句长六个方面来阐明两个语料库的风格异同,试图给国内英文旅游网站的建设提供改进建议,助力当地经济发展,消除文化误解,弘扬中国文化。
鉴于以某一地旅游外宣(这里主要是指英文,以下皆是)文体风格为研究对象,以语料库为研究手段的研究较少,本文设计通过语料库分析杭州的两座友好城市--英国的Leeds和美国的Boston旅游网站景点推介的文本风格与杭州旅游景点外宣译本风格的相似点与不同点;解决以下问题1.Leeds和Boston的旅游网站文本具有哪些文体特征?2.杭州旅游外宣网站译本具有哪些文体特征?3.同为英语文本,作为母语在英美城市景点介绍中的特征和作为外语在杭州景点介绍中的特征有些什么不同之处?4.通过对比,杭州旅游外宣网站有哪些可以改进的地方?
在本研究过程中使用了Corpus Word Parser对三个城市的景点资料进行分词,之后使用了语料分析工具WordSmith6.0对分词后的数据进行统计检索,得到两组数据结果。使用多维分析赋码器TreeTagger2.0(北外改编版)对词性进行标注处理,然后再次使用WordSmith6.0统计语料的词性信息。
收集浙江省文化旅游厅的网站数据、英国Leeds政府官网和美国Boston政府官网的旅游数据自建小型专门用途语料库。杭州语料库中包括西湖新老十景、灵隐寺、岳庙、雷峰塔等杭州主要景点;Leeds&Boston语料库囊括了波士顿美术博物馆、自由之路、波士顿公园和皇家军械博物馆、哈伍德庄园等两个城市最受欢迎的景点。均涉及吃、住、行、游、娱、购等游览的各方因素,虽然只涉及三个城市的游览网站信息,但试图做到最全面最准确。浙江省文化旅游厅是隶属于浙江省人民政府的官方媒体,Leeds和Boston的数据也来自官方渠道,所提供的信息正规性和权威性有保证。梳理上述三组数据,剔除多余的空格和特殊符号,以保证数据的清洁和准确,形成两个以旅游为主题的类比语料库。在资料收集过程中注意平衡三个城市的信息采集的种类和数量的平衡。
1.类符形符和类形符比。形符是指一句话中词汇的个数,类符是不重复计算的形符,因此一般认为类形符比可以体现文本的词汇密度。
杭州的语料库形符共有23839个字符,Leeds和Boston的语料库形符共有23206个字符,两者的大小接近。一般认为,类符形符比越高,文本的用词变化越大,用词也越丰富;类符形符比越低,文本的用词变化越小,用词也越单调重复。以上两个数据库的文本同属旅游类目主题的文本,其类形符比可以反映中美旅游类文本的词汇多样性的差异。从表1中可以看出虽然相比杭州,Leeds和Boston文本的形符数较少,但是类符数却高于杭州译本,而类形符比也明显高于杭州译本。标准化类符形符比值杭州为40.04,Leeds和Boston为44.82,反映出中国网站旅游文本的类符形符离散程度要大于英美两国文本。这组数据显示,杭州外宣网站文本的词汇重复率较高,词汇变化度低,用词比之Leeds和Boston网站略显单调,符合翻译文本的“简化”趋势。
表1 类形符和类形符比
2.高频词汇
汉语中的实词主要包括名词、动词、形容词、副词、数词和量词,虚词主要为起语法功能的连词、介词、助词、叹词和语气词 (王克非、胡显耀, 2008)[4]。
使用WordSmith6.0中的Wordlist功能对两组文本词频统计发现,排前三位的都是“the”、“and”、“of”这三个功能虚词,虽然所占比例略有不同。Leeds和Boston的语料库第一个实词出现在排名第10位复现频次为0.94%的“Leeds”、然后依次出现的实词是第17位的“city”、18位的“Boston”、20位的“museum”、28位的“park”、30位“tour”和33位“art”。Leeds皇家军械博物馆和坐落于Boston的艺术博物馆,在两国内都占有举足轻重的地位,收录了世界各大文明的诸多藏品,因此是这两个城市的必去景点,网站上提及的频率和介绍的详实程度也较高。
在杭州的文本中首次出现的实词是排名第10位的“Hangzhou”,出现频率占比是0.89%,然后依次是20位的“lake”、22位的“area”、26位的“west”、28位“temple”、32位的“culture”和34位的“dynasty”。实词占比最高的Hangzhou和Leeds以及排名18的Boston都显示出旅游目的地城市的主题和核心地位。但不同于英美两个城市的最重要景点是博物馆,杭州的旅客热门景点是杭州的城市名牌“西湖”和佛家江南名剎“灵隐寺”。“art”、“culture”和“dynasty”显示出欧美国家倾向于艺术的鉴赏而我们更乐于探讨文化的渊源和传承。中国人喜欢在讲述历史传承中阐明景点的欣赏价值,旁征博引,引经据典,思维方式发散而讲究个人领悟;西方人更擅长平铺直叙,语言凝练,思维方式缜密,逻辑严谨。
3.词汇长度
一个文本的词汇拼读越复杂、词长越长、长词量越多,文本的可读性就越低文本难度就越大。表二是对两个语料库词汇长度的分析,主要列举了1到12个字母长度的词汇,英语中词汇的字母容量主要集中于这个区间。
表2 词汇
每组上面数字条代表杭州的词汇文本表征,下面数字条代表Leeds&Boston词汇文本表征。可以看出在1字母单词、6字母单词、9字母单词、10字母单词、11字母单词和12字母单词的数量上Leeds&Boston的词汇数量均多于杭州相同字母长度词汇的数量。2字母、3字母、4字母词汇和5字母词汇两者的数量都是最多的。杭州文本中2字母词汇数为3766,3字母词汇数为4730,4字母词汇数为3727,5字母词汇数为2627。Leeds&Boston文本中2字母词汇数分别为3181,3字母词汇数为4281,4字母词汇数为3496,5字母词汇数为2605。杭州语料库这四类词汇占比62.69%,Leeds&Boston语料库这四类词汇占比58.83%,都超过了半数。在这四项中反而是杭州的词汇多于Leeds&Boston的词汇数量。也就是说杭州语料库的词汇长度集中在字母数2-5的区间,且起伏剧烈;相对来说Leeds&Boston的词汇长度起伏较缓。2-5个字母的词汇一般为常用词,说明译本选取的词汇更为常用和简单。虽然两者在词汇长短变化趋势和常用词长度上基本一致,但在使用不同长度的词汇方面母语使用者具有更高的可变性和自由度。
1.指示代词
统计高频词时在Leeds&Boston的语料库里第三人称指示代词“it”出现在第21位,频次占比为0.47%;但在杭州语料库中“it”出现在第9位,频次占比0.94%。第三人称代词“it”,常常用作主语或宾语,用来指代某一特定的事物或事件。如:
Largest indoor market in Europe and also is a beautiful Victorian building and a landmark in Leeds.It also has a outdoor market which sells everything from food to clothes to electronics and accessories.
The street is full of Chinese craft stores, such as candy sculptors, old-fashioned movie players, paper-cuttings, which makes Hefang Street charming and lively.It is a good place to buy small local souvenirs.
在Leeds&Boston的文本中第二人称代词(单数或复数)“you”频次占比0.31%位居第32位;在杭州的外宣网站语料库中居第14位占比0.64%。如:
You will now have reached Millennium Square, the Civic Hall and the City Museum.
If you are interested, you can go ashore to walk on this causeway, and try to understand the cultural connotations that these six bridges contain.
从语用学的角度讲,“在特定情况下说话人对指示方式的特定选择表明了说话人对听话人的态度、情感和相互关系”[5],而“指示方式”首先就涉及人称指示,即人称代词的使用。相比于Leeds&Boston语料库,杭州语料库更倾向于使用代词来指代人或事物,这和中国人的思维模式是密切相关的。中国人习惯从经验出发,注重分享自身感受,喜欢推己及人感同身受。对待景观主张天人合一,万物有灵,因此行文造句上常常使用主动句式,意图生动形象传递画面感。英语则常使用非人称结构,惯用被动表达客观理性的态度,营造真实可信氛围。
2.词性
使用北京外国语大学改进的TreeTagger词性赋码工具对两个语料库的文本进行词性赋码,然后把赋码结果POS文件转换为TXT文件再使用WordSmith6.0统计数据,得出两组词性的统计数据。
表3 Leeds&Boston排名前15的词性
表4 Hangzhou排名前15的词性
如上图所示两者的主要区别在PP、CD、VV和VBZ的占比,根据TreeTagger词性赋码集,PP是指人称代词(personal pronoun),VV是指词汇动词原形(lexical verbs,base form),VBZ是指动词 be的第三人称现在时态(present tense of BE verb)。CD(coordinating conjunction)是指基数,主要和景点的介绍中是否含有数字相关。根据词频的分析,我们得知在杭州的语料库中人称代词“you”的出现频率是高于Leeds&Boston语料库的。相比于一般使役动词,杭州语料库使用了更多的系动词Be作为谓语部分来形成语句,暴露了一定的选词局限性。虽然是官方网站翻译品质较高,但是译者还是受中式思维模式和原文的原有行文方式影响,个别句式异于英语句式。
3.句数和平均句长
平均句长就是文本中平均每个句子所包含的词数,数值越大,句子的难度越高,对于读者要求的越高,可读性就越低。
表5 句数和平均句长
杭州语料库的句数较少,平均句长较长,每句有至少20个单词组成,略高于应用性质文章的平均水准。Leeds&Boston的旅游网站面向普罗大众,希望人人可懂人人会用;杭州语料库文本的阅读难度较大,面向的是有一定经济基础和文化背景的可以跨国旅行的人,也是受中文的负迁移影响在行文上较书面化,追求意境形美,不同于英语的直来直往简单明了,讲究体会和感受。
得益于全球化中国一跃成为世界第二大经济体。经济的飞速发展催生了出入境旅游的繁荣,不论是英文旅游文本的中译还是中文外宣资料的英译,不但为大众娱乐休闲生活提供了便利,是政府文化旅游工作的一个重要环节。2019年中国旅游与大数据研究中心主办的“文旅盛世最美中国”活动评选杭州西湖风景区为百名最受欢迎风景区第二名。2010年和2016年《纽约时报》两度把杭州评选为最值得到访风景区。杭州作为旅客的心之向往的旅游目的地对其外宣产品必然有质和量的高品质要求。
作为实用性强的外宣文本,旅游外宣网站文本通过传达有效信息,吸引游客对于名胜古迹的兴趣,最终获得经济收益。由于文化差异和审美取向的不同,旅游外宣网站常常无法获得最佳宣传目的。因此,横向类比较杭州外宣网站语料库和Leeds&Boston旅游网站语料库的文本风格,发现在词汇层面杭州网站呈现显性简化特征,而在句法层面则呈现书面化语体特征。因此,在编写国内旅游网站的外宣资料时,应注意缩短句子的长度,采用简洁明了的表达方式具象化的描述景点特色,才能不断增强我国旅游外宣网站的可读性,规避作为外语的英语文本在我国旅游外宣产品中的不准确和不规范,以促进国际交流的顺利进行,最大程度消除文化壁垒和误解,宣传我国的优秀文化,响应文化强国的号召。