基于语料库的《加州的群山》汉译研究策略*

2016-03-18 07:58王雪玲王静江凤霞杨琪
高教学刊 2016年19期
关键词:汉译词频语料库

王雪玲 王静 江凤霞 杨琪

(黑龙江科技大学外国语学院,黑龙江哈尔滨150022)

基于语料库的《加州的群山》汉译研究策略*

王雪玲 王静 江凤霞 杨琪

(黑龙江科技大学外国语学院,黑龙江哈尔滨150022)

论文以语料库手段分析缪尔生态散文《加州的群山》汉译特点。以语料库检索为辅助手段的文学文本分析方法能够更为客观地对文本进行加工和分析,结合传统的文学作品分析,主客观有机结合能够得出更令人信服的鉴赏结论,是对传统文学鉴赏和文学批评方式的有益补充。

语料库;《加州的群山》;生态散文;翻译策略

一、概述

传统的研究和分析方法继承了文学研究的精髓内容,为我们今天分析和鉴赏佳作提供了很好的借鉴和参考。运用语料库能够将翻译过程中语言转换的语料实例科学地结合起来,比较英汉两种语言之间的异同,研究翻译转换规律,并进一步研究译者所采取的翻译策略和方法,探讨中英两种语言在词汇和句式之间的对应关系。建成的语料库具有一定的数据统计功能,能够统计出文本的类符数、形符数、类/形符比、词频、平均句长、词汇密度、不同词性词汇使用频率等信息,能够对文本的语言特征进行定量和定性分析,从而分析不同译者翻译的语言特点。

平行语料库属双语语料库,能将源语文本及其译语文本进行全文检索并对照显示,具有双语对照、语域广、时效性强、语言实例数量多、语境丰富等优势。能够广泛地应用到翻译研究、翻译教学、双语对比分析、双语词典编撰等领域。利用语料库检索软件对平行语料库中的文本进行分析,可以充分体现出检索软件对文本语言特色和翻译特点等方面的检索优势。

二、《加州的群山》的语言特点检索

选择缪尔的《加州的群山》建立英汉平行语料库,进行语言对比和翻译研究。采用兰卡斯特大学计算机语料库研究中心的CLAWS网络版词性赋码器对原文语料库文本进行词性标注;采用中国科学院计算所的汉语词法分析系统(ICTCLAS)进行中文分词、分句和词性标注。从高频词、词长分布、词汇密度等方面分析文本的语言特征。其次利用Wordsmith6.0对原文语料库进行检索,获得散文的词频等信息,统计显示散文中共有91002个形符,8223个类符,标准化形符/类符比为47.72。共2677个句子,平均句长为33.99。

通过语料库检索软件wordlist功能检索出原文语料库中第一人称单数代词"I"位列词频表第14位,属于词频最高的人称代词,表明文本的写作视角为第一人称“我”,即作者个人的视角进行描述;再检索系动词"is"词频,发现is在词频表中位居第7位,表明文本以一般现在时为主;介词in、with和on的词频位列第6、12和14位,表明文本中关于时间、地点和方式的环境成分所占比例较大。句子层面的分析证实文本以现在时态为主,体现生态散文的时态特征。

为了解文本的大致情节,通过语料库软件的语境共现(concordance)功能,输入关键词进行带语境的关键词(KWIC)进行检索;再阅读并分析检索词两侧的语境(或上下文),可以大致看出文本的主要情节,文本中的重要信息一般会出现在检索出的主题词表(或关键词表)中较前的位置,通过软件中的wordlist功能,对文本主题词表中的关键词进行检索显示:文本中mountain(s)出现268次,加上53个衍生词mountaineer(s),mountaineering和mountainsides,文本内容如标题所示:描写加利福尼亚地区的山脉;range(s)出现175次,复数形式在文本中专指海岸山脉(Coast Ranges)的专有名词有18处。说明文本重点描述的是加利福尼亚地区的山脉,Sierra出现166次,说明文本对塞拉山的描述着墨较多。再检索Mount,得到更多关于山体专有名词,在文本中出现39次,如加利福尼亚地区的惠特尼山(Mount Whitney),沙斯塔山(Mount Shasta),费尔韦瑟山(Mount Fairweather),圣埃利亚斯山(Mount St. Elias),莱伊尔山(Mount Lyell),里特山(Mount Ritter),安东尼奥山(Mount San Antonio)等出现的频率较高。检索glacier(s)发现有226个索引项是关于glacier(s)的,再加上76个衍生词glaciation,glacial,glaciated,preglacial和unglaciated,说明作者还重点考察了加利福尼亚山区的冰川。检索feet共出现306次,除少数(27次)是描述山脚、人脚、动物的脚以外,绝大多数(279次)都是作为长度单位使用。检索pine(s)共出现232次,说明山区植被以各种松树为主。另外,检索加利福尼亚地区一种特有的树种Sequoia(美洲杉),得到59个检索项,包括Sequoia forests,Sequoia woods,Sequoia groves,Sequoia belt,Sequoia seeds,Sequoia trunks,等等。作者从不同角度详细介绍了美洲杉的地理分布、生长高度、多产性、生长环境、顽强生命力以及耐腐蚀性,等等。

通过对文本关键词表中的词项进行KWIC检索,能够快速抓住文本中关键词的语境信息,从而充分了解文本的主题、时间、地点等重要信息,有助于研究者把握原文本的思想脉络,利于译者在翻译过程中突出这些信息内容。另外,语料库中关于特色词的研究也能反映文本的主题结构和重要思想。

三、《加州的群山》汉译对比分析

对语料数据的采集和统计属定量研究的范畴,而对统计结果的描写、分析和解释则离不开定性的因素。大规模原文与译文的语料能够为翻译研究提供丰富的数据,在翻译研究对象的确定、语料选择、数据描写、分析和解释方面都需要定性的方法。而语料库翻译研究的目标则是从描写出发,最终达到对翻译现象的解释和预测。如果描写的不够充分,就不能对翻译现象做出合理的解释;同样,解释的深度不够的话,也就不能进行合理预测与广泛应用。翻译研究中始终关注描写与解释的有机结合,某种语言现象的产生一定是受到该语言系统内部相关因素的影响和制约,翻译过程中要充分考虑该语言现象在源语和目的语中表现形式的异同,进一步拓展研究和视角,使研究结论更加客观科学。充分考虑现有语言学理论和翻译学理论对具体翻译现象的解释力,从更广泛的视野对其进行解释,对各种不同的看法产生新的判断与取舍。

翻译过程中,译者经常要对某些语篇的结构进行调整。英语中的背景信息与叙事信息通常混合在一起,而汉语中一般分开处理,所以要根据具体的叙述的方便而适当调整。“在评估译文时,首先要看是否功能对等,尤其是经验功能对等,如果元功能不对等,就要对译文进行多层面的分析(从文化语境、意识形态等较高层面到词汇语法层面),找出功能不对等但又是合格译文的理据。”[1]

“语篇中主位的推进模式体现作者的写作思路和目的。”[2]对原文主位推进模式的分析有助于译者准确理解其语言元功能,在译文中尽最大努力保持并实现其元功能的准确传达。一般情况下,各个语言成分都具有相对固定的位置,但是为了突出某个成分的功能而将其移到句首,就形成了标记性主位。标记性主位通常具有特殊的语篇功能,分析它能够帮助我们准确理解语类文体特征。

统计显示,原文本中代词为主位中心语的句子有435个,普通名词或专有名词为主位中心语的有1167个,介词短语为主位的有417个,句子为主位的有166个,另有454个复项主位。“英汉小句主述位结构有相似之处,但更多的是差异,通过主述位结构的对等和调换可实现英汉小句的等效互译。”[3]首先实现信息结构的对等,然后达到功能对等。以句子主位为例,最常见的是主从复合句的从句(修饰)前置形式,原文语料中的数量较多。语料库中以all that、one、that和what引导句项主位的句子共23个,该句型主要表示关系过程,过程动词以be为主,少数为enable、seem、come等动词。

(1)All that we have seen here enables us to see…

在这里所看到的一切使我们很清楚地看见……

动词enable表示关系过程,主位部分可以译成名词词组“所看到的一切”,原文主句中的过程动词译为与主位中动词并列的结构,因此译文与原文主位成分不一致,语义也略有差异。

(2)What benefit to the tree,directly or indirectly,is all this wealth of color of the autumn?

秋天丰富的颜色对树木有什么直接或间接的好处吗?

主句中过程动词be汉译时一般译为关系动词“是”或“有”。主位部分汉译时移到述位部分,由原文中的述位部分充当主位成分。

(3)What the limits of its developments in the future may be…,it is not easy to guess.

很难猜测未来发展还存在什么局限性……

该句属于倒装的投射小句,为了强调动词guess的内容,将其前置到句子开始位置作标记性主位成分。汉译时也基本保持了原文的语篇形式,将guess的内容前置。

总之,当英汉小句的主位结构信息分布出现差异时,在英译汉中译者应适当改变英语的主位结构以符合汉语的表达习惯,对比汉译句中的主述位结构分布,从中找出其恰当的汉泽方法及翻译规律所在。对于本文所研究的生态文学文本而言,为了使描写更加生动有力、贴近自然,原文作者采用标记性主位来增强语言表达效果,能够给读者留下更加深刻的印象。汉译时为了保持语篇形式上的对等,译者首先要考虑在主位结构方面与原文保持一致,而根据译文语言习惯所做的结构调整,主要是为了满足译语读者的阅读习惯,实现译语读者心目中的顺畅自然。

四、结束语

从语料库的创建到具体语言信息检索,各种数据信息一目了然,可以看出语料库方法不可替代的优势,尤其对词汇、短语和小句层面的检索方便快捷,词汇层面包括高频词、词长分布、词汇密度、关键词以及特色词等方面特征。语料库手段为生态文学作品的研究提供了一种新的角度和思路,用真实的语言数据展示了作品的生态图景和作者的生态思想。

[1]黄国文.翻译研究中的“元功能对等”[J].中国外语,2014(2):97-102.

[2]胡壮麟,朱永生,张德禄,等.系统功能语言学概论(修订版)[M].北京:北京大学出版社,2005.

[3]习海宇,李慧燕.从英汉小句的主述位结构看英汉小句翻译[J].湖北函授大学学报,2009(4):147-138.

The paper analyzes the translation features of The Mountains of California written by John Muir with the help of corpus.Corpus-based literary analysis will draw a more convincing conclusion.This new method will be more objective and more reasonable if combined with traditional literary appreciation and criticism.

corpus;The Mountains of California;eco-essays;translation strategies

H059

A

2096-000X(2016)19-0072-02

2015年度黑龙江经济社会发展重点研究课题(外语学科专项)“基于语料库的十九世纪美国生态文学汉译研究”阶段性成果(编号:WY2015127-C);2015年度黑龙江省哲学社会科学规划项目“系统功能语言学的十九世纪美国生态散文汉译语料库研究”(编号:15YYD05)。

王雪玲(1975-),女,黑龙江讷河人,英文博士,五级副教授,主要研究方向为英语语言学与英汉翻译。

猜你喜欢
汉译词频语料库
《李尔王》汉译的序跋研究
《语料库翻译文体学》评介
25年来中国修辞研究的关键词词频统计*——基于国家社科与教育部社科课题立项数据
西方译学术语的汉译现状与思考
基于COCA语料库的近义词辨析 ——以choose和select为例
谈谈柯尔克孜语中“bay”、“-bay”和“bek”、“-bek”的汉译
基于JAVAEE的维吾尔中介语语料库开发与实现
词频,一部隐秘的历史
以关键词词频法透视《大学图书馆学报》学术研究特色
汉语音节累积词频对同音字听觉词汇表征的激活作用*