基于语料库的许渊冲唐诗英译研究

2018-12-28 05:48顾春江
科技视界 2018年29期
关键词:许渊冲词汇量唐诗

顾春江

(无锡城市职业技术学院,江苏 无锡 214071)

0 引言

唐诗作为中国文学的一个瑰宝, 凝聚了中华文明的文化和语言精髓。 唐诗题材广泛、语言精练、对仗工整、 韵律优美, 是所有汉语学习和了解中国必不可少的一环。 在如今全球化大背景下和“一带一路”的广泛经贸交流中, 如何传播中华文化, 如何让更多非汉语为母语的人群了解、 接受并且欣赏中国传统古典诗歌,是一个文化交流中难题,也是一个亟待解决问题。

诗歌是一种特定语境下的产物, 是诗人运用语言(通常是母语)的一种意图表达。 翻译不仅仅是两种语言的转换, 还涉及到两种语境转换, 同时要兼顾源语言和目标语之间的文化、 语言差异。 如何有效翻译唐诗? 如何忠实地传达诗歌内容? 如何在翻译过程中尽量保存原有的意境和韵律? 目前在诗歌翻译界也是众说纷纭, 还没有定论。 因为诗歌本身是一种凝聚了特定文化的高度精练的语言表达形式, 背后包含着广泛而深邃的文化、 历史和语言, 甚至是世界观和人生观内涵。 诗歌统一而又多样化的表现形式同样给与翻译带来了极大障碍。 诗歌创作就是一门语言艺术, 但是诗歌翻译不仅仅是两种语言转换, 从另外一个方面可以看做是一种新的创作。 这里涉及的不仅仅是译者和作者的关系, 还涉及目标读者接受程度。 所以翻译是一个主动性和创造性过程, 但是又不能完全脱离源文本。

1 唐诗英译本

唐诗数量无法界限,甚至连《全唐诗》收录的唐诗也有遗漏。 目前国内流传较广, 影响较大的基本上为孙渚所编《唐诗三百首》以及喻守真版《唐诗三百首》。根据前者为底本的翻译作品影响比较大的是1929 年出版的宾纳( Witter Bynner)与江亢虎合译的《群玉山头: 唐诗三百首》( The Jade Mountain: A Chinese Anthology, Being Three Hundred Poems of the Tang Dynasty,618-906 )。 这部翻译作品成文很早,在西方文学界和翻译界影响最大, 流传最广, 是研究中国文学的必备材料。 而根据后者为底本的翻译作品是许渊冲1988 年所翻译的《唐诗三百首》(2007 年更新)。许渊冲先生是北京大学教授,中国唯一一位精通中、英、法三国语言,并且翻译了大量的中国古典名著,从《诗经》、《楚辞》到近现代的毛泽东诗词等,留下了大量优秀翻译作品。 许渊冲先生的《唐诗三百首》是目前国内翻译界研究中国古典诗词翻译必备材料, 也是目前翻译学研究热点。 这两个版本由于译者身份不同、 文化背景以及翻译理论不同而造成了不同翻译效果。

目前语料库研究方法出现对于唐诗英译本研究提供了一个新角度, 通过数据化分析, 排除主观性个人情感,不再局限于简单诗歌意象、词句、音律讨论,而更加着眼于全局性定性、 定量以及关键词检索分析。这种研究在客观性和全面性方面比传统研究方法更准确, 更具有参考价值。 考虑到这两个英译本所翻译内容繁多, 表达方式多样, 本文随机选取部分对应诗词以及《唐诗三百首》原诗词建立一个微型语料库,以此对两个英译本对比研究。 通过对两个译本词汇长度、句式长度、 词汇丰富度以及独特词等方面来讨论两个译本在翻译策略和翻译风格方面比较, 希望能够对于我国诗歌翻译有所帮助。

2 研究方法

本文讨论的语料库主要来自于宾纳的《群玉山头》(以下简称宾版)和许渊冲的《唐诗三百首》(以下简称许版)。 前者版本电子稿来自于佛吉尼亚大学图书馆在线电子书库的《群玉山头:唐诗三百首》,后者为用OCR 识别软件,转换成电子稿。 首先从许版《唐诗三百首》里随机抽出12 首唐诗英译版本,随后在宾版内找到相应12 首唐诗的宾纳英译版本, 再列出这12 首唐诗中文原版。用文本预处理软件对OCR 识别的文本和网络电子文本进行处理, 方便检索和处理。 随后运用AntConc 软件检索和SPSS 软件进行数据分析。 对于诗歌平行对比分析主要是以诗歌的词(word)和行(line)为对比研究单元。 通过词汇层面和句式层面来研究两个译本翻译效果。

3 研究结果

3.1 词汇层面

3.1.1 词汇量比较

唐诗译本词汇量指的是, 唐诗英译版中词汇出现的数量,相同词汇算一次,不重复计数。 词汇量大小也反映了译本语言多样性, 描述生动性, 以及更加能够准确表达原作内涵和诗歌意境。 通过文本处理软件处理相应电子文本后,对于相同类型(type)词汇忽略其变形(token)算同一个词汇,如makes, made, making 都算作make,只算一次,不重复计数。 统计出12 篇唐诗译本样本中总词汇数量如下:

表1 词汇量统计表

假 设H0:μ1=μ2, 通 过 软 件SSPS 分 析, 发 现p 为0.325, 远大于0.05, 而且通过12 个译本总词汇量分析,许版的词汇量达到了383,而宾版只达到了372,因此从词汇量方面可以看出许版唐诗译本词汇量更加丰富,更能够准确传达丰富诗歌内涵。 这12 首唐诗源文本中文词汇量为421 个,远远大于许版和宾版。这主要是运用英语来对汉语隐含意思进行显化翻译结果。 因为英语中对于汉语翻译不肯完全一一对应, 如唐诗中的“莫”、“非”、“无”等词汇,英文都只能用“not”来翻译。 客观上造成了唐诗源文本中文词汇量要大于英译本。 但是不同译本对于相应源文本阐释力不一样,造成的翻译效果和读者理解效果也不一样。 例如:

例1:王之涣《凉州词》——葡萄美酒夜光杯

许版:With the white grapes the cups of jade would glow at night

宾版:They sing, they drain their cup of jade

许版明显比宾版要长,看上去似乎更加啰嗦,但是许版完美地解释了夜光杯“夜光”的含义,而宾版只是笼统地说了是玉杯, 失去了源文本所表达的奢华和惊艳,以及诗人所希望表达的尽情欢乐、忘却自我情绪。

例2:柳宗元——《江雪》

许版:Fishing in Snow

宾版:River-Snow

例2 中对于柳宗元《江雪》诗标题的翻译,许版不仅仅局限于标题词汇, 而是着眼于整首诗主旨, 更加呼应本诗最后一句话: 独钓寒江雪。 这样翻译更具有概括性和传神性。 宾版标题翻译是简单词汇对应翻译, 从词义表述方面达到了完美呈现, 但缺乏诗歌语言灵动性, 也缺乏中国古典诗歌所倡导的诗意。 因此可以看出许版多意译,宾版多直译。

3.1.2 词汇长度比较

词汇长度在传统翻译研究中是被长期忽略的一个维度, 因为在传统美学和韵律分析中, 词汇长度不是一个特别需要强调和考虑方面。 本文在上面译本词汇量基础上, 剔除重复词汇, 按照单词字母数量来统计两个版本词汇长度, 所有缩写词汇都算作一个单词来处理。

表2 词汇长度统计表

从表2 可以看出, 许版和宾版基本上词汇长度一致, 但是许版对于5 个字母以上词汇数量大于宾版,且词汇长度略大于宾版。 词汇长度数值差异结果反映了两个译者对于翻译源文本处理成目标语时候采取的翻译策略不同, 这也代表了译者的个人翻译风格,也同样造成了译本带给读者的不同阅读体验。 一般来说, 词汇长度跟词汇复杂程度相关, 有些词汇如:unprecedented, 具有较长词汇宽度和较多元音音素(morpheme),一般来说多音节词汇比较长。音节比较长的词汇在读音方面会造成一种声音起伏不定, 造成整首译本诗歌音律的美感比单音节词汇高。

但是另外一方面, 多音节词汇在英文中通常也是比较生僻词汇, 不能为所有普通读者熟知, 因此宾版译本词汇长度低, 词汇难度也同样低, 方便诗歌传播和理解。

例3:李白——《静夜思》

许版:A Tranquil night

宾版:In the Quiet Night

例4:疑是地上霜

许版:Is it the hoarfrost upon the ground?

宾版:Could there have been a frost already?

对于“霜”的翻译,许版用的是“hoarfrost”,而宾版用的是“frost”,这两个词在词典上解释基本上一致,只是“hoarfrost”更具体,更正式。 也就是说许版在翻译总用词词汇长度长,词汇正式,文体更加文雅,接近诗歌原味。 宾版更加简化,容易读懂。

3.1.3 独特词比较

本文运用AntConc 对比分析许版和宾版译本的独特词,得到以下数据:

表3 独特词统计表

许版译本独特词排在前五位的是:Can’t, I’m,Blooms, Riverside, I’ll, 这 五 个 词 占 据 独 特 词 总 使 用次数的47.3%, 宾版译本的独特词排在前五位的是:blowing, lone, China, thought, line,占据独特词总使用次数的48.2%。 从独特词使用数量和含义数量来看,许版译本独特词数量较宾版多, 且含义更加丰富。 另外从独特词前五位的词汇来看, 许版大量出现了缩写。这是许渊冲先生翻译理论——“三美”中形美的重要体现。 许渊冲先生认为唐诗是一种格律诗,不但押韵,而且在形式上对仗。 因此许版译本中, 很少会出现某行翻译超级长,某行超级短,尽量在形式上向唐诗靠拢。这样为了让形式上美观, 有时候就不得不求助于缩写。

例5:许版王维《送别》

电泳结束后,取出凝胶于染色液(甲醇:冰醋酸:水=4:1:5,0.1%考马斯亮蓝R-250)中,并置于摇床上染色40 min。

At Parting

Dismounted, I think with you.And ask what you’ve in view.

“I can’t do what I will; So I’ll do what I will;

另外从宾版译本来看,Bynner 在翻译过程中更多是直译, 对于画面的直白简单描述, 缺乏一种深入表现和情感输送。 如:

例6:孟浩然《夏日南亭怀辛大》——开轩卧闲敞

宾版:And open my window and lie down in peace.

许版:And by the open windows,I lie in the nook fair.

3.1.4 词汇形次比(TTR)

TTR 是词汇类符(type)与形符(token)比,是衡量样本词汇密度常用方法, 可以辅助说明样本词汇难度。一般来说TTR 越高,译者所用词汇变化范围越大。 但是如果样本中功能词(如 a, an, the, of, at)很多,会影响TTR 准确度,因此这里还引入了STTR,即标准化TTR(每1000 个词的TTR 均值处理)。通过软件分析12首唐诗的两个译本,类符和形符比结果为:

表4 TTR 和STTR 统计表

从表4 可以看出,许版的STTR48.71%大于宾版的STTR47.21%,说明许渊冲先生译本比起Bynner 译本在词汇方面运用更多变形。 而TTR 数值中许版比宾版小,说明许版中功能词在这12 个样本中使用频率超过了宾版。

3.2 句子层面

3.2.1 句长比较

一般来说句子长度是指特定句子中单词数量,这跟句子复杂性和正式性有着密切相关。 一般来说,较长句子的语法结构和语意结构也比较复杂。 本文在统计时候, 把唐诗译本一行等同于一句话来统计句子单词数量, 以此获得句子长度。 源文本一个中文字算一个数量单位。 统计结果如下:

表5 句子长度统计表

从上表可以看出,不管是许版还是宾版,译本平均句子长度都远远大于源文本句子长度, 这说明在唐诗翻译中,源语言(汉语)转化成目标语(英语)过程中,由于源语言(汉语)本身存在单个中文含义丰富,能传达更多信息, 因此在翻译中无法满足两种语言的完全匹配, 必然会出现对源语言意义的阐释和转述, 也必然会出现比源语言句式更长句子。 如: 许渊冲先生把“可怜闺里月”翻译为:Lonely women,watching the moon in the chamber,fall in thought.源文本只有5 个词,译本出现了11 个单词,长度远大于源文本。 但是这种翻译准确传达了中国唐诗中独守闺房女子的哀愁, 又用月的形象来进一步类比和强化这种形象。

另外对比许版和宾版,可以清楚看出,宾版在平均句长上大于许版, 长度较大句子在阅读上必然会造成阅读困难和信息传播效率较低, 但是较长句子对于切当和传神表达唐诗内在韵律确是很有必要的。

例7:王勃《送杜少府之任蜀州》

许版:Farewell to Prefect Du

宾版:Farewell to Vice-prefect Tu Setting out for His Official Post in Shu

从王勃这首著名的 《送杜少府之任蜀州》 翻译来看, 首先许版和宾版在唐诗题目上翻译上就显示出了各自翻译风格不同。 许版直接翻译成 “Farewell to Perfect Du”, 在转成目标语过程中,直接进行了意译和简化处理,忽略了“任蜀州”这个含义,因为本首诗是一首送别诗, 诗人所重点表述的是离别愁绪和对朋友祝愿, 因此离别去哪里根本不是诗歌所需要表达的重点。 这样翻译简洁明了,直指重点。 而与之相反,宾版则事无大小把所有内容都翻译出来, 造成了标题比正文还长的倒置现象, 导致读者阅读效率低下, 无法有效把握诗歌主旨。 这首诗许版译本平均句长是6.625,宾版是7.875,后者明显比前者在表述上冗长。 可以看出许版翻译时候,照顾了中国唐诗简洁、紧凑特点,而宾版译本则表现了英语语言所具有的结构复杂, 修饰繁多特点。如那句“无为在歧路,儿女共沾巾”,许版翻译 成 “At crossroads where we bid adieu, Do not shed tears as women do! ”,句式结构贴近于唐诗音律,具有一种唐诗的音律美。而宾版则翻译成“Why should you linger at the fork of the road, Wiping your eyes like a heart-broken child?”, 表述上更加接近于英文表述习惯,对于母语为英语读者来说,更加容易理解,但是丧失了唐诗音律美和简洁美。

3.2.2 句式结构比较

运用AntConc 软件来统计这12 首译本中主从连词(subordinator)数量,分析译本句式的复杂性。 一般英文句式的长句都是通过连接词来扩展和衔接。 中文和英文在句式上一个最大区别就在于, 中文连接词很少,主要通过句间逻辑来串联起来。 而英文句间衔接主要通过连接词来组成一个复杂语义单位。 通过统计许版和宾版主要连词数量和所占总字数比例如下:

表6 连词统计表

从上表可以看出许版在使用连词上面明显少于宾版, 这也另外一方面论证了许渊冲先生翻译美学的具体体现,在翻译中不仅忠实源语言(唐诗)的意思,更加注重源语言语言特点和句式特点, 即句间逻辑关系来串联。 而宾版更加注重英文的表述习惯, 句式比许版复杂。 这钟翻译策略差异可以对比白居易 《琵琶行并序》清楚地看出。

例8: 得阳江头夜送客,枫叶荻花秋瑟瑟。

许 版 :One night by riverside I bade a friend goodbye;

In maple leaves and rushes autumn seemed to sigh.

宾版; I was bidding a guest farewell, at night on the Hsun-yang River,

Where maple-leaves and full-grown rushes rustled in the autumn.

对比分析琵琶行这句翻译, 许版明显使用了汉语逻辑思维习惯, 用分号把两个内在意思关联的句子衔接起来。而宾版则用连接词“where”引导一个定语从句修饰前面的“Hsun-yang River”,整句话构成了一个主句和一个修饰状语的定语从句构成的结构精密、 形式完备的英文句子。

4 研究结论

根据以上研究,我们可以得出以下研究结论:

(1)许版词汇量大于宾版,而且词汇难度也大于宾版,用词更加正式;宾版在阅读上更加具有易读性,并且适合西方人的阅读习惯。

(2) 许版译本在翻译上更贴近唐诗意境和音律要求,形式上也更加整齐。

(3)宾版在诗歌句式方面,多采用长句和解释性词汇,对于阅读难度降低很多,但是句式结构复杂,缺乏唐诗的韵律。

以上这些发现都是通过统计学方式, 从词汇和句式结构方面来理解两个译本异同点。 翻译不仅是两种语言转换, 还涉及到译者文化背景和母语背景。 许渊冲先生在对唐诗三百首进行处理时候, 尽量使用整齐形式和句尾押韵等方式来传达唐诗所特有的词汇、句式和音律的美感。 通过翻译唐诗, 能够让我们国家优秀传统文化走向世界, 在信息化大爆炸时代, 优秀翻译作品更加能够达到信息传播的良好效果。

当然本文研究还只是局限于一个很小方面, 现代语言学、 翻译学和人工智能等快速发展都为翻译发展提供了很多新途径和视角。 如何准确传达信息, 如何更快更有效传达信息也是这个碎片化阅读时代所有翻译作品所需要解决的问题。

猜你喜欢
许渊冲词汇量唐诗
元 日
诗译英法唯一人:许渊冲
春夜讲唐诗记
唐诗里的日与月之争
用词类活用法扩充词汇量
“第三届许渊冲翻译大赛”英译汉原文
唐诗赏读
Receptive and Productive Vocabulary in Language Teaching
折桂令·客窗清明
词汇量测试对语言水平的预测性的实证研究