基于语料库的非物质文化遗产文本翻译方法探究

2021-03-01 08:59赵丽丽宋欣阳
文化学刊 2021年1期
关键词:中英文语料语料库

赵丽丽 宋欣阳

非物质文化遗产是人类口耳相传、世代延续的无形文化遗产,鲜活地扎根于民间,主要表现为人们的生活方式和生产方式,因此被誉为历史文化的活化石。非物质文化遗产维系着不同族裔、群体的文化特性和集体记忆,也反映着文化的多样性和人类的创造力[1]。非物质文化遗产的翻译研究对于更好地展现和对外宣传我国的传统文化具有重要意义。也正是由于非物质文化遗产文本中蕴含着大量文化因素,使之翻译也面临着巨大困难。如何在非物质文化遗产翻译的过程中尽量保留中国传统文化的元素,同时确保外国读者能够有效理解,是译者亟需解决的难题。

一、研究背景

作为一种新的研究范式,语料库翻译学为传统的翻译研究注入了新的活力,已成为目前翻译研究的新方向和新趋势。英国著名的翻译理论家蒙娜·贝克(Mona Baker)在1993年发表的论文中首次提到语料库的研究方法将会对翻译研究带来直接的影响,并诠释了语料库用于翻译研究的理论价值及其应用价值;1996年,她将语料库翻译学作为全新的译学研究领域正式提出[2]2-3。自此,语料库翻译学的研究在国内外发展迅猛,主要体现在多种大型的翻译语料库先后建成并投入使用,相关的语料库翻译学的论著相继出版,同时亦有大量研究论文在学术期刊上发表[3]。综上,基于语料库的相关研究已给翻译研究领域带来了很大影响,成为该领域研究的最新趋势和发展方向,这也为非物质文化遗产的翻译研究提供了新的视角。但就语料库翻译研究而言,目前仅有个别学者将非物质文化遗产的翻译与语料库结合起来,指出了语料库对非物质文化遗产的翻译研究的重要意义,并对相关研究提出了一定的建设性意见。由此,整体而言,我国对于非物质文化遗产的翻译研究尤其是基于语料库的非物质文化遗产的翻译研究和成果尚少,有待进一步深入[4]。

二、研究方法

为保证非物质文化遗产文本的翻译质量,可利用语料库技术,利用现有语料建设汉英平行语料库,对汉英文本的语言特点进行对比分析,从而得出可供参考借鉴的翻译方法。利用语料库对非物质文化遗产的翻译进行研究,在科学的数据统计和分析的基础上推导出具有实用性的翻译方法和原则,从而提升文本的翻译质量,具有较强的可行性和可靠性,有助于最终实现翻译目的[5]。

(一)语料采集

创建一个语料库的关键在于所选语料是否适用于建立相应的语料库,其中包括语料的学术性和语料的质量。在此原则下,创建翻译语料库时,所收录的译文应该是名家译作或知名出版社出版的翻译文本或权威机构发布的译文[2]69。就非物质文化遗产的翻译而言,目前仅有数种图书资料译介了非物质文化遗产。其中,《中国的非物质文化遗产(中英文版)》(2011年版)一书为“十二五”国家重点音像出版规划项目、首批国家出版基金资助项目,由多名专家学者组成专业编写团队,使之成为非物质文化遗产翻译的可供参考的权威译本。因此,本研究选取该著作为语料来源,旨在以此建立汉英平行语料库,并得出可供参考借鉴的翻译方法。

(二)语料降噪

语料降噪指对所获取的语料进行文本处理,去除语料中多余的字符或影响语料对齐的公式、图表等,以提高语料库统计分析的效用[2]74-75。以《中国的非物质文化遗产(中英文版)》(2011年版)一书为例,由于所获取的为PDF格式的文件,因此首先需要使用ABBYY等软件将其转换为可以编辑的Word格式。而后,由于文本中包含了大量图片等内容,可先将其另存为txt格式,仅保留所需的文字部分,并进行人工校对,使中英文文本的内容相对应;然后再应用Microsoft Office或Em Editor等文本编辑软件进行降噪处理,使得文本的内容和格式等都达到相应规范,符合语料库的语料要求,从而提高语料质量。

(三)语料对齐和标注

在对语料进行降噪处理之后,便可选用对齐工具进行语料的英汉对齐,以便之后的统计研究。本研究采用Tmxmall工具将文本进行了中英文的句级对齐,在自动对齐的基础上进行人工对齐,以保证对齐的质量,完成后导出为exl、tmx、txt等格式保存[6]。在将文本进行降噪及对齐等处理后,可用Corpus Word Parser等软件将中文文本进行分词和词性标注,使用TreeTagger等软件将英文文本进行词性标。在此基础上,中英文语料可用于进一步的对比研究,从而得出可供参考借鉴的翻译方法。

三、研究结果与分析

使用WordSmith软件中的词表功能对语料进行统计分析,得出中英文文本的相关数据。其中,类符(types)表示文本中词的种类,形符(tokens)表示文本中的总词数,类符/形符比(Type/Token Ratio,TTR)的作用是说明词汇变化和丰富程度,标准类符/形符比(Standardized Type/Token Ratio,STTR)可在一定程度上反映文本中词汇的变化情况[2]27-28。对比可知,非物质文化遗产的原文本,即中文文本的总量和词汇变化程度均高于所翻译出的英文文本,这也在一定程度上说明原中文文本的词汇表达更为丰富,而原文的文化独特性在翻译过程中有所丧失(见表1)。

表1 WordSmith软件中的wordlist统计数据

使用ParaConc软件对中英文文本进行对齐、检索和分析,研究译者所采用的具体的翻译方法。由于非物质文化遗产中蕴含大量文化元素,本研究从两个角度入手分析译者的翻译策略:一是选取非物质文化遗产的项目名称,二是选取汉语中特有的四字表达(包括但不限于成语)。

一方面,从非物质文化遗产的项目名称的翻译来看,对于中文特有的表达,译者主要使用了“直译+释义”的翻译方法,如“安塞腰鼓”鼓译为Ansai Waist Drum Dance,“昆曲”译为Kunqu Opera,“那达慕”译为Naadam Festival等,“苏州评弹”译为Pingtan、a Form of Storytelling and Ballad Singing in Suzhou Dialect,“太极拳”译为Taijiquan、Traditional Chinese Shadow Boxing等。不难发现,dance、opera、festival等单词的添加,以及对“评弹”“太极拳”等信息的补充说明使得译语读者可以更好地理解项目的形式,从而便于理解该项目的内容。

另一方面,检索得出汉语文本中特有的四字词语之后,选取其中蕴含文化因素的表达的翻译,译者主要使用了归化的翻译策略,即对原文进行了灵活处理[7]。如“孟姜女的故事家喻户晓、妇孺皆知”一句翻译为the story of Mengjiangnv is a household name,“家喻户晓”与“妇孺皆知”两词翻译为household一词;“评话的内容多为金戈铁马的历史演义和叱咤风云的侠义豪杰”一句翻译为The content of Pinghua covers mainly historic romances and sages,“金戈铁马”与“叱咤风云”作为修饰词在译文中被省略。由此可见,由于原句中并列成语的意思相近或属于次要信息,在翻译成英文时均作简化处理,这样更符合英文的表达习惯,从而使得英文文本的词数和词类较之原文本有一定的降低。

从以上分析可得出,译者在处理非物质文化文本中的文化因素时,若中文中特有的专有名词英文中不存在相关表述,翻译时主要采用直译(音译)的方法,同时补充相关信息,帮助译语读者理解;若是中文中特有的成语或叠词等表达,翻译时主要采用归化的翻译方法,即灵活使用意译、省译等方法,其目的是更符合译语读者的阅读习惯,降低阅读难度,从而便于译语读者更好地了解各非物质文化遗产项目。

四、结语

本研究探索自建非物质文化遗产小型汉英双语语料库的方法,并对中英文文本进行对比分析,得出可供借鉴的翻译策略和方法,可为其他非物质文化遗产文本的翻译提供参考。需要指出的是,本研究中所建设的语料库的语料仍需不断扩充,进一步研究的重点应为在大量语料的基础上提取术语,从而指导其他相关文本的翻译实践,同时进行更为深入的翻译方法和策略研究。只有如此,才能真正将语料库技术应用于非物质文化遗产文本的翻译工作中,确保非物质文化遗产翻译的外宣效果,助力中国文化的对外宣传。

猜你喜欢
中英文语料语料库
基于归一化点向互信息的低资源平行语料过滤方法*
《语料库翻译文体学》评介
本刊可直接使用的常用缩略语中英文对照表
本刊可直接使用的常用缩略语中英文对照表
APPITA 2015年第2期中英文摘要
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
APPITA 2013年第4期中英文摘要