自建语料库的汉英翻译新闻词汇特征分析

2018-07-07 02:11:28
天津大学学报(社会科学版) 2018年4期
关键词:情态分词语料

(天津大学外国语言与文学学院,天津300350)

随着科学技术的发展,语料库翻译学作为一门新兴学科迅速发展起来。语料库翻译学为研究翻译、语言特征提供了新的视角。它以语言理论和翻译理论为研究上的指导,以概率和统计为手段,以大规模双语真实语料为对象,采用语内对比与语际对比相结合的方法,对翻译现象进行历时或共时的描写和解释,探索翻译的本质[1]。

英国曼彻斯特大学的Mona Baker较早采用了以语料库为基础的分析方法。1993年,她发表了第一本关于语料库翻译学的著作《语料库语言学与翻译研究:启示和应用》。同年,国内的杨惠中教授发表了《语料库语言学与机器翻译》一文,开启了国内语料库研究的篇章。此后,语料库研究方法逐渐开始在语言特征、译者风格、口译等方面得到广泛运用。以语料库为基础的词汇分析主要集中在宏观词汇特征、微观词汇使用、词汇搭配、语义韵等方面。王克非利用北外“通用汉英对应语料库”对翻译汉语不同于原生汉语的词汇特征进行了分析[2]。武光军通过对比2011年我国政府工作报告和美国国情咨文,提出我国政府工作报告应当增加动词、小词等词类的使用[3]。覃梅通过分析汉语新闻翻译及英语新闻翻译的特征,验证翻译共性是否在英汉两种语言中普遍存在的问题[4]。朱一凡和胡开宝以“被”字句为出发点,对比了其在新闻汉译语料和原创语料中的语义韵差异[5]。

一、 研究目的及步骤

1. 研究目的

借助语料库技术,以英语原语新闻为参照语料,以翻译新闻为观察语料,一方面验证Baker等人提出的简化等翻译共性,另一方面在对比中找出汉译英翻译新闻的不足之处,提出解决措施,以期提高英语翻译新闻的水平,在新闻方面增强对外宣传能力。

2. 研究步骤

为了将汉英翻译新闻与英语原语新闻进行对比,收集了78篇国内新闻、78篇国内新闻的英语翻译(translated English news,TEN)、78篇同样内容的英语原语新闻报道(non-translated English news,NTEN)。新闻类型广泛,涉及政治、经济、文化、科技、社会等多种题材。翻译新闻和原生新闻均来自权威网站,其中翻译新闻来自爱语吧双语新闻、中国日报、Global times等网站,原生新闻来自dailymail、BBC、mirror等网站。

基于上述材料,笔者自建了两个小型单语语料库,第一个语料库包含翻译新闻,共计20 159个字,第二个语料库包含原生新闻共计17 474个字。

第一步,将这两个文件转为txt文本,命名为TEN.txt和NTEN.txt。

第二步,在线用CLAWS7软件对文本进行词性赋码,将赋码后的文本分别复制到新建的两个word文档、两个文本文档中,命名为Tag-TEN.docx、Tag-NTEN.docx、Tag-TEN.txt、Tag-NTEN.txt。

第三步,利用word文档的“查找”功能找出某一词性的词(如用_N查找名词)的个数,除以文档总字数得到这一词性的分布比例。利用wordsmith分析TEN.txt、NTEN.txt、Tag-TEN.txt、Tag-NTEN.txt,得到文本的总体特征参数,并形成词频表。

二、 汉英翻译新闻词汇特征

1. 总体特征

类符形符比(type/token ratio, TTR)是衡量文本语言复杂程度的标准之一。类符指语料中不同词的数量,形符指语料中所有词的数量。类符形符比比值越高,语料复杂程度越高。但由于一定时期内语言的词汇量是有限的,即类符是有限的,而形符却随着文本大小的变化而变化。文本越长,形符越大,在类符一定的情况下类符形符比越小。因此,比较规模不同的语料库时,常用“标准类符形符比(standard type/token ratio, STTR)”作为衡量标准,即计算文本中每1 000词的形符类符比。利用wordsmith 4.0的统计功能,得到翻译新闻和原生新闻的数据(见表1)。

表1 翻译新闻与原生新闻总体特征对比

这些指标反映了文本的词语变化[2]。由表1可知,相比原生新闻,翻译新闻的STTR值较小,但与原生新闻的差距仅为0.4,这表明翻译新闻的词语丰富度虽然低于原生新闻,但差别并不十分明显。这一情况可能是由于本语料库中的翻译新闻均选自国内英语学习权威网站,翻译质量受网站审校人员的严格把关,且一些网站,如China Daily等均有英语母语者作为审校人员,因而译文水平有所保障。从STTR标准差来看,翻译新闻STTR的离散程度要高于原生新闻,表明国内不同网站的汉英翻译新闻词汇丰富度参差不齐,差别较大,而国外网站的用词普遍比国内网站较为丰富。

许伟指出,常见文本的平均词长为4左右,如果远低于4,意味着文章的语言比较浅显,如果高于4,意味着文章的语言比较复杂深奥[6]。由表1可知,翻译新闻与原生新闻的平均词长均为5,说明两类文本都有一定的阅读难度。这一情况可能是因为两个语料库的语料均出自国内外知名网站,如China Daily、mirror等,这类网站的译者或记者的语言应用能力强,文章质量也较高。但翻译新闻与原生新闻的平均词长仅比常见文本的平均词长高出1个字母,说明两者都在保障文章质量的同时,考虑到了新闻的文体特征,不使用过于复杂的词汇,满足读者的阅读需求。

Halliday指出,词汇密度也是衡量文本复杂程度的一项指标,反应了文本包含的信息量。采用Michael Stubbs提出的计算词汇密度的方法,即计算实词形符包括动词、名词、形容词、副词在总形符中的比例。用CLAWS 7软件对翻译新闻和原生新闻进行词性标注后,对照CLAWS 7 POS Tageset词性赋码集,利用word的查找功能计算出两个文本的词汇密度(见表2)。

表2 翻译新闻与原生新闻各类实词频率对比

Ure指出,词汇密度(实词在总词数中的比例)在口语表达中一般低于40%,在书面文本中则高于40%[7]。而根据UE.COM,词汇密度在60%~70%之间的可视为词汇密度高的文本,在40%~50%之间的词汇密度相对较低。由表2可知,翻译新闻和原生新闻均为信息量高的文本。翻译新闻的词汇密度略低于原生新闻,支持翻译共性假设中的“简化”特征。

2. 动词特征

(一) 时态

由表2中的“差”一栏可知,翻译新闻与原生新闻各类实词最明显的差异在于动词的使用。进一步根据CLAWS 7 POS Tageset词性赋码集的动词分类标准,检验各类动词的频率,其中翻译新闻和原生新闻差异最大的前五位动词(见表3)。

表3和表4综合反映了翻译新闻与原生新闻在时态、情态动词运用方面的差异。“动词过去式”代表一般过去时,“过去分词been”代表完成时(过去完成时和现在完成时),“动词原形”一方面与“情态动词+动词原形”的结构有很大关系,另一方面也体现了一般现在时、to不定式的使用,“will”和“would”代表将来时。由表中数据可知,翻译新闻与原生新闻都以一般过去时为主要时态,且两者之间一般过去时的差异最大。返回翻译新闻与原生新闻文本中发现一般过去时的例子如下。

表3 翻译新闻与原生新闻各类动词频率对比

表4 翻译新闻与原生新闻情态动词频率对比

例1 翻译新闻:Pictures alongside her post showed the textbook featured not only illustrations of the reproductive organs and of two people having sex, but also portrayed discussions about sexual harassment.

原生新闻:The book initially came to public attention when a mother took a picture of her child’s book, where a woman says to a man: “Can you show me your penis?”

例2 翻译新闻:…while others welcomed what they said was a long overdue infusion of sex education in the country.

原生新闻:But many people also objected to this criticism, arguing that this was an advanced move for China’s sexual education.

例1中,翻译新闻用3个过去式动词描述了一位妈妈因儿童性教育课本“尺度太大”在网上发声的事情,在原生新闻中,作者则用一般现在时的定语从句引出了课本的内容,前者强调事件发生的时间,后者强调事件的客观真相。例2中,翻译新闻同样用了两个过去式动词表明网友对此的态度,而原生新闻在用过去式动词表明一部分人的态度时,用现在分词进行进一步解释说明。

(二) 情态动词

由表3可知,情态动词的差异居第二位。进一步将情态动词细化可得表4。

情态动词中“would”使用频率差异最大,经笔者检验,翻译新闻和原生新闻中都只有一个would like短语,其余的would均表示过去将来时。这表明原生新闻过去将来时使用较多,而翻译新闻一般将来时使用较多(由“will”一词的差别可知)。其次差异比较明显的是“could”。这表明,翻译新闻使用情态动词would和could较少。

(三) 现在分词

由表3可知,翻译新闻与原生新闻在现在分词的使用上也有较大差异。现在分词表示主动,表达主语与谓语之间的关系。日常交流中,语言使用者由于默认动作发出者与分词表示的动作之间的主谓或动宾关系,简化了句子结构。这种构句方式依靠的是内在的语义或语序,是一种意合的隐形衔接[8]。当现在分词在句中充当表语时,句子表现为依靠系动词构成的显性衔接;当现在分词充当定语、状语以及构成复合结构(即动词短语)时,句子表现为隐形衔接。经过筛选,排除动名词以及非现在分词的词(如steven hawking中的hawking),翻译新闻与原生新闻的现在分词分布(见表5)。

表5 翻译新闻与原生新闻现在分词对比

由表5可知,翻译新闻与原生新闻都呈现出显性衔接与隐形衔接相结合的特征。翻译新闻中现在分词作表语的百分比与原生新闻基本相同,现在分词作定语、状语、构成复合结构的百分比比原生新闻高出0.1个百分点,表明翻译新闻的意合程度高于原生英语新闻。这一现象可能是由于翻译新闻受到翻译源语的干扰而出现的。反观翻译新闻存在现在分词的句子及其对应的汉语,发现有很大一部分都是汉语中的“连动句”见例3。

例3 翻译新闻:User @Liulangxiaowu agreed, noting that “teenagers would otherwise resort to other improper methods, including watching pornography, to get the information if we hold back appropriate sex education all the time.”

汉语新闻:另一位名为“流浪小屋”的用户则表示赞同,表示:“如果不适当进行性教育,孩子们很可能会另辟不恰当途径,比如看色情片等来获取相关信息。”

汉语新闻用“赞同”和“表示”两个连续的动词表示网友的观点,而翻译新闻则把后一个动词化为现在分词,作为伴随状语在句中出现,表现出隐形衔接的特征。

三、 结 语

用语料库手段结合语料库分析软件对比分析翻译新闻与原生新闻之间的差异,可以使我们从大数据中了解翻译新闻的不足,进而改进国内新闻翻译。通过系统研究,得出以下几点结论:第一,翻译新闻和原生新闻的阅读难度都适中,符合读者的阅读需求;第二,相对原生新闻而言,翻译新闻具有简化特征,表现为词汇密度略低;第三,翻译新闻情态动词使用不足、时态使用较为单一、受翻译源语影响意合特征比较明显。在此基础上,国内新闻的译者应注意以上差别,继续保持现有新闻的阅读难度,从词汇入手,使用多种情态动词和时态,逐步提高翻译新闻的质量,达到预期的宣传效果。

但值得注意的是,翻译新闻与原生新闻之间的差异并不悬殊,表明我国外宣翻译文本,特别是新闻翻译,质量已经有所保障,有利于对外宣传。在以后的研究中,研究人员可建立更大容量的语料库,系统研究我国翻译新闻的各类特征,进一步找出差距,为树立中国形象、让世界认识中国、了解中国打下良好的基础。

[1] 王克非, 黄立波. 语料库翻译学的几个术语[J]. 四川外语学院学报, 2007(6): 101-105.

[2] 王克非, 胡显耀. 基于语料库的翻译汉语词汇特征研究[J]. 中国翻译, 2008(6): 16-21,92.

[3] 武光军.基于语料库的我国《政府工作报告》英译本的语体特征分析[J].西安外国语大学学报,2014,22(4):118-121.

[4] 覃 梅. 基于语料库的汉英新闻翻译变体特征对比分析[D]. 重庆:西南大学外国语学院, 2015.

[5] 朱一凡,胡开宝.“被”字句的语义趋向与语义韵:基于翻译与原创新闻语料库的对比研究[J].外国语:上海外国语大学学报, 2014,37(1):53-64.

[6] 许 伟. 平行语料库在翻译批评中的应用:以培根Of Studies的不同译本为例[J]. 外语研究, 2006(2): 54-59.

[7] Ure J. Lexical density and register differentiation[C]// In Perren G E, Trimm J L M.ApplicationsofLinguistics:SelectedPapersofthe2ndInternationalCongressofAppliedLinguists. Cambridge:Cambridge University Press, 1971: 443-452.

[8] 任东升, 马 婷. 基于语料库的《水浒传》沙博理英译本意合句式研究[J]. 外语研究, 2015(1): 64-70.

[9] 赵秋荣,肖忠华.基于语料库的翻译研究:现状与展望:第四届“基于语料库的语言对比与翻译研究”国际学术研讨会综述[J].中国翻译,2015,36(2):69-71.

猜你喜欢
情态分词语料
情态副词“说不定”的情态化研究
表示“推测”的情态动词
表示“推测”的情态动词
结巴分词在词云中的应用
智富时代(2019年6期)2019-07-24 10:33:16
基于语料调查的“连……都(也)……”出现的语义背景分析
值得重视的分词的特殊用法
华语电影作为真实语料在翻译教学中的应用
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
高考分词作状语考点归纳与疑难解析