基于语料库的能源新闻与通用新闻词汇特征比较

2015-07-05 11:10樊筱楠
2015年27期

樊筱楠

摘 要:基于语料库方法, 本文对能源新闻与通用新闻的词汇特征进行了对比分析。研究结果表明,这两个功能相近的文本在词汇特征上存在差异。文章还分析了差异产生的原因,并结合实践最后根据研究结果对今后EPO的翻译实践提出建议。

关键词:语料库方法;能源新闻;通用新闻;词汇特征

1.前言

1.1研究背景及目的。作为一种特殊文体,能源新闻随着能源外交的兴起而不断为人所熟知。在参与国际能源合作与交流活动中,能源文章的翻译更是不可或缺的连接桥梁。尤其是近段时间油价的跌涨沉浮更是让能源新闻翻译这项工作显得异常重要。

中国国际能源舆情研究中心(EPO)是在辅导老师的指导下,由学生管理运营的舆情监测中心。每天,该中心下设的网站部会定点发送转载的能源新闻以及翻译的能源评论文章。该中心不仅为学生及其他人士提供了了解能源新闻的便利渠道,更重要的是,其与中国石油大学(北京)外国语学院的翻译硕士相联系,是学生实习实践的重要平台。

在实际操作过程中,EPO的翻译质量由于种种因素而参差不齐,这不仅大大影响网站的传播质量,更有甚者会降低网站新闻传播的可靠性。因此,在学习了计算机辅助翻译后,本文试图借用CAT软件—WordSmith和ParaConc对比基于语料库的能源新闻与通用新闻的词汇特征,以此希望通过此法提高EPO的能源翻译实践质量,并希望对未来能源新闻翻译有所助益。

1.2研究的新颖之处。通过从中国知网上查阅文献可知,传统的研究大都集中在对于中国《政府工作报告》英译本与美国《国情咨文》原文的用词对比。基于此,在前人研究成果之上,本文独辟蹊径,借用WordSmith软件对比基于语料库的能源新闻与通用新闻的词汇特征,分析得出能源新闻翻译的一般特点,由此弥补此方面的研究空白,并启示EPO能源翻译实践。

2.语料库语言学与翻译研究

语料库语言学是一门结合语言学、计算机科学、认知语言学和应用语言学的新兴交叉学科。语料库语言学为语言学研究提供了一种全新的研究方法,它以真实的语言数据为研究对象,从宏观的角度对大量的语言事实进行统计,然后通过宏观和微观的、定量与定性相结合的分析方法,从中寻找语言使用的规律。自20 世纪90 年代中期以来,许多学者致力于翻译语料库的研究与设计,其中以Mona Baker 的影响最大。Baker 是第一个倡导把语料库应用于探究翻译现象的学者,开辟了一条以语料库方法开展翻译研究的道路,即广泛收集真实的翻译材料,借助现代化的手段建立大型资料库,挑选出各种资料样本进行分析,以此来描述翻译的真实面目和性质,揭示翻译中可能存在的规律,并为翻译操作提供范式(赵晴2008)。

3.本研究使用的语料库

本文是一项基于语料库的研究,所使用的语料库包括一个能源新闻(reuters2014)和通用新闻(flob-news)。其中,能源新闻语料库的规模约为30 万词,收录的是路透社2014年的新闻;通用新闻语料库的规模约为4万5千词,收录的是FLOB的新闻。

4.研究结果与讨论

本文针对文本中词语的总体特征对能源新闻(reuters2014)和通用新闻(flob-news)进行对比,并进行具体分析。将从平均词长、词汇密度、类符形符比、高频词和动词名词化现象五个方面对词语特征进行研究。

4.1词汇密度。词汇密度是指文本中实词在总词数中所占的比例。英语的实义词(lexical word 或content word)指具有稳定词汇意义的词语,与之相对的是功能词(grammatical wor d 或function word),指不具备稳定词义或意义模糊而主要起语法功能作用的词语。根据胡壮麟(2002)对实词和虚词的分类,实词的主组成部分包括名词、动词、形容词和副词;虚词主要包括连词、介词、代词和冠词。词汇密度被认为可以反映篇章的信息容量和難度。词汇密度偏高说明该篇章的实词比例较大,因而信息量也较大,难度也相应增加。相反,词汇密度偏低则说明篇章难度相对较低,容易理解。本文采用Ure(1971)和Stubbs(1986)提出的词汇密度计算方法,旨在通过语料库考察能源新闻(reuters2014)和通用新闻(flob-news)信息量上的差异和难度的大小。

能源新闻的词汇密度比通用新闻高,说明能源新闻信息量较大,难度较高。从实词词数比较情况来看,两者名词、动词、形容词、副词的差异很大,其中名词的差异最大。因此可以把造成两者词汇密度差异的原因归结于能源新闻中形容词较多。经过分析可得出,这是能源新闻专业术语较多所致。因而,能源新闻所传达的信息量较大。

4.2类符形符比。类符形符比(Type/ Token Ratio,简称TT R)是指在特定语料中类符(type)和形符(token)的比率。所谓类符数是指文本一共有多少个不同的词形,而形符数是指文本中一共有多少个词。单纯的类符数和形符数不能反应文本的本质特征, 但两者的比率在一定程度上反映了文本的某种本质特征, 即用词的变化性(杨惠中2002)。一般情况下,超过1,000词的语料要使用标准化类符形符比,即按一定的长度(通常是1,000 个形符)分段计算文本的类符形符比。能源新闻(reuters2014)形符数和类符数远大于通用新闻(flob-news),其标准化类符形符比(43.75)小于通用新闻(47.73)。该差异表明能源新闻的词语变化程度低于通用新闻。由此可知,能源新闻的词汇密度高于通用新闻,难度较大。

4.3高频词比较。词频统计是语料库研究的一个基本统计手段。一般情况下,一个语料库词表中的高频词绝大多数是功能词(或称虚词),实词的出现则表明该实词所指的人、事物或行动等是语料关注的焦点,因此才会被反复提到。

4.4结论。通过以上基于语料库的分析与对比,可以看出能源新闻与通用新闻的文本正式程度相似。此外,能源新闻还具备以下特征:(1)词汇密度较高,所传达的信息量较大,文本难度相应较高;(2)在词汇使用上变化不明显,表明能源新闻的词语变化程度低于通用新闻,能源新闻重复使用难度较高的词语;(3)高频词中实词所占比重较大,说明文章主题明确而且侧重点集中。因此,这便要求译者在翻译能源新闻时首先要明确文章主题,其次要十分重视文中重复使用的专业术语难词。遇到难理解的句子或段落务必请教专业人员。

由于文体的特殊性,能源新闻时常涉及许多专业知识,这便大大加大了翻译难度。此次通过运用WordSmith和ParaConc软件对其与通用新闻词汇特征进行对比,更是印证了这一点。因此,态度认真、勤学多总结对译者而言至关重要。

5.对EPO翻译实践的启示

5.1经常培训。从以上分析可知,能源新闻的词汇密度较高,所传达的信息量较大,文本难度相应较高。由于EPO的翻译实践为能源新闻方向,因此了解此方面的背景知识至关重要。但由于在EPO实习的译者多为文科出身,对与能源相关的知识了解甚少。因此,EPO應该定期聘请能源领域的专家来校对实习译者进行培训。此外,还应邀请上届的实习译者对新进译者进行培训,培训内容可涉及能源知识、能源行业走势、能源文本特点及注意事项等。

5.2建立统一的术语库。从以上分析可知,能源新闻在词汇使用上变化不明显,其词语变化程度低于通用新闻,且经常重复使用难度较高的词语。因此,在翻译过程中,遇到相同术语,14人的翻译有时不尽相同。对此,EPO应该根据大家的翻译文章,建立统一的术语库,并不断更新术语库,这样,不仅能提高译者译文的质量,还能大大提高网站的可靠性。

5.3编写能源翻译规范。自EPO开始运营至今,已走过了几个年头。在这些年里,EPO的翻译实践量已经积攒了很多。因此,老师应该带领实习译员针对平时翻译中遇到的种种问题进行总结,编写翻译规范,并不断更新,让能源翻译在一定程度上有章可循。编写翻译规范不仅能提高老译员的翻译水平,还能帮助新译员迅速提高。

总之,通过CAT软件对比基于语料库的能源新闻与通用新闻的词汇特征不仅能加深对能源新闻与通用新闻的理解,还有助于启发自己的翻译实践。此外,此种研究方法对未来能源翻译有所助益。(作者单位:中国石油大学(北京)外国语学院)

参考文献:

[1] 陈建生,崔亚妮.基于语料库的中国《政府工作报告》英译本词汇特征研究[J].当代外语研究,2010

[2] 何正国,连建峰,史忠志.基于语料库的东盟博览会翻译研究[J]. 文教资料. 2009(14)

[3] 马子恩. 热点事件新闻语料库的研制及词汇研究[M]. 南京师范大学.2012

[4] 卫乃兴.基于语料库和语料库驱动的词语搭配研究[J]. 当代语言学. 2002(02)