语料库在科技论文摘要翻译中的应用

2016-11-26 17:22
小品文选刊 2016年20期
关键词:词频语料库长度

王 培

(成都理工大学 四川 成都 610000)

语料库在科技论文摘要翻译中的应用

王 培

(成都理工大学 四川 成都 610000)

随着我国建设创新型国家战略的逐步深化,科学技术的发展成为必然趋势。科技论文摘要对科技论文的传播极为重要,但是由于我国在该领域的研究时间不长,因此科技论文摘要的英译存在许多问题。本文基于现代语料库的技术,通过自建小型语料库,从词汇和句法两个方面对科技论文摘要中的词频及平均句长进行了对比和分析,并得出结论。

语料库;摘要翻译;常见错误

1 引言

随着科学技术的发展,科技英语以及科技论文在世界上发挥着越来越重要的作用。为了满足科学技术交流的需要,论文摘要的翻译也日益重要。由于科技英语的研究历史短,因此翻译质量参差不齐,对国际技术交流造成了一定的障碍。本文在对科技论文摘要的自建小型语料库的基础上,对15个译本的类符形符比、词频和平均句长进行了对比分析,并利用这些数据,分析了科技论文摘要的常见翻译错误。找出这些常见的错误,可以帮助我们更好地翻译文摘。

2 科技论文摘要和语料库简介

2.1 科技论文摘要的定义。作为科技论文主要观点的集中概括,科技论文摘要是科学研究的发展呈现,是理解科技成果的捷径。对于许多科技工作者而言,他们会先接触到摘要,然后才是科技论文。学术文摘在学术界不容忽视。摘要翻译的规范化将有助于学术界的国际交流,也有利于扩大中国科学成就的影响。

2.2 科技论文摘要的特点

摘要的特点包括规范性、简洁性、具体性和完整性。

首先,科技论文摘要采取正式的风格,要求严谨。其结果是,摘要中的句子是完整的,用词是规范的。此外,标准术语取代了缩写词和古语词。其次,摘要要求简明扼要,有示例和对比。此外,在摘要中应使用一些单词来连接上下文,使上下文简洁紧凑。 第三,每一个概念和论点都应该是具体和不同的。在摘要中,法语和拉丁语应该用来替代词的多义词。最后,摘要本身应该是完整的。有些读者会用摘要来进行研究,因此,完整性是很重要的。

英语摘要的长度应控制在100到150个单词之间。冗长的翻译将导致内容累赘,而过于简短的内容又无法概括摘要的信息。在科技论文的摘要翻译中,广泛应用被动语态和无生命的主体,因为可以强调摘要的客观性,并突出摘要所要表达的信息。

2.3 语料库的定义。在语言科学中,一个语料库是一个书面文本或转录的语音,可以作为语言分析和描述的基础。作为一个电子数据库中文本的集合,语料库的定义是电子数据库,但由于其种类繁多也带来许多疑问。

以下是一些语料库的定义:在《语料库、一致性和搭配》中,辛克莱指出,主体是一个自然发生的语言文本集合,用来表示一种语言的状态或变体。通常的假设是,存储在一个语料库的语言是自然发生的,它是根据明确的设计标准和大脑中的特定目的,来代表所选语言的较大数据块。通常情况下,语料库处理的是自然、真实的语言。斯塔布在《单词和词组》指出,语料库是一个集合的文本,为一些特定的目的所使用,通常是教学或研究。一个主体不是一个说话者所做或知道的事情,而是一个研究者所建构的东西。它通常是许多不同用户的行为记录,并用来进行研究,以便我们可以对典型的语言使用有新的认识。

语料库可以分为多种类型,如:一般/平衡/核心语料库;专业语料库编译构建语言模型和语言处理:训练语料和测试语料库;编制区域或社会语言学变异研究:方言语料库,语料库的语料和区域、非标准语料库等。语料库语言学中有许多基本的概念,如:类符(被看作是代表所有与它类型相同的一类符号);形符(被视为一个单独的具体符号,而不是作为一类相同的符号)等等。

3 建语料库在常见翻译错误中的应用

本文在对科技论文摘要的自建小型语料库的基础上,对15个译本的类符/形符比、词频和平均句长进行了对比分析,并利用这些数据,分析了科技论文摘要的常见翻译错误,减少了主观性,便于对科技论文摘要的常见翻译错误进行分析,而且发现常见的错误也可以帮助我们更好的翻译文摘。

3.1 平均句长。在面对具有鲜明文体特征的原始文本时,我们应该考虑翻译过程中是否再现了文体特征。在一个词中,文体分析可分为四个部分:句法结构、词汇、语音和语篇结构。本文只分析了句子的长度,这是句法的基本层次。通过分析不同翻译版本的平均句长,可以发现翻译的文体特征。

让我们运用Wordsmith软件对15个译本的平均句子长度差异进行分析。根据WordSmith的统计功能,作者提取了其中三个语料库,经过分析后发现,针对相同的原文,15位译者都有自己的翻译版本。其中两个版本中的句子属于长句,但语料库有巨大的差距,这应该引起我们的注意。根据显示的信息,作者发现,原文是5句,128个字,平均句子长度为25.6;Amy的翻译为7句,156个字,平均句子长度为22.2;David的翻译是9句,168个字,平均句子长度为18.6。在对统计数据进行分析后,作者发现两个学生的翻译版本都比原来的文本长。因此,两个版本都不接近原文,没有考虑到摘要翻译的特点,因为英语摘要的长度需控制在100到150个单词之间。

3.2 词频。作者用AntConc从处理过的文本中提取高频词,然后分析词频,从而对词语的使用情况进行分析。通过分析数据作者发现,在David的翻译中,“他”一词出现了四次,“一”这个词出现了三次。摘要有一个明显的特征,就是客观性。但是,在这15个翻译版本中,作者发现有13个人使用了“我”。科技论文的摘要是为了陈述事实,因此,译者应尽量避免使用第一人称,防止因个人主观性而影响论文的客观性。

4 结语

本文在对科技论文的摘要和语料库进行简单分析后指出了科技论文摘要翻译中的常见错误,并在对科技论文摘要的自建小型语料库的基础上,对15个译本的词频和平均句长进行了对比分析,从而减少了主观性,便于对科技论文摘要的常见翻译错误进行分析,从而使研究更具科学性。作者也认为,摘要有其自身的翻译特征,语料库在科技论文摘要翻译中的应用将有利于译者的翻译。

[1] 何安平,《语料库语言学与英语教学》。北京:外语教学与研究出版社,2004年

[2] 黄昌宁,李涓子著,《语料库语言学》。北京:商务印书馆,2002年

[3] 钱多秀,《计算机辅助翻译》。北京:外语教学与研究出版社,2011年

王培(1992.02-),女,汉族,陕西榆林,硕士研究生,成都理工大学,英语笔译方向。

G232

A

1672-5832(2016)08-0263-01

猜你喜欢
词频语料库长度
基于语料库的清末民初日源外来词汉化研究
绳子的长度怎么算
《语料库翻译文体学》评介
词汇习得中的词频效应研究
爱的长度
汉语阅读中词频与注视时间、跳读的关系
长度单位
词频,一部隐秘的历史
语篇元功能的语料库支撑范式介入
汉语音节累积词频对同音字听觉词汇表征的激活作用*