摘 要:语料库的不断发展和完善,对不同语言的研究以及与其有紧密联系的翻译批评产生巨大的促进作用。翻译批评是指在一定的社会发展状况下,通过某种翻译准则和翻译方法对翻译作品、翻译现象进行的评价。具体而言,就是通过翻译标准或标准译本对翻译作品进行衡量、分析和评价该作品翻译内容的翻译方式、翻译技术、翻译手段和翻译现象。翻译批评过程集合了翻译批评的主观性和客观性,翻译的主观性是指对翻译作品的感性表达,比如作品的可读性和整体印象都属于直观的感受。本文基于此从语料库对翻译批评研究的重要作用着眼,重点分析探究了适用于翻译批评研究领域的语料库的目的、流程以及具体方法。对于语料库的相关应用情况进行了深入探讨,同时对于语料库在翻译研究中的下一步發展方向和前景给予了期望。
关键词:语料库;翻译批评;应用
翻译主体的主观能动性是与生俱来的,对翻译作品进行翻译批评而产生的主观答案会随着翻译主体的背景不同而改变,翻译的主观性评价实际上是历史的现实表达和文本的直观感受,在翻译批评过程中或多或少会带有翻译主观性的色彩,这是翻译批评者打上的情感烙印,也可以是区分其他翻译批评者的标准,在翻译标准和理性思维的压制下,翻译的主观性虽然无法完全避免,但可以在一定程度上缩小,而翻译的客观性在这一方面尤为重要。在客观视野下,评论要全方位且多层次,避免以偏概全,同时,通过科学的采集实例和选取语料,以有效论证例证的科学性和必然性。本文基于此种模式,采取主客观相统一的评价方法,挖掘翻译语料库对于文本属性的价值。本文从适用于翻译批评研究的语料库建立开始,阐释分析了语料库如何在翻译批评研究中发挥具体作用。
一、翻译批评语料库的建立
语料库研究专家认为,在从事翻译批评相关领域的研究,当对翻译文本进行分析研究时,语料库是最为行之有效的探究方式,而研究语料库因溯本求源,将语料库本身作为研究的开端。语料库作为一个系统的语料体系,包含语料内容组织方法[1]。
(一)设立研究目的
翻译批评语料库的设计目的,决定了语料库的研究方向,是指通过语料库来解决怎样的难题,它在整个过程中占有十分重要的地位,对接下来的步骤有重要的指引作用,其决定了如何选取语料以及如何设立标注。从本文的研究实际来看,研究立足于两种英译本,通过翻译准则和对比的方式来统计英译本的语言特征,并以客观化的视角来看待两种英译本,在两种英译本之间分析,谁具有口语化的特点,或者哪一本更加适合舞台表演等问题的研究。
(二)搜集语料库
适用于翻译批评领域的语料库从其来源分析,一般有两种类型,其一是翻译文本的全译文,其二是选取翻译文本的局部进行译文的选择抽样,在选择翻译文本时通常应关注翻译者、翻译文本是否具有一定的范例性和样板性,当完整翻译文本的搜集难以完成时,通常需要对翻译文本进行临时随机的抽取样本,抑或是依据此次的研究目标实行人工抽取样本,譬如,挑选翻译文本中的一些代表篇章,或是将分析文本拆分成许多个短篇,再从每一个短篇中二次抽取样本,另外,还可依循翻译文本的具体内容和表现特征有机联系所探究的翻译问题方向进行挑选,抽取样本的手段务必前后一致保持连贯性,并且做到在很多个翻译文本中保持使用同样的一整套抽取样本的方式,只有如此才能确保语料库具有合理的可比对性与科学的严谨性[2]。
(三)将语料电子化
收集语料之前要正确分析和认识语料的特征,考察其是否具有广泛的代表意义,同时最好囊括全文,将原语文本和英语文本进行电子化收录。随着万物互联,语料进行电子化后,可以通过互联网进行下载,扫描仪也可以对语料进行精准识别。将语料进行电子化主要有以下三种常用的方法:依靠人工键盘打字输入、实物文本扫描输入以及依据网络资源进行电子文本搜集。第一种方法是最为传统、耗费时间最长且效率极低的电子化方式,现如今只有在面对稀世孤本和不再版的对象文本时,因为文本的存世数量极为稀少且传播范围非常有限,故而只能依靠对象文本的所有者和实际使用者采用手动输入的模式进行语料电子化。第二种实物文本扫描输入通常被图书馆、博物馆以及从事语言翻译研究的个人工作者广泛使用,具体做法是将对象文本进行人工扫描操作后,再应用电脑光学字符的专业识别软件,如OCR等软件进行计算机辨识,最后经过人为的校对后,方可成为方便使用的电子化文本[3]。第三种电子化方法是直接使用已经在互联网上存在的电子文本数据库,通过使用搜索引擎的查询,检索到相关的网络页面,再下载对象文本,譬如,现今闻名全球的开放电子文本资源库有古藤堡文本库计划,以及国内电子图书馆的电子文本数据库等。翻译批评研究领域的学者或相关工作者都可以通过这些网上文本资源库寻找到大量可用的对象文本资源。
(四)语料库的预编辑
原始的语料资源只有进行预编辑后才能转变为成熟的可用语料,预编辑往往由三个阶段组成。其一是将对象文本进行去噪处理,其二是将对象文本进行分词处理,其三是将对象文本进行对齐。文本的去噪是指将对象文本进行二次的纯文本电子化处理,一般是指将已经做好电子化的对象文本,即Microsoft Word文档中的语料经过处理保存到以“Unicode”编程的TXT文档中。需要去除原始对象文本中多余重复的格式以及非文本部分,如图片、标注等,对象文本经过转化格式和人为的核准检查后,便可成为TXT格式的纯文本语料库资源。第二种对象文本的分词处理具体是指,应用汉语分词处理和英语分词处理两种分词处理模式,其中,汉语分词处理一般使用贴合国家标准规定的中科院ICTCLAS专业分词软件工具,此软件有科学严谨的汉语分词算法准则,另外,开放的汉语分词应用软件还有IKAnalyzer、汉英分词应用程序,盘古分词应用软件、庖丁中文分词库等[4]。与汉语分词方式相比,英语分词的模式较为简便,常用的英语分词应用软件有Wordsmith、Lueene等,以及应用空格来作为间隔符使用的分词器Whitespace等。第三种方式将语料库里对象文本内容为目标,对其进行章段对齐,文篇对齐,句式对齐以及词汇对齐,而具体的操作手段又分为人为对齐模式和应用软件对齐模式,人为对齐模式相对而言重复枯燥、效率低下,最好能够采用软件对齐,现如今市面上有多种类型可供选择的对齐类应用软件,例如,雅信软件的对齐应用插件和学人翻译软件的双语对齐工具等[5]。
(五)语料的标注
语料文本分为两类,第一类为自然文本(natural texts),第二类则为标注后的文本(annotated texts)。而标注后的文本也称为赋码,具体而言,就是对语料的内容进行丰富,通过添加注释、类码对语料进行信息解读。当中标注分为两类,第一类是类赋码(tagging),通过对文本词形的考察和分析,附上相似的词语;第二类是指句法标注(parsing),对文本中的句子进行解析,分析出句子建设的结构和方法,并在文中标注出来。
语料库的标注通常由相关的应用软件完成,汉语的语料标注一般可参照国家语委语料库,该库是以句子的模式组成。在实际研究中,现如今大量使用的英文标注体系是COCOA,其优势在于能够利用应用软件设置标注,并且在最终呈现时,可以将其隐藏。
本文所研究的英译本是没有经过任何标注的自然文本,但是为了调查该英译本的口语化程度以及目的,对文中具有代表性的三个动词进行赋码。
二、通过语料分析软件统计相关指标
Wordsmith是一款语料分析软件,其功能齐全并具有极强的计算功能,主要作用是对新闻语料进行处理,面对繁杂的语料和数据,能够在一定期间内完成词语的检索和统计,有效辅助了文本研究,对于分析和了解语言特点具有强大的解释功能。
(一)形符、类符、类符/形符比、平均词长平均句长
形符是指在新闻与新闻之间,西文与西文之间的空格中的连续字符,构成词语。而类符是指在语料库中有着不同的数量,通过计算类符在形符中的占比,可以计算出比值,从而有效识别语料的出现次数和频率,得出其重复程度,从而可以计算出词语的丰富程度。
一般而言,如果平均值较长,则说明在文本中使用的长词和难词的数量比较多,引出文本的结构难度大。如果平均句比较长,该文本具有浓厚的书面化特点且结构十分复杂,反之,如果平均句较短,文本则十分简单、结构单一、口语化[5]。
例如,学生创作了一篇600词的英语文章,在此文本素材中,如若使用了200个完全不同的词汇,那么这篇文章的类符数即为200。而如果另一名学生的600词的英文文章中使用了300个词汇,则可以表明此文的词汇量大于第一篇,很可能可以从侧面证明第二名学生掌握的词汇量要远远大于第一名学生。类符/形符比是指一个对象文本的类符与此文本的形符的比值关系,标准化类符/形符比是指按特定的长度分次计算对象文本的类符/形符的比值,然后最终计算出来的平均值。例如,设定长度是1200,那么首先算出第一个1200词的类符与形符的比值,随后算出接下来的1200词的类符与形符的比值,接着算出第三个1200词的类符与形符的比值,重复之前的步骤直到最后1200个词(所剩不足1200词的忽略不计),最终再算出它们的平均值,这个结果就是此文本的标准化类符与形符的比值。其作用在于能够详细地反映出不同对象文本的词汇量与使用语言的实际状况。
(二)词频
词频是指各种类符在对象文本中的出现频率,作用主要在于观察和对比不同词汇的使用频次,抑或有利于下一步更为庞杂的统计工作,例如,搭配水平与搭配的显著性分析等。从翻译批评来说,有些高频词汇的使用可以直接反映出作者或译者的遣词特点。
(三)宾语从句中that的省略
调查并重置的省略情况,可以有效比较文本之间的口语化,本文通过对文本进行标注,对省略后的情况进行了统计和分析。然而,将语料库纳入翻译批评研究的具体应用范畴之中还有很多问题是亟待解决的,譬如,现阶段还无法顺利实现基于语音方面的针对源语对象文本、目的语译本间语言节奏方面的掌控探究;而翻译语料库在语法使用结构分析的细节处理和文章结构类型的实践分析中,还存在一系列的欠缺和空白。
除此之外,在进行文本的单独量化分析研究时务必要结合质性考量,必须互相协助,特别是不能让语料库的优势遮蔽了用于不断探寻的眼睛,忽视在翻译批评研究中,尤其是在文学翻译批评研究过程中,质的考量通常比量的变化更为关键。因此,在接下来的研究中重点解决以上问题,对于推进语料库在翻译批评研究中深入应用发展,具有十分重要的前瞻性和实践意义[6]。
三、语料库在翻译批评中的应用
?语料库在翻译批评研究的具体应用中,常常被用来探究翻译者的翻译风格,原始语言的特征类型,译文特征风格以及翻译后文本与原文本语言的特征对比,同一部原始语言相同的文本在不同翻译者的同一目的语译后文本的具体表现形式等。这里研究的对象包含:词汇使用频率密度,句式类型长度,以及词汇语法,句型特征等,这种蕴含多视角、全方位的对比评价有利于深入理解翻译者的认知水平、翻译方针与社会历史背景、文化视角等翻译领域的宏观场景问题,接下来以《论语》译文的语料作为示例进行分析。
(一)句法结构
根据风格突出、特征显著的源语文本而言,翻译批评视角下的文本探究可以分为从小到大的三个层面,第一个层面是词汇、第二个层面是句型结构、第三个层面是文章结构,在这里仅以句型结构里面重要的应用数据,也是检索资源的关键参数——称为关别选取亚瑟·韦利、辜鸿铭以及理雅各三名不同的出色翻译家的译本,将三人在译本中的句子长度进行统计,其中,亚瑟·韦利的平均句长为14.61,辜鸿铭的平均句长为33.94,理雅各的句子长度为19.56。而从以一个数据句长标准差显示:亚瑟·韦利的标准差值为10.92,辜鸿铭标准差值是31.48,理雅各的标准差值為17.26[7]。从以上数据可以看出,英国汉学家亚瑟·韦利翻译文本平均句长最短,而辜鸿铭翻译文本平均句长最长,同时,句长标准差可以表明不同长度句子在整个文本中的存在分布特质,差值越大,表明句子长度的波动范围越大,在三个不同的翻译文本中,亚瑟·韦利的翻译作品中句长标准值差值最小,则说明他在翻译过程中,广泛应用了较为精炼的句式和短句,而辜鸿铭的翻译作品中大量采用了语法更为复杂的长句。
(二)关键词
在语料库进行查询检索文本数据时,有一个相当重要的应用数据,也是检索资源的关键参数——称为关键词(key word),而分析关键词是为了更好地将语料进行比对研究,从而找出在翻译文本中词汇有哪些具体的分布特征,其中,包含以下情况:第一,词汇的使用频率,具体可以得知哪些是高频词,哪些是低频词。第二,词汇所表现出的布局差异是否有显著的外部表象特征和象征意义。第三,词汇是否具有明显的重要性属性等。
四、结语
以上介绍的例子可以看出,语料库在翻译批评中的实际应用方式,能够用于研究同一年代的不同译本特色甚至译者的自身风格,有利于分析探究一些翻译现象,例如,针对一个原语单词的不同解读和思索。
本文分析梳理了构建能够适用于翻译批评研究领域的语料库的建立流程和其在翻译批评领域的具体应用,应用语料库的各种优势为翻译批评研究服务,能够帮助研究者用科学严谨的视角客观地把控原文的风格特征,让翻译者从风格方面着手通过一系列科学合理的分析、对原著作与译作进行全方位、多角度的比对研究探索。另外,对语料库的深入理解能够让研究者敏感地发掘出文本的语言使用风格和细节风貌、通过对语言习惯特色的偏差和开拓性的发掘、描绘,以及拆分解读,使翻译批评的研究行为更加基于客观理性的科学分析和判断,防止主观意识的随意武断评价产生。
参考文献:
[1] 房宇华,熊松涛. 语义韵研究在翻译批评中的应用——以《红楼梦》中“早 + 动词”结构英译为例[J].齐齐哈尔师范高等专科学校学报,2019(2):80–83.
[2] 王汐. 語料库批评译学视阈下的《道德经》英译本性别意识研究——以人称代词的显化为例 [J]. 重庆理工大学学报(社会科学版),2018(4):142–152.
[3] 康啸. 中文音乐文论中术语翻译研究——以近十年中文学术期刊英文目录为对象[J].中国音乐学,2018(2):127–137.
[4] 吴偲.美国当代英语语料库COCA在自主翻译学习中的应用探索[J]. 现代交际,2018(7):210–211.
[5] 程树华,等.基于语料库的定性定量分析在阿育吠陀词汇梵—拉—英—汉四语词典编纂中的翻译应用[J].攀枝花学院学报:综合版,2019(4):66–74.
[6] 季娟.汉英双语平行语料库在大学英语翻译教学中的应用研究[J].湖北开放职业学院学报,2019(16):169–170+180.
[7] 殷小娟. 《论语》四个英译本中“仁”的翻译效果对比[J]. 宜春学院学报,2012(9):113–116+119.
作者简介:王唯怡(1982—),女,汉族,重庆人,重庆工商大学派斯学院外国语学院讲师,硕士,研究方向:翻译学。