语料库在口笔译教学中的应用研究

2017-10-24 01:13宫静萍
湖北第二师范学院学报 2017年7期
关键词:口译语料语料库

宫静萍,刘 萍

(安徽科技学院 外国语学院,安徽 凤阳 233100)

语料库在口笔译教学中的应用研究

宫静萍,刘 萍

(安徽科技学院 外国语学院,安徽 凤阳 233100)

语言学研究上经常使用的语料库,近十几年来已慢慢应用在翻译教学与研究领域,不过仍以欧洲语言的应用为主。本文以英汉、汉英翻译为例,介绍语料库如何应用在翻译教学及研究上。内容涵盖语料库种类、语料库检索工具、各种潜在用途、相关翻译语料库之建构建议,以及设计以语料库为辅之翻译教学课程。

语料库;语料检索;语料标记;以语料库为辅的翻译教学

语料库(corpus)作为学术研究工具,从17世纪的字典编纂、18世纪的圣经研究、19世纪的方言研究,一直到20世纪中期的一般语言研究,已拥有四个世纪的长久历史。1960年开始,电脑运算能力逐渐加速发展,储存媒体的成本不断降低,直接促进语料库的飞快发展,各种大型语料库应运而生,语料库语言学(corpus linguistics)也成为语言学之下一个蓬勃发展的分支,为语言研究及语言教学提供了一项有力的工具。

翻译学作为语言学的相关学科,自然也可从语料库的研究上获得助益。20世纪90年代初期,英国曼彻斯特大学翻译研究大师Mona Baker (1993)首次利用语料库工具分析英译文本中的独特翻译体共性(translation universal),进而在翻译学之下建立了语料库翻译学(Corpus-based Translation Studies简称CTS)分支。之后的十几年间, CTS相关的研究如雨后春笋般大量问世,翻译学的地位也更新巩固。21世纪初期, CTS学者的视角逐渐从单纯的翻译语体研究转为翻译教学及实践研究,期望新时代电脑与语料库工具的结合能够为翻译教学传统及专业翻译实务带来新的助益。许多大学及翻译相关机构开始建立各种实用的翻译语料库,规模也日渐庞大,从百万字扩增至数千万字。欧美国家一些翻译课程里已开始教导学生自建语料库(do-it-yourself corpora),作为字典及网络之外的翻译辅助工具。[1]本文将以口笔译教学与研究为主轴,介绍语料库在这两方面的可行应用方向。

一、语料库与翻译教学

翻译教学过程中,老师或学生经常需要进行各种探索,例如某个字的翻译方法、专有名词如何处理、表达方式、遣词用字的推敲、翻译口吻等等。语料库由于包含了大量的例句,因此特别适合作为翻译查询的辅助工具。本文将以语料库与翻译教学的结合为主题,探讨语料库的种类、语料库查询方式、语料库在翻译教学上的潜在用途等等。

(一)商业语料库

当今学术界里,各种语言的语料库已相当齐全。英式英语的 “英国国家语料库”(British National Corpus,简称BNC)及美式英语的 “美国国家语料库”( American National Corpus,简称ANC)则是英语世界里的两大代表语料库。美国宾州大学主持的Linguistic Data Consortium则是一个非常庞大的语料库建设计划,内容涵盖各种主题及语言的语料库,并且对外贩售,集中语言资源的管理,避免各单位自建语料库而导致资源重叠。现代的电脑商业语料库在规模上均极为庞大,最起码都有千万字以上。在内容方面则大致上有书面语、口语、一般主题及专业主题之分。[2]商业语料库需要付费方得使用,有些语料库极为昂贵,不适合个人购买。大型的商业语料库虽然内容丰富,但用在翻译辅助上并非绝对有帮助。例如查询很简单的nut一字,它有 “坚果”、“螺帽”、“呆子”等不同意思,规模达一亿字以上的若能够使用小型的专业自建(DIY)语料库,在查询上将非常方便。

(二)DIY语料库

自建的翻译辅助语料库,在规模及内容上可由老师、研究者、学生自行决定,依照上课或研究目标建立各式各样的小规模语料库(一百万字以下)。建置上可区分主题、文体、文类、年代、文章困难度等等。刚开始建立语料库时或许感觉费时,需要进行大量的网络搜索、文章分类、文字标注等初步作业,但系统的建立起来之后,后续的工作便只是不断添加内容及语料管理,长远看来依旧有其价值。其实翻译老师的个人电脑里已经有许多现成的语料。学生平日交的翻译作业文档即是一例,老师可以将这些作业收集成为语料库,每次同一篇作业(原文)都有不同学生的翻译版本,妥善收集整理之后便成为一个极为实用的 “翻译作业语料库”,可用在翻译教学及翻译品质的研究上。另外,学生针对一篇翻译作业进行网络查询,搜索到的参考文件也可以收集成 “翻译专业主题语料库”,长久积累之后便是一个相当实用的参考语料库。个别学生本身的翻译作业也可建置成 “个别学生语料库”,方便自我学习及自我风格的研究。自建语料库的文字来源极为广泛。

(三)单语查询

大多数的语料库检索软体均只能进行单语查询,较常用的软体包括WordSmith、Concordance、AntConc、Xaira、Text STAT等等。这些软体均提供基本的查询结果,例如词频表(frequency list)、附前后文的关键词索引(key word in context,简称KWIC)、词频表及KWIC的多重排序方式等等。词频表列出语料库内所有单词的出现频率,可选择依照单词的频率高低或字母顺序进行排序,再择一单词观察其所有KWIC例句。[3]西方语料库翻译学界经常针对单语的翻译语料库(translated corpus)及非翻译语料库(non-translated corpus)进行比较,亦即所谓的 “可比语料库”( comparable corpora),以此研究翻译文字的语体特色,成果丰硕。

(四)双语查询

平行语料库(parallel corpora)的查询,完全依赖源语与译语语料之间是否绝对对齐(alignment)。目前欧洲语言之间的自动对齐准确度已相当高,欧亚语言之间则仍存在自动对齐的技术问题。经过对齐的语料,大致可区分为 “一对一”及 “一对多”的对齐模式。著名的ParaConc平行语料库最多可以进行 “一对三”的显示,亦即一源语对三个版本的译语。分析双语或多语的平行语料库,可以研究翻译技巧、查询翻译对等关系、提供翻译例子、协助学生了解专业译者的翻译策略等等。在商业软体方面,ParaConc不仅可进行最多 “一对三”的显示,还与亚洲语言相容。除此之外,MultiConcord也颇为知名,但不支持亚洲语言。[4]

(五)翻译教学中使用语料库的目的

传统的翻译教学模式,一般而言均是老师决定原文文章之后,交由学生阅读全文,查询生词及相关知识,决定翻译技巧及整体策略,之后再进行翻译。利用语料库工具,我们可以将原文输入语料库,取得词频表之后,再分析前一百个高频词并加以分类,初步了解该篇作业的内容属性,可协助学生拟定翻译策略。以美国奥巴马总统2009年初的就职演说为例,这篇演讲若当成作业,约2400字,学生全部读完需要一段时间,也无法立即掌握这篇重要演说的意境。经由语料库处理之后,我们取得这篇演讲的前一百个高频词,并依词性加以分类,整理成如下表一。

从表1可以看出,同一词类里面不断出现的几个词均有其语用意义,例如代名词的密集使用代表奥巴马总统的就职演说强调与美国民众对话,期望拉近与老百姓的距离,而非只是政策的宣示。几个助动词的使用也代表信念与决心。连接词but、because的使用,代表演讲人的推理及因果解释。各种名词的使用象征团结、共同目标、爱国主义、美国与世界的互动、国际议题、代代相传、勇敢迎接挑战等等。几个形容词的使用目的主要是凸显共同的目标、国家利益、安全、希望等等。整体而言,这篇就职演说强调与民众对话、渴望、希望、挑战、不畏惧、团结、团队精神、国际合作、快速行动等等。这些意涵均可作为学生拟定翻译策略及语气时的参考,在着手翻译之前,对这篇演说已有了不同于传统阅读层面的认同。此外,语料库在翻译教学、实践与研究过程中,也是极具价值的工具,可让使用者找到各种例句及翻译方法,用途相当广泛。

表1 以语料库为辅的翻译作业文本分析

文本:奥巴马2009年总统就职演说稿

分析对象:前一百个高频词

词性字例意涵人称代名词、所有格代名词our,we,us,you,they,those,their口语化文本情态助动词will,can,must信念、决心连词but,because转折、解释名词nation,America,people,world,gener⁃ation,spirit,crisis,men,peace,power,courage,economy,father,force团结、共同目标、爱国主义、美国与世界之互动、代代相传、挑战、勇气……形容词new,common,grea⁃ter,long共同目标、国家利益、国家安全、希望……动词do,let,work,know,meet,seek行动、信心、与敌人对话……时间副词today,now,time,day,forward紧急行动、把握时间整体翻译重点:口语、渴望、希望、挑战、不畏惧、团结、团队精神、全球合作、快速行动……

翻译语料库提供各种工具及方法来分析翻译作品(product),以此可了解翻译过程(process)。以连接词but的汉译为例(表2),根据研究,原文100个含but的句子里,有高达91.5%会被翻成 “但是”;其他被翻成 “但是”的英文连接词还有however、and、yet等等,合计十七种。由此可以看出,许多连词均会让译者想到 “但是”,而非只有but或however。此外,根据相同的研究,在汉译文本中使用 “但是”的句子里,有83%可在原文中找到相对应的连词,17%是译者需要自行添加。这种连词明朗化的现象,说明译者在翻译过程中的主动性。

表2 汉译文本中 “但是”一词之原文

对等词百分比及明朗化现象分析

原文对等词出现频率百分比%but72591.5however354.4and70.9yet60.8其他(13词)192.4合计(17词)792100沿用自原文79283明朗化(译者自行添加)16217合计954100

综上所述,在翻译过程中使用语料库的方法,对翻译品质及效率之提升均有一定程度的助益。在翻译研究中,语料库之使用亦让我们发现平常不易观察之现象,对翻译过程之了解也具备一定功能。

二、以语料库为辅的翻译教学

语料库结合翻译教学的发展,至今已有十几年的历史,也慢慢形成所谓的 “以语料库为辅的翻译教学”(Corpus-assisted Translator Training;简称CATT)。[5]在此一背景下,世界各国的主要翻译系所及组织纷纷建立自己的翻译语料库,作为教学及研究的工具。结合CATT的翻译课程是未来的发展趋势,笔者从翻译教学及研究角度出发,认为以下三种语料库是值得追求的方向。

(一)专业笔译、学生笔译语料库(Corpus of Professional and Trainee Translators;简称CPTT)

CPTT的建置可采 “外译汉”及 “汉译外”双向语料的方式,内容包括由专业译者及学生译者完成的各种主题译文及其原文,同时开发专用的双语语料库检索软件,并且必须做好原文及译文的语料对工作。在语料本身的标注方面,可加入多层次的注记,例如基本文本资料、词性、学生档案、专业译者档案、翻译错误标记、创意译例、翻译技巧等等,目的在比较专业译者与学生译者的技巧及文本处理方式之差异。此类语料库在教学方面可以让学生了解及学习专业译者的译笔功夫,在研究方面可以分析两类译者的差异类型,以寻找出最有效的教学方式。

(二)专业口译、学生口译语料库(Corpus of Professional and Trainee Interpreters;简称CPTI)

CPTI的设计架构类似CPTT,只是将笔译语料改为口译语料,但其技术复杂程度却更高。首先是口译内容的正确书写,这是极为繁琐、耗时的工作。目前虽然有电脑自动书写工具可供使用,但准确度高低不一,仍必须依赖人工进行修正工作。口译语料完成之后,必须与原文对齐以方便查询。检索介面也必须提供各种查询口语语料的功能,例如原文及译文的倒转及快转同步、关键词检索、随机点选播放等等,以方便进行双语比较或是专业口译与学生口译之比较。另外,口译语料若经过完整的标注,例如停顿点、口译员修正、重复、、语气等等,将有利于口译策略及风格之研究。

(三)专业文本语料库(Corpus of Specialized Texts;简称CST)

随着国际化及网络时代的来临,翻译的专业性也日渐提高,任何一篇等待翻译的文本均有一定的困难度。CST的内容设计以单语语料为主,强调语料的广度及深度,涵盖各式主题,分类详尽,并具备即时更新的功能。CST犹如译者的随身图书馆,可随时提供最贴切、恰当的译文建议,减少译者在网络搜索引擎上的查询时间。例如译者在翻译 “固话客户”一词时,初步的直觉翻译或许是 “fixed line customer”,但经过查询CST之后,可获得 “wireline customer”、“landline customer”这些更专业的翻译建议。对于译者译入外语时所欠缺的语感,CST特别有帮助。

三、结语

本文介绍了语料库在翻译教学与研究上的一些应用方式,期望为翻译学术界引介一个极为实用的工具与资源。笔者认为语料库应该成为翻译课程中的一环,让学生及老师均具备语料库的操作及应用能力。老师可以在作业设计上加入语料库内容,鼓励学生以个人或小组方式自制语料库,协助翻译作业的完成,并以此提倡自主学习的习惯。翻译系所的学生在数年的求学过程当中需要完成许多作业,这些都是现成的翻译语料,如果经过妥善的收集、分类、标注,必可为翻译教学过程带来更充实的学习素材。在研究方面,翻译语料库的建构也可作为硕士、博士论文研究的材料,无论是研究翻译共性、教案编写、教学研究、译例分析、翻译策略等等,均是极为可行的应用方向。

[1]丁信善. 语料库语言学的发展及现状[J].当代语言学, 1998, (1):4~7.

[2]廖七一. 当代英国翻译理论[M]. 武汉: 湖北教育出版社, 2001:395~396.

[3]Biber, Douglas. Corpus Linguistics 1998 [M]. Beijing: Foreign Language Teaching and Research Press, 2000:16.

[4]谢应光.语料库语言学与外语教学[J]. 外语教学与研究, 1996, (3):45~47.

[5]杨惠中.语料库语言学导论[M]. 上海: 上海外语教育出版社, 2002:333.

A Corpus-assisted Approach to Teaching Translation and Interpretation

GONG Jing-ping, LIU Ping

(College of Foreign Language, Anhui Science and Technology University, Fengyang Anhui 233100, China)

Machine-readable corpora have been widely used in translation research and teaching for more than a decade, although the application is dominantly prevalent in the translation of European languages. Drawing on examples from English-Chinese and Chinese-English translation, this paper provides an overview of how corpora can be used in the teaching and researching of translation. The discussions center on types of corpora, concordancing tools, potential applications, suggestions on building do-it-yourself translation corpora, parallel concordancing, use of corpora in translation teaching, and the development of a corpus-assisted translation curriculum based on three purpose-built corpora.

corpus;concordancing;part-of-speech tagging corpora;corpus-assisted translation curriculum

H315.9

A

1674-344X(2017)7-0029-04

2017-06-03

安徽省教育厅人文社科专项项目(SK2015A784)

宫静萍(1986-),女,安徽蚌埠人,助教,硕士,研究方向为翻译与英语教学。 刘 萍(1967-),女,安徽宣城人,副教授,硕士,研究方向为英语教学。

责任编辑:陈君丹

猜你喜欢
口译语料语料库
基于归一化点向互信息的低资源平行语料过滤方法*
美国法庭口译制度研究及启示——以夏威夷州法庭口译为例
《语料库翻译文体学》评介
略论笔译与口译的区别
基于JAVAEE的维吾尔中介语语料库开发与实现
口译认知构建中的概念整合——以总理记者招待会的古语诗词口译为例
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
论心理认知与口译记忆
语篇元功能的语料库支撑范式介入