宁波舟山港港务翻译语料库的建设及应用

2017-04-09 19:10翟红
宁波职业技术学院学报 2017年5期
关键词:港务西班牙语语料库

翟红

摘 要: 作为中小型专用语料库,宁波舟山港港务翻译语料立足西班牙语与汉语双语交互,旨在为港务翻译及国际交流提供便利。从港口规划、港口投融资、港口经营、港口物流、港口引航等港务活动的书面语中采集语料,并对其进行中西互译,从而形成“一次建库”;在港务交流活动中,有意识地将上述港务活动的口语表述直接吸收入库,从而完成“二次建库”。通过“一次建库”与“二次建库”的共时性研究,可以发现同义港务语料在口语与书面语中的差异化表述,以便为口笔译翻译者提供更加专业、规范、流畅的翻译文本,有效提升港务翻译的服务水平。

关键词: 宁波舟山港; 港务; 语料库; 西班牙语

中图分类号: H34 文献标志码: A 文章编号: 1671-2153(2017)05-0069-04

宁波舟山港是我国大陆重要的集装箱远洋干线港,是国家的主枢纽港之一。2015年,宁波舟山港货物吞吐量达到8.89亿吨,连续7年位居世界港口第1位;集装箱吞吐量首次突破2000万标箱,排名跃居世界港口第4位。2016年,宁波舟山港成为全球首个货物吞吐量突破9亿吨大港(相当于安特卫普、鹿特丹、汉堡三大欧洲主要港口吞吐量总和)。随着我国“一带一路”发展战略的全面展开,宁波舟山港亟需在现有国际港口合作的基础上,进一步推进与北非、欧洲、拉美地区的港务合作与业务交流,全面构建对外开放的新格局。在新的历史机遇下,我们立足宁波舟山港港务运营实际,创建以西班牙语和汉语为交互基础的双语翻译语料库,旨在通过对该语料库的使用和管理(如计算机存储检索、编辑处理及统计分析),为翻译工作者提供更加专业、规范的翻译文本,有效提升港务翻译的服务水平。

“语料库”可通俗理解为语料的仓库或语料的集合。作为专业术语的语料库是指为某一个或多个应用而专门收集的、有一定结构的、有代表性的、可以被计算机程序检索的、具有一定规模的语料的集合。但其与原始语料集合(文本数据库)的不同之处,乃在于语料库在语言文本之上还标注有语法、语义、语音、语用等语言信息。(1)因此,本文所称的宁波舟山港港务翻译语料库乃是基于宁波舟山港港务实践活动而产生的、为满足港务翻译需要而收集的、标注有西班牙语与汉语语言信息的港务用语集合。

一、建库规划及语料来源

目前,国内尚无有关港口实务的西班牙语翻译研究,更无涉及此领域的专用语料库。因此,本文提出的宁波舟山港港务翻译语料库首先应定位于中小型专用语料库,唯有该区域内中西港务活动日益活跃,带动语言文化交流趋于丰富,才可能实现该语料库的体量扩充及功能完善。因此,宁波舟山港港务翻译语料库的建设划分为两期。“一次建库”所收集的语料来源于汉语、西班牙语书写的有关港口实务的法律档、专著、期刊及其他印刷品,此可谓“书面语优先原则”。其在建库方式上可选择“积木法”,即仿若搭积木一样,可将某个语料库按照一定标准分为若干部分,每一部分对应一个专题,称之为语料库的一个子库。而这些子库互补交叉,整体上归并为目标语料库。而“二次建库”所收集的语料则来源于中西港务交流活动中的口语表述,此可谓“口语补充原则”。其在建库方式上可采用“原型法”,即从创建一个较小规模的语料库出发,其在结构及定义事项上均与目标语料库完全一样,此称为目标语料库的原型,其后再以滚雪球的方式逐步扩大原型语料库的规模而形成目标语料库。有学者认为,口语的采集、转录费时、费力,采用“原型法”建库有利于尽快见效、减少错误和提高开发效率。(2)本文认为,在语料库建设中可综合采取上述方法,即通过“积木法”先行划分出各子库专题,再在各子库建设中采取“原型法”逐步扩展库容,随着子库语料素材的日益丰富,原语料库的内容也将更为充实而逐步形成目标语料库。

二、一次建库:以書面语为中心

根据中国《港口法》,本文乃将港口规划、建设、维护、经营、管理及其相关活动界定为港务活动。因此在宁波舟山港港务翻译语料库的“一次建库”中首先运用“积木法”将港务活动划分为港口规划、港口建设与维护、港口物流、港口经营与管理、港口引航等5个子库(见图1)。每个子库的每一语料都由中西雙语构成,在录入方式上可以借鉴英国伯明翰大学英语系语料库语言学中心建设的中英翻译语料库的设计思路,通过建设中西双语对齐的语料库,提取翻译单元。

为方便计算机检索,目标语料库的逻辑结构可定义为:

子库名l(语料记录号1,元数据1,元数据2,……,元数据N,语料形式1,……语料形式n)

……

子库名n(语料记录号n,元数据1,元数据2,……,元数据N,语料形式1,……语料形式n)

这里的子库名即指港口规划子库(以代码G表示)、港口建设与维护子库(以代码J表示)、港口物流子库(以代码W表示)、港口经营与管理子库(以代码L表示)、港口引航子库(以代码Y表示)。语料记录号则是保证语料信息唯一性的重要标识。按照语料库设计的完整性要求,每个语料信息须有一个区别于其他信息的记录号,以便于计算机检索和统计分析。作为中小型专用语料库,此处的记录号可仅采用流水号标记(既用于唯一标识,也可直观统计出现有语料库的实际容量)。(3)元数据就是采集语料的直接表达,此处将元数据1对应为汉语,元数据2对应为西班牙语。语料形式就是一条语料在语料库中存在形式,此处将语料形式1作为书面语(以代码S表示),语料形式2作为口语(以代码K表示)。本文认为,西班牙语港务翻译语料库“一次建库”时只采集书面语,“二次建库”时再采集完成相关口语表述,而未来随着西班牙语港务翻译语料库的逐步完善,还可考虑载入图片、音频、视频等多种语言表现形式。

例如,在“一次建库”中,可将“港口规划子库”中某条语料定义为:

G(000001,港口规划是指根据经济与社会发展的要求,合理制定港口发展战略、发展目标和发展方向,对未来时期的港口布局及建设等作出综合部署和全面安排,是建设、管理港口的基本依据,Según los requisitos de desarrollo social y económico, la planificación portuaria se contiene elabarados razonablemente la estrategia, el objetivo y la dirección de desarrollo, y se realiza el despliegue integrado y el plan completo en ámbitos de distribución y construcción portuaria en períodos futuros, que es la base fundamental de fundación y gestión del puerto, S)。

从理论上说,语料库语言学可以检测各种语料的特征,如词频、语法构造、语篇模式、共现、词汇密度等。(7)特别是宁波舟山港港务翻译语料库作为类比语料库,同一语料可能包括源语言文本(口语或书面语)、口译文本、笔译文本。翻译工作者可借助该语料库对中西口笔译的特点展开研究,即结合现有翻译理论研究和该语料库的数据分析,可以发现港务翻译口笔译往往存在以下差异:

一是口译存在间断性停顿。往往在主旨演讲、欢迎致辞等语料中,口译停顿较多,而笔译完全通过标点符号来表示语义,不存在间断性停顿。究其原因,一方面,可能是被动性停顿,即因为口译者追随演讲人、致辞人语言表述的停顿而停顿;另一方面,可能是主观性停顿,即口译者因为自身语言转换、斟酌用词、回忆话题等而发生的停顿。后者某种程度上显示出口译者在实践能力上仍有需要改进的空间。

二是口译对源语言隐喻、隐射、引申性话语的处理较为模糊。因为在口译中,留给翻译人员的时间较少,来不及完全领会源语言的内在含义。例如对中文中的成语、歇后语、一语双关等语言现象的诠释,显得较为犹豫、模棱两可,甚至从字面直译而发生语义乖谬。但在笔译中,翻译人员有较多时间可以查阅资料,对源语言文本的理解可以更为全面和准确。

三是口译中存在自我修正的现象。由于口译中对人名、数字、专有名词、地理和国家名词、单复数表达、隐喻及引申表达等理解可能难以第一时间作出完全准确的语言转换,因此,翻译人员往往在后续翻译过程中,主动、故意对先前的翻译词句进行重述,便于受众获得更为恰当的理解。但在笔译中,完全没有这样的纠偏空间,一旦译文既定,就会构成翻译失误。

四是口译中存在顺句驱动现象,即按照原文顺序,将所听到的句子切成若干意群,再用口译技巧将这些片段或单元自然地连接在一起,使其符合目的语的翻译方式。(8)就口译而言,要在短时间内迅速对所听到信息进行反应,并进行有效的双语转化,往往具有一定压力。因此为节省时间,口译者多会按照“先进先出法”对接受的语言信息进行转化,这样,即使语法上即使不十分连贯,但至少确保了语义的准确。

五是口译语料以短句为多。口译语料主要源于口语直译,其对语义的连续性要求较高,往往呈现为一系列的短句形式。而笔译则相反,要求翻译人员先从整体进行理解,在根据意群进行划分,最后以划分好的句子为翻译单位进行翻译。总体上呈现出稳健的長句型(如名词性从句等)。

宁波舟山港港务翻译语料库作为西班牙语口笔译语料库,有效解决了翻译语料库中口译语料难以收集和处理的问题。针对“与笔译不同,口译内容只以声音形式存在,口译中源语和目标语的呈现都是一次性的”的现实难题,我们一方面努力做好口译现场的录音、录像等语料留存操作,另一方面也积极促进口译语料文本化,秉笔直书,将原始的口译语料直接转录为文字,便于后期开展口笔译差异化研究。作为西班牙口笔译教学平台,宁波舟山港港务翻译语料库可以为课堂教学提供真实的语言素材,并根据此类语料的难易程度加以分类整理,由浅入深引导学生进行口译笔记、情景交际互译、类比翻译等课业训练,培养学生口译活动的“应变”、“流畅”和促进笔译活动的“专业”、“规范”。随着宁波舟山港港务翻译语料库的逐步丰富和规范运作,必将为国内外港务翻译工作者提供更为全面的港务活动研究资料,帮助他们更好地提高相关业务水平。

注释:

(1)(2)何婷婷. 语料库研究[D]. 武汉:华中师范大学,2003.

(3)大型语料库则有所不同,其语料记录号可由设计者通过一定的编码规则用以表达每一语料的相关信息。如“国家现代汉语语料库”的记录号就由11位字符组成。第1位表示样本的来源(如B表示报纸、J表示教材),第2位表示语料的学科分类,第3位是学科分类下的小类,表达出该语料记录的来源和学科;而分类号的第4至8位则表示某一类下的样本号,第9至11位用以区分同一样本的不同记录。

(4)参见(宁波舟山港)港口概况,http://www.portnbzs.com.cn/Introduction/overview,2017年8月3日最后访问。

(5)王斌华,叶亮. 面向教学的口译语料库建设:理论与实践[J]. 外語界,2009(2):24.

(6)梁茂成,李文中,许家金. 语料库应用教程[M]. 北京:外语教学与研究出版社,2016:23.

(7)张威. 口译语料库的建设与应用[M]. 北京:北京语言大学出版社,2013:25.

(8)杨婷. 口笔译差异对比——以顺句驱动为例究[J]. 才智,2015(11):272.

猜你喜欢
港务西班牙语语料库
新时期港口石油化工企业的消防安全管理工作
基于语料库翻译学的广告翻译平行语料库问题研究
运用语料库辅助高中英语写作
对福建省沿海港口整合的思考
科尼向迪拜环球港务集团旗下杰贝阿里港交付13台空箱堆高机
语料库与译者培养探索