王宗英,郭高攀
(东华理工大学外国语学院,江西南昌 330013)
据国家旅游局2017年上半年旅游统计数据报告,国内旅游增速超预期,入境旅游稳步增长。旅游经济已成为国民经济发展的重要组成部分,越来越多的国家和地区高度重视旅游经济的发展。而游客是否选择某一旅游景区、旅游服务或旅游产品取决于他们对此旅游景点及服务是否了解及了解的程度。由此可见,旅游景区、旅游服务或旅游产品的宣传工作异常重要,旅游文化外译是扩大当地旅游文化特色及旅游服务国际知名度的重要手段。旅游文化的外译包含自然景区、人文景观、民俗风情、旅游服务及旅游产品等的外译工作。本研究旅游文化外译特指汉语译成英语的工作。
江西作为中国十大旅游省份之一,具有丰富独特的旅游资源,然而入境旅游经济收入相比其他旅游大省还有很大的差距。经调查发现其中一个重要的原因就是旅游外译工作相对滞后,了解江西独特旅游文化尤其是具备红色文化相关背景知识的专业外语人才紧缺。因此,为服务地方旅游经济发展,本研究试图创建江西旅游文化汉英平行语料库,并将其应用于旅游翻译、旅游文化翻译教学与研究及导游人才的培养中,为江西旅游文化外宣工作提供支持。
过去30年基于语料库的翻译研究取得了飞速发展。1995年,曼彻斯特大学建立了世界上第一个翻译语料库(TEC),而后用于翻译研究的语料库应运而生。目前,用于翻译的语料库主要有:译文语料库、类比语料库和对比/平行语料库,这三类语料库多以文学文本为主,针对某一领域专门研制的
双语语料库相对较少。旅游文化语料库是一种专门用途语料库,然而目前国内外已创建的单语或双语旅游语料库数量较少。
纵观国内外相关文献,我们发现目前国内外研制的旅游类语料库主要以下三类:1.单语旅游语料库的研制,如Michael Wilkinson于2005创建的公67万词的英语旅游语料库,主要用于指导学生将芬兰语译为英语时提供参考[1];Carlota Alcantar收集了旅游部门、酒店、旅行社及语言培训学校相关文本于2007年创建了约3.8万词的英语旅游文本语料库并总结出旅游文本中常用的421个词汇和短语,用于指导旅游学院教师有效的教授旅游词汇[2];2.类比旅游语料库的研制,如康宁创建了基于中美英网站旅游文本的可比语料库,旨在系统地描述和对比分中、英、美网站英语旅游文本中评价意义构建的特点,找出中国旅游网站英语旅游文本评价性语言所存在的问题和不足[3];3.双语平行语料库的创建;如李德超,王克非(2010)创建的以香港地区旅游文本为主的中英双语旅游语料库,文章介绍了该语料库设计的理念及操作程序[4];熊兵(2016)创建了旅游文本汉英平行语料库,语料来自旅游景点介绍(如故宫介绍、湖北旅游、西安旅游等等)[5],旨在探究旅游文本的译文词汇特征及翻译;其它的诸如内蒙古汉英平语料库、云南省汉日平行语料库、泉州旅游文本汉英平行语料库等地域性的双语平行语料库研制也取得一定的进展。
综上所述,国内旅游双语平行语料库的研制已经取得了一定的进展,但是数量还不够,还有待进一步深化。一是目前国内旅游语料库规模较小、地域有限,由于各种原因已建的旅游语料库并未对外开放。二是各地旅游资源迥异,把它省或它地区的旅游语料库用于当地的旅游外宣、导游培养、旅游翻译与教学有一定的局限性。在“一带一路”战略下,提高旅游文化译文质量是打造江西旅游枢纽区的重要一步,研制江西旅游文化汉英平行语料库有助于提高旅游文化译文质量,促进江西旅游经济发展。
江西省是旅游大省,有着丰富的自然景观和人文景观,截止2017年2月江西省共有10个旅游景点被评为5A级景区。悠远的人文景观、秀丽的自然风采及浓郁的红色文化使江西成为海内外游客的主要目的地之一。近年来,江西的旅游环境不断改善,国际形象和知名度大幅提升,国际游客的数量逐年稳步增长。据江西省统计局2016年1月公布的2014年入境游总人数为54.92万人,实现旅游总收入5.7亿美元。相比日趋完善的旅游激励政策和硬件设施,江西旅游文化外宣翻译则相对滞后。
经笔者调查发现,在国外访问量较大的中国日报英文版网页上,多省开通了英文频道(http://www.chinadaily.com.cn/regional/),未见江西省英文频道,中国日报英文版网页上关于江西省承办的国际性会议及论坛英译文数量也较少。江西旅游官网未见相应的英文介绍,江西省人民政府、南昌市政府、九江市政府等及部分旅游景区及酒店官网开通了相应的英文网页,但是关于景点、酒店及相关旅游服务的介绍比较简单,有的译文存在误译及不地道的表达法。研制规范的江西旅游文化汉英平行语料库,不仅能直接用于政府部门及企业的外宣及推广,也可以为旅游文化翻译者提供一定参考,同时也可以为旅游英语教学及翻译提供真实素材,从而提高江西省旅游文化译文质量,营造优质的旅游环境,提升江西旅游形象品牌,吸引更多的外国游客,促进当地旅游经济发展。
本研究构建的江西旅游文化汉英平行语料库是一个开放性的具有地方旅游文化特色的专门语料库,其库容随着旅游外宣及研究的深入不断进行扩充。本语料库主要根据王克非教授撰写的《双语平行语料库研究与应用》及李德超等创建的平行语料库所采用的设计理念及思路进行该语料库的设计[4],创建过程包括语料的收集、整理、标注、对齐等。
语料的选择主要借鉴Maia的标准[6],依据社会语域(如分为景点介绍、景点公示语、旅游配套设施介绍等若干类),将分层抽样、均衡抽样和比例抽样有机结合使用,以确保入库语料的代表性。江西省旅游文化汉英平行语料库主要涵盖以下几个方面:经典山水(比如庐山、明月山、鄱阳湖等)、红色文化(如八一纪念馆、瑞金共和国摇篮、井冈山等)、民俗风情(如景德镇古窑民俗博览区)及酒店、餐饮业及相关旅游服务的介绍。语料主要来源为出版社及各级政府部门出版发行的书籍(图书、论文及音像资料DVD等)、各景区的景点介绍及景区标识语及宣传手册、各个景区的网络资料,重点收集了部分景区官网、政府官网、部分旅行社网页有关上述三类景区的双语介绍性文本。在语料收集的过程中,我们将各类双语语料存放在同一个文档中(检索时只要检索出原文或译文的词句,其对应的词句就会自动出现),按照预先规划的三个字库存入相应的文件夹。
因为语料的来源众多、形式多样,在语料收集完成之后,需对语料进行进一步的整理。对购买的书籍及其它出版物进行扫描然后用文字识别软件进行识别,再进行人工校对;拍摄的图片需进行人工输入;网络下载的资源如PDF及CAJ格式需转换,拷贝的网页文件须删除图片、链接,最终所有的电子文档存为统一的格式.txt格式。我们将采集到的语料进行筛选,排除一部分译文低劣不可修改的原始文本,选取译文质量较高并且具有代表性的语料,然后人工校对是否有错别字、语法错误、乱码杂质等,删除冗余信息。同时对初步筛选过的语料进行查漏补缺,对有问题的译文进行修正,对缺少对应英译资料的文本提前进行一些英译工作,充实汉英对译文本。最后组织翻译专家团队和外籍教师对译文进行校审并修改,确保译文的质量。
对修正过的生语料,本研究使用风林文本整理器进行清洁。风林文本整理器是一款绿色文本清洁软件,可以整理空格、段落和空行、转换代码、合并文档等,支持批量整理多个文本文件。整理过的文本在自动词性赋码时就不会出现乱码。
平行语料库的标注虽然不是一个必要的步骤,但是进行了句法和词法标注的语料库会更加便于研究与学习[7]。语料标注影响到语料库建成后的应用范围,也是实现原始语料机读化的重要环节。本研究中的标注分为两个类别:篇头和文内标注以及词性标注。语料在转换为.txt形式存档后,原语料中的很多信息都会被去除。通过篇头和文内标注,这些原始信息可以在处理后的文档中得以体现。参照通用汉英对应语料库的标注方法,并结合本研究的目的和特点,本语料库语料标注分为篇头标注和文内标注,目的是使原语料中的相关信息能够在处理后的文档中得以体现。篇头标注可包含:标题、景区所在地、译者信息、时间、出版信息等;文内标注可利用语料库词汇切分和词性赋码软件工具分别对汉语和英语语料进行词性标注。英语文本使用德国斯图加特大学Helmut Schmid开发的词性标注工具软件Tree Tagger,对英文语料进行词性赋码;汉语文本使用中国科学院计算技术研究所开发的汉语分词及标注工具ICTCLAS进行分词及词性标注。对标注之后的中英文语料需再次进行人工校对,查看并纠正错误。
整理过的语料需作对齐处理,即将原文与译文建立起段落、句子或短语层面的对应。语料对齐是平行语料库建设的核心部分。虽然很多学者认为,对齐单位越小,所提供的语言信息就越多,因而应用的价值也就越大。但也有专家指出,“由于汉、英分属不同语系,它们在语序、句子结构和逻辑语义的表达等方面都存在着明显的差异,语词的逐一对应在整个语料库是不可能做到的,语句层级上的对应难度也相当大。”[4]在各级对齐研究中,最为重要且成熟的自动对齐技术是句子对齐。因此,在本语料库的构建过程中,我们进行句子层面的对齐,辅以段落对齐的方式。本语料库先使用Paraconc软件以句为单位粗略对齐,完成后进行人工校对。语料本身并不能实现什么,只有与语料库工具结合才能对语言现象进行研究[8]。检索工具选用的软件要根据平行语料库语料存储的不同形式来选定。对于语料被存放于同一文档的平行语料库,使用普通的检索工具如AntConc,Concordancer进行检索并输出结果,可以进行基本的统计和分析。
不同于单语语料库及可比语料库,双语平行语料库既含有原文又有译文,信息丰富,能从不同层面探究双语之间不同层面的对应关系,双语平行语料库可以为翻译研究、双语教学、机器翻译、教材编写等提供有效的资源平台[7]。江西省旅游文化汉英平行语料库作为地域性的专门语料库,有其专门的针对性和实用价值,主要包括以下方面:
第一,丰富江西旅游文化双语语料,服务江西旅游文化资源外宣工作,推动江西旅游经济的发展。由于入库的语料经过翻译专家团队及外籍教师的审核与研究人员的修订,建成后的江西旅游文化汉英平行语料库可以直接用来补充和完善现有的政府及景区网页上旅游资源的英译文,提高旅游外宣文本的翻译质量,提升旅游景点档次。同时,研究人员正在对收集整理的江西经典山水、红色旅游文化及江西民俗风情等双语语料,进行编辑及撰写,正在筹备出版发行江西旅游文化双语指南。以上这些做法无疑将有效提升江西省游资源品牌,扩大江西省特色旅游文化的国际知名度,有效吸引潜在的国内外游客,推动江西旅游快速发展。
第二,江西旅游文化汉英平行语语料库还可应用于本地高校的翻译教学,有助于培养高素质的翻译人才。旅游文本的翻译是翻译实践的一部分,建成的旅游文化双语语料库能够为学生提供丰富真实的译文实例,学生通过比较不同的翻译文本,研究旅游文本翻译的具体方法,进而形成自己的翻译策略。教师可以利用翻译工作坊的教学形式,让学生通过语料库关键词的检索,获得准确的双语词汇和句型表达方式。一方面可以激发学生翻译实践的热情;同时有利于培养学生自主翻译实践的能力。这种教学模式可以促进旅游翻译教学的转变[9],从而进一步提高翻译课的教学效率,培养高素质的翻译人才。
第三,建成的江西旅游文化汉英平行语平行语料库可以为汉英旅游文本词汇、语用、语体研究等提供一定的参考。该语料库可直接为汉英旅游词典,红色旅游文化词典编纂提供大量可靠的语言实例。该语料库还可为旅游学院教师的教学提高丰富的素材,同时也为出版江西省旅游文化汉英双语教材和各类旅游参考书籍提供丰富的资源,从而可以更好地培养江西特色旅游文化英语导游者人才。
建成的江西旅游文化汉英平行语料库有助于旅游宣传单位和译者实现资源共享,提高江西外宣译文质量和翻译效率,从而有助于促进江西旅游经济的发展。同时,本语料库的语料也可以为广大翻译研究者、译者和旅游学院教师和学生提供丰富的研究和教学素材,该语料库的构建具体过程也可以为其了解平行语料库、研制语料库以及使用平行语料库方面提供有益的参考。
[1]Wilkinson,M.Discovering Translation Equivalents in Tour⁃ism Corpus by Means of Fuzzy Searching[J].Translation Jour⁃nal,2005(9).
[2]Alcantar,C.Construction of Special Corpus to Extract the Most Frequent Words in a Particular Field[J].Essex Gradu⁃ate Student Papers in Language&Linguistics,2007(9).
[3]康宁.基于类比语料库的中国网站英语旅游文本语言分析[J].青岛科技大学学报(社会科学版),2012(4).
[4]李德超,王克非.新型旅游语料库的研制和应用[J].现代外语,2010(1).
[5]熊兵.基于语料库的旅游文本英译文词汇特征及翻译研究[J].华中师范大学学报(人文社会科学版),2016(5).
[6]Maia,B.“Some languages are more equal than others”:Train⁃ing translators in terminology and information retrieval using comparable and parallel corpora[A].In F.Zanettin,S.Bernardi⁃ni&D.Stewart(eds.).Corpora in Translator Education[C].Man⁃chester:St.Jerome,2003.
[7]冯敏萱.汉英平行语料库的平行处理[M].北京:世界图书出版公司,2011.
[8]Susan,H.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press,2002.
[9]李德超,王克非.基于双语旅游语料库的DDL翻译教学[J].外语电化教学,2011(1).