专利文献翻译平行语料库的建设与应用

2019-12-27 09:36车丽洁纪卫宁
武夷学院学报 2019年4期
关键词:译员语料术语

车丽洁,纪卫宁

(青岛农业大学 外国语学院,山东 青岛 266109)

近年来,我国在双语平行语料库的构建方面取得显著成就,形成许多大型双语语料库,不断丰富国内语料资源,其中,专利文献语料库属于专门用途语料库。专利文献是具有特定规范的科技文献,涉及各个领域的新发明、新技术、新方法、新产品等。[1]相比于传统的翻译方法,利用计算机辅助翻译软件Transmate,Trados,Tmxmall等辅助翻译,构建专利文献翻译平行语料库,可有效解决传统模式的弊端,辅助译员掌握专利文献的翻译规范,统一专业术语,提高翻译效率与质量。

基于此,本文结合专利文献的自身特点,介绍我校专利文献翻译团队创建专利文献翻译平行语料库的方法和实施过程,探讨翻译平行语料库对翻译实践和翻译教学的有效作用。

一、专利文献翻译平行语料库的建设目的和作用

专利文献的特点为专业性强,具有固定的语言表达方式,表述严谨规范。译员在翻译专利文献时往往会遇到词语内涵理解错误,搭配不当,词性、语态转换机械等问题。构建专利文献翻译平行语料库,可培养译员翻译素养,遵守专利翻译规范,形成相符翻译风格。此外,术语库及预翻译功能可统一专业术语,提高翻译质量及项目小组合作效率。

(一)培训译员的专利翻译意识

译员在专利翻译入门阶段,由于缺乏相关的百科知识,无法正确理解原文,会认为专利文献翻译难度大。实际上,专利文献的文本结构和语言句式较为固定,涉及大量惯用词组。例如,专利文摘的起始句有固定表达格式,The invention relates to/provides/discloses/belongs to;专利名称后的过渡词“包括”“其特征在于”“其中”等可分别翻译为“comprises”“be characterized in”“wherein”等;专利文摘在介绍产品优点部分时也需要按固定句型翻译成 “has the advantages of或that…”。除了具有固定的词汇以及语法结构特征,专利文献翻译又具有其特定的注意规范和翻译风格,译员须明确了解专利翻译规范,按照专利文献的文体特征进行翻译。专利文献翻译平行语料库的建立可帮助译员迅速而高效地掌握专利文献的语言形式特征和翻译风格和规范,培养译员的专利翻译意识。

(二)规范专业技术词汇的通用译法,建立术语库

术语管理在专利文献翻译中至关重要。有研究表明,译者75%的时间用在术语的翻译上。[2]专利翻译中含有大量的术语,其术语密度高,要花费译者较多时间和精力来翻译。同时,专利翻译涉及的专业领域多,不同的专业领域术语有不同的译法,不能望文生义。例如网络社区中为了隐藏身份而注册的ID称为 “马甲”,应译为“sockpuppet”,而非“waistcoat”;又如,用于集中器和采集器的UART接口“复用”扩展装置,该句属于通信领域,复用应为“multiplex”,指多路传输的,而非“reuse”重新使用。此外,专利翻译中有许多惯用词组,例如,实用新型,utilitymodel;具有,be provided with;多个,a plurality of等等。此外,专利术语翻译的原创性高。专利都是对新发明的技术或产品的描述,作者往往会创造一些新的术语来表达新的概念。这些术语在工具书中查询不到,需要译者根据原文创造新的术语进行翻译。

专利文献翻译平行语料库的建立可以有效解决术语管理的任务。我们利用语料库中Transmate的记忆库管理功能,可以实现术语的收集、描述、记录、存贮、呈现及查询等工作。启用预翻译功能,达到匹配率的记忆库文本可自动填充到译文栏中,译员可将其作为参考译文,减少译员查词的工作量,确保译稿的术语统一,实现译文用词的一致性,同时大大提高翻译的效率。

二、专利文献翻译平行语料库的建设方法

建设专利文献翻译平行语料库的步骤包括对语料的采集、对齐、整理与加工等。首先应结合构建语料库的目的,选取不同领域的语料,确保语料库的丰富性和代表性;再利用计算机辅助翻译软件进行双语语料对齐,其是建立语料库的核心步骤;最后需对语料库进行词性标注,深层次整理加工语料库。

(一)语料采集

高质量语料的采集对语料库的构建与应用具有重要意义。本项目通过采集外国语学院创译工作室的知识产权专利翻译内容作为原始语料,由于其皆是原文与译文一一对应的段落,且以word文档形式保存,相比于网上下载的双语资料,文档格式转换以及处理选取语料的排版步骤皆可省略。在构建该专利文献翻译平行语料库之前,应研究分析农学、建筑、医学、物理、化学、交通等不同领域的专利文献中英句式特点,从而总结出影响语料库与译文质量的语句是哪些类,译员在科技文献翻译初级阶段时易犯哪些错误等。据此,我们根据合作翻译公司的质检反馈稿件,选取无语法错误、符合专利翻译规范的高质量文本,保证所选取语料的语言质量和翻译质量。

(二)双语语料对齐

语料采集后,需要对语料进行对齐。在语料对齐时选取句级对齐单位,即由一个或多个自然的中文/英文句子组成且中英文句子间具有翻译关系。[3]具体操作办法如下:

(1)首先登录网站 http://www.urelitetech.com.cn/免费下载安装Transmate单机版V7.3.0.1218,相比于雅信,DéjàVu和Trados等CAT软件,该软件操作简单,方便易学。

(2)打开软件后,点击【语料管理】—【双语对齐】—【导入文件】菜单,此时会弹出“导入双语文件”对话框,选择文件路径,导入选取的语料,点击确定后,成功导入原始语料。

(3)对段落合理分析,进行语句拆分,直至源语言与目标语言一一对齐。

(4)语料对齐工作完成后,点击菜单【导出到记忆库功能】,选择相应的记忆库,可以将其单独导出到记忆库。此外,也可将对齐的语料库导出为tmx、txt等各种格式的文档内,方便共享。

(5)点击【设置】—【选项】,在弹出的对话框中可设置【模糊匹配】,即最低匹配率,在【机器翻译】选项下,启用一项在线翻译,输入已申请的API(Application Programming Interface,应用程序编程接口)设置,设置完毕后,即可准备测试语料库的应用效果。

(三)语料库的整理加工

双语语料对齐后,该专利文献翻译平行语料库仍为生语料库,即没有经过任何处理的电子文件语料库,而词性标注可进一步提高语料库的利用价值。未经加工的生语料库中无法分开检索不同词性的同一词形,即若检索“焊接”,可为名词性“焊接装置”,也可为动词性“焊接某物”。因此,利用中国科学院计算技术研究所开发的ICTCLAS汉语分词软件,可对中文词汇进行赋码处理,即对不同词性的词汇进行标注,再利用Treetagger对英文词汇进行赋码处理,最后还需进行人工校对。[4]

此外,该专利文献翻译平行语料库为开放性语料库,译员可边建边用,其提供编辑功能,即对齐后的源语言与目标语言皆可再编辑修改。因此,译员可不断完善语料库,提高语料库的实用价值。

三、语料库的应用

语料库构建完成后,其可提供大量专利文献英汉语言实例,应用于科技英语翻译教学过程,也可用于培训译员的专利翻译意识,指导译员进行专利翻译实践。此外,计算机辅助翻译软件提供翻译记忆库功能、术语萃取及术语库管理功能、项目管理功能等,可实现团队高效率的协作翻译。

(一)建立翻译项目

(1)双击软件图标,运行 Transmate,点击【创建项目】建立项目,定义项目,设置源语言 (source language),即原文的语言与目标语言(target language),即译员需输出的语言,填入项目路径,项目创建完毕。

(2)点击【我的项目】,选择需操作的项目,启用【记忆库】,即挂库,双击打开需翻译的原文,进入翻译界面。也可在已创建项目内导入文件,并打开进入翻译界面,此方法可用于导入txt格式的文档。

(3)点击【预翻译】,设置参数,包含启用何种在线翻译或术语等,设置匹配率。

(4)预翻译完成后,译员可根据参考译文进行修改,再点击【确认】,保存该句译文,利用快捷键“ctrl+enter”或者点击【下一句】进入下一句的翻译。

(5)翻译文档完成后,可以导出译文,也可以导出双语对照,便于导入记忆库,存储于记忆库内,扩大语料库。

(二)建立术语库

Transmate软件具有术语萃取及术语库管理功能,通过“语料管理”的术语萃取功能,打开翻译文件,设置最小出现频率,可由系统自动筛选术语并导入术语库,也可在翻译过程中手动添加专业术语,进而建立术语库。通过“语料管理”的术语库管理功能,译员可导入所需术语文件,也可根据需要自行添加术语,对术语进行整理汇总,确保术语正确性、一致性、无重复性与完整性;此外,译员可在已建立的术语库中检索所需相关术语信息,提高查询专业术语的效率。

相比于句级对齐单位,精确的术语单位可提高系统的语句匹配率。术语库的建立对于多人合作的翻译项目具有重要作用。在翻译实践中,一库多用,可共享术语,保证所有译稿的术语一致性,提高翻译团队的效率。同样,术语库也需不断修改完善,在应用过程中不断提出质疑,做到定时更新。术语库的建立对词汇处理有以下优点:

(1)有些词汇属于一词不可多译类,译员在翻译该类词汇时,术语库会提示译者相应的译法,避免其有各自的译法,导致术语的不统一,增加译后整稿的工作量。

(2)有些词汇属于一词可多译类,术语库中会有其相应的分类,可节省译员查询术语、确定相应领域的时间,例如“下料”是专利翻译的常见词汇,若是指钢板下料,剪切力下料,应用blanking;若是指切割,则用cutting;若是指粉剂流出等的下料,则用discharging。

(三)启用项目管理

Transmate网络版具有项目管理功能,可实现项目化管理。翻译项目进行之前,“项目管理”可结合已有的翻译记忆库对翻译文件分析,预估所需翻译时间。项目经理建立项目后,可通过项目管理端查找译员、分发任务,译员也可从项目管理端接受翻译任务,从而实现翻译团队协作翻译。“项目管理”可实现语料资源在线共享,项目经理可实时更新术语库,定期分享给译员,确保译稿术语的统一性,提高稿件翻译质量。此外,译员的翻译进度以百分比显示,项目经理可通过项目管理端实时监控稿件翻译进度,实现对译员的管理和监督。

(四)翻译教学应用

相比于传统的翻译教学模式,将专利文献翻译平行语料库应用于科技英语翻译教学中具有以下优点:

(1)通过建立翻译教学案例库,基于语料库强大的检索功能,其可为学生和老师提供丰富翻译案例,拓展学生思维。学生可在特定的语境下对于不同双语对译案例分析,分析词汇、短语、句式的差异,学习翻译策略技巧,增强翻译意识。

(2)基于语料库的翻译教学模式,可以增强学生与教师的交流,提高学生在课堂上的参与度。一句多译可增强学生的思辨能力,学生可赏析译文,体会不同的译者风格,针对多种翻译技巧探讨分析,可提高学生的逻辑分析能力,增强学生的主观能动性,从而有利于提高翻译教学质量。

四、建库中常见问题及解决方案

在建设专利文献翻译平行语料库过程中,我们对所遇到的各种问题进行分析,提出可参考的解决办法,以便提高建库的效率与质量。我们将建库中所遇到的问题及分析方案进行记录整理,如下:

(一)专利文献中的长句拆分问题

为了表述的严谨性和详尽性,专利中通常对同一主题或事物的描述放在一句话中。因此,长句是专利文献的一个重要特点。[5]译员严谨分析选取的专利翻译文摘,进行合理的语句划分,便于语料对齐工作,提高预翻译中语句匹配率。若不对长句做妥善处理,必然导致专利文献中的部分语句无法逐一对应,增加语料对齐的难度,例如:尤其是一种……的加工结构,该句涉及一个长定语,若要拆分成小句,则需改变原文,改为“尤其是一种加工结构,其加工结构……且……”从而实现原句与译句的平行对应。

(二)如何选取对齐单位

大段对齐会降低系统的匹配率,不利于快速定位到合适的小句或专业词汇。过于精炼的词汇会增加语料对齐的工作量,而一些专业术语的出现频率并不高。此外,词汇级对齐任务难度大、易出错,因为大多数自然语言之间往往缺乏一对一的对应关系[6],因此一般选择句级对齐单位,其既可提高预翻译的语句匹配率,又可减少对齐任务工作量。因此在导入原文前,可将段落拆分成语句,拆分方法如下:打开一篇以txt格式保存的专利文献原文文档,使用回车符将每一个句子位于单独的一行,以此类推,完成段落的拆分。拆分完成后,按上文描述导入文件,打开翻译界面时,将显示各个不同的语句,而非一个整体段落。

(三)术语库整理问题

计算机辅助翻译软件具有语料分析功能,系统可统计出高频词汇,译员可据此建立术语库,但需进行筛选和补充,因为译稿中的一些专业术语出现频率低,不能被系统筛选出,需要译员自行添加;译员还需删除多余的高频率普通词汇,例如冠词a等。因此,创建术语库之后,译员应整理汇总术语库,定期更新术语库,确保术语库的质量。高质量的术语库有助于译稿的术语统一,方便质检译员质检。

(四)语料对齐及应用的格式问题

使用Transmate时,导入的文件应为其所支持的文档格式,若源文件格式不支持,可用相应的工具转换成Transmate所支持的格式。语料对齐前,由于专利文献前具有专利号,可在整理原始语料时将其删除,或在导入语料库之后,开始对齐工作前删除。语料对齐后,可直接导出tmx格式文本,但其不便于整理分析,可将双语平行语料先导出到记忆库,再将记忆库的对齐语料导出,即可导出txt格式的对齐语料,命名后保存在纯文本文档内,形成双语平行语料库文本,便于译者对语料库的整理分析。此外,在应用语料库进行预翻译时,应将稿件整理为双语对应的文字形式,可提高利用Transmate进行翻译的效率。翻译之后导出的文本也需整理为符合译文规范的标准格式。

五、结语

计算机辅助翻译软件有助于译者提高翻译效率和翻译的准确性。专利文献翻译平行语料库的建设可用于指导译员进行专利翻译实践,减少译员确定和统一术语的环节,提高翻译实践的效率和质量。目前机器辅助翻译已代替传统的人工翻译成为翻译行业的主流翻译模式,译员提前了解并使用计算机辅助翻译软件,也可为以后进入翻译公司,快速熟悉翻译流程奠定基础。此外,专利文献翻译平行语料库也可应用于科技英语翻译教学过程,老师可随时调出所需教学素材的原文及译文示例用于课堂教学。学生也可根据语料库提供的丰富语料,学习翻译技巧,评估多种译文,培养自主学习能力和批判性思维能力。

猜你喜欢
译员语料术语
面向低资源神经机器翻译的回译方法
中医口译的难点与处理策略探究
贸易术语修改适用问题探讨
口译中的“现场学习”
濒危语言与汉语平行语料库动态构建技术研究
口译中的“陷阱”
译员扮演何种角色?
国内外语用学实证研究比较:语料类型与收集方法
翻译适应选择论下中医术语翻译探讨
英语教学中真实语料的运用