赵足娥 吴年利 李培隆
摘 要: 论文、学术著作中外文资料比例越来越大,学习先进的技術知识需要更高的英语水平。而人工翻译成本高、效率低,已经无法适应发展需求,于是需要在科技英语的辅助系统上寻求突破口。Trados作为现今主流辅助翻译软件,可大幅度提高翻译效率和质量,同时降低翻译成本。文中基于Trados系统研究一种适应科技英语特性的高效辅助系统设计,提出翻译记忆模型,采用精准对齐的方式实现记忆库查询与校验操作。同时建立相似度规划算法,以“编辑距离”估算语言模糊匹配,实现更贴近语境语义的翻译效果。最后进行语料翻译测试,其数据结果表明,该种基于Trados平台开发的辅助翻译系统在科技英语翻译方面,词法准确率与专业性均较高。
关键词: Trados平台; 辅助翻译; 系统设计; 科技英语; 翻译记忆模型; 翻译测试
Abstract: Due to the increasing proportion of foreign language materials in papers and academic works, learning advanced technical knowledge requires a higher level of English. In allusion to the manual translation can no longer meet the development needs on account of the high cost and low efficiency, a breakthrough in the auxiliary system of the scientific English need to be found. As the mainstream assistive translation software, Trados can greatly improve translation efficiency and quality while reducing translation costs. A design of the efficient auxiliary system adapted to the features of scientific English is studied based on the Trados system. The translation memory model is proposed, and the memory query and verify operation are achieved by means of the precise alignment method. The similarity programming algorithm is established, and the language fuzzy matching is estimated by "editing distance", so as to achieve the translation effect that is closer to the context semantics. The translation test of corpus was conducted. The data results show that the auxiliary translation system developed based on the Trados platform has a higher lexical accuracy and professionalism in the translation of scientific English.
Keywords: Trados platform; aided translation; system design; scientific English; translation memory model; translation test
0 引 言
随着世界一体化发展趋势,各国交流日益密切,学术圈子已经覆盖到全球各国。而科技英语作为学术通用语言,其翻译质量决定着学术思想、成果的传递效率。传统的纯人工翻译成本代价过高且效率低,无法满足日益增长的翻译需求[1]。再加上万物互联时代下,人工智能大数据的蓬勃发展,计算机翻译已然成为发展的必然趋势,也是翻译效率提升的突破口。为此,人们对现行的辅助翻译系统提出了新的需求。
现今,国内主流辅助翻译软件有SDL Trados,DAVU,CAT等,其中Trados市场占有率最高[2],达到78%。另外,Trados充分利用了“翻译记忆”的理念,将翻译过的文本储存到记忆库中,遇到类似的文本便可综合以前的翻译结果,从而得到更加精准,且贴合语义的翻译结果。结合计算机强大的储存与检索能力,其记忆库的样本可以无限增长,从而实现类学习模型的翻译质量提升[3]。本文基于Trados这一良好的系统平台,进一步开发符合科技英语特性的辅助系统,来寻求更高效、高质的论文翻译方法。
1 系统关键模块分析
1.1 翻译记忆库
记忆数据库负责对已翻译、待翻译的文本进行储存记忆或再提取,是系统的核心模块,也是系统实现更高翻译质量的分析依据。其按照类别又可细分为句料库和术语库。每次翻译流程中,相似度计算、内容检索、译文翻译和修正均要围绕着翻译记忆库实现[4]。可以说记忆库的数据管理、分类方式是系统性能的直接关联因素,需要合理规划。本文依据科技英语句式分布和词汇频率特性,设计一种根据句子级别对齐的分类方式。记忆库结构设计如表1所示。
此外,本模块还需完成相应的信息检索、添加、增删等操作。同时,数据库需要动态更新、实时提取,以保持较高的文本活性。
1.2 翻译检索模块
翻译检索模块是为了简化翻译匹配流程,提升翻译质量和速度的参考模块。具体流程为,首先,从记忆库中检索得到历史文本,通过相似度匹配翻译句式。检索得到的实例越贴合待翻译句子,则前期的句式与词法翻译过程将得到更大程度的简化。
检索机制的核心在于相似度匹配算法,本文采用“最短编辑距离”来估算并划分相似程度[5]。由于科技英语具备用词精准、规范术语、措辞正式、科学严谨、逻辑性以及专业性强的特点,且部分语句还具有独特的词汇体系和句法特征。因此,词汇量大、句段间关系复杂、知识高度细化、层次清晰、关系紧密。这也使得对翻译的精准度和语境语义贴合度要求极高,否则将无法精确解析句子表达的含义。以此为前提,本辅助翻译系统在检索匹配模块句子时,采用模糊匹配算法,通过相似度提高准确性。如,A,B两句子间的相似度计算公式为:
式中:A代表目标翻译句子;B代表记忆库历史参考翻译。
1.3 翻译编辑环境
翻译编辑环境为系统的前端部分,主要提供给翻译人员内部数据记忆库的入口和过滤器操作,对应格式文件的录入与系统自动的句段分割、句法分析等。也可以称之为系统预编译或预处理模块,其功能旨在提供前期的准备工作,简化人工校验的流程[6]。此外,在系统编辑环境下,可一键实现模糊匹配筛选。通过二分法查找已有词汇,自动匹配相似句子或短语,插入译文提供给翻译人员。经人工修正后,可导出为源文档格式译文。
2 系统设计与实现
2.1 系统流程设计
系统整体采用C#实现,数据存储于SQL Server中,运行主界面由Bootstrap和Jquery搭建可视区域[7]。根据功能划分为三部分,分别为左上的记忆库动态匹配句段、右上的参考词汇表和下部的辅助参考译文。这一部分可直接编辑修改译文,或添加新的翻译段落。此外,系统支持记忆库的句段查询和词汇表查询,从而省去了再通过其他途径查询术语词汇的过程。系统整体风格简易,使用功能明确。
目标翻译文本录入系统后,其翻译流程如图1所示。
待译文本通过系统识别,确定文本类型后,经由预处理模块词法解析和预编译后产出第一次翻译样例。原文与翻译文本句子对齐存储方式为:XML语言编码,以“翻译单元”形式存储,文本和翻译待定项逐一对应,通过ID标记进行描述[8]。此外,可调用Trados检索模块和记忆库,自动建立语料信息资源库,再引用Trados自带的术语库进行功能管理,从而可进一步提高产出效率和匹配精准度[9]。
2.2 测试用例分析
本文从1 000份的语料中随机抽取了多份语料文献,文章类型涵盖了大部分的科技英语形式,并将其分为3大类。其中测试集1为旅游、财经类内容,测试集2为科技类内容,测试集3为娱乐类内容,每个测试集随机选取6份不同数量的语料文件进行测试。此外,讨论内容也选取不同方向,力求进行一次全面测试。对语料进行过滤分类后,通过辅助翻译系统进行语段词法解析。直接收集分类结果,统计准确率、精确率、语境贴合度等评价指标[10],其结果汇总如表2所示。
从表中可知,分类准确率最高可达90%左右,且词法精确率有83%。各分支类型中较为生僻的旅游、财经平均翻译精准度最低,但仍有80%的词法精准率。由此反映出,本文所提出的基于Trados平台开发适用于科技英语领域的辅助翻译系统具备较好的适用度及可扩展性。其只要将记忆库中的参考译文进行再丰富,并加强生僻冷门术语和学科的词法引用,翻译的精准度将会大幅提升,达到学术级要求。
3 结 语
本文提出一种搭建在Trados辅助翻译系统平台上的、适应科技英语特性的语料翻译系统。系统旨在实现对学术性、专业性、精准率要求均較高的学术论文或学术著作的高质辅助翻译。尤其对于历史记忆语段丰富的词法结构,可保证绝对准确的翻译和语境贴合度,大幅减少了人工成本投入。文中从系统的核心模块分析,关键技术讨论着手,细致说明了系统的设计与实现过程。最终以实例数据结果表明,本系统具备较高的辅助翻译质量和准确率,可充分满足学术专业文献的翻译需求,且具备良好的扩展与二次开发性。
参考文献
[1] 钱多秀.计算机辅助翻译[M].北京:外语教学与研究出版社,2011.
[2] 李丹,许霄羽,杨悦.基于语义网技术的网络机器翻译研究[J].现代电子技术,2011,34(4):107?109.
[3] 李长栓.非文学翻译[M].北京:外语教学与研究出版社,2009.
[4] 宋淑彩,庞慧,丁学钧.GA?SVM算法在文本分类中的应用研究[J].计算机仿真,2011,28(1):222?225.
[5] 谌婉莹.TRADOS翻译软件运用中术语收词问题研究[D].重庆:重庆大学,2016.
[6] 郭转辉.TRADOS翻译科技英语的译文质量测评[D].重庆:重庆大学,2011.
[7] 李伟.Trados辅助翻译软件在科技英语翻译中的应用[D].武汉:华中师范大学,2012.
[8] 王晓凤,张建伟.科技词汇的范畴化动因及其语义认知与翻译[J].中国科技翻译,2011,24(4):1?4.
[9] 闫冰.TRADOS在促进译者快速学习和提高翻译产出效率方面的积极作用[D].上海:上海外国语大学,2012.
[10] 吴承凤,刘涛.机器翻译中的多模糊语义自动判断方法研究[J].现代电子技术,2017,40(14):75?77.
[11] 于佳弘,庄天赐,昌雨荭.浅谈Trados辅助翻译软件和语料库在公开课英文字幕翻译中的应用[J].知识经济,2019(36):103.