电动汽车安全标准中英文平行语料库的构建

2020-09-02 15:58濮宏宇王炼可
关键词:语料库电动汽车

濮宏宇 王炼可

摘 要:语料库因其规范性、流通性、实用性已受到了社会各界的广泛认同。本文以欧盟电动汽车安全标准为例,尝试构建一个基于欧盟电动汽车的国际安全标准反映其电动汽车安全问题的小型中英语料库,并在此基础上使用计算机翻译辅助软件SDL Multiterm 2019 Extract提取中英文術语,制作电动汽车安全标准中英文对照术语表,对语料库的构建进行了经验的总结,发现并分析了中国电动汽车安全标准中术语翻译中的不足之处并提出了改进意见。

关键词:语料库;电动汽车;安全标准;翻译技术

0 引言

近几十年来,西方学者在以语料库为基础的汽车术语翻译的研究领域取得了丰硕成果,有关汽车术语语料库的建设得到了世界各国的广泛重视和支持。虽然国内语料库发展势头良好,但仍存在诸多不足,尤其是在电动汽车领域有所欠缺。

在电动汽车相关语料库的研究与国际贸易蓬勃发展的大背景下,进出口商品的安全标准正逐渐成为不可或缺的存在。同时,欧盟所制定安全标准的中英翻译需要极高的准确性和严谨性,这也推动了安全标准语料库的研究与发展。关于电动汽车法规标准的翻译,各大车企都有过相关的研究经历,但这使得翻译版本众多,其中有些术语的翻译不一致,容易造成误解。本课题尝试建立一个基于欧盟电动汽车的国际安全标准反映其电动汽车安全问题的小型英汉语料库,不仅能使欧盟电动汽车安全标准相关的翻译工作更加便捷、规范,也能帮助国内众多电动汽车企业更好了解他国相关的安全法规,为进入其市场做好充足的准备。

1 相关概念及语料库发展现状

1.1 术语的概念

术语又称技术术语、科技术语、科学术语或技术名词。术语是在特定专业领域内对一般概念的词语的指称。术语是在特定学科领域用来一般表示概念的称谓的集合。术语是通过语音或文字来表达或限定科学概念的约定性语言符号,是思想和认识交流的工具。

术语又可被大致分为简单术语、复杂术语、借用术语和新术语四类。简单术语和复杂术语的区别在于是否能再被分割成更短的术语。借用术语是取自其他专业领域的术语。新术语则为某个概念而创立的全新术语。

1.2 语料库的定义

语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。

双语平行语料库一般指的是原文本及其对应的翻译文本构成的语料库,相较于其他工具,双语平行语料库对翻译的辅助功能更为显著。相较于传统意义上的语料库而言,平行语料库对于语言对比研究、翻译教学、翻译技术开发、双语词典编纂等研究方向上蕴含着巨大的潜力,因此平行语料库的建设在全球范围内得到迅猛发展。

1.3 语料库以及计算机辅助翻译目前的发展情况

自从20世纪90年代以来,语料库不断地与翻译实践相结合,并发挥着越来越重要的作用。我国双语平行语料库的建设在近十年以来也取得了重大进展,已建成多个中英、中日等双语平行语料库。相较而言,国内基于语料库的研究方向大多比较笼统,通常选择大角度,可以说以电动汽车的为研究对象的语料库更是少之又少。虽然双语平行语料库和计算机辅助翻译已然成为学术界的热门,但我国目前尚无专门以电动汽车安全标准为基础建立的平行语料库,汽车行业内的相关语料库也没有完整的体系,针对电动汽车安全标准等具体方面的研究更是屈指可数。

2 语料的采集与语料库的构建

2.1 语料查询与采集

构建语料库第一项工作便是对语料进行采集。为保证语料的专业性,项目组从国际自动机工程师学会(原译:美国汽车工程师学会)官网(https://www.sae.org/standards/),欧洲标准化委员会官网(https://www.cen.eu/Pages/default.aspx)以及欧洲经济委员会官网(http://www.unece.org/publications/) 上采集了英文原版的有关电动汽车安全标准的各项文件,其涵盖了自2000年至2020年之间发布的语料。采集语料时,项目组将与电动汽车安全标准评估息息相关的性能试验方法文件也纳入了语料库中,同时也参考了由中国国家标准化管理委员会发表的国家标准和相关行业标准,还删除了内容重复的语料和语料中的图表。

2.2 语料的整理与规范

由于从网络上直接采集的语料存在着乱码多、标点符号混乱、格式紊乱、语料重复等一系列问题,所以无法第一时间直接对语料进行提取排序,需要对其进行一定的调整。针对这些问题,项目组借助计算机软件对文本进行了规范化处理。得益于软件的替换功能,语料中的所有全角字符和半角字符得到了统一,多余的空格和全部乱码也被删去,语料的行文格式也有了一定的规范。与此同时,我们记录下了整个规范处理的过程,不仅规范了操作,也将方便日后的查询和参考。

2.3 建立高频词语料库

在美国汽车工程师协会(SAE)、欧盟汽车标准法规体系(EN)和欧盟汽车标准法规体系(ECE)所出台的有关电动汽车的安全标准中,其制定者对于汽车概况、技术参数、动态性能指标、安全装置、试验方法等方面进行了详细的规定。词频是一种用于文本挖掘的常用加权技术,用以评估一个词对于一个文本或者一个语料库中的一个领域文件集的重要程度。通过学习高频词汇和短语,能够在短期内扩大自身的有效词汇量,帮助理解文献各段落的含义。项目组在提取了三大电动汽车安全标准中的高频词汇后,通过排序整理发现其中排名前三的高频词汇分别为battery(电池)、charge(充电)和test(测试)。这一结果也突出了安全标准的侧重点,即规定电动汽车上各项元件的基本参数,安全要求和各项性能的试验方法,从而对电动汽车行业内的设计、生产和使用进行标准的统一与规范。其余高频词除 vehicle(车辆)、power(动力)、system(系统)外,大部分都属于组装汽车的重要部件,如motor(电动机)、brake(制动装置)、chassis(底盘)、generate(发电机)、suspension(悬架)、converter(转换器)、transformer(变压器)、sensor(传感器)等,其余的一些高频词汇则是物理学或是其学科领域内所涉及到的专业术语,如amplitude(幅值)、frequency(频率)、phase(相位)、coupling(耦合)、damping(阻尼)、strength(强度)、rigidity(刚度)等。

通过分析语料中出现的高频词汇并对其进行分类,从而熟悉并掌握电动汽车安全标准及部分性能指标的试验方法所对应的英文释义。其中值得注意的是,我們所选取的电动汽车安全标准中所涉及的绝大多是以车用动力电池或燃料电池作为动力源,带动电机运转,从而驱动车轮旋转使汽车行驶。因此在安全标准中voltage(电压)、current(电流)、capacity(容量)同样为高频词。对于某些反复出现的重要词汇,找出相应语境共现材料,应对其着重关注。例如以 battery作为检索词,在10063条术语中进行搜索,得出与其相关的短语和句子,共计有317条。

对提取的术语进行分析,我们从中得知,相关安全标准中关于电池的所提及到的内容主要包括了battery system(电池系统)、battery cells(电池电芯)、battery module(电池模组)、battery pack(电池包)、thermal management system(热管理系统)、heat exchanger(热交换器)等内容,同时也通过battery这一词汇更好地了解了polymer , electrode等术语,从而对电动汽车用电池的含义有了更为深入的见解。

3 实践总结

在语料库的建设过程中,语料的原文与译文本应是双向对应的,但在很多情况下,由于电动汽车语料术语定义形式的多样化导致了术语的翻译往往不唯一,换句话说,有时候一个英文术语对应多种不同的翻译,同时一个中文术语往往有着多种不同的英文表达方式。例如在构建语料库过程中反复出现的概念“Engine”,它所对应的翻译可以是“引擎”或者是“发动机”;在各大安全标准中经常被提及的“幅值”的概念,在文本中既出现过“Amplitude”,同时“Magnitude”也有被使用过,究竟哪一个更为合适,这些问题都需要单独分析,并且也少不了项目成员之间达成共识。

4 结语

近年来,在我国开放型经济发展战略和“一带一路”合作倡议等国家重大方针政策的引领下,我国对外出口商品的市场规模也在不断地扩大。语料库对于跨国贸易和专业培养的作用越来越受到重视。本文尝试将英语语料库引入电动汽车安全标准领域,是对相关语料库应用工具软件的开发的一次重要尝试,既能帮助国内众多电动汽车车企业更好了解欧盟相关的安全法规,从而进而更容易打入国外市场,同时也为培养高素质汽车专业人才提供了有效渠道。

参考文献:

[1]骆嘉宇,徐朱迪,金笑帆,赵若彤.中国海关法律法规中英文平行语料库的构建及计算机辅助术语提取研究[J].科技展望,2016,26(15):

331-332.

[2]韦萧萧,陈标,程泊静,谭慧.基于语料库的汽车专业英语教学模式探索——以湖南汽车工程职业学院特斯拉项目班为例[J].教育现代化,2019,6(19):94-95.

[3]高书娜.语料库“数据驱动”的汽车专业英语教学模式改革探索[J].西南师范大学学报(自然科学版),2016,41(10):168-172.

[4]王文君.翻译实践中术语的提取和翻译[D].上海外国语大学,2014.

[5]周阔.运用“塔多思”软件解决协作式翻译中的一致性问题[D].北京交通大学,2013.

[6]高爽.基于语料库的海事英语术语提取研究[D].大连海事大学,

2011.

[7]顾铖.图情档术语自动提取研究[D].南京大学,2011.

猜你喜欢
语料库电动汽车
基于无桥隔离SEPIC转换器的电动汽车充电设备
基于语料库翻译学的广告翻译平行语料库问题研究
浅谈语料库分类及用途
国内外语料库建设研究简述
运用语料库辅助高中英语写作
2020年北京私家电动汽车将基本“一车一桩”
北汽电动汽车登陆上海
电动汽车血泪史:特斯拉从中能学到什么?
语料库与译者培养探索