杨 琳
(外交学院,北京 100091)
近年来,人工智能(Artificial Intelligence)飞速发展,不断为其他领域带来工作模式的革命。在口笔译领域,研究人员将语音识别(Speech Recognition)和机器翻译(Machine Translation)技术相结合,由此产生了语音翻译技术(Speech Translation)。随着语音翻译器的翻译速度和质量不断优化,软件开发者和翻译工作者对其的关注度逐渐提高。
语音翻译技术的出现和发展催生了计算机辅助同传(Computer-Assisted Simultaneous Interpreting)的工作模式,是指在同传口译中翻译机器为人类译员提供参考资料(包括词汇表、实时转写字幕和翻译字幕等),以期减轻译员压力,提升口译质量。在日常练习和实际工作中,学生译员经常需要翻译带有大量专业术语、长句和信息密集句的讲话,这些都是同传中的难点。根据Gile的精力分配模型,译员的总处理能力(TA)有限,对其听力与分析(L)、产出(P)、记忆(M)和理解(C)的总要求(TR)不可超过其总处理能力(TA)。[1]当遇到口译难点时,对译员的总要求往往会超过其总处理能力,可能导致译员出现错译、漏译和模糊处理等问题。
本研究采用实验和问卷调查相结合的方法,探究学生译员在同传口译中遇到术语、长句和信息密集句等口译难点时,能否在语音翻译器的辅助下提升口译表现。最后,文章根据实验和问卷结果,就如何优化语音翻译器进行讨论。
语音翻译(Speech Translation)是指计算机识别讲者声音和讲话内容,随即把实时翻译字幕展示在计算机屏幕上的技术。许多软件开发者和译员都高度关注该技术。例如,Jiang和Lu认为,语音翻译器译文产出效率较高,支持语种较多,成本也较低;然而,它们无法识别一些方言、无法传达讲者的情绪。[2]
语音翻译器可以同时提供实时转写文本和翻译字幕,因而它们可能在实际工作中减轻口译员的精力分配负担,提升口译质量。当应用于同传时,该工作模式就可称为计算机辅助同传(CASI)工作模式。
对人工智能和翻译机器未来是否会取代人类译员的问题,学界观点尚未达成一致。一些学者认可人工智能的优势。例如,王华树等指出,人工智能翻译工具的智能程度正不断提高,比如Google Assistant甚至能够像人类译员一样,发音自然、语速流畅、停顿适当、精准识别语音和语义,从而产出精确的翻译。[3]
另外一些学者则指出现有语音翻译器的缺点,认为人类译员不可替代。比如,邓军涛等指出,人类译员在实际工作中需要扮演文化协调者、对话促进者、发言者、支持者等多重角色,这些都是人工智能目前无法胜任的。[4]
考虑到现存语音翻译器的优缺点,部分学者讨论了人类译员和语音翻译工具之间的关系。比如,许文胜等认为,虽然信息技术飞速发展,但翻译机器并不能取代人类译员,人类译员需要灵活运用机器的辅助功能,实现人机协同。[5]
为探索使用语音翻译工具辅助人类译员的可能性,李润美开展了口译实验,目的是测试工具的实时翻译字幕是否有助于减轻学生译员的负担,并探究工具在交传过程中发挥的作用。研究得出,学生译员借助以IFLYREC为代表的语音翻译工具可以提高口译准确性和完整度。[6]然而,其口译质量评估标准及量化打分时各项权重的科学性有待商榷。孙海琴等开展了口译实验和问卷调查,认为IFLYREC在人类译员翻译数字等客观信息时会产生帮助,而在人类译员翻译逻辑等主观信息时会产生干扰。[7]由于实验结果仅仅通过比较机器组和非机器组各项平均分的方法进行评估,没有进行显著性检验,实验结果的可信度有待讨论。
基于现存研究结果,文章旨在探讨IFLYREC实时语音翻译字幕能否提升学生译员在英中同传中,尤其是在遇到术语、长句和信息密集句等口译难点时的口译表现。
为探究IFLYREC语音翻译器能否提升学生译员同传口译表现,本实验提出以下假设:(1)IFLYREC能够帮助学生译员减轻信息输入、处理和输出负担;(2)IFLYREC能够帮助学生译员提升英中同传总体质量;(3)IFLYREC能够帮助学生译员提升英中同传中的术语、长句和信息密集句等难点的口译质量。
本实验邀请16名外交学院MTI专业研究生二年级学生作为被试。他们自入学以来学习的课程完全相同,全部进行了大量交传和同传培训,均通过了CATTI英语二级口译考试。他们被随机分为A组和B组,每组8人。
科大讯飞IFLYREC语音翻译器发布于2020年,提供包括中英文等语言的实时语音识别和翻译服务。据IFLYREC官网显示,其实时语音识别准确率达97.5%,在国内语音识别行业中处于领先地位,曾获“最值得信赖服务商”称号。因此,为给被试提供最大限度的帮助,本研究选择IFLYREC作为语音翻译工具。
为帮助被试熟悉IFLYREC的工作模式,笔者在实验前一周制作了一段1分钟的演示视频供其学习,屏幕上半部分播放演讲视频,下半部分展示IFLYREC实时翻译字幕。视频内容与正式实验材料无关,形式与正式实验材料完全一致。正式实验材料为一篇金融领域的英语演讲,讲者是King's Business School金融学教授Patrick Boyle,主要分析了恒大(Evergrande)的破产与中国整体经济以及过去30年的某些经济决策之间的联系。笔者选取两处讲者语速相当、长度相当,所含术语、长句和信息密集句数量基本一致的段落,分别命名为A部分和B部分。两部分术语数量均为30,长句数量分别为18和17,信息密集句数量分别为22和19,具有可比性。由于所选材料中长句和信息密集句高度重合,本实验选取同时满足两个条件的句子作为分析对象。
本实验采用交叉验证设计(见表1)。翻译A部分时,A组为对照组,无IFLYREC实时翻译字幕辅助;B组为实验组,有IFLYREC实时翻译字幕辅助。翻译B部分时,B组为对照组,无IFLYREC实时翻译字幕辅助;A组为实验组,有IFLYREC实时翻译字幕辅助。
表1 实验设计
实验地点为外交学院语音教室。实验全程录音,方便笔者将音频转写成文字稿,用于后续打分、统计和分析。
A组首先进行实验,先进行A部分的同传,无IFLYREC辅助。A部分结束后休息五分钟。随后,进行B部分的同传,有IFLYREC辅助。
然后B组进行实验,先进行B部分的同传,无IFLYREC辅助。B部分结束后休息五分钟。随后,进行A部分的同传,有IFLYREC辅助。
1.评分机制
为评估被试的术语口译表现,本研究参考徐然(2018)的术语准确度评分系统。[8]该评分系统把术语口译错误分为六类:“错译”“漏译”“搭配不当”“语法错误”“发音错误”和“语义错误”。由于该实验的译出语是母语,故不考虑发音错误;该实验仅评估术语本身是否译对,故不考虑句子层面的语法错误和语义错误。评分细则详见表2。
表2 术语翻译评分细则
为评估被试的长句和信息密集句口译表现,本研究参考韩潮(2021)的口译质量评估体系,包括“信息完整度”“表达流畅度”和“语言质量”三个指标。[9]然而,该体系没有给出每项指标的权重或计分方式。因此,本实验设计了一套量化评分细则(见表3):
表3 长句和信息密集句翻译评分细则
本实验的评分员由笔者担任。笔者将被试的口译转录文本与原文逐一进行对照,对每位被试的每个术语翻译进行打分,对每个长句和信息密集句的信息完整度、表达流畅度和语言质量分别进行打分,并对每位被试的口译整体表现进行打分。然后,笔者以有无IFLYREC辅助作为区分,对以上所有指标进行了显著性检验。
2.实验结果
由表4可知,对A部分的术语而言,有IFLYREC辅助的译员比无IFLYREC辅助的译员均分更高,表现明显更好(p<0.05);对B部分的术语而言,有IFLYREC辅助的译员比无IFLYREC辅助的译员均分更高,表现更好,虽然差异不显著(p>0.05)。
表4 术语翻译显著性检验结果
由表5可知,在翻译A部分的长句与信息密集句时,在信息完整度、表达流畅度、语言质量和总体口译质量方面,有IFLYREC辅助的译员比无IFLYREC辅助的译员均分更高,表现更好,尤其是在信息完整度上的差异较为显著(p<0.05)。然而,B部分的结果与A部分截然相反。具体来讲,有IFLYREC辅助的译员在信息完整度、表达流畅度、语言质量和总体口译质量方面的表现均不如无IFLYREC辅助的译员,虽然差异不显著(p>0.05)。
表5 长句与信息密集句翻译显著性检验结果
综上所述,两部分的实验结果不完全一致。总体来讲,有IFLYREC辅助的学生译员的术语口译表现优于无IFLYREC辅助的学生译员。但在长句和信息密集句方面,IFLYREC并不一定能帮助学生译员提升口译表现。
为找出可能导致两部分实验结果不完全一致的原因,笔者给所有被试发送了问卷,询问他们IFLYREC是否对其口译过程产生了帮助或者干扰,以及在未来工作中是否愿意使用IFLYREC等。
75%的被试认为IFLYREC有利于提升其术语口译表现。部分人提到,IFLYREC的一些专业术语翻译帮助其减轻了处理信息的负担;若涉及陌生领域,IFLYREC可以在其难以听懂时提供帮助。相比之下,只有25%的被试认为IFLYREC对其术语口译表现产生了负面影响或几乎没有影响。
超过50%的被试认为IFLYREC对其长句和信息密集句口译产生了干扰。部分人提到,IFLYREC翻译字幕延迟时间过长,导致其在等待时错过了后面的信息。
超过40%的被试表示不确定在以后的工作中是否会使用IFLYREC。部分人提到,如能减少IFLYREC实时翻译字幕的延迟,并提高其翻译准确性,他们会更愿意使用IFLYREC。
以上实验数据与问卷结果显示,在两个部分中,有IFLYREC辅助的学生译员都比无IFLYREC辅助的学生译员的术语表现更好;而在长句和信息密集句上,两组的实验结果截然相反,未呈现明显的趋向性,故就被试的术语表现进行探讨。
1.术语错误类型
笔者首先将术语错误进行归类。由表6和表7可知,在两个部分中,最常见的错误类型都是漏译,其次是错译和搭配错误。这说明在大多数情况下,学生译员选择省略他们不知道的术语。此外,该实验中术语的漏译大多是比较严重的漏译(单个术语得分为0分),造成了原文意思严重缺失或扭曲。
表6 术语错误数量及占比(A部分)
表7 术语错误数量及占比(B部分)
另外,在两个部分中,有IFLYREC辅助的被试术语错误总数小于无辅助的被试术语错误总数。值得注意的是,有IFLYREC辅助的被试比无辅助的被试漏译总数更少。这表明IFLYREC帮助人类译员减少了术语漏译。
2.IFLYREC帮助学生译员提升术语口译质量
(1)补充遗漏术语
在翻译专业性强、信息密度大的讲话时,学生译员经常遇到不熟悉的术语。这时,IFLYREC的实时翻译字幕便可能为学生译员提供借鉴。比如,在A部分中,A3最初没有翻译cut corners,但几秒钟后IFLYREC提供了这个术语的实时翻译,她便立刻将遗漏的术语补充在了下一句译文中。
原文:There have been lots of issues with this model where often the property developers cut corners in construction because the buildings have already been sold.And this has led to what the Chinese called“tofu-dreg construction”,where the builder might have skimped on rebar,padded out the concrete with old bottles and things like that to save money.
译文:有、因为有、但是还是会存在很多问题。比如说豆腐工程经常发生。就是说,房地产开发商会偷工减料,减少自己的成本。
在原文中,cut corners比tofu-dreg construction出现得更早,但A3在译出“豆腐工程”之后才译出“偷工减料”。这可能是因为她不知道cut corners这个术语,但IFLYREC的实时翻译字幕帮助她理解了它的意思,因此她选择了在下一句补译。虽然她改变了原句顺序,但未影响听众理解。由此可见,IFLYREC可以帮助学员增补漏掉的术语,从而提高整体信息完整度。
(2)提高术语口译准确性
若学生译员能善用IFLYREC,可能会提高术语口译准确性和整体信息完整度。例如,笔者在转录B4的译文后发现,其翻译非常紧贴IFLYREC的翻译。统计得出,B4是16位被试中术语出错次数最少的。其15处术语翻译中,有9处与IFLYREC的翻译完全相同,因此其信息完整度在16位被试中排名第3(见表8)。这说明IFLYREC的实时翻译可以帮助译员提高术语口译准确性和整体信息完整度。
表8 信息完整度得分及排名(B部分)
(3)不可过度依赖IFLYREC
在评估B4在B部分中的表达流畅度和语言质量后发现,其口译整体质量并不高。由表9可知,即便其信息完整度在16名被试中排名第3,其表达流畅度和语言质量仍排名第13,三项指标总分仅排名第10。
表9 信息完整度、表达流畅度和语言质量得分(排名)(B部分)
续表
为探究过度依赖IFLYREC的实时翻译对B4整体口译表现产生负面影响的原因,笔者仔细研究了她的译文,发现其存在颠倒因果关系和指代不清等问题。这说明她没有充分理解讲者的逻辑。在实际工作中,会给听众造成困惑甚至误解。因此,即使在IFLYREC的辅助下准确地翻译了术语,整句口译质量也不一定会提高。这说明译员应多注意句子的逻辑,而不是只注重个别术语的翻译。
综上所述,IFLYREC可以帮助学生译员补充遗漏术语,提高术语口译准确性,从而提高整体信息完整度。但是,如果在未充分理解原文的情况下过于紧贴IFLYREC的翻译,容易忽略甚至扭曲原文的逻辑和意思。
1.减少实时翻译的延迟
实验数据和问卷结果显示,实时翻译延迟过多是IFLYREC目前最大的问题。75%的被试者表示,当IFLYREC终于展示出他们希望参考的句子的翻译时,讲者平均已经往下讲了两三句,因而大多数译员选择放弃前面的句子。在机助同传中,如果机器翻译延迟过多,对口译员的帮助就会大打折扣。因此,开发者应尽量减少IFLYREC实时翻译字幕的延迟。
2.提高译文准确性
虽然IFLYREC的语音识别准确率达97.5%,但其语音翻译的准确率还有待提高。在该实验中,IFLYREC有时会出现错译现象。
原文:The“three red lines”were hard limits on a property development company'sdebt to asset ratio,itsdebt to equity ratio,and it'scash to short-term debt ratio.
译文:这三条红线是对房地产开发公司债务的硬限制。资产比率,它的债务与权益比率和现金与短期债务比率。
该句包括三个术语:“资产负债率”“债务股本比”和“现金短债比”。但IFLYREC只正确译出了一个,这可能是因为语料库数据不足。此外,IFLYREC对此句的断句不当,大大扭曲了原意。因此,为增强人类译员对IFLYREC的信任度,开发者应扩充语料库,提升句子结构识别准确度,以提高实时翻译准确性。
3.优化语法纠错功能
部分被试表示,IFLYREC有时会连续多次修改同一个句子的翻译,严重分散他们对下面句子的注意力。事实上,语法纠错(Grammatical Error Correction)是自然语言处理(Natural Language Processing)领域最重要的应用之一,目的是通过参考相邻的单词乃至整句来自动检测和纠正语法错误[10],以改善语法和表达,提高整个文本的可读性[11]。机器在翻译过程中,由于对词汇、标点和句子结构等识别错误,需要不断自我纠正。以下句子是该实验中IFLYREC进行语法纠错的典型例子:
原文:It's kind of hard to say.It does make sense for them to worry about the high levels of real estate debt and debt in general.
译文:很难说。他们担心房地产的高水平、债务和总体债务是有道理的。
对该句的翻译,IFLYREC反复修改了3次,耗时8秒钟。虽然最终确定的译文基本正确,但8秒对同传来说已经是相当长的延迟,IFLYREC的实时翻译几乎毫无意义。因此,开发者应优化IFLYREC的语法纠错功能,以使其能更好地辅助人类译员。
本研究采取实验和问卷调查相结合的方法,探究了IFLYREC实时翻译字幕是否有助于提升学生译员在英中同传中的口译表现。结果显示,IFLYREC在总体上对译员术语口译帮助较大,而在长句和信息密集句口译上作用不大。IFLYREC尚有优化空间,建议开发者减少实时翻译字幕的延迟,提高译文准确性,并优化语法纠错功能。
本研究还说明,口译活动中仅依赖翻译软件是不明智的,传统口译培训中讲授的口译策略依然重要。当学生译员遇到口译难点时,仍需熟练地接收和分析信息,善用口译策略,保证表达流利度和语言质量。因此,现阶段专业口译培训仍具有重要意义。
受技术和现实条件限制,该实验仅包含16位被试者,未来研究应尽可能扩大样本容量,以增强实验结果的可信性。另外,笔者是本次实验唯一的评分员。条件允许时应邀请多位评分员,以降低评分过程的主观性。此外,也可对被试进行访谈。口译是一种高度主观的活动,通过与被试交谈,研究人员有机会了解机助口译模式下更多发人深省的细节。
随着人工智能技术的深入发展,各种计算机口译工具不断涌现,为人类译员带来工作模式的革命。人类译员应在熟练运用传统翻译技能的同时,勇敢地拥抱新兴技术,更好实现人机协同,促进自身工作效率提升、质量提高、体验优化。