模拟机器辅助功能对英汉同声传译表现的干预研究

2021-01-08 04:16:44肖鸾仪王艳艳

广东第二师范学院学报 2020年6期

肖鸾仪，王艳艳

(上海对外经贸大学国际商务外语学院，上海 201620)

《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》提出“一带一路”建设是“开放的、包容的，欢迎世界各国和国际、地区组织积极参与，得到了国际社会的广泛认同与积极响应”[1]。口译服务作为“一带一路”建设不可或缺的重要基础保障与先导工程，越来越被研究人员重视，人工智能以及机器翻译技术在口译与笔译领域的运用也得到了愈来愈多的关注。何家宁指出，将译入语在较短的时间内，以口语的方式转换为译出语，这样的活动被称为口译也称传译[2]。其中，同声传译是口译的重要形式之一，指的是口译员接受原语信息输入，几乎在同一时间，将原语信息进行理解、分析、转换，并将信息以目标语表达输出[3]。

随着神经网络翻译技术不断发展，机器同传系统的构建已基本实现。2018年上半年博鳌亚洲论坛，首次出现了全自动人工智能机器同声传译。然而，全自动机器同传的现场实战译文仍然存在不足[4]，机器翻译领域的人工智能研究陷入瓶颈期[5]。造成这个瓶颈期的原因之一是研究者过度考虑如何让机器取代译者完成翻译(笔译/口译)任务，而非辅助译者去完成相关翻译工作[6]。赵军峰、许艺认为机器翻译的研究初衷是成为译员的辅助性工具，而并非替代人完成这项工作[7]。因此，对基于深度学习的仿真神经网络技术的应用，译者可以借助机器的语音识别功能、文本转换功能、翻译功能等，提升自身口译输出质量[8]。例如，邵华、杨晓峰提出的“人+机器”口译模式，是对机器辅助口译员提高目标语输出质量模式的探索。然而，机器是否能够切实辅助译者翻译，提升译者的输出质量，不同译者根据各自实践经验持有不同见解[9]。例如，高紫璇从语气、经验等角度阐释了机器辅助在同声传译中应用的局限性[10]。张媛的研究类比机器辅助同传与带稿同传，从口译节奏理论说明机器辅助难以达到带稿同传的质量，更加难以提高盲稿同传输出质量，机器翻译的准确性是否会产生新的问题也尚待研究[11]。机器辅助功能对同声传译员输出质量影响的跨学科实证研究，也是探究人与机器交互模式的一个方向[12]。因此，本研究以模拟机器辅助功能为干预手段，探析在不同主题背景下，模拟机器辅助功能对英汉同声传译员目标语输出质量的影响。

一、同声传译员工作模式与模拟机器辅助翻译流程

同声传译员的工作模式主要分为两个模块，即语音模块与信息处理模块。其中，语音模块包括语流输入和语流输出两部分；信息处理模块包括协调能力和语料库两部分，协调能力包括听力理解、瞬时记忆、断句切割、翻译策略、译文输出，语料库包括原语语料库和目标语语料库[8]。

模拟机器辅助翻译的工作流程分为三个模块，即语音模块、语音文本双向转换模块、机器翻译模块[4]。其中，语音模块包括语音识别和语音生成两部分；语音文本双向转换模块包括原语的语音到文本转换和译语的文本，再到语音转换两部分；机器翻译模块则是由机器完成整个语言处理过程。

对比同声传译员工作模式与模拟机器辅助翻译流程发现，两者的工作模块中都存在语音模块和信息处理模块。其中，语音模块均是负责原语输入的识别和目标语译文的输出，同声传译员的信息处理模块是通过自身的多任务协调能力与语料库积累程度来完成，模拟机器辅助翻译的信息处理模块是通过机器翻译系统实现的。模拟机器辅助翻译的工作流程中增加了语音文本双向转换模块，因为模拟机器是通过语音文本的识别转换来实现翻译目的的。并且，由于人工智能机器所接受的语流可能具有碎片化和随机化的特征，所以对机器的硬件和软件也有一定的要求。

二、模拟机器辅助功能的构建原理

公开语音识别的数据显示，基于深度学习的机器翻译，已基本实现高准确率从原语语音识别到原语或者译语的文本生成，这为本研究提供了有效的技术支持背景。机器辅助通过语音文本双向转换模块，实现借助文本形式，辅助译者完成听力理解、瞬时记忆、断句切割、翻译策略的信息处理任务。机器辅助指的是译者在完成口译任务时，需掌握的听辨技巧、记忆技巧、笔记技巧均可以由机器辅助完成[9]。演说者的原语，不需要译者来听辨，机器可以瞬时将演说者的原语进行语音识别，并转换成文本展现在译者面前的电脑上，这种不需要译者做笔记来记录演说者所讲的内容，理论上可以实现帮助同声传译员解决听不准、记不住、写不完等常见同传问题。在语音识别与机器翻译的辅助下，同声传译员经常提出的听辨、记忆、笔记等问题，由机器替代人工完成。基于以上原理，笔者设计了下面的干预实验，通过对照组、实验1组和实验2组观测机器辅助与英汉同声传译员输出质量的关系。

三、研究设计

(一)研究问题

本研究采用模拟机器辅助功能以达到增加语音文本双向转换模块的目的。研究主题加入“模拟”这个概念，旨在强调实验过程中应用的不是相关软件如语音文本转换器或语音机器翻译等设备，而是模拟机器辅助功能，对音频材料进行先期文本添加处理来达到语音文本转换的目的。该实验手段的优势在于，重复实施本实验不需要大规模购置人工智能辅助口译的机器软件或硬件设施，扩大了本研究的可重复性实验的范围。本实验可以通过先期处理音频材料来模拟机器辅助功能，具体实施实验的场所是院校的同传实验室、机房等。

本研究的研究问题是：

第一，模拟机器辅助功能对英汉同声传译整体输出质量产生什么作用？

第二，不同主题背景在模拟机器辅助英汉同声传译输出质量影响的研究中是否具有调节作用？

(二)研究对象

根据口译能力与口译表现发展的特点，本研究选取辽宁省某高校大三学生为研究对象。被试共计177名，来自3个平行班级，每个班级学生被随机等分成3组，即对照组、实验1组、实验2组。本次研究所选取的研究对象熟悉实验地点，并在上一学年度已经完成基础口译课程，具备完成初级同传任务的知识与技能，以及完成本实验测试项目的英语能力、口译能力。

(三)研究过程

本研究采用干预性实验研究手段，随机对照实验设计，以一个完整的授课班级作为基本单位，以独立个体为研究对象，将学生随机分配到对照组和实验1组、实验2组，对被试进行多次测试，观察模拟机器辅助功能对英汉同声传译输出质量的影响效果，重点观测群体平均水平和发展趋势的差异，关注干预的即时效果。

本研究采取随机干预实验方法，实验分为实验前、实验中、实验后三个阶段。实验前为实验准备阶段，对实验内容进行选取，选取的材料与被试学生同声传译能力相匹配，符合其语言认知规律和口译输出水平。音频材料分金融和科技两个主题，均节选自中国环球电视网(China Global Television Network，CGTN)，原语为英语，每个主题包含一个段落，每个段落词数在120～130之间, 词汇难度、句法难度与文本难度等级采用LanguageData进行检测，选取符合大学英语中等水平的段落。

在模拟机器辅助功能对音频材料进行先期文本添加处理时，采用Camtasia Studio 进行编辑。首先，不同主题音频段落按照金融、科技先后顺序排列，合并成一个音频文档，主题与主题之间间隔1分钟。其次，音频按照添加文本语种的不同类型分别进行两次独立处理，添加的文本分为英文原文文本和中文译文文本两种。在处理英文原文文本添加时，文本根据音频原文的播放顺序，逐词出现，符合人工智能语音文本转换显示的特点，即演说者没有说出的话将不会以文本形式呈现在屏幕上，文本内容与音频内容保持同步出现。在处理中文译文文本添加时，由于汉语和英语的语序不同，中文译文词汇的出场顺序与英文可能存在差异，本研究根据机器翻译特点，在处理译文文本添加时，中文译文词序基本符合英文词汇出场顺序，句子意思基本通顺，精确的笔译文本在本研究中被排除。最后，三组不同音频文档分类处理完毕，即无文本辅助的音频文档、有英文原语文本辅助的音频文档、有中文译语文本辅助的音频文档。

实验在可容纳百人的机房展开。实验前，将三组音频文档提前拷贝在实验机房的电脑上。根据实验设计将被试随机分成三组，即对照组、实验1组、实验2组，三组不同音频文档也根据被试人数进行分配，电脑与电脑之间保持两个位置的间隔，并立有标识予以区分。实验时，被试学生进入机房随机选取有标识的电脑就座后，打开各自手机录音功能放到自己面前，戴上耳机播放已经拷贝在电脑上的音频文件并开始同声传译。实验后，学生将各自的录音文件，标明学号、姓名、音频文件序号，发送到指定邮箱，笔者随后对被试学生同声传译质量进行评分并进行统计处理，对对照组和实验1组、实验2组主要进行两个阶段的分析，数据分析应用SPSS软件。

实验第一阶段，重点观测模拟机器辅助功能与学生英汉同声传译整体质量的相关性，重点观测无文本辅助(对照组)、有英文原语文本辅助(实验1组)、有中文译语文本辅助(实验2组)的干预程度下，学生口译水平的区别，采用单因素ANOVA方差分析法。

实验第二阶段，进一步探析不同主题背景下模拟机器辅助对英汉同声传译输出表现是否具有调节效应，将不同程度的模拟机器辅助功能与两个主题背景交互效应的显著性进行对比。数据分析应用双因素混合实验方差分析法观测其交互效应，以及其不同假定吸引子状态的单因素与双因素差异比对分析。

四、实验结果

(一)模拟机器辅助功能对英汉同声传译整体口译质量的影响

实验第一阶段结果(见表1)发现，无文本辅助的对照组59名学生，平均成绩为74.12，采用英文原文文本辅助口译的被试学生平均成绩为74.88，采用中文译文文本辅助口译的被试学生平均成绩为76.61。对照组学生整体平均成绩略低于有文本辅助的实验组学生成绩，采用中文干预组的被试成绩高于其他两组学生。

表1 三组学生口译成绩平均分

在方差齐性检验中，通过单因素方差同质性检验结果显著性P=0.429>0.05, 说明方差齐性的假设成立，因此方差分析的结果值得信赖。ANOVA检验结果显示，F=1.307，P=0.273>0.05，见表2。F值不显著说明主效应不显著，这三个组别间至少有两个组之间是不存在任何显著性差异的，即不同文本辅助程度对被试英汉同声传译质量不存在显著影响。因此，不再继续进行事后检测的多重比较。结果显示，实验分析第一阶段中，自变量对因变量的变化没有直接效应。因此，第二阶段分析中加入调节变量“主题分类”继续观测干预手段是否通过其他变量协同影响学生英汉同声传译输出结果。

表2 ANOVA单因素方差显著性检验

(二)不同主题背景下模拟机器辅助对英汉同声传译表现的影响

实验第二阶段结果(见表3)显示，“金融”主题背景下，对照组学生平均成绩为37.88，采取中文干预的被试学生平均成绩为38.34，采取英文干预的被试学生平均成绩为39.08；“科技”主题背景下，对照组学生平均成绩为36.24，采取中文干预的被试学生平均成绩为38.27，采取英文干预的被试学生平均成绩为35.80。标准差值最小值为4.923，最大值为7.033，说明学生整体口译成绩比较稳定。

在观测方差分析的结果时，重点观测：(1)被试内效应检验中主题分类与干预方式的交互作用。将所有被试轮流分配到不同的主题背景下进行实验，进而有效地控制被试变量对本实验结果的影响；(2)各变量的主效应。结果显示：第一，主题分类与干预方式的交互作用效应不显著(df=2，F=2.223，P=0.110)，见表4；第二，主题分类的主效应不显著(df=1，F=7.144，P=0.008)，干预方式的主效应不显著(df=2，F=1.397，P=0.249)，见表4。因此，使用不同文本辅助功能在两个不同口译主题背景下进行辅助翻译，对学生口译质量的影响不存在差异性，不同主题背景下机器辅助对英汉同声传译表现的影响不具有调节效应。

表3 三组被试学生不同主题下口译成绩平均分

表4 主效应与交互效应方差分析

五、讨论

(一)模拟机器辅助功能对整体英汉同声传译输出质量的影响

模拟机器辅助功能对本研究中的被试整体英汉同声传译输出质量没有起到明显的促进作用(正相关结论)或者阻碍作用(负相关结论)，与相近研究结论一致[11,13,14]。机器翻译辅助功能，对同声传译员的目标语输出质量没有起到正向辅助功能，可能由译员认知负荷造成[15]。吉尔认知负荷模型理论指出，同声传译员的工作模式十分复杂，包括听力理解(L)、瞬时记忆(M)、言语生成(P)以及协调性(C)。即：SI=L+M+P+C。认知负荷模型以人类大脑注意力资源的有限性为依据，判断当认知负荷超过大脑的认知极限时，就会产生认知错误[16]。译者在进行同声传译过程中，大脑处在高负荷压力下，如果受到内部或者外部干扰，便容易出现错误。

上述认知负荷模型描述了同声传译的工作模式，其中，并没有“做笔记”这一项，但这并非意味着同声传译员都不做笔记，只是相对于连续传译员来说，同声传译员的笔记任务较少。因为在高负荷压力的同声传译环境下，过多地做笔记甚至会干扰同声传译员的工作，这也可以解释为什么机器虽然可以代替人完成语音识别、文本转换、文本翻译等任务，却无法在实践中帮助同声传译员解决听不准、记不住、写不完等常见同传问题。同声传译员的认知是有负荷极限的，在达到饱和状态时，便无法分配出更多的精力来关注机器提供的辅助内容。同时，本研究选取的实验文本具有叙事属性较强，没有数字互译的特点。数字互译既是口译中的重点又是难点，在数字英译汉的过程中难点在于记忆，而数字汉译英的过程中难点在于快速表达。机器辅助数字英译汉是机器辅助英汉同声传译员记忆的一个路径，材料中没有涉及。本实验材料对同声传译员的表达要求相对灵活，更侧重考查译者译文的完整性与情感的把握，因此，机器辅助的效果并不明显。

(二)不同主题背景下模拟机器辅助对英汉同声传译表现的影响

主题类别以及主题熟悉程度是研究口译表现的重要调节变量，很多研究结论显示，主题熟悉度对口译质量有着重要的影响，主题熟悉度越高，同声传译员的口译准确度就越高[16]。因此，本研究数据分析分两个阶段，在第一阶段数据分析结果不显著之后，进一步进行第二阶段数据分析，即引入主题分类变量观测变量间是否具有交互效应。主要依据是将机器辅助类比为带稿同传中“带稿”的部分特征，即文字支持。假设第一阶段实验结果不显著的原因之一是由于英汉同声传译员没有时间去看机器辅助内容，之二可能是由于机器辅助功能这一核心变量所包含的信息被主题熟悉度这个变量信息所覆盖。因此，再继续观测第二阶段变量间是否具有调节/交互作用。数据结果表明，变量间交互作用不显著，交互结果数值不同，彼此存在细微差异性。机器辅助功能并非是文本熟悉度的子系统，对英汉同声传译表现影响不具有调节效应。

王华树、杨承淑指出，在译员完成口译工作的时候，要将自身口译技能与信息技术的各个要素“相互关联、相互作用，动态融合，发挥不同的功用，共同为完成口译活动而服务，由此形成一个动态的口译技术系统”[17]。主题背景在本实验检验与机器辅助的交互作用中不显著的一个原因，是技术与同声传译员没有形成一个相互融合的动态口译技术系统。同时，在研究主题熟悉度与口译输出质量关系时，本研究是根据本课程考核评分量表进行统一打分；然而，对口译质量的评价标准在学界却众说纷纭，量化标准也很难达成统一[18]。本研究的量化考核标准主要考查学生的知识能力(包括术语掌握、跨文化知识等)、技能能力与心理能力，其中扣分点为错译、漏译以及停顿，这三点在判断同声传译员对主题的熟悉程度时是十分重要的指标[19]。其他的口译技能与能力，比如对回译能力的考查，在本实验材料中并未涉及，不排除机器是通过其他路径来辅助口译输出这个可能。

关于对同声传译员的技术应用的指导还有很大的上升空间，对模拟机器辅助口译输出的实际路径还有待探索。机器语音识别、文本输出与翻译功能的算法是有限的，可以通过对原型进行测绘，来发展可以促进译员同声传译质量的模型。人工智能是受计算机语言控制，按照预先的算法和设定的程序运作，机器翻译是基于双语描写、对比和匹配结果的形式化和程序化处理，实现不同语言的自动翻译，输出结果是在一定范围内的选择，而并非是无限的可能和创造[20]。因此，对于模拟机器辅助功能与其耦合子系统的交互作用研究可以是未来探索的一个方向。