构建可信赖机器翻译系统的基本原则
——一种基于工程伦理的观点

2021-03-07 16:27张霄军邵璐
外国语文 2021年1期
关键词:译文伦理人工智能

张霄军 邵璐

(1.西交利物浦大学 翻译系,江苏 苏州 215123;2. 中山大学 外国语学院,广东 广州 510275)

0 问题的产生

近年来,面对人工智能和机器翻译所取得的突出进步,尤其是神经网络机器翻译在机器翻译译文的可读性方面大幅提高,这就使得高校翻译专业不得不面对这样一个问题:人工智能时代翻译专业该怎么办?其实,这是一个市场“倒逼”的提问,比这个问题更加尖锐的问题是:翻译专业会不会消亡?机器翻译是否会取代人工翻译?

“机器翻译与人工翻译”的问题在2014年德国柏林召开的第20届世界翻译大会上得以显化,该届大会的主题就是“人工翻译还是机器翻译?翻译工作者与术语学家的未来”(Man vs. Machine? The Future of Translators, Interpreters and Terminologists),自此拉开了翻译研究技术转向的序幕(张霄军 等,2014)。之后机器翻译甚嚣尘上,翻译“大事件”层出不穷,如百度机器翻译2015年正式上线神经网络机器翻译系统并获得国家科学技术进步奖二等奖、谷歌于2016年发布神经网络机器翻译引擎、2017年微软翻译发布神经网络机器翻译系统、2018年博鳌论坛腾讯同传登台亮相、科大讯飞宣称2019年其语音翻译将达到“专业八级”水平,等等。然而,我们发现,引领上述“大事件”的大都是机器翻译公司或者人工智能企业,韩林涛(2019)认为由于商业炒作而产生的断言“以偏概全、夸大事实”,但不得不承认我们已经来到一个“无技术不翻译”的时代(任文,2019)。这也引发了学术界对该论题的忧思与争论。蔡基刚(2020)认为“随着机器翻译时代的到来,高校翻译专业必然走向消亡”,他认为“技术文本和政治文献的机器翻译替代人工翻译在未来几年就可以实现”;李长栓(2019)则认为“要想通过机器翻译,实现自然语言的处理,恐怕还有很长的路要走;也许永远没有实现的一天”;祝朝伟(2018)直接断言“机器取代人不过是不证自明的伪命题”。陈伟(2020)从机器翻译对译者主体性结构说明“机器翻译无法完全取代人工翻译”;刘和平和梁爽(2019)则提出翻译的教与学应该“拥抱技术”,而不是畏惧和排斥技术。

其实,无论是“人工智能时代翻译专业最终走向消亡”还是“机器翻译会取代人工翻译”,真正从事机器翻译研发的科学家很少提出这样的论断。对于机器翻译研发者而言,机器翻译系统的开发与应用是一项系统工程,任何未经检验的论断都会涉及人工智能和机器翻译技术的工程伦理问题。正如王华树(2020)在回答《翻译技术100问》中“机器翻译是否会取代人类译员?”这个问题时所言:“机器翻译目前还存在着许多技术和伦理层面的问题,同时也给人类带来了新的机遇。”目前讨论人工翻译能否被“取代”为时尚早,我们应该尽快厘清的是机器翻译的工程伦理问题。

1 人工智能和机器翻译技术的工程伦理问题

工程伦理是对在工程实践中涉及的道德价值、问题和决策的研究(李世新,2010)。也就是研究如何开发对人类有用却不会伤害人类的系统,系统开发过程中如何保护隐私,如何确保系统安全性和鲁棒性,等等。机器翻译技术是用计算机来模拟人的翻译能力,是人工智能技术的一个重要分支,两者“本是同根生,在发展过程中几经浮沉,同甘苦共命运,它们之间存在着密切的联系”(冯志伟,2018)。因此,人工智能从业者所面临的工程伦理问题同时也是机器翻译研发者所面临的工程伦理问题,两者并无二致。鉴于机器翻译和人工智能在各自发展历程中具有相似的特征以及人工智能专家和机器翻译工程师在职业发展中的雷同性,我们将这两者的工程伦理问题归并到一起进行讨论。人工智能和机器翻译技术的工程伦理指的是人工智能和机器翻译系统或者产品在设计、研发过程中所产生的伦理问题。

1.1 工程伦理的制度化建设问题

在制度化建设方面,一个直接相关的就是职业注册制度问题。人工智能行业从业者和机器翻译研发者应不应该注册某种职业资格,要获得何种职业资格证,目前尚无讨论。在美国和英国,目前推行的是职业工程师执照制度,要求工程师申请职业工程师执照(professional engineer,简称P.E.执照)。在我国推行的是国家职业资格证书制度,规定“对从事技术复杂、通用性广、涉及国家财产、人民生命安全和消费者利益的职业(工种)的劳动者,必须经过培训,并取得职业资格证书后,方可就业上岗”。然而,在人力资源社会保障部印发的《关于公布国家职业资格目录的通知》公布的140项国家职业资格目录中,对人工智能从业者和机器翻译研发者并无明确规定。这意味着大多数人工智能和机器翻译工程师无法以可能会被吊销资格证的方式来抵制参与不遵守伦理道德的行为。

制度化建设的第二个方面是工程社团和社团伦理章程的制定。在促进工程伦理的建设中,工程社团应起怎样的作用?对此,学术界有不同的看法。比较一致的观点:(1)社团是探讨技术争论和伦理纷争的最好的场所;(2)职业社团应当促进而不是实施工程伦理建设。工程社团通常会制定行业的伦理章程来确立工程师应关注的主要的伦理领域。然而,对于章程的性质和功能却存在着争议。中国人工智能学会、中国中文信息学会和中国翻译协会是三个在民政部注册的一级学会,也就是我国人工智能从业者和机器翻译研发者赖以解决伦理纷争和制定伦理章程的工程社团。然而,对于并不隶属于上述任何一家社团的从业者,伦理章程所包含的标准、规则、原则和理念是否同样适用呢?

制度化建设的第三个方面是工程伦理教育问题,即工程伦理在学科体系中的地位问题,目前能够达成共识的是工程伦理教育是工程教育的一部分。此外,冯志伟(2005)论证了自然语言处理是一个多边缘的交叉学科,机器翻译是自然语言处理的一个任务。那么人工智能和机器翻译技术的工程伦理应该纳入工程学工科学科体系还是语言学/翻译学文科学科体系?如何将工程伦理的内容融入现有的教育体系中?有无开设相应必修课或者选修课的必要,还是不单独开设伦理课程而要求在授课内容中包含伦理的内容?

1.2工程师的责任和义务问题

20世纪70年代之前,大多数的工程伦理章程认为,工程师的首要义务是对客户或雇主的忠诚,而很少提到对公众所承担的义务。1974年,美国职业发展工程理事会(Engineering Council on Professional Development,ECPD)采用了一项新的伦理章程,该章程认为,工程师的最高义务是公众的健康、福祉与安全。现在,几乎所有的章程都把这一观点视为工程师的首要义务,并称之为“首要条款”。当工程师发现首要条款被违反时,举报在道德上应该是必需的,或至少是允许的。这其中当然有商业利益的考量,利益冲突是近年来颇受关注的话题。某些职业利益会威胁一个人的职业判断从而使其判断变得不可靠,或者与人们所期待的相比变得不容易让人们信服。尽管机器翻译研发者不能确定其研发的系统能否实用,可一旦资本涌入想要商业化其系统,很难有研发者拒绝如此丰厚的商业利润,甚至会为系统商业化而沾沾自喜,并以此高估其系统性能。

1.3工程活动与社会政策问题

工程活动对环境的影响已得到普遍认同,但对于工程师对环境是否应承担责任以及这种责任的基础和范围是什么,仍存争议。其中一个核心问题是,是否只有当人类的健康和福祉受到明显威胁的时候接受对环境的责任才是充分的,或者说,是否应该出自环境自身的原因而关注环境。人工智能和机器翻译等信息技术产业看起来貌似是对环境不会产生太大影响的绿色产业,然而随着人们驾驭信息技术能力的增强和公众对人工智能产品的依赖,人类赖以生存的生态环境、工作环境和家庭环境都在发生深刻的变化。以机器翻译为例,随着语音识别技术和机器翻译质量的提高,一种全新的会议口译新模式正在形成。新模式下,口译员更加“隐身”,取而代之的要么是口译员语音即时转写后以字幕的形式投射到会场的大屏幕上或者听众席的小屏幕上,要么是发言者语音即时转写后经机器翻译将翻译结果以字幕的形式投射到屏幕上。这就需要给会场增加投影和屏幕,听众席上也要增加可视设备,如此会议口译会场的生态环境就会发生了改变。随着5G网络的普及,互联网数据传输的容量越来越大,传输速度越来越快,这就使得远程即时翻译,尤其是远程口译成为现实,口译员的工作环境发生变化。借助自动口译设备和机器翻译系统,不同国度交流越来越便利,国际家庭的组建也越来越多,家庭成员之间的沟通也越来越依赖自动口译设备,家庭环境也在悄然发生变化。同时,人工智能驱动翻译模式转向众包,基于网络的众包翻译模式的兴起也“重写”了翻译伦理。上述因机器翻译技术而发生变化所带来的环境伦理问题鲜有讨论。

马丁(M. W. Martin)和欣津格(R. Schinzinger)认为工程是一种“社会实验”,这种实验给“实验”的对象(公众)带来了一定的风险(李世新,2010)。然而,什么是可接受的风险?谁来确定这种风险?翻译客户能否接受机器翻译系统所产生的译文?在多大程度上采用机器的译文?机器翻译译文质量到底如何?如果因机器翻译的译文质量造成了交际失误或者交易失败,机器翻译译文提供者和机器翻译译文使用者谁该承担主要责任?供应商倾向于功利主义,通过可能性的产物和伤害的大小来定义风险,他们认为,如果潜在的收益超过了潜在的危害,那么这种风险就是可接受的。但是,公众却试图将可接受风险、自由和知情同意以及风险和收益的合理分配联系起来。在这种实验性的社会活动中,工程师们又该如何去确定和规避实验风险?

工程活动是一种职业行为,什么样的职业行为是社会所期待和所信赖的?我们之所以会向医生毫无隐瞒地坦陈病情是因为我们信赖医生;我们之所以会心安理得地住在高楼大厦中是因为我们信赖建造工程师。那么,公众会像信赖医生和建造师那样信赖人工智能产品和机器翻译系统吗?怎样的职业伦理准则才能满足(或符合)这种社会所给予的信赖呢?对社会而言的职业信赖对于建设和谐社会是必不可少的。遗憾的是,这些问题至今尚未得到充分研究。

2 人工智能技术的伦理原则

2018年6月7日,谷歌(Google)发布了七条人工智能应用的“伦理原则”(1)https:∥ai.google/principles.,包括:(1)对社会有益(Be socially beneficial);(2)避免制造或强加不公平的偏见 (Avoid creating or reinforcing unfair bias);(3)提前测试安全性(Be built and tested for safety);(4)对人类负责(Be accountable to people);(5)保证隐私(Incorporate privacy design principles);(6)坚持科学高标准(Uphold high standards of scientific excellence);(7)从主要用途、技术独特性发展(Be made available for uses that accord with these principles)。

无独有偶,2019年4月8日,欧盟委员会发布了《可信赖人工智能的伦理准则》(EthicsGuidelinesforTrustworthyAI)(2)https:∥ec.europa.eu/digital-single-market/en/news/ethics-guidelines-trustworthy-ai.,报告提出了四项伦理准则:

(1)尊重人的自主性(Respect for human autonomy)。人工智能系统不应该胁迫、欺骗和操纵人类。相反,人工智能系统的设计应该以增强、补充人类的认知、社会和文化技能为目的。人类和人工智能系统之间的功能分配应遵循以人为中心的设计原则,而且人工智能系统的工作过程中要确保人的监督。人工智能系统也可能从根本上改变工作领域。它应该在工作环境中支持人类并致力于创造有意义的工作。

(2)预防伤害(Prevention of harm)。人工智能系统不应该引发、加重伤害,或对人类产生不好的影响。因此需要保护人类的尊严和身心健康。人工智能系统和运行的环境必须是安全的。因此要求技术上必须是鲁棒的,而且要确保人工智能技术不会被恶意使用。尤其要注意可能会恶意使用该技术的人和可能会造成不良影响的应用场景。

(3)公平性(Fairness)。人工智能系统的开发、实现和应用必须是公平的。虽然对公平性可能会有不同的解读,但是应当确保个人和组织不会受到不公平的偏见、歧视等。如果人工智能系统可以避免不公平的偏见,就可以增加社会公平性。为此,人工智能系统做出的决策以及做决策的过程应该是可解释的。

(4)可解释性(Explicability)。可解释性对构建用户对人工智能系统的信任非常关键。也就是说整个决策的过程、输入和输出的关系都应该是可解释的。但目前的人工智能算法和模型都是以黑盒(black box)的形式运行。

谷歌公司和欧盟委员会发布的上述人工智能伦理准则为突飞猛进的机器翻译技术发展提供了工程伦理借鉴。基于此,我们总结了实现可信赖的机器翻译系统的七个关键原则。

3 可信赖的机器翻译系统的七个原则

3.1人本性(Human Centricity)

人工智能系统应通过支持人的能动性和基本权利以实现公平社会,而不是减少、限制或错误地指导人类自治。机器翻译也不可以脱离人的监督直接去实现语码自由转换。事实上,ALPAC报告之后,机器翻译研究已经放弃了“全自动高质量机器翻译(Fully Automatic High Quality Machine Translation, FAHQMT)”的企图,转而向“人助机译(Human-aided Machine Translation, HAMT)”或“机助人译(Machine-aided Human Translation, MAHT)”方向发展。近年来,随着统计机器学习和深度学习技术在机器翻译中的广泛应用,系统运算能力的增强和训练语料的不断丰富,机器翻译质量得到了大幅提升,“机器翻译替代人工翻译”的论断才有了传播的基础。然而,此类武断的说法大多来自市场宣传而非出自系统研发人员之口,但普通用户并不知其所以然,所以在一定程度上迷惑了消费者,造成大众对机器翻译不切实际的期望,产生了不良后果。人类的监督可以帮助确保机器翻译系统不影响人类自主或产生不良后果。监督可以通过不同的管理机制来实现,包括human-in-the-loop(HITL)、human-on-the-loop(HOTL)、human-in-command(HIC)等方法(3)人机协同的方式,按照机器的自主权限从低到高,分为“人在环中(in the loop)”“人在环上(on the loop)”“人在环外(in command)”三种。。根据机器翻译系统应用领域和潜在的风险,可以实现不同程度的监督机制以支持不同的安全和控制措施。

3.2鲁棒性 (Robustness)

可信赖的人工智能系统的关键部分就是技术鲁棒性,这与欧盟委员会发布的《可信赖人工智能的伦理准则》中的预防伤害原则是紧密相关的。技术鲁棒性要求算法足够安全、可靠和稳健,以克服人工智能系统所有生命周期阶段的错误或者不一致。机器翻译系统应该防止被黑客攻击或出现可以被攻击的漏洞。黑客攻击可能是针对翻译或者语言模型的、也可能是针对训练数据的、也可能是针对底层基础设施的,包括软件和硬件。如果机器翻译系统被攻击,其中的数据和系统行为可能会被修改,导致系统产生不同的翻译结果。机器翻译系统应该有出现紧急情况的备用方案——机器翻译系统可能从基于统计的决策转为基于规则的决策,或者要求询问人工译员才可以继续(计算机辅助翻译或者交互式机器翻译),必须保证系统所做的一切都不会对用户造成伤害。良好的机器翻译系统开发和译文质量评估过程可以支持、缓解和纠正出现不准确的机器译文及其所带来的潜在风险。如果偶尔不准确的译文不可避免,那么系统应该要能计算这种错误情况发生的概率。在可能会对人类生命安全带来影响的机器翻译系统中,译文准确度的要求是非常重要的,比如在卫生健康领域和刑事司法领域的应用。

3.3私密性(Confidentiality)

人工智能系统必须确保系统的整个生命周期内部都要确保隐私和数据保护,这既包括用户提供的信息,也包括用户在和系统交互过程中生成的信息。用于机器翻译系统训练和测试所用的数据不会被用来伤害或歧视数据的所有者和用户,同时要确保收集的数据不会用于非法地或不公平地歧视用户的行为。训练语料(数据集)的质量对机器翻译系统的性能非常关键(刘群,2003),但特定机器翻译系统开发(如对话机器翻译)收集的数据可能是含有偏见的、不准确的、有错误的。这些数据在训练之前要进行清洗,去除这些有偏见的、不准确的、有错误的数据,但同时又要确保数据的完整性,如在对话机器翻译系统中,就要完整保留说话者信息(Wang et al., 2017)。如果说话者信息必须保密,那就需要对语料进行脱敏处理,比如用特定标记标注说话者信息等。如果给机器翻译系统的训练数据是低质量的甚至是恶意的,就可能会改变机器翻译系统的整体性能。因此,在规划、训练、测试和实现的整个过程中都要对数据集进行测试和处理。系统在处理数据时,都会用到管理数据访问的数据协议,该协议应该列出谁以及什么情况下可以访问数据。

3.4可解释性(Explicability)

人工智能系统应确保相关元素的可追溯性,包括数据、系统和商业模型。因此,机器翻译系统产生决策使用的数据集和过程也都应该记录下来以备追溯,并且应增加透明性,具体包括收集的数据和算法使用的数据标记。可追溯性在机器翻译系统中通常被称为可解释性。可解释性就是要解释机器翻译系统的技术过程和相关的决策过程。技术可解释性要求机器翻译所产生的译文是可以被人们所理解的。在机器翻译系统会对人类的生活造成重大影响时,就需要机器翻译系统的决策过程有一个合理的解释。此外,人类有权知道与其直接进行对外交流的是译员还是机器翻译系统,这就要求机器翻译系统可以被识别。出现译文质量纠纷时,要能明确权责,让客户知晓谁该为翻译服务负责,谁又该为译文质量负责。

3.5公平性 (Fairness)

人工智能系统应考虑人类能力、技能和要求的总体范围,并确保可接近性。该要素与欧盟委员会发布的《可信赖人工智能的伦理准则》中的公平性原则是紧密相关的。因此,机器翻译系统所使用的数据集会不可避免地存在歧视、不完整和管理不当等问题。这类数据集的歧视可能会造成机器翻译系统的针对特定人群或个人的歧视。机器翻译系统开发的方式也可能会出现不公平的歧视问题,可以通过一种明确的、透明的方式来分析和解决系统的目的、局限性、需求和决策。尤其在垂直领域,机器翻译系统可能是以用户为中心的,以一种允许所有人都平等地使用机器翻译产品和服务的方式,即无论年龄、性别、能力和其他特征,因此针对残障人士的辅助功能就显得格外重要,特别是在口语机器翻译系统研发中。因此,机器翻译系统的设计不应该采用一种通用的设计,为了开发出可信赖的机器翻译系统,建议对受系统直接或间接影响的利益相关方进行咨询。

3.6可复现性(Replicability)

可复现性指人工智能专家要能够准确地描述人工智能系统的行为和公开实验方法、算法和数据,方便其他人工智能研发者进行验证和再次实现。人工智能系统的结果必须是可复现的和可靠的,要对人工智能系统进行详细检查以防产生意外。机器翻译系统的复现依赖译文评价机制和系统代码与数据开源情况。评价可分为人工评价和机器自动评价,前者可解释性强但耗时费力花钱,后者快速方便但可解释性较差。如何设计和开发一个客观科学的机器翻译译文评价系统是目前制约机器翻译发展的一个瓶颈。系统代码和数据开源在机器翻译研究中做得相对成熟,Github(4)https:∥github.com/.等平台为代码和数据开源提供了足够的空间,arxiv(5)https:∥arxiv.org/.等网站为科研产出评价和共享提供了共享和同行评审的平台。同行评审包括对研究算法、数据和设计过程的评估,也包括对研究实验的复现结果。

3.7可持续性 (Sustainability)

人工智能系统具有积极促进社会变革、增强可持续性生态之责任。一般情况下,人工智能系统大都是为了解决一些迫在眉睫的社会难题,同时又要保证尽可能以环境友好型的方式出现。因此,机器翻译系统的开发、实现和使用过程,以及整个供应链都应该进行这方面的评估。同时,机器翻译系统在社会生活各领域的应用,可能会改变我们对社会机构的理解,影响我们的社会关系。机器翻译在增强我们的社交技能的同时,可能也会减弱我们的社交技能,会对人们的身心健康带来影响。机器翻译在翻译教学和二语写作教学领域也会产生争议,并日渐影响学生的翻译和写作习惯。同时要考虑评估机器翻译应用对民生、社会的影响,因为机器翻译系统极有可能应用于政治决策和外交内联等的政治进程之中(傅莹,2019)。

4 结语

技术可以被理解为广义的技术——一种旨在控制自然(和人类)的方法,这种方法奠基于一套严格、客观中立的方法之上,将所处理的对象一律视为僵化的客体。然而,我们不能简单地拒绝现代技术。首先这是不可能的,我们已然生活在现代技术之中,我们对生活的理解都深深地涉及技术。其次,这也是不可逆的,因为放弃技术意味着放弃技术为我们带来的巨大福利。我们需要的首先是发展技术,其次是遏制技术的发展。如何遏制?这就需要伦理学的规范和约束。工程伦理学的产生促进了安全和有用的技术产品并给工程师的努力赋予意义,也直接地增强工程师在工程中有效地处理道德问题复杂性的能力,增进工程师的道德自治,即理性地思考以道德关注为基础的伦理问题之习俗与技能。越来越多的技术研究者和应用者,尤其是人工智能技术应用领域的专家开始意识到伦理的重要性。谷歌公司和欧盟委员会发布的准则就是负责任的人工智能产业代表和有担当的政府部门对此发出的积极响应。在学术界,斯普林格出版社(Springer-Verlag)正在编辑出版“工程技术哲学”系列丛书(SeriesofPhilosophyofEngineeringandTechnology),目前已出版《技术的规范》(NormsinTechnology)、《技术为善》(DoingGoodwithTechnologies)等32部著作(6)https:∥www.springer.com/series/8657?detailsPage=titles.。在自然语言处理领域、技术伦理和工程伦理的探讨也逐步深入。目前已经连续召开了两届以“自然语言处理的伦理”(Ethics in Natural Language Processing,EthNLP)为主题的国际研讨会,第一届2017年在西班牙瓦伦西亚召开(7)http:∥www.ethicsinnlp.org/ethnlp-2017.,第二届2018年在美国新奥尔良市召开(8)http:∥www.ethicsinnlp.org/.。

在国内,对机器翻译的过度宣传一方面引发了行业对这一技术应用的忧思,另一方面也催生了一些学者对机器翻译技术伦理学的探讨。讨论人工翻译能不能被机器翻译所取代的基础是机器翻译的工程伦理,如果没有厘清机器翻译的技术和工程伦理的框架,任何与之相关的断言都是不可信的。2018年在北京召开的“首届语言智能与社会发展论坛”上,与会专家集体通过了《语言智能与外语教育协同发展宣言》。宣言称:“机器翻译等语言智能技术的发展和实践,不应也不可能谋求全面替代人类的外语能力,在公共宣传、科普演示中,语言智能学界和产业界应当实事求是地报告语言智能的发展现实,不夸大语言智能技术的现有性能,不做缺乏科学依据的展望,不能对人类的外语工作造成恐慌,不能对人类的外语事业规划造成形势误判。”因此我们也呼吁更多的仁人志士加入机器翻译/翻译技术伦理探讨之中,期盼语言智能界、伦理学界及社会有关学界能成立“语言智能伦理委员会”,保证语言智能在符合人类伦理的框架内发展。

猜你喜欢
译文伦理人工智能
《心之死》的趣味与伦理焦虑
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
译文摘要
护生眼中的伦理修养
2019:人工智能
人工智能与就业
数读人工智能
I Like Thinking
下一幕,人工智能!
医改莫忘构建伦理新机制