人工智能时代的翻译伦理研究

2022-12-31 11:50:56杜思钰马望尧陶思晴

科技智囊 2022年11期

李俊杜思钰马望尧陶思晴

北京大学医学人文学院，北京，100191

人工智能在为人类社会带来便利的同时，也给传统的社会关系和伦理原则带来挑战，在翻译领域也不例外。人工智能引入翻译后，可以极大地提高重复性翻译活动的生产效率和准确性，在某些场景下甚至能够替代或部分替代人类译者。但由于人类语言和交际的复杂性，人工智能翻译本身尚存在大量的技术进展空间。如何让技术为人类服务，又如何通过人类翻译实践和研究活动促进人工智能翻译技术发展，都是非常值得探讨的问题。其中的核心议题是伦理规范的建构，因为伦理规范涉及整个产业乃至社会的健康发展和人类的福祉。

一、文献综述

人工智能是利用数字计算机或者数字计算机控制的机器来模拟、延伸和扩展人的智能，感知环境、获取知识并利用知识获得最佳结果的理论、方法、技术及应用系统。[1]机器翻译平台、语料加工平台、语音转写等人工智能技术已经在翻译行业广泛应用。

翻译伦理在翻译界已有近40年的研究历史，其指的是翻译活动中各参与方应当遵循的建立在价值取向基础上的规范。它既面向翻译行为，也面向翻译行为的主体。[2]传统翻译伦理主要以翻译行为的主体（译者）所应遵循的伦理为核心关注点，规定译者在译前、译中、译后如何做出涉及自身与文本、自我与世界的伦理抉择[3]，但对技术研发方等译者以外的其他主体关注不够。

人工智能时代的翻译伦理究竟应该是什么样的，目前学界仍无定论。有部分学者认识到，人工智能时代翻译活动中的主体增加，翻译变成了发起者、赞助人、待译文本作者/讲话人、审校、译文出版/发布机构、译文/译语使用者、翻译技术研发与应用方共同参与的社会实践[4]，而各方的权利关系、生产关系、经济关系也随之改变。因此，人工智能时代的翻译伦理不仅需要关注人际相处之“道”，还要关注人与技术、机器、自然等之间的互动[4]。

世界部分国家和地区已经认识到人工智能发展过程中可能存在的问题，并出台了推荐性和框架性的治理原则。例如，欧盟在人工智能方面比较注重对潜在问题的规制[5]。2021年4月，欧盟发布了《人工智能法》提案，重点关注人工智能系统的数据安全和算法歧视偏见等问题。在数据保护方面，该提案有更具体的指导，包括人工智能系统需在收集用户数据前履行告知义务，保证用户的知情权和选择权，确保数据采集的合法性等；在训练、验证、测试“高风险”人工智能系统数据集时，应完成数据质量检验、算法偏见评估检查等；在人工智能监管沙箱中处理个人数据时，应保证个人数据处于功能独立、隔离且受保护的数据处理环境中，并实施授权访问和数据删除机制等内容。[6]《人工智能法》提案建立的监管沙箱，切实保护了数据提供者的利益，确保用户授权他人使用数据后，仍保有收回数据的权利。截至2022年8月，美国已有17个州产生了有关人工智能一般法案或决议的提案，在科罗拉多州、伊利诺伊州、佛蒙特州和华盛顿州已有相关法律颁布。[7]但总体来看，可能是考虑到过早、过严的规制影响技术创新，美国的法律规制比较宽松。人工智能技术的核心在于数据和算法，算法的改进离不开基于大量数据的机器学习，翻译领域人工智能系统亦是如此。在翻译领域，译者也应掌握自身数据的所有权、授权使用权和收回授权的权利。但在我国，尚无法律法规保障译者的这些权利。

当前，我国已经确定了一些关于数据保护与使用的法律法规及政策文件，但其中有关人工智能的部分仍然处于起步阶段，需要不断完善。2017年7月，国务院印发的《新一代人工智能发展规划》[8]，2017年12月，工业和信息化部印发的《促进新一代人工智能产业发展三年行动计划（2018—2020年）》[9]，2020年7月，国家标准化管理委员会、中央网信办、国家发展改革委等五部委联合印发的《国家新一代人工智能标准体系建设指南》[10]中指出，用户的数据保护与使用是一项基础任务，亟待在伦理、法律方面进一步完善。2021年6月，第十三届全国人民代表大会常务委员会第二十九次会议通过的《中华人民共和国数据安全法》详细规定了数据安全与发展、数据安全制度、数据安全保护义务、政务数据安全与开放及法律责任等。其中，关于用户数据保护与使用的部分，明确了用户的权利与使用者所承担的义务与法律责任。另外，我国各级相关部门高度重视数据安全问题，在《国家新一代人工智能标准体系建设指南》、《中华人民共和国数据安全法》及2022年8月通过的《深圳经济特区人工智能产业促进条例》[11]中，数据安全都被视为基础体系建设任务，相关部门希望通过理论研究、法律制定，及时有效地找到预防惩处措施，尽可能保障技术发展中的数据安全。

2021年，全国信息安全标准化技术委员会秘书处发布的《网络安全标准实践指南—人工智能伦理安全风险防范指引》指出，在人工智能发展中应注意以下几个问题：其一，应尊重并保护个人基本权利，包括人身、隐私、财产等权利，特别关注保护弱势群体（弱势群体是指生存状况、就业情况、发声途径或争取合法权益保障能力等方面处于弱势的群体）；其二，不应研究开发以损害人的基本权利为目的的人工智能技术；其三，不应设计制造损害公共利益或个人权利的人工智能系统、产品或服务；其四，不应以有损社会价值、个人权利等目的恶意使用人工智能；其五，应及时、准确、完整、清晰、无歧义地向部署应用者说明人工智能系统、产品或服务的功能、局限、安全风险和可能的影响。[12]上述规定中，主观故意是判断行为是否道德的一个准则，然而，这可能成为某些违反规定者的遁词。翻译算法可能在推动行业效能提高的同时，侵犯到部分用户和译者的基本权利。人工智能进入翻译活动后，由于相关法律法规的滞后、翻译模式的多样化等，在翻译活动中更有可能出现潜在的道德风险。根据全国科学技术名词审定委员会颁布的《管理科学技术名词》，所谓道德风险指的是从事经济活动的人在最大限度地增进自身效用的同时做出不利于他人的行动。[13]道德风险和伦理规范是一个硬币的两面，规避了道德风险，就能最大限度地完善伦理规范。

人工智能时代的翻译伦理，是隶属于人工智能伦理下的一个子命题。已有的人工智能伦理相关研究指出，人工智能可能给人类主体地位带来挑战，带来数据泄露和信息泛滥、权利责任认定、岗位替代、弱化道德情感、侵犯主体隐私、劳动竞争异化等问题[14]，可能引发社会不稳定，剥夺人类赖以生存的劳动权，且无助于缩小贫富差距[15]。但这些研究主要聚焦人机对立与合作问题，并未充分关注技术引入后的翻译伦理问题，即翻译活动参与主体之间的关系问题。如何协调各方关系，重新平衡权利与义务的天平，实现公平、公正等公共伦理价值，关乎翻译等诸多受人工智能影响行业的长期发展和生产关系、社会关系的重新建构，值得深入探讨。

笔者对人工智能在翻译中的广泛运用所带来的潜在道德风险展开研究，以期构建人工智能时代的翻译伦理。笔者研究的翻译伦理是指技术研发方、提供方、用户（即译者和译品受众）等翻译活动参与主体应当共同遵循的伦理。

二、人工智能时代翻译模式潜在风险分析

在人工智能时代，由于技术的引入，翻译活动的组织方式及参与对象变得日益复杂化、多样化。不同的翻译模式在一定程度上存在潜在的道德风险。同时，技术平台提供方会在平台向用户弹出协议，用户必须同意（勾选“已阅协议全文，同意”）后，才可继续使用，因此用户协议中也可能存在潜在的道德风险。

（一）人工智能时代翻译模式潜在的道德风险

人工智能已经广泛运用到翻译研发（模式1和模式7）和应用（模式2—6）中，包括口译（模式2—5）和笔译（模式6）。下文对每种模式的潜在道德风险进行逐一分析。

1.模式1—翻译技术开发商与译者合作开发语料库

翻译技术开发商与译者达成合作意向，共同开发双语对应语料库。在此模式中，利益攸关方包括原作者、译者、技术开发商、审校者、读者、学者、语料原始存储平台等。潜在的道德风险则包括译者如缺乏保密意识，可能无意中透露语料获取渠道等关键信息，翻译技术开发商在获知信息后，可能不再与译者合作；因双方无书面合作合同，译者可能无法维护自己的知识产权等。从整个行业发展来看，这些潜在的道德风险可能阻碍技术开发方与译者这两个团体的长期合作。

2.模式2—机器独自完成会议翻译

在大型国际会议中，主办方使用线上会议平台及机器翻译引擎进行实时机器翻译和字幕添加。该模式颠覆了过去会议现场交流使用口译的习惯，无人类译员参与。在此模式中，利益攸关方包括会议组织方/翻译活动组织方、参会讲者/作者、线上会议平台技术提供方、翻译引擎技术提供方（技术支持者、潜在的语料收集者）、听众/参会者等。潜在的道德风险包括会议平台/翻译引擎技术提供方可能在未告知讲者、组织方的情况下擅自录音、录像并保存数据，用于技术改进，以获取商业利润；翻译任务发起者/赞助者可能拒绝支付译酬、译者违反保密原则等。

3.模式3—人译机助会议翻译

国际会议主办方使用线上会议平台及其语音识别引擎进行原语识别、原语字幕添加，并要求人类译员同声翻译，再由语音识别系统识别译员译出语，添加译文版字幕。在此模式中，利益攸关方包括会议组织方/翻译活动组织方、参会讲者/作者、线上会议平台技术提供方、语音识别引擎提供方、听众/参会者等。潜在的道德风险包括会议组织方/翻译活动组织方拒绝向技术提供方支付费用；技术提供方在未告知讲者、组织方的情况下擅自录音、录像并保存数据，用于技术改进，以获取商业利润；技术提供方可能对外谎称译文版字幕是由翻译引擎独立完成等。

4.模式4—机器辅助交替传译

该模式运用的语音转写和机器翻译技术辅助译者完成交替传译工作，系统会对发言人讲话进行转写，转写文字可显示在屏幕上供译者参考，译者可在文字上做笔记，或在屏幕空白处做交替传译笔记，遇到陌生单词和短语，可下划线查看参考译法。该技术研发公司称，该系统所有数据保存在用户本地，平台不会在云端和后台收集用户数据用于机器翻译引擎和语音识别算法改良。在此模式中，利益攸关方包括会议主办方、讲者、译者、技术开发商、听众/观众等。潜在的道德风险包括平台使用技能成为译者技能之一，不掌握技术或技术运用不够娴熟的译者处于竞争劣势。此外，系统仍有在云端和后台收集数据的机会，数据若存储在译者本地，则存在译者滥用会议主办方和讲者版权资料的风险。

5.模式5—翻译机辅助日常生活任务

在无法聘请可靠口译员的情况下，使用离线或在线翻译机、平台或应用，协助处理日常生活任务，包括购物、就医、工作等。在此模式中，利益攸关方包括技术开发方、用户等。潜在的道德风险包括错误的翻译可能会损害生命健康和财产安全；在线翻译机的技术提供方和翻译机制造方可能会收集用户语音、地理坐标等数据，用以分析和改良系统，导致存在用户隐私泄露的风险等。患者利用翻译应用就医、医生利用翻译应用开展诊疗的风险不小，已有文献报告谷歌翻译存在不少（最高可达20%）具有临床意义的错误[16-18]。

6.模式6—机器辅助的多人协同笔译

该模式通过线上多人协作翻译平台和翻译引擎实现。具体办法是，由翻译平台向翻译组织者、译者、审校者提供翻译项目管理服务，包括项目设置和分配、文件版本转换、翻译记忆、提供术语库、译文质量控制等，由接入翻译平台的各翻译引擎提供机器翻译服务，多个人类译员和审校者参与工作，负责部分文字的译审工作。在此模式中，利益攸关方包括原作者、翻译任务发起者/赞助者、翻译项目组织者和管理者、翻译平台技术提供方、机器翻译引擎技术提供方、译者、审校者、读者等。潜在的道德风险包括翻译项目组织者和管理者拒绝向译者支付译酬；翻译平台技术提供方、机器翻译引擎技术提供方在未告知使用者的情况下，利用在后台收集的数据进行系统和翻译算法的改进，并牟取商业利润等。此外，在参与用户层面，还存在内容合法性、著作权、任意退出等伦理问题；在众包翻译平台方层面，主要存在劳动剥削、维权方式不明等问题。[19]

7.模式7—译员翻译算法云端生成、储存、调用

该模式通过翻译平台采集译者个人的翻译数据，在云端进行存储和分析，产生该译者的个人翻译技巧和模式算法，可供译者调用以翻译其他文本。该技术开发方称，该系统经授权后会自动采集获取译员翻译知识体系，包括译员的翻译修订数据、术语及语料，经过数据挖掘后成为自定义机器翻译引擎的训练素材，并指出该系统由译员赋予智慧，具备与译员相同的翻译知识；在使用该系统过程中，译者通过调用翻译引擎自动翻译、人工译后再进行修改，可建立记忆库、术语库。在此模式中，利益攸关方包括原作者、翻译任务发起者/赞助者、翻译平台技术提供方、机器翻译引擎技术提供方、译者、审校者、读者等。潜在的道德风险包括除模式3中提及的风险之外的潜在技术“剥削”。该系统最大的特点就是能够在后台收集数据，并通过机器学习的方法，总结出人类的翻译模式（即算法）。在未来，最了解自己译法的不是译员自己，而是在云端收集译者数据的人工智能平台。如果系统所有者违背与使用者达成的契约，滥用译者算法，就会对译者构成极大的技术“剥削”。目前看来，此种风险不可小觑，毕竟在此模式下，译者很难发现自己的翻译算法被他人调用。

（二）人工智能时代翻译模式用户协议风险分析

大部分翻译网络平台的用户协议都对网络平台提供的服务进行定义与解释，对账号、服务费用、用户使用规范、用户信息保密、广告、知识产权及免责声明等进行规定。几乎所有翻译平台都有保证用户信息不被滥用的条款，承诺不会将个人信息转移或披露给任何第三方，除非以下5种情形：其一，取得授权或者同意；其二，相关法律法规或司法机关、行政机关要求；其三，为完成合并、分立、收购或资产转让而转移；其四，为提供您要求的服务所必需；其五，依据《隐私政策》或其他相关协议规则可以转移或披露给任何第三方的情形等。但对如何使用用户信息平台并没有详细阐明，仅有部分平台在用户协议中说，“如您选择使用交互式机器翻译，第三方除了获取您的原文文本外，还会实时获取您键入的译文结果，由此实现交互式机器翻译结果的实时优化”“平台有权决定保留或不保留服务器上的全部或部分数据”“将按照本协议及《隐私政策》的规定收集、使用、储存和分享您的个人信息”等。

三、人工智能时代翻译伦理存在的问题

人工智能翻译的主要潜在的道德风险包括用户隐私保护问题、知识产权保护问题等，可能对翻译行业健康发展产生负面影响，并存在潜在的社会不公平问题，可能对译者的职业发展产生不利影响。有学者指出，“智能革命的出现对现今的伦理标准、法律规则、社会秩序及公共管理体制带来一场前所未有的挑战”。[20]依据法律法规和用户协议的分析，笔者认为，人工智能时代的翻译伦理存在以下5个方面问题。

（一）用户隐私保护问题

在机器翻译平台、语料加工平台、语音转写平台等人工智能翻译平台用户协议中，用户处于明显劣势。平台能够收集、储存并利用用户信息。有的原作者、讲者可能不愿公众了解自己曾写过、说过某些内容，而译者有可能不想让自己的译文暴露在公众视野下接受检视或批评等。那么，一旦原文、译文等用户信息不慎泄露，责任由谁承担？原作者、译者的用户隐私如何保护？

（二）用户知识产权保护问题

在人工智能翻译时代之前的机器辅助翻译时代，翻译软件和平台已经可以从后台收集各种语料乃至双语对照语料，用于用户行为分析和系统功能改善。从前文所述的用户协议看，人工智能时代的翻译平台可能会在未经用户同意的情况下，将收集到的用户数据，包括译者在翻译平台上键入和修改的译文数据等，用于优化平台本身，以此来增加收益。有学者指出，译者创造的大量译文，包括对原文的改写加工，常常未经本人许可就成为被存储记忆、供他人免费反复使用的语料，而他们自身的利益未必得到应有的考虑。[4]在人工智能时代，由于算力的提升，技术“白菜化”，平台可以收集更多的语料，用于翻译算法的改进。“散户样”存在的语料贡献者如何得到充分的回报，如何主张自己的回报？语言资产也是一种知识产权，在其归属权问题上，任文认为，“不能因为翻译记忆和语料库等技术模糊了‘译者’的概念就可以无视著作权/版权等知识产权问题”。[4]然而，某些技术开发商已经积极参与翻译算法专利申请。按照我国《专利法》第25条的规定，单纯的算法不能获取专利，但按照我国《专利审查指南》的相关规定，将算法与具体应用领域相结合，形成具体的产品或方法的技术方案却可申请专利。[20]

（三）人工智能的引入影响翻译行业健康、可持续发展，对译者不公平、不公正

有学者指出，翻译行业公平公正原则正受到挑战，机器翻译在提高了翻译速度与效率的同时，也带来了将译者的努力隐藏于机器之后的风险，可能导致译者的价值被低估，译者角色进一步隐身，于译者不公，不利于翻译行业的健康、可持续发展。[4]

人工智能被广泛引入翻译活动，会使初级翻译需求量急剧下降，这就好比有了面条机后，只有工艺复杂、机器无法生产的手工面制作还需人类主导，一般面条制造者大量失业。翻译也一样，如果客户只需要模糊的、大概的、粗略的翻译，大可使用各种人工智能翻译。翻译市场中总体需求会因人工智能翻译方案的存在而减少，而需求降低势必导致所需翻译者和翻译产品数量减少，这对吸引人才加入需要终身学习的翻译实践行业极为不利。近年来，已经出现某些院系翻译专业录取学生不报到的情形。另外，有调查显示，翻译业务的不稳定，是影响翻译专业化发展的一个重要因素。[21]人工智能时代的到来，导致翻译专业化发展可能“雪上加霜”。众多翻译培养院校的初级翻译员必须在技艺上超过翻译引擎，否则在翻译市场中将无立足之地。

（四）译者知识产权遭受的漠视对人工智能翻译可持续发展的不利影响

翻译技术开发商在合作中对译者权益的有意无意侵犯，为人工智能翻译的可持续发展埋下了隐患。翻译技术开发商通过各种手段从译者处获得语料库建库材料等关键信息，译者起到了顾问的作用，但往往得不到应有的酬劳。译者知识产权长期被漠视及由此引发的经济纠纷不断，难免迫使专业译者壁垒高筑，这将阻碍专业译者和翻译技术开发商的合作交流及人工智能翻译技术的进步。尊重和保护知识产权，不仅能保护译者的权利，还有利于企业预防竞争对手窃取其知识产权、吸引外部投资[22]，从而取得竞争优势，为人工智能翻译技术的进步注入新的动力。政府、翻译技术开发行业和翻译工作者三方能否形成合力，能否完善合作规范和相关法律法规，译者教育能否加入必要的法律和行业规范课程，帮助其在之后的就业中维护自身的权益，是推动人工智能翻译可持续发展的关键。

（五）人工智能翻译技术对译者职业发展的不利影响

有学者认为，译者能够在翻译过程中向机器学习，从机器翻译提供的译文中学习措辞和表达，从而达到自我能力提升的目的。但部分学者对此持怀疑态度，其认为，随着翻译技术的发展，译者不再主要承担翻译的工作，反而更像是译后编辑，对机器翻译出的译文进行挑选。[23]如此一来，译者进行翻译的时间和机会都大幅减少，不利于自身技能的精进。对译者（尤其是初级译者）而言，机器翻译所提供的译文很可能起不到借鉴作用，甚至还会产生负面影响。机器翻译的译文在语言的一致性和连贯性方面一般都存在问题，段落之间的衔接处理欠佳，不能充分体现译文所处语境与文本的联系，可能不是最好的译文表达形式。另外，机器翻译技术还可能会降低译者对译入语和译出语的掌握程度。为了提高翻译效率，译者可能在翻译时大量参考机器翻译提供的译文，不再投入时间和精力去斟酌是否存在更加合适的表达。[23]

四、人工智能时代翻译伦理建设的建议

基于以上分析，笔者为人工智能时代翻译伦理建设提出多方参与建设、用户协议优化、法律建设完善、主动披露制度、加强翻译伦理教育等建议。

其一，人工智能时代翻译伦理建设的总体原则是要由专业协会学会、翻译技术研发公司、立法机构、译者、翻译任务委托方、翻译教育机构、人工智能翻译的用户等各个相关利益主体共同参与。专业协会学会则应发挥引领作用，制定相应伦理守则，如中国翻译协会可牵头制定相关的伦理准则，甚至发布用户协议或翻译协议范本。

其二，翻译技术研发公司应严格遵照法律规定来制定用户协议、使用用户数据、研发算法、提供技术等，做到对各方公平、公正。从对翻译技术平台用户协议分析的结果来看，翻译平台会在未经用户同意的情况下，将收集到的用户数据，包括在交互式平台上键入的译文结果等用于优化平台自身，以此来增加收益。鉴于用户数据对翻译平台优化升级的重要性，各网络翻译平台应在其用户协议中写明用户数据的各种用途，以避免任何侵犯知识产权的可能性。另外，如这些平台是以营利为目的而使用用户数据，应该支付用户相应的费用，或在用户使用平台收费项目或服务时提供优惠。

其三，立法机构应加强科技伦理立法，使翻译伦理专家参与其中，借鉴国外人工智能监管经验和技术，完善相关法律法规，保障数据隐私安全。立法机构应进一步健全现有法律法规体系，完善人工智能时代翻译相关的大数据和人工智能法律法规，加大人工智能侵权者侵权惩戒力度，采用举证倒置、集体诉讼等原则和方式，考虑用户数据授权的后悔权、删除权、收回权等，修改《广告法》中有关人工智能翻译相关内容或出台专门法规规范人工智能翻译的宣传，还可借鉴欧盟《人工智能法》提案中的沙箱技术，切实保障用户数据安全。

其四，用户方应主动披露对机器翻译的使用情况，做到开诚布公。具体来讲，译者若使用机器翻译的相关内容，应主动将相关信息披露给译文使用者；若是翻译任务委托方仅使用机器翻译进行初步翻译，而译员做译后编辑和润色，应说明使用了机器翻译而非译员产生的初步译文。

其五，翻译教育机构应加强人工智能翻译伦理教学与研究。在人工智能时代的翻译活动中，道德风险和权利侵害的可能性会持续存在。但在目前的翻译职业教育中，翻译伦理得到的重视程度不足，应加强翻译伦理教学与研究。

六、结语

在人工智能时代，翻译技术的飞速发展极大地扩展了翻译服务的范围，同时也对翻译伦理的特征与发展趋势产生了巨大的影响，人工智能时代翻译伦理探讨话题的焦点也发生了转移。传统翻译伦理更多聚焦的是译者与其他主客体之间的关系，而在人工智能时代，其焦点逐渐转向人与技术、机器、自然等之间的关联。笔者从人工智能时代的翻译模式出发，对相关的法律法规和用户协议进行了梳理，厘清存在的问题，提出了相关建议，以期为研究人工智能翻译伦理、推动人工智能伦理建设提供参考。囿于文章篇幅、研究精力、时间及阅历，笔者无法穷尽一切人工智能翻译模式及所有的潜在道德风险，亦无法回顾所有相关法律法条和用户合同，未来研究可进一步深入探讨。