大型生成式人工智能的版权法分析
——禁止盗用救济路径的提出

2023-04-24 07:30:04迈克彭道敦

学术研究 2023年11期

[澳] 迈克·彭道敦[文] 谢琳[译]

人工智能可能是当前讨论最多、最受关注且最具争议的议题之一，而这些讨论主要针对的是大型语言模型的生成式人工智能，其中ChatGPT（现为第 4 版本）在目前同类产品中最为著名。人工智能程序进行大量文本与数据挖掘（Text and Data Mining，TDM）训练以执行任何给定任务。这当然会引发可能侵犯所挖掘资源的版权，以及其终端生成物是否会构成侵权或甚至产生原创性版权作品的问题。笔者将基于英联邦法律并结合比较法视角对此进行探讨。

值得注意的是，对此类人工智能局限性的讨论将影响最终结论。若未来人工智能能够对现象做出自己的解释，而不仅仅是描述其所挖掘的解释，则将得出与下文分析截然不同的结论。Noam Chomsky 在《ChatGPT 的虚假承诺》一文中指出：“人脑不像ChatGPT 及其同类产品那样，一个笨拙的模式匹配统计引擎，吞噬数百TB 的数据并推断出最可能的对话响应或最可能的科学问题答案。相反，人脑是一个非常高效甚至优雅的系统，它只处理少量信息；它不寻求推断数据点之间的粗鲁关联，而是寻求解释。”①Noam Chomsky, “The False Promise of ChatGPT”, The New York Times, 8 March, 2023.到目前为止，生成式人工智能无法做出解释，只有人类才能做到。人工智能仅能通过分析文献来解释为什么苹果会掉到地上，但人工智能无法基于爱因斯坦所拥有的少量数据而得出苹果坠地是因时空弯曲引力的解释。

一、版权法相关概念的不确定性

对于人工智能是否生成版权作品及侵犯他人版权的问题，笔者认为不应受制于版权法的相关概念分析。版权法中“独创性”作品构成要件和“实质性相似”侵权判定要件实际上具有高度不确定性，无法提供清晰的指引。

版权保护的本质在于保护对劳动（labour）、技术（skill）、努力（effort）、时间和金钱的投入。在早期的版权法中，至少一个多世纪以来，英联邦司法管辖区采用的是“额头流汗”学说。该学说坚持认为，在信息整理方面只要投入足够的劳动、技能和努力就足以赋予其独创性，从而获得版权保护。基于防止过度保护的司法政策考量，后期判例法提高了独创性的判定标准，认为仅仅依靠“额头流汗”不足以赋予其独创性，并引入思想表达二分法，①Ice TV Ltd.v Nine Network Australia Ltd., [2009] HCA 14.若思想与表达混同则不能获得版权保护。②Feist Publications, Inc.v.Rural Telephone Service Co., Inc., 499 U.S.340 (1991).在版权侵权判定方面，为合理界定保护范围，版权法采用了与独创性相对应的“实质性相似”判定要件。

然而采用这些概念反而会使版权法变得更为复杂且更加具有不确定性。“独创性”“实质性相似”的判定在很大程度上取决于法院的主观衡量，为定性而非定量分析。司法实践中不乏模糊保护甚至对“思想”突破保护的判例。③对此我可以举出大量的模糊性判例，Michael D.Pendleton, “An Abject Failure of Intelligence: Intellectual Property and Artificial Intelligence”, in Ryan Abbott (ed.), Intellectual Property and Artificial Intelligence, Cheltenham & Northampton:Edward Elgar Publishing, 2022, pp.113-132.在经常被援引的Kelly v Morris 判例中，原本属于事实的地图里程测量获得保护。④(1866) 1 Eq 697.在标志性案件Ladbroke（Football）v William Hill 中，虽然被告主张足球博彩券中的多个表格仅各自构成版权作品，但法院则认为对多个表格的总体汇编也构成作品。⑤[1964] 1 All ER 465.在Elanco v Mandops 案中，被告尽管完全改写了原告说明书的表述，但仍然构成侵权。⑥[1980] RPC 213.该案经常作为支持版权保护超越表达的先例而被援引。至于后期要求最低程度创造性的独创性标准也面临着同样的模糊性问题。满足独创性要求是小数据、大数据乃至人工智能获得保护的关键。然而计算机特别是人工智能程序所涉及的数据汇编独创性判定却最成问题。标准的模糊性将无法清晰指引人工智能产业的发展。对于判定结论的得出，法院的同情心起重要作用，而同情心则是非常具有主观性的。除非情形显著，否则判例法很少能阐明为何做出这样的判定。而在能够阐明之处，法院实际上采用的是“禁止盗用（misappropriation）”分析逻辑。因此，直接从禁止盗用对劳动、技术、努力、时间和金钱的投入的角度进行分析，回归问题的本质，可避免因采用版权概念而使问题进一步复杂化。

二、禁止盗用的一般性救济路径的提出

在多数案件中，判决构成实质性相似进而构成侵权是因为法院认为被告的行为有违其公平竞争理念，而判决不构成侵权则是因为法院认为存在允许竞争的必要性，但这些背后的原因在判决中鲜有提及。⑦例如LB (Plastics) Ltd.v Swish Products Ltd., [1979] RPC 551.

笔者的主张是，虽然认识到限制版权保护的必要性是可取的，但存在比背离额头流汗规则更好的方式来实现这一点，即扩大侵权抗辩也可得到同样的结果。换而言之，只要投入劳动、技术、努力、时间和金钱，即可获得保护，但同时也应建立一种新的抗辩，被告只要对原告所做的添加了足够多的劳动、技术、努力、时间和金钱的投入，就可以说已经获得了可受保护的新权利，不再对原告的作品构成侵权。⑧自20世纪80年代初以来，笔者一直主张构建禁止盗用的一般性救济路径，并就此发表过一系列论文，如Michael D.Pendleton, “Balancing Competing Interests in Information Products: A Conceptual Rethink”, Information & Communications Technology Law, vol.14, no.3, 2005.其中核心关键问题是，需要投入多少额外的劳动、技术和努力，才足以脱离他人的保护范围并可能享有自己的保护？必须进行多大的跳跃（jump）？

三、人工智能作品的可版权性

人工智能作品因其并非由人类所创作，可能无法满足版权作品的独创性要件。然而若依据上文所提出的禁止盗用救济路径，直接从禁止盗用的角度予以衡量，独创性则不应成为阻碍其获得版权保护的门槛障碍。虽然美国版权局近期拒绝对人工智能作品进行登记，①U.S.Copyright Office, Library of Congress, “Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence”, 88 FR 16190, 16 March, 2023.但最重要的是要记住，登记并不是授予美国版权，只是加强了保护。版权局拒绝登记人工智能作品并不意味着其没有版权，人工智能作品仍然可能获得版权保护。若美国国会没有进行立法，未来很可能会有关乎人工智能作品可版权性的案件一路进行到最高法院，来回应科技的新发展。

美国版权局的当前路径沿袭了美国宪法上注重作者和艺术家保护的版权传统，欧洲的法律也倾向于如此。然而值得注意的是，英国版权法（安娜法和出版商公司的历史）则与艺术家或创作无关，而是关乎企业或出版商发行作品的风险保护。英国和英联邦国家的法律至今仍然在很大程度上反映了这一点。英国法上“计算机生成作品”便早已认可对人工智能作品进行版权保护。

四、人工智能版权豁免的构建

对于人工智能输出和输入行为的侵权判定，世界各地的司法管辖区都在计划制定新的立法，与此同时，相关回应也陆续提出。在输出方面，终端生成物有可能侵犯版权，例如澳大利亚、加拿大、英国和西班牙要求在线平台为本地内容付费。②“Artificial Intelligence is Reaching behind Newspaper Paywalls”, The Economist, 2 March, 2023.在输入方面，人工智能需要复制大量的文本进行训练，也有可能侵犯版权。对此均应考虑其是否构成版权豁免。欧洲和美国等都已经通过或提出各种TDM 豁免方案。当然，此类豁免必须符合《伯尔尼公约》的三步检验法。在功能上，其与美国《千禧年数字版权法》中互联网平台的安全港条款非常相似。

正如Pierre Sirinelli 教授所指出的，三步检验法并没有详细说明应允许的例外情形，其优势在于概括出基本的判定规则，使各国能够以此审查或修改其立法，以适应数字环境的新发展。③Pierre Sirinelli, “Exceptions and Limits to Copyright and Neighbouring Rights”, the Workshop on Implementation Issues of the WIPO Copyright Treaty and the WIPO Performances and Phonograms Treaty, Geneva December 6th and 7th, 1999, p.6.《伯尔尼公约》当然允许通过美国式的司法自由裁量权方式来界定合理使用豁免。法院对通过三步检验法的判定可视为其符合《伯尔尼公约》。据此，美国最高法院在谷歌诉甲骨文案④Google LLC v.Oracle America, Inc., 593 U.S._（5 April, 2021）.中所阐述的转换性使用在我看来特别契合人工智能：其灵活、技术中立且动态。在该案中，作品价值的实质性增加不仅仅依赖于Java 编程语言的版权所有人，同时也依赖于使用和开发它的各种程序员。谷歌的目的在于创建一个新平台。谷歌意图创建一个接口来进一步开发计算机程序，而这本身就是在促进版权的基本宪法目的的实现。转换性使用概念为界定何为足够的额外劳动、技术和努力以构成版权抗辩提供了充分依据。

学术研究2023年11期

学术研究的其它文章: 电商下乡与农村相对贫困缓解
——基于电子商务进农村综合示范政策的评估*; 婚姻生育状况对劳动参与的影响研究*; 推动数据流通交易：要素市场细分和基础制度建设*; 互嵌式协同：跨区域政企协同治理模式创新及机理分析*; 基层治理视角下乡村公共文化空间重构对居民幸福感的影响研究*; 新兴经济体企业传承创新民族非遗技艺的演进路径与作用机制
——基于战略性社会责任视角的案例分析*

大型生成式人工智能的版权法分析——禁止盗用救济路径的提出

一、版权法相关概念的不确定性

二、禁止盗用的一般性救济路径的提出

三、人工智能作品的可版权性

四、人工智能版权豁免的构建

大型生成式人工智能的版权法分析
——禁止盗用救济路径的提出