生成式人工智能的侵权标准、价值辨析与规范应对

2024-10-27 00:00:00孙阳
社会科学动态 2024年10期
关键词:生成式人工智能著作权法

摘要:生成式人工智能作为创新性的技术应用不直接涉及著作权法的制度性评价。生成式人工智能既可以是合法的技术过程,也可以是基于著作权侵权的违法技术应用并承担法律责任。合法行为与侵权行为共同构成了生成式人工智能在著作权法层面的二元法律属性,而著作权侵权标准的适用增加了生成式人工智能在著作权法层面的法律不确定性。必须承认的是,生成式人工智能无论是作为合法技术还是侵权应用都会对人工智能的整体技术研发和产业发展产生实质影响。因此,有必要廓清生成式人工智能作为著作权合法行为或著作权侵权行为时所产生的价值内涵与潜在影响,为著作权法的规范应对提供价值参照。

关键词:生成式人工智能;著作权法;侵权标准;实质相似性;生成内容

基金项目:北京市习近平新时代中国特色社会主义思想研究中心项目“习近平法治思想中知识产权保护重要论述研究:理论体系与实践运用”(22LLFXB038)

中图分类号:D923.41 文献标识码:A 文章编号:2096-5982(2024)10-0042-08

一、问题的提出

生成式人工智能(Generated AI)通过技术过程生成诸如图片、视频、文本以及旋律等表达性内容,为人类智力开发和社会生产生活带来深刻变革,创造性地解放了人类智力劳动的整体过程。生成式人工智能技术深入社会文化生产生活的方方面面,深刻影响和改变个体与组织的运行模式与利益分配。一方面,人工智能的生成内容通过市场化开发满足消费者需求,代表生成式人工智能逐步确立文化创意产业的需求市场(1);另一方面,受著作权法保护的作品如音乐歌曲、美术作品以及文字小说等以信息或素材的形式纳入生成式人工智能的技术过程,对著作权作品的创作、传播与使用提出了制度性挑战。生成式人工智能的著作权合法性面临著作权侵权标准的检视与评估,进而影响生成式人工智能的技术创新与产业发展。著作权人基于著作权法的规范基础,通过著作权侵权标准的适用对生成式人工智能提出规制要求。(2)生成式人工智能的相关主体如技术公司、研发团队等则需要厘清三个问题:生成式人工智能技术运行过程中使用作品是否存在著作权侵权风险?著作权侵权标准如何具体适用?生成式人工智能研发者、使用者以及数据训练参与者等主体可能承担何种法律责任?较为遗憾的是,由于生成式人工智能技术仍然处于研发创新过程中,上述问题尚未得到著作权法的系统性回应。(3)生成式人工智能的著作权侵权标准尚未得到统一、清晰与合理的制度性确认。有鉴于此,本文通过分析生成式人工智能的著作权侵权标准,从著作权法层面对生成式人工智能的法律性质进行价值辨析,进而提出契合生成式人工智能技术发展与著作权法制度目标的规范应对。

二、生成式人工智能的侵权标准适用性分析

生成式人工智能及其技术过程是否对著作权侵权,直接影响生成式人工智能技术开发、参与主体的法律责任以及生成内容的收益分配。2023年7月,国家七部门联合发布的《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)中明确规定生成式人工智能服务过程中“涉及知识产权的,不得侵害他人依法享有的知识产权。”(4)一方面,《暂行办法》的颁布为著作权法应对生成式人工智能的侵权行为提供了规范方向;另一方面,《中华人民共和国人工智能法(学者建议稿)》中也明确了人工智能建立和完善知识产权保护的基本规则。(5)由于生成式人工智能的技术过程模拟人脑的思维训练活动,要求海量、广泛且多样化的数据输入而确保内容生成的效率和质量,技术过程的输入阶段必然涉及一定数量著作权作品而导致著作权侵权的可能性。(6)著作权法的作品自动保护原则导致作品合法权属的不确定性,进一步增加了生成式人工智能的著作权侵权风险。

(一)著作权侵权标准的适用之一:生成式人工智能的输入阶段

生成式人工智能在内容生成领域的技术特征有别于传统技术应用。长期的历史实践中技术设备如自动钢琴、打印机、计算机等具有生成文本、图片与音乐等表达性内容的基本功能。以上技术设备的生成机制往往被动地遵循人工指令的要求,缺乏生成过程的灵活性和自主性。(7)经历多年的技术发展和产业实践,生成式人工智能得以充分地通过图灵测试。(8)不同于传统设备的生成机制,生成式人工智能通过以大语言模型(Large Language Model,short for LLM)为代表的技术应用,将复杂的输入信息依托机器学习过程转化为类型化的表达内容。譬如OpenAI公司研发的聊天机器人程序ChatGPT可以针对简单的对话提问,通过自然语言程序(Natural Language Program)的运行生成类型相同的文本回答,并实现对话提问与文本回答之间的逻辑体系关联与前后文互动特征。(9)类似地,由Stability AI公司设计开发的Stable Diffusion 3图文转换软件则通过文本词汇的输入而生成具有相关性特征的图片画面内容。(10)

著作权司法实践中的侵权标准主要考察两个层面的要素:一是被告不当接触作品;二是侵权作品与受保护作品的相似程度。第一个要素意味着被告具有实施侵权行为的可能性,第二个要素则指明了著作权侵权行为实施的客观结果。侵权人实施未经授权的侵权行为往往比较隐蔽,即“剽窃主体很少公开实施侵权性复制行为,直接证据往往难以获得。”(11)此时接触作品可以作为推定来证明被告实施了未经授权的复制行为。例如在琼某诉于某著作权侵权案中,法院认为“被告接触作品可以是一种推定……被诉侵权人依据社会通常情况具有获知权利人作品的机会和可能,可以被推定为接触。”(12)

以大语言模型为代表的生成机制具有高效性与多元性,需要大量信息输入并完成内容生成的技术过程。大量信息输入必然导致潜在的著作权侵权法律风险,即著作权作品的文本、图片、声音乃至视频等未经授权的复制行为。著作权法的侵权视角下,生成式人工智能信息输入行为等同于未经授权的大量使用著作权作品,而以大语言模型为代表的技术应用则为侵权的发生提供了技术便利。在此情况下,著作权人针对生成式人工智能发起著作权侵权之诉也成为了必然的结果。譬如2023年1月,美国艺术家与插画家群体向三家生成式人工智能研发公司发起集团诉讼,主张三家公司设计研发的生成式人工智能应用未经授权使用其创作的图片训练生成式人工智能的行为,侵犯了其美术作品的著作权。(13)

除了技术特征导致的侵权风险,著作权法的权利基础也提供了侵权标准适用的条件。著作权的权利基础是作品复制行为的专有控制,作品的开发和使用也需要复制权作为前提。(14)早在1793年法国就颁布了《复制法令》,明确规定作者对其作品享有复制、发行或授权他人复制、发行的专有权。(15)《世界知识产权组织版权条约》(以下简称《版权条约》)与《世界知识产权组织表演和录音制品条约》(以下简称《表演和录音制品条约》)都明确规定《伯尔尼公约》中的复制权完全适用于数字技术环境,尤其是数字技术环境下使用作品的情形。(16)我国《著作权法》也规定了“数字化方式将作品制作一份或多份”作为复制权行使的方式之一。(17)鉴于生成式人工智能的技术过程发端于信息输入,而信息输入本质上属于一种复制行为,理论上,著作权人对于生成式人工智能可以基于作品未授权的复制性使用而发起著作权侵权之诉,主张生成式人工智能的相关主体承担著作权侵权的法律责任。这也说明著作权侵权标准很容易适用于生成式人工智能的输入阶段。

(二)著作权侵权标准的适用之二:生成式人工智能的输出阶段

输出阶段的生成内容同样面临着著作权侵权的法律风险,亦即生成内容是否与输入作品存在实质相似性。著作权理论认为“不当接触”与“实质相似性”是构成著作权侵权的一种重要规则,即“接触+实质相似性”是著作权侵权的基本要件。(18)实质相似性的判定规则及其理论构成发端于美国著作权的个案审理过程,缺乏成文立法对实质相似性进行规范澄清。(19)美国学者威廉帕特里基于作品的构成将实质相似性划分为两个层次,即作品媒介层次的相似性与作品表达内容的相似性。媒介的实质相似性依托于作品表达的实质相似性,专属于著作权侵权诉讼中的原告,且同时出现在原告作品与被告作品中。(20)

实质相似性的判定方法本质上都要求对著作权诉讼中原告、被告作品进行作品媒介与作品表达之间的分离、提炼与比较之基本步骤,以此判断是否存在独创性表达之间的重叠部分。例如美国第二巡回法院的“抽象检测法”(Abstraction Test)即通过剔除作品表达中具有区别的部分,保留具有普遍适用性的内容,重复该步骤直到提炼后的表达不再具有实质相似性的可能。(21)相对地,美国第九巡回法院的“整体概念与感知”方法则认为尽管部分被复制的表达性要素不能单独受到著作权法保护,但相同表达要素的使用和组合达到了相似的程度,以至于被告已经复制了原告的“整体概念和感觉”,足以建立原告、被告作品之间的实质相似性。(22)实质相似性要求侵权作品与著作权作品之间在独创性表达方面出现内容重叠,本质上是侵权人主动使用著作权作品且在独创性表达内容层面建立侵权作品与著作权作品之间的具体逻辑关联。 (23)

生成式人工智能是否可以从根本上规避著作权侵权风险,尤其是实质相似性的侵权标准适用,现阶段司法实践给出的答案是否定的。在广州互联网法院审理并判决的首例生成式人工智能著作权侵权案件中,生成式人工智能因生成图片与原告作品存在实质相似性而承担著作权侵权的法律责任。该案中,被告公司经营特定网站并提供人工智能对话与生成绘画的基本服务功能。原告作为著作权虚拟形象奥特曼的权利人,发现被告网站通过人工智能生成绘画功能可以生成具有奥特曼形象的图片,因此主张被告对其著作权侵权。被告公司网站的AI绘画功能可以根据用户指令生成对应的图片,如用户输入“生成一个奥特曼”即可产生奥特曼形象图片;输入“奥特曼融合美少女战士”,即生成奥特曼身体拼接美少女战士的形象图片。法院认为涉案部分生成奥特曼图片保留了原告作品在美术领域的独创性表达特征,并且多个关键特征与原告作品具有极高的相似度,构成实质性相似。尽管被告公司在应诉后尝试屏蔽关键词“奥特曼”的技术策略,但庭审过程中输入相关关键词如“迪迦”仍会生成与原告著作权图片高度相似的相关图片。(24)

因为涉及著作权虚拟形象的侵权争议,所以生成式人工智能必须面对著作权保护的特殊标准与实质相似性的判定风险。受著作权保护的虚拟形象一般源自于小说、漫画、电影等艺术创作,要求足够具体且具有独特性。(25)具体、独特的虚拟形象并不需要作为小说、漫画或电影等作品的核心内容或主要部分,只需要保证以上特征可以充分识别。(26)虚拟形象的保护标准对于著作权人证明实质相似性而言有两个层面的影响:其一,著作权人仅需要证明独特且知名的虚拟形象被生成式人工智能复制了;其二,著作权人不需要通过作品要素分离的传统方法分析和评估虚拟形象与被告作品的相似性。实际上,实质相似性判定从涉及著作权虚拟形象侵权角度而言大大降低了著作权人的举证难度,相反提高了生成式人工智能输出阶段的著作权侵权风险。这一点在图文生成为服务模式的生成式人工智能输出阶段尤为明显,广州互联网法院的判决即为典型。

三、生成式人工智能的著作权法二元属性及其价值

生成式人工智能作为创新性的技术应用不直接涉及著作权法的制度性评价。生成式人工智能既可以是合法的技术过程,也可以是基于著作权侵权的违法技术应用并承担法律责任。合法行为与侵权行为共同构成了生成式人工智能在著作权法层面的二元法律属性,而著作权侵权标准的适用增加了生成式人工智能在著作权法层面的法律不确定性。必须承认的是,生成式人工智能无论是作为合法技术还是侵权应用都会对人工智能的整体技术研发和产业发展产生实质影响。因此,有必要廓清生成式人工智能作为著作权合法行为或著作权侵权行为时所产生的价值内涵与潜在影响,为著作权法的规范应对提供价值参照。

(一)法律属性一:生成式人工智能属于著作权合法行为

生成式人工智能属于合法行为即使用作品的合法性得到了著作权法的确认。使用作品或者取得著作权人的授权,或者属于著作权法中规定的例外情形。现阶段有部分国家或地区在著作权有关的立法规则中明确了生成式人工智能特定技术应用的例外情形,例如欧盟地区通过增设“数据挖掘的限制与例外”(以下简称“TDM例外”)作为制度性例外规则明确了特定数据训练行为的合法性情形;日本也在其本国的著作权法中规定了包含人工智能特征的“计算机信息处理”行为可以豁免著作权侵权责任;而美国则围绕合理使用规则扩大解释了生成式人工智能相关行为的例外空间。(27)

生成式人工智能属于著作权法层面的合法行为,意味着著作权人不能通过著作权诉讼限制使用作品的行为,且作品使用者不需要承担著作权侵权的法律责任。这对于鼓励生成式人工智能的技术发展和特定技术应用的推广产生正面影响。例如文本数据挖掘技术通过自然语言处理(Natural Language Processing, NLP)将文本信息或数据的结构进行转化,提升数据信息的获取能力并提高科学研究效率,为商业应用模式的开发和转化奠定基础。(28)这一点实际上与著作权法律制度鼓励文学、艺术及科学领域独创性表达内容的创作与传播具有一定的相关性:生成式人工智能技术过程中所涉及的作品提取、复制、传输及使用等环节原则上属于著作权人专有权行使的范畴和目标。

确认生成式人工智能在著作权法层面的合法性,也有助于解决作品授权许可过程中存在的市场失灵问题。著作权权利行使的主要方式包括作者直接使用作品和进行作品的授权许可,后者可以增加著作权作品的使用频率、扩大作品的使用范围以及增加使用收益的主要方式。 (29)问题在于,授权许可条件下作为商品的著作权作品投入市场必然需要面对市场失灵的潜在问题。 (30)作品授权许可的市场失灵即作品在著作权人与作品使用者之间的交易行为难以实现理想的市场结果,尤其是作品授权许可的交易成本过高导致作品使用者无法与著作权人达成一致。(31)具体的原因可能包括作品授权许可的选择单一且商业模式过于僵化,或者作品授权许可凭身份准入为标准而缺乏开放性,或者作品授权许可不以传统金钱形式为支付标准等。过高的交易成本使作品不能有效授权许可或传播使用,导致著作权人的作品收益不能保证。基于作品授权许可而进行的改编、演绎、注释、整理等作品使用行为丧失合法性基础,根本上影响了著作权制度鼓励作品创作和传播的制度目标。解决著作权层面的市场失灵问题需要承认和正视作品使用的客观需求和现实价值。生成式人工智能呼应了使用作品生成文本、图片、音乐以及视频等表达性内容的使用需求,拓展了生成内容的市场需要,培育了生成内容的市场价值。具有合法性的生成式人工智能可以补充传统的著作权作品授权许可模式,提供使用作品的技术支持。同时,确认合法性能够豁免生成式人工智能技术的侵权法律责任,降低生成式人工智能在设计研发、设备测试、推广宣传等阶段所遭遇的侵权风险与法律成本,为生成式人工智能的社会服务提供了溢价空间。

(二)法律属性二:生成式人工智能属于著作权侵权行为

著作权侵权标准既适用于生成式人工智能的输入阶段,也适用于生成式人工智能的输出阶段。简言之,生成式人工智能技术过程的整体阶段都处于著作权侵权标准的适用范畴。这意味着宏观层面生成式人工智能的技术研发与产业发展不得不受制于著作权法的规范效力。当生成式人工智能属于著作权侵权行为时,著作权人可以依据著作权侵权规则就生成式人工智能使用其作品的行为发起侵权之诉。理论上,著作权人发起侵权之诉后可以充分维权,救济因生成式人工智能侵权行为造成的损失;同时,著作权人胜诉后可以一定程度限制生成式人工智能使用作品的具体行为模式,排除未经授权使用作品的渠道或机制,维护作品授权许可的专有性。生成式人工智能的技术过程属于复合型技术应用,参与主体一般包括人工智能技术研发主体、人工智能设备所有主体、训练数据提供主体、数据训练操作主体以及生成内容的使用主体。(32)上述参与主体在生成式人工智能技术过程中可能出现重合的情况,如技术研发主体与设备所有主体重合,训练数据提供主体与数据训练操作主体重合,或数据训练操作主体与生成内容使用主体重合等。当生成式人工智能属于著作权侵权行为时,上述参与主体都有可能作为直接侵权人或参与直接侵权过程的间接侵权人承担著作权侵权的法律责任。

理论上,承担著作权侵权责任的主体越多,越有利于著作权人充分救济因侵权行为遭受的损失。唯一的问题在于著作权人如何确认著作权诉讼的被告,即通过侵权之诉救济权利的合理维权目标。生成式人工智能涉及复数主体,这就无形中增加了著作权人筛选合理维权目标并进行权利救济的难度。合理的目标意味着著作权人既要能够通过诉讼有效地制止被告的侵权行为,实现遏制和惩罚的效果;又要争取最大程度的损害赔偿来弥补因侵权遭受的损失。考虑到不同类型参与主体对于生成式人工智能的影响,技术研发主体和设备所有主体从软件和硬件的两个层面根本上影响生成式人工智能的技术过程。因此,实践中生成式人工智能的著作权侵权纠纷一般以生成式人工智能的研发主体和设备所有主体作为诉讼被告,即人工智能相关技术公司。(33)

生成式人工智能技术公司作为诉讼被告对著作权人而言是合理的维权目标,但承担著作权侵权责任的负面影响不能忽视。生成式人工智能技术公司作为诉讼被告,最有可能承担的侵权责任形式一般包括停止侵害和赔偿损失,这也是各国以著作权为代表的无形财产权制度中最主要的民事救济措施。停止侵害是一种物权请求之诉,权利人既可以请求侵权人停止侵害,也可以请求法院责令侵权人停止侵害;请求停止侵害既包括已经产生之侵害,也包括可能出现之侵害。(34)著作权人请求停止侵害意味着生成式人工智能完全停止技术运行的基本流程,且在可预见的将来作为侵权性技术不得继续使用。这对于技术公司的研发投入、人力资源消耗、产品销售推广以及市场竞争都会造成难以估量的损失。赔偿损失作为一种债权之诉,即对权利人的损失要求侵权人以一定数额的金钱予以赔偿;既充分赔偿权利人的实际损失,也剥夺侵权人的侵权收益,以达到对侵权行为否定、遏制与惩罚的制度目的。(35)生成式人工智能技术公司承担赔偿损失的民事责任,是在正常的技术产品研发、测试、制造、宣传与销售推广之外额外承担的经济成本,会干扰乃至中断技术公司的正常经营周期。

著作权法的政策功能之一在于鼓励文学、艺术和科学领域的作品有效地创作和传播,丰富社会层面的独创性表达。(36)应当承认的是,生成式人工智能提高了特定条件下文学、艺术和科学领域内表达性内容生成的效率。在不受到著作权法侵权规则限制的条件下,生成式人工智能可以高效地处理文字、图片、音乐、视频等作品信息。当生成的表达性内容在外在形式上接近乃至超越作者创作的独创性表达时,作品使用者有什么理由坚持既有著作权许可获得作品而不通过生成式人工智能满足作品使用的现实需求呢?(37)当上述假设逐步通过生成式人工智能技术突破而得以实现,即生成的内容可以低成本地满足社会公众的作品使用需求,著作权法赋予作者专有的排他性权利以促进作品创作和传播的制度设计就不具有理论层面的绝对性。

四、生成式人工智能的规范应对:例外规则与授权模式

梳理和分析生成式人工智能的著作权法二元属性及其价值内涵为著作权法全面有序地应对生成式人工智能的著作权侵权风险提供了规范参照。生成式人工智能作为合法性技术应用可以为人工智能产业发展、作品的充分使用与生成内容的市场开拓提供技术支持,但一定程度上会压缩著作权作品的专有权边界,降低作品授权许可的收益预期;生成式人工智能作为侵权性技术应用则需要承担著作权侵权的法律责任,负面影响人工智能技术推广与生成内容的使用空间。总体而言,著作权法层面明确生成式人工智能的二元法律属性需要遵循著作权法律制度宏观层面的利益平衡原则,具体兼顾作品的充分保护与技术应用的创作空间。(38)著作权法层面廓清生成式人工智能的法律性质,通过例外规则的设计和授权模式的多样化来协调生成式人工智能技术发展与作品的著作权保护是有效应对生成式人工智能的合理路径。著作权法应当通过例外规则的设计鼓励生成式人工智能广泛地参与表达性内容的输入、分析、处理以及生成,提高表达性内容的生成和传播,通过生成内容的表达属性满足社会公众的精神文化需求。同时,著作权人应当认识到生成式人工智能对于开发新的作品需求市场具有重要意义,合理的授权模式有助于满足多元化的作品市场需求。

(一)例外规则设计:整体定义与行为标准

通过著作权法明确生成式人工智能的法律属性能够为生成式人工智能技术提供稳定发展的空间和安全研发的方向,为生成式人工智能参与主体的行为模式提供明确指引,降低生成式人工智能的法律风险。遗憾的是,现阶段各国对于生成式人工智能的例外规定仅限于以文本数据挖掘为代表的特定技术应用,不能普遍适用于生成式人工智能的不同技术类型。如果通过个案审理厘清生成式人工智能的法律属性,不仅会受到各国司法制度的差异化影响,还容易造成裁判标准无法统一的情况,导致生成式人工智能的侵权标准不统一、不清晰,影响产业发展的风险评估。为了应对上述问题,需要通过体系化的例外规则设计将生成式人工智能纳入著作权法的合法行为范畴。设计体系化规则需要兼顾生成式人工智能的两个方面:一是合法行为的整体定义;二是合法行为的具体标准。可通过整体定义扩大生成式人工智能的合法性边界,依托具体标准引导参与主体的行为模式,为后续生成式人工智能的著作权立法提供规则参照。

其一,明确合法行为的整体定义。明确合法行为的整体定义即明确生成式人工智能在何种情况下属于著作权合法行为。考虑到有的国家和地区已经在著作权立法实践中规定了特定生成式人工智能技术应用作为著作权的例外情形,故可以围绕特定的技术应用设计合法行为的整体定义。例如通过类型化文本数据挖掘技术的基本概念来定义生成式人工智能的合法行为,具体可以规定为“一种自动处理数据化内容信息,包括文本、图片、数据、声音、图像或其他数据形式内容,或上述要素组合的人工智能技术,以获得新功能、新信息或新知识为主要目的”。

需要明确的是,以上基于类型化技术特征的整体定义不是合法行为定义的核心内容。通过生成式人工智能获得功能、信息与知识等内容才是合法行为的主要标准。合法行为的整体定义具有一定的开放性,可以较为灵活地涵盖生成式人工智能的主要技术类型和技术革新的调整空间。对于著作权人而言,合法行为以获得和使用独创性表达之外的功能内容为评估标准,有利于引导生成式人工智能技术研发、数据测试、应用推广以及商业开发等流程规避著作权侵权的标准适用。对于生成式人工智能的参与主体而言,合法行为要求技术过程以功能目的为导向,以避免落入著作权专有行为的边界。因此,合法行为的整体定义对于平衡生成式人工智能技术发展与著作权作品保护也具有一定的指导意义。

其二,确定合法行为的具体标准。体系化的例外规则设计还应当考虑合法行为的具体标准,为生成式人工智能参与主体的行为决策提供明确、清晰且具体的规范参照。由于生成式人工智能的著作权侵权标准包括输入阶段的复制行为以及输出阶段的实质相似性问题,合法行为的具体标准应当基于这两个层面进行设计,以更好地协调生成式人工智能与著作权作品使用之间的潜在冲突。因此,合法行为的具体标准应包括三点:一是允许基于数据训练技术运行而必须进行的复制行为,如人工智能软件、硬件设备的检测、维修等基本技术步骤和技术流程;二是允许基于标注或注释目的的生成行为,用于清晰标识生成内容的属性和来源(39);三是允许基于人工智能设备相关信息的暂存、缓存、验证等功能性行为。

以上合法行为的具体标准未尽全面,旨在为生成式人工智能的规则订立提供一定参照,为生成式人工智能的参与主体提供较为明确的行为标准,避免特定技术应用和行为实施面临著作权侵权风险。允许生成式人工智能参与主体在明确合法行为标准的前提下自由和充分地运用生成式人工智能技术,有助于鼓励生成多元、高效、安全与高质量的生成内容,丰富社会公众对于表达性内容的多层次需求。(40)以上行为标准并未规定生成式人工智能是否应属于商业应用,这是因为限制商业应用可能会干扰生成式人工智能的产业发展,迫使人工智能技术团队谨慎对待商用技术模式的开发,限制技术应用的潜在场景,降低生成式人工智能的产业价值。

(二)授权模式多样化

著作权作品的授权许可是合法使用作品,是避免侵权风险的机制保障。生成式人工智能的侵权风险就在于输入阶段不能确保合法的著作权授权。通过合法的授权模式生成具有类似作品外在表现形式的表达性内容,能够满足社会公众对于表达性内容的多元使用需求,一定程度上形成新的表达性内容的需求市场和商业模式。有鉴于此,著作权人可以通过授权模式的创新与人工智能技术公司建立实质合作关系,以授权合同的形式约定作品使用的行为义务、生成内容的收益分配以及法律风险的承担比例等。授权模式属于事前协商模式,可以更有效地保证生成式人工智能技术过程中使用作品的稳定性,避免出现著作权诉讼的法律风险,加强双方对于作品使用过程的重视。生成式人工智能具有输入数据规模大、训练数据种类多以及输出数据价值高的基本特征,运用传统著作权授权模式不能满足生成式人工智能规模化的技术特征。(41)解决规模化的作品授权,著作权集体管理组织可以发挥重要作用。著作权集体管理组织可以根据生成式人工智能的作品使用需求作为授权协商的基础,代表著作权人进行规模化的授权许可,保障数据行为获得合法的著作权授权许可。不过,著作权集体管理组织面对规模化许可的现实需求,本身可能存在授权模式不够灵活、数字作品覆盖未尽全面以及组织管理效率有待提高等潜在问题。(42)

除了著作权集体管理组织的作品授权模式,参照知识共享协议的授权模式也可以为著作权法应对生成式人工智能提供思路。知识共享协议(Creative Commons, short for CC)是著作权领域参考计算机软件的开源授权模式而建立的作品授权模式。知识共享协议在允许著作权人脱离传统的著作权作品授权模式,保留部分著作权(如署名权、改编权、保护作品完整权)的情况下向作品使用者提供不同类型的授权许可协议。(43)知识共享协议减轻了作品使用者作为协议被许可方所要承担的法定义务,间接降低了作品使用者可能承担的著作权侵权责任。对于著作权人而言,知识共享协议提供了额外的授权选择。即便知识共享协议的授权结果不及预期,著作权人仍然可以通过传统的著作权作品授权模式实现作品的许可使用。知识共享协议对于生成式人工智能的规模化特征具有正向价值。知识共享协议的类型多样性和授权灵活性契合生成式人工智能所需要的低成本输入特征。同时,知识共享协议鼓励内容分享的授权理念本身也符合生成式人工智能规模化的产业特征。具体应用于生成式人工智能的技术过程,知识共享协议作为事前授权机制可以有效降低与著作权人协商使用作品的交易成本,提高了获得合法授权使用作品的概率,增加了作品的授权类型和数量,最终有利于生成式人工智能规模化的技术实现。

五、结语

生成式人工智能作为技术革新和新质生产力的典型,深刻地改变了文本、图片、音乐以及视频等表达性内容的生产方式,为国家、社会及个人提供满足其使用需求的多元化表达性内容。生成式人工智能对著作权作品的使用与保护提出了实质挑战。生成式人工智能的著作权侵权标准包括输入阶段的复制行为以及输出阶段的实质相似性问题,二者都会产生著作权诉讼的法律风险,影响生成式人工智能技术过程的正常运行。生成式人工智能在著作权法层面二元法律属性是著作权法律制度应对生成式人工智能的制度性结果。当生成式人工智能属于著作权合法行为时,则生成式人工智能可以拓宽适用场景和培育市场需求,通过生成内容满足社会公众的多元化需要,并推动解决著作权作品授权许可的市场失灵问题;当生成式人工智能属于著作权侵权行为时,则生成式人工智能的参与主体有可能承担侵权法律责任,对产业发展和技术革新造成负面影响。因此,应当通过著作权法厘清和确认生成式人工智能的法律属性,结合著作权法的例外规则设计与作品授权模式的多元化,协调生成式人工智能技术发展与作品的著作权保护。通过构建生成式人工智能的规范架构,为生成式人工智能的后续立法、司法和行政执法提供充分合理的规范参照。

注释:

(1) 参见《这幅画卖出300万天价 但它的创作者却“不是人”》,中国日报网2018年10月26日。

(2) 如2023年12月,纽约时报以著作权侵权起诉微软和OpenAI,主张ChatGPT训练数据中使用其作品的行为构成著作权侵权;2024年3月,法国竞争管理局宣布对谷歌处以 2.5 亿欧元罚款,认为谷歌人工智能服务对受著作权保护内容的使用未能按其承诺与权利人进行谈判并合理支付许可费用。

(3) 吴汉东:《人工智能时代的制度安排与法律规制》,《法律科学(西北政法大学学报)》2017年第5期。

(4) 参见《生成式人工智能服务管理暂行办法》第7条。

(5) 参见《中华人民共和国人工智能法(学者建议稿)》第23条第1款。

(6) [美]杰瑞·卡普兰:《人工智能时代》,李盼译,浙江人民出版社2016年版,第24页。

(7) Paul Goldstein, Copyright’s Highway, From the Printing Press to the Cloud, Standford University Press, 2019, p.59.

(8) 图灵测试即一名测试者写下自己的问题,随后将问题以纯文本的形式(如计算机屏幕和键盘)发送给另一个房间中的一个人与一台机器。测试者根据他们的回答来判断哪一个是真人,哪一个是机器。所有参与测试的人或机器都会被分开。这个测试旨在探究机器能否模拟出与人类相似或无法区分的智能。

(9) 王鹏: 《ChatGPT赋能数字经济发展新模式》,中国日报网2023年2月18日。

(10) See Matt Growcoot, Stability AI Preview Next-Gen AI Image Generator Stable Diffusion 3, PetaPixel, Feb (23rd)" 2024.

(11) See Johnson v. Gordon, 409 F.3d 12, 18 (1st Cir. 2005).

(12) 参见北京市高级人民法院(2015)高民(知)终字第1039号民事判决书。

(13) See Min Chen, Artists and Illustrators Are Suing Three A.I. Art Generators for Scraping and “Collaging” Their Work Without Consent, USA Art News, Jan. 24th 2023.

(14) 梁志文:《论演绎权的保护范围》,《中国法学》2015年第5期。

(15) 来小鹏:《知识产权法学》,中国政法大学出版社2019年版,第115页。

(16) 参见《版权条约》第1条第(4)款和《表演和录音制品条约》第1条第(2)款。

(17) 参见《中华人民共和国著作权法》第10条第1款第(5)项。

(18) 吴汉东:《试论“实质性相似+接触”的侵权认定规则》,《法学》2015年第8期。

(19) 参见阳贤文:《美国司法中实质性相似之判断与启示》,《中国版权》2012年第5期。

(20) See William F. Patry, Party on Copyright, Thomson West, 2007, p.59.

(21) See Melville B. Nimmer and David Nimmer, Nimmer on Copyright, Matthew Bender, 1997, p.13.

(22) See Nichols v. Universal Pictures Co., 45 F.2d 119, 121 (2d Cir. 1930).

(23) See Roth Greeting Cards v. United Card Co., 429 F.2d 1106, 1110 (9th Cir. 1970).

(24) 参见广东省广州互联网法院(2024)粤0192民初113号民事判决书。

(25) Jani McCutcheon, Works of Fiction: The Misconception of Literary Characters as Copyright Works, Journal of Copyright Society of the USA, 2018, 66(1), pp.123-124.

(26) See Generally DC Comics v. Towle, 802 F.3d 1012, 1021 (9th Cir. 2015); also see Gaiman v. McFarlane, 360 F.3d 644, 660 (7th Cir, 2004).

(27) 关于欧盟规定的“数据和文本挖掘”,指的是旨在分析数字形式的文本和数据以获得包括但不限于有关模式、趋势和相关性信息的任何自动化分析技术,包括AI 技术。参见《单一数字市场版权指令》( Directive(EU(2019/790)序言第8段及第2条第 (2) 项;关于日本著作权法的具体规定,参见日本《著作权法》第30条之4规定;关于美国合理使用规则的适用,See Benjamin L. W. Sobel, Artificial Intelligence’s Fair Use Crysis, Columbia Journal of Law amp; Arts, 2017, 41(45), p.49.

(28) 典型的商用文本数据挖掘工具如IBM公司的Intelligent Miner、SAS公司Enterprise Miner、SPSS公司Clementine等。

(29) Mark A. Lemley, The Economics of Improvement in Intellectual Property Law, Texas Law Review, 1997, 75(5), pp.989-992.

(30) Wendy J. Gordon, Fair Use as Market Failure: A Structural and Economic Analysis of the Betamax Case and Its Predecessors, Journal of Copyright Society of the U.S.A., 1983, 30(3), pp.254-55.

(31) [美]威廉·M.兰德斯、理查德·A.波斯纳:" 《知识产权法的经济结构》,金海军译,北京大学出版社2016年版,第45页。

(32) Margaret A. Boden, AI, Its Nature and Future, Oxford University Press, 2016, p.97.

(33) See e.g. Getty Images (US), Inc. v. Stability AI, Inc., No. 1:23-cv-00135-UNA (D Del. Feb. 3, 2023); also see Anderson et al. v. Stability AI ltd. et al., Docket No. 3:23-cv-00201(N.D. Cal. Jan. 13, 2023).

(34) 吴汉东:《无形财产权基本问题研究》,中国人民大学出版社2013年版,第133页。

(35) 杨立新:《侵权损害赔偿》(第六版),法律出版社2016年版,第239页。

(36) 吴汉东:《知识产权中国化应用研究》,中国人民大学出版社2014年版,第284页。

(37) 例如AI绘画技术对于原画师的职业影响,参见《AI绘画与原创画师:关于未来,我们依然在求解|特稿》,《澎湃新闻网》2023年11月13日。

(38) 冯晓青:《著作权法的利益平衡理论研究》,《湖南大学学报》(社会科学版)2008年第6期。

(39) 部分国家政府已经要求生成式人工智能技术公司主动对其生成内容进行标识,明确生成内容的属性和来源。See FACT SHEET:Biden-Harris Administration Secures Voluntary Commitments from Leading Artificial Intelligence Companies to Manage the Risks Posed by Al, Press Release, The White House, July 21st 2023.

(40) Amanda Levendowski, How Copyright Law Can Fix Artificial Intelligence's Implicit Bias Problem, Washington Law Review, 2018, 93(2), pp.606-607.

(41) 焦和平:《人工智能创作中数据获取与利用的著作权风险及化解路径》,《当代法学》2022年第4期。

(42) 孟磊:《智能时代的著作权集体管理:挑战、反思与重构》,《出版发行研究》2020年第1期。

(43) 邓朝霞:《网络版权的公共领域研究——以知识共享协议为例》,《电子知识产权》2018年第12期。

作者简介:孙阳,中国政法大学民商经济法学院副教授,北京,100088。

(责任编辑 程 骋)

猜你喜欢
生成式人工智能著作权法
生成式人工智能的教育启示:让每个人成为他自己
挑战·融合·变革:“ChatGPT与未来教育”会议综述
生成式人工智能时代的政治传播走向
党政研究(2023年3期)2023-05-29 01:10:39
生成式人工智能重塑教育及教师应对之道
人机共生时代国际传播的理念升维与自主叙事体系构建
对外传播(2023年4期)2023-05-21 20:52:16
生成式人工智能的教育应用与展望
新《著作权法》视域下视听作品的界定
从著作权法适用的角度谈对网络实时转播行为的规制
知识产权(2016年8期)2016-12-01 07:01:23
论版权转让登记的对抗效力——评著作权法修改草案(送审稿)第59条
知识产权(2016年4期)2016-12-01 06:57:54
著作权法的作品观:从本质主义到建构主义
知识产权(2016年1期)2016-12-01 06:56:40