摘 要:【目的】明晰生成式人工智能生成内容的权益归属,缓和生成式人工智能与著作权法之间的矛盾,为生成式人工智能著作权法保障提供建议。【方法】通过分析生成式人工智能的运行逻辑,结合著作权权属认定的基本理论与司法实践,探寻生成式人工智能生成内容权益归属的基本原则。【结果】生成式人工智能本身不可作为著作权主体,而在用户与服务提供者之间,当以约定为先,没有约定时则顺位适用法定权属配置规则。【结论】生成式人工智能生成内容权益归属的厘定,有助于纾解生成式人工智能所面临的法律风险,实现著作权法鼓励文化创新的立法目的。
关键词:生成式人工智能;服务提供者;用户;作者中心主义;投资保护主义;权益归属
中图分类号:D923.41 文献标志码:A 文章编号:1003-5168(2024)15-0115-06
DOI:10.19968/j.cnki.hnkj.1003-5168.2024.15.025
Research on the Ownership of Rights of Generative AI-Generated Content
ZHANG Wenrui1 TANG Yifan2
(1.College of Law, Hebei University , Baoding 071002 , China;2.Institute of political and history Cangzhou Normal University,Cangzhou 061000,China)
Abstract:[Purposes] This paper aims to clarify the ownership of rights and interests in generative AI-generated content aims to alleviate the sharp contradiction between generative AI and copyright law, and provide copyright law protection for the development of generative AI. [Methods] By analyzing the operation logic of generative AI, and combining with the basic theory and judicial practice of copyright ownership determination, this paper explores the basic principles of ownership of content generated by generative AI. [Findings] After clarifying the basic principles, it can be seen that generative AI itself cannot be used as a copyright subject, and between users and service providers, when the agreement takes precedence, and if there is no agreement, the legal ownership allocation rules will be applied in order.[Conclusions] The determination of the ownership of the rights and interests of generative AI-generated content will help alleviate the legal risks faced by generative AI and achieve the legislative purpose of the Copyright Law to encourage cultural innovation.
Keywords:generative AI;service providers;user;author-centrism;investment-protectionism;the ownership of rights
0 引言
王利明在2023世界人工智能大会法治论坛的演讲中提到,ChatGPT容易生成虚假信息,在经大面积传播后,不仅会对单个的受害人造成重大损害,甚至会引发社会的不稳定。从侵权对象来看,ChatGPT等生成式人工智能引发的侵权行为,主要是侵害人格权和知识产权[1]。2023年11月27日,北京互联网法院针对人工智能生成图片(AI绘画图片)著作权侵权纠纷作出一审判决,该案为AI生成图片相关领域著作权第一案。
尽管本案已经尘埃落定,但其对著作权法的影响却远不止于此。这一判决促使我们不断反思既有的著作权法体系:尽管司法裁判对生成式人工智能生成内容的法律性质作出了界定,但同时又径行说明“涉案图片是基于原告的智力投入直接产生的,且体现出了原告的个性化表达,故原告是涉案图片的作者,享有涉案图片的著作权”,从而肯定了生成式人工智能生成内容的权益当归属于用户。这一观点是否能够被法律体系接纳,有待商榷。
1 生成式人工智能生成内容的主体类型
关于生成式人工智能生成内容的权益归属,学界存在诸多观点,包括人工智能机器说、设计者说、制造者说、购买者说、使用者说、所有者说、合作者说等。但无论是何种观点,其合理性证成均建立在对生成式人工智能运行逻辑进行分析的基础上。
1.1 生成式人工智能的运行逻辑
生成式人工智能的运行逻辑基本可以分为4个阶段,即设计阶段、训练阶段、运行阶段和自学习阶段(如图1所示)。
1.1.1 设计阶段。生成式人工智能研发者通过独特的算法设计,使得生成式人工智能本身不仅具有传统人工智能的自我学习、自我进化的能力,还获得了自注意能力。以OpenAI公司发布的ChatGPT为典型,其利用神经网络模Transformer算法获得了自我注意的能力,使其在进行编码处理的时候不仅向外界寻求资料,同时也向自身寻求资料。易言之,此时生成式人工智能的输出不仅是它转述了别人的说法,同时还是它在符合自身系统编排序列的前提下转述了别人的说法[2]。
1.1.2 训练阶段。生成式人工智能研发者通过对人工智能进行数据喂养来锻炼其自动生成后续文本的能力。通过让人工智能在海量数据中学习文字接龙,并将人工智能的回答与语料中下文的内容做对比[3],提高其生成内容的准确性。
1.1.3 运行阶段。运行阶段是生成式人工智能最为重要的阶段。在这一阶段,服务提供者将生成式人工智能投放到市场,开始让生成式人工智能与用户进行互动。在此过程中,生成式人工智能结合自身的算法和前一阶段的训练数据,给不同的用户以多元化的答案,并由用户来对这些答案的好坏做排序。服务提供者通过搜集用户的信息来优化生成式人工智能算法,建立一个尽量符合用户要求的评价标准。
1.1.4 自学习阶段。自学习阶段是最能体现生成式人工智能算法和算力优势的阶段。服务提供者和用户在此时都无法直接接触到生成式人工智能本身,转而由生成式人工智能根据服务提供者设计的算法和搜集的用户数据进行自我学习和自我优化。在这一阶段生成的内容也会由服务提供者进行监督和搜集,并用于下一周期的模型训练。
1.2 生成式人工智能生成内容的主体争鸣
值得注意的是,此处的服务提供者,应当作广义理解,包含生成式人工智能的研发者在内。上述已然明晰,在训练阶段需要研发者用数据喂养生成式人工智能以培养其基础能力,而《生成式人工智能服务管理暂行办法》(以下简称《办法》)在未区分服务提供者与研发者的前提下,径行规定服务提供者当遵守数据合规义务,实则旨在将生成式人工智能服务的技术研发商、应用开发商、提供API接口等接入服务的提供商,以及直接利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人,均视为服务提供者。
用户仍是当下最主要的生成式人工智能生成内容的作者类别。著作权法规定只有具备独创性的文学艺术作品才有可能被视为作品,作者的创作过程必须是独立的智力劳动,其产出的内容必须经过逻辑性的有机组合[4]。在与生成式人工智能进行交互的过程中,用户需要依据生成式人工智能模型进行相关思考,并最终选定输入的数据。此过程是用户智力投入的体现,因此用户应为生成内容的作者。
亦有学者指出,由于机器依托于人类预设的控制、指示、操作与监控程序,其生成的内容本质上体现了人的思维与行为模式,故机器的创造者或设计者应当被视为版权所有人[5]。故而,生成式人工智能生成内容当归属于服务提供者。
此外,还有学者提出从维护著作权法在 “激励自然人创作”方面的价值取向和基本概念体系,促进人工智能产业健康发展及保护自然人创作者的合法权益角度分析,人工智能生成内容宜采用非赋权模式,以作为知识公有领域的组成部分[6]。
2 生成式人工智能生成内容主体认定的基本原则
生成式人工智能的问世标志着第四次科技革命的到来,人工智能生成内容的权属争议面临诸多理论和实践层面的困境。这一争议的本质是作者中心主义和投资保护主义的博弈。
2.1 追本溯源:作者中心主义
作者中心主义最初源自“天赋人权”理念,即“天赋著作权”,意指著作权是上天赋予的人类对自己的文艺创作物享有的自然权利。政府和法律只是消极确认,而非积极赋权,从而促成了“作品人格价值说”理论的出现——人拥有的最神圣、最具人格性、最有价值的财产就是作品,著作权法即确认作者对其作品具备专有权的法,该专有权神圣不可侵犯[7]。作者中心主义孕育于法国大革命时期的两部法律,分别是1791年的《表演权法》和1793年的《作者权法》,前者认可了表演权人对作品独占性的表演权,后者又认可了作曲家、画家及各种书面形式的作者终身在法国整体上或部分地销售、出卖、转让其作品的权利,作者的继承人在作者死后10年内继承作者的相关权利[8]。可见,在法国大革命的浪潮下,法国著作权法的体系从其诞生之初就刻有深刻的个人主义色彩,作者是著作权领域的核心所在。也正如Saunders所言:以个性化为特征的作者中心主义法国体系,其源头在于法国大革命的法令[9]。这种以“创作者”为中心,重视作品的人格价值,并在著作权法律制度中开创性地设立著作权人的精神权利理论,逐渐演变成作者中心主义,影响了世界各国的著作权立法[7]。
当下,世界各国的知识产权法体系都坚持以人为中心来建立其保护体系,贯彻智力成果必须源于人的立法思路。《伯尔尼公约》成员国普遍同意“作品”应是“人类智力和创造活动产生的独立成果”[10]。我国《著作权法》第十一条第二款也是作者中心主义的体现,申明了“创作原则”在作品权利归属规则中的地位。因此,基于对人的尊重、对人权价值的肯定,为作品投入了智力成果的人理所当然地成为著作权人。
2.2 与时俱进:投资保护主义
随着工业革命的到来,基于人类中心主义的伦理原则开始受到挑战,作品的创作主体呈现出多元化的趋势,“劳动理论”“人格理论”及“功利理论”等指向自然人创作的著作权理论基础逐渐松动。
由于社会公众的文化需求逐步提升,电影等复杂形式的作品开始丰富公众的精神世界,该类作品通常不能够为某个自然人所单独完成,而是需要物力、人力和财力等资源的大量投入。在这样的背景下,资本对作品的创作起到重要作用。为促使文化产业的繁荣,著作权法开始主动求变,为创作复杂多元化形式的作品寻找制度空间。因此,著作权归属出现了“投资者所有”的模式。我国《著作权法》第十一条第三款即是。
进入21世纪,科技革命孕育了人机协同创作模式的诞生与发展。高新科技产业等新兴产业逐步壮大,作品创作分工的精细化和复制化使得作品创作与固定成本不断增加,投资风险日益增大,创作者个人更无法承担创作前期所需的巨额资金与投资风险[11]。因此,淡化创作者精神利益的保护,承认投资者作者身份的规制路径逐渐被各国著作权法体系所接纳。英国《版权法》第11条、日本《著作权法》第15条等域外法律中都映射着投资保护主义的立法思路。
3 生成式人工智能生成内容的权益归属认定
基于利益衡量、立法成本以及执行成本的考量,对生成式人工智能生成内容权益归属的认定可以以现行的著作权体系为基础,通过法律解释来进行规制,在作者中心主义与投资保护主义之间寻找一个最佳的利益平衡点,以期促进生成式人工智能的产业发展。
3.1 生成式人工智能本身无法作为著作权人
尽管学界存在生成式人工智能生成内容应当归属于人工智能本身的主张,但《办法》并未将生成式人工智能作为法律关系的主体,而是将其作为一种“服务”,这一规定的合理性有两点。
第一,就生成式人工智能的运行逻辑来看,其本质仍是一种算法工具。相较于传统人工智能的内容生成,生成式人工智能的技术创新在于用自然对话的人类表达方式提供了大型语言模型与人的统一新型交互接口,使得自然语言生成任务兼容了自然语言理解任务,使中间任务逐渐退出,通过算法和算力的加持实现原始素材到最终生成物的直接生产链路,端到端地完成最终任务[4]。以ChatGPT为例,其核心算法Transformer通过“搜集、学习、反馈输入数据”的方式,将与人的交流作为自身学习的一部分,同时将数据进行搜集用以自我提升。因此,生成式人工智能没有思想,仅是一种算法工具,其本身并不具备法律关系主体资格,不能被赋予权利能力,也不存在行为能力和责任能力[12]。有关著作权的争论是人基于人的立场和视角展开的,故生成内容的权益无法归属于生成式人工智能本身。
第二,在著作权法体系中,无论是作者中心主义,还是投资保护主义,其核心都在于对“人”的价值认同。正所谓“作品作为作者的创造物,最能体现作者的人格;作者因创造了体现其人格的作品,就应该对该作品拥有不可剥夺的财产权。由此,版权被认为是作者人格的具体化”[13]。而生成式人工智能所创作的作品不过是算法模式下的“重复”,即使存在算法黑箱使人无法解释生成式人工智能运行过程中的复杂性,但对于其生成内容总是有算法可循。然而人的创作则与之不同,人类大脑中所包含的思想、感情和灵感,是生成式人工智能所无法模拟的,也是人类文学艺术作品的精华所在。因此,生成式人工智能的生成内容与人的创作内容并非同质,也就不应将生成式人工智能作为著作权法主体。
3.2 生成式人工智能生成内容权益归属约定优先
基于经济学之考量,“主观评价标准才是对价值的唯一可信测度”,主体而非任何外在的第三方对于自身的资源利用能力(如何能够发挥资源最大价值)和主观评价(资源的价值如何)拥有最为完备的信息,因而能够在其社会交往当中自发构建与反复检验促进资源最优利用的权属配置规则[14]。因此,著作权利益主体的多元化和利益关系的复杂化使得自发性、有序化地构建权属配置规则更为重要。在著作权法中,牵涉多元主体的复杂利益关系时,法定版权配置规则也后顺位于私人自发构建的归属规则。
生成式人工智能的投入和运行本身涉及多元化的利益主体。生成式人工智能初期的技术开发、算法设计、模型训练等工作,需要大量的资金投入。现实中,有能力承担人工智能开发的都是诸如微软、谷歌、Facebook等巨头企业或政府提供资金支持的研发团队,一般个人难以承担人工智能开发所需的巨额成本。人工智能生成物等十分依赖巨额投资和相当长时间劳动才能完成作品的创作,其在某种程度上更加依赖于投资方的资金保障和组织工作,而非依赖于个人的独立创作、智力创作或者创新[11]。因此,部分生成式人工智能服务提供者在用户使用其产品之前,就在服务协议中注明了生成内容归属权益的条款。目前主流生成式人工智能模型的权利归属模式主要分为表1中的四类。
生成式人工智能运行逻辑中所关系到的主体和利益错综复杂,法律难以评价多元情境之下不同主体对于生成内容的智力贡献程度,因此法定的权属配置规则易致使著作权归属权益与作品创作贡献程度不匹配,难以实现著作权法鼓励创新、促进文化发展之目的。因此,对于生成式人工智能生成内容的权益归属问题,法律应当尊重各主体之间的约定,在约定不明时,再适用法定权属配置规则。
3.3 用户创作型生成内容的著作权归属
在运行阶段用户主导生成式人工智能生成内容的情况下,生成内容当以用户为著作权人。尽管在人机协同的创作模式下,人无法完全预测到生成式人工智能的生成内容,生成式人工智能具有高度的自主性,然而其生成内容更多的还是体现着人的思想与感情。这一点在学术界和实务界均获得了认可。
就生成式人工智能的运行逻辑来看,其运行是以人的智力活动为基础的,需要人先行通过自己的思考选择相应的类型、样本数据、模板框架、生成时间等,而后输入至生成式人工智能,再由其通过自身的算法生成一定的结果。诚然,生成式人工智能相较于传统人工智能而言,呈现出生成内容的不确定性,其能够因人而异、因时而异地对相同的输入内容,针对不同的用户输出不同的内容。在某一次对话中出现的侵权内容未必在其他对话中出现,表面上具有一定的“独创性”,但是其本质仍是在算法运行下的生成结果,并不能够体现思想的过程,更不能将其依托算法输出内容的过程视为创作的过程。因此,生成式人工智能并不具备作为著作权主体资格的“人”的理性、独立思考能力和意志能力,正所谓“人是一根有思想的芦苇”。基于这种思想和理性,人具有了认识世界、改造世界的能力,成为有别于动物的能够自律、他律的主体,故此人被作为著作权法的主体。但生成式人工智能则不然,尽管现有的生成式人工智能已经初步具备了人的意志外观,甚至有迈入“强人工智能时代”的趋势,但是其本质上仍然是对人的智慧的模仿,是人的智能的物化,其并不具备人的思想——这是人之所以为人而区别于智能产品的根本。
司法实务中的经典案例“Dreamwriter案”也印证了这一点。广东省深圳市南山区人民法院在判决中说明:“根据查明的事实,涉案文章是在原告的主持下,由包含编辑团队、产品团队、技术开发团队在内的主创团队运用Dreamwriter软件完成的,并未提及涉案文章还有其他参与创作的主体。涉案文章是由原告主持的多团队、多人分工形成的整体智力创作完成的作品,整体体现原告对于发布股评综述类文章的需求和意图……本院认定涉案文章是原告主持创作的法人作品,原告是本案适格的主体,有权针对侵权行为提起民事诉讼”①。以此观之,法院认可原告主创团队在数据处理和语料风格取舍上的个性化安排与选择具有一定的独创性,属于与涉案文章的特定表现形式之间具有直接联系的智力活动[7]。因此,更趋向于将软件的使用者而非软件本身作为著作权主体。在北京市互联网法院裁判的“AI生成图片著作权侵权第一案”中,也保持了相同的裁判思路。法院认为“涉案人工智能模型设计者既没有创作涉案图片的意愿,也没有预先设定后续生成内容,其并未参与涉案图片的生成过程,于本案而言,其仅是创作工具的生产者……涉案人工智能模型设计者亦不是涉案图片的作者。而原告是直接根据需要对涉案人工智能模型进行相关设置,并最终选定涉案图片的人,涉案图片是基于原告的智力投入直接产生的,体现出了原告的个性化表达,故原告是涉案图片的作者,享有涉案图片的著作权”②。本案也认可了生成式人工智能的使用者对生成内容的著作权。
3.4 生成式人工智能自学习生成内容的著作权归属
自学习阶段,生成式人工智能在进行自我学习的过程中,能够根据奖励模型的反馈来优化自身的产出结果,以完成自我学习与优化。这一阶段,人工智能已经脱离了低级的人为数据输入,能够通过自身的深度学习,梳理和选取创作所需的各种材料、片段,再运用独特的方式和技巧对所提炼出来的信息进行整合和加工,从而满足著作权法关于作品的创造性最低限度要求[16]。此时,生成式人工智能的创作主要是基于自身已经搜集的数据以及设计的算法,与用户及服务提供者都不再具有直接关系,其“创作”可能会脱离用户与服务提供者所预设的路线,生成各方主体所无法预见的结果,这也正是部分学者认为生成式人工智能存在意志能力的重要论据。但本质上,任何人工智能生成内容都是“人”创作的结果。尽管用户与服务提供者没有参与生成式人工智能自学习阶段的输入,然而不可忽视的是服务提供者在设计阶段预设的算法,在训练阶段喂养的数据以及用户在运行阶段所交互的数据,都是生成式人工智能“创作”的基础,这些基础使得生成式人工智能形成了自身的判断标准和体系,让其能够在海量的数据中汲取养分,不断成长。因此,自学习阶段生成式人工智能的“创作”不过是其在后期模仿人类的思维创作出具有独创性的表达,使其从外表上看具有了类人的意志和情感。
而自学习阶段的基础,更多的是来自服务提供者前期的科技投资、算法设计以及数据喂养,用户在运行阶段交互的数据更多是为了生成专属于自身的内容。尽管表面上能够满足生成式人工智能的“数据投资”,但实质上其输入的数据与生成式人工智能交互的行为并非生成式人工智能的优化与完善。相较于服务提供者而言,用户的数据输入显然不满足“投资”的要件,且用户难以助力生成式人工智能的算法与算力设计。因此,在自学习阶段,生成式人工智能的生成内容著作权人应为其服务提供者。
4 结语
科技发展能够促进著作权法的革新,但革新并不意味着要创制全新的法律规则。生成式人工智能生成内容的权益归属问题给著作权法带来的挑战,完全可以使用已有的法律制度予以纾解,在作者中心主义与投资保护主义的立法思路之间探寻最佳的利益协调机制。明确不同场景下生成式人工智能生成内容的权益归属,能够在激励用户使用新兴技术实现文化创新的同时保障服务提供者的投资权益,实现促进文化创新与科技发展的双重目标。
注释:
①参见广东省深圳市南山区人民法院(2019)粤0305民初14010号民事判决书。
②参见北京市互联网法院(2023)京0491民初11279号民事判决书。
OywDh/HbQ+gSeBOCz3zaV+dka5mkSpDBqXOSprllRDY=参考文献:
[1]王利明.对生成式人工智能法律规制的几点思考[EB/OL].(2023-08-23)[2024-01-13].https://www.civillaw.com.cn/t/?id=39359.
[2]刘振宇.生成式人工智能的法律规制:承认还是再分配[J].地方立法研究,2023,8(4):40.
[3]毕文轩.生成式人工智能的风险规制困境及其化解:以ChatGPT的规制为视角[J].比较法研究,2023(3):155-172.
[4]唐一力,牛思晗.论人工智能生成作品的权利主体及其著作权归属[J].福建论坛(人文社会科学版),2023(11):107-122.
[5]吴汉东.人工智能时代的制度安排与法律规制[J].法律科学(西北政法大学学报),2017,35(5):128-136.
[6]于雯雯.再论人工智能生成内容在著作权法上的权益归属[J].中国社会科学院大学学报,2022,42(2):89-100,146-147.
[7]左荣昌.人工智能创作物法律保护的证成和设计[J].重庆交通大学学报(社会科学版),2021,21(5):15-23.
[8]陈凤兰,吕静嶶.西方版权沿革与贸易[M].郑州:河南人民出版社,2004.
[9]David Saunders.Author and Copyright [M].London:Stand University Press,1992.
[10]于雯雯.人工智能生成内容在著作权法上的权益归属[J].人工智能,2020(4):93-100.
[11]李晓宇.人工智能生成物的可版权性与权利分配刍议[J].电子知识产权,2018(6):31-43.
[12]李爱君.人工智能法律行为论[J].政法论坛,2019,37(3):176-183.
[13]贾斯丁·休斯.知识产权哲学[A].杨才然,张萍,译.刘春田主编.中国知识产权评论(第二卷)[C].北京:商务印书馆,2006.
[14]埃里克森.无需法律的秩序:相邻者如何解决纠纷.[M].苏力,译.北京:中国政法大学出版社,2016.
[15]黄荣楠 ,祁筠 ,马钦奕,等.《生成式人工智能服务管理暂行办法》四大亮点解析[EB/OL].(2023-12-07)[2024-01-13].http://m.fljg.com/news/585693.html.
[16]张春艳,任霄.人工智能创作物的可版权性及权利归属[J].时代法学,2018,16(4):22-28.