摘 要:人工智能生成内容已深入应用到社会生产生活当中。在数据确权制度诞生之前,各国立法、司法和理论界大多主张以著作权法保护人工智能生成的数据。由于狭义著作权确权模式饱受“独创性”诟病,转而走向邻接权确权模式。然而,透过人工智能生成内容的技术和法律本质可以看出,该客体和邻接权的保护客体以及设立目的并无相关之处,盲目扩大邻接权的保护范围不仅会遭到理论与制度的挑战,而且在司法实践中也会捉襟见肘。因此,必须走出著作权保护模式的藩篱和迷雾,直面人工智能生成内容的本质,构建具有合理性的新型财产权制度。从数据视野来看,人工智能生成内容的技术本质为数据,法律本质为数据财产。随着数据时代的到来以及数据立法的展开,人工智能生成内容的数据财产权确权模式必然浮出水面。数据财产权确权模式是依托于数据法律制度的出现与发展提出的,是立足于人工智能生成内容的数据本质形成的,是基于人工智能生成内容的数据财产法律属性揭示的确权模式选择。在综合考量产业目的、盈利模式、风险成本、商业实践以及使用者目的来看,人工智能生成内容的权利主体应当为服务使用者而不是服务提供者,权利保护应适用“财产规则”和“禁易规则”。
关键词:AIGC;人工智能生成内容;著作权;数据;数据财产权
中图分类号:D923.4 文献标识码:A 文章编号:1001-4403(2024)01-0088-12
DOI:10.19563/j.cnki.sdzs.2024.01.009
人工智能技术研发与应用点燃了全球范围内的技术与制度火花,有些国家已经迅速进入了立法阶段,更多的国家则一直徘徊在治理数据问题的社会边缘。在人类迈入人工智能时代的社会历史进程中,立法作为新时代的系统知识供给不可忽视。作为人工智能技术重要分支的生成式人工智能如ChatGPT与文心一言在商业化应用上的成功,将人工智能生成内容的确权模式问题彻底暴露在世人面前。2018年北京互联网法院审理的“北京菲林案”中法院认为,人工智能生成内容不构成作品。①①参见北京互联网法院(2018)京0491民初239号民事判决书。然而,在2023年11月27日北京互联网法院审理的“AI生成图片著作权侵权第一案”中法院认为,涉案人工智能生成图片符合作品“独创性”要件,应当被认定为作品,并受著作权法保护。①①参见北京互联网法院(2023)京0491民初11279号民事判决书。从同一法院在判决结果上相互矛盾的两个案例来看,人工智能生成内容确权模式的争议可见一斑。2023年3月16日,美国版权局(U.S.Copyright Office)发布《版权注册指南:包含人工智能生成的材料的作品》(以下简称《版权注册指南》)明确规定,版权只保护人类创造的内容,最根本的原因是《美国宪法》和《美国版权法》中使用的“作者”一词不包括非人类。②②See United States Copyright Office.Copyright Registration Guidance:Works Containing Material Generated by Artificial Intelligence.FEDERAL REGISTER,2023,88(51),p.16190.在生成式人工智能技术发展最前沿与激进的美国,都对采取著作权确权模式保持审慎态度。这警示我们:确有必要从人工智能生成内容的技术生成原理与事实属性出发,在尊重法律制度的本质与演进规律的基础上反思著作权确权模式,并在权利保护与产业发展之间寻找到恰当的人工智能生成内容确权模式,以期为人工智能生成内容产业的发展扫清制度障碍。
一、从技术到法律:人工智能生成内容概念的法律界定
人工智能生成内容作为一种客观实在与社会现象存在于社会实践之中,基于其技术生成原理与客观实在进行法律方向的抽象与归纳,是形成法律意义上人工智能生成内容概念的基本路径。
(一)人工智能生成内容的技术生成原理
人工智能生成内容同时具有专业生成内容的高质量和用户生成内容的多数量的特点,可以同时满足人们爆发性增长地获取高质量内容的精神文化需求。生成式人工智能技术已成为新一代的生产工具,人工智能生成内容是虚实结合的元宇宙世界中的基本内容存在形态。③③参见中国信息通信研究院、京东探索研究院:《人工智能生成内容(AIGC)白皮书(2022年)》,第4-51页。人工智能生成内容的典型应用包括数字人创建、数字藏品铸造和场景数字孪生等。
人工智能生成内容的技术生成原理可以分为生成式人工智能模型训练(以下简称:模型训练)与生成式人工智能模型应用(以下简称:模型应用)两个环节。模型训练是制作人工智能生成内容的预备环节。所谓模型训练,是指利用数据训练生成式人工智能模型的过程。从技术上看,完成生成式人工智能模型的训练必须基于大数据的数据概率分布和结构等特征和规则,通过强大的算力支撑,运用算法对模型中的参数进行不断地调整,最终方能形成满足各领域场景需求的生成式人工智能模型。④④参见刘安平、金昕、胡国强:《人工智能大模型综述及金融应用展望》,《人工智能》2023年第2期,第30-36页。模型应用是制作人工智能生成内容的核心环节。所谓模型应用,是指利用生成式人工智能模型制作满足人们生产生活需求的内容的过程。模型应用的结果是产生人工智能生成内容。从技术上看,生成式人工智能模型在根据输入数据制作人工智能生成内容时,通常采取随机采样或条件采样的方式。所谓随机采样,是指从模型学习到的数据概率分布中随机抽样制作人工智能生成内容的方法。所谓条件采样,是指在输入一定条件的情况下,从模型学习到的条件分布中采样制作人工智能生成内容的方法。⑤⑤参见梦飞:《生成式AI技术解读》,载电脑爱好者微信公众号,https://mp.weixin.qq.com/s/1Hn9-YfBrSUZMFjGIkzmZQ,2023年12月13日访问。由于人工智能生成内容是概率计算的结果,故模型处理相同的数据输入常常获得不同的内容输出结果。模型训练与模型应用两者之间相辅相成。模型训练以模型应用为导向,模型应用的结果是模型训练重要的训练数据,能帮助完善生成式人工智能模型,进一步提升人工智能生成内容的质量。
(二)法律意义上的人工智能生成内容
在完成人工智能生成内容的技术生成原理剖析的基础上,我们可以进一步推进对人工智能生成内容概念的法律认识。在学界,对人工智能生成内容概念的界定存在“技术说”和“表达说”两种观点。“技术说”认为:“人工智能生成内容是指强人工智能所生成的内容,即人工智能通过神经网络和机器学习,去‘理解’庞大的数据库,而后生成的内容。”①①孙玉荣、刘宝琪:《人工智能生成内容的著作权问题探究》,《北京联合大学学报(人文社会科学版)》2020年第1期,第87页。“表达说”认为:“人工智能生成物是依据人类创意完成创作,其生成物是自然人智力活动的直接体现,并不是单纯地依据程序、规则、算法、模版产生,而是人类情感、思想、观点、立场、方法等综合理念的表达。”②②叶霖:《人工智能生成物所涉著作权问题研究》,《科技与出版》2019年第5期,第119页。上述对人工智能生成内容的概念界定多从技术构成、生成方式与生成内容的种类进行界定,并未全面反映人工智能生成内容的法律属性与特征。我们认为,所谓人工智能生成内容,是指利用生成式人工智能模型或类似技术自动生成的能够满足人们生产生活需要的电子数据。“自动生成”意味着,人们只需输入特定数据或指令,生成式人工智能模型即可在无须他人介入的情况下生成数据。人工智能生成内容的法律特征包括无形性、独立性、可支配性与价值性。第一,所谓无形性,是指人工智能生成内容以电子或类似形式存在的属性。这意味着,人工智能生成内容无法落入物权法的规范射程之内,应当适用数据法规则调整之上的法律关系。第二,所谓独立性,是指人工智能生成内容须独立为一体,满足人们的生产生活需要的属性。与生成式人工智能模型闲聊所获得内容,因其零散且无法满足人们生产生活需要,故不构成法律意义上的人工智能生成内容。第三,所谓可支配性,是指人工智能生成内容须能为人们所占有、使用、收益和处分的属性。第四,所谓价值性,是指人工智能生成内容具备一定的价值或使用价值,能够满足权利主体的利益需要的属性。这种需要既可以是物质上的,也可以是精神上的;既可以是社会生产上的,也可以是日常生活中的。
(三)人工智能生成内容的类型划分及其法律意义
对人工智能生成内容进行类型划分,是厘清人工智能生成内容概念外延的不二法门,是剖析人工智能生成内容法律性质的必由之路,是明确人工智能生成内容法律规则的必然要求。
合法人工智能生成内容和非法人工智能生成内容。根据是否包含法律法规所禁止的信息为标准,可以将人工智能生成内容分为合法人工智能生成内容和非法人工智能生成内容。所谓合法人工智能生成内容,是指内容不包含法律法规所禁止的信息的人工智能生成内容。所谓非法人工智能生成内容,是指内容包含了法律法规所禁止的信息的人工智能生成内容。区分两者的法律意义在于,合法人工智能生成内容允许自由流通,而非法人工智能生成内容则禁止流通。
现有人工智能生成内容和合成人工智能生成内容。根据是否为新生成的内容为标准,可以将人工智能生成内容分为现有人工智能生成内容和合成人工智能生成内容。所谓现有人工智能生成内容,是指已存在于现有数据库中的人工智能生成内容。生成现有人工智能生成内容时,生成式人工智能模型仅起到在数据库中检索相关数据并原封不动地提供数据的功能。所谓合成人工智能生成内容,是指不存在于现有数据库中的人工智能生成内容。区分两者的法律意义在于,现有人工智能生成内容类似于搜索引擎提供的搜索结果,人工智能服务提供者应当标明来源,并提供可供访问的链接路径,否则可能构成不正当竞争。合成人工智能生成内容是由生成式人工智能模型制作的新数据,人工智能服务提供者应当根据《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》等立法的规定,对使用其服务生成或者编辑的信息内容采取技术措施添加不影响用户使用的标识等。
完全人工智能生成内容与不完全人工智能生成内容。根据是否完全由人工智能模型自动生成为标准,可以将人工智能生成内容分为完全人工智能生成内容和不完全人工智能生成内容。所谓完全人工智能生成内容,是指利用生成式人工智能模型自动生成的内容。这是本文的研究对象。所谓不完全人工智能生成内容,是指生成式人工智能模型在人为干预的情况下制作的内容。在此情况下,生成式人工智能技术起到辅助作者进行创作的作用,是作者创作作品的工具。区分两者的法律意义在于,完全人工智能生成内容不构成作品,而不完全人工智能生成内容构成作品。
二、著作权确权模式的困境与突破
人们总是习惯于从事物的表象出发,运用朴素的直觉将“新事物”归入已被类型化的“旧事物”中,并使用已经过实践检验的规则解决“新事物”所带来的新问题。遵循此认识规律,人们最初倾向于采取狭义著作权确权模式调整在外在表现形式上与作品趋近一致的人工智能生成内容。然而,由于狭义著作权确权模式饱受“独创性”诟病,转而走向邻接权确权模式。但毕竟人工智能生成内容和邻接权的设立不相干,盲目扩大邻接权的保护范围必然遭到理论的质疑与制度的挑战。
(一)狭义著作权确权模式的“牵强引用”与“理论空洞”
1.狭义著作权确权模式的“牵强引用”
所谓狭义著作权确权模式,是指在确定人工智能生成内容构成作品的前提下,适用著作权规则保护人工智能生成内容之上利益的模式。现有论证人工智能生成内容构成作品的观点有“设计者意志说”“独创性客观标准说”“人工智能工具说”与“拟制作品说”。“设计者意志说”认为,人工智能生成内容是生成式人工智能设计者意志创作的产物,构成作品。①①参见熊琦:《人工智能生成内容的著作权认定》,《知识产权》2017年第3期,第3-8页。“独创性客观标准说”认为,独创性判断的对象是表达本身,基于此人工智能生成内容与人类创作的作品在客观上完全一致,故构成作品。②②参见吴汉东:《人工智能生成作品的著作权法之问》,《中外法学》2020年第3期,第653-673页。“人工智能工具说”认为,人工智能是人类创作所使用的工具,人工智能生成内容是由人类使用人工智能创作而成的,故构成作品。③③参见李扬、李晓宇:《康德哲学视点下人工智能生成物的著作权问题探讨》,《法学杂志》2018年第9期,第43-54页。“拟制作品说”认为,虽然人工智能生成内容并不符合现行著作权法的作品构成要件,但是从技术理性、文化市场多重价值实现、历史逻辑规律等角度分析有必要将其拟制为作品。④④参见黄汇、黄杰:《人工智能生成物被视为作品保护的合理性》,《江西社会科学》2019年第2期,第33-42页。上述观点或多或少存在逻辑与理论缺陷。“设计者意志说”和“人工智能工具说”仅将生成式人工智能技术视为人类创作工具,进而简单推导出构成作品,忽视了自动生成内容的复杂情形,以偏概全,不足为取。“独创性客观标准说”则仅将作品的构成要件限定在“独创性”要件上,肆意扩张作品认定范围,违背著作权法定原则。“拟制作品说”最为致命的缺陷在于无视人工智能生成内容不符合作品构成要件的判断,强势将其置于著作权制度之下,牵强适用著作权规则应付人工智能生成内容权利归属等新问题,势必阻碍人工智能生成内容产业的有序发展。
对于人工智能生成内容的权利归属,狭义著作权确权模式内部亦存在较大分歧,主要包括“人工智能所有者归属说”“人工智能设计者归属说”“人工智能使用者归属说”“综合考量说”与“公有领域说”等。“人工智能所有者归属说”认为,将人工智能生成内容归属于人工智能所有者,能够在确保投资者回报、激励投资者的同时,避免因参与制作人工智能生成内容的人员过多导致权利被过度分割而影响市场化。⑤⑤参见刘影:《人工智能生成物的著作权法保护初探》,《知识产权》2017年第9期,第44-50页;See Chaudhary G.Artificial Intelligence:Copyright and Authorship/Ownership Dilemma?.Indian J.L. amp; Just.,2022,212,p.13.“人工智能设计者归属说”认为,内容生成规则由人工智能设计者设定,体现了人工智能设计者的意志,故设计者应当作为权利主体。⑥⑥参见郭欢欢:《AI生成物版权问题再思考》,《出版广角》2020年第14期,第37-39页;See Hristov K.Artificial Intelligence and the Copyright Dilemma.IDEA,2017,431,p.57.“人工智能使用者归属说”认为,生成式人工智能作为人工智能使用者进行创作的工具,权利理应归属于使用者,如此亦更能发挥著作权对作者的激励作用。⑦⑦参见李扬、李晓宇:《康德哲学视点下人工智能生成物的著作权问题探讨》,《法学杂志》2018年第9期,第43-54页;杨利华:《人工智能生成物著作权问题探究》,《现代法学》2021年第4期,第102-114页。“综合考量说”认为,根据各主体在制作人工智能生成内容过程中所投入的资金与劳动力等因素的大小,进行综合考量分析,最终确定由何主体所有或由几个主体共同共有人工智能生成内容之上的权利。①①参见孙正樑:《人工智能生成内容的著作权问题探析》,《清华法学》2019年第6期,第190-204页。“公有领域说”认为,将人工智能生成内容分配给人工智能不符合人类主体地位的要求,同时也会导致著作权制度失去其激励人类创作的功能,而将人工智能生成内容分配给人工智能所有者、人工智能使用者等主体则会导致过度激励的问题,因此将人工智能生成内容归入公有领域是最佳选择,使其成为人类创意领域不可分割的一部分。②②See Palace V M.What If Artificial Intelligence Wrote This:Artificial Intelligence and Copyright Law.Fla.L.Rev.,2019,217,p.71.造成以上意见分歧的主要症结在于,人工智能的非主体性与制作人工智能生成内容的参与主体多元性特征导致人工智能生成内容的利益归属不明晰。狭义著作权确权模式法定的权利归属规则在保护人工智能生成内容上捉襟见肘,牵强引用狭义著作权确权模式必然导致人工智能生成内容法律保护的混沌无序。
2.狭义著作权确权模式的“理论空洞”
狭义著作权确权模式无视“人”的主体地位的做法是造成著作权确权模式理论空心化的直接诱因。狭义著作权确权模式无视“人为目的”的哲学基础。随着对著作权确权模式不足反思的深化和对“人是目的而非工具”的康德哲学观的坚持,狭义著作权确权模式无视“人为目的”哲学基础的做法已然成为众矢之的。国内立法者和国际组织都应该考虑著作权制度的哲学基础,人格理论、劳动理论和分配正义理论均不支持为人工智能生成内容提供著作权保护,应当修订著作权制度以明确将人工智能生成的作品排除在著作权保护之外。③③See Budden B.On the Intersection of Artificial Intelligence and Copyright Law.Can.L.Libr.Rev.,2022,10,p.47.各国立法均强调“人”的主体地位,人工智能生成内容必须在人的参与和安排下才有获得著作权法保护的可能性。④④参见唐蕾:《人工智能生成物的著作权保护比较法研究——以元宇宙背景为视角》,《电子知识产权》2023第3期,第84-87页。对著作权确权模式的理论质疑立足于法律对“人”的主体地位的尊重和对著作权制度理论基础的重申。
国内外实务界更是对狭义著作权确权模式进行了有力围剿。2023年2月21日,美国版权局在肯定克里斯提那·卡什塔诺娃是《黎明的曙光》(包含人工智能生成内容)作者的同时,进一步认定由生成式人工智能生成的内容中的图像不是人类作者的产品,重新颁发仅包含其创作的表达内容的新证书。⑤⑤参见《文本提示不算创作,美国版权局裁定:AI制作图片不受版权保护》,载观察者网百度百家号,https://baijiahao.baidu.com/s?id=1758701615718346323amp;wfr=spideramp;for=pc,2023年12月13日访问。紧接着,美国版权局发布《版权注册指南》,明确版权只保护人类创造的内容。⑥⑥See United States Copyright Office.Copyright Registration Guidance:Works Containing Material Generated by Artificial Intelligence.FEDERAL REGISTER,2023,88(51),p.16190.国内的典型案例莫过于前述北京互联网法院先后对人工智能生成内容是否构成作品呈现完全相反的判定。然而,深入分析两个案件的判决书可知,北京互联网法院均以是否存在“人类创作”为要件认定人工智能生成内容是否构成作品。“北京菲林案”中法院认为,独创性不是判断人工智能生成内容是否构成作品的唯一构成要件,还应当考虑是否是人类创作。著作权法仅保护自然人创作的作品,不保护人工智能生成内容。⑦⑦参见北京互联网法院(2018)京0491民初239号民事判决书。“AI生成图片著作权侵权第一案”中法院认为,人们利用人工智能模型生成图片本质上是人利用工具进行创作,从涉案人工智能生成图片的整个生成过程来看,原告进行了一定的智力投入,是原告独立完成并体现了原告的个性化表达,应当被认定为作品。⑧⑧参见北京互联网法院(2023)京0491民初11279号民事判决书。人类创作是人工智能生成内容获得狭义著作权保护的必要条件,狭义著作权确权模式已然被国内外法律实践所抛弃。
狭义著作权确权模式违背著作权立法宗旨。采取狭义著作权确权模式违背著作权立法宗旨,架空著作权立法目的。《中华人民共和国著作权法》(以下简称《著作权法》)开宗明义:制定《著作权法》的目的在于鼓励作品创作与传播的同时,促进社会主义文化和科学事业的发展与繁荣。采取狭义著作权确权模式意味着,由互联网巨头和资本财阀们控制的高效“内容生产机器”所制作的内容,将与作为“万物之灵”的人类的智慧所创造的内容在法律上获得同等保护。这势必严重影响人们创作的积极性。国内外均已出现“抵制AI绘画行动”。国内的网易图片社区LOFTER因使用AI绘制工具侵犯著作权,遭遇大量原创画师发文抵制;国外著名绘画平台A站(Art station)也因AI画作侵权问题引发大批原创作者抵制AI绘画。①①参见庄小蕾、姜增煜:《知名平台被骂上热搜 AI绘画为何遭抵制?》,载潮新闻客户端百度百家号,https://baijiahao.baidu.com/s?id=1759958780291508799amp;wfr=spideramp;for=pc,2023年12月13日访问。总之,采取狭义著作权确权模式与鼓励作品创作和传播、促进文化发展繁荣的著作权法立法目的背道而驰。
(二)邻接权确权模式的“价值追求”与“制度沦陷”
在破除对狭义著作权确权模式的经验主义幻想后,学界在诟病人工智能生成内容“独创性”的基础上,转而求助寄生于著作权制度中的邻接权确权模式,以期抓住著作权确权模式提供的最后一丝希望。
1.邻接权确权模式的“价值追求”
所谓邻接权确权模式,是指在确定人工智能生成内容不构成作品的前提下,适用邻接权规则保护人工智能生成内容之上利益的模式。采取此模式的理由大体上可以归纳为:由于人工智能生成内容无法满足人类创作等作品构成要件,但基于制度成本因素、激励投资和繁荣文化创作等目的,同时因保护人工智能生成内容与邻接权制度的价值追求和制度功能相一致,故可以采取邻接权确权模式并以创设新的邻接权权利类型的方式保护人工智能生成内容之上的利益。②②参见许明月、谭玲:《论人工智能创作物的邻接权保护——理论证成与制度安排》,《比较法研究》2018年第6期,第42-54页。学界对于采取邻接权确权模式下人工智能生成内容的权利归属亦存在不同观点,主要分为“所有者归属说”“使用者归属说”和“综合考量说”。“所有者归属说”认为,人工智能所有者通常是人工智能生成内容的主要投资者,将其规定为权利人符合激励人工智能生成内容投资的主要宗旨,同时易于操作。③③参见许辉猛:《人工智能生成内容保护模式选择研究——兼论我国人工智能生成内容的邻接权保护》,《西南民族大学学报(人文社会科学版)》2019年第3期,第100-106页。“使用者归属说”认为,对特定人工智能程序或设备享有使用权者是人工智能生成内容的促成者,对该内容负有责任,也是该成果的实际支配者和传播决策者,故人工智能生成内容应当归属于使用者。④④参见陶乾:《论著作权法对人工智能生成成果的保护——作为邻接权的数据处理者权之证立》,《法学》2018年第4期,第3-15页。“综合考量说”认为,应当根据对人工智能生成内容的投资、制作与传播贡献程度进行综合考量,在参与制作的多方主体间合理分享权利、分配义务和责任。⑤⑤参见易继明:《人工智能创作物是作品吗?》,《法律科学》2017年第5期,第137-147页。邻接权确权模式并未跳出著作权确权模式对作品的投资、创作与传播贡献的权利分配理念束缚,故在人工智能生成内容权利归属问题上邻接权确权模式亦无法给予人们有力的制度支撑。
2.邻接权确权模式的“制度沦陷”
邻接权确权模式的优势在于其在综合考量现行立法规定和人工智能生成内容的事实属性基础上承认人工智能生成内容不构成作品,并进一步探索邻接权制度保护人工智能生成内容之上利益的可能性。然而,邻接权确权模式违背邻接权制度的设立初衷,最终必然导致邻接权确权模式流产。邻接权制度起源于作者权法制国家,其制度创设的历史初衷在于建立一种著作权制度的“附属权利”或“派生权利”。⑥⑥参见徐聪、李子昂:《邻接权的体系构成:本源、性质、扩张》,《上海大学学报(社会科学版)》2021年第4期,第86页。“邻接权”更确切的提法应当是“作品传播者权”。⑦⑦参见沈仁干:《郑成思版权文集(第一卷)》,中国人民大学出版社2008年版,第60页。邻接权制度作为广义著作权制度的组成部分早已成为学界与实务界的共识,保护投资也应当限定在对既有作品利用的投资上,而非毫无限制地随意扩张。显然,制作人工智能生成内容并非对既有作品的利用,通过创设新邻接权以保护人工智能生成内容的做法过于理想化,与邻接权制度本身遭遇极大挑战且主要邻接权形式出现萎缩的迹象相悖,此时谈扩张邻接权有违历史潮流。①①参见丛立先:《人工智能生成内容的可版权性与版权归属》,《中国出版》2019年第1期,第12页。采取邻接权确权模式保护人工智能生成内容有悖邻接权制度的设立理念。
三、揭开人工智能生成内容法律属性的面纱
纵观著作权确权模式非线性与循环反复的演变历程,缺乏对人工智能生成内容法律性质的共识,这直接导致学界在人工智能生成内容确权模式的选择上摇摆不定。我们认为,结合人工智能生成内容的技术生成原理与事实属性,人工智能生成内容不构成作品,其法律性质应当是数据财产。
(一)人工智能生成内容作品属性的批判
《著作权法》明确揭示了作品的四个法律构成要件,分别是“领域要件”“独创性要件”“形式要件”和“创作自觉要件”。人工智能生成内容基本上都能满足“领域要件”和“形式要件”的要求,下文将重点从“独创性要件”和“创作自觉要件”阐明人工智能生成内容不构成作品的理由。
1.人工智能生成内容“独创性”之问
通说认为“独创性”可以分解为“独”与“创”两个方面。其中,“独”是指劳动成果由劳动者独立完成,而非抄袭的结果;“创”即“创造性”,是指作品需要具备一定程度的智力创造性。②②③参见王迁:《著作权法》,中国人民大学出版社2015年版,第19-34、24-35页。我们认为,独创性要件的构成要素除了“独立性”和“创造性”之外,还应当具备“直接性”。所谓“直接性”,又称“创作直接性”,是指作者依据自由意志,无须他人的介入对思想进行表达的属性。“直接性”包含两个方面:其一,从行为角度,是依据作者的自由意志,无须他人干预进行思想的表达。这意味着作者的创作行为与作品之间存在直接联系。其二,从表达内容角度,是对作者思想的直接表达。这意味着作者的思想与作品之间存在直接联系。应当具备“直接性”的理由在于:《中华人民共和国著作权法实施条例》第3条第1款规定,创作是指直接产生文学、艺术和科学作品的智力活动。“直接”是对创作的限定,其内涵在于作者依据自由意志,无须借助他人的介入进行的创作,而非为他人创作进行组织工作,提供咨询意见、物质条件,或者进行其他辅助工作。
通常情况下,人工智能生成内容能够满足独立完成、非抄袭结果的要求。但是,人工智能生成内容并不符合独创性要件中“直接性”和“创造性”的要求,不构成法律意义上的作品。
一方面,人工智能生成内容不符合“直接性”要求。第一,人工智能生成内容并非直接来源于作者的创作行为。首先,训练生成式人工智能模型的行为存在于制作人工智能生成内容的预备环节,并不直接产生人工智能生成内容。其次,人工智能生成内容的制作由人们输入数据运算生成,且所输入的数据即提示词(Prompt)越准确、详细,生成的内容越贴合人们的生产生活需求。但是,输入的数据仅仅是对要素的描述,不构成法律意义上的表达。因此,在整个人工智能生成内容的制作过程中,不存在任何主体依据自己的自由意志,在无须他人介入的情况下进行的创作。第二,人工智能生成内容不是作者思想的直接表达。人们只能在生成式人工智能模型输出几个人工智能生成内容中选择最符合其生产生活需求的人工智能生成内容进行使用,或重新输入数据驱动生成式人工智能模型重新生成新的人工智能生成内容。选择人工智能生成内容类似于人们在画廊中选择符合自己心意的画作,该行为与思想表达无关。
另一方面,人工智能生成内容不符合“创造性”要求。作品创作活动不是一般的劳动,而是作者的智力创造活动。创造性意味着作者存在创作的空间。③然而,人工智能生成内容的生成过程是一个概率计算过程,输出的人工智能生成内容存在随机性,并未给我们留下创作的空间。与此同时,生成式人工智能模型输出多个不同的人工智能生成内容供我们选择,并不等同于我们拥有创作的空间。总之,人工智能生成内容不符合“创造性”要求。
2.人工智能生成内容的“创作自觉”之谜
《著作权法》与其他法律制度一样将人作为目的,预设了作品只能由自然人创作的前提。然而,在生成式人工智能技术背景下,单靠独创性要件进行作品判断的方法已然无法满足实践需求。国内外法律实践均开始重申“人”的主体地位及其在作品创作中不可替代的作用。延伸至《著作权法》的具体表现为对作品“创作自觉”要件的重申。根据马克思主义基本原理,实践是人类特有的本质活动。剖析实践活动的过程包括目的、手段和结果三个基本环节,其中实践活动的目的性体现了实践的自主性和自觉性,即体现了实践主体的主观目的与自觉性。①①参见肖前:《马克思主义基本原理(上册)》,中国人民大学出版社1994年版,第275-278页。作品是自然人发挥主观能动性创作的产物。创作作为人类实践中的精神生产活动,包含主体创作的自觉性。“创作自觉”要件应当是作品的构成要件之一。
人工智能生成内容不是来源于自然人主观能动性的创作,不符合“创作自觉”要件。人工智能研发者的劳动仅存在于生成式人工智能模型的研发与训练阶段,与人工智能生成内容的制作无直接关系。在模型应用阶段,生成式人工智能模型仅根据输入的数据完全自动生成电子数据,该人工智能生成内容是概率计算的结果,而非人们发挥主观能动性进行精神生产活动的结果。因此,制作人工智能生成内容不具备主体的主观能动性,不符合“创作自觉”要件。
(二)探究人工智能生成内容的“数据”本质
探究人工智能生成内容的法律性质,应当从人工智能生成内容的事实属性出发,在此基础上根据现行立法对人工智能生成内容做出价值判断。
《中华人民共和国网络安全法》(以下简称《网络安全法》)第76条第4项规定,网络数据是指通过网络收集、存储、传输、处理和产生的各种电子数据。《中华人民共和国数据安全法》(以下简称《数据安全法》)第3条第1款规定,数据是指任何以电子或者其他方式对信息的记录。《网络安全法》和《数据安全法》对数据的界定存在一定区别。其中,《网络安全法》对网络数据的界定侧重于对何为“网络”的说明,且将网络数据限定为电子数据。仅从《网络安全法》对“网络数据”的定义,我们无法明确法律上数据的内涵。《数据安全法》则从形式要件与实质要件两个方面对数据进行界定,即形式上数据以电子或其他方式存在,而实质上数据是对信息的记录。所谓信息,是指能够被人脑处理和理解的,固定在一定载体之上的,能够满足人们生产生活需要的,被数据所记录的内容。从《数据安全法》对数据的定义可知,数据是信息的记录,属于载体、表现形式的范畴,而信息是数据所记录和承载的内容。综上,我国立法将数据界定为以电子或其他方式存在的对信息的记录。
人工智能生成内容的事实属性是数据。数据限于在计算机及网络上流通的在二进制的基础上以0和1的组合表现出来的比特形式。②②维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社2013年版,第104页。事实上,数据不等同于数字,而是一切比特形式的存在。人工智能生成内容是在强大的算力支撑下,通过生成式人工智能模型依据输入的数据自动生成的结果。通常情况下,人工智能生成内容以比特形式存在于计算机及网络之中。因此,人工智能生成内容的事实属性是数据。
人工智能生成内容构成法律上的数据财产。根据我国立法对数据的界定,以人工智能生成内容的事实属性为基础进行价值判断,人工智能生成内容满足法律上数据的形式要件和实质要件,构成法律上的数据。从数据的形式要件看,人工智能生成内容在事实属性上以比特形式存在于计算机及网络之上,满足法律上数据以电子或其他形式存在的形式要件。从数据的实质要件看,人工智能生成内容是对信息的记录。人工智能生成内容是由生成式人工智能模型,根据输入的数据自动生成的结果。人们使用生成式人工智能模型的目的在于,生成式人工智能模型制作的人工智能生成内容能够满足其生产生活需要。这意味着,人工智能生成内容是能够被人们所处理和理解的信息,且对人们来说具备一定的价值或使用价值,故人工智能生成内容满足法律上数据的实质要件。同时,《中华人民共和国民法典》第127条将数据和网络虚拟财产并列规定在同一条款中,说明数据和网络虚拟财产应当是归属在某一上位概念下的同一逻辑层面上并列存在的概念。其中,网络虚拟财产在法律性质上构成财产,是归属于财产概念下的概念,故数据与网络虚拟财产一样具备财产属性。总之,人工智能生成内容构成法律上的数据财产。
综上,人工智能生成内容的法律性质是数据财产,而非作品。将人工智能生成内容准确地归入数据财产法律客体类别,并基于其数据财产法律属性选择数据财产权确权模式保护其之上的利益,契合类型化利益保护理论,避免因确权模式错位导致的权利人利益保护不充分,以及因之而阻碍人工智能生成内容产业有序发展。
四、数据财产权确权模式的确定与规则选择
伴随着邻接权确权模式所带来的著作权确权模式的最后一丝希望的破灭,有学者将目光投向了以合同确权模式和反不正当竞争确权模式为代表的兜底性确权模式:认为对人工智能生成内容的法律保护应当基于合同规则和责任规则对市场中产生积极使用收益进行保护和对利益破坏者主张救济;①①参见何炼红、潘柏华:《人工智能自主生成成果“作品观”质疑与反思》,《贵州省党校学报》2018第5期,第20-22页。反不正当竞争法等部门法都可为人工智能生成内容寻得提供财产性利益保护的充分解释空间。②②参见李逸文、刘宇:《论人工智能生成物的非版权属性及其保护路径》,《长春理工大学学报(社会科学版)》2021年第4期,第32-34页。遗憾的是,通过合同确权模式或反不正当竞争确权模式是一种过度性的保护。③③参见何培育、蒋启蒙:《人工智能生成物的著作权保护路径探析——兼评人工智能生成物著作权第一案》,《重庆邮电大学学报(社会科学版)》2020年第4期,第33-34页。随着数据时代的到来以及数据立法的展开,人工智能生成内容的数据财产权确权模式必然浮出水面。所谓数据财产权确权模式,是指在确定人工智能生成内容构成数据财产的前提下,以数据财产权为权利基础赋予权利人绝对权和支配权的模式。
(一)数据财产权确权模式是时代发展与法律进化的必然要求
基于数据财产法律属性揭示而提出的数据财产权确权模式,是顺应从著作权到数据财产权的数据财产保护历史演进规律的,根源于知识财产与数据财产相区分理论,并立足于人工智能生成内容产业发展客观需求的确权模式,是时代发展与法律进化的必然要求。
1.顺应数据财产保护的历史演进规律
从数据财产保护的历史演进轨迹看,数据财产经历了从著作权确权模式到数据财产权确权模式的演进历程。最初,鉴于数据库投资成本巨大且有重要的经济价值与社会价值,国际和全球主要国家均探索数据库的确权模式。《与贸易有关的知识产权协议》(“TRIPS协议”)第10条第2款规定,只要对数据的选择或编排构成智力创作,就应当受到著作权法保护,但是该保护不延伸至数据本身。著作权确权模式对于数据来说,实质上是一种极弱的保护,不具备独创性的数据不会受到著作权法的保护,处于法律保护的真空地带。但是,数据才是数据库的价值核心。鉴于此,反不正当竞争确权模式和合同确权模式被提出来,用以补充著作权确权模式所遗漏的对数据本身的保护。然而,两种确权模式存在明显弊端。首当其冲的就是两者对数据的保护缺乏权利基础,无法全面保护权利人的利益需求。合同具备很强的随意性,容易导致权利人利用优势地位创设不平等的条件造成数据垄断。1996年3月11日欧盟出台《关于数据库法律保护的指令》,对数据库采取特殊权利确权模式,标志着数据库特殊权利制度成为法律现实。数据库特殊权利保护的是数据库中的实质性内容部分——数据。④④参见李扬:《数据库法律保护研究》,中国政法大学出版社2003年版,第137页。数据库特殊权利制度脱离了著作权制度,成为一个独立的确权模式。如今,构建数据财产权制度已成为数据时代背景下各国的制度建设共识。挣脱著作权确权模式枷锁的数据财产权确权模式,顺应数据财产法律保护历史演进规律,精准保护人工智能生成内容之上的利益,是保障人工智能生成内容产业发展的不二选择。
2.根源知识财产与数据财产相区分理论
成熟于《美国统一计算机信息交易法》(以下简称:UCITA)的知识财产与数据财产相区分理论,为人工智能生成内容数据财产权确权模式提供了有力的理论支撑。UCITA首次在立法层面对“信息”和“知识”进行区分,奠定了知识财产与数据财产相区分理论的法律基础。UCITA第102条第(35)款规定“信息”是指数据、文本、图像、声音、计算机集成电路布图或计算机程序,以及对它们的集成和编辑。UCITA第102条第(39)款规定“知识”是对事实的实质性理解。①①参见齐爱民:《捍卫信息社会中的财产——信息财产法原理》,北京大学出版社2009年版,第191-192页。知识财产的本质是思想观念;而数据财产的本质是数据产品,两者存在本质差别。区分两者的法律意义在于,知识财产适用知识产权法律规则,而数据财产适用数据财产权法律规则。“一数据一权利”的法律制度以区别于知识产权授权许可的权利实现方式为数据要素的自由流通保驾护航。基于知识财产与数据财产相区分理论,让数据财产权在理论上脱离并获得独立于著作权的理论地位,数据财产权规则才得以构建,数据财产权利才获得合理的保护,社会公众才能基于数据财产权明确的边界,享受数据要素自由流通所带来的福利。知识财产与数据财产相区分理论为人工智能生成内容数据财产权确权模式的提出提供了坚实的理论基础。
3.立足人工智能生成内容产业发展需要
人工智能生成内容的商业模式主要集中在网络营销与即时消息生成等短平快的数字传播领域。若以与生俱来就带着垄断特性的著作权确权模式调整人工智能生成内容,则会存在第一个制作特定人工智能生成内容的主体,将通过著作权控制着所有与其生成的人工智能生成内容构成“实质性相似”的人工智能生成内容。鉴于人工智能生成内容是一种概率计算结果,只要人们使用相同的生成式人工智能模型,并输入相同或相似的提示词,就有一定概率获得相同或相似的人工智能生成内容。在现行立法与司法实践的统摄下,上述两个人工智能生成内容极大可能被判定为构成“实质性相似”,必然严重影响人们对生成式人工智能模型的使用热情,对人工智能生成内容产业带来毁灭性打击。
与著作权确权模式对比明显,数据财产权确权模式的核心特征是非垄断性。所谓非垄断性,是指权利人无权控制非由其生成的人工智能生成内容自由流通的属性。由于每个独立生成的人工智能生成内容均为独立的数据财产,存在独立的数据财产权,首个生成人工智能生成内容的权利人,不得干预在后的权利人对其生成的与之完全一致的人工智能生成内容的占有、使用、收益和处分。数据财产权确权模式的非垄断性特征能够有效保障数据要素自由流通,契合人工智能生成内容产业的商业模式,促进人工智能生成内容产业的发展。
(二)人工智能生成内容的权利主体界定与权利保护规则
在确定人工智能生成内容采取数据财产权确权模式后,我们必须直面的首要问题便是人工智能生成内容的权利主体界定问题。诚如前述,人工智能研发者并未直接参与人工智能生成内容的制作,故此处不将其列入讨论范围,现行立法亦如此考量。《生成式人工智能服务管理暂行办法》将参与人工智能生成内容制作的主体分为生成式人工智能服务提供者(以下简称:服务提供者)和生成式人工智能服务使用者(以下简称:服务使用者)。所谓服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务的组织、个人。所谓服务使用者,是指使用生成式人工智能服务生产内容的组织、个人。在数据财产权确权模式下人工智能生成内容之上的权利应当界定给服务提供者还是服务使用者?不同的权利界定,会带来不同效率的资源配置。
人工智能生成内容的权利主体为服务使用者。理由如下:第一,从服务提供者的产业目的来看,服务提供者建设生成式人工智能服务平台的目的是为不特定的公众提供一个创造数字产品的开放式服务平台,辅助他人获得数字产品的服务是服务提供者的基础目标,而不是为了自己获得数字产品。第二,从服务提供者的盈利模式来看,服务提供者以生成式人工智能服务为主营业务,通过主营业务获得盈利是服务提供者的主要目标。没有哪一个服务提供者是通过使用者下达指令创造的生成内容获得盈利。第三,从生成式人工智能服务平台的运营的风险成本来看,人工智能生成内容的权利归属于服务使用者情形下其运营的法律风险成本可以降至最低。生成式人工智能服务容易引发侵犯在先存在的知识产权等权利的情况发生,而过大的法律风险将严重制约服务提供者的经营乃至整个生成式人工智能服务平台产业的发展。根据权责利相一致的原则,权利归属于谁,责任也应该归属于谁。人工智能生成内容的权利主体归属于服务使用者,服务使用者就承担了可能发生的“侵权风险和主要责任”。《生成式人工智能服务管理暂行办法》第14条规定了服务提供者发现违法内容的处理与报告义务。可见,服务提供者知道或者应当知道服务使用者侵犯其他权利的,应当采取制止侵权必要措施;未采取必要措施的,与侵权人承担连带责任。在权利归属于使用者的条件下,服务提供者可以获得最大限度的“责任免除”,避免了经营中的法律风险。第四,从服务提供者的商业实践来看,通过分析国内外现有大型生成式人工智能服务平台的商业实践,尤其是自律规范可知,服务提供者均把生成内容的权利归属于使用者。例如,在OpenAI公司的《使用条款》中约定,OpenAI公司将其根据服务使用者指令输出的数据中的所有权利、所有权和利益(如果有的话)转让给服务使用者。①①See OpenAI“Terms of use”:Ownership of Content.As between you and OpenAI,and to the extent permitted by applicable law,you (a) retain your ownership rights in Input and (b) own the Output.We hereby assign to you all our right,title,and interest,if any,in and to Output.在《文心一言用户协议》中百度公司约定服务使用者制作的人工智能生成内容之上的权利归属于服务使用者。②②参见《文心一言用户协议》第4条服务使用规范,4.1基于您对本服务的使用,百度许可您一项个人的、基于法定或约定事由可撤销的、不可转让的、非独占的和非商业的使用本服务进行内容输入并获得内容输出的权利。第五,从使用者的目的来看,人工智能生成内容的权利主体为服务使用者。服务使用者热衷于使用他人建设的生成式人工智能服务平台的基础目的是获得自己需要的、量身定制的数字产品,这些数字产品可以为使用者所有和所用,无论是用于生产还是生活。这是生成式人工智能服务平台区别于游戏平台的一个重要特征。因此,在综合考量产业目的、盈利模式、风险成本、商业实践以及使用者目的来看,人工智能生成内容的权利主体应当为服务使用者而不是服务提供者。这是数据财产权确权模式下人工智能生成内容权属主体界定的最佳制度设计。
初始法授权利一旦确立,社会就必须对这一法授权利的保护规则做出选择。③③参见唐纳德·A威特曼:《法律经济学文献精选》,苏力等译,法律出版社2005年版,第36页。“卡-梅框架”是从法律后果的角度,以私人对权利的自由转移和自愿交易为标准,对法律规则做出的一种逻辑分类,具体分为“财产规则”“责任规则”和“禁易规则”。基于人工智能生成内容权利归属于服务使用者的权属界定前提,根据交易成本分析和人工智能生成内容相关立法之规定,数据财产权确权模式下人工智能生成内容的保护规则适用“财产规则”和“禁易规则”。所谓“财产规则”,是指允许仅以自愿数字产品交易为前提的数据财产权在私人之间转移的规则。“财产规则”赋予权利人对数据财产的定价权,即权利人有自愿决定人工智能生成内容的价格的权利。所谓“禁易规则”,又称“不可让渡性规则”,是指不允许数据财产权在即使是自愿的买卖双方之间进行转让的规则。典型例子为非法数字产品,如包含色情、暴力和政治危害等内容的数字产品的交易禁止等。根据《生成式人工智能服务管理暂行办法》等相关人工智能生成内容的立法可知,非法人工智能生成内容是不允许流通的,故人工智能生成内容在特定情况下亦适用“禁易规则”。综上,数据财产权确权模式下人工智能生成内容的保护规则包括“财产规则”和“禁易规则”。
五、结语
技术变革对人类社会的影响一直是深远且不可阻挡的。每一次技术变革在带来生产力极大提升的同时,均对原有的社会生产关系带来重大冲击。学界与实务界不得不对新技术应用带来的新问题做出法律上的回应。人们对新事物的认识规律是一个由表入里的发展过程。此认识规律必然会让人们在面对亟须解决的新问题时,试图将其观察到的新事物的表象归入现有的某种已类型化的旧事物中,使用熟悉的处理经验解决新问题,也是情理之中的做法。但新事物不仅仅是量变,革命性的技术将带来革命性的进展,这需要我们解放思想,探寻新事物的本质,以此为基础进行法律知识体系建构。人工智能生成内容看起来很像“作品”,在这个迷幻的表象和经验主义驱使下,人们难免轻松选择著作权确权模式保护人工智能生成内容。然而,面对斗转星移般的技术变迁,我们不能刻舟求剑,应当勇敢面对人工智能生成内容的数据本质,走出著作权保护的“舒适区”,构筑数据财产权确权模式,是社会发展和人类法律认识进化的必然结果。
The Evolutionary of the Right Confirmation Mode of Artificial Intelligence Generated Content and the Establishment of Data Property Right
Abstract:Artificial intelligence generated content has been deeply applied to social production and life.Before the birth of the data rights system,most of the legislative,judicial and theoretical circles in various countries advocate the protection of artificial intelligence generated data by copyright law.As the narrow copyright model is criticized for “originality”,it has turned to the neighboring right mode.However,due to the technical and legal nature of the content generated by artificial intelligence,it can be seen that the object and the object of protection of the right of neighboring rights and the purpose of the establishment is irrelevant,and blindly expanding the scope of protection of the right of neighboring rights will not only be challenged by the theory and system,but also has been stretched in the judicial practice.Therefore,it is necessary to get out of the fence and fog of the copyright protection mode,face the nature of the content generated by artificial intelligence,and construct a new type of property right system with rationality.From the perspective of data,the technical nature of artificial intelligence generated content is data,and the legal nature is data property.With the arrival of the data era and the unfolding of data legislation,the data property right mode of artificial intelligence generated content is bound to surface.The data property right confirmation mode is based on the emergence and development of the data legal system proposed,is based on the formation of the data nature of artificial intelligence generated content,is based on the artificial intelligence generated content of the data property legal attributes revealed the confirmation mode selection.Considering the industrial purpose,profit model,risk and cost,business practice and user’s purpose,the subject of the right of artificial intelligence generated content should be the service user rather than the service provider.The “property rule” and the “forbidden rule” should be applied to the protection of rights.
Key words:AIGC;artificial intelligence generated content;copyright;data;data property right