主持人:张凌寒*
笔谈人:郭 禾**
冯晓青***
张 平****
熊 琦*****
张吉豫******
1
张凌寒:各位专家好,北京互联网法院针对AI生成内容的版权保护作出一项富有创新意义的判决,确认了生成式AI作品的可版权性。该判决在全球范围内引发广泛关注。同期,美国版权局再次拒绝为AI生成内容赋予版权,至今已连续四次驳回AI作品的版权注册申请。请问为何中美双方会就AIGC是否应获得知识产权保护作出迥异的决定?承认或否认AIGC应获得知识产权保护会对产业带来何种影响?
郭禾:顾名思义,人工智能生成内容(以下简称“AIGC”)是指利用了人工智能技术所生成的内容。具体而言,其主要包括“基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成的相关内容”【TE智库:AIGC词条,载百度百科,baike.baidu.com/item/AIGC/59988381?fr=ge_ala,2024年1月22日访问。】。近年来,随着ChatGPT的发布,AIGC成为全球关注热点。在这一背景下,AIGC与知识产权制度的关系也成了法学领域的热门话题。在这里所讨论的知识产权保护对人工智能产业的影响,仅限于知识产权作为一种财产权在市场经济环境中对产业发展的作用。
在市场经济环境中,AIGC的走红自然会直接引发资本的关注。毫无疑问,资本的充分注入将直接刺激人工智能产业的进步与发展。然而,正常情况下投资行为所追求的目标是市场利润。如果投资行为的结果得不到法律的承认或保障,资本对产业的投入就不具有持续性。这里的“法律的承认或保障”就是承认投资行为与相关市场利润间的关系,进而用这种关系去决定市场利润的分配。比如,法律上确立了劳动者对劳动成果的所有权,便保障了劳动者投入其劳动的收获,进而使劳动的投入具有可持续性。类似地,确立AIGC的权利归属,无疑有利于鼓励人们利用人工智能技术产生出更多的内容。具体而言,一方面可以促使更多的人工智能系统被人利用,从而产出更多的AIGC;另一方面,人们对人工智能系统的需求也会进而促使人工智能系统开发者研发出更优秀的人工智能系统。前述推理是从全社会的角度给出的总体效果。要取得这样的总体效果,就必须确保相关各方在市场中获得各自的利益。
为了保障前述各方在市场中的利益,仿照劳动成果所有权的设定模式,在AIGC上设定相应的排他性权利,无疑是最为直接和简单的办法。基于AIGC的无体属性和AIGC在产生过程中必然涉及智力活动这两个因素,以既有的知识产权模式为基础构筑其法律保护体系当为自然之选。当然,这里所说的知识产权应当包括我国《民法典》中所确立的权利和利益两方面内容。既有的知识产权制度在权利产生、变动、行使和救济等各方面已经充分考虑到保护对象无体性的自然属性,进而在制度设计上对知识产权的效力和限制等方面分别作出了较为均衡的规定。从这种意义上看,选择知识产权模式作为蓝本,可使有关制度的设计和运行成本相对较低。至于AIGC本身所具备的“智力”属性,更强化了其与既有知识产权制度的联系,故选择知识产权模式具有天然的合理性。在此基础上,再结合合同法等相关制度,完全可以平衡人工智能系统开发者、人工智能系统操作者和AIGC使用者等各方在市场环境中的利益分配。
因此,在市场经济环境中赋予AIGC相应的知识产权保护,不仅不会使社会运行成本陡增,而且可以引导资本不断地向人工智能产业注入,从而对该产业的发展起到积极的促进作用。
冯晓青:
从知识产权制度产生的一般规律来说,知识产权制度是商品经济和科学技术发展的产物,二者缺一不可。商品经济发展为知识产权制度的诞生提供了私权观念基础和知识产品交易环境,科学技术发展则为知识产权制度的诞生奠定了物质技术基础和条件。随着商品经济程度不断提高并发展到较为成熟的市场经济,知识产权制度作为调整知识产品利益关系的法律保障机制、激励创新机制和利益协调机制,对于市场经济发展的驱动和保障作用日益增强。这尤其体现于知识产权制度促进产业发展上,包括产业创新、产业转型升级以及传统产业的现代化改造等多方面。知识产权制度是以知识产权的充分和有效保护为基础和核心的,其作用于市场经济发展特别是产业发展方面的作用也主要体现于知识产权保护的力度和成效。当前知识产权新结构经济学研究的一个重要内容,即是知识产权制度运行与产业发展、产业创新之间的辩证关系。知识产权制度的变革和发展也深受科学技术发展的影响。科学技术发展不仅会影响知识产权保护的主体、客体、内容以及知识产权侵权表现等,而且会通过作用于知识产权保护,影响与技术发展相关的产业。简单而言,知识产权保护与技术进步和产业发展之间存在十分密切的互动联系。
当前,随着大数据、人工智能技术及其产业化的迅猛发展,知识产权保护和产业发展方面出现了前所未有的重大课题,其中尤为重要的是AIGC“横空出世”对现行知识产权制度带来的巨大挑战。不过,前述关于知识产权保护与技术进步和产业发展关系的原理依然适用。故不妨结合上面的观点透视给予或不给予AIGC知识产权保护对产业发展的影响。
这里首先需要表明一下个人的立场,即承认AIGC可以获得知识产权保护,给予知识产权保护有利于人工智能相关产业发展。AIGC之所以可以获得知识产权保护,我认为主要是基于以下原因。其一,AIGC符合受知识产权保护的客体的条件。毫无疑问,知识产权保护客体需要满足一定的条件,如《著作权法》中作品的独创性要件、《专利法》中发明和实用新型的“三性”要件。从理论上说,只要AIGC满足了相应的知识产权客体的条件,就没有理由不予以知识产权保护。其二,AIGC是人类智力活动和智力劳动的产物,与自然人从事创造性行为所得的结果存在实质性相同。AIGC固然是基于人工智能生成的,但其与自然人从事创作和发明创造所形成的作品或发明创造在外观和内容上并没有实质性差异。值得注意的是,否认AIGC受知识产权保护的学者的一个重要理由是:受知识产权保护的客体或对象应当是人类或者说自然人从事智力劳动的产物,而不能是借助于人工智能完成的。对此,我认为应当辩证地看待AIGC,它并不是凭空产生的,产生AIGC的人工智能本身是人类智慧劳动的产物。自然人利用人工智能生成的对象,无论是作品还是发明创造,都留下了人类智慧的足迹,至少在当前总体上属于弱人工智能的阶段,AIGC是人机互动和人机结合的产物。离开人类智慧和智力活动参与,则既不会有人工智能的存在,也相应地不会有AIGC的存在。
需要继续探讨的是AIGC的知识产权保护对产业发展的影响。我认为,知识产权保护促进产业发展的上述原理同样适用于AIGC。具体而言,AIGC知识产权保护有利于鼓励用户更多地利用人工智能从事知识创造活动,并促进相关智力成果的传播和利用,而这反过来又有利于促进对人工智能的研发和投资,从而促进人工智能技术水平的提高。与此同时,人工智能技术水平的提高,又有利于形成人工智能产业。《“十四五”国家知识产权保护和运用规划》即提出,要完善知识产权保护政策,健全大数据、人工智能、基因技术等新领域新业态知识产权保护制度。相反,如果对AIGC不予知识产权保护,在法律上其就可能进入公共领域,不仅对于人工智能使用者而言缺乏使用人工智能的动力,进而使得人工智能技术的运用受到影响,还会直接冲击现有的受知识产权保护的知识产品市场,影响在知识产权保护之下形成的既有的文化产品和技术产品竞争秩序与市场秩序。从这个意义上讲,不承认对AIGC的知识产权保护不仅会影响人工智能产业本身发展,也会对相关文化产业和技术市场产生负面影响。
张平:
生成式AI技术的迅猛发展给世界各国的法律提出了新的议题,特别是对AIGC或者人类与AI技术合作的生成物能否给予知识产权保护,各国呈现不同立场。之前美国版权局撤销了利用AI技术完成科幻漫画的版权登记,给出的结论是,“版权只能保护人类创造的产物,‘作者’一词不包括非人类”。但是,美国版权局不予登记的理由是该版权登记人给AI系统提供的目标生成图像的提示和参数没有对生成物结果有创造性工作,进而认为,AI生成物能否构成作品取决于具体情况,特别是要根据AI工具如何运作以及作者如何使用AI工具创建最终作品的情景来决定。所以,我们不能得出美国版权局完全不承认AIGC版权保护的结论。相比美国,英国法律则是旗帜鲜明地给予AIGC版权保护,并在社会上出现质疑时,坚持认为“没有证据表明对计算机生成作品的保护是有害的”。
在李某与刘某侵害作品署名权和信息网络传播权纠纷案中,北京互联网法院为我国在AIGC版权保护问题上给出了初步的立场,也为近期广泛讨论的AIGC能否受《著作权法》保护的话题提供了阶段性意见。本案肯定了“人”在AI生成图中的独创性工作,确定了利用AI生成的图片具有作品性,并认可AI使用者以作者身份依法享有著作权。本案向社会明确传达了使用生成式AI进行创作的技术门槛和独创性认定标准,纠正了大多数人对于“自动生成”过程“快速、简单、机械、没有创作含量、不特定结果”的误解。此判决也表明了我国在对待AIGC的著作权保护上充分考虑了“人”在其中的创作贡献,保护了AI使用者的创作成果。此案例也会在客观上推动AI技术迭代和产业投资的积极性。
对于AIGC的非人类创作问题,现行著作权制度确实是以“人”的智力成果作为作品构成逻辑起点的。但是,AI也是人类智力成果的汇集,只不过它学习能力太强,知识积累太多,创作效率太高罢了。生成式人工智能的自主运转依然属于人类的“智力活动”,AIGC恰恰是人类智力成果的汇聚,体现的是人类的智力劳动,而不是非人类的信息集合。如同自然人创作,AIGC也是利用之前积累的人类知识进行创作,只不过人工智能是在更广泛、更庞大的人类知识积累基础上生成作品而已。所以,人工智能生成物并不违反《著作权法》中“智力成果”这一要件。
当然,并不是所有AIGC都会被赋予著作权保护,具体还要根据个案不同情景加以判断,最终要通过作品的“试金石”即独创性来判断。作品的著作权归属也具有多元并存性,可以按照法定归属原则(如法人作品、视听作品)来归属其著作权,也可以按照约定归属原则,如约定人工智能开发商、投资人等作为著作权人。
当下我国人工智能产业迅猛发展,面对科技先行于法律的现实局面,对生成式人工智能的法律保护应当立足于促进人工智能发展的立场。《著作权法》更应当鼓励公众利用新型创作工具,创作更多更好的作品,同时也要提供更多的训练“语料”,让人工智能训练数据更加丰富,技术迭代更加迅速。至于那些关于人工智能创作泛滥的担忧,完全可以交由市场加以甄选或淘汰,就如同今天工业化产品和手工制作品一样自然会有不同的价格定位和市场选择。
尽管美国目前在AIGC的版权登记上持保守态度,但是在白宫2023年10月30日发布的《关于人工智能的新行政命令》中明确提到,所有类型的政府机构必须确保美国在人工智能技术开发方面处于领先地位。版权保护对于生成式人工智能产业发展就是重要的一个环节,美国一定会继续寻找解决途径。
熊琦:
当2016年来自谷歌的人工智能AlphaGo战胜人类顶级围棋大师时,人类在被人工智能强大算法所震惊的同时,也坚持认为在文学艺术等更多强调主观个性的领域,人类仍然是不可取代的。但自2022年开始,以ChatGPT和Bard等为代表的生成式人工智能,已经能够在文字、绘画和软件等领域以普通人要求的水准完成文本生成,人类认为不会被人工智能攻破的最后堡垒也面临失守。人工智能生成内容的常态化,意味着普通网络用户都能通过该渠道来进行创作。如何认定这些基于用户提示语所生成内容的可版权性及其归属,就成了《著作权法》不得不面对的问题。
无论是在2016年还是今天,其实人工智能生成内容引发的著作权问题始终集中在两点上,即作为人工智能模型训练的输入阶段以及作为人工智能生成内容的输出阶段。
迄今为止讨论最多的部分,是输出阶段。其中包含两方面的内容:一是人工智能生成的内容是否属于作品并受《著作权法》的保护;二是如果该内容属于作品,应如何认定其著作权归属。关于这两个问题,我国司法实践的结论和其他国家既有相同也有不同。相同之处为,现阶段我国和域外都秉承著作权法的立法目的与原则,即使在人工智能时代,也坚持只有人类才能拥有作者身份,认定著作权法只保护自然人的创作,生成式人工智能模型不具备自由意志,不是法律上的主体。同时,对于人工智能所生成的内容是否属于作品而受到著作权法的保护,仍然应当基于著作权法关于作品的构成要件来加以判断,独创性和智力成果等要件的认定不会因内容来源的差异而不同。不同之处在于域外权威机构坚持认为,由于通过用户提示完成的人工智能内容是不可预测和不可掌控的,用户的提示行为更类似于建议而非创作,所以用户不应视为作者;反之,我国司法裁判则认为用户对提示词的选取和生成过程中相关参数的调整都能体现出审美选择和个性判断,所以输入提示语的用户应视为作者。但无论现今裁判的结论如何,我国和域外的裁判机构都是从既有著作权制度规范出发作出的法律判断。因为不管是从法律的社会功能还是规制对象来看,基于既有规范来解释人工智能生成内容的可版权性及其权利归属都是法律适用的重要前提。这一方面是因为法律向来是以“涵摄”的方式去应对新的争议,以维持法律自身和公众预期的稳定性,不应轻易调整变化;另一方面则是因为人工智能虽然近年来助力生成了大量内容,但与著作权法调整对象的数量和范围相比,仍然仅占一部分,如果每种不同的生成方式都设定一种新标准,法律将无法正常适用。
自生成式人工智能服务提供者开始向网络用户大规模提供生成式人工智能服务后,针对输入阶段的讨论就逐步增加,其中最重要的问题,就是在未经著作权人同意的情况下大规模使用数字化的作品用于对AI模型进行训练是否构成侵权。在这一领域,域外已有一系列的诉讼正在进行,包括Stability AI、OpenAI、Meta、Alphabet等在内的全球头部生成式人工智能企业全部在被诉之列,但代表性的判决结果尚未出现。从产业发展的角度出发,诸多发达国家形成了鼓励人工智能产业发展的共识,部分国家已经在政策层面形成了“促进生成式人工智能健康发展”的方案。日本政府官员甚至公开提出不会将人工智能训练中使用作品的行为视为侵权,并在2024年1月迅速公布了《人工智能运营商指南(草案)》,希望尽快出台一份全面涵盖人工智能开发者、提供者和使用者的指导文件。韩国在其2023年的经济工作计划中,也提出推进著作权法的修改,将数据分析中使用作品纳入合法范畴,以此推动人工智能产业的发展。但司法上最终会如何认定,还需要等待上述判决的结果来参考。
由此可见,无论是输入端还是输出端,人工智能生成内容都给著作权法带来了新的议题。事实上,这种技术对制度的冲击,在著作权法的历史上也曾多次出现。例如,录音技术、广播技术和网络技术的先后到来,都使著作权法的调整和适用过程面临新旧产业保护的取舍问题,而且司法上的判决结果往往会对产业的发展方向产生重大影响。从“索尼案”将使用录像设备改变观看时间和地点的行为认定为合理使用,到针对P2P软件传播作品的系列案件中对平台帮助和教唆侵权责任认定标准的讨论,都在很大程度上塑造了新兴产业的未来。这次人工智能带来的冲击,本质上也是在技术的帮助下显著降低了作品创作和传播中的交易成本,使原来权利范畴和权利限制的设定难以保障著作权人的合法收益,进而弱化了著作权制度对创作与传播的正向激励,因此需要在新技术形成的新市场中界定权利范畴及其归属。
张吉豫:
这一轮基于大模型的生成式人工智能,具有一些突出的特点。首先,人工智能生成内容类型不断丰富,质量有了飞跃式发展,使生成结果具有了产业实用性。其次,多模态技术的发展,使文字、图像、音频及视频等多种类型的内容可以更容易地互相转化和生成,将进一步革新内容生产模式。目前文生图、文生音乐等类型的应用已经有了显著发展,未来可能有更多的多模态应用发展。最后,大语言模型等人工智能的发展,将全面升级信息分发获取的方式和人机交互方式,特别是越来越多的普通用户不需掌握计算机操作的专业技能,可以仅使用自己熟悉的自然语言等表达方式,就能够实现原本比较复杂的与机器的互动,获得自己想要的内容或服务。很多研究预测,人工智能大模型正在成为新一代的基础设施,对各行各业都带来改造升级,产生变革型的影响。
当前生成式人工智能的产业应用正处于快速发展阶段,具有非常广阔的前景,产业发展情况需要进一步跟踪观察。目前看来,在文字生成、图片生成、语音生成及音乐生成等方面的人工智能服务已经有了非常多样化的应用发展,如智能写作助手、PPT制作助手、智能客服及交互式数字人、智能图片生成和优化、短视频智能配乐、智能广告制作等,并且一些应用已经具有了庞大的用户群体。报告显示,ChatGPT在2023年1月末的月活用户已经突破了1亿,成为用户量增长速度最快的应用。2023年年底百度披露,“文心一言”的用户数量已超过1亿【郑新钰:《百度文心一言用户数破1亿,专业级用户开测智能体模式》,载人民网,https://paper.people.com.cn/zgcsb/html/2024-01/15/content_26037244.htm,2024年1月28日访问。】,日均调用量达数千万次,每月服务企业超过1万家【AI芯天下:《百度文心大模型率先通过国家大模型标准测试》,载腾讯网,https://new.qq.com/rain/a/20231225A08W8C00,2024年1月28日访问。】。Midjourney的文生图服务尽管需要付费使用,在Discord上频道的用户也已超过1000万。【Rok Krivec: Midjourney Statistics(How Many People Use Midjourney), at https://colorlib.com/wp/midjourney-statistics/(Last Visited on Jan. 28th, 2024).】另外,一些企业专注于向专业用户或特定产业提供生成式人工智能服务,尽管用户总量不大,也开始有了不菲的收入。可以预见,生成式人工智能将对社会的文化和相关产业都产生深远影响,丰富人类的创作方式,并扩展产业的运作方式和可能性边界。
很多用户仅是由于有趣或出于试验、了解等目的来使用人工智能生成内容,实际上没有进行作品创作的意愿,也没有投入多少时间。对于此类用户,生成内容能否获得知识产权保护,基本不会对其行为产生直接影响。但对于一些出于创作、商业化运用等更严肃目的而使用的用户,使用人工智能生成的内容能否获得知识产权保护,可能影响其愿意为此支付的费用,以及愿意在使用人工智能创作上所花费的精力。对于游戏、动漫、影视等专业的内容产业则更是如此。如果使用人工智能生成的内容不能够获得知识产权保护或效果相当的其他权利保护,这些专业内容生产企业将会在选择采用此类方式时审慎考虑。这些对于使用人工智能的犹疑,在长期来看可能会抑制生成式人工智能的发展。
人工智能生成内容能否获得知识产权保护,还可能影响传统方式所创作的作品的市场,影响相应作者群体的利益。一些学者曾指出,如果人工智能生成内容不能得到知识产权保护,则会导致大量内容进入公有领域,使潜在的作品使用者没有必要去付费使用作品,损害了人类创作者基于著作权可获得的经济利益,依赖版权经济效益存续发展的众多产业也将受到抑制。【参见易继明:《人工智能创作物是作品吗?》,载《法律科学》2017年第5期;曹源:《人工智能创作物获得版权保护的合理性》,载《科技与法律》2016年第3期;孙那:《人工智能创作成果的可版权性问题探讨》,载《出版发行研究》2017年第12期。】但如前所述,如果人工智能生成内容不能得到知识产权保护,也将影响其生成内容的商业化运用,进而激励产业继续选用传统创作方式产生的作品,有利于相对高质量作品的作者群体。
传统的作者群体已经开始对生成式人工智能强烈不满,2023年不同作品领域的著作权人针对生成式人工智能的诉讼频起,彰显了激烈的利益冲突。很多传统作者并不是聚焦于人工智能生成内容能否获得知识产权保护,而是不希望自己的作品被用来训练生成式人工智能、进而使其能够生成类似于自己作品的内容。实际上,除了人工智能生成内容本身能否得到知识产权的保护外,目前对产业影响最大的知识产权问题是使用作品进行模型训练是否能够构成合理使用或是否应有其他形式的著作权限制。
2
张凌寒:尽管各国的决定、判决最终结果并不相同,但是对此问题的争议焦点主要集中在生成式人工智能技术给知识产权中的“思想表达二分法”“实质性相似侵权认定”等原则带来的挑战,以及对作品认定的“独创性”和“智力成果”等要件的冲击。请问法律应如何应对?
郭禾:
这个问题提及了知识产权制度中多个基本原则和概念。这里着重讨论“思想与表达二分法”原则。
“思想与表达二分法”在不同语境下会有不同的理解。本问题将该原则置于知识产权框架之下,因此对“思想”或“表达”的理解应当不限于著作权制度。法律是行为规范,不是思想规范,因此“思想”绝不可能成为法律调整的对象。知识产权保护的对象只能是“表达”,因为“表达”是能够为人感知的客观存在。比如,专利技术或商标都应当是一种表达,也有学者称其为形式。无论在法理上还是司法实践中,法律保护的对象只能是客观化的表达,至于存在于主观层面的思想,是不能被纳入知识产权保护范围的。具体到AIGC,必须以技术、商业标志或者非实用的符号组合等形态成为可以为人感知的“表达”,才能得到法律保护。简言之,法律绝不可能保护完全以主观形态存在于大脑之中的思想。从这种意义上讲,目前的人工智能技术尚未对“思想与表达二分法”构成挑战。
当然,在著作权法框架下的“思想”或“表达”,无不限定在“作品”概念所框定的论域之下。其含义直接通过这些命题得到反映:“表达即作品”和“作品是思想的表达”。在这里,关于“思想”和“表达”概念的理解与前面有所不同。这里的“思想”不被理解成人类大脑的思维,而应将其降格理解为相对具体的“方案”“创意”等;相应地,“表达”也不再被严格限定为非实用的符号组合,而是将其升格理解为“情节”“桥段”等。在此界定下,当下引人关注的人工智能以文生图的诸多事件中的“文”与“图”之间的关系,是否属于“思想”与“表达”的关系,还存疑问。如果“文”被界定为思想,则可进而推出“思想与表达二分法”受到挑战。
然而,著作权法中关于“思想”与“表达”概念的界定在理论逻辑上原本就存在不甚严谨之处。西方著作权理论中的“Idea”在汉语环境中常被译作“思想”,更加重了这种形式逻辑上的不严谨。只是司法实践中,法官往往通过各种技术性处理弥补了逻辑上的缺陷。因此,即使针对AIGC,只需在“思想”和“表达”的概念界定或解释上稍作技术性处理,则“思想与表达二分法”仍然可以适用。至于当思想的表达有限时,则不能对该表达给予保护的问题,因为涉及对“独创性”概念的理解,即人们常说的“有限表达不具有独创性”,故也将在后面再进一步探讨。
冯晓青:
近年来,人工智能技术发展速度之快,令人惊奇。以ChatGPT和我国“文心一言”为代表的生成式人工智能技术的出现和应用,为现行知识产权制度带来了新的巨大挑战。核心问题还是利用生成式人工智能生成的作品和发明创造,是否分别属于著作权法和专利法保护的作品和发明创造。这里不妨以前者为探讨对象。
要明确利用生成式人工智能生成的作品是否受著作权法保护,需要评判其是否符合受著作权法保护作品的条件。如果符合,则可以纳入受著作权法保护的作品范畴、受到著作权法保护;反之,则不能纳入著作权法保护范围。根据我国现行《著作权法》第3条规定,著作权法所称的作品“是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。该规定表明,受著作权法保护的作品应满足以下四个要件:(1)属于文学、艺术和科学领域;(2)具有独创性;(3)能以一定形式表现;(4)属于智力成果。
就人工智能生成的作品而言,由于其涉及自然科学、社会科学和人文科学的内容,其满足第一个要件并不存在争议。人工智能生成的作品在外观上与自然人创作的作品并无差异。例如,当某人利用“文心一言”生成一篇文章,在其未申明系借助于人工智能生成的情况下,人们一般很难识别是否为自然人创作的作品。上述情况也足以表明,人工智能生成的作品也满足“能以一定形式表现”的要件。然而,对于上述第二个和第四个要件,则因为认识和理解上的不同而存在不同观点,实质上也深刻地体现了人工智能技术发展对作品认定的“独创性”和“智力成果”要件的巨大挑战,因此值得进一步深入探讨。
关于人工智能生成的作品的独创性,否认人工智能生成物在著作权客体中的地位、排除其受著作权法保护的观点认为,独创性强调作品是源自作为自然人的作者独立完成的,而人工智能生成物借助了人工智能,所生成的“作品”可以说是机器“创作”而形成的结果,缺乏自然人的独创性智力劳动成果。对此,我认为人工智能生成的作品依然具有著作权法中作品的独创性,具体理由如下。
首先,作品的独创性不仅需要考虑自然人创作的过程,而且需要判断人工智能生成的最终结果是否属于思想的表达,能够反映一定的思想、情感,表达一定的信息。就人工智能生成作品而言,不论是谁进行创作,最终生成的结果和通常意义上的作品并无实质性差异【参见杨利华:《人工智能生成物著作权问题探究》,载《现代法学》2021年第4期。】,人们同样能够以一定的形式阅读或欣赏。这一点是即使是不承认人工智能生成结果作品属性的学者也予以承认的。其次,在回答前一个问题时已经提到,至少在当前的弱人工智能背景下,人工智能生成作品的形成过程并非缺乏人的因素的干预。无论是类似于腾讯案件中人工智能自动生成系列作品,还是前述北京互联网法院案例中借助于人机互动,都体现了人的意志因素,即不能完全排除自然人的创作性因素。对此,后面关于生成式人工智能对“创作”的挑战还将予以探讨。最后,人工智能生成物的独创性还体现在最终产生的结果能够排除与已公开作品的实质性相似。在人工智能生成物经得起类似知网“查重”的检验的前提下,人工智能生成物的独创性可以得到进一步的巩固。
关于人工智能生成物的智力成果属性,不承认人工智能生成物在著作权客体中地位的观点也是以否定该生成物的智力成果属性为出发点。这里就存在如何认识智力成果的问题。我认为,人工智能本身是智力创造的结果,人们借助于人工智能创作作品并生成作品的行为,不仅包含了作为人工智能操作者、使用者生成人工智能作品的创作意图,而且包含了其个性表达的因素。这是因为,人们利用人工智能生成作品,需要多次提出问题、修改或排除主题词或参数,这都体现了人工智能操作者的选择和安排。正如张平教授在前一问题中的回答,前述北京互联网法院案例也正是基于此,不仅认定涉案图片属于受《著作权法》保护的作品,而且认定用户为作者。当然,对于那些通过输入非常简单的提示词、经过简单的步骤即生成的作品,情况则有所不同。但即便如此,也不能否认人工智能生成物作品的智力成果属性。这是因为,从人工智能生成作品的运作机理看,其存在所谓前端的数据输入、预训练和数据输出过程。人工智能生成结果借助了人工智能算法和算力,包含和体现了人类的智力活动过程,能够满足一般意义上的作品的要求。
对于上述独创性和智力成果的认定,我认为应对的策略应当是在《著作权法》中接纳人工智能生成作品在著作权客体中的地位,给予著作权保护。【参见冯晓青、李可:《人工智能生成内容在著作权客体中的地位》,载《武陵学刊》2023年第6期。】这样,既有利于丰富作品的类型和内容,也有利于协调围绕人工智能产生的利益关系,通过《著作权法》介入人工智能生成物领域的保护,也有利于著作权制度的现代化。我国《著作权法》在2020年修正时,在其第3条增加了“符合作品特征的其他智力成果”,对于纳入人工智能生成作品也提供了制度空间。实际上,著作权制度的发展历史就是一部权利客体和权利内容的扩张史。这一扩张,一方面,反映了随着技术发展,创作作品的形式和内容日益丰富,有必要新增受著作权法保护的客体;另一方面,也是技术发展和相应的产业变革中实现利益平衡的需要。人工智能生成物“挤进”著作权客体的范围,就是重要体现。
还值得指出的是,无论技术如何发展及其对著作权制度的影响程度如何,著作权法的基本理念和原理依然具有生命力。其中,用于界定著作权保护范围的重要原则——“思想表达二分法”就是如此。“思想表达二分法”意味着思想属于不受保护的公共领域,而思想的表达才是受著作权法保护的范围。就人工智能技术发展而言,在界分人工智能生成物是否受著作权法保护时,该原则同样适用。只是实践中,对于如何划分思想与表达的范畴,人工智能技术的发展确实带来了挑战。例如,用户在什么情况下输入主题词、参数等获得的人工智能生成物属于表达的范畴,在什么情况下属于思想的范畴,就值得研究。此外,在人工智能预训练阶段,需要大量地涉猎现有同类作品的思想、风格、主题,并通过人工智能算法和模拟人工神经网络生成作品。基于此,人工智能输入端利用现有受著作权法保护作品的行为是否属于著作权侵权,就依然可以从上述二分法的角度加以评判。至于“实质性相似侵权认定”则涉及人工智能生成物侵权责任问题。
张平:
生成式人工智能对著作权法的挑战不在于作品性和作者的认定,而主要在以下两方面。第一,人工智能训练数据涉及海量作品的学习,是否还要遵循“事前授权、使用付费”原则?这关系到人工智能开发者的生存问题。第二,人工智能生成物的侵权认定标准或者抄袭的判断标准,这关系到著作权法“思想表达二分法”是否成立的问题。第一个问题属于训练数据合法性问题,在此暂不讨论。
对于“思想表达二分法”而言,其创设前提是,过去人们学习既有作品的风格、灵感进而创作出新作品的能力十分有限。即使不保护在先作品中的思想,也并不会导致不同主体之间利益的显著失衡。然而,生成式人工智能可以在短时间内快速“学完”人类社会海量思想、知识和风格的基础上,进行无限的、全新的内容生成。当人工智能参与到“创作”中,很容易瞬间学习到他人的创作思想和风格,然后输出表达完全不同而风格极其相似的结果。例如,针对梵高的《星空》油画作品,人工智能可以作出无数的风格一致但表达完全不同的作品。因此,在判断人工智能生成物是否构成抄袭时,不应机械适用著作权法中的“思想表达二分法”,而应当以诚实信用原则为判断基础。
对于“接触+实质性相似”认定标准问题而言,首先,行为“接触”原则上由原告承担证明责任,即原告需要证明被告有“接触”在先作品的条件和事实,且被告具有非正当性目的。但是,这种证明对原告而言十分困难。生成式人工智能模型训练中的作品利用,是在模型内部进行的非外显的作品利用。这就导致了即使自身作品未经授权被人工智能模型用于训练,著作权人实际上也难以发现并提供相应证据。另外,著作权人难以进行“实质性相似”标准的比对。生成式人工智能对于内容创作的颠覆性影响在于,其通过对在先作品思想、风格的吸收学习,以一种难以预判的方式,输出和既有作品相区分的、全新的内容表达。AIGC会与原作品“似曾相识”但又“似是而非”。
根据目前实践,大模型公司并不会完全披露数据集的确切来源,原告所能提供的证据仅为大模型公司在训练过程中数据的权重和偏好,以及与在先作品高度相似的生成内容。例如,在纽约时报诉OpenAI和微软案中,原告提供ChatGPT侵权行为最重要的证据是100多个GPT-4输出内容和《纽约时报》报道文章高度相似的例子。
熊琦:与技术上的日新月异不同,全球著作权法在经历了从机器介入内容生成到人工智能生成内容的漫长历史后,关于人类与独创性来源的关联性立场却始终如一。人工智能生成内容对著作权法带来的挑战,与其说是填补规则的空白,不如说是研究既有规则如何针对新问题作出新解释,包括但不限于在人工智能训练过程中使用作品是否构成合理使用、人工智能生成内容是否具有可版权性以及在符合作品构成要件的情况下如何认定权利归属。已有的著作权规则并没有因人工智能的出现而失灵,在判定人工智能生成内容的相关著作权争议时,无论是我国还是其他国家,都是采取与判定完全由自然人创作的作品相同的规范和标准。从源起于19世纪末摄影设备介入创作后首次出现的机器与创作关联性之争,到20世纪末“计算机生成作品”(computer-generated works)权利归属的成文法定义,再到今天针对人工智能生成内容的著作权认定,司法机关、行政机关和学界的主流判断都坚持只有人类才能拥有作者身份,无论是机器、计算机还是人工智能,都不得视为作者。借助机器且以随机或自动运行的机械过程所生成的内容,因为其中缺乏人类智力活动的参与,该内容也不得被视为作品。这一点也在前面的问题中被反复提及。美国版权局在其2023年发布的《人工智能参与生成作品的版权登记指南》中,专门引用一份1884年针对借助摄影设备进行创作的判决,以此证明判定标准的延续性和稳定性。至于“思想表达二分法”和“独创性”等传统的可版权性认定标准,司法机构百年来在处理机器与创作关系时,都集中于判断作为创作者的自然人对所生成内容结果的可预期性和可控性。这种以既有规则涵摄机器介入创作时作品独创性来源的判断方法,既保持了判定标准的稳定性,又灵活地将独创性来源与自然人对应,坚持将机器视为人类创作的辅助工具这一核心判断,也间接说明现有著作权法足以应对来自人工智能生成内容的挑战,无需专门设计全新的制度来解决问题。
我国法院在司法实践中,也明确认可了人类创作在人工智能生成内容可版权性认定中的必要性。但当人工智能生成内容与他人作品构成实质性相似时,侵权行为的归责又必须追溯到侵权作品的主体。这种技术进步与规范守成之间的差异,以及拒绝保护和确权需求之间的悖论,都需要我们再次审视现有规则及其解释路径,探寻兼具符合著作权立法目标和满足技术迭代需求的权利配置安排。但从机器介入创作的技术史与制度史中已经可以发现,著作权法之所以坚持以既有的客体判定和权利归属来涵摄机器与创作的关系,目的始终是激励人在作品创作和传播中的核心作用,并在权利归属的认定上确保法律关系的稳定性。因此,以既有的独创性标准认定人工智能生成内容的可版权性,并正确区分该作品在人工智能算法设计者和使用者之间的权利归属,前提都在于认定人与创作行为的关联。因此,现阶段生成式人工智能讨论的重点,在于如何从现有著作权客体和归属判定的适用过程中找到自然人在人工智能生成内容中的贡献及其比例,而不是专门为人工智能创设一个全新的著作权体系。
张吉豫:
生成式人工智能为著作权法中的一些基本概念和原则提供了新的适用场景。
“思想表达二分法”是著作权法中的重要原则,用于划分作品中受保护的部分与不受保护的部分,以实现著作权人与社会公众之间的利益平衡,使著作权保护不至于影响后续作品的创作。抽象的思想往往对应无限的表达,不应使著作权人获得过宽的保护。
也因此,某个个体可能对自己撰写的指导人工智能的“提示语”(prompt)拥有著作权,但是如果其中的某些文字是为了实现特定的操作所必需的撰写方式,则可能因为思想与表达合并而无法得到排他性保护。此外,个体不能对自己编写的“提示语”可能产生的所有表达拥有著作权,而至多对已通过自己选用大模型、输入提示语以及进行选择或调整后得到的表达拥有著作权。
人工智能生成内容是否具有独创性、是否构成智力成果,目前争议较大。从目前的法律文本上看,正反两种观点都存在解释可能性。在过去著作权法的发展过程中,并不需要严肃讨论一个作品生成过程中人类智力的贡献模式和程度。因此,我们今天在讨论这两个概念时,不能简单考察过去的解释内容,而应当在文义可及的边界内,探寻何种解释更加符合著作权法的立法目的,更有利于促进文化的繁荣和人类的福祉。要更好地回答这一问题,还需要对产业及社会发展进行更深入的观察分析。
3
张凌寒:生成式人工智能对“创作”带来哪些挑战?应如何开展制度设计?
郭禾:
前一个问题专门提及“独创性”。独创性与本题中的“创作”直接相关。无论是独创性还是创作,都属于著作权法中的核心概念。独创性被认为是作品构成要件中的内在要件,而创作则是指作品产生的过程或者行为。因此,只有能够产生具有独创性成果的行为才能被视为创作;反过来,创作行为产生的成果就是作品,当然具有独创性。本问题的核心是要回答AIGC的产生过程能否被视为创作,或者AIGC是否具有独创性及能否作为作品受到著作权法保护。
创作即指作品的产生过程。作为创造行为的一种类型,创作被认为是只有人类才能完成的。AIGC的诞生让人们反思机器能否创作。然而,以人本主义的立场为基点,机器只能是人实现其目的的工具,不可能成为法律主体。在法理上,创作作为著作权法律关系产生的要件,行为主体只能是人。虽然法律主体并非仅限于自然人,但要将机器设定为法律主体,在理论上要么改变法律是人的行为规范的基本范畴,要么就必须重新界定法律上人的概念。显然,目前都不可能直接作出这两种选择。在这样的条件下,要从著作权法上解释AIGC的产生过程,便只能归因于人的创作行为了。尽管这种处理方式存在目的导向之嫌,但从制度成本的角度看,这可能是最经济的路径。
为了说明人工智能系统被视作人类创作工具的基点,有必要弄清楚人类和人工智能技术在AIGC产生过程中分别发挥了何等作用。当下的生成式人工智能系统无一不是在特定的算法之下通过大量数据训练或学习而变得“聪明”的。当然,算力在这里也是重要因素之一,但这或与硬件关系密切。在这里,数据和算法或居于核心地位。在人工智能系统中,算法往往表现为人类根据既有的知识、规则和逻辑体系事先设置的一系列指令的集合,用于实现计算、处理数据或推理等目的。这种意义的算法既包括作为计算机运行的底层系统,也包括该模型试图解决的应用层面的规则。比如,作为语言交互目的的人工智能系统至少应当将特定语种的基本词汇、语法、读音乃至语气等植入其中,否则便无法与用户进行对话。同样地,要生成用于商业目的的文章、图片及视频等,撇开各种媒体的相关要求,从法律的角度看至少需将著作权法相关规范植入算法,以防止生成的内容直接利用他人具有独创性的表达,从而导致侵权。可见,算法对著作权规则的理解是否到位,直接关系到生成内容是否侵犯在先作品的著作权。数据则在算法的作用下被分解、整理,最终成为大模型自己的知识库的一部分。处理数据的过程同时也是大模型学习的过程。被处理的数据越多,模型在输出或生成内容时就显得越“聪明”。当然,数据质量的高低也直接影响模型学习后水平的提高程度。AIGC即是按照算法所确立的各类规则,将若干被分解、整理后的数据元素进行重新组合后的输出。从著作权法角度对其进行审视,这些输出内容的外在形态与作品无异,以致由人脑来审查AIGC本身往往无法判定其与人类创作的作品的差异。
人类之所以难以判定AIGC与人类自身创作的差异,归根结底在于人脑对大数据的处理能力极其有限。人脑与电脑相比,最大的弱点在于人脑有遗忘效应。当数据量过万,人脑往往就难以全部记住。对电脑而言,即使是过亿的数据量,只要有足够的存储空间,都可以“过目不忘”。这一差异反映在作品独创性判定上,就表现为人脑和电脑对于有限表达的判定完全不同。当某种思想的表达有上万种,对人脑而言,则将其视作表达无限,进而认定特定表达具有独创性。但对于电脑,这当然属于有限,只要算力足以支撑,万亿种表达也是可以处理的。所以,AIGC在理论上仍是有限表达的一种,只是这里的有限数量超过了人脑的处理能力,以至于在人脑看来已经具备了独创性。例如,一部中文长篇小说,由于汉字的数量是有限的,小说的篇幅也是有限的,因此哪怕长达百万字,其组合在数学上也是有限的。
从本质上讲,AIGC引发了我们对创作或创造概念的重新认识。通观全球各国的著作权法,无论是作者权体系还是版权体系,无不要求创作行为中应当包含创造性,即便只有一点“创造性火花”。法国人所称“小硬币”或者美国人所称的“最低限度创造性”都是对作品创作或者作品独创性要件的说明。可见,作品应当具备创造性是世界各国的共识。但这并不能解决AIGC所提出的以下问题:是否只有彻底的“无中生有”才被叫作创造?只要组合的可能选择多到仅以人脑不易处理,对现有要素的组合是否也可被视作创造?当人工智能技术被普及时,当任何人都可以通过人工智能系统非常容易地生成各种内容时,创作或创造的概念是否需要更新?另外,当AIGC不再稀缺时,它还是财产吗?其是否需要用法律手段加以保护?这些问题都有待我们回答。
冯晓青:
“创作”在著作权法中具有举足轻重的地位。我国现行《著作权法》中提及“创作”就有19处之多。《著作权法实施条例》第3条第1款、第2款规定:“著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。”“为他人创作进行组织工作,提供咨询意见、物质条件,或者进行其他辅助工作,均不视为创作。”我国《著作权法》1990年颁行以来已修改多次,尽管没有直接规定创作行为对于获得著作权的意义,但通过强调作者是首要的著作权人,以及规定“为谋取个人名利,在他人作品上署名的”属于“应当根据情况,承担停止侵害、消除影响、赔礼道歉、赔偿损失等民事责任”的侵权行为,间接地肯定了著作权法保护的是基于作者的创作行为产生的作品。现行《著作权法》第9条和第52条第3项即作了相应的规定。
对于著作权法中“创作”的认识和研究,离不开另一个关键性概念——“作者”。所谓作者,就是创作作品的人。结合前述《著作权法实施条例》关于创作的概念界定,可以将作者进一步定义为直接从事产生文学、艺术和科学作品的智力活动的人。从作品创作实践和各国著作权法的一般规定来看,能够成为作者的一般是自然人。这与发明创造实践以及各国专利法规定关于发明人(或者设计人)只能是自然人的情形有异曲同工之妙。但也应看到,随着法人概念的提出和法人制度的出现,将法人或者非法人组织视为作者的立法例和实践也已出现。我国现行《著作权法》第11条第3款即规定:“由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。”这类作者在著作权法理论上又被称为“拟制作者”。拟制作者显然不是作者的主要形式,并且需要满足严格的条件,即由拟制作者(法人或者非法人组织)主持、代表其意志创作并由其承担责任三个条件缺一不可。即便是拟制作者,也是由具有生命的自然人组成的,在本质上依然是自然人创作的体现。
从著作权制度的发展来看,创作手段的不断丰富,是受著作权保护客体不断扩张、著作权保护内容也日益丰富的重要原因。例如,在摄影技术出现后,人们能够通过照相机创作摄影作品,丰富了艺术作品的表现形式。在录音录像技术出现后,视听作品逐渐被纳入著作权客体的范畴。近些年来,随着信息网络技术及其产业的发展,“用户生成内容”(UGC)逐渐普遍,使得“人人成为作者”更加便利。总体上看,创作手段的不断丰富是以相关技术不断发展和进步为标志的。技术发展和进步,不仅使人们的创作变得更加便利、效率更高,而且能够创作未曾有的新的作品类型。这自然在一定程度上体现了前述技术发展对知识产权制度的影响。
然而,在人工智能技术特别是生成式人工智能技术发展和应用之前,无论技术发展对于创作的影响有多大,也脱离不了技术作为人类创作手段和工具的属性。生成式人工智能的出现对“创作”的挑战可谓具有革命性,因为人们利用生成式人工智能可以轻而易举地生成具有很高专业和技术含量的形形色色的作品。在生成式人工智能运用背景下,人们可以利用生成式人工智能批量地自动生产作品。近年腾讯公司主张侵权救济的人工智能生成作品著作权侵权纠纷案就是体现。
随着近年来生成式人工智能的迅猛发展,人工智能用户借助于人工智能,通过输入主题词、参数和不断进行调整等方式获得最终令自己满意的作品的行为日益普遍。这尤其体现于国外的ChatGPT以及我国“文心一言”等生成式人工智能平台。前述北京互联网法院判决并生效的“李某与刘某侵害作品署名权和信息网络传播权纠纷案”就是这方面的典型例子。这类纠纷案件尽管数量还极少,但其意义是深远的,深刻反映了生成式人工智能技术发展对著作权法中创作概念和相应的作者概念及其认定的严重挑战。这些挑战也对如何修改和完善现行著作权制度、如何从制度设计方面优化现行制度提出了崭新的时代命题,值得深入研究和探讨。
关于生成式人工智能对著作权法中创作概念和认定的影响,我认为需要认识到这种创作环境下“创作”的新内涵和方式。毫无疑问,在前述明确人工智能生成作品符合著作权客体条件、能够受到著作权法保护的前提下,这种作品的创作离不开操作人工智能的用户和人工智能本身。至于设计生成式人工智能的技术人员以及开发人工智能的投资者均应当排除在外。因为根据前述关于《著作权法》中创作的定义,他们都不直接从事产生文学、艺术和科学作品的智力活动。这样一来,界定人工智能生成作品的创作行为只能从操作人工智能的用户和人工智能本身两方面寻求答案。如前所述,作者是创作作品的人,关于生成式人工智能对创作的挑战,最终还是需要回到“谁是人工智能生成作品的作者”这一关键问题上来。
从国内外现有关于界定人工智能生成作品的作者的观点看,主要有以下几种。一种观点基于人工智能生成作品来自于人工智能本身,操作人工智能的用户只是通过提问和选定主题词及参数等“引诱”人工智能生成自身需要的作品而不能视为作者,进而主张应将人工智能拟制为作者。该类观点还注意到国外有赋予人工智能本身以“电子人”身份的先例。国内的腾讯案件也是在人工智能生成的作品上署了所取的人工智能的名字。另一种观点则反对赋予人工智能作者身份,主要理由是根据通常的法律主客体分离的基本法理,认为人工智能只是人类创作的工具,其不可能成为作者或者被视为作者。这种观点通常认为,应当将操作人工智能的用户视为人工智能生成作品的作者,如前述北京互联网法院案例就是如此。当然,也有个别观点主张,鉴于人工智能生成作品是“人机结合”的产物,可以视为用户与人工智能“合作创作”的作品。
对于上述观点,我认为不能笼统地主张人工智能为作者或用户为作者,或者二者为合作作者,而是应当基于在人工智能生成的作品中自然人(及其所在的法人或者非法人组织)所发挥的具体作用具体分析。在涉及基于人工智能生成作品的创作和作者以及相应的著作权归属问题上,我认为在制度设计上可以作如下考虑。
其一,对于类似于腾讯公司案件中的在单位开发出生成式人工智能后,通过相对固定的算法和设计,运用该人工智能自动生成的批量性质的作品,可以按照该案中类似法人作品的界定路径,将著作权归属判定为属于法人,同时将人工智能明确为非著作权法主体意义上的“作者”,并通过体现人工智能“作者”身份的强制署名,向社会公众告示该作品乃基于人工智能自动生成,以便于和自然人创作的作品进行区分。这类作品,实际上缺乏著作权意义上作为自然人或者自然人集合(法人或者非法人组织)的作者,而只有人工智能这一“名义作者”。这正是人工智能技术发展背景下人工智能生成作品作者身份及其界定的特殊性所在。这一特殊性决定了既不能完全按照传统著作权法的原理(作者只能是拥有生命的自然人)确定作者身份,也不能完全按照现行《著作权法》规定来确定作者。基于此,未来应对《著作权法》相关规定进行修改,以适应人工智能技术发展需要。
其二,对于类似前述北京互联网法院判决案例的人工智能生成作品,由于作品并非人工智能自动生成,而是用户通过多次提问、设置和调整参数以及反向排除等多种手段才最终获得,这类人工智能生成作品中用户基于提问、安排、取舍、诱导等行为而体现出对作品个性化表达的成分,可以将用户视为人工智能生成作品的作者。基于此,这类作品公开和传播时,可以在作品上将用户署名为作者。
但应当指出,第一,正如北京互联网法院所判决的一样,要求在作品公开和传播时表明该作品系借助于人工智能所完成,而不能仅署名用户,以至于其他任何人难以获悉该作品系借助于人工智能生成的。这一做法,既符合诚实信用原则,也便于区分人工智能生成作品与自然人独立创作的作品,防止人工智能生成作品公开和传播对正常的作品市场及流通秩序造成负面影响。关于上述要求,应注意用户署名和基于人工智能获得的声明应当被置于相邻位置,防止突出用户署名而变相隐匿借助于人工智能生成的信息的情况发生。
第二,对于操作人工智能的用户通过过于简单的提问、提示和调整而产生的人工智能生成作品,应当进行特殊考虑。从前述著作权法保护作品的独创性要件来说,这种情况并不满足独创性要件,缺乏作者个性化表达的因素和贡献,此时用户不宜被视为作者。但也应看到,法律制度的实施需要考虑可操作性和经济成本。在社会观念和改革后的著作权法接纳人工智能生成物作为受著作权保护的作品的背景下,要排除上述情况中用户的作者身份,可操作性问题较大。综合权衡,一方面,可以考虑赋予其作者身份,同时通过侵权责任等相关制度设计予以制约和限制;另一方面,可以考虑邻接权保护方式。
第三,在明确用户作为作者并可以署名的前提下,由于人工智能生成作品要公开和传播才具有实质性的法律意义,在人工智能生成作品的情况下,需要进一步明确用户在作品上署名可能承担的侵害著作权的法律责任风险。这与法理学上权利义务一致性原理相符。因为该原则要求,用户不能只享有借助于人工智能获得人工智能生成作品的作者身份和相应的著作权,却不对可能存在的著作权侵权风险承担责任。
张平:
生成式人工智能对“创作”带来的挑战存在于多种场景,如人工智能绘画、人工智能音乐创作、人工智能剧本编写等,都对传统的“创作”人员构成威胁。例如,利用人工智能绘画工具很容易将个人肖像转化为动漫形式,由此很容易形成许多改编的影视作品。再如,数字人可以进行数字分身,许多演员可用真人替身,以及文字作品的有声化、实时翻译及机器同声传译等,导致复制与演绎行为的边界越来越不清晰。这些问题都是对著作权法基本原理的挑战。
就制度设计建议而言,首先,可以考虑为人工智能创作制定特殊的标识义务,如为人工智能创作的作品设立独特的标识,以区分人类和人工智能的创作。这可以帮助公众明确作品的来源,同时保护消费者和使用者的权益。其次,应当对人工智能创作作品的著作权进行重新配置,可能包括建立多方权益共享机制。例如,可以考虑将人工智能创作的作品著作权分配给人工智能开发者、数据提供者和使用者,并建立相应的利益分配机制。最后,可以通过“署名和著作权相分离”的方式来明晰权利归属、定分止争,也即人工智能作品著作权的归属可以通过声明、版权登记确认、标注等方式归属给投资人、开发者或使用者(用户)等。这种将署名和著作权分离的做法突破了现行著作权法中“在作品上署名的视为作者,进而推定为著作权人”的规则。如果著作权法稍作调整,署名与著作权的归属分离完全可以得到法理上的支持,既符合著作权法中规定的署名是对“创作者”的宣示作用,同时也符合民法上的诚实信用原则,宣示是人工智能生成作品。此时给人工智能署名并不意味着给它人格或法律主体地位,署名应当是一种标识,表明作品出处,是一种客观事实的反映。
面对生成式人工智能技术的挑战,考虑如何进行制度设计不仅需要对现行著作权法进行深入分析和适应性改革,还需要技术、社会和法律多方面的合作,以实现对人工智能创作的合理规制和保护。
熊琦:
从技术上看,人工智能技术其实在20世纪60年代即已被提出和展开研究,但由于硬件算力的不足和大数据技术尚未跟上,其技术方案难以实现,并未对社会产生巨大影响。进入21世纪后,随着硬件算力的显著提升,以及互联网带来的大数据技术和产业繁荣,人工智能的训练效果突飞猛进,最终形成了今天的产业态势。
但技术的勃兴未必需要法律的颠覆性调整。发达国家和地区的管理机构与研究机构在近年来关于生成式人工智能知识产权问题的相关报告中,都不约而同地认定现有著作权规则无需进行结构性调整,完全能够应对现阶段人工智能的挑战。在创作的来源和认定标准上,更是毫不怀疑地坚持只有自然人才能创作的底线认知。德国马克斯-普朗克创新与竞争研究所在2021年发布的一份关于人工智能的立场声明中提出,版权被认为是一个本质上以人类为中心的法律领域,根据目前的知识状况,为人工智能生成内容而创设新的保护制度是不合理的。美国版权局在2023年发布的《人工智能参与生成作品的版权登记指南》中也提出,“享有作者资格的作品,必须由人类创造”,“由机器创作的作品,或纯粹由机械过程随机或自动生成的作品,如果没有任何人类作者的创造性贡献或干预”,就不应进行版权登记。致力于提升全球版权保护水平的国际保护知识产权协会(AIPPI)早在2019年大会上通过的《人工智能生成物的版权问题决议》中也声明,只有人类才能拥有作者身份,无论是机器、计算机还是人工智能,都不得视为作者。借助机器且以自动运行的机械过程所生成的内容,因为其中缺乏人类智力活动的参与,该内容不得被视为作品。同时,来自全球版权产业的会员也一致认为,现有著作权法足以应对来自人工智能生成内容的挑战,无需专门设计全新的制度来解决问题。
之所以坚持既有的著作权规范,主要是基于两个原因。从规范层面出发,在人工智能生成内容的可版权性认定中坚持自然人对独创性的贡献,是维持确权和侵权体系稳定的需要。如果将人工智能视为著作权主体,未来在权利变动的意思表示来源及侵权责任认定的对象等问题上,机器都将与人享有同样的法律地位和资格。如何认定机器的真实意思,如何考量机器在侵权行为中的主观过错,都是现行法律体系无法解决的问题。从效用层面出发,只有自然人才需要著作权法的激励来进行更多更好的创作和传播。无论是机器还是人工智能,其工作效果都不会因为被生成的内容是否受到保护而改变。生成内容的质量取决于人工智能算法和训练的质量,更与训练输入的内容质量相关。将著作权赋予自然人,可保障著作权继续激励人工智能的设计者与所有者对硬件和训练数据的投资以及对算法的改进。
张吉豫:正如之前所言,生成式人工智能带来了新的“创作”方式,也具有使“创作”进一步普及化的潜力,整体而言有利于增进人类福祉。当然,不同的具体应用情况或不相同,需要具体问题具体分析。从当前的文生图等应用来看,结合“创作”的问题,我有如下一些基本想法。
首先,创作的方式是不断发展的,我们不应当固守对于传统“创作”模式的认识。或许使用人工智能进行创作短时间内难以被社会普遍接受为一种创作方式,就像摄影是否为创作,也曾受到质疑。产业的发展需要和更大范围的实践带来的认知变化,共同为摄影作品得到著作权法认可奠定了基础。相比摄影,或许使用人工智能进行创作与传统观念中的创作具有更大差别。相信随着更多人真正以创作为目的使用人工智能之后,社会也可能在观念上认可使用人工智能生成内容构成创作。
其次,创作的普及化、大众化是有利于促进文化繁荣的。过去我们看到,数字化技术和互联网的发展,使摄影、摄像、图片和视频编辑等曾经成本较高的创作领域的创作和传播成本都大幅度降低,极大地推动了相应领域的创作。当然,成本的降低,必然会使大量“低质量”的内容出现,正如我们每个人的手机里恐怕都留存着大量我们自己也不愿意称为“作品”的照片,但这并不影响摄影能够成为创作出优秀作品的一种方式,也不会因此否定摄影作品作为一个作品类别。创作的普及化也不断推动着公众的审美和创作的提升。一种观点认为,一个人没有经过美术训练就能产生美术作品是荒谬的。我认为,这恰恰是使用人工智能创作的积极意义之一,可以使更多的人将自己的创作激情和设想转化为能够看到的实在作品。Remix等创作方式对于社会的价值很大一部分也在于此。激励这类创作方式,并不是对传统创作方式的排斥,而是扩展了一种人类创作的可能性。当然,也同样需要考虑对其他创作方式的影响。但目前并没有看到实际证据表明,认可使用人工智能生成内容构成创作会明显影响传统创作方式。
因此,在著作权法框架下开展关于人工智能生成作品的制度设计之时,需要认真考虑制度对于使用者创作的影响,考虑如何对创作进行激励。创造性的活动是人类美好生活的要素之一。在认可使用人工智能生成的内容构成著作权法保护的作品时,着重考虑的并不只是人工智能产业的利益和发展,还同样包括这种新的创作方式能够带来的对于更广范围的个体创作意愿的满足,以及进而对社会文化的促进。
此外,使用者应诚信说明自己的创作方式。《生成式人工智能服务管理暂行办法》规定了提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识,对于一般内容可以采用不影响用户使用的标识,对于可能导致公众混淆或误认的一些特定内容则需要依法进行显著标识。这也为公众获知创作方式提供了一定的条件。
4
张凌寒:目前支持赋予AIGC著作权保护的决定和案例,本质上是认为应当对人工智能生成内容予以一定程度的法律排他性保护。但是,除了著作权之外,是否有其他制度选择,如邻接权、财产权抑或其他路径?
郭禾:
从世界范围看,有关国家近期分别出现了涉及AIGC的争议案例或事例。约三个月前,北京互联网法院有关案件的判决对AIGC在知识产权法中的地位给予了肯定回答。但美国国会图书馆对于以作品形态申请版权登记的AIGC却给出了拒绝登记的答复。与之类似,澳大利亚知识产权局驳回了申请人就AIGC提出的专利申请。如前所述,站在市场经济的角度肯定AIGC的财产地位是必然的。具体采用何种方式保护该类财产,前面已经述及最为经济的方式是借鉴知识产权模式。至于采用专利权还是著作权,则要根据保护对象的属性而定。如果AIGC属于技术方案,则适合专利法;若为非实用的符号组合,则适用著作权法。
关于能否采用邻接权模式保护AIGC,从理论角度看答案是肯定的。因为邻接权制度本就是欧洲作者权体系著作权法中的一部分,其运行机制与关于作品的权利并无本质差异。而在版权体系中,相关国家的版权法则将邻接权完全与作者权合并,不再区分邻接权与作品的权利。所以适用邻接权保护AIGC只是法律技术的细节问题,并可以在一定程度上缓和关于AIGC独创性的争议。但从财产权的角度看,这一争议无关紧要。究其原因非常简单,前面关于有限表达不具有独创性的讨论已经说明,那些在自然人看来具有独创性的AIGC有可能在事实上仍是有限表达的一种,只是该有限表达的数量已经超过人脑可处理的数据量上限,比如三十亿。现实中一些自然人完成的、已经被贴上具有独创性标签的表达,很可能有朝一日被证明这类表达只有三十亿种,难道届时还要反过来否定其独创性,进而否定以前已经给予的著作权保护?答案当然是否定的。市场的力量最终会“逼着”社会承认AIGC的地位。
冯晓青:
如前面所讨论的,人工智能生成内容获得法律保护应当是没问题的。法律保护人工智能生成内容,不仅体现了法律制度适应人工智能技术及其产业发展的需要,而且反映了人工智能生成内容在当代经济社会生活中的重要价值。【参见冯晓青:《数字时代的知识产权法》,载《数字法治》2023年第3期;冯晓青:《数字环境下知识产权制度面临的挑战、问题及对策研究》,载《社会科学战线》2023年第9期。】如果不予以法律保护,这一般意味着人工智能生成内容直接进入公共领域,可以由任何人自由利用。即便如此,也并不意味着法律对于人工智能生成内容不予以调整和规制,这是因为人工智能生成内容一旦公开和传播,就会对社会生活产生影响。如果人工智能生成内容涉嫌违反国家法律、社会公德或公共利益,也应当受到法律的规制。实际上,《生成式人工智能服务管理暂行办法》即对生成式人工智能服务和管理事宜作了规定。
在承认人工智能生成内容应予以法律保护的前提下,关于是否应赋予其法律的排他性保护,个人认为答案是肯定的。具体而言,如前所述,对于人工智能生成作品,由于其符合受著作权保护的客体的要件,可以给予著作权保护。相关理由不再重述。当然,在学术研究中,也有观点主张著作权法中的邻接权保护。由于我国《著作权法》既保护著作权,也保护邻接权,因此对于邻接权保护的途径也有必要探讨。从著作权法原理看,邻接权保护和著作权保护既有密切联系,也有重要的差别。就二者的差别而言,在对作品的保护上,邻接权保护的要求较低,并不要求满足作品的独创性要件。从国外立法看,德国著作权法对于摄影作品即规定,满足独创性要件的摄影作品给予著作权保护,反之则给予邻接权保护。就人工智能生成内容而言,上述原理应当同样适用。具体来说,对于前述类似于腾讯案件中完全由人工智能生成的“作品”,缺乏用户投入创作作品中的个性化表达,相应地也缺乏自然人创作行为,但开发人工智能的单位付出了相关的投资、智力劳动和时间,给予邻接权保护具有相当的合理性。至于不分任何情况,一律将人工智能生成作品纳入邻接权保护则不够合理,因为这样无法体现和反映操作人工智能的用户的独创性劳动,无法以著作权法之激励机制鼓励充分使用人工智能造福于社会和文化进步。
关于人工智能生成内容的法律保护,除了上述著作权、邻接权保护模式外,一般财产权或者财产权益保护也同样值得考虑。人工智能生成内容承载了一定的财产化利益,在利用人工智能生成内容时,不排除涉及不正当竞争行为的可能,因此在一定条件下也可以受我国《反不正当竞争法》的规制。当然,由于生成式人工智能在我国刚刚兴起,目前这方面案例并不多见。关于人工智能生成内容的《反不正当竞争法》规制问题,不仅有待于司法实践中总结经验,而且有待根据人工智能发展状况作出前瞻性的研究。
张平:
结合AIGC的特性,可以根据AIGC是否具有独创性以及独创性的程度高低,视具体情形设计AIGC的著作权保护路径、邻接权保护路径及反不正当竞争法保护路径等方案,实现对AIGC的多元化保护。
首先,若能满足独创性要求,狭义著作权保护路径是保护人工智能生成内容的最优选。作为一种专门保护表达的权利,著作权权利内容比较完整,如发表权、署名权、保护作品完整权、复制权和发行权等权利,时限也长达作者终身外加去世后50年。著作权法与科技发展密切相关,著作权内容的延展体现了对科技进步的容纳性,人工智能技术也应驱动著作权法的发展。
其次,相比狭义著作权更为灵活的著作邻接权可以为一些不符合著作权保护标准但具有一定独创性和市场价值的内容提供保护。邻接权制度相比传统的著作权制度有许多优势。例如,邻接权的保护相对较弱,不像著作权那样强调人格权。邻接权也主要涉及财产内容,而不涉及人格利益。邻接权的权能较著作权少很多,保护期也较短。这与人工智能生成的作品相对应,因为人工智能生成的作品不会有生命期限制。邻接权对独创性的要求不高,邻接权制度的初衷是为了保护传播者的投入,而不是独创性的表达,因而邻接权的客体是不构成作品的其他劳动成果。因此,与狭义著作权体系相比,邻接权是一个开放的制度,可以根据本国国情的需要创设新的邻接权类型。但邻接权制度在设计上也存在一些困难:其一,若人工智能的“自主创作”以邻接权保护,而与人类“共同创作”的作品可能适用著作权保护,二者难以区分;其二,邻接权的权属难以界定,邻接权的初衷是保护传播者的投入,但在AIGC的投资者、研发者和使用者之间难以确定权利归属。
再次,特殊财产权利制度可以应对权属争议,为非传播者的正当利益提供保护。需要保护AIGC背后的行业,因此也需要保护投资者。AIGC具有自身的价值,满足财产权的核心构成要件。并且,AIGC比数据库更具商业价值,数据库的汇编与实质性投入对数据库内容本身并未做修改,更没有独创性变更。而AIGC是基于大数据基础上的加工分析处理,因此对其内容的保护程度不应当与数据库权的保护程度一样,理应设置不同的保护制度。
最后,无论如何,对于AIGC之上存在的未上升为权利但具备商业价值的经济利益应当予以保护,此时《反不正当竞争法》即可发挥规制不正当竞争行为、保护市场竞争秩序以及市场主体合法权益的作用。在法律对此未有明确规定之前,可先以《反不正当竞争法》第2条(“一般条款”)进行保护。《反不正当竞争法》或可以作为知识产权或其他商业成果类权利的“孵化器”,在特定的创新成果可能成为法定权利之前,先纳入《反不正当竞争法》进行过渡性、尝试性或实验性的保护。将来能够对其上升为权利或作为权利保护达成共识时,再适用具体的法律进行保护。
总体而言,针对AIGC的保护,需要综合考虑独创性要求、保护范围和时限、侵权问题以及经济利益等因素,通过适当调整现有法律的适用范围和标准来实现多元化的保护。
张吉豫:
如前所述,人工智能生成内容是一个比较广阔的领域。从目前比较常见的一些文生图等应用模式来看,相应的人工智能生成内容可以在著作权法框架下得到保护。著作权法能够给予作者人格权意义上的身份认可以及产业上的经济激励,并且给予著作权保护存在解释空间,具有可行性,可以在不修改法律的情况下立即满足使用者和产业的需求。同时,著作权法的“独创性”“智力成果”“思想表达二分法”等要件和原则具有弹性调节的功能,可以令司法机关随着产业和社会发展,进行合乎著作权法立法目的的解释,针对新的情况调节合理的保护范围。如果随着进一步的观察研究和司法实践发展,可以论证确有设置特殊条款的必要性,则未来可以在著作权法中进行必要的修改。
在制度设计上,一般应当认定人工智能这一工具的使用者为作者。如果是研发人工智能的企业自己使用,或者提供给其他企业使用,则可以根据著作权法认定构成法人作品,即如果该作品系由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任,应将法人或者非法人组织视为作者。
主要考虑如下。首先,使用者是一个个具体作品产生的直接原因,很多高质量作品的生成离不开使用者的反复打磨,使用者也是前述繁荣社会文化、激励创作等目的实现所应当激励的主体。并且,如果是企业使用,则可以依据法律认定法人作品,并不影响相应情况下企业经济利益的实现。其次,生成式人工智能可能产生无限的表达,将权利“一揽子”赋予人工智能企业,可能给予人工智能企业过多的对于内容领域的权利,不利于后续创作的丰富化、多元化。再次,生成式人工智能服务的提供者可以在与用户的合约中约定著作权财产权的相关许可条款,进而根据具体的场景实现合理的利益分配,保障自身的权益。通常人工智能的提供者和使用者之间在合约制定中具有不对等性,将著作权默认分配给使用者,有利于利益平衡的实现和交易的达成。最后,将权利赋予使用者,能使其更有动力去审查、修改和调整,使用者也可以将自己的其他作品与一种甚至多种人工智能生成的作品进行融合,进行更丰富的创新,并将优秀作品带入公众视野,进一步促进其传播。
5
张凌寒:感谢各位老师的精彩回应。AIGC是否应予以著作权保护的后续问题,一定就是如果生成物侵害他人著作权,应如何认定用户、大模型技术和服务提供者侵权责任。请问各位老师对此有何看法?
郭禾:
当AIGC与他人在先享有著作权的作品或者在先享有邻接权的对象相同或实质性相同时,则涉及侵犯他人著作权。根据AIGC的产生过程,导致“相同或实质性相同”的情形至少可分为两种:第一,大模型的用户知道或者应当知道其指令可能让系统生成与他人在先成果相同或实质性相同的AIGC,仍然输入相关指令生成该AIGC并投入商业利用;第二,大模型在没有针对特定人或物的一般指令下生成与在先成果相同或实质性相同的AIGC。
针对第一种情形,责任当然在大模型的用户或者使用者。这就如同知道或应当知道自己的行为构成抄袭却追求或放任抄袭结果发生并将抄袭结果投放市场一样。只是这里的抄袭行为所使用的工具从手中之笔换成了人工智能系统而已。在这种情形下,用户自当承担侵权责任。
第二种情形相对复杂。在没有过错的前提下,用户只要在得知侵权情况后停止相关行为,即可不承担损害赔偿责任。这时,相关责任即转到了大模型提供者身上。但在责任承担问题上仍需区分知识产权请求权下的相关责任和损害赔偿责任两类不同的责任形态。关于第一类,停止侵害之类的禁止令在适用时无需考察行为人的主观心理状态,但必须是行为人经过努力能够达到的目标。第二类损害赔偿责任则需要判定大模型提供者是否存在过错。显然,这里涉及大模型提供者在开发人工智能系统时的注意程度问题。只要开发者尽到了应有的注意义务,就可以免除其赔偿责任,只是注意程度的高低需要由行业专家根据该行业技术发展状况加以确定。当然,模型提供者与使用者之间也可以通过协议约定相关责任分担问题,只是该协议必须符合公平、自愿等原则才能确保协议的有效性。
冯晓青:
从理论上说,人工智能生成内容涉及的著作权侵权等问题,既包括人工智能生成作品之类的内容被他人侵害,也包括人工智能生成内容侵害他人著作权或者其他民事权利。其中,前者反映的是人工智能生成内容所有者自身维权的问题,前述腾讯公司案、北京互联网法院的“李某与刘某侵害作品署名权和信息网络传播权纠纷案”就是如此。对这一问题的解决自然需要结合个案,认定涉案人工智能生成内容是否符合受著作权保护的作品的要件以及在符合该要件的前提下相应的作品著作权归属,进而判定被诉侵权行为是否成立。后者则是这里需要着重探讨的问题。对此,应当区分不同主体行为的性质,明确相关主体是否存在主观过错以及行为相应的后果。
具体而言,在涉及人工智能生成内容侵害他人著作权的案件中,用户承担侵害著作权的法律责任是值得首先考虑的重要对象,原因如下。第一,用户是人工智能生成内容的直接完成者。根据前面的探讨和现行司法实践的观点,在用户涉及个性化表达、对人工智能生成内容的独创性作出了实质性贡献的前提下,用户甚至可以被认定为作者,相应地享有涉案人工智能生成作品的著作权。根据权利与义务相一致的基本法理,用户也应承担其公开享有著作权的作品侵害他人著作权的风险。第二,由用户承担侵害他人著作权的责任,有利于敦促用户慎重公开和传播,特别是以自己作为作者身份公开和传播。当前总体上仍然属于弱人工智能时代,在生成式人工智能出现和推广后,用户尚且能够轻松地借助其生成作品,如果不将用户行使著作权和承担相应的侵权责任风险挂钩,就不利于严格控制用户随意通过人工智能生成作品并以作者身份公开和传播这类特殊作品,导致对现行自然人创作的市场造成冲击。
在涉及人工智能生成内容侵害他人著作权的问题上,大模型技术提供者是否需要承担相应的著作权侵权责任的问题也值得探讨。从原则上说,大模型技术提供者只是为生成人工智能内容提供技术基础,并不直接参与涉嫌侵害他人著作权的行为。但是,毕竟用户是利用人工智能获得生成内容的,在认定相关侵权责任时也并非绝对不考虑模型技术提供者。《互联网信息服务深度合成管理规定》即对于互联网信息服务深度合成作了具体规定,违反这些规定将要承担相应的责任。
至于人工智能服务提供者,根据现有的人工智能服务与用户之间的格式合同,人工智能服务提供者通常会对用户利用其人工智能生成内容的权利归属和法律风险予以明确。如ChatGPT人工智能服务就是如此。对于服务提供者而言,这种做法或许首先考虑的是避免任何因为人工智能生成内容引发的法律风险。在这种情况下,即使出现人工智能生成内容侵害他人著作权的情况,也会由用户承担侵权责任。
当然,从一般意义上说,人工智能生成内容涉及的侵害他人权益,并不完全限于侵害著作权,也可能侵害其他民事权利。这一问题需要进一步研究。
张平:
面对生成式人工智能的新技术挑战,具体到侵权责任制度,应更重视预防损害的作用,而不是一味强调制裁从而抑制企业的创新动力。当出现AIGC侵权情况时,可能会存在多种可能,可能是用户输入了侵权内容导致生成内容侵权,也有可能是AIGC服务提供者在训练数据环节输入了侵权内容从而导致生成内容侵权。因此,就AIGC侵权问题而言,应当分阶段、分环节、分主体进行讨论。
一是训练数据环节,对服务提供者的侵权责任认定。
按照《生成式人工智能管理暂行办法》,生成式人工智能服务提供者应当保证训练数据的合法、真实、准确、客观,但实践中确实很难达到这一要求,只能是尽可能做到基本的注意义务,根据《民法典》《网络安全法》《数据安全法》《个人信息保护法》以及相关的知识产权法的规定并依照责任原则承担事后的补偿责任。
二是使用环节,对用户的侵权责任认定。根据用户和服务提供者之间的协议,目前全球范围内大多数AIGC服务提供者通常会将生成内容(Output)的权利转移给用户,继而由用户承担责任,这符合权利、责任和利益相一致的原则。然而,鉴于生成式人工智能存在“算法黑箱”及其算法模型的复杂性,普通用户缺乏对生成内容的预期,并难以理解其运作逻辑,实践中往往会产生如郭禾教授所谈到的更为复杂的第二种情况。在这种情况下,让用户承担全部责任并不公平。因此,在侵权事件发生时,需考虑用户是否“故意”、服务提供者是否存在“引诱侵权”以及服务提供者是否采取相关技术措施来识别侵权内容等诸多因素。此外,服务商和用户之间的免责协议并不能对抗第三方,服务商还是可能要承担共同侵权责任。
三是服务提供者的内容审查注意义务。
2020年,欧盟颁布了数字市场法(Digital Markets Act),首次确立了“数字守门人”制度。根据“数字守门人”理论,通用人工智能的提供者拥有信息生产和控制的重要职能,因此承担着数字内容的监督责任。这包括必须执行内容审查义务,主动发现和处理违法或侵权内容。人工智能开发商或者服务商作为一个网络平台的构建者、控制者以及受益者,有义务确保人工智能服务平台安全和合法合规地运行。服务提供者应对数据集进行识别和审查。服务提供者可以利用一些技术措施来识别训练数据和用户生成内容中是否有违法信息。
在内容生产不断迭代和完善的背景下,数据输出阶段的提供者应建立投诉和举报机制,以对用户报告的涉嫌侵权的有害内容进行检查。若确认内容确实侵犯了版权,提供者就有责任采取必要措施,如移除该内容并停止其生成,以避免侵权行为的再次发生。
熊琦:
在人工智能生成内容满足作品构成要件的前提下,认定是否构成侵权以及由谁承担侵权责任,首先需要确定人工智能生成内容的权利归属。与自然人创作作品不同,从内容生成的来源看,人工智能生成内容包括了人工智能软件的设计者和使用者两个渠道。
人工智能的设计者通过人工智能的核心代码、训练数据来源和偏好来影响未来所生成内容的风格,使用者则是通过输入提示词来调整所生成的内容。判断究竟由谁享有著作权,仍然要回归独创性来源的判断。使用者的提示行为,本质上就是对人工智能设计者主导的软件提出要求。尽管人工智能的使用者通过输入提示语来调整内容生成的方向,但由于提示语过于抽象且生成结果不可预测,使用者的提示更接近于建议,类似于雇用他人为自己创作,所以使用者不应被视为作者。从人工智能设计者的角度看,人工智能并非如自然人一般去理解语言或图形的含义,而是通过对海量数据的学习来发现其中的规律,并以此生成内容。其中探寻规律和范式的方法,依赖于设计者如何选择数据样本以及如何标注算法反馈结果,所以把设计者视为作者是现阶段更符合智力贡献来源的判断。在此基础上,法院可以类推适用委托作品规则来处理。在无委托合同约定的情况下,著作权应由决定人工智能核心代码、训练数据来源和发展偏好的设计者享有。
另需注意的是,由于生成式人工智能技术尚在发展完善中,通过提示所获得的内容可能与他人作品存在实质性相似的问题。为了避免此类著作权风险,提供生成式人工智能服务的平台往往通过“最终用户服务协议”来约定著作权的归属,如ChatGPT和Midjourney两款人工智能都对使用者所生成内容的著作权归属作了明确约定。Midjourney的协议区分了付费与非付费用户。针对付费用户,Midjourney在格式条款中规定所生成内容的所有权利归使用者享有。针对免费用户,Midjourney则规定使用者不享有所生成内容的著作权,但Midjourney会通过“知识共享许可协议”(creative commons license)以非商业使用为限允许使用者自由使用。ChatGPT虽然并未区分付费和免费用户,但同样将所生成内容的所有权利让与使用者,同时声明所生成内容可能包含他人作品的风险以及用户输入类似提示可能生成同质化内容。这种将著作权让与使用者和限制商业性使用的合同条款,旨在帮助人工智能设计者规避内容生成过程中可能出现的侵权风险。
然而,即使存在上述详细的权利归属约定,也无法阻止法律争议的大规模爆发。实践中已有很多针对生成式人工智能设计者和平台的侵权纠纷。在大量已发生的案件中,人们最为关注的是前面张平教授提到的纽约时报诉OpenAI和微软案。原告纽约时报是版权产业最杰出的代表之一,也是“职业创造内容”的典范。被告OpenAI和微软则是生成式人工智能的主流缔造者和实践者。原告纽约时报作为大量优质原创作品的著作权人,起诉被告OpenAI和微软在训练人工智能模型时大量使用了上述作品,侵犯了原告的著作权。当然,这种大规模诉讼的出现,并不意味着生成式人工智能设计者或者平台一定存在侵权行为。只是每当新兴产业开拓新兴市场后,原市场中的权利人都会因既有市场遭遇冲击和萎缩而奋起捍卫自己的利益。从录音制品到互联网介入内容生成的时代,都一再证明了这种因果关系。但司法机构对相关案件的判决结果,却可能在很大程度上重塑新旧产业之间的关系,甚至左右新兴产业的发展。同理,以纽约时报诉OpenAI为代表的系列案件判决结果,将如同当年的决定录像设备前景的索尼案和左右网络服务提供者命运的Napster案一样,为人工智能产业的发展带来决定性的影响。因此,无论是在输入端未经许可利用作品训练人工智能模型构成侵权还是合理使用,还是在输出端生成的内容是否具有可版权性的认定,都会对尚未真正获得盈利能力的人工智能产业发展态势带来重大改变。
张吉豫:
人工智能生成内容侵犯他人著作权的情况,需要在相关主体之间进行合理的责任划分,促进最有效率的风险预防机制的实现,并给予相应主体比较明确和稳定的预期。生成式人工智能服务提供者应当根据我国《生成式人工智能服务管理暂行办法》,建立健全投诉、举报机制,接受公众监督,并在发现违法内容或者发现用户从事违法活动时,依法采取相应措施。对于侵犯著作权的民事责任而言,可基于损害可能的范围和主要因果关系,区分生成内容对他人著作权侵害的不同阶段或形式来讨论责任。
对于生成式人工智能服务向使用者提供侵权内容的情况,服务提供者一般应当承担停止侵害的责任。对于损害赔偿,则应以过错责任为主,考虑提供者和使用者是否具有过错。对基于使用者的提示词生成侵权内容的生成式人工智能提供者而言,可以参考《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》中对于网络服务提供者的过错认定规则,考虑人工智能系统的性质、损害发生时该领域的技术发展水平、可以采取的必要措施及其成本和效果、系统使用规模等因素综合确定。当提供者能够证明自己已经采取了符合损害发生时技术水平的必要措施来预防损害,但仍无法防止损害的发生,则应认定其不具有过错。使用者也应当注意遵守法律,尊重他人的合法权益,正确使用人工智能系统,不得故意诱导。如果使用者的行为导致侵权内容的生成,并具有过错,则应承担侵权责任。
对于使用者将侵权内容向外传播的情况,使用者应承担直接的侵权责任,传播平台则按照“通知—删除”规则,在满足相关条件时可免除损害赔偿责任;但若明知或应知侵权行为的发生却未采取必要措施,则构成共同侵权。具体情况需结合个案进行判断。
[责任编辑 荣圆梦]