张惠彬 王怀宾
【摘要】以ChatGPT为代表的生成式人工智能(AIGC)的出现,引发了人工智能技术和版权保护之间的紧张关系。在模型训练端,AIGC大规模使用作品,传统版权许可制度失灵;在内容生成端,AIGC的创作自主性提升,其生成内容的“作品”性质和权利归属不明。为规范AIGC技术发展,法国国会提出法案,要求AIGC模型训练一律须取得版权许可,并增设版税制度;将AIGC生成内容的版权归属于原始作品的版权人,并设立标识义务。该法案采取强版权保护和弱技术激励的思路,是法国本土人工智能产业和文化产业实力对比下的无奈之举,对AIGC技术发展有一定的负面影响。当前我国正处于提升人工智能技术国际竞争力的关键阶段,走版权保护和技术发展的平衡道路更具现实可行性。对于AIGC的模型训练,可以采用“法定许可+著作权集体管理”的作品利用方式;对于AIGC的生成内容,在满足“人类最低独创性贡献标准+AIGC生成内容标识义务”后,可将其视为作品进行保护,并将版权归属于AIGC的使用者。
【关键词】AIGC 版权风险 法国版权制度 数字宪法主义
【中图分类号】G230 【文献标识码】A 【文章编号】1003-6687(2024)5-103-10
【DOI】 10.13786/j.cnki.cn14-1066/g2.2024.5.014
以ChatGPT为代表的生成式人工智能(Artificial Intelligence Generated Content,以下简称AIGC)的出现,引发了人工智能技术和版权保护之间的紧张关系。在数据层,AIGC模型训练的数据主要是文字、图像、音乐、代码等作品,通过大量作品进行深度学习,构建符合人类表达风格的模型参数;在应用层,AIGC的主要目的是生成与人类创作无异的“作品”,成为一种商业性创作工具进入千家万户。在版权法语境下,AIGC可以被描述为通过大规模阅读受版权法保护的作品或者不构成作品的数据等其他材料,形成的反映创作风格的模型,其在使用者的提示下,可以自动生成风格相似的“作品”。可以说,AIGC的出现,使我们进入了机器读者和机器作者的时代。相应地,AIGC带来的版权问题也包括了机器阅读的版权问题和机器创作的版权问题两个方面。
由于AIGC在进行机器阅读时需要大规模复制作品,这引发了人们对大规模侵犯版权的担忧。2023年12月27日,《纽约时报》以侵犯版权为由起诉OpenAI和微软公司,这是主要新闻机构首次以侵犯版权为由起诉ChatGPT的开发商。虽然到目前为止,案件仍未判决,但可以预见,如果《纽约时报》胜诉,那么它将在有史以来最大的知识产权侵权判决中胜诉,从而促使AIGC服务提供者重新构建数据训练机制。而如果OpenAI和微软胜诉,他们将继续大规模利用《纽约时报》等传统媒体数据,为传统新闻业的生存带来新的不利影响。在我国,AIGC生成内容是否构成作品也同样引发了争议。2023年11月,北京互联网法院在“AI文生图第一案”中,将AIGC生成内容认定为作品,将著作权归属于使用者,引发了广泛关注和多方热议。
随着AIGC与版权保护的争议在全球愈演愈烈,法国执政党——复兴党于2023年9月12日提出第1630号法案(以下简称法案),提议修改《法国知识产权法典》。该法案有四个亮点。一是强制性的版权许可。AIGC服务提供者将受版权法保护的作品用于大模型训练,须取得版权人许可。二是AIGC自动生成内容的版权权属分配。法案主张应归属于原始作品的版权人。三是AIGC生成内容的强制标注义务。四是基于公共利益的版税制度。通过分析该法案,我们可以窥探版权保护和人工智能发展冲突背后的理论和政策分歧,为我国提供经验和借鉴。
一、版权法视野下AIGC的新特征与新争议
AIGC与人脸识别、自动驾驶等决策式人工智能,以及腾讯的Dreamwriter等早期自动化新闻写作软件相比,具有新的特征。AIGC以内容生成为目的,以构筑商业模式为导向,其生成的内容独创性较低。这些新特征引发了新的版权争议。在模型训练阶段,未经许可获取、利用作品可能违反版权法,而针对决策式人工智能和科研目的的“文本与数据挖掘”合理使用制度则存在适用困境。在生成内容阶段,AIGC生成内容的自主性更强,难以定位人类作者,是否承认其生成内容为作品,以及如何分配版权存在争议。
1. 版权法视野下AIGC的新特征
(1)AIGC以内容表达为目的。从利用作品开展模型训练的过程来看,AIGC的内容表达目的超越了以科研为目的的文本与数据挖掘人工智能,对其进行合理使用辩护更加困难。欧盟《数字化单一市场版权指令》第2条将文本与数据挖掘人工智能定义为“旨在分析数字形式的文本和数据以生成包括但不限于模式、趋势和相关性等信息的任何自动化分析技术”,因此文本与数据挖掘人工智能虽然复制作品但通常不对外传播。而AIGC不仅复制作品,而且对外输出(传播)作品,如果输出内容与原作品类似,很可能引发侵权诉讼。在美国发生的针对AIGC的集体诉讼中,原告普遍认为AIGC模型训练侵犯了作者的版权,而技术公司则以合理使用制度进行辩护。[1]马克·莱姆利认为,AIGC与传统决策式人工智能存在很大差别,这种差别很可能导致美国法院不再豁免技术公司的版权侵权责任。[2]从生成内容来看,AIGC的内容表达与人类表达在外观上无法区分,将会影响版权法对作品的定义和权属的判断。与决策式人工智能相比,AIGC能够生成内容;与Dreamwriter等传统写作软件相比,AIGC创作自主性更强,人类对AIGC自主生成“作品”的独创性贡献趋近于无。因此AIGC自动生成的“作品”可能并不存在人类作者。
(2)AIGC以构筑商业模式为导向。AIGC的商业模式导向表现为利用他人作品获取私人商业利益,不仅如此,其还抢占人类作者的创作市场。决策式人工智能主要打造决策辅助者,帮助企业或个人作出决策,AIGC则培养机器作者和机器艺术家,帮助使用者进行內容创作。前者通常不构成与数据提供者的竞争,相反还会帮助其提高决策效率,如算法推荐技术;后者则可能对用于训练的作品的提供者(内容创作者)造成冲击,特别是在集中使用某一作者作品的情况下,由于生成内容与原作者的作品风格类似,AIGC可能与原作者构成竞争关系。AIGC的商业模式既包括以会费形式向消费者提供机器作者、机器艺术家、聊天机器人等服务,也包括以流量计费的方式帮助软件开发者开发新产品。以Open AI为例,其GPT-3.5模型可免费使用,而GPT-4模型则需要每月支付20美元,同时,Open AI还为软件开发者提供了付费的API接口,从而将ChatGPT集成在其他软件产品中。①除了提供付费服务以外,Open AI还将ChatGPT嵌入Office相关产品和搜索引擎,提供翻译、问答、阅读等服务,旨在进一步吸引用户,强化产品黏性。有学者认为,这一商业模式所带来的巨大利益既是驱动AIGC发展的动力之一,也是“权利-义务统一”中的权利(利益)。[3]就AIGC生成内容而言,在“权利-义务统一”的观念下,上述商业模式可能影响对AIGC生成内容的版权保护;就AIGC的模型训练而言,过去基于科研目的的“文本与数据挖掘”合理使用的说服力将显著降低。
(3)AIGC输出内容的独创性较低。从创意生产角度看,AIGC输出内容的独创性较人类创作仍具有差距,表现为输出知识的平庸性和“惯性”。一方面,在逻辑推理和因果分析领域,AIGC并未随着大模型技术的运用取得明显突破,其反映的是大数据之间的相关性,而无法认识背后的机理,也不能理解人类社会的价值观。[4]另一方面,AIGC为了更好地模仿人类作者,既要学习作品也要学习人类的表达规律和表达习惯,这就要求模型训练的结构趋近于主流的表达方式,小概率和边缘性的表达方式将被忽略。因此,有学者将ChatGPT定位为“智能搜索引擎+智能文本分析器+智能洗稿器”,主张AIGC只是采用了转换表达方式对互联网数据重新进行了表达,并没有提出与已有观点不同的新观点。[5]也有学者基于哲学分析,认为ChatGPT的文学艺术作品虽然技术精良,但其艺术品质是平庸的。因为人工智能的本质是逻辑和数学,而文学艺术创作有着逻辑和数学无法表达的品质。[6]知识的平庸性可能会影响立法者、司法者对AIGC输入和输出之间差异的判断,进而影响对输出内容的侵权判断,从而影响对AIGC生成“作品”的独创性判断。
2. AIGC模型训练和内容生成的版权争议
(1)AIGC模型训练的版权许可或合理使用。AIGC模型训练过程包括作品获取、存储和分析三个环节。在获取环节,AIGC可能避开技术保护措施。技术保护措施是版权人在数字环境下维护自身利益的技术手段,可以防止他人未经许可接触、复制或传播作品,旨在要求使用者为使用作品付费。我国《著作权法》第49条规定,未经版权人许可,不得故意避开或破坏技术措施,对作品进行浏览、欣赏和传播。在存储环节,AIGC为训练模型需要对作品进行复制,可能侵犯复制权。在分析环节,AIGC需要对作品数据进行拆解、标注、清洗,如果在此基础上产生了具有独创性的新作品,则落入改编权的保护范围。此外,如果AIGC生成“作品”构成对原作品的复制,但是故意删除或改变原作品的权利管理信息,则可能违反《著作权法》第51条关于权利管理信息的禁止性规定。权利管理信息是指在作品复制品或者作品传播过程中,表明作者身份和作品使用条件的信息。
AIGC的模型训练在国内外引发多起诉讼,争议的焦点有三。一是AIGC的模型训练是否复制了版权人的作品。如果AIGC没有对作品进行复制,而是和人类一样在阅读过程中并不产生复制品,则不会侵犯复制权。但事实上,在没有“联邦学习”“云端计算”等技术的情况下,AIGC的模型训练通常复制并存储版权人的作品。对是否复制作品的争议反映为一种诉讼策略,也就是要求原告证明侵权事实的存在,否则将承担败诉风险。在美国的一起案件中,一名联邦法官以原告无法证明Midjourney等图像生成式AIGC是否包含侵权复制件为由,驳回了原告的诉讼请求。①二是AIGC的模型训练即使对作品进行了复制,那么该复制行为是否在版权法的容许范围之内。对于某一复制行为,既可能因为适用“避风港规则”所规定的“缓存自由”而豁免侵权责任,也可能因为被认定为对作品的合理使用而不构成侵权。前者引发了产学界关于是否赋予AIGC模型训练“复制自由”的讨论,后者则引发了在美国版权制度下该复制行为是否属于合理使用的争论。[7]三是AIGC模型训练阶段对作品的分析处理行为由何种权利加以规制。权利人认为AIGC生成的“作品”构成原作品的衍生作品,也就是对原作品打乱重组,形成新的作品,因此应该落入“改编权”范畴。一般来说,AIGC是通过对大量作品的学习,构建反映字词句、线条、色彩、色调等表达规律的参数模型,其在接受提示词后依据参数生成新的作品。技术公司通常主张AIGC模型训练只是借鉴了大量作品中蕴含的表达风格,而依据思想/表达二分法,风格属于思想范畴,不受版权法保护。AIGC模型训练的争论正围绕内容创作者主张的版权许可和技术公司主张的合理使用两种观点展开,并混杂着对获酬权、法定许可、选择-退出机制以及著作权集体管理等具体平衡措施的争议。
(2)AIGC生成内容的性质及其权利归属。AIGC生成内容的版权议题,是已有的人工智能生成物版权保护命题的延续,包括是否构成作品和权利归属两方面内容。与腾讯Dreamwriter等新闻写作软件相比,AIGC生成“作品”的版权保护问题引起了更加激烈的讨论。原因在于AIGC内容创作的自主性、实用性大幅提高。在ChatGPT等AIGC出现之前,深圳南山区法院在2020年审结的首例人工智能Dreamwriter生成“作品”纠纷案中,认为原告主创团队在数据输入、触发条件设定、模板和语料风格的取舍等方面的安排与选择,属于与涉案文章的特定表现形式之间具有直接联系的智力活动,构成了Dreamwriter生成作品的独创性贡献,因此判决相关文章构成了原告主持创作的法人作品。②由此可见,过去的主流观点仍将人工智能視为创作工具,人工智能本身无法自主创作,以人类创作规则进行作品认定和权属分配具有一定合理性。但是,AIGC较高的自主性使得人类主创团队以及使用者对生成的“作品”不再具有版权法意义上的独创性贡献。一方面,AIGC主要通过对大量作品进行无监督学习,形成反映作品创作风格、主题的系列参数模型,在此过程中,主创团队并未对被训练作品、模型参数进行有意义的安排和选择。另一方面,使用者的提示词只是用于引起AIGC对潜在创作风格的反馈,是人工智能生成的对应提示词风格的诸多表达中的一种具体表达,在没有后续创作行为的情况下,使用者的单纯提示行为难以称得上独创性贡献。①
对AIGC生成内容的版权法分析主要围绕“作品”独创性的来源和性质展开。首先,要判断AIGC生成“作品”的独创性贡献来源于人类创作者还是AIGC。对此,有学者认为AIGC模型训练过程中融入了设计者的主观偏好,其生成“作品”具有来自人类的独创性贡献,应当获得版权法保护。[8]北京互联网法院在“AI文生图第一案”中,也将AIGC使用者的提示词和持续调整行为视为独创性贡献。其次,如果“作品”的独创性贡献全部来自AIGC,则要判断其是否构成版权法上的作品。如果AIGC生成的独创性贡献全部来自AIGC,此时的争议是版权法如何看待来自非人类体的“独创性贡献”。对此,主要有两种观点。“独创性客观说”主张版权法并未限制独创性贡献的主体来源,只要客观上看“作品”具有最低限度的独创性,即可以受到版权保护,无论独创性贡献是来自人类创作者还是AIGC;[9]考虑到借由版权法奖励劳动、鼓励社会对话、激励科学和艺术的发展以及促进知识产权的功利目的,可以赋予AIGC生成内容以可版权性。[10]“作者自然人主义”则坚持人类—独创性贡献—作品的逻辑,主张只有人类作者才是作品独创性贡献的来源,如果没有人类对作品作出独创性贡献,AIGC自主生成内容不构成作品。[11]这两种针锋相对的观点实际上是“功利论”和“道义论”在版权法上的映射。前者在总体社会福祉增长的目的下,论证只要AIGC的生成内容在外观上有独创性并对公众有益,便应当对其进行保护;后者则以人的创作和机器创作的本质区别为前提,论证人的创作是自由意志的体现,而机器创作则是算法和规则的结果,两者不能混同。当对AIGC生成“作品”的独创性贡献作出判断之后,对权利的分配便水到渠成。在不考虑职务创作的情况下,谁作出了独创性贡献谁就应当享有版权。
二、法国版权法的改革趋向:强版权保护和弱技术激励
目前,在版权保护和AIGC技术发展之间,存在两个极端理念。一是强版权保护和弱技术激励下的AIGC模型训练的版权许可和AIGC生成内容的不可版权性;二是弱版权保护和强技术激励理念下的AIGC模型训练的合理使用和AIGC生成内容的可版权性。在作者权法传统和数字宪法主义技术政策下,法国选择了前者。一方面规定了AIGC模型训练的版权许可和版税制度,另一方面肯定了对AIGC生成内容进行版权保护,但是将版权归属于原始作品的版权人。
1. 法国法案的背景:作者权法传统和数字宪法主义
(1)作者权法传统下对浪漫主义作者观的坚持。根据不同的理论体系,可以将著作权制度分为作者权法体系和版权法体系。前者以德国、法国作者权法(著作权法)为代表,源自欧洲的理性主义哲学传统,主张作品是作者人格的体现。后者则以英国、美国版权法为代表,源自不列颠的经验主义哲学传统,在适应现代集体创作、雇佣创作、工业化进程中形成了实用主义的版权法理念。[12]在观念层面,作者权法体系坚持浪漫主义作者观,认为作品不仅是作者个性化思想的表达,而且是其内心世界的流露和人格的延伸。[13]而版权法体系在实用主义的影响下,综合考量法律的公共政策属性,强调版权法对产业发展和创作实践的适应力,如美国版权法采用法律拟制技术将雇主视为作者。在权利构造上,作者权法体系采用著作人格权和著作财产权二元构造,其中,著作人格权不得转让。之所以这样规定,是因为作者权法体系坚持浪漫主义作者观,认为作品是作者人格、意志和个性的反映,作者对作品当然享有不可转让和放弃的人格权。相较之下,版权法体系则采用著作财产权的一元构造。
法国著作权法制定于法国大革命时期,最初与英美法一样,均源自洛克财产法理论。在后续的发展中,法国著作权法理论受到基尔克、科勒尔等学者,以及爱德华·扬等作家、诗人的浪漫主义思想影响,逐渐转向作者权法体系。1957年法国作者权法将作者人格权写入其中。自此,充满浪漫色彩和人文情怀的法国作者权法体系引发大陆法系国家跟风,令大陆法学者骄傲、英美法学者羡慕。[14]一度有观点指出,在作者权法体系下,放弃精神权利无异于精神自杀。[15]由此可见,在浪漫主义作者观的影响下,法国著作权法必然遵循人本主义精神,以是否反映人的个性、意志和人格作为作品认定的基本要素。而AIGC缺乏这些要素,自然无法成为作者。这一浪漫主义作者观的作者权法传统,“把人类思想变成宇宙的唯一支柱”“把巨大的强力和力量归于人的智力”。[16]因此,唯有人类作者是作品的独创性来源,如果要对AIGC生成内容进行著作权保护,则需要从中找到人类创作者的独创性贡献,并将其归属于他。法案的解释性备忘录中强调:“必须按照以人为本的原则,切实保护进行创作和阐释的作者和艺术家。”
(2)数字宪法主义影响下对限制技术权力的坚持。目前,欧盟在数字技术领域的监管政策,由早期的数字自由主义转向数字宪法主义,主张以“数字宪法”对跨国数字技术公司进行严格监管,从而限制基于个人数据和算法技术所形成的私人平台的权力。[17]在网络技术刚刚兴起时,欧盟和美国将网络服务提供商视为中立的在线中介机构,奉行数字自由主义的监管政策,鼓励私营部门积极发展数字技术。随着网络服务提供商的逐渐壮大,其利用自身的数字技术优势和掌握的大量数据与信息,逐渐丰富了网络平台的功能。此时,网络服务提供商已不再是在线中介机构,而是成为个人数据信息的控制者和网络知识的生产与传播者。一方面,数据挖掘和算法推荐等数字技术的私人化,不断挑战欧美宪法对个人权利和隐私的保护;另一方面,算法技术赋予了跨国技术公司在数字环境中履行准公共职能的权力,规范私人关系的私人准则填补了宪法真空。[18]在此情况下,欧盟的监管政策逐渐转向数字宪法主义,试图在数字网络空间构建保护个人基本权利、防止私人权力滥用的“数字宪法”。然而,技术乐观主义和围绕互联网治理的自由叙事仍然具有很大影响,如美国便采取了与欧盟相反的数字监管政策。
作为数字宪法主义影响下的最新立法成果,欧盟的《人工智能法案》对人工智能技术公司进行强力监管,要求AIGC基础模型提供商開展模型训练、设计和开发时,必须遵守欧盟和成员国内的版权法。同时,提供商应公布模型训练所使用作品的详细使用摘要。这一关于模型训练的版权透明度条款,似乎是为落实《欧盟数字化单一市场版权指令》所做的铺垫。该指令虽然允许基于科研目的的文本与数据挖掘,但对于商业目的的文本与数据挖掘则规定了著作权人“选择-退出”机制。总之,法国法案是对欧洲盛行的数字宪法主义思想的延续,法案的解释性备忘录渲染了AIGC不受控制地发展对欧盟《基本权利宪章》所规定的基本权利(表达自由、信息自由、艺术和科学自由)的威胁,宣称其不仅是“未来创作的灾难”“对自由意志的质疑”,还会导致“法国文化产业更加脆弱”。①
2. 法国法案的内容:强版权保护和弱技术激励
法国的作者权法传统与欧盟数字宪法主义的结合,造就了法国以人为本、限制私权力的著作权法发展理念,遵循强版权保护和弱技术激励的思路。基于上述背景,法案以法国《知识产权法典》的“作品条款”和“精神权利条款”为指引,以尊重版权、鼓励创作和维护道德、伦理为基本原则,提出保护人类作者和反技术倾向的著作权法条款。法案包括解释性备忘录和四个正式条款,分别涉及AIGC模型训练和AIGC内容生成四个关键问题。
(1)AIGC模型训练:版权许可和版税制度。针对AIGC的模型训练,法案从版权许可和版税制度两个方面全方位保护被训练作品的版权。首先,法案第一条规定:“人工智能软件在其系统中集成受版权保护的作品,以及对这些作品的利用,均须遵守本法的一般规定,因此须经作者或权利人授权。”该条款涵盖的作品利用行为包括将作品集成到人工智能系统,以及对作品的后续利用,前者是对作品的复制和存储,后者是对作品的改编、汇编等。其次,法案第四条规定了针对AIGC技术公司的版税制度,包括以下内容:第一,征收版税主要针对AIGC模型训练中利用无法确定权利人的作品这一行为;第二,征收版税的对象是AIGC的运营者;第三,征收版税的税率和基础由法国最高行政法院确定;第四,版税由集体管理组织收取,不进行再分配,而是用于促进关乎公共利益的创作。
可以看出,法案针对能够确定权利人的“有名”作品和无法确定权利人的“无名”作品,采用了较为全面的立法思路:一方面以版权许可制度加強权利人对AIGC模型训练利用“有名”作品的控制;另一方面基于版税制度,以公共利益名义要求技术公司就“无名”作品的利用支付版税。技术公司利用“有名”作品,需寻求版权许可并支付使用费;利用“无名”作品,则只需要支付版税。法案将“无名”作品定义为“来源无法确定的作品”,但并未提供判断“无名”作品的具体标准。对于AIGC模型训练时,动辄百万的大规模利用作品的情况,该法案显著提高了技术公司的合规成本。当然,在欧盟《人工智能法案》的版权透明度条款下,法案新增加的合规成本仅限于权利人的甄别成本以及使用费、版税的支付成本。
(2)AIGC生成内容:版权归属与AIGC标识义务。针对AIGC的生成内容,法案明确了版权归属,同时规定了标识义务。首先,法案第二条规定:“当人工智能在没有人类直接干预的情况下创造作品时,唯一的权利人是使设计上述人工作品成为可能的作品的作者或受让人。”该法案虽然承认AIGC生成的内容属于作品,但却一反常态地将版权归属于原始作品的版权人。对于AIGC技术公司而言,其负面影响较否定AIGC生成内容的版权保护更甚,进一步增加了其技术合规成本。由于AIGC需通过对大批量作品进行机器学习形成具有表达风格的模型,其后依据提示词生成类似风格的作品。因此,很难将AIGC输出的内容与某一个版权人的作品对应起来。所谓“使设计上述人工作品成为可能的作品的作者或受让人”通常不是一个权利人,而是众多作品的权利人的集合。在当前的技术条件下,除非AIGC模型训练仅使用了同一著作权人的众多作品,或者其自主生成的“作品”与原始作品构成了实质性相似,否则确定AIGC自主生成内容所对应作品的权利人集合非常困难。此外,如果AIGC自主生成内容与某一作者的创作风格相似(通常是因为模型训练主要利用了该作者的大量作品),就将版权归属于原作者,这一做法与版权法不保护创作风格的原则相冲突。其次,法案第三条规定:“在作品由人工智能系统生成的情况下,必须说明‘作品由人工智能系统生成,并列出导致该作品产生的作者姓名。”该条款规定的标识义务分为两类。第一类“人工智能生成”的标识义务,已经逐渐成为业界共识。[19]该标识义务对于治理虚假新闻、避免学术造假以及深度伪造等具有重要意义。第二类“作出贡献的原始作品的作者姓名”的标识义务,则建立在法案第二条的著作权归属规则之上,目的在于承认原始作品作者的贡献,同时表明AIGC生成作品的著作权归属。
事实上,法国法案具有明显的浪漫主义作者情结和反技术理念,无论是AIGC模型训练阶段的版权许可,还是AIGC生成内容的权利归属,均建立在“作品的独创性贡献绝对且唯一来自于人类作者”的基础之上。法国法案将AIGC生成内容的权利归属于原始作品的作者,实际上是否定AIGC本身以及AIGC的设计者、运营者、使用者可能作出的独创性贡献。同时,也完全禁止了未经许可的模型训练行为。这在降低AIGC商业价值的同时,显著提高AIGC的合规成本。因此,法案对法国AIGC技术公司的进一步发展,造成了一定的不利影响。
三、法国法案的评述与启示
长期坚持作者权法传统和数字宪法主义技术政策的法国,在人工智能产业和技术发展方面显著落后于中美两国。在政策传统和产业衰退背景下,法国法案坚持强版权保护和弱技术激励的立法导向,欲复现欧盟布鲁塞尔效应。①基于促进我国人工智能产业繁荣发展的现实目的,过于严格保护版权会阻碍AIGC技术发展;而如果不保护版权,则可能导致内容创作的不可持续,最终还是会反噬技术和文化的持续发展。因此,我国需要在版权保护和AIGC技术发展之间取得平衡。
1. 法国法案的评述
(1)法国法案在技术和法律上难以实现。在作者权法传统和数字宪法主义的双重影响下,法国法案以极端保护原始作品和人类创作者的理念,在一定程度上走向了技术发展的对立面。法案一方面推崇人类作者是作品独创性“绝对、唯一”的源泉,另一方面又渲染AIGC技术对本土文化产业的威胁,导致版权保护与技术发展呈现冲突关系,可能造成的结果是内容创作和技术发展的双双失利。首先,从可实现性来看,法案所依赖的原始作品“可追溯性”很难实现。法案解释性备忘录指出,“所有规则都是通过可追溯性实现的”,特别是AIGC生成作品的版权归属和原始作者的标识义务,均需准确识别哪些原始作品对新作品的独创性做出了贡献。法案提供的识别标准——使人工智能作品成为可能的原始作品,在技术和法律上均难以实现。在技术上,AIGC的算法黑箱和大语言模型特征,使得原始作品输入和新作品输出很难对应起来。在法律上,有些原始作品尽管与新作品毫无关联,但可能提供了不受版权法保护的思想、知识与风格,这些原始作品同样是人工智能作品成为可能的重要支撑。其次,从技术发展来看,法案要求的模型训练的版权许可和“可追溯性”将显著提高AIGC的合规成本,给人工智能技术快速发展带来一定阻碍。AIGC技术被视为通用人工智能的雏形,可以预见其在基础科学研究、学术出版、医药研发、教育等多个领域的深刻影响。[20]一方面,面对AIGC模型训练动辄百万的大规模作品需求,技术公司事前一一取得版权许可的成本较高。即便可以通过著作权集体管理制度进行集中许可,但很多作品的许可权仍然掌握在大量分散的作者手中。另一方面,AIGC的模型效果高度依赖被训练作品的完整性和高质量。如果因为版权许可成本过高,使模型训练只能使用作品的一部分或者低质量数据,将导致AIGC有概率输出歧视性内容。[21]最后,从法律效用来看,法案不能实现其解释性备忘录中声称的“鼓励创新和促进艺术多样性”。尽管解释性备忘录以“确保人类作者从AIGC模型训练中获得公平公正的报酬”为理念,但具体规则却忽略了法定许可、著作权集体管理组织集中许可、延伸性集体管理等调和方案,一律要求授权许可。这种一刀切的“乌托邦式”方案不仅无法实现公平报酬,而且还会危及版权法促进文化繁荣的宗旨,例如基于科研目的、教育目的的作品使用,以及引用、戏仿或模仿等促进文艺繁荣的合理使用制度。[22]此外,AIGC作为全球技术发展潮流,将成为各国文学、艺术创作者不能忽视甚至争相利用的创作工具。尽管AIGC的创作内容品质平庸,但可以帮助内容创作者从简单、重复的低质量创作中解脱出来,集中精力思考高品质的艺术表达。正如相机的出现并未导致人类绘画技能的丧失,反而使得绘画和摄影各司其职。因此,绘画和摄影的关系正如人类创作和AIGC创作的关系,在AIGC创作时代必然到来的情况下,版权法需要考虑的是如何促进人类创作者和AIGC技术之间的合作关系,而非完全站在技术发展的对立面。
(2)法国法案是该国人工智能产业弱势状况下的应然之举。从产业发展来看,法国采用人本主义、反技术的版权法策略,实际上是其人工智能产业与文化產业实力存在明显差距这一状况下的应然之举。长期以来,法国乃至欧盟的数字宪法主义技术政策,对人工智能技术公司施加了过多义务,阻碍了自身人工智能产业的发展。经济合作与发展组织报告显示,2020年全球对人工智能的风险投资约为750亿美元,美国和中国的初创公司吸收了其中的80%,而欧盟仅占4%,法国只占欧盟的1/3。①2020年,美国获得100万美元以上融资的AI公司有2130家,相比之下,欧盟仅有890家。欧盟《通用数据保护条例》(GDPR)的前车之鉴表明,过高的合规标准将阻碍欧洲的初创公司和人工智能产业发展。[23]截至2023年7月,全球累计公布AIGC大模型268个,其中中国有130个,美国有114个,约占全球大语言模型数量的90%。②法国仅有Mistral AI等人工智能公司发布的寥寥几个大语言模型,且竞争力不强。在法国人工智能产业缺乏竞争力的情况下,外来技术公司自由和免费地利用其本土作品训练AIGC,并反过来抢占本土内容创作市场,必然会受到法国内容创作者和出版公司的强烈抵制。因此,通过法案,法国一方面寻求在AIGC发展进程中向外输出包含欧洲价值观的治理模式,另一方面希望借此打造本土AIGC产品的道德优势、安全品质,通过规则优势弥补技术短板。这一做法试图延续欧盟《通用数据保护条例》发布后的布鲁塞尔效应,也就是说,法国希望通过自身的市场力量倒逼其他国家接受自己的监管标准。[24]
2. 法国法案对我国的启示
我国《生成式人工智能服务管理暂行办法》提出:“国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。”该办法建立在我国AIGC技术快速发展的产业基础和知识产权法的公共政策属性之上,体现的是技术发展与版权保护的平衡之道,以期实现健康、可持续的技术发展和文化创作。
(1)版权保护和技术发展的平衡更适合我国现状。从我国知识产权制度的价值目标和功能来看,知识产权兼具私权属性和公共政策属性。[25]在理论层面,知识产权公共政策属性的客观基础,来源于知识产权客体——知识的公共性;在实践层面,知识产权依托国家予以强制保护,是国家根据现实发展状况和未来发展需要作出的制度安排。国家制定著作权法的政策目标是维持社会稳定、维护社会公正、促进社会发展,“知识产权制度是一个社会政策的工具”。[26]我国《著作权法》第1条明确该法的宗旨是“鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进社会主义文化和科学事业的发展与繁荣”,这是知识产权公共政策属性在著作权法领域的体现。同时,知识产权的私权属性表明,知识产权公共政策在追求社会效益的同时还要确保公平正义。如果版权法忽视作者对作品的智力劳动投入,随意扰乱知识生产领域的资源配置,最终将导致内容生产者失去物质激励和生存空间,从而无法实现文化繁荣发展的社会目标。知识产权公共政策的属性,要求政策制定主体充分考虑现实发展状况和未来发展需要,作出合乎实践的制度安排和选择。当前,人工智能技术已成为国际竞争的主要方向,我国相关产业虽发展迅速,但与美国仍有明显差距。AIGC的迅速发展,除得益于算法、算力的积累外,还需依赖丰富的互联网数据和大量内容创作者。强版权保护和弱技术激励会降低人工智能产业的国际竞争力;弱版权保护和强技术激励则会损害内容创作者的作品生产积极性。有研究表明,如果没有新的数据源或可持续的作品生产,AIGC将在2026年耗尽所有高质量数据,届时依赖庞大数据集的AIGC的发展将停滞不前。[27]因此,综合自身产业基础和知识产权公共政策目标,我国更适合采取版权保护和技术发展的平衡策略。
(2)构建版权保护和技术发展的平衡方案。要想实现版权保护与技术发展的平衡,需寻求兼顾内容创作者利益和技术发展效益的可行方案。在法国的实践中,法国音乐收藏协会等著作权集体管理组织依据欧盟《数字化单一市场版权指令》的“选择-退出”机制,决定退出生成式人工智能的模型训练,并宣称其动机在于“恢复创作者的专有权利,以便能够与生成式人工智能领域的主要参与者协商许可协议”。①相较于“选择-退出”机制,法定许可方式可以降低技术公司与创作者的谈判成本,提高模型训练所使用作品的覆盖面。因此,从兼顾版权保护与技术发展的角度考虑,对于AIGC模型训练所需的作品,可以采取“法定许可+著作权集体管理”的方式。技术公司按照作品使用情况向著作权集体管理组织支付版权许可费,获得作品利用的法定许可;著作权集体管理组织依据该作品使用情况向著作权人转付使用费;对于无法确定权利人的“无名”作品,可以参照上述法国的有关做法。如此,既可以降低技术公司获取版权许可的成本,也能够维护著作权人的权益。不过,这对著作权集体管理组织提出了更高的要求,其应进一步适应人工智能产业快速发展的现状,探索高效、合理地向著作权人分配版权使用费的路径。在此过程中,应充分利用区块链、智能合约等新型技术。[28]
对于AIGC生成内容,我国著作权法可以考虑将其纳入作品范畴进行保护,但需满足特定条件。一是AIGC生成内容需满足人类最低独创性贡献标准。我国《著作权法》第3条规定,作品是指“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,因此,判断AIGC生成内容是否构成作品的要件为“独创性”和“智力成果”。在实践中,对AIGC生成内容独创性贡献的判断,可交由司法机关进行。在北京互联网法院关于“AI文生图第一案”的判决中,法院认为原告(AIGC使用者)“设计人物的呈现方式、选择提示词、安排提示词顺序、设置相关参数、选定哪个图片符合预期”等行为属于自然人的智力投入,所生成的图片体现了原告的个性安排和审美选择,由此判断涉案图片满足作品“独创性”和“智力成果”要件。②换言之,如果AIGC的使用者对AIGC生成内容仅作出例如“生成一幅风景画”等简单指令,则没有达到最低独创性贡献标准,该“作品”不受版权法保护。二是AIGC生成内容需尽到标识义务。北京互联网法院在判决中肯定了原告“AI插画”的标识义务,认为其旨在满足诚实信用原则和公众知情权,该判决具有一定的现实意义。AIGC生成内容的标识义务既有利于在AICG生成和人类创作之间划清界限,避免AIGC批量生成作品扰乱版权生态系统,方便监管法规落实;又有利于公众对作品的进一步利用,鼓励更多的人使用最新的工具进行深度创作,促进文化繁荣和人工智能发展。在著作权归属上,我国《著作权法》第11条以著作权原始归属于作者为原则,以特定情形下归属于雇主或视听作品制作者等法人/非法人组织为例外,遵循谁作出独创性贡献谁就原始享有著作权的逻辑。这里说的特定情形,是指著作权法为方便作品使用和流通,在利益平衡的基础上,将著作权原始归属于非作者主体。因此,如果确定AIGC的使用者是作出独创性贡献的主体,那么在不存在需要设定特定情形的情况下,AIGC的使用者是原始的著作权人。[29]而根据意思自治原则,AIGC的运营者和使用者对著作权归属的约定,属于著作权转让的范畴。也就是说,在著作权归属上,AIGC生成作品的著作权归属于AIGC使用者,即作出独创性贡献的人类作者;AIGC的运营者和使用者之间通过“用户协议”等约定著作权归属于运营者的,按照著作权转让进行处理。
结语
当前,AIGC的发展正处于关键时刻。尽早明确AIGC的版权规则,有利于权利人和技术公司预见版权风险,促进相互合作,实现AIGC产业的健康发展。法国采用强版权保护和弱技术激励的理念应对AIGC版权风险,在技术和法律层面均难以实现。当然,法国的版税制度、AIGC标识义务,以及作品利用的“可追溯性”理念值得学习。我国具有在版权保护和技术发展之间取得平衡的现实条件和产业背景。在模型训练阶段,我国有很多“历史替代性方案”可供选择,不局限于版权许可或合理使用;在内容输出阶段,北京互联网法院对“AI文生图第一案”的司法判决反映了一定的实务精神,具有一定的现实意义。但是,平衡好内容产业和人工智能产业的共同发展显然并非易事,未来需要产学研各领域的专家学者,以及立法者和司法者集思广益、群策群力。
参考文献:
[1] Christopher J.Recent trends in generative artificial intelligence litigation in the united states[EB/OL].[2024-02-13].https://www.klgates.com/Recent-Trends-in-Generative-Artificial-Intelligence-Litigation-in-the-United-States-9-5-2023.
[2] Lemley M A, Casey B.Fair learning[J].Tex.L.Rev., 2020, 99(4): 743-785.
[3] 王迁. 再论人工智能生成的内容在著作权法中的定性[J]. 政法论坛,2023(4):16-33.
[4] 顾男飞. 生成式人工智能的智能涌现、风险规制与产业调控[J]. 荆楚法学,2023(3):70-83.
[5] 王迁. ChatGPT生成的内容受著作权法保护吗?[J]. 探索与争鸣,2023(3):17-20.
[6] 赵汀阳. GPT推进哲学问题了吗[J]. 探索与争鸣,2023(3):66-74,178.
[7] Bracha O.The Work of Copyright in the Age of Machine Production[DB/OL].[2024-02-13].https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4581738.
[8] 叢立先,李泳霖. 生成式AI的作品认定与版权归属——以ChatGPT的作品应用场景为例[J]. 山东大学学报(哲学社会科学版),2023(4):171-181.
[9] 谢琳,陈薇. 拟制作者规则下人工智能生成物的著作权困境解决[J]. 法律适用,2019(9):38-47.
[10] 庄诗岳,辛谏. 生成式智能出版:可版权性与著作权归属[J]. 编辑之友,2024(3):96-104.
[11] 王迁. 论人工智能生成的内容在著作权法中的定性[J]. 法律科学(西北政法大学学报),2017(5):148-155.
[12] 孙新强. 论作者权体系的崩溃与重建——以法律现代化为视角[J]. 清华法学,2014(2):130-145.
[13] 张耕. 论民间文学艺术版权主体制度之构建[J]. 中国法学,2008(3):55-64.
[14] Ginsburg·J.C.French copyright law: a comparative overview[J]. Journal of the Copyright Society of the USA, 1988(36): 269-285.
[15] Giocanti D. Moral Rights:Authors'Protection and Business Needs[J].J.Int'l L.& Econ., 1975(10): 627-644.
[16] E·博登海默. 法理学—法哲学及其方法[M]. 邓正来,姬敬武,译. 北京:华夏出版社,1987:69.
[17] De Gregorio G.Digital constitutionalism in Europe: Reframing rights and powers in the algorithmic society[M]. Cambridge:Cambridge University Press, 2022: 38.
[18] De Gregorio G, Radu R. Digital constitutionalism in the new era of Internet governance[J]. International Journal of Law and Information Technology, 2022, 30(1): 68-87.
[19] 刘晓春,夏杰. 人工智能标识义务的功能与实践[J]. 中国对外贸易,2023(11):51-53.
[20] 张凌寒. 生成式人工智能的法律定位与分层治理[J]. 现代法学,2023(4):126-141.
[21] 梁志文,李忠诚. 论算法创作[J]. 华东政法大学学报,2019(6):46-59.
[22] 冯晓青. 著作权法的民主文化目标及其作用机制研究[J]. 黑龙江社会科学,2011(5):144-147.
[23] 金玲. 全球首部人工智能立法:创新和规范之间的艰难平衡[J]. 人民论坛,2022(4):44-47.
[24] 梅傲. 數据跨境传输规则的新发展与中国因应[J]. 法商研究,2023(4):58-71.
[25] 吴汉东. 知识产权本质的多维度解读[J]. 中国法学,2006(5):97-106.
[26] 刘华. 知识产权制度的理性与绩效分析[M]. 北京:中国社会科学出版社,2004:46.
[27] Villalobos P,Sevilla J,Heim L,et al.Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning[DB/OL].[2024-02-13].https://arxiv.org/abs/2211.04325.
[28] 张惠彬,王怀宾. 著作权集体管理制度的反思与回应——信托视角下[J]. 中国编辑,2022(5):56-61.
[29] 徐小奔. 论人工智能生成内容的著作权法平等保护[J]. 中国法学,2024(1):166-185.
Copyright or Technology First: Trends and Implications of France's Response to AIGC's Copyright Risks
ZHANG Hui-bin, WANG Huai-bin(Institute of Intellectual Property, Southwest University of Political Science and Law, Chongqing 401120, China)
Abstract: AIGCs such as ChatGPT have triggered the tension between technology and copyright protection. On the model training side, AIGC uses works on a large scale, and the traditional copyright licensing system fails; on the content generation side, AIGC's creative autonomy increases, and the nature of "works" and the attribution of rights of its generated products are unclear. In order to regulate the development of AIGC, the French Parliament has proposed a bill that requires all AIGC model training to obtain copyright licenses and adds a royalty system; attributes the copyright of AIGC-generated works to the copyright holder of the original work and establishes a marking obligation. The bill is a helpless compromise concerning the opposing ways of strong copyright protection and weak technology incentives, which is due to the contrasting gap between the strengths of France's local AI industry and cultural industry. At present, China is in the stage of improving the international competitiveness of AI technology, and it is more realistic and feasible to take the balanced path of copyright protection and technology development. For the model training of AIGC, the utilization of works of "statutory license + collective management of copyright" can be adopted; for the content generated by AIGC, under the premise of meeting the "minimum standard of human originality contribution + the obligation of marking generated by AIGC", it can be protected as a work of art, and the copyright will be protected as a copyrighted work. For the content generated by AIGC, it can be protected as a work of art and the copyright can be attributed to the user of AIGC.
Keywords: AIGC; copyright risk; French copyright regime; digital constitutionalism