【摘 要】随着生成式人工智能作品使用需求的不断扩大,其与著作权制度的冲突日益加剧。鉴于生成式人工智能对人类作品使用的海量性和寄生性等特点,在其训练数据的同时,保障著作权人的获酬权是纾解著作权困局的关键。法定许可是保障著作权人获酬权实现的有效机制选择,因此,应明确生成式人工智能使用作品法定许可的主要规则,设置生成式人工智能使用作品法定许可的付酬标准,并通过公私协同参与的集体管理制度保障著作权人获得应有的报酬,从而为生成式人工智能技术的发展与作品保护提供良好的互动空间。
【关 键 词】生成式人工智能;著作权;法定许可;集体管理
【作者单位】张舒琳,湖南理工学院法学院;王健宇,湖南理工学院法学院。
【基金项目】湖南省社会科学成果评审委员会项目(XSP22YBC313);湖南省知识产权战略推进专项项目(2023F004K)。
【中图分类号】D923.4 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2024.20.014
2023年4月,中共中央政治局会议指出:“要重视通用人工智能发展,营造创新生态,重视防范风险。”在生成式人工智能技术繁荣发展的背后,其对作品使用的著作权合规问题日益凸显,产生了一系列针对生成式人工智能使用作品的著作权纠纷。如:盖蒂图片起诉Stability AI违规采集1200多万张图片,《纽约时报》诉Open AI在未获得许可及未付费的情况下大规模使用来自《纽约时报》的内容,我国北京互联网法院也开庭审理了四起画师起诉AI绘画软件开发运营者著作权侵权案件等。这些案件无一不反映出在现有的著作权制度框架内,著作权人利益在生成式人工智能技术面前难以得到有效保障,但若实行过度的著作权保护,又会对人工智能技术发展造成阻碍。如何在人工智能技术发展中纾解著作权保护困局,实现著作权保护与生成式人工智能技术发展的有效平衡,迫切需要予以深入研究。
一、生成式人工智能使用作品的著作权困局
1.财产主义著作权理念与知识共享需求相悖
生成式人工智能通过对智力成果的挖掘与分析,凭借其反应的快速性及生成内容的无限性为社会提供丰富的创作型人工智能产品。这一发展在潜移默化中影响着社会公众的著作权观念,使得传统财产主义的著作权保护理念逐渐转变为对知识共享的现实需求。
其一,知识共享成为生成式人工智能满足公共利益的现实需要。生成式人工智能技术的发展不仅促进了技术的创新,还对社会文化、价值观念产生了深刻影响。一方面,生成式人工智能为公众提供新的创作工具,借助新型的创作方式,公众能够快速且批量地生成满足不同领域所需的内容,显著提升创作效率。另一方面,作品中蕴含的作者自我思想表达、增进交往交流等方面的非经济价值[1],能被生成式人工智能充分挖掘并利用,从而为公众提供更为丰富的文化产品。
其二,生成式人工智能对知识共享的需求与传统著作权制度的财产主义理念相悖,压缩了公共利益的实现空间。财产主义理念将作品视为著作权人的私有财产,赋予著作权人在特定地域和时间范围内对作品的垄断权,以严格控制作品的使用来实现经济利益。然而,这一定程度上与生成式人工智能对知识共享的需求形成互斥。有观点提出,鉴于人工智能的学习和人类学习具有相似性,人类在学习过程中大脑内发生的生化固定和复制并不产生版税收益,因此人工智能训练数据理应免费。[2]因此,应当优先考虑科技发展和人类的共同福祉。
2.作品使用需求与著作权保护制度存在冲突
数据要素是保障生成式人工智能正常运行并生成优质内容的基础。受著作权保护的作品具有丰富的语言结构、创意性表达和思想内容,必然成为生成式人工智能训练数据的优质资源。回顾ChatGPT的迭代过程,从大模型的参数量由GPT-1的1.11亿拓展到GPT-4的万亿不难发现,生成式人工智能内容生成的表现与数据数量和质量呈现正相关。这种快速迭代表明,在生成式人工智能数据训练过程中,如何大量且合法获取享有著作权的高质量作品,是构建有效训练基数的关键。然而,我国现行著作权法下的授权许可制度、法定许可制度和合理使用制度都难以适应生成式人工智能的作品使用需求。
其一,授权许可制度对生成式人工智能而言,存在成本过高且难以实现的问题。授权许可是针对特定作品和使用者的个别许可,而生成式人工智能在作品使用上表现出价值低密度[3],在训练模型过程中需要挖掘获取海量数据。这种大规模作品数据使用刚需,与授权使用的高成本却低效率之间存在天然的冲突。
其二,现有法定许可的类型,诸如“编写出版教科书的法定许可”“制作录音制品的法定许可”等,与生成式人工智能的作品使用相去甚远,无法为生成式人工智能提供适法依据。同样,合理使用制度对著作权的限制虽然在生成式人工智能使用作品的侵权讨论中常被提出,但是仍需考虑我国合理使用在立法上的封闭性。而且,在合理使用适用时应遵循三步检验法的“递进累积关系”下[4],第一步即不存在符合生成式人工智能使用作品的数据训练行为特定情形,自然也无须考量其后两步的符合与否问题。
3.作品广泛无偿使用使著作权人权利边缘化
将受著作权保护的作品提供给生成式人工智能无偿使用,容易导致著作权人权利的边缘化。
其一,生成式人工智能技术运行层面存在黑箱问题。算法黑箱导致生成式人工智能运行过程缺乏透明度,作品自被生成式人工智能合法或非法复制伊始,著作权人的权利便逐渐进入失控状态。尤其是经过复杂的机器学习过程,作品内容的核心部分——思想、事实和语言结构[5]等被打散和重组,最终形成与原作品相差甚远的内容,从而使得著作权人难以主张和证明其权利。
其二,著作权人权利因制度供给的不足难以得到应有的救济,这可以从两个层面观察。一方面,近年来虽已出现生成式人工智能因使用作品引发的著作权纠纷,但从此类纠纷的数量较之于作品被海量使用之间的不对称来看,尚有大量著作权人并未主张自己的权利。这主要是由于著作权被侵犯无从发现,或者虽然发现,但著作权人碍于寻求救济在成本与收益上的不对称而望而却步。另一方面,虽然寻求救济在生成式人工智能技术运行层面存在黑箱问题,但在相关制度供给匮乏的情况下,侵权事实难以得到充分证明,或即使事实被证明也未必能得到应有补偿。正是在此背景下,2023年北京互联网法院作出的首例“AI文生图”著作权纠纷判决,引发了人们对生成式人工智能使用作品著作权保护的诸多质疑。即便作者在生成端增加了独创性部分,免费获取著作权是否有悖于公平公正原则仍有待考量。
二、生成式人工智能使用作品著作权困局的纾解机制
1.保障著作权人获酬权是纾解困局的关键所在
著作权困局的纾解是促进生成式人工智能技术顺利发展的内在要求。法律预期状态的长期不确定性势必会造成原创积极性的消减以及作品资源的匮乏,甚至产生“逆向淘汰”和“加剧排除”等反噬效应[6]。困局的纾解首先要充分认识人工智能使用作品著作权保障的正当性,进而抓住著作权人获酬权保障这一关键。著作权事实上是一种市场化的权利,其产生也是一个权利市场化的过程[7]。在生成式人工智能的技术场景下,技术开发主体大多是基于市场营利性目的的。即使是发展中的所谓社会公共利益,也主要是局限在科技发展对社会生产力进步这一意义上,并不能否定开发主体基于自利性的市场化目的。这也意味着作品在生成式人工智能技术中的市场化使用具有坚实的根基,这种市场化使用的根基必然要求对其使用作品提供应有的著作权保障,尤其是给予著作权人应有的补偿。
第一,人类创作具有生成式人工智能无法取代的社会价值。人类的实践历史已经表明,文学与艺术作品对社会具有特殊价值,人类作品能够记录和反映社会的变迁,批判现实并激发思考,在推动社会进步方面发挥重要作用。这种深层次的创新思维及其理性价值并非生成式人工智能通过整理和模仿等表层学习所能替代的。况且,如果缺乏海量且持续更新的人类作品作为支撑,生成式人工智能将很难生成具有一定质量和创新性的内容。适当的经济回报可以保障创作者在数字经济时代公平分享收益,从而激励其创作出更高质量的作品,进而为人工智能技术的持续发展提供源源不绝的优质数据资源,确保生成式人工智能的创新能力得以维持。
第二,生成式人工智能应当就其“寄生侵占”予以著作权人补偿。生成式人工智能之所以能够生成高质量的内容,是因为其在训练中利用了大量作品作为训练资源,这种利用本质上是对原有作品的“寄生”。一方面,生成式人工智能不是真正的内容创作者,其之所以能模仿人类文学和艺术表达,是因为其能通过海量作品和特定的算法分析人类的创作[8]。另一方面,生成式人工智能在形成这种泛化能力后,不可避免地会对人类原生作品及其市场产生替代。以古典风格创作“梦幻幻想风景”数字艺术家Greg Rutkowski为例,其作品风格在Stable Diffusion上超过9.3万次被提示使用 [9],此类“表达”相似且同质化的内容输出无疑会稀释人类创作的市场。
第三,获酬权是著作权人应当享有的劳动要素利益。《中共中央 国务院关于构建数据基础制度 更好发挥数据要素作用的意见》指出,要“着重保护数据要素各参与方的投入产出收益”。有观点提出,原始数据属于劳动对象范畴,原始数据提供者参与数据的劳动生产属于数据要素的劳动者[10]。生成式人工智能建立在对作品原始数据要素的深度解析之上,在此过程中,著作权人好比“劳动者”,间接参与人工智能平台对生成式人工智能的研发与内容产出服务,故应参与由此产生的收益分配。虽然单个作品在生成式人工智能中的价值密度较低,但也不应成为妨碍著作权人就作品聚合的集体价值进行权利主张的理由。借由获酬权让权利人参与要素分配获得补偿,能够激发人类作者持续创作的动力,保障高质量的数据来源,因此,需要探索实现获酬权的有效制度路径。
2.法定许可是著作权人获酬权实现的机制选择
法定许可模式与生成式人工智能使用作品中著作权人获酬权的实现高度适配,其核心在于在特定条件下允许使用者不经著作权人许可而使用作品,但必须向著作权人支付报酬。
一方面,法定许可通过免除逐一授权的烦琐程序,使得作品能够更为高效地被使用者合法利用。另一方面,著作权人可以根据法律规定的标准和程序获得合理的报酬,而不必担心因协商的缺失而无法保障经济利益。尽管法定许可的实施在某些情况下被质疑能否有效实现著作权人的获酬,但这一问题可以通过与集体管理组织的合作得到解决。目前,我国著作权法针对存在大批量作品使用需求的情形制定了法定许可制度,并配套著作权集体管理、报酬支付等方面的相关规定,以确保该制度的有效运行。虽然这一制度尚未涉及生成式人工智能使用作品的情形,但至少能够为其作品使用提供制度基础。
以上说明,完善我国法定许可制度,是解决生成式人工智能作品使用的有效路径。但在法定许可模式下,生成式人工智能使用作品获酬权的实现亦有其自身的特殊性,需要相应的规则设置、付酬标准和实施保障。
三、生成式人工智能使用作品法定许可的制度构建
1.生成式人工智能使用作品法定许可的规则设置
生成式人工智能使用作品的法定许可,应明确付酬义务主体和行为模式。
其一,付酬义务主体的确定。首先需要明确生成式人工智能服务提供过程涉及哪些主体,然后根据其行为内容划定付酬责任。目前,生成式人工智能形态可分为“基础模型—专业模型—服务应用”三个层次[11]。实践中生成式人工智能的技术调用模式十分复杂,主要呈现三种服务形态:一是技术开发与服务提供为一体的服务平台;二是接入他人提供技术的预训练大模型后,经过自己训练向特定市场提供的服务平台;三是直接调用他人大模型而不进行自主性训练的服务平台[12]。以上三种形态并不是非此即彼,而是有可能服务提供者在模型层训练数据的同时,也在应用层提供服务。
从行为内容来看,“基础模型层”通过对大量作品的学习和处理,生成具备广泛适应能力的通用模型,为下游应用提供支持;“专业模型层”则是在“基础模型层”的基础上,进一步对特定领域的作品进行训练与优化,以提升模型在特定领域的表现能力;“服务应用层”不直接涉及作品的训练或加工,而是基于已完成训练的模型,通过API接口为用户提供生成文本、图像等内容的服务。相比之下,“基础模型层”和“专业模型层”作为数据训练方,在技术运行中对数据来源和运用具有控制力,理应对其训练数据中的作品使用承担相应的付酬义务。而“服务应用层”则不同,其行为限于调用已有的技术能力来满足用户需求,且已有前端主体承担付酬义务,无须再为训练阶段的作品使用支付报酬。不过,“服务应用层”对内容的输出也有一定的管控能力,应对其提供服务依赖大模型的著作权来源合法性,以及输出内容的合法性承担一定的注意义务。
其二,应明确法定许可对专有权利的限制范围。在生成式人工智能运行过程中,输入端和输出端都可能发生作品使用行为。在输入端,作品被作为机器学习的数据来源使用,在进行分析和处理后,最终在输出端呈现的结果通常有两种。一种是“非表达性使用”,即生成完全不同于原作品的全新、独立的表达;另一种是“表达性使用”,即生成内容中含有与原作品实质性相似的表达。根据相似之处的状态,此种情形又可以进一步细分:一是相似之处存在原作品的独创性表达;二是相似之处为公有领域的内容。
不同的情形应予以区分对待。如果输出端的生成结果为“非表达性使用”,以及虽为“表达性使用”但相似之处为公有领域内容,则意味着输出端并未再现受著作权保护的表达,说明内容的输出不侵权。然而,输入端的作品使用仍需评价单独。原因在于,生成式人工智能的作品使用是以内容生成为目的,是一种对人类创造力的技术性依赖,其效应不仅体现在提升机器生成内容的质量和效率,还会冲击人类作品的市场空间,只不过这两种情形与“表达性使用”中对特定作品市场利益的直接侵害相比具有间接性。鉴于这种差别,可将“非表达性使用”以及虽为“表达性使用”,但相似之处为公有领域内容此两种情形纳入法定许可,设置一种介于合理使用与单独许可之间的著作权保护力度。但如果构成“表达性使用”且实质性相似之处为受著作权保护的部分,则无异于直接提供作品,仍需获得权利人的单独许可(见图1)。
2.生成式人工智能法定许可使用作品的付酬标准
目前,我国对法定许可使用的付酬标准采用“法律规定为主、当事人协商为辅”的模式。虽然协商确定法定许可情形下的付酬标准有利于著作权人获得预期收益,但谈判成本的增高会降低法定许可制度的实施效率。加之我国尚未制定在法定许可使用费不一致时的裁决或救济程序,可能导致权利人在不满对方提出的报酬时拒绝法定许可的实行。尤其在生成式人工智能对作品的大规模使用需求下,协商确定费用的弊端愈发明显。因此,建议在立法层面事先确定法定许可使用的付酬标准,以提高制度的效率和可操作性。
生成式人工智能法定许可使用获酬标准的设置应做到参与主体多元和考量因素多元。一是参与主体多元意味着应吸纳和考量广泛的利益相关者诉求,如权利人代表、人工智能平台、集体管理组织、主管部门等多方主体,共同参与付酬标准的制定,以保证付酬标准制定的客观性、科学性。二是确保费率考量因素的多元化。合理的定价应当以促进高效的资源分配为目标,在金额上体现出法定许可使用优于市场协商,这样才能使法定许可使用制度充分体现其效率和功能[13]。
实际上,采用法定许可制度的批判者主要是担忧海量作品使用所需支付的费用会给人工智能企业的发展增加过重的负担,尤其是一些经济实力弱小的企业将难以发展。此种担忧应当在制度设定中予以充分考虑,可以大模型服务营收情况为基数,设置一个合理比例作为费率标准,具体考虑使用的目的、作品的质量、使用次数和贡献率等因素。这不仅能确保权利人获得公正的报酬,还能在一定程度上减少非营利性或实力较弱小主体的研发压力。
3.以公私协同参与的集体管理保障获酬权的实现
付酬标准确定后,还须进一步明确由谁来保障著作权人获酬权的实现。若是由著作权人自行收取报酬,现实操作的可行性低、执行成本高,因而需要有专门的组织将法定许可使用费予以落实。目前,我国法定许可使用费的征收和分配职能主要由著作权集体管理组织承担,而我国著作权集体管理组织的设立必须经过著作权行政管理部门批准,且同一业务范围内只允许一家集体管理组织的存在。法定垄断的著作权集体管理制度一定程度上限制了作品的管理范围,与智能时代的市场灵活性和作品需求的海量性存在一定的冲突,为此,可以构建公私协同参与的集体管理制度。
其一,打破著作权集体管理的身份垄断,有针对性地根据生成式人工智能作品使用获酬权的实现下放集体管理职能。目前,出于传统集体管理制度的弊端以及集体管理的非强制性,国内五家著作权集体管理组织管理的作品数量和覆盖范围存在一定的局限性。事实上,一些大型的互联网平台汇聚了更为全面的著作权资源,如腾讯音乐的著作权曲库占到中国市场总曲库的90%[14],已在实质上代行作品集体管理职能。这种发挥着著作权集体管理组织功能的民间组织被称为“类著作权集体管理组织”[15]。从生成式人工智能对作品的海量使用、保证获酬权顺利实现等诸多因素考量,可以在保持现有著作权集体管理组织不变的情况下,发挥类著作权集体管理组织在获酬权实现上的补充作用,由此凝聚公私合力,拓宽获酬权实现的保障路径。
其二,设立著作权集体管理联盟,聚焦人工智能领域事务。联盟可以包含各类著作权集体管理组织和著作权登记交易平台,就人工智能开源数据库建立、API标准统一、许可协议范本等开展常态座谈、议事等,以提高治理效能,保障获酬权落到实处。
四、结语
相较于以往的信息碎片化利用模式,以ChatGPT为代表的生成式人工智能不仅显著降低了创作门槛,还深刻改变了知识生产与传播的方式。在这一技术变革的浪潮中,著作权人所面临的隐形代价不容忽视。如何避免其权益被边缘化,成为亟待解决的问题。通过法定许可制度赋予著作权人获酬权,科学设定付酬标准,以集体管理制度为保障路径,不仅能为生成式人工智能的作品使用提供著作权法依据,也为构建公平、可持续的人机创新生态提供了可能。
|参考文献|
[1]孟磊. 智能时代的著作权集体管理:挑战、反思与重构[J]. 出版发行研究,2020(1):46-49.
[2]OPDERBECK D W. Copyright in AI Training Data:A Human-Centered Approach[J]. Oklahoma Law Review,2024(4):951-1023.
[3]王文敏. 人工智能对著作权限制与例外规则的挑战与应对[J]. 法律适用,2022(11):152-162.
[4]熊琦. 著作权合理使用司法认定标准释疑[J].法学,2018(1):182-192.
[5]LEMLEY M A,BRYAN CASEY. Fair Learning[J].Texas Law Review,2020(4):743-785.
[6]陆宇峰. 信息社会中的技术反噬效应及其法治挑战:基于四起网络舆情事件的观察[J]. 环球法律评论,2019(3):54-68.
[7]杨绪东. 作品数据化使用的赋权规制[J]. 山东科技大学学报(社会科学版),2022(3):33-40.
[8]MARTIN SENFTLEBEN.Generative AI and Author Remuneration[J]. IIC-International Review of Intellectual Property and Competition Law,2023(10):1535-1560.
[9]ALHADEFF J,CUENE C,DEL REAL M. Limits of Algorithmic Fair Use[J]. Washington Journal of Law,Technology&Arts,2024(1):1-53.
[10]王延川,吕君枝. 原始数据提供者参与数据要素收益分配的理论逻辑与实践路径:以共同富裕为视角的考察[J]. 陕西师范大学学报(哲学社会科学版),2023(3):82-93.
[11]张凌寒. 生成式人工智能的法律定位与分层治理[J]. 现代法学,2023(4):126-141.
[12]徐小奔,薛少雄. 生成式人工智能服务提供者版权注意义务的法律构造[J]. 科技与出版,2024(7):48-58.
[13]孙山,张雯雯. 生成式人工智能预训练中权利限制制度的选择与建构[J]. 科技与出版,2024(7):6-15.
[14]音乐行业反垄断调查背后:被忽视的词曲版权垄断之害[EB/OL].(2019-09-24)[2024-07-20].https://www.36kr.com/p/1724410642433.
[15]张惠彬,王怀宾. 著作权集体管理制度的反思与回应:信托视角下[J]. 中国编辑,2022(5):56-61.