【摘要】为明确生成式内容的版权侵权行为,首先从作为内容素材的原作品两大使用方式角度出发,就生成式内容的版权合理使用和侵权行为性质予以客观探讨,再就版权侵权行为可能造成的公私法益危害展开深入分析,最后根据“行动网络理论”,从法律、技术及社会层面提出多主体互动规制路径。研究发现,对生成式内容的版权侵权行为而言,从法律层面对其定性区分,并基于其特征表现与现实危害构建多元规制路径,是应对技术滥用和保护版权生态的必由之路。
【关 键 词】人工智能;生成式内容;行为动机;版权侵权;互动规制
【作者单位】王晓彤,武汉大学法学院。
【基金项目】2020年教育部国家人权教育与培训基地重大项目(20JJD820006);2022年国家建设高水平大学公派联合培养博士研究生项目(CSC202206270068)。
【中图分类号】D923.41【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.09.005
2023年7月13日,国家网信办联合国家发改委等7部门联合公布《生成式人工智能服务管理暂行办法》(以下简称《办法》),其第九条规定,“提供者应当依法承担网络信息内容生产者责任,履行网络信息安全义务。涉及个人信息的,依法承担个人信息处理者责任,履行个人信息保护义务”。由于目前我国法律体系还未对生成式内容进行明确定性,这也导致在版权保护领域,该责任是否直接与侵权行为的治理挂钩,仍需要更多明示与澄清。此外,就技术赋能下的生成式内容而言,哪些行为属于合法编创与合理使用,哪些行为又该被判定为版权侵权,还需要具体问题具体分析。因此,对生成式内容的版权侵权行为而言,从法律层面对生成式内容的版权侵权行为进行定性区分,并基于其特征表现与现实危害构建多元规制路径,是应对技术滥用和保护版权生态的必由之路。
一、生成式内容版权侵权行为特征及成因
1.生成式内容版权侵权行为特征
第一,隐蔽性。在科技发展日新月异的当下,出于核心技术保护需要,一般的技术模型或应用工具主要以一种不公开的运作机制向目标用户提供内容生成服务,这也导致版权侵权行为的隐蔽性较强,给侵权认定和版权保护工作造成极大困难。2023年4月,德国媒体巨头Axel Springer SE的公共事务高级副总裁Dietrich yon Klaeden曾向《纽约时报》和彭博新闻社的记者表示,目前机器内部发生的事情并不透明[1]。由于技术隐蔽操纵,人们难以确认生成式模型及相关工具从数据搜集到内容生成过程中是否发生版权侵权行为。据海外媒体不完全统计,自2022年11月至2023年10月,仅美国加州北区法院就已受理10起版权侵权案件,版权人所起诉的AI机构包括OpenAI、Meta、Stability AI等科技公司,主要诉求是上述科技公司承认利用技术隐蔽操纵侵犯原权利人的版权并给予他们一定的补偿。
第二,复杂性。当前,科学技术的发展使得从数据搜集到内容生成环节的目标操作主体不同,导致版权侵权行为的复杂性更甚。有学者认为,人工智能生成内容版权侵权风险主要由技术研发者、服务提供者以及目标用户的角色分离导致,较传统版权侵权行为更为复杂[2]。一是技术研发者,即内容模型和技术工具研发商可能因为非法搜集、处理数据而泄露信息,引发版权侵权风险。二是技术服务商,即内容生成服务提供方可能因为输出未经授权的内容造成侵权风险。三是目标用户可能因为恶意提问生成与原作品存在一定相似度的内容并将其用于非法传播和商业获利,从而构成侵权行为。在当前时代,不同运作环节和行为主体都可能单独造成或共同引发版权侵权风险,侵权行为主体呈现复杂性和多元性。
2.生成式内容版权侵权行为成因
从客观层面来看,法律规范和监管措施缺失,是生成式内容版权侵权行为发生的根本原因。由于现有法律规范并未对这一技术创作物作出明确规定,导致版权侵权行为难以被认定、举证,因而在一定程度上助长侵权行为,出现“钻空子”“搭便车”等现象。此外,国家网信办等部门联合发布的《办法》在法律位阶上属于部门规章,不及法律法规的强制效力,而且也未从版权领域澄清其责任义务,对侵权行为的惩处和震慑作用有待提升。有学者指出,与生成式内容侵权行为密切相关的信息网络传播权,被置于《中华人民共和国著作权法》第六十四条“计算机软件、信息网络传播权的保护办法由国务院另行规定”的情形下,这不仅降低了版权保护的法律层级,也可能因为法律规范的缺位而助长版权侵权行为[3]。此外,行政监管的缺失也在一定程度上为版权侵权行为提供滋生环境。目前,出于鼓励技术创新的需要,行政机关对生成式人工智能技术、大型语言模型尚未采取强力的监管措施,加上《中华人民共和国网络安全法》第二十一条对网络运营者的技术合理利用提供“可解释性”保护,导致生成式内容的版权侵权行为打击力度不足。
从主观层面来看,技术竞争和市场抢占动机主导下的发展机制,是生成式内容版权侵权行为发生的重要原因。从技术研发商和服务供应商的角度来看,为了不断优化技术系统和服务功能,必然要不断扩大训练数据规模,以凸显自身在生成式内容领域的权威地位和强大效用。但无论是数据搜集与训练环节,还是功能优化和输出内容精准度方面,都可能有意或无意引发版权侵权风险。因此,技术研发商和服务供应商多以自身商业目的为出发点进行不透明操作,但并未对内部复杂要素进行解构重组、重新生成以及重新连接,极易出现版权侵权行为。从目标用户角度来看,具备生成式内容功能的技术系统或应用工具,多以To C模式向大众提供个性化服务,但又难以捕捉和管控用户意图和目标行为。若个体用户利用网络的隐匿性和低门槛特性,违背合理使用制度,将生成内容通过二次或多次加工修改再进行公开传播并获益,无疑会进一步提升侵权难度,甚至造成更大的危害。
二、生成式内容版权侵权行为定性及危害
1.生成式内容版权侵权行为定性
关于原作品作为内容生成行为的深度学习资料。从技术角度来看,内容生成能力的强弱与训练数据规模大小呈正相关。为了不断扩大和优化模型功能,一些技术研发商或利用网络爬虫等工具自主搜集各类数据资源,或通过与专业机构合作获取优质数据资源,但前者在未经权利人授权的情况下进行,极易构成侵权行为。自2023年以来,包括OpenAI、Stability AI、Meta等在内的国外大模型企业已受到《纽约时报》等专业媒体在内的多次版权诉讼。在国内,出于模型训练需求导致的版权纠纷也有待解决,如2023年6月,教培巨头学而思被披露未经授权利用合作伙伴笔神作文的数据进行大模型训练。上述表明,技术研发商为达到模型训练和功能强化的目的对未经授权的原作品数据进行非法搜集的行为,已然违反合理使用制度,且模型训练目的含有商业倾向,并对原作品权利人或专业机构造成利益侵害,可认定为侵权行为。需要注意的是,内容生成行为的深度学习引发的原作品内容侵权行为,现存在巨大的法律盲区,这给生成式内容技术学习训练环节的版权侵权行为认定造成实际阻碍。版权限制目前存在合理使用、法定许可和强制许可三种情形,导致作为学习训练素材的原作品版权保护与侵权诉讼面临对抗性冲突,即版权保护体系与技术创新支持之间出现矛盾,进而给侵权行为提供可操作空间。
关于原作品作为内容生成行为的定向改编对象。第一,通过基础模型和特定训练数据调试后的内容生成模型,其输出的编创内容可能与作为原始训练素材的已有作品内容存在极强的关联性和相似性,且能通过语句替换、语序调整等二次加工手段规避版权法的权利保护。对于这种侵权行为的定性,仅通过思想与表达二分法来判定和检验,可能会因为技术隐蔽操纵面临诸多难题,因而需要适当利用抽象观察法,对生成内容的核心思想和同质化替代作用进行司法判断,以此实现对侵权行为和合法利用行为的有效界分。在国内首例AIGC生成图片著作权纠纷中,北京互联网法院从智力投入、智力成果、独创性等维度对被告侵犯著作权的事实予以司法判定,其本质是对原作品核心思想和个性化价值的肯定与保护,而这也为生成式内容的隐蔽性侵权行为认定起到重要参考作用。当然,并非所有通过改变和替换原作品内容表达但保留核心思想的内容生成行为都是侵权行为,其区分和判定还应该引入对目标对象行为动机的考察,若出于商业目的并采取公开传播的方式对原作品及其所有权人的合法权益造成损害,则可认定为侵权行为。有部分学者指出,针对定向改编和编创物输出传播过程是否使用合理使用制度的问题,需要纳入“不得不合理地损害著作权人的合法权益”的范围内予以评判[4]。
2.生成式内容版权侵权行为危害
第一,生成式内容的版权侵权行为,对原作品权利人和大众合法权益造成严重侵害。一方面,生成式内容的版权侵权行为对个体权利人和行业机构合法权益造成诸多损失。例如,由于技术隐蔽操作和侵权成本较低,涉嫌侵权的生成式内容一旦公开传播,将获得属于原作品权利人的流量和效益,并成为原作品的同质化替代品,挤占它们的市场空间。此外,对以核心版权资源为主要竞争力的出版发行机构而言,低成本、大规模的内容侵权行为可能导致自身原有的商业运行模式难以为继,最终出现生存危机。2023年7月,8500多名海外作家联合签署“致生成式AI领导者的公开信”,强烈谴责并呼吁包括OpenAI在内的多家技术研发商就版权侵权问题作出公平补偿并停止持续侵权。另一方面,生成式内容的版权侵权行为是对大众知情权的变相侵害。生成式内容的技术隐蔽手段较多,一定程度上增加了用户的判别难度,无法及时有效地界分所接触的内容是否属于侵权内容,因而知情权受到损害。由侵权行为引发的知情权问题还会造成两个困境:一是大众在不知情的情况下帮助宣传、分发侵权内容,加剧对原作品权利人及相关机构的合法权益侵害;二是当大众无法界分侵权行为和合法行为时,可能会因为行为的不确定性保持谨慎态度,不利于原作品的市场传播和价值变现。
此外,生成式内容的版权侵权行为,对内容市场和社会稳定发展造成诸多危害。生成式内容版权侵权行为的便捷性和多发性,可促使大量侵权创作物以同质化竞品形式进入内容市场,破坏原市场良性的供给关系。
三、生成式内容版权侵权行为的互动规制路径
1.以道德规训完善法律规范,以常态行政管理加大版权保护力度
当下,既有法律规范面临生成式内容版权保护乏力的困境,国家立法部门可以从道德层面对侵权行为进行合理的求证和追问,从而确保生成式内容数据搜集、训练、学习与输出的正当性。因为知识产品具有相容性和非排他性特征,其经由技术应用的学习模仿和输出传播会出现合法性认定的模糊以及维权成本过高等问题,单凭权利规则来界定维权并不足够,只有借助义务规则的外部性内化辅助,才能有效治理这种“钻空子”“搭便车”的侵权行为。法律与道德内部的商业习惯、伦理间的互动为规制客观性侵权和主观性侵权行为提供了价值追求和法律依据。具体来看,国家立法部门既要加快相关法律法规的立法进程,也要在立法过程中以“专条”为形式,以“概括+列举+兜底”为结构,对生成式内容的版权侵权行为予以有效界分和认定,如内容层面的相似性、核心思想层面的一致性、行为动机的合理性,以及是否采取技术保护手段等,以此作为司法判定侵权行为的重要依据,并根据侵权程度量化惩处措施。
尽管法律规范的强制效力强,但制定程序复杂、立法周期较长,因而在完善版权保护法律制度的同时积极发挥行政机关的作用,建立常态化行政管理制度,能够在版权侵权问题治理中发挥重要且及时的规范作用。例如,在相关法律立法进度缓慢的情况下,政府监管或互联网治理相关部门可以建立常态化的行政管理机制,如行政约谈等,通过自有渠道或平台提供的投诉信息,就涉嫌侵权的“问题作品”展开深入调查,对技术研发商数据搜集环节出现的侵权行为予以行政约谈和处罚,对使用者内容生成环节出现的侵权行为予以警告,严重的可通过司法部门介入追究其责任。在常态化行政管理过程中,需要以侵权行为的实质性证据作为处罚依据,具体可通过《中华人民共和国著作权法》等已有法律规范和《办法》等部门规章的合理延伸,要求技术研发方、平台服务商全面配合侵权举证,同时开展自检自查活动,形成生成式内容的版权治理生态,在降低制度治理成本的同时,加大对侵权行为的打击和惩处力度。
2.加快建立“技术规制技术”的逻辑与路径
从逻辑上看,“技术规制技术”旨在利用更高级、更敏感的技术工具对生成式内容可能出现的版权侵权问题进行科学认定和及时处理。清华大学人工智能研究院视觉智能研究中心主任邓志东教授表示,通过模型优化训练的方式防止再次生成侵权内容虽在技术上难以实现,但利用价值对齐的算法采取内容过滤等措施或可实现[5]。美国乔治城大学安全和新兴技术中心、斯坦福大学网络观察室以及OpenAI也联合发表报告,明确提出人工智能供应商要开发对事实更加敏感的语言模型,其逻辑基础也是“技术规制技术”。目前,OpenAI已推出新一代网络爬虫工具——GPTBot,可在数据搜集环节避开可能涉及个人身份信息、版权保护制度的文本数据,对防止生成式内容可能出现的版权侵权问题具有积极作用。谷歌于2023年宣布,后续将在新Bing(基于生成式AI技术的全新聊天机器人)引用内容足够多时明确注明内容出处,这对内容生成环节可能出现的技术客观和使用者主观侵权问题均有良好的规制作用。
从路径上看,垂直领域的出版社、内容平台由于成本和技术问题,较难实现规制目标。出版社与企业应通过跨界合作共同构建版权保护技术路径,得出解决“卡脖子”问题的最佳方案。具体来看,以出版社、内容平台等为代表的内容行业主体,可通过与技术公司、高校或专业机构的深入合作,携手共建版权保护生态系统。例如,2023年龙源数字传媒集团基于大模型AI技术和版权文章库,与多家技术合作伙伴共同打造“文可知识文库”,为生成式内容的版权确权与保护贡献力量。除合作开发外,内容行业主体还可通过技术引用方式,维护自身版权效益。如:与OpenAI合作引入“Copyright Shield(版权盾)”功能;与浙江省高级人民法院知识产权审判庭合作引入“版权AI智审”技术系统;与北京瑞莱智慧科技有限公司等第三方专注于大模型内容安全防控的专业公司建立技术合作关系。基于“技术规制技术”逻辑的行业跨界合作路径,可在大幅减少技术难题和成本问题的前提下,有效缓解技术研发商在模型训练与学习阶段的数据资源匮乏问题,从根本上杜绝技术隐蔽操纵导致的版权侵权危机。
3.基于价值理性的多主体协同共治
第一,内容生成服务商、媒体平台等社会多元主体应加大对使用者即社会大众的技术理性培育力度和使用规范教育力度。教育考核可提升用户的技术伦理认知水平,在其内心形成一定的约束机制和规范标准,从而避免主观层面的侵权行为的发生。因此,内容生成服务商、媒体平台可在用户注册或提供服务之前设置类似B站的客观考核题,将版权保护和侵权处罚等内容融入其中。只有成功通过考核的用户,才能通过认证成为正式会员并享受内容生成等服务。媒体平台应具备高度的责任意识,积极参与并加大对版权侵权行为的曝光力度,如媒体应通过典型案例不定期向大众宣传侵权行为可能造成的诸多危害。平台与平台之间可就原作品版权保护签订跨平台合作协议,就侵权行为及其造成的不良影响进行联合宣传,同时还要加大对原创作品的流量扶持力度和激励力度,让更多的用户树立原创价值理念和版权保护意识,以防大规模侵权乱象的产生。在这一过程中,无论是媒体还是平台,都需要确立对价值理性和技术理性的认知与追求,以此促进并形成认同效力,将版权保护外化为社会大众的共同义务,切实发挥来自商业习惯和行业规则的积极作用。
第二,行业主管部门应从社会层面出发,针对生成式内容的版权侵权行为的复杂性和隐蔽性,组建包括原作品所有权人、技术企业、内容单位、媒体平台、用户等在内的第三方监察机构,通过多主体协同互动和全面参与,强化侵权行为的认定和规制效力,共建版权保护良好生态。具体来看,可通过国家版权局、中国版权协会等行业主管部门和专业社会团体的号召与引领,组建专注于内容行业版权保护的第三方监察机构,通过原作品所有权人的内容敏锐性、技术企业的科技创新支持、内容单位的专业标准制定、媒体平台的舆论监督管理以及社会大众的及时举报反馈,让侵权行为曝露在公众视野之中并得到及时治理。在这一过程中,尤其要注重对用户群体的合理选择,即选择具有长期阅读经历或创作经验并深谙内容生成技术原理的特定群体,以此凸显生成式内容侵权行为认定的正当性、针对性及有效性。总之,基于行业主管部门或专业社会团体引导下的第三方监察机构的建立,既是生成式内容版权侵权问题社会共治理念的有力体现,也是在版权保护机制中充分发挥人的主观能动性的创新举措。
四、结语
在科技发展日新月异的当下,技术的多元涌现功能在惊艳大众和赋能学术出版业转型升级的同时,也可能因为主客观因素影响制造更多新的恐惧和矛盾,即“人类文明的基本矛盾日益转变为人与技术的矛盾,人性很可能因为无法驾驭飞速发展的技术而导致文明困局”。版权侵权仅是当下某个问题的缩影,我们既要具体问题具体分析,针对版权侵权行为做好互动规制工作,更要透过现象看本质,就新时代背景下的技术失范现象构建更全面、科学、高效的防治体系,在鼓励技术创新的同时,确保技术合理应用。
|参考文献|
[1]生成式AI“杀入”出版业,17家媒体高管谋划3大反击措施[EB/OL].(2023-04-12)[2024-04-
29]. https://www.jiemian.com/article/9230925.html.
[2]刁佳星. 生成式人工智能服务提供者版权侵权注意义务研究[J]. 中国出版,2024(1):25-30.
[3]张金平. 论人工智能生成物可版权性及侵权责任承担[J]. 南京社会科学,2023(10):77-89.
[4]饶先成,徐棣枫. 从一元向多元互动转变:人工智能洗稿行为的规制路径[J]. 编辑之友,2021(7):84-90.
[5]仇飞. 生成式AI监管新规的哪些细节值得关注[N]. 法治周末,2023-04-17.