Sora使用者的著作权侵权风险与治理因应路径

2024-01-01 00:00:00刘祖兵
关键词:著作权

摘要:Sora生成的视听作品在思想与表达上分属于不同的权利主体,其使用者的著作权侵权风险具有高度隐蔽性。Sora是基于海量视频素材的场景“复现”,在场景与时间的交叉融合中生成,是思维与表达分离的创作过程。Sora使用者的行为存在侵犯复制权、改编权和传播权(广播权和信息网络传播权)的风险,且具有高度隐蔽性。“接触+实质性相似”的侵权判定规则和“过错原则”在适用上均存在障碍,甚至导致举证不能。应将Sora使用者纳入披露主体范畴,将Sora生成视听作品作为披露内容,同时引入在先作品使用背书制度,以此强化事前的算法风险防范机制,同时适度探索“举证缓和”制度和灵活使用“举证责任倒置”,以融合事前防范与事后治理。

关键词:Sora;Sora使用者;著作权;侵权风险

DOI: 10.13734/j.cnki.1000-5315.2024.0316

收稿日期:2024-05-27

基金项目:本文系教育部人文社科规划基金项目“智能汽车的数据商业化利用法律问题研究”(21YJA820032)、上海市软科学研究项目“智能网联汽车数据出境的法律风险及防控研究”(22692104400)的阶段性成果。

作者简介:刘祖兵,男,江西南昌人,同济大学法学院互联网与人工智能法律研究中心研究员,研究方向为智能法学、知识产权法学,E-mail: ncliuzb@126.com。

OpenAI于美国当地时间2024年2月15日发布大型视频模拟模型Sora“Sora”,即日文中的“そら”,寓意“天空”,表达的是该款生成模型具有无限的创造潜力之意。。Sora是基于对真实世界的深度理解和强大的模拟能力,根据使用者文本指令生成的连贯、一镜到底的高清视频。Sora的问世,标志着人工智能(Artificial Intelligence)在跨域生成领域取得了新突破。人工智能生成内容(Artificial Intelligence Generated Content,AIGC)成为继专业生产内容(Professionally Generated Content)和用户生产内容(User Generated Content)之后的又一新型创作模式中国信息通信研究院、京东探索研究院《人工智能生成内容(AIGC)白皮书》,2022年9月1日发布,2024年3月25日访问,http://www.caict.ac.cn/sytj/202209/P020220913580752910299.pdf。,开启了“人机”协同创作视频新纪元。无论是专业人士,还是影视爱好者,甚至是普通使用者都能轻松“烹饪”高质量的“视听盛宴”。Sora不仅大大降低了视听作品的创作成本,而且提升了影视制作效率,更迎合了普通公众对生成高质量视频内容的强烈期待。

然而,以Sora为代表的生成式人工智能(Generative Artificial Intelligence,GenAI)在助力人类实现视听成果极大丰富的同时,也将公众带入了对著作权侵权风险的深刻忧虑之中。一方面,Sora训练时可能侵害他人著作权,因为Sora是基于海量视频数据实现深度学习和强化训练的结果,但用于训练算法的视频数据,不乏处于权利保护期的视听作品;另一方面,使用者在使用文本指令驱动Sora跨域生成视听作品时,亦可能诱发侵害在先权利的巨大风险,或扰乱人类现有的知识产权秩序。本文通过剖析使用者在使用Sora过程中的著作权侵权风险及规制困境,建议完善披露制度和举证制度,以实现视听作品在先权利人权益保护与技术发展并重的目的。

一" 行为解构:一种由Sora表达的文本思想

Sora与使用者融合创作,生成物是由Sora表达的文本思想,其思想与表达所属主体分野。Sora在海量视频素材的“浸润”和强化训练下获得物理识别能力,基于使用者文本指令“复现”视频数据库中的场景,实现场景和时间的交叉融合而生成视听作品并反馈人类文本指令。

(一)基于海量视频素材的场景“复现”

Sora基于海量的视频数据实现强化训练。Sora在强化训练时需要大量的视频数据,对视听作品表现出较强的依赖性。人工智能将海量作品转化为可识别的代码数据供机器学习和训练使用,由算法自主生成在外观上与人类独创水平相似的作品。“无数据,则无算法”,GenAI与人类创作时参考已有文献一样,它也需要得到视频素材的“喂养”,这些素材即是以数据的形式表现出来的各种数字化作品焦和平《人工智能创作中数据获取与利用的著作权风险及化解路径》,《当代法学》2022年第4期,第128页。。GenAI基于海量的数据“投喂”,通过强化训练和深度学习使算法获得类似人类神经网络的思辨机制,继而依据使用者指令生成预期结果。GenAI是基于机器学习算法实现自动生成多类型数据的大模型,不仅能生成诸如文本、图像等静态数据,还可以制作音频和视频等动态信息,是建立在大模型和大数据基础之上的、对已有数据进行创作的前沿性人工智能技术邹开亮、刘祖兵《生成式人工智能个人信息安全挑战及敏捷治理》,《征信》2024年第1期,第41-42页。。Sora是GenAI的最新技术成果,它对视频数据具有强烈的依赖性。作为大型视频模拟模型,Sora的生成能力是在接受海量视频数据的持续“浸润”过程中不断完善的。它依赖于丰富的视频数据展开训练并理解物理变量之间的关系,依据使用者指令模拟现实世界的场景,以视频的形式反馈使用者文本指令“Video generation models as world simulators,” OpenAI,last modified Feburary 15,2024,https://openai.com/research/video-generation-models-as-world-simulators.。

Sora基于对视频素材的理解、复制和转换性使用,从而生成视听作品。GenAI归纳、分类、整理和分析大量已有作品数据,从中抽取和提炼作品的规则、模式、结构和趋势,将它们应用到具体的创作场景之中进行独立观察、持续改进和优化数据的分析与处理。每一部用于训练Sora的视频素材都是由有限数量的帧构成的,每个帧即是一张二维图片。Sora能进行字幕语句整合,在每个帧中标注物理矢量,通过该方法“理解”不同事物的物理矢量,通过学习视频素材中时间和空间的变化来“感知”事物之间的相对位置。经过强化训练,Sora逐渐获得“涌现”能力,即它能够自发性地学习物理世界的基本规律并模拟物理现象,冲破人为参数的束缚,即通过对视频素材中的物理矢量关系的理解,复制、转换使用和再现类似场景的表达。

然而,Sora生成视频的现实基础是视频素材中有限的物理矢量,Sora基于视频素材标的之间的相对关系来理解使用者指令所关联的视频场景,它并不具备创造能力。换言之,Sora是在海量视频中选择有限数量的帧,基于对帧的理解来学习视频素材提供的表达。也就是说,Sora主要是对视频数据进行复制、组合和再加工,用独特的表达形式反馈使用者文本指令。因此,在OpenAI提供的官方DEMO中出现行人在行走时左右脚步调不协调、画面扭曲和动物数量失控等肉眼可见的缺陷,这即是Sora在将多个视频复制、组合和再现过程中产生的单独帧错位的原因所致。然而,当可供训练的视频数据足够丰富时,Sora的理解能力会得到极大的增强。例如,《行走在东京街头》的视频虽然存在瑕疵,但是这部长达60秒的视频从动作效果、头发、服装等细节方面都实现了十分连贯的场景转换,已基本达到以假乱真的水平。

(二)基于场景与时空交叉融合的视频生成

与其他视频生成模型相比,Sora显现出明显的场景与时空相融合的生成特征。此前上市的文生视频模型也普遍存在因循环网络、生成对抗网络、自回归变压器等技术导致的狭隘视觉和视频时限的局限问题Wilson Yan, etc,“VideoGPT: Video Generation using VQ-VAE and Transformers,” last modified April 20,2021,https://doi.org/10.48550/arXiv.2104.10157.。Sora就此类问题进行了模型改进,它能深度理解使用者的文本语义,在此基础上迅速匹配视频数据库中的字幕信息,实现复杂场景下跨时空融合视频的生成。

Sora依据文本指令精准生成视听作品关于AIGC是否构成作品,学界已展开了较多讨论。本文支持AIGC作品“肯定说”,即认为在符合最低独创性的标准之上,AIGC是著作权法上的适格作品,且其权利归属于实际使用GenAI创作的个人、法人或者非法人组织。该观点也得到实务案件支持,例如北京互联网法院审理的“全国第一例AI生成图片著作权案”,案号:(2023)京0491民初11279号。,实现跨时空的连续表达。TransformerTransformer是谷歌于2017年首次发布的一款算法强化训练模型,它采用注意力机制的深度学习,按输入数据的重要性分配训练强度并分配不同的算力资源,从而提高模型生成的精度。该模型在ChatGPT模型训练时已被使用,是一种比较成熟的训练模型。能强化算法长距离语境理解能力和泛化能力,从而使Sora能够准确捕捉到与文本指令高度匹配的上下文字幕语境,提高调用视频语料的精准度。同时,为了给多机位的视频生成提供多视角,它将不同的场景、动作和灯光条件等融合为所要生成视频的素材,保证生成内容在时间和空间上具有连续性,也能使表达形式之间具有高贴合度、连贯性和准确性。Sora的强化学习和多模态处理能力,使其能够全面、多维度地理解文本指令中包含的思想。同时,得益于Transformer,自然语言处理模型(Natural Language Processing,NLP)能与字幕模型配合将处理的所有字幕和文本指令矢量化,以此提高算法匹配的精准度。Sora的字幕语句整合功能可以多角度理解和分析视频语料库的外在表现与内在联系,为实现高质量视频生成提供精度上的支持,也为视频表达提供了多种可理解的形式。

Sora对真实世界展开高度仿真。Sora通过理解视频素材中的物理矢量关系,对变量“块”(patches)展开多样化的复制、模拟和组合应用“Video generation models as world simulators,” OpenAI,last modified Feburaty 15,2024,https://openai.com/research/video-generation-models-as-world-simulators.,它将二维帧拓展至“三维空间”。“块”记录帧的物理矢量,即它们在时间和空间上的相对关系。换言之,Sora应用“时空块”理解视频物理素材。它在该过程中能精确地处理视频物理要素之间的衔接,从而摆脱存在于二维帧之间松散的关联关系,在表达上实现视频之间的精准衔接,使同一物理素材在不同场景下具有很好的应景感。使用者使用文本指令命令Sora将视频素材扩展至其他场景,并进行自动调整、变换机位等多类型操作。基于这些技术优势,Sora已基本实现对现实世界的高度仿真,最后生成的视听作品能够反馈文本指令所提供的创作思想。

Sora基于高效率和低成本优势加速了人类视听作品的创作过程。当下,个人创作面临着单机位、内容重复且后期处理成本高的问题,同时,专业的视频制作从业者凭借主观经验布置拍摄场景面临较大的成本负担与失败风险,特别是对一些需要特别处理的题材,如科幻类的、二次元等类似题材。Sora基于使用者的简短文本指令和对物理世界的理解,即能生成高度逼真的、多机位的视频视觉效果预览,极大地赋能创作灵感,降低创作成本,在提高创作灵活性和创作效率等方面发挥着无可替代的作用,也能对公众视频创作技术的提升和视频表达形式的多样化提供有效借鉴。Sora对创作者的事实偏好和行为数据具有依赖性,会在理解私人订制的亲密关系中生成个性化的表达。这种激荡着“数字生命感”的叙事方式,不仅能精准地满足作者与观众的需求,亦能推动实现文本内容的多样化表达,使受众高效地找到与自己兴趣相符的独特内容。

(三)基于思维与表达分离的创作过程

Sora生成模型有着区别于传统人工智能算法(Artificial Intelligence Algorithm)的工作模式。传统人工智能算法的工作模式是通过接受强化训练获得泛化能力,在海量离散数据之间建立相关联逻辑关系,推导或预测类似场景下的规律,即其主要运行基础是大数据支撑下的机器学习。人类在熟知其运行逻辑的基础之上,通过输入待执行文本指令和设置运行参数,得出目标作品。易言之,在应用传统人工智能算法进行创作时,其创作思想和表达均反映的是使用者的真实意志。反观Sora,使用者在生成视频的过程中参与度要低很多,作品的表达形式也已经超越人类的预期。

一方面,视听作品的思想内容源于人类文本指令。使用者使用文本指令启动“创作”进程,Sora依据该指令调用视频语料库中的素材后展开创作。得益于字幕生成模型(Video ReCap Model),Sora对视频语料库的素材进行字幕标识。Sora创作的过程始于使用者下达的文本指令,即根据使用者指令要求标识、调用视频库中的字幕,从而对视听作品的物理矢量进行复制、组合、模仿和转换性使用。虽然使用者文本指令的来源多样,但从性质上看可归纳为两类:第一类,是使用者即兴创作的写实文字,或者受著作权保护的自有作品内容,这种文本指令是使用者创作的,它们可以是对世界事实状态的描述,也可以是使用者表达心理感受的词句等;第二类,则是著作权法意义上的文字作品的全文或者摘选其中的部分篇章,使用者从文字作品中节选部分内容或者全部用于指示Sora创作,其中不乏仍然处于权利保护期内的作品,当然,也有因超过保护期不再受著作权保护的文字作品。文本指令是开启Sora视频创作的钥匙,Sora在使用者指令的驱使下调用视频素材库中的物理矢量展开生成程序。

另一方面,Sora为作品思想提供多样化的表达。使用者将创作文本指令传达给Sora,其创作思想和创作意图通过有限的文字传达给GenAI大模型,寄希望于通过Sora高效、多样和精准的表达方式将文本思想表达出来。使用者用有限的文本指令(写实文字或作品内容)驱使Sora进行视频创作时,思想和表达是绝对二分的,即独特且个性的思想、情感归于使用者,而生动、绚丽的表达由Sora负责实现。也即,Sora通过读取使用者文本指令中包含的思想,关联视频数据库中与之匹配的字幕标签,然后调用视频物理矢量加以改造,生成符合使用者指令所期望的视听作品。人类创作的作品与算法生成的作品在形式上的最大区别,就在于人类先有思想后有表达,而算法则是先有表达然后基于理解使表达具有思想、情感或艺术价值黄姗姗《论人工智能对著作权制度的冲击与应对》,《重庆大学学报(社会科学版)》2020年第1期,第163页。。Sora的创作过程正是基于此逻辑,它在符合文本指令的思想下套用多种物理矢量的表达形式,满足使用者对视听作品的创作需求。

二" 风险表征:Sora使用者侵权的多重体现

一般认为,当下的人工智能算法不具备著作权主体资格,它并非法律关系的实施者邹开亮、刘祖兵《试论智能算法主体化》,《重庆邮电大学学报(社会科学版)》2023年第2期,第67、71页。。因此,直接表达人工智能算法侵权的观点存在欠妥之处。也有学者从人工智能生成物的法律属性出发,倒推其主体身份,继而阐明侵权表述的合理性王迁《三论人工智能生成的内容在著作权法中的定位》,《法商研究》2024年第3期,第196-197页。。这种观点虽然未直接明确人工智能是侵权主体,它或许为人工智能算法成为著作权法意义上的作者身份提供了另一种可能性,但并不符合人类现行法律关于主体性的规定。因为,依据现行法律规定,仅有自然人、法人和非法人组织才是适格作者《中华人民共和国著作权法》第十一条第二款、第三款规定:“创作作品的自然人是作者。”“由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。”。事实上,使用者借助Sora创作的表达与思想是绝对二分的,使用者应该对使用Sora的生成行为负责,即Sora使用者应当对输入文本指令至生成视听作品,再到该作品在信息网络上传播的侵权行为承担责任。

(一)侵犯复制权的风险

GenAI侵权行为主要发生在数据训练环节和生成内容环节王利明《生成式人工智能侵权的法律应对》,《中国应用法学》2023年第5期,第28页。,Sora对在先视听作品复制权的侵犯也出现在模型训练和视听作品输出的环节。《著作权法》意义上的复制行为要求将作品从一个有形载体转移到另一个有形载体,且作品能在该载体上相对稳定、持久地固定王迁《著作权法》,中国人民大学出版社2015年版,第164-165页。。该权利规制的是在未经权利人许可且无法定抗辩事由的前提下,在有形载体上再现作品的行为,即增加作品复印件的行为。Sora进行模型训练环节和作品输出环节,不仅涉及临时复制,还永久性地复制在先作品,应当分阶段讨论其行为。

1.模型训练阶段

在进行深度学习之前,大模型需要对视频素材展开字幕标签化处理(数字化转换),以供Sora创作时调用。虽然该过程涉及对在先视听作品的临时复制,但并未实质性地增加其复印件数量。因此,使用在先视听作品训练Sora阶段并未侵犯复制权。尽管我国《著作权法》第十条将“复制”限定为以“印刷、复印、拓印、录音、录像、翻录、翻拍、数字化等方式将作品制作一份或者多份”的行为,然而,《伯尔尼公约》(Bern Convention)第九条规定的复制行为范围明显较为宽泛,其将复制行为扩大为以“任何形式、任何方式复制”,认为对视听作品的特定复制不限于有形复制载体。域外其他国家的法律规定也不尽相同。例如,《英国版权法》第十七条并未就“复制”行为作实质性规定,而是认定复制的在先作品的全部内容或者其中的实质内容;《美国版权法》虽然也未明确复制行为的构成要件,但在实务中偏向于对《伯尔尼公约》作扩大性解释。由此可见,人类现行著作权法对应用视频数据训练Sora的行为是否侵犯在先权利人的复制权的认定标准不一,至少当下我国法律是持否定态度的。在实际使用Sora的过程中,鉴于使用者并未实际参与Sora的训练过程,他们不应对其训练行为负责。因此,Sora在训练过程中是否存在侵权行为与使用者并不相关,Sora使用者并不对GenAI大模型在训练中的侵权行为承担责任。

2.视频生成阶段

Sora在输出视听作品的环节存在侵犯复制权的巨大风险。如果经由Sora创作的视频与在先视听作品存在实质性相似,即构成对在先视听作品复制权的侵犯。应当根据现行“接触+实质性相似”规则,分别评析“接触”和“实质性相似”要件。

应当从Sora与使用者融合创作的视角适用“接触”要件,而非单独分析Sora与使用者的行为。当使用者的文本指令不由其创作产生,而是来自在先作品的时候,使用者将文本指令传达给Sora之前即已实质性地接触在先作品,这是显而易见的。然而,Sora在接受视频数据展开训练时,出于对理解视频物理矢量的目的而进行的分类、汇编等接触作品的行为,能否成为使用者侵权的要件呢?鉴于使用Sora的目的是实现创作,该创作是由使用者提供“思想”和Sora提供“表达”的融合行为完成的,因此,并不能将使用者创作目的和Sora创作意图视为一个共同的创作意愿,即使用者和Sora并不存在共同侵权的直接故意。换言之,Sora对在先视听作品的分类、汇编等行为,属于使用者实施间接接触在先作品的行为,不能将使用者纳入共同侵权的主体范围之内。

复制权侵权是以作品中存在相似的表达为构成要件,而非仅仅内容的实质性相似。它是以使用者的文本指令指向的作品表达与Sora复制、组合和转换性使用视频矢量生成的视听作品与在先作品之间存在高度的相似性为要件,即Sora在理解在先视频的基础上,对在先视听作品进行转换性使用的程度较低,人们仅凭肉眼可见的方式足以察觉二者之间存在高度相似性,即判定为复制权侵权。也就是说,倘若Sora生成的视听作品与用于训练算法模型的在先视听作品之间存在实质性相似,那么即存在复制权侵权的盖然性。然而,我们还需要看到“实质性相似”并非构成侵权的充分条件,而仅仅是必要条件。对于生成视频的表达风格是否能成为判定实质相同的因素,目前学界基本持否定态度。即使创作结果与该文字作品的“风格”构成实质性相似,也并非必然构成侵犯复制权。

(二)侵犯改编权的风险

改编权侵权发生在使用者选择文本指令和Sora依据该指令进行视频生成的环节当中。著作权法中的改编是指改变作品的表达形式,创作具有独创性的新作品的行为。也有部分域外法律规范并不禁止改编行为本身,而仅仅把改编作品后的使用行为作为规制对象。例如,《德国著作权法》第二十三条规定,只有在作品权利人允许的情况下,才能使用改编后的作品。一般认为,通过解构使用者使用Sora创作的具体行为可以发现,其生成的视听内容在达到最低独创性要求之后即完成作品的创作,形成改编作品,这种根据文字作品的思想改变在先视听作品表达的行为存在侵害改编权的风险。

当文本指令属于第一种类型,即来源于使用者自己创作的作品时,因文本指令是Sora使用者的智力成果,所以并不涉及侵犯改编权。如果涉及修改权,使用者实施的亦仅仅是对自己享有著作权作品的改编行为,并不满足侵权行为的构成要件。但是,当文本指令是从他人作品中节选的片段或者是作品的全部时,正好该作品又处于权利保护期内时则可能落入改编权的“禁区”之内。如果Sora生成的内容符合最低独创性标准,该视频是对文本指令蕴含思想的一种表达,证明其已完成改编。如果生成作品仅仅是对在先作品增加了部分情节、生动画面和绚丽色彩,使在先作品中的思想具有更加具体的表达形式,那么,这种改编作品就存在侵犯改编权的风险。因此,使用他人处于权利保护期内的在先作品作为文本指令,要求Sora展开视频创作的行为,就涉嫌侵犯他人改编权。

Sora对文本指令创作的内部过程亦涉及对视听作品的改编。Sora基于对海量视频数据的理解,学习事物之间物理关系的表达。GenAI并非实质性地以某单部作品为基础进行再创作陶乾《论著作权法对人工智能生成成果的保护——作为邻接权的数据处理者权之证立》,《法学》2018年第4期,第9页。。Sora在算法生成逻辑上具有融合性,即它对事物物理性质的理解不是基于单一作品,而是综合多部作品的结果。有观点认为,GenAI生成内容是软件设计版权的演绎作品熊琦《人工智能生成内容的著作权认定》,《知识产权》2017年第3期,第6页。。虽然这种观点在文字作品生成时期存在合理性,但随着GenAI技术的持续进步,逐渐显现出局限性。特别是文生图大模型的出现使这种观点难以自圆其说。大模型对物理矢量的理解已经摆脱了版式设计的固定性要求,如果将视频的表达形式视为软件设计的版式,而版式是相对固定的,这即与GenAI生成形式的多样性与可变性相悖。另外,演绎行为不仅需要忠实在先作品的表达,还需要发展该表达,使两种相似又具有区别的表达形式融为一体。Sora训练的目的是形成对世界物理矢量的理解能力,在理解的基础上对在先视听作品的表达风格进行转换性使用。可见,只是符合“事前授权、事后付酬”的前置条件之下,并不能完全排除经由Sora生成的作品成为演绎作品的可能性。然而,这种传统的授权使用方式对于Sora提供者而言又会是一种巨大的挑战,不仅仅表现在经济成本上,还会徒增沟通成本。因此,在实务中意图套用演绎作品的生成规则并不能有效抗辩Sora对侵犯改编权的嫌疑。

(三)侵犯传播权的风险

Sora使用者的传播权侵权风险主要表现在两个方面,即侵犯信息网络传播权和广播权。传播权并非一项具体的权利,而是一个权利体系,它由表演权、放映权、广播权和信息网络传播权构成,是不依赖于有形载体将作品从一方向另一方传播而产生的权利。在信息网络环境下,使用者使用Sora生成的视听作品诱发的侵权风险,主要涉及对信息网络传播权和广播权的侵犯。

使用者将由Sora生成的视听作品通过信息网络向公众传播(延时发布),可能诱发信息网络传播权侵权风险。我们当下所处的时代,信息传播多是通过互联网进行的,AIGC中包含受著作权保护的客体内容,它们通过有线或是无线的形式传播,存在侵犯信息网络传播权的风险马治国、赵龙《文本与数据挖掘对著作权例外体系的冲击与应对》,《西北师大学报(社会科学版)》2021年第4期,第108页。。一旦将Sora生成的视频作品在信息网络向公众延时传播,公众在其选取的时间和地点内能获取到该作品(按需获取),即构成信息网络传播权侵权。无论是使用有线还是无线的方式传播该视听作品,都是信息网络传播权控制的行为。信息网络传播权是著作权中的经济性权利,它是为作者提供经济价值回报的途径王迁《〈著作权法〉修改:关键条款的解读与分析(上)》,《知识产权》2021年第1期,第35页。。当下,信息网络发布业已是使用者将生成后的视听作品传播并实现其经济价值的重要手段,同时也是作品传播的重要途径之一,Sora使用者在网络上传播存在无法规避的侵犯信息网络传播权风险林秀芹《人工智能时代著作权合理使用制度的重塑》,《法学研究》2021年第6期,第178页。。

使用者将经由Sora生成的视听作品通过信息网络向公众公开发布,还涉嫌侵犯广播权。我国《著作权法》第十条将《伯尔尼公约》第十一条之二的“广播和相关权”的规定确定为以“有线或者无线方式公开传播或者转播作品,以及通过扩音器或者其他传送符号、声音、图像的类似工具向公众传播广播的作品的权利”。虽然从法条上看,广播权的三项中并未包含使用信息网络传播作品的情形,但是考虑到《伯尔尼公约》订立时并未出现信息网络这一传播方式,根据当时的立法背景,应当对其作扩大解释,推定广播权的传播方式应当包括信息网络,这点也在1996年缔结的《世界知识产权组织版权条约》(World Intellectual Property Organization Copyright Treaty,WCT)第八条得以确认,即“使公众中的成员在其个人选定的地点和时间可获得这些作品”。因此,使用者将Sora生成的视听作品在信息网络上传播存在侵犯广播权的风险。

三" 治理障碍:Sora使用者侵权风险治理难题

(一)“接触+实质性相似”规则适用困难

通说认为,使用者使用他人在先作品指令Sora融合创作即已构成对该作品的实际接触。因此,对于“接触”要件而言并不存在适用障碍。但“实质性相似”要件则不然,在传统知识产权侵权场景下,“实质性相似”规则可以防止行为人滥用知识产权法中的公众接触权吴汉东《试论“实质性相似+接触”的侵权认定规则》,《法学》2015年第8期,第65页。。然而,在使用者与Sora融合生成的创作模式中,使用“接触+实质性相似”规则判定侵权时常常发生适用障碍。无论是使用者文本指令包含的在先作品思想,还是算法服务提供者收集的用于生成视听作品的作品表达,它们经由Sora融合创作后,在先作品中的实质性表达部分常常难以为一般公众所觉察。因此,在思维与表达分属于使用者和Sora的融合创作过程中,用于事后判定侵权的“接触+实质性相似”规则或将难以适用。一方面,“实质性相似”主要是应对单个侵权客体而设计的原则。GenAI特别是Sora在使用在先视听作品素材时,其数据并非单一视频素材,其对素材的使用也并非对表达进行简单挪用,更非完整照搬。Sora使用视频素材中的物理矢量是经其理解后的再应用。例如,人物衣服的大小、颜色及其他附件常常是经过重新搭配后的组合应用。又如,人物行走动作和肢体外观都是经理解后的矢量转换。因此,无论是采用整体观察法,还是显著部位观察法,在不公开算法后台参数的情况下是难以认定其生成内容是否达到实质性相似的标准的。另一方面,在使用者文本指令思想与视听作品表达融合生成的场景下,在先作品描述的场景并不能完全受到“实质性相似”规则的约束。使用者将创作的思想通过文本指令传达给Sora,它再将这种思想以场景化的表达形式融合进入视听作品当中,即在融合创作的过程中,Sora复制在先视听作品的表达行为具有高隐蔽性,在表象上即已脱离“实质性相似”标准可规制的对象范畴,这无疑给司法适用带来障碍。

鉴于此,依赖事后的“接触+实质性相似”标准,已难以有效应对使用者与Sora共同参与下的新型侵权判定。因此,应当着力于强化事前风险防范机制,希冀融合事前防范措施与事后“接触+实质性相似”规则,有效化解侵权认定的障碍。

(二)在先权利人维权举证困难

当事人诉讼地位的不平等和Sora侵权的隐蔽性使在先权利人(受害人)举证困难,甚至常常发生举证不能。归责标准取决于应用场景,在AIGC侵权案例中,在先权利人负担的举证责任较高,而且他们往往处于相对弱势的地位,很难掌握强有力的侵权证据臧志彭、丁悦琪《中国AIGC著作权侵权法律规制的优化路径》,《出版广角》2023年第24期,第27页。。美国Sarah Andersen v. Stability AI案正是因为原告(个人联合诉讼)提供的证据不足,致使一审法院驳回艺术家们的大部分请求,原告不得不撤回损害赔偿的诉请美国Sarah Andersen v. Stability AI案,即Kelly McKernan,Karla Ortiz和Sarah Andersen代表其他艺术家向美国加州北区联邦地区法院诉AI公司(Stability)、DeviantArt公司(DeviantArt)及Midjourney公司(Midjourney)等侵害其著作权的案件。。无独有偶,正在审理的The New York Times Company v. Microsoft Corporation,Open AI,INC案也涉及举证困难的问题,致使《纽约时报》陷入维权窘境之中。

知识产权法系私法,它以“过错原则”为首要举证原则,即在先权利人有义务证明Sora使用者的行为与侵权结果之间存在直接联系(因果关系)。换言之,只有Sora使用者存在过错,才会导致其承担侵权责任的可能性。然而,只有当被告因直接故意(明知+希望)实施侵权行为时,才承担损害赔偿责任。因为AIGC的出现具有随机性与不可预见性,且发明Sora的目的并非希望实施侵权行为而受益。可见,无论是Sora服务提供者,还是使用者,构成直接故意的主观心理态度的可能性较小朱振《归责何以可能:人工智能时代的自由意志与法律责任》,《比较法研究》2022年第1期,第53页。。因此,对于服务提供者而言,其承担侵权责任的可能性相对较小。以复制权为例,对于在训练Sora时被临时复制在算法逻辑当中用来理解视频要素的物理矢量而言,因被Sora提供者掌握,在先权利人取得相关证据的难度很大,更不用说证明他们与生成视听作品存在关联性。

引证视听作品与生成的视听作品之间的关联关系隐蔽,致使在先权利人常常举证不能。在先权利人或主张Sora使用者侵权,即认为使用者在从文本指令输入直至视听作品生成和传播这个过程中承担侵权责任。然而,著作权法保护表达而不保护思想。引证作品所内含的思想经Sora转换性处理后,常常被多部视听作品的融合物理矢量表达出来,尽管引证作品中的部分场景仍然会被争议为在先视听作品的保留,但在缺少必要的后台技术支撑的情况下,仅凭在先权利人的智慧仍然难以有效辨别其与在先作品之间的实质联系。因此,即使被诉视听作品被用于信息网络传播,权利人也难以举证其思想源于引证作品,更不用说该作品已经获得复合性的表达形式。由此可见,思想与表达主体分离带来的关联性弱化,无疑给权利人的维权诉请带来了较重的举证负担。

法律不能强人所难,要求在先权利人举证这种隐藏于AIGC背后的侵权行为或已失去合理性。较重的举证义务将导致权利人丧失获得司法救济的权利,这也变相助长了Sora使用者滥用他人在先作品的行为,破坏了人类知识产权秩序。

四" 风险纾解:Sora使用者侵权治理的因应路径

鉴于事后的“接触+实质性相似”标准和“过错责任”原则带来的Sora使用者侵权治理障碍,不仅应当从披露主体、披露内容层面完善我国算法披露制度,同时引入在先作品使用背书制度,以此强化我国GenAI治理的事前风险防范机制。此外,还应当适度探索“举证缓和”制度和灵活使用“过错推定”原则,融合事前防范与事后治理的综合应对。

(一)完善披露制度以期健全事前防范机制

Sora与使用者融合生成场景表现出新的侵权特点,仅凭“接触+实质性相似”判定标准已无力应对。因此,需要完善和巩固算法披露制度,以此健全我国应对GenAI侵权风险的事前防范机制。当下,我国业已初步建立由《生成式人工智能服务管理暂行办法》、《互联网信息服务深度合成管理规定》、《互联网信息服务算法推荐管理规定》、《网络音视频信息服务管理规定》等行政法规构成的算法披露制度体系,但是仍然存在披露主体单一、披露内容片面等问题。为此,建议将使用者纳入披露主体范畴,将生成的视听作品纳入披露内容之列。此外,还应建立文本指令使用背书制度,以规范Sora使用者的行为。

1.将Sora使用者纳入披露主体的范畴

当前,在我国主要由GenAI服务提供者承担算法披露义务。例如,《互联网信息服务深度合成管理规定》将Sora提供者(深度合成服务提供者,含技术服务支持者)作为主要的披露义务主体,从信息标识内容上明确了具体的披露义务。又如,《互联网信息服务算法推荐管理规定》将算法推荐服务提供者作为主要规制对象,使之担负在算法推荐中有关信息合成内容的披露义务《互联网信息服务算法推荐管理规定》第九条第一款规定:“算法推荐服务提供者……发现未作显著标识的算法生成合成信息的,应当作出显著标识后,方可继续传输。”。可见,当下我国与著作权制度相关的算法披露义务主要由算法服务提供者承担。鉴于使用者的文本指令来源具有强隐秘性,在先权利人往往难以举证生成后的视听作品源于引证作品,同时,在司法实践中“接触+实质性相似”规则应用存在前述障碍,这些因素往往使在先权利人无法通过一般诉讼程序维护其合法权益,给我国著作权制度的正常运行带来障碍,因此,建议将Sora使用者纳入披露主体范围,以此完善我国算法披露主体制度。

2.将Sora生成物纳入披露内容之列

建议将经由Sora生成的内容作为算法披露对象,对生成的视听作品作必要的权利标识。披露制度的目的之一即是消除在先权利人与Sora使用者之间的信息差。为了在生成后的视听作品和在先作品之间建立易于察觉的关联关系,维护在先权利人的合法利益,增强作者的创作热情,Sora使用者不仅应当对被选择的文本指令负责,也需要对生成的视听作品负责。同时,公众可以借此机制对争议视听作品在传播过程中的权利风险作出预判,减轻事后侵权诉讼中的举证负担。具体而言,一方面,生成后的视听作品应当在显著部位注明经由人工智能生成(如水印),以防止该作品在信息网络传播中发生二次权利侵害。人工智能生成内容标识义务已经逐渐成为业界之共识刘晓春、夏杰《人工智能标识义务的功能与实践》,《中国对外贸易》2023年第11期,第52页。,对治理虚假新闻和深度伪造等具有重要意义张惠彬、王怀宾《版权优先还是技术优先?——法国应对AIGC版权风险的趋势及启示》,《编辑之友》2024年第5期,第108页。。另一方面,生成后的视听作品还应在明显部位标注权利管理信息,将使用者的署名、文本指令涉及的权利信息,例如作品名称、作者姓名等在明显部位标注。此外,GenAI开发者应将AIGC归属方案嵌入AIGC信息框架之中, 确保公众可以及时确定生成内容的权利归属陈俊凯《人工智能生成内容信息披露机制构建研究》,《中国科技论坛》2024年第3期,第164页。。

3.引入在先作品使用背书制度

作为一种强制性的行政监管制度,在先作品使用背书机制的核心任务在于记录GenAI算法在训练过程中使用在先视听作品的明细,如作品名称、作者、使用章节和使用者信息、使用目的以及作品上下文语义等,旨在记录Sora提供者、使用者及其他相关主体进行GenAI视听作品创作的行为。引入背书制度的目的在于记录Sora生成视听作品的文本指令的来源和内容,而非仅仅是训练Sora的视频数据权利信息。在使用者使用端,背书制度能很好地记录使用者用于指令Sora进行整合创作的文本作品指令的权利信息。在制度设计上,背书机制是一种弱公示制度,背书信息公开的对象不仅仅是在先权利人,还应当包括接触Sora生成内容的一般公众。背书制度的基础运行逻辑是算法设计者设计背书功能、Sora实时执行背书任务、在先作品权利人和相关使用者了解背书内容、使用者和其他公众知悉Sora使用在先作品训练的情况。该制度一方面能有效回应合理使用制度在Sora训练中的应用要求,缓和Sora训练过程中涉及的在先视听作品权利冲突,平衡技术发展与权利保护的双重要求;另一方面能从技术层面为在先权利人在权利争议诉讼中提供充足的证据支持,减少不必要的举证压力,是一项融合事前防范与事后救济的重要权利保障措施。

(二)使用“过错推定”原则应对在先权利人举证难题

因Sora表达与使用者文本指令融合生成过程具有黑箱特性(隐蔽性),与案件有关的绝大多数证据都被算法服务提供者和使用者控制,在先权利人难以取得作品使用情况和对方心理状态,这些给在先权利人带来较重的举证压力,使在先权利人承担了不合理的举证义务,常常发生举证不能的障碍。为实现个案公平和提高司法效率,可以尝试探索如下两条路径。

1.适度探索“举证缓和”制度

“举证缓和”制度即应用柔性的方法在个案中调整弱势一方当事人的举证义务。“举证缓和”是在尊重“过错原则”的基础上,适当调整在先权利人的举证义务范围。该制度应用的前置条件是在先权利人已经穷尽必要的举证手段,履行了最大限度地收集并提出证据的义务,在此基础上赋予法官相对较大的自由裁量权,减轻诉讼弱势方即在先权利人在案件中的举证义务。然而,Sora提供者和使用者凭借技术优势,往往会故意地损毁、隐匿有关侵权参数、材料以及使用记录等重要的证据材料,发生“举证妨碍”。“举证缓和”的实质是赋予法官自由裁量权以推动实现个案公平,该制度是化解举证障碍的首选路径。

2.尝试灵活应用“举证责任倒置”

由在先权利人承担必要举证义务的基础上,灵活应用“举证责任倒置”规则。人工智能技术的专业性及黑箱属性使受害人面临举证困难,他们无力识别风险、证明产品缺陷以及其因果关系。反观Sora提供者,他的风险预见和控制能力更强王利明《论我国侵权责任法分则的体系及其完善》,《清华法学》2016年第10期,第119页。,故可以尝试适用“举证责任倒置”规则。现实中,Sora具有很高的技术壁垒,其技术相对封闭,“过错推定”原则要求证明被诉方无过错,这对他们而言并非难事。因此,建议尝试灵活应用“举证责任倒置”。但是,并非绝对由Sora提供者和使用者承担证明其行为与侵权结果之间不存在因果关系的义务,而是先由在先权利人承担必要的举证义务。例如,要求在先权利人证明由Sora提供者和使用者具有侵权的明显表征和较大可能,但又无力提供实际侵权的证据时,再由法官将举证义务转至Sora提供者和使用者,由他们证明自己未实际实施侵权行为,或者证明他们的行为与侵权结果之间不存在因果关系。域外已经尝试该制度,如欧盟在《人工智能责任指令》(AI Liability Directive)中对可反驳的因果关系进行推定,对于人工智能算法产品侵权案件,原告进行了必要的举证义务后,可要求相对方披露相关证据以帮助确定潜在的责任方,若被告未按法院要求披露,法院会推定被告违反了规定的证据披露义务“Artificial intelligence: MEPs want to ensure a fair and safe use for consumers,” European Parliament, last modified Feburaty 12, 2020,https://www.europarl.europa.eu/news/en/press-room/20200206IPR72015/artificial-intelligence-meps-want-to-ensure-a-fair-and-safe-use-for-consumers.。可见,该制度可为应对我国当下或者将来可能面临的治理困局提供必要的借鉴。

[责任编辑:苏雪梅]

猜你喜欢
著作权
我国构建著作权延伸性集体管理制度可行性探析
浅议影视中文字幕组侵权问题
商情(2016年39期)2016-11-21 10:00:45
广播行业与音乐著作权集体管理组织的冲突与合作
中国广播(2016年10期)2016-11-18 13:26:52
浅谈体育赛事与体育赛事节目
人间(2016年27期)2016-11-11 17:38:52
数字出版的著作权保护问题研究
企业导报(2016年20期)2016-11-05 18:57:19
试论我国房地产行业知识产权立体化保护策略
浅析新媒体时代的版权之争
误读为“演绎”的“同人”
浅谈新媒体时代文艺作品的保护方法
信息时代图书馆数字化服务中的著作权问题探析