生成式人工智能与著作权法:法律挑战与未来展望

2024-12-06 00:00李依琳
江汉学术 2024年6期

摘 要:生成式人工智能基于对现有作品的学习极大地降低了人类的创作成本。虽然现有的法律可以回答生成式人工智能带来的大部分与著作权相关的问题,但答案可能并不符合受生成式人工智能影响的创作者们的预期。尤其是对合理使用原则的判断,不同国家法院、法官的判决是不同的。除了生成式人工智能的学习阶段,它产生的输出结果也可能是可以被授予著作权的。考虑到生成的作品与人类作者之间错综复杂的关系以及数字内容分发的全球性,与生成式人工智能有关的著作权规则亟须在国内和国际层面做出更新,而不是仅仅依靠判例来阐明。

关键词:生成式人工智能;著作权;著作权法;合理使用原则;机器学习

中图分类号:TP18;D923.41 文章标志码:A 文章编号:1006-6152(2024)06-0005-11

DOI:10.16388/j.cnki.cn42-1843/c.2024.06.001

人工智能,也称为机器学习技术,是指应用数据逐步改进其功能和输出的软件。无论是接收有关新流媒体节目的推荐,还是向数字助理询问天气预报,人工智能技术都构成了上述算法的基础,可确保用户接收到准确、相关的信息。ChatGPT和Midjourney等生成式人工智能产品的爆火,让大众意识到人工智能极有可能改变目前的生产结构。

生成式人工智能不仅对现代科技带来了革新,甚至可能超出了传统著作权法律的“预期”。为了解答现有的著作权规则是否可以适用生成式人工智能,本文将分析机器学习的运作原理,进而考察它在著作权法合理使用框架下的适用性,并对生成式人工智能创作的作品是否符合著作权保护的条件以及如何从法律上界定人工智能与人类作者的创作关系做出回应。最终,针对生成式人工智能引发的法律环境变化及潜在问题,提出相应的对策和建议。

一、生成式人工智能的学习逻辑

生成式人工智能是能够使用生成模型生成文本、图像或其他媒体的人工智能。生成式人工智能模型学习输入的训练数据的模式和结构,然后生成具有相似特征的新数据[1]。生成式人工智能和机器学习技术并非放之四海而皆准,它们具有多种结构和算法,针对不同的任务会有不同的编程。因此,任何关于机器学习和由此产生的关于生成式人工智能的法律影响的讨论都需要避免对一般技术得出笼统的结论,而应该根据具体情况考虑基础技术及其对受著作权保护材料的处理。生成式人工智能是一种计算机系统,旨在(几乎)独立于人类程序员做出预测或决策。它能实现各种功能,包括生成图像、代码等。为了做出预测,人工智能必须通过机器学习,这涉及处理大量输入的训练数据以识别模式。输入到数据集中的训练数据越多,输出数据就越精确和有价值。例如,用于预训练GPT-2的WebText语料库包含超过800万个文档和40GB的文本①。通常,这些庞大的数据集包含受著作权保护的材料——照片、绘画、书籍或计算机源代码,而且大多数时候著作权所有者并不知道他们的材料在机器学习中被使用。

以生成式人工智能技术发展最为迅猛的美国为例,在GitHub、微软和OpenAI诉讼中,上述公司希望法院驳回一项集体诉讼,该诉讼指控这些公司窃取许可代码来构建GitHub的AI驱动工具——Copilot②。Copilot于2021年推出,它利用OpenAI的技术直接在程序员的代码编辑器中生成代码行。该工具是根据GitHub的公开代码进行训练的,它接受了从网络上抓取的公共代码存储库的培训,其中许多代码都带有许可证,要求任何重复使用代码的人都必须注明其创建者。Copilot被发现在没有提供许可证的情况下使用长段许可代码,从而引发了这场诉讼。本案中,原告方的代码为开源代码,其核心诉求在于要求法院认定被告的行为属于《数字千年版权法》(Digital Millennium Copyright Act,DMCA)第1202(b)条下的侵权行为,即未经许可不得删除关键的“版权管理”信息。但加州法官乔恩·蒂加(Jon Tigar)驳回这一诉求,理由是Copilot建议的代码与开发人员自己受版权保护的作品不够相似,因此第1202(b)条不适用。

像微软和OpenAI这样,从网络上抓取受著作权保护的材料来训练AI系统以盈利的公司,远非少数。例如开源程序Stable Diffusion也是以完全相同的方式创建的。这些项目背后的公司坚称,他们对这些数据的使用在美国受到合理使用原则的保护。针对Stable Diffusion、DreamStudio、DreamUp 和 Midjourney 的著作权侵权起诉中,原告认为,Midjourney、Stability AI和DeviantArt 创建的人工智能艺术工具非法从互联网上抓取艺术家的作品,违反了著作权法③。因为上述三家公司都在名为Stable Diffusion 的软件库上构建了他们的人工智能图像生成器,该软件库由Stability AI开发。Stable Diffusion是一个文本到图像的潜在扩散模型,该模型建立在称为“扩散”的技术过程之上:首先对程序进行训练,使它能够重建输入的图像,然后它可以在输入提示时生成新图像。原告认为,“扩散模型的主要目标是以最大的准确性和保真度重建训练数据的副本,这一目的明显是为了复制”。原告声称,这些复制的图像被用来创造“衍生作品”,“这种作品包含了足够多的原始作品,以至于它显然源自原始作品”。本案于今年八月略微取得了一些进展,加利福尼亚北区的威廉·奥里克法官在Andersen诉Stability AI案中部分批准并部分驳回了对首次修订诉状的驳回动议。尽管该命令只是此案漫长审理过程中的早期步骤之一,但该命令明确指出,生成式AI模型与过去著作权纠纷中的核心技术不同,关于AI模型如何运作以及它们是否构成侵权的问题将因模型及其摄入的作品类型而有所不同。无独有偶,Getty Images 也起诉了Stability AI,指控该公司的Stable Diffusion 工具“非法”从网站上抓取图像④。该案目前尚未有进一步审理的细节。因此,本文在此将以Stable Diffution的工作原理分析著作权问题,借此案抛砖引玉,分析AI模型的“学习”逻辑。

Stable Diffusion 在LAION-5B数据集上进行训练,而这些数据集中的大部分图像均受著作权保护。虽然LAION-5B包含58.5亿个图像文本对,但LAION声称不拥有这些图像的所有权。正如它所指出的那样:“这些图像受到著作权保护。”⑤问题在于这些产品能够响应创作者的任何“风格”图像提示,比如用户可以要求人工智能工具以宫崎骏的风格创作猫,而产生的收入没有一项会流向输出作品所模仿的作品的艺术家,在这些产品基于他们的作品构建之前,他们甚至没有被咨询或告知。人工智能学习的作品在这些人工智能的用户协议中被称为“贡献者”(contributor),这个词非常准确地揭示了如果没有画家、插画家、摄影师、雕塑家和其他艺术家的工作,Stable Diffusion 和其他图像类生成式人工智能产品就不可能存在。

根据Stable Diffusion的工作原理,Stable Diffusion即使在早期训练中也不存储复制的作品。首先,Stability AI并未通过互联网上获取的图像或图像数据创建其基础模型,执行这些操作的一方是LAION-5B,LAION-5B在OpenAI旗下的CLIP(对比语言—图像预训练)技术的辅助下执行。Stable Diffusion是Stability AI拥有的一款生成式人工智能系统,它在LAION-5B数据集上进行训练,Stability AI是LAION的捐赠者或投资者,但Stability AI并未在收集LAION-5B数据集的过程中起到任何直接作用。其次,LAION并不是以复制的方式在互联网上收集图像。LAION是使用公共网络档案 Common Crawl中的图像数据创建训练数据集。从2008年开始,Common Crawl组织爬取网络,从近年来大约30亿个包含图像的全球网络网站中收集图像和文本信息。Common Crawl并不捕获或下载实际的图像,而是收集原始网页数据、提取元数据和文本。Common Crawl将数据存储在WAT(Web Archive Transformation)文件中,使用WebAssembly文本格式将网页数据(包括有关图像的数据)存储为中间形式并重新组装为二进制代码,以便Web浏览器或其他工具可以读取并进一步处理。WAT文件不包含实际的.jpg或.png文件或任何其他数字格式的图像文件。Common Crawl在WAT文件中存储和发布的数据提供了足够的信息,使最终用户(如LAION)能够评估网站上图像的元数据和alt-txt数据,而无须复制或下载实际的图像。[2]

LAION对Common Crawl的数据集处理流程包括三个主要步骤:

第一,网页过滤。为了从Common Crawl中提取图像文本对,LAION解析Common Crawl的WAT元数据文件中的HTML IMG(图像)标签。具体而言,LAION关注具有alt文本的图像,以便创建图像文本对。alt文本是IMG标签的HTML属性,包含在相应图像无法渲染情况下的替代文本。例如,用于视觉受损的人的屏幕阅读器软件可能会阅读alt文本,搜索引擎也可能会使用alt文本以便更好地索引网页,而无须分析实际图像内容。在提取alt文本之后,LAION使用CLD3进行语言检测,有三种可能的输出:英语、其他语言或未检测到语言(即,所有检测都低于置信度阈值)。LAION将结果数据存储在PostgreSQL服务器中,以便流程的后续阶段进行处理。LAION始终在服务器上保留约500M图像URL。

第二,下载图像文本对。为实现资源利用的最大化,LAION利用Trio 和 Asks Python库使用异步请求从解析的URL中下载原始图像⑥。为了控制成本,LAION选择了一个具有2个虚拟CPU、1GB RAM和10Mbps下载带宽的小型云节点作为工作实例(worker instance)⑦。这样的工作实例可以在约10—15分钟内处理1万个链接。LAION并行使用大约300个工作实例,并将工作负载批量化为从上述PostgreSQL服务器获取的10,000个链接块。

第三,后处理。在从Common Crawl下载WAT文件后,LAION删除了文本少于5个字符、图像数据少于5 KB以及潜在恶意、大型或冗余图像的数据。为了完成流程,LAION根据其内容过滤了图像文本对。具体而言,LAION使用OpenAI的ViT-B/32 CLIP模型计算图像和文本编码之间的余弦相似性。对于非英语语言,LAION使用了来自Carlsson等模型的多语言ViT-B/32 CLIP。尽管后来OpenAI发布了更大的CLIP模型,但在开始组装LAION-5B时这些模型尚不可用。为了保持一致性,LAION依赖于整个数据集的ViT-B/32 CLIP模型。LAION删除了所有余弦相似度低于0.28的英语图像文本对以及所有其他相似度低于0.26的图像文本对。此步骤删除了原始500亿图像中的近90%,最终留下了将近60亿图像文本对[2]。

上述介绍来源于LAION的开发者论文介绍,对于非计算机相关专业的人士而言,可能非常晦涩难懂,但是在讨论是否涉及侵权时,我们只需要考虑一件事,那就是整个过程中,LAION不存储实际的.jpg或.png文件或任何其他数字格式的图像文件。它只存储从Common Crawl WAT文件中获取的经过筛选、策划的网页数据。当 LAION-5B 等数据集完成后,Stability AI等客户端将使用该集中的数据作为其图像生成系统的基础模型。该软件不会以拼贴画的形式拼凑图像,而是根据这些数学表示从头开始创建图片[3]。

二、生成式人工智能是否构成对作品的

合理使用

人工智能生成技术是否侵犯著作权法是一个复杂的问题。虽然人工智能工具的创造者认为,合理使用原则涵盖了使用受著作权保护的数据训练该软件⑧,但合理使用的判断是需要法院进行的,而且由于数据来源和人工智能公司所在地的不同,不同国家法院对是否构成合理使用的判断也可能不同。

合理使用原则的目的是平衡著作权赋予其所有者的保护与更大的社会利益[4],并促进创造力、教育和言论自由。合理使用是著作权的一个例外,允许在未经所有者同意的情况下使用受著作权保护的材料进行评论、新闻报道、教学、奖学金或研究。合理使用是法律和事实的混合问题,意味着判断某事是否构成合理使用是针对特定案例的。通行的判断方法是基于伯尔尼公约第九条第二款确立的三步测试法:(1)在某些特殊情况下才允许例外;(2)不与作品的正常利用发生冲突;(3)不无理损害作者(或其他权利人)的合法利益。该测试源自1967年斯德哥尔摩会议对《伯尔尼公约》的修订,现已成为若干国家著作权法及一些国际协议的组成部分。但是由于国际层面判例法的稀缺,这些步骤的具体含义仍然存在不确定性,该测试的实际含义并没有在各国达成一定程度的一致意见[5]。

考虑到目前知名的人工智能技术公司基本上注册地都在美国,因此本文在此主要分析美国和中国对于合理使用的定义。巧合的是,目前中国和美国也都有就生成式人工智能是否构成合理使用展开讨论的案子,分别是:纽约时报诉OpenAI、微软案⑨和小红书画师诉讼案[6]。

在美国,对于合理使用的判断主要基于以下四点:(1)使用的目的和性质,包括此类使用是商业性质还是非营利目的;(2)著作权作品的性质;(3)与受著作权保护作品相关的使用部分的数量和实质性;(4)使用对受著作权保护作品的潜在市场或价值的影响⑩。

商业性是指如果侵权者在未向著作权所有者支付惯常价格的情况下,利用受著作权保护的材料获利,法院将推定其为商业用途。如果人工智能所有者向最终用户收费,在人工智能网站/应用程序上托管广告,或以其他方式(比如通过收集和出售用户数据),不论直接或者间接都可以认为其获利。然而,作为第一个因素(使用的目的和性质)的一部分,美国法院会权衡该使用的变革性程度(transformative),即以新的表达方式、含义或信息改变原件的程度。作品越具有变革性,法院就可能越不重视其他可能不利于合理使用的因素,例如商业化、复制作品的重要部分等。比如在世嘉诉Accolade案中,法院就认为复制竞争对手的计算机程序代码以了解其未受保护的功能元素并确保被告的新程序与竞争对手的游戏机兼容是合理使用⑪。不过在本案中被告没有在其新程序的代码中使用竞争对手代码的创造性元素。另外,在Campbell诉 Acuff-Rose Music中,法院也指出如果其结果和原始受著作权保护的作品服务于不同的市场功能,也可以被认为是变革性使用。同时本案还确立了商业模仿可以被视为合理使用,作品赚钱这一事实并不意味着合理使用就无法适用,它只是合理使用分析的组成部分之一12。在作者协会诉Google案中,法院明确确认Google图书项目符合合理使用的所有法律要求。Google图书项目通过扫描和数字化将受著作权保护的书籍转变为在线可搜索数据库,这属于提供了一些新的和不同于原始的东西或扩展了它的效用,从而服务于著作权的总体目标,即为公众知识作出贡献13。同理,法院也认为搜索引擎制作受著作权保护的书籍或图像的缩略图或片段是变革性的合理使用,因为它提供了另一种功能,而不是潜在的创意内容。通过在图像搜索功能中提供图像缩略图,搜索引擎没有进行艺术表达,而是改善了对互联网信息的访问14。基于上述判例,本文认为在机器学习的最终目标是新功能的情况下,法院很有可能认为其使用具有变革性。OpenAI公司也提出,在机器学习数据集中包含受著作权保护的材料是合理使用,其使用的目的和特征是具有变革性的。与原作的“人类娱乐”目的不同,机器训练的目的是学习“人类生成的媒体中固有的模式”。不过美国法院也明确指出,合理使用的决定没有公式可循,作品具有变革性这一事实并不能决定问题的答案。

在考虑与受著作权保护作品相关的使用部分的数量和实质性因素时,如果被告使用了过多的原始著作权作品,则可能认为被告向公众提供了“竞争性替代品”,更可能被认为不符合合理使用特征13。法院判断时不仅会考虑是否有大量内容是从受著作权保护的作品中复制的,还会考量最终产品中的大部分是否仅由复制的材料组成12。在机器学习的情况下,训练数据集基本上包含完整的作品。从表面上来看,这可能不利于合理使用的认定。然而,根据本文第一部分对于生成式人工智能学习过程的梳理,如果ChatGPT也是同样的工作逻辑,那么它并没有真正对作品进行复制。此外另一个需要考虑的关键事实因素是它是否向最终用户一比一还原了训练数据集。如果只讨论学习这一阶段,那么它实际上并不存在向“公众提供”。

最后是使用对受著作权保护作品的潜在市场或价值的影响。这意味着如果使用旨在“替代”原始作品并竞争其市场,则不太可能符合合理使用。在分析检查使用是否损害著作权所有者销售或许可其作品的能力时,本文发现虽然生成式人工智能技术是否侵权仍在讨论中,但一些公司已经将他们的数字艺术需求外包给人工智能,因此生成式人工智能将与人类创造者竞争不仅仅是一个假设。GitHub集体诉讼的主要原告Matthew Butterick认为,编写代码的人工智能可能会“饿死”开源社区。按照其说法,人工智能将消除开发人员发现和贡献“传统开源社区”的动力,使开源代码的创建和持续开发成为可能,从而扼杀开源软件的增长和发展。目前尚不清楚对开源社区的潜在需求减少是否足以得出给市场带来负面效应的结论。然而,这似乎违背了著作权的最终目标——通过让潜在创作者独家控制其作品的复制来扩大公众的知识和理解,从而为他们提供经济激励来创作信息丰富、知识丰富的作品供公众消费。更有甚者,在纽约时报诉OpenAI、微软的起诉中,纽约时报提到GhatGPT和Bing浏览器插件输出的内容包括对旗下文章的逐字摘录,这毫无疑问会影响纽约时报的订阅和广告收入⑨。

至于中国,根据《中华人民共和国著作权法》(以下简称《著作权法》),合理使用是有明确前提的:在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益。不过《著作权法实施条例》在第19条又约定:“使用他人作品的,应当指明作者姓名、作品名称;但是,当事人另有约定或者由于作品使用方式的特性无法指明的除外。”从法律文本本身来看,似乎合理使用在大部分情况下必须指明作者姓名或者名称、作品名称。但是从目前的判例来看,这一点仍有争议。在上海知识产权法院对上海美术电影制片厂与浙江新影年代文化传播有限公司、华谊兄弟上海影院管理有限公司著作权侵权纠纷一案作出的二审判决中,法院认为,新影年代公司在涉案电影海报中的背景图案引用“葫芦娃”“黑猫警长”美术作品属于合理使用15。其中说理部分法院指出:“海报中虽未对‘葫芦娃’‘黑猫警长’标注作者姓名,但未署名并不当然影响对作品合理使用的认定,仅可能涉及对作者署名权的侵犯,况且指明作者姓名、作品名称的情形,还要结合作品使用方式的特性予以综合判断,不能一概而论。例如,在文字作品中引用他人文章中的表述时,应该通过脚注或尾注等方式予以注明。但是根据海报等宣传画的作品属性和创作特点,基于海报画面完整性要求,未在画作中标注被引用形象作者的做法亦属正常且合理。”另外,在最高院审理的王巨贤与绍兴市水利局其他著作权权属侵权纠纷审判监督民事判决书中16,最高院提到:“虽然原二审判决和原再审判决在未区分室外艺术作品本身署名情况的前提下,一概认定对室外艺术作品进行合理使用时需指明原始绘画作者身份,对著作权法相关规定的理解有不当之处。但在本案中,鉴于绍兴市水利局并非任意的社会公众,其作为景区的管理者,在出版全面介绍景区的旅游图册时,对于景区内雕塑等作品的权利状况应负有更高的注意义务。且综合案件事实,《康乾驻跸碑》碑记上有署名,故原二审判决和原再审判决判令其在相关报纸上刊登声明,指明王巨贤为相关绘画作者并无不当,其判决结果正确,应予维持。”

基于上文对于人工智能模型工作原理的梳理以及对合理使用定义的分析,本文认为,不论是在中国还是美国,用受著作权保护的数据训练人工智能模型在法理上都可能会被视为合理使用。然而,这一结论仅仅针对学习阶段,对于输出结果是否侵权则完全可以依靠通俗的著作权侵权判断办法——接触+实质性相似。

三、生成式人工智能生成的作品的

定性和侵权问题

在讨论生成式人工智能生成的作品的定性之前,本文需要预设一个前提——该人工智能的生成物不构成侵权。根据大多数国家的著作权法,作品的创作者通常被视为著作权所有者。除了英国等少数几个承认由计算机生成且无人类创作者参与的作品受到保护的国家外,普遍认为作品的作者应当是自然人。当一个作品由人工智能创作时,“计算机生成作品”的“作者”被定义为“为创作作品进行必要安排的人”[7]。在这个定义下,对于这个“人”指的是谁自然有多种解释。是生成模型的开发者或运营者?还是模型本身?还是使用模型的人?

回顾作品的生成过程,至少以目前的技术力来说,最终的作品仍需要人类工作的参与,只是参与的多少决定了最后作品的精致程度。既然著作权保护的是人类创造力产物,那么只要有人类创造力的贡献,就不能简单地说人工智能作品都不能被著作权法保护。另外,笔者这里还想要释明一点,美国并不是否认人工智能生成的作品获得著作权保护的资格,而是不认可人工智能技术被登记为作者。因为美国的宪法和著作权法中使用的“作者”一词排除了非人类[8]。是否能被授予著作权还需要具体情况具体分析,特别是人类如何运作及使用人工智能工具来创作最终作品,比如人工智能贡献的是“机械复制”的结果,还是作者“将自己原始的心理概念通过人工智能技术实现了‘可见的呈现’”。

美国版权局(USCO)认为,如果作品的传统作者身份要素是由机器产生的,则该作品缺乏人类作者身份。例如,当人工智能技术仅收到人类的提示并产生复杂的书面、视觉或音乐作品作为响应时,“作者身份的传统元素”是由技术而不是人类用户确定和执行的。根据目前USCO的实践情况,本文认为USCO的判断核心是用户不会对此类系统如何解释提示和生成材料进行最终的创造性控制。相反,这些提示的功能更像是对委托艺术家的指令,确定提示者希望描绘的内容,但机器决定如何在其输出中实现这些指令。在考虑是否授予Théâtre D’opéra Spatial(太空歌剧院)的著作权时,USCO表示该作品不符合著作权资格17。虽然该作品的制作者Jason Michael Allen向USCO提交过书面解释,详细说明了他为了作品的完成做了多少努力以及他对原始图像做了多少修改,包括但不限于使用Adobe Photoshop来修复缺陷,使用Gigapixel AI来增加尺寸和分辨率。Allen指出,创作这幅画至少需要624次文本提示和输入修改。最后USCO认可Allen使用Adobe修改的画作部分构成原创作品,然而用人工智能生成的部分不能获得著作权保护[9]。换句话说:Allen可以对这幅画的部分内容进行著作权保护,但不能对整幅画享有著作权。USCO这一判断是基于美国法律明确规定作者只能是自然人,对于人工智能生成部分,被认为是属于机器生成。关于Allen提到的624次文本提示和输入修改,USCO认为,提示过程可能涉及创造力,但这并不意味着向Midjourney 提供文字提示 “实际上形成了生成的图像”。为区分另一个知名的人工智能作品案,本文想用一点篇幅分析Thaler v. Perlmutter18案,在该案中USCO拒绝注册人工智能生成的作品,因为在申请中人工智能系统被指定为作者。该案例争论的重点是人工智能系统是否可以成为作者,USCO裁定不能这样做,因为人类作者是必要的。美国哥伦比亚特区地方法院于2023年8月18日做出判决,确认USCO拒绝注册人工智能生成图像“A Recent Entrance to Paradise”的决定是正确的,因为缺乏人类作者,所以不存在授予著作权的前提。但法院做出该判决的依据是,申请中显示Thaler在使用人工智能生成作品方面没有发挥任何作用。Thaler在登记时明确告知USCO“该作品是‘由机器自主创作的’,他对著作权的主张只是基于他‘拥有机器’这一事实”。换言之,该案并没有解决“需要多少人工输入才能使人工智能系统的用户成为所生成作品的‘作者’”。而这个才是太空歌剧院案中需要解决的问题。对于太空歌剧院的著作权授予,USCO的拒绝理由是,作品中由人工智能生成的不仅仅是微不足道的内容量,因此,在登记申请中必须放弃对此内容的声明。由于Allen不愿意放弃人工智能生成的材料,因此不能按照提交的方式登记该作品。值得注意的是,太空歌剧院案的标准只是基于USCO的指引,目前还未有法院讨论这一观点是否违背美国的著作权法。

不过根据现有的案例,还可以发现关于是否认可自然人在最终的人工智能作品中有独创性表达在不同国家可能会有不同的结果。例如,北京互联网法院针对人工智能生成图片的著作权侵权纠纷一案19中,法院就认可了人类投入在最终作品中有独创性。该案的判决分析了:人工智能生成物是否是作品——是,因为其具备智力成果和独创性的特征。法院提到:“从原告构思涉案图片起,到最终选定涉案图片止,从整个过程来看,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等。涉案图片体现了原告的智力投入,故涉案图片具备了‘智力成果’要件。”“原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。而且原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断……涉案图片并非‘机械性智力成果’。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达。综上,涉案图片具备‘独创性’要件。”对于该案的判决,知识产权领域的知名教授王迁老师曾在其公开讲座中批评过该判决犯了三个错误:其一,没有区分作为思想的智力投入和作为表达的智力投入;其二,误将人工智能不具备自由意志和法律人格作为认定使用者是作者的理由;其三,没有依据“创作”的法律定义认定输入提示词和参数的行为性质20。核心观点在其论文中也提到过:“著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。”王迁老师认为,根据《著作权法实施条例》第3条第2款规定“为他人创作进行组织工作,提供咨询意见、物质条件,或者进行其他辅助工作,均不视为创作”,而人工智能的研发者或使用者对人工智能生成的内容仅有间接影响不能视为创作[10]。其实王迁老师和北京互联网法院的观点之间的核心差异是“需要多少人工输入才能使人工智能系统的用户成为所生成作品的作者”。笔者在此更支持北京互联网法院的观点,独创性本就无高低标准一说,只要与他人的表达不同,且不属于司空见惯的表达,即不能否定其独创性[11]。因此,在这一前提下,肯定人工智能生成作品可被著作权保护的逻辑并没有严重的错误。至于王迁老师提到的“人的智力投入与结果无法对应”,笔者认为这一点并不影响决定作品可以被授予著作权,因为这从来不是著作权法在判定作品时的排除因素。

即使一个普通人在大自然中拍了一张日出照片,也没有人会质疑这张照片不能被授予著作权,这是因为关于摄影作品的可保护性已经明确记录在国际条约和各国立法中了。但是一个有趣的地方是,关于摄影作品的可保护性大约确立在19世纪末21,彼时的摄像技术还处于胶片时代,从准备拍摄到最后冲洗需要耗费大量人力,并且冲洗过程需要人对此进行调整,不同的冲洗选择会令照片呈现不同的光影效果。但是随着科技的发展,尤其是计算摄影的产生,目前的摄像(尤其是用智能手机进行的摄影)已经不完全依赖于人,而更多的是靠算法了。计算摄影的核心涉及使用先进的算法和软件来处理和操纵图像数据,扩展或增强传统摄影技术。举一个简单的例子,使用计算摄影的设备可以通过其内置的人工智能驱动的自动对焦系统实现智能地跟踪拍摄对象并预测其运动,还可以通过人工智能降噪帮助摄影师减少图像中的噪点,尤其是在弱光条件下拍摄的图像,这可以使图像看起来更干净、更专业,而无须花费数小时进行后期处理。毫无疑问,随着计算摄影的发展,在拍摄中,需要人做的工作将越来越少。但为什么没有人质疑过计算摄影下的作品是否可以被授予著作权——因为著作权法已经明确说明,摄影作品可以取得著作权保护。

法院认可生成式人工智能作品的著作权并不代表法院认同这类作品不会侵犯人类作者的著作权以及如果当两个人同时用相同提示词让人工智能生成相同作品时,后生成的就必然构成侵权。虽然目前中国没有类似判决,但Sahuc诉Tucker案22会是回答上面问题的一个非常好的案例。在Sahuc诉Tucker案中,Louis Sahuc 拍摄了新奥尔良杰克逊广场周围的大门,圣路易斯大教堂在雾中升起。他因在同一地点拍摄的一张照片而起诉Lee Tucker侵权。但最终Sahuc败诉,法院认定他对该想法或具体位置没有财产权益。Sahuc没有创造大门、广场、杰克逊雕像、大教堂或雾。照片中的这些元素并非作者的原创作品。同样,雾中杰克逊广场的照片也是一个想法,也不受法律保护。

最后,本文之所以没有具体分析用生成式人工智能生成的作品著作权属于作者还是人工智能的所有者,是因为本文认为这一问题的答案应该是根据这些生成式人工智能的用户协议来约定,这是一个合同问题,而非著作权问题。

四、生成式人工智能相关的产业实践

诚然生成式人工智能是一项跨时代的革新,但这种革新很可能挤压目前创作者的生存空间,尤其是考虑到生成式人工智能利用素材学习的行为有可能会构成合理使用。本文虽然基于现有法律框架认为人工智能训练数据集可能构成合理使用,但是这不代表本文支持这一观点。生成式人工智能的可及性将创造的力量交到了更多人手中,使他们能够参与更多的内容创作,大大降低了创作成本和创作门槛。但是同样地,这种可及性极大地挤压了创作者的生存空间,降低了创作者创造和分享的欲望。

在上文提到的纽约时报诉OpenAI、微软公司一案中,纽约时报就提出OpenAI 的 ChatGPT 和微软的 Bing Chat 可以生成与《纽约时报》文章几乎相同的内容,利用《纽约时报》对新闻业的巨额投资,在未经许可或付费的情况下构建替代产品。而且一些互联网平台利用其庞大的用户体量和影响力,在用户协议里添加对于人工智能使用的授权,令创作者在无意识的情况下把他们上传的作品作为人工智能的学习数据库。比如就有作者发现小红书使用其作品训练人工智能。但根据其使用小红书前必须同意的用户服务协议中的4.2条:“除非有相反证明,您理解并同意,为使用户内容得到更好的分享及推广,提高其传播价值及影响力,您授予小红书公司免费的、不可撤销的、非排他的、无地域限制的许可使用,包括:存储、使用、传播、复制、修订、改编、汇编、出版、展示、翻译、表演用户内容或制作派生作品,以已知或日后开发的形式、媒体或技术将内容纳入其他作品,再许可第三方按照前述方式使用的权利,以及以自身名义或委托专业第三方对侵犯您上传发布的享有知识产权的内容进行取证、发起投诉或提起诉讼的权利。”[6]虽然目前已经有作者起诉了小红书,但截至本文完成时,该案仍未判决。基于上文的分析,笔者认为如果最终生成物与原作品在独创性部分具有相似性,即使是人工智能生成物也必然构成侵权,而且上述条例也有格式条款的嫌疑。可是并不是每个作者都会发现其作品被人工智能学习,也不是每个人都会注意到这个格式条款。比画作侵权更难判断的是语言和声音侵权案件。随着深度学习的发展,基于人工智能的变声算法种类越来越多,一些致力于构建可信人类声音的人工智能还能够解构现有声音并将它合并到最终产品中。但声音模仿通过知识产权很难被完全保护,比如使用者完全可以利用人工智能生成某名人的声音,并用这个声音演唱其原创歌曲。在这种情况下,可能根本不构成著作权的侵权。因此本文更倾向于通过人格权对声音进行保护。虽然声音是否能够被授予人格权在不同国家有不同的标准,但是至少在中国,这个答案是肯定的。根据《民法典》第1019条第一款规定,任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,不得制作、使用、公开肖像权人的肖像。第1023条第二款规定,对自然人声音的保护,参照适用肖像权保护的有关规定。由此可见,即使是普通人的声音,也是可以被授予人格权保护的。可是并不是全球都认可声音可以通过人格权保护。而且在实践中还会发现一些非法律专业的人士很可能在不知不觉中就“卖出”了他们的声音,比如在北京互联网法院的“人工智能声音侵权案”中,被告之一就提到双方约定经原告录制形成的作品著作权属于他所有。

五、结 语

简而言之,本文认为生成式人工智能出于学习目的使用著作权法保护的材料可能属于合理使用的范围,但这个结论可能会因为所处地区不同,甚至是法官的不同而改变。从另一方面来看,虽然生成式人工智能程序本身可能在一些地区不能被视为传统意义上的作者,但生成式人工智能产生的输出成果可能是可以被授予著作权的。

毫无疑问,在未来,生成式人工智能的发展将伴随着版权的争议。如果保护人类创作者,让人工智能公司承担著作权法的责任将可能会遏制这些公司的发展。虽然像微软、Meta这样的老牌公司完全有能力确保数据许可协议并应对法律挑战,可是资本较少的初创企业可能就难以获得竞争所需的数据。但是如果不保护人类作者,人类的创作欲和分享欲将大大降低。因此,本文认为考虑到目前生成式人工智能的生成物著作权的尚未明晰以及配套法律仍待更新,在没有明确人工智能生成物的使用场景前,现阶段对于人工智能生成作品都必须明确标识。在当前的人工智能热潮中,不仅需要制定新的知识产权标准,还需要针对剥削性合同制定法律保护措施,因为创作者们可能会在不知不觉中丧失自己的声音或者作品的权利。甚至大型平台凭借庞大的客户基础、生态体系和资源优势,将更容易建立起生成式人工智能产品的竞争壁垒,享有“先发优势”,从而在这一领域形成“垄断”局面。

著作权法不但是为了保护创作,也是为了繁荣创作。因此,本文认为著作权法不会,也不应该一成不变。当新技术改变了创作的模式,那么就是时候考虑法律是否需要做相应的更新。基于上文的分析,本文认为更新需要分别从国内法和国际法两个层面进行。国内法律需要包括对人工智能背景下合理使用的构成进行更清晰的定义,确定谁拥有人工智能生成的作品的著作权以及制定尊重现有作品著作权的人工智能使用指南。国际层面则需要聚焦跨境著作权纠纷以及制定基本原则。考虑到互联网和数字内容分发的全球性意味着人工智能生成的内容经常跨越国界,进而导致在执行和管辖方面出现诸多复杂性,单靠国内法是无法彻底解决这些问题的。因此,更新国际条约有助于建立更统一的全球标准,确保创作者的权利在全球范围内受到保护,并以一致的方法处理人工智能生成的内容。同时鉴于人工智能技术快速发展的性质,法律和条约的设计应具有适应性,以使它们应该能够适应未来的技术发展,而无须不断进行重大检修。

注释:

① 来自hugging face的简介,参见网址:https://huggingface.co/course/chapter5/4?fw=pt。

② 参见Joseph Saveri Law Firm, LLP公开诉Github、OpenAI、微软的起诉书,网址:https://githubcopilotlitigation.com/pdf/07074/1-0-github_complaint.pdf。

③ 参见Andersen 等诉Midjourney、Stability AI 和 DeviantArt的起诉书,网址:https://ipwatchdog.com/wp-content/uploads/2023/02/Andersen_et_al_v._Stability_AI.pdf。

④ 参见Getty Images (US), INC. 诉 Stability AI, Inc.的起诉书,网址:https://cdn.vox-cdn.com/uploads/chorus_asset/file/24412807/getty_images_vs_stability_AI_

delaware.pdf。

⑤ 来自Joseph Saveri Law Firm的公开言论,参见网址:https://www.saverilawfirm.com/our-cases/ai-artgenerators-copyright-litigation。

⑥ 原始图像(raw images),在计算机视觉、数据处理或图像分析的背景下,“原始图像”通常指组成图像文件的像素数据和元数据。

⑦ 工作实例通常是指计算机科学领域中的一个概念,它表示计算机程序中执行的一个单独的任务或进程。工作实例可以是一个程序的运行实例,也可以是一个计算机系统中的特定操作或任务的示例。

⑧ 参见GitHub 前首席执行官的公开言论,网址:https://twitter.com/natfriedman/status/1409914420579

344385。

⑨ 参见纽约时报诉OpenAI、微软起诉书,网址:https://nytco-assets.nytimes.com/2023/12/NYT_Complaint_

Dec2023.pdf。

⑩ 参见美国著作权法第107条。

⑪ 参见Sega Enterprises Ltd. v. Accolade, Inc., 977 F.2d 1510。

⑫ 参见Campbell v. Acuff-Rose Music, Inc. ,510 US 569 (1994) 591。

⑬ 参见Authors Guild v. Google, Inc. ,804 F.3d 202 (2d Cir. 2015) 214。

⑭ 参见Kelly v. Arriba Soft Corporation, 280 F.3d 934 (9th Cir. 2002) withdrawn, re-filed at 336 F.3d 811 (9th Cir. 2003)。

⑮ 参见(2015)沪知民终字第730号。

⑯ 参见(2013)民提字第15号民事判决书。

17 参见美国版署拒绝注册空间歌剧院的第二次复议请求:Second Request for Reconsideration for Refusal to Register Théâtre D’opéra Spatial (SR # 1-11743923581; Correspondence ID: 1-5T5320R), 网址:https://www.copyright.gov/rulings-filings/review-board/docs/Theatre-Dopera-Spatial.pdf。

18 参见Thaler v. Perlmutter, 1:22-cv-01564, (D.D.C.)。

19 参见(2023)京0491民初11279号。

20 记录自2023年12月18日王迁教授“人工智能‘文生图’在著作权法中的定性难题”讲座。

21 美国国会于 1865 年首次规定照片享有著作权。美国最高法院于1884年裁定国会可以根据宪法给予照片著作权保护。

22 参见Sahuc v. Tucker, 300 F. Supp. 2d 461 (E.D. La. 2004)。

参考文献:

[1] Bandi A, Adapa P V S R, Kuchi Y E V P K. The Power of Generative AI: A Review of Requirements, Models, Input-Output Formats, Evaluation Metrics, and Challenges[J]. Future Internet, 2023(8): 260.

[2] Schuhmann C, Beaumont R, Vencu R, et al. Laion-5b: An Open Large-Scale Dataset for Training Next Generation Image-Text Models[J]. Advances in Neural Information Processing Systems, 2022, 35: 25278-25294.

[3] Murray M D. Generative AI Art: Copyright Infringement and Fair Use[EB/OL].[2024-02-07].https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4483539.

[4] 胡开忠,张妍.论情景原则在著作权司法保护中的合理适用[J].江汉学术,2023(4):84-93.

[5] Wymeersch P. EU Copyright Exceptions and Limitations and the Three-Step Test: One Step Forward, Two Steps Back[J]. GRUR International, 2023,72: 631-642.

[6] 多位创作者起诉小红书偷画师作品“炼”AI模型涉侵权,已获立案[EB/OL].(2023-11-30)[2024-02-07].https://www.sohu.com/a/740280849_120133310.

[7] Kretschmer M, Meletti B, Porangaba L H. Artificial Intelligence and Intellectual Property: Copyright and Patents:A Response by the Create Centre to the UK Intellectual Property Office’s Open Consultation[J]. Journal of Intellectual Property Law and Practice, 2022(3): 321-326.

[8] US Copyright Office. Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence[EB/OL].(2023-03-16)[2024-02-07].https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence.

[9] 严驰.生成式人工智能“作者”问题之思:以罗兰·巴特的作者观为视角[J].南京邮电大学学报(社会科学版),2024(4):30-42.

[10] 王迁.再论人工智能生成的内容在著作权法中的定性[J].政法论坛,2023(4):16-33.

[11] Abrams H B. Originality and Creativity in Copyright Law[J]. Law & Contemp. Probs., 1992, 55: 3.

责任编辑:刘伊念

(E-mail:lynsy@ jhun. edu. cn)

收稿日期:2024 - 06 - 22 本刊网址·在线期刊:http://qks. jhun. edu. cn/jhxs

基金项目:上海市智库青年领军人才专项课题“知识产权制度型开放中的风险预警机制研究”(2024TRC014);国家社科基金重大项目“构建人类命运共同体国际法治创新研究”(18ZDA153);国家社科基金重点项目“‘人类命运共同体’国际法理论与实践研究”(18AFX025)

作者简介:李依琳,女,江苏苏州人,上海对外经贸大学国际经贸创新与治理研究院讲师,博士,E-mail:19110270005@fudan.edu.cn。