随着人工智能(AI)技术的高速发展,人类借助AI的创作方式正快速转型,即:由文字为主的内容写作,转入以文字转换为图片的AI文生图等崭新领域。那么,在人工智能本身并不具备法律主体资格的前提下,AI文生图是否构成法律意义上的作品呢?
ChatGPT基于算法技术的应用,可以独立自主地生成具有特定算法个性且与人类作品在外观上高度相似的新闻、乐曲、绘画等,甚至还可根据文字描述生成精美图片(AI文生图)。公开资料和相关调研数据显示,AI文生图的Stable Diffusion(稳定扩散)模型是由互联网上大量图片及其对应文字描述训练而来,该模型可根据文本指令,利用文本中包含的数据信息与图片中包含的像素之间的对应关系,生成与文本信息匹配的图片。该模型的作用或功能类似人类通过学习积累所具备的技能和能力。它既能对数据资料、表达方式、表现形式等进行选择,也可根据人类输入的文字描述生成相应图片,代替人类画出线条、涂上颜色,将人类的创意和构思进行有形呈现。在AI文生图模式下,每个人都能够轻而易举地成为“画家”,用户只需输入文字指令,描述自己想要的图片内容,AI系统就可依据该文本指令输出大致相关的图片。
2023年11月27日,北京互联网法院对“AI文生图著作权侵权案”作出判决:“从原告构思涉案图片到最终选定涉案图片的整个过程,原告设计了人物呈现方式、选择提示词、设置相关参数等,进行了一定的智力投入,体现了原告一定的独创性。AI文生图具备作品资格,该作品为美术作品。”这一裁判结果在国内引发了广泛热烈的讨论,焦点主要集中在两个问题上:一是AI文生图是否具备作品的构成要件?二是AI文生图是否构成美术表达,是否属于美术作品?
我国著作权法第3条规定:本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。根据该规定,AI文生图构成作品需要满足属于文学、艺术和科学领域,具有独创性,有一定的表现形式和属于智力成果四个要件。从AI文生图的外观上看,其与通常人们见到的照片、绘画无异,显然属于艺术领域,并具有一定的表现形式。因此,判断AI文生图是否构成作品的关键在于其是否满足“独创性”和“智力成果”两个要件。并非所有智力成果都可构成作品,只有满足“独创性”要件的智力成果才能构成作品,智力成果是构成作品的必要条件,独创性则是构成作品的充分条件。
“智力”作为人类认知自然的天然能力,为人类所特有,AI只是模拟了人类的智力活动所形成的机械运行模型。在传统的创作概念中,实际包含“创”和“作”两个行为,“创”是思想源头,“作”是具体表达。通常情况下,人类在进行创作时,这两个行为都是同一个主体实施的,不作区分。但在AI文生图的创作过程中,使用人需要通过输入提示词、设置相关参数并不断进行调整修正,最终才能获得自己满意的图片。在这一过程中,人类对提示词的选择、参数设置、颜色调整修正、图片选择等操作中人的智力发挥起到了极大的作用,是进行“创”的源泉,而“作”的行为则交给了机器(AI)运行,人“创”机“作”在此完美分工。没有人“创”,机“作”无从发生,机“作”在法律上完全可以看作是行为的委托关系。机器在此只是人的行为的代理,机器只构成人的行为工具。由此可见,当前AI图片产出过程的每个环节都体现着人类的智力付出,AI文生图不是机械的成果,而是具备自然人智力投入的“机械性”的智力成果,因为AI的行为是自然人创作意志的延伸。因此,AI文生图构成智力成果。不过,在司法实践中,需要自然人加以证明其真正的智力付出,因为简单的指令带来的文生图可能很难有效证明其构成智力付出并构成智力成果。
“独创性”作为认定作品的充分条件,著作权法并未对其予以明确定义,但《最高人民法院关于审理著作权民事纠纷案件适用法律若干问题的解释》(2020年修正)第15条规定:由不同作者就同一题材创作的作品,作品的表达系独立完成并有创造性的,应当认定作者各自享有独立著作权。根据该规定,“独创性”可从“独立性”与“创造性”两方面进行理解。“独立性”即作品需作者独立完成而非抄袭复制,“创造性”即作品需有一定程度的智力创造性,这种创造性可外化为明显的作品差异性。就“独立性”而言,不论是Stable Diffusion(智能绘画生成工具)模型生成的文生图,还是IBM公司的Watson生成的电影预告片,抑或Amper Music智能生成的音乐,这些算法生成物至少在外在表达形式上并不是简单复制或抄袭,这表明算法生成物满足了“独立性”这一要件。就“创造性”而言,人“创”机“作”表明了人“创”的重要性。AI文生图由使用者自由设置不同参数和提示词,AI模拟人类大脑的运作机理,利用大数据网络、深度学习以及神经网络等技术来训练这种“仿生大脑”,使之能从海量资料中获取经验、提炼规律,将这些元素进行排列组合,从而生成与现有作品在表达形式上完全不同或存在显著差异的图片。这些差异性便是AI文生图成为作品的基础,具有一定程度的智力创造性。因此,在AI文生图中,独创性主要源自使用者对提示词的选择和安排。
在Stable Diffusion的图片生成模型中,使用者并没有直接动笔去画具体的线条,生成图片的线条和色彩基本是人所进行的“文本输入”,然后由AI模型进行“图画输出”。人工智能绘图模型的使用者对人工智能绘图的文字提示和描述即使再具体,由于使用者并没有直接“动手去绘制”,显然不符合通常概念下的绘画创作,“说者”无法成为“画者”。但是,将“作”画与“说”画彻底对立起来的观点不符合科技发展的实际情况。因为在2024年1月30日,清华大学与宣武医院团队宣布成功进行的首例无线微创“脑机接口”的临床试验中,脊髓损伤患者经过训练不仅实现了通过意念活动驱动手套抓握水瓶等“脑机接口”运动,而且能凭意念控制电脑屏幕上的光标移动。因此,随着科技的进一步发展,“想画”已逐渐成为可能,“说画”更是轻而易举。在人“创”机“作”中,人“创”才是创作的源泉,“作”只是“创”意的表达方式,而表达方式会随着技术迭代不断变化。
《著作权法实施条例》第4条规定:美术作品是指绘画、书法、雕塑等以线条、色彩或者其他方式构成的,有审美意义的平面或者立体的造型艺术作品。立法者并没有对美术作品的表达方式进行严格限制,美术作品的表达并不局限于线条和色彩等能够直接带给人视觉体验的“传统创作元素”,线条和色彩仅是表层的表达,其与最底层的思想(创意)之间,有一个逐渐抽象的过程,中间可能容纳可被作为美术作品表达的内容。因此,AI文生图的“说画”过程虽然没有直接“动手去绘制”线条和色彩,而是利用绘图模型设计了具体的构图布局和文本提示词,也同样构成美术表达。美术作品与其他作品的差异不在于“创作”的方式,而在于作品的功能,即美术作品的功能在于将“给人美感”作为这一作品内容信息的呈现。
2024年2月,美国人工智能研究公司Open AI发布视频生成大模型Sora,只需提交简要的文字指令就可生成场景逼真、细节丰富、动作流畅的视频。从“文生图”到“文生视频”,人工智能技术展示了惊人的迭代速度。在这样的背景下,认可AI文生图的“作品”属性将有利于激发使用者利用AI作为工具进行创作的热情,从而促进人工智能技术的创新发展和应用,实现著作权法“激励作品创作”的目标,推动文化繁荣。
(本文为国家社科基金项目“个人信息的数据化商业利用权益冲突问题研究”〔22BFX083〕阶段性成果)
编辑:黄灵 yeshzhwu@foxmail.com