关键词:人工智能;智力成果;独创性;公地悲剧;真实性
2023年11月17日,北京互联网法院就李某与刘某侵害作品署名权、信息网络传播权纠纷案作出一审判决,认定涉案人工智能生成图片由原告独立创作,体现出了原告的个性化表达,具备独创性,构成作品。这是全国首例认定人工智能生成内容构成美术作品的案件,被称为中国“AI文生图第一案”。无独有偶,2024年2月8日,广州互联网法院就上海新创华文化发展有限公司与某人工智能公司网络侵权责任纠纷案作出一审判决,认定涉案人工智能生成图片构成美术作品。上述两起判决均发生在生成式人工智能飞速发展的新业态背景之下,引发了国内外各界人士的关注和讨论。ChatGPT、“文心一言”等生成式人工智能能够基于大模型和大算力,根据使用者输入的指令自动生成相应内容,以自然语言为媒介实现与人类的高质量对话。
《中华人民共和国著作权法》(以下简称《著作权法》)第三条对作品下了定义,规定了作品构成的四要件:(1)文学、艺术和科学领域内的成果;(2)具有独创性;(3)能以一定形式表现;(4)智力成果。而人工智能生成的多为文字、图片、视频等内容,且当然均为能被人们所感知的表达,因此人工智能生成内容通常能够满足上述第一和第三个构成要件,这是基本没有争议的。阻碍人工智能生成内容受到《著作权法》保护的障碍主要是上述第二和第四个要件,理论界和实务界的争议也在于此。本文将对上述争议予以澄清,在肯定人工智能生成内容的可版权性基础上,再对人工智能生成内容版权保护存在疑虑的观点进行回应,以期有效破解人工智能生成内容在著作权法中定性问题的现实迷思。
一、人工智能生成内容是人类的智力成果
(一)应坚持并正确理解“人工智能创作工具论”
笔者一直是“人工智能创作工具论”的提倡者。“人工智能创作工具论”的核心观点是人工智能本质上不过是人用来减轻自己智力劳动的工具。非人工智能时代,作品创作也借助了技术的力量,但主要还是依赖人的智力投入,这种技术条件下的创作是一个非常艰难的过程,也是一种无奈的选择。但人的创作活动不可能永远停留在主要依赖人的自然智力投入的状态。人与其他物种本质区别之一在于人拥有意识和思维,而且意识和思维在不断进步。人不但可以改造客观世界,而且可以改造主观世界。为了减轻创作的艰辛和投入,人类利用计算机系统发明了人工智能平台用于创作,使创作变得简单和高效,这是技术革命的必然结果和选择,就像人发明机械替代自己从事繁重的生产活动一样,如今人类繁重的智力劳动的负担也将得以减轻。人工智能生成内容是否构成作品,应坚持在“人工智能创作工具论”视角下充分发挥现行《著作权法》对科技革命所带来的挑战的回应,利用现行《著作权法》关于作品构成要件的规定进行认定和处理,尚不存在创设新规则进行立法回应的必要性。通过否定或者误读“人工智能创作工具论”以否定人工智能生成内容是人类智力成果的观点是值得商榷的。
美国版权局否定现有的人工智能生成内容具有可版权性的核心依据便是认为人工智能生成内容不是人类的智力成果。根据《美国版权局实施纲要(第3版)》第三百零六条和三百一十三点二条的规定,美国版权局将作品限定在必须由人类作者所创作,不为由自然、动物或植物“创作”的作品登记版权,也不为由据称是鬼神或超自然的存在所“创作”的作品登记版权,同时,美国版权局进一步提出,不为由机器生成的作品登记,也不为仅由机器随机生成或自动生成而无任何独创性或无人类作者介入的作品登记。为了论证自己观点的合理性,美国版权局还援引了伯罗·贾尔斯平版印刷公司诉沙乐尼案(以下简称沙乐尼案)(Burrow Gilles Lithographic Co.v.Sarony)的观点,认为作品的作者必须是人类。学界有观点支持美国版权局的主张,否定人工智能生成内容具有可版权性,其理由是只有“人”的创作成果才能作为作品,受到著作权法的保护,而人工智能生成内容并非由“人”所完成。该观点还把人工智能生成内容与著名的猕猴自拍照案相类比,认为人工智能生成内容就如猕猴自己按下照相机快门“自拍”而成的照片一样,都是非人类创作的作品,不应当受到著作权法保护。然而本文认为,上述观点对人工智能存在误解,没有坚持“人工智能创作工具论”,故上述观点值得商榷。
美国版权局援引的1884年的沙乐尼案出现在美国第二次工业革命的中期,这个时期出现了诸如摄影、留声机、电影和电气发电机等技术,该案围绕借助照相机生成的照片的可版权性问题展开了激烈的争论。争议涉及伯罗·贾尔斯平版印刷公司和一位摄影师沙乐尼之间的纠纷,沙乐尼受委托为奥斯卡·王尔德拍摄照片。在安排了如窗帘、灯光、配饰甚至王尔德的服装和姿势等因素之后,沙乐尼完成了照片的拍摄,并将其命名为《奥斯卡·王尔德18号》。但伯罗·贾尔斯平版印刷公司未经许可将该照片制作成了石版画投放市场进行销售。当沙乐尼提起版权侵权诉讼时,伯罗·贾尔斯平版印刷公司以摄影只是一个机械过程为由进行了抗辩,认为摄影并不符合作品的定义,因为它只是一种机械化的过程。米勒大法官代表全体法官撰写的判决借鉴了来自1883年Nottage v.Jackson案的“作者”定义,并采纳了版权保护确实应该延伸到摄影作品的理由,其指出:“就是说,那个监督安排的人,那个通过安排人物的位置、安排人物所在的地方而实际形成了画面的人——他是那幅画产生的有效原因……作者作为创作者或主脑,参与了应受保护客体的原创、制作和生产,无论是绘画、油画还是照片……为了实现国会法案的目的,应将摄影作品视为一门艺术,作者是真正表现、创造或实现想法、幻想或想象的人。”因此,该案法院认定摄影作品可以是独创性的智力成果,其应受到版权保护。
然而,美国版权局断章取义地引用了沙乐尼案的观点,试图为其对版权登记的严格立场辩护。而沙乐尼案的法院意图并不是限制“作者”的定义,甚至不是限制可以受版权保护的客体。相反,该案的判决批评了对字面定义的严格依赖,这种依赖忽视了可以受版权保护的新客体。该案事实上指出:“摄影作品之所以没有被列入1802年法案的扩展保护名单中,可能是因为那时摄影这种艺术形式还不存在,摄影所依赖的科学原理以及用于操作的化学物质和机械都是在该法令颁布之后很长一段时间内才被发现的。”如果忽视对该案意图的思考和剖析,就会犯下一个错误,那就是忽视了该案件强调了将新出现的客体与现有法律保护的客体进行比对,以讨论是否对其进行保护。例如,米勒大法官调查了摄影作品是否可以与其他可受版权保护的客体形式区分开来,最终认为摄影作品难以与其他当时受版权法保护的客体形式相区分,进而认为没有理由不保护摄影作品。有鉴于此,美国版权局对该案的理解有失偏颇,想利用该案的判决否定人工智能生成内容是人类智力成果进而否定其可版权性的做法值得商榷。在面对利用新的创作工具创作的内容时,该案法官关注的不是创作工具本身,而是在创作作品时人类是如何选择和安排元素的。换言之,法院关注的是人类的智力投入,且并未因为技术工具的介入而否定和忽视人类的智力投入。法院在该案中列举了沙乐尼对拍摄细节的选择和安排等独创性决策,据此认可了《奥斯卡·王尔德18号》是一件独创性艺术品,从而对摄影过程中固有的机械过程使摄影师无资格成为作者的推定提出了质疑。因此,法院授予了沙乐尼使用、出版和销售他的摄影作品的专有权利。
部分观点以猕猴自拍案为依据否定人工智能生成内容是人类智力成果的观点也值得商榷。该案中猕猴“自拍”的照片之所以不具有可版权性的原因并非与创作工具有关,而是与是否有人类智力投入有关。审理猕猴自拍案的法院在分析案件的过程中并没有纠结于照相机这一工具本身,那么为何分析人工智能生成内容的时候就要纠结于作为创作工具的人工智能呢?该案中,猕猴“自拍”的照片之所以不受著作权法保护,是因为猕猴的拍照过程完全没有人类的介入,没有体现人类在照片形成过程中的选择和安排。该观点还举一例欲加强论证说理,其认为马戏团中的动物可以被训练完成各种任务,但是这些动物无法被著作权法所激励,因此动物当然不可能是著作权法所鼓励的对象。然而,借用该观点举的例子,如果猕猴自拍案的猕猴是马戏团中经过训练的猕猴,能够按照训练的要求完成各种任务,那么经过训练的猕猴按照人类的指令站在指定的位置、摆出指定的动作,使取景框中的照片符合下达指令的人类的要求,此时再对猕猴下达按下快门的指令,形成的照片在符合独创性要求的情况下没有理由不受著作权法保护。这与人类拿着自拍杆进行自拍、利用无人机进行航拍的举动没有本质区别,都是人类借助工具进行创作。上述情况下著作权法激励的也不是猕猴、自拍杆和无人机,而是人类。可见,猕猴自拍案只能证明某些包含动物参与的照片不是作品,不能证明所有包含动物参与的照片都不是作品,更不能证明所有包含高自主性工具的生成内容都不构成作品。
综上所述,目前尚不清楚美国版权局为何将沙乐尼案视为排除非人类作者的权威依据。美国版权局断章取义地引用了该案判决,并错误地引用了“作者的独创性智力构思”这一短语,以支持“如果版权局认定作品不是人类创作的,就会拒绝登记”的主张。事实上,该案恰恰印证了“人工智能创作工具论”的合理性。米勒大法官在该案中对利用先进创作工具创作的内容所持的进步立场,启示人们拥抱技术发展带来的创作工具的创新所引发的作品创作模式的变革。本文并不否认著作权法保护的是人类创作的智力成果,但是在考虑利用新技术工具创作的内容是否应当纳入著作权法保护的问题时,关注的重点不应当是创作工具本身,而应当关注人类在利用创作工具创作过程中,投入了多少独创性元素。人工智能是程序员或用户的工具,理解或可解释性并不是作者控制工具的先决条件。以沙乐尼案为例,人类的智慧,即使是在艺术领域,没有物质的帮助也难以产生任何东西,艺术家的思想始终是工具的指挥者,是物质手段的引导者和启发者,始终扮演着至高无上的角色。在摄影中,仪器取代了手工劳动,但并非完全取代了手工劳动,即劳动的物质部分,但它在最大程度上将智力劳动留给了艺术家。摄影师构思作品,安排配件和光线的作用,根据对照片呈现效果的要求安排仪器的距离、清晰度和大小。可见,从一开始,案件分析的重点就放在了作者的作用上,摄影师不需要了解其使用的相机是如何将光子转化为图像,就可以控制相机,从而保持对其照片的版权主张。在利用人工智能作为创作工具进行作品创作过程中,人们可以像沙乐尼一样以独特的方式选择和安排构图元素、作出审美选择,例如,在用人工智能创作美术作品时,人们可以通过提示词将光线、主题构图等元素组合成一幅作品。甚至有学者将人工智能称为人类的“活”的义肢。上述作品创作过程符合沙乐尼案中关于独创性的大部分标准,人工智能的使用者与沙乐尼一样是使作品最终能够形成的创作者。正因如此,秘鲁摄影师克里斯蒂安·文斯(Christian Vinces)将人工智能生成图片与摄影作品相类比,在社交媒体平台“脸书”上提出了一个新术语——“Promptography”,该词由人工智能术语—一提示词(Prompt)和摄影(Photography)组合而成。“摄影作品”是用光线创作,而人工智能生成图片“Promptography”是用提示词来创作。国内的“AI文生图第一案”的判决基于对涉案图片生成过程的查明,认为从原告构思涉案图片起,到最终选定涉案图片止,这整个过程来看,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等。因此,判决认定涉案图片体现了原告的智力投入,具备“智力成果”要件。欧洲也有司法判决支持本文观点。例如,法国巴黎初审法院认为,在计算机辅助音乐创作的情况下,如果涉及人工干预,作者的选择会导致独创性作品的创作。法国波尔多上诉法院认为,计算机系统创作的智力成果可以受益于保护版权的规则,只要它以最低限度的方式显示了创作者想要带来的独创性。意大利最高法院明确指出在图像生成过程中使用软件,这一事实本身并不足以排除作品创作属性,而是需要更严格地去判断是否存在一定程度的独创性,需要法院去评估对工具的使用是否以及在多大程度上反映了使用者的独创性贡献。
然而,有观点否定了人工智能的创作工具属性,提出拍摄者在使用照相机时通过照相机的液晶取景屏可以决定拍出照片的基本内容,即“所见即所得”,并且照相机无法决定照片内容,但人工智能实质性地决定构成作品的表达性要素,因此其与照相机等创作工具存在本质区别。本文认为上述观点值得商榷。首先,该观点论证的对象是数码相机,然而摄影作品受到世界各国著作权法保护的年代使用的还是胶片相机,彼时拍摄者没法第一时间看出自己拍的照片最终呈现效果怎么样,拍摄者只能凭借经验来拍摄,然后将胶片拿到暗房中,经过繁琐的步骤冲洗才能看到最终效果,当时也并未因此否定摄影作品的可版权性,反而像米勒大法官等对新技术持进步立场的专家支持了摄影作品的可版权性,推动了版权法保护客体的扩张,因应了技术的进步。其次,如今许多智能手机的照相系统自带美颜等修图功能,拍摄的照片效果可能与拍摄者选择拍摄的所见场景大相径庭,超出拍摄者的想象。然而这也没有剥夺拍摄者的版权人身份,未否定经过修图功能自动处理的相片的可版权性,甚至有法院明确支持其可版权性。例如,2020年中国台湾地区智慧财产法院审理的一起案件中,涉案照片的创作过程是作者以“PH-34电动磨甲机”产品照片为素材并以绘图软件后制而成。法院认为就商品照片部分,其“固属静态拍摄,惟就拍摄镜位角度、光线、物品排列方式等已加入巧思,并非单纯原物之机械式呈现”,并且在“数次成像”后才“挑选最适合照片”;另就后制加工部分,法院指出该作者“以绘图软件进行美工修图”,其利用“符合主题之红色与粉红色几何图块、人之手、足部、花朵等图档素材,透过排布编辑、着色、明暗变化等特效技巧以及美术工序,展现创作人之创作思想、感情及美感”,而该修图之完稿因“足以表现其个性及独特性”而“已表现最低限度之创意”,故“应属受著作权法保护之美术著作”。总之,人工智能自身仍未突破人类辅助工具的范畴。有学者提出,当一种智能元素屈从于另一种智能元素时,最大的可能,其依旧只是一种工具性的存在。
(二)随机性不能否认人工智能生成内容是人类的智力成果
有观点否定人工智能生成内容是人类的智力成果,其理由是人工智能使用者无论对提示词进行多么精细的选择和安排,都无法凭借其自由意志决定人工智能呈现的内容,人工智能使用者的行为不构成著作权法意义上的“创作”。因为《著作权法实施条例》对“创作”的定义是“直接产生文学、艺术和科学作品的智力活动”。“直接产生”意味着“民事主体决定构成作品所需表达性要素的自由意志。其与作品之间的联系如此紧密,以至于只能用‘直接’而非‘间接’予以描述。”美国版权局同样主张,使用者并未运用“最终的创造性控制力”来决定人工智能如何理解提示词、如何生成素材。本文将上述观点统称为“意志论”。作品的创作过程大致可以划分为“构思”和“执行”两个阶段。而“意志论”事实上是对作品创作的“构思”和“执行”两个阶段均提出了要求:“构思”阶段必须对作品的表达结果有详细而具体的设想;进入“执行”阶段,作者又需要对作品的表达结果具有绝对的控制,使其能够与“构思”阶段的设想一一对应。上述两个阶段均不能存在“随机性”,否则会影响作品的可版权性。然而,作品的独创性表达的呈现是否以及在多大程度上应该由作者预先设定?创作过程的随机性真的能够否定作品是人类的智力成果吗?
本文认为“意志论”值得商榷。一方面,在作品创作的“构思”和“执行”两个阶段,许多情况下创作者允许他们对作品“执行”甚至是“构思”的控制消失,有意将随机因素纳入作品创作过程。换言之,人类的很多创作本身就具有随机性或机械性,并不是有意识构思和创作的产物。例如,早在18世纪,莫扎特就根据掷骰子的结果完成了一首名为“音乐骰子游戏”的音乐,这首华尔兹的一部分便是通过上述创作方式随机创作的,不仅“执行”阶段采用的是“随机”创作方式,而且其中的许多音符都是莫扎特在“构思”阶段都未曾设想的;美国抽象主义画家杰克逊·波洛克(Jackson Pollock)采用泼溅颜料的方式绘画,他不可能预料到颜料的精确轨迹和落点,尽管他的泼溅绘画过程从表面上看是高度可控的,可见“构思”和“执行”阶段均充满了随机性。然而,著作权法并没有怀疑上述偶然创作出的内容是人类的智力成果乃至具有可版权性,著作权法是能够容忍上述作品创作过程中存在一定程度的随机性。这是因为著作权法具有尊重创作自由和减少社会成本两个方面的价值基础。就前者而言,《中华人民共和国宪法》(以下简称《宪法》)第四十七条赋予了中国公民文学艺术创作的自由,提出鼓励和帮助公民从事有益于人民的创造性工作。同时,我国《著作权法》第一条规定了促进社会主义文化和科学事业的发展与繁荣的立法目的。《宪法》赋予公民文学艺术创作的自由,鼓励创作,除了有保障公民人权的立法目的外,其实也有间接促进科学与艺术发展的立法目的,《著作权法》也正是为了实现上述立法目的而制定的下位法。文学艺术作品的创作过程本就高度个性化,这种个性化不仅体现在创作内容的个性化,还体现在创作方法的个性化,而二者是相辅相成的。如果《著作权法》限制创作过程的随机性,即限制创作方法的个性化,那很有可能排除大量由个性化创作方法创作的具有个性化创作内容的作品,这是对创作过程乃至创作自由的隐性歧视,不仅不符合《著作权法》的立法目的,而且可能有使《著作权法》违宪的嫌疑。因此,只有尊重《宪法》赋予作者的创作自由,才能创作出更多优秀的作品,进而实现《著作权法》的立法目的。就后者而言,《著作权法》区别于专利法,采用的是事后界权模式,允许作品创作过程的随机性是著作权法制度经济性使然。具言之,从社会成本的角度看,相比于技术方案这类大概率成果,在当今社会生产的海量信息成果中,更多的还是小概率成果,采用事后界权模式更有利于降低社会成本。既然如此,只有适当放宽著作权法作品保护的门槛,才能让海量的小概率成果无需付出昂贵的事前界权成本就能实现合理的利益分配效果。有鉴于此,通过所谓的随机性来否定人工智能生成内容是人类的智力成果,事实上是不当地提高了作品保护的门槛,因为随机性本就是一个不确定的概念。
既然著作权法仍然承认上述作品是人类的智力成果乃至具有可版权性,那么可以推论出,在“构思”阶段,作品的创作可能并不要求作者必须在头脑中形成完整而准确的作品形象,即使在作品的创作过程中,作者偏离了最初的预期,无论是为了适应意外的、非故意的发展,还是仅仅因为其想法在创作过程中发生了变化,作者仍然是作者;在“执行”阶段,作者不必对其创作作品行为的“执行”保持绝对的控制,而是可以依靠外力——如随机性和自然的力量来完成其作品,即使出现了作者没有详细设想到的外力对作品的表达产生了影响,只要这些外力符合其意愿即可。我国司法实践中也有法院持上述观点。在“追气球的熊孩子案”中,原告高某、邓某某将相机固定在气球上并设置为录制状态后,将气球放飞,相机自动录制了一段视频。在该录制过程中无法人为操控相机,也无法人为干预气球飞行。视频录制完成后,二人从该视频中截取了一帧画面,并将该帧画面上的一个竖状阴影去掉,获得了涉案图片。对于涉案图片是否构成作品的问题,二审法院认为,对于即使是自动拍摄的照片,但如果明显体现了人工干预、选择和判断的,可以构成摄影作品。因此,在照片拍摄、形成的过程中,只要有人为因素的参与,使得人以独创性的方式在拍摄过程中发挥了作用,那么就满足了摄影作品所需的独创性要求,构成摄影作品。可见,二审法院没有因为涉案照片创作过程中的随机性便否定其可版权性。
另一方面,随着科学技术的发展,作品创作的“执行”阶段本身也在逐渐被工具所介入,人对工具的控制力本身就在逐渐减弱,但人类的“构思”永远是作品能够创作完成的核心。在传统的创作形式中,作者在“执行”阶段对工具的掌控比较绝对。例如,作家用笔、打字机等工具将小说情节写为文字,作曲家用笔、打字机等工具将音乐思想写为音符。然而从19世纪开始,机器在这一创作阶段发挥着越来越重要的辅助作用,人类对其掌控力逐渐减弱。例如,没有照相机就不可能拍摄照片等,人类对照相机的掌握已经有些“力不从心”,再先进的相机也无法保证拍摄的照片绝对符合人类的心理预期。随着人工智能辅助创作的出现,这种趋势越来越明显,机器学习的“黑箱”使人们对创作工具越来越捉摸不透。然而,在文化产品生产中使用高度先进的人工智能系统并不意味着人类已经完全放弃了他们在创作过程中的重要作用。尽管在作品创作的“执行”阶段,人类作者已经部分或大部分被机器所取代,但人类的角色在“构思”阶段仍然至关重要,没有人类变化莫测的提示词,人工智能也难以生成具有独创性的、展现具有文艺价值的内容。可见,“执行”阶段的随机性的增加符合科学技术发展的趋势,不能由此限制作品的可版权性的认定。
总而言之,著作权法并不总是要求作品创作过程的绝对无随机性。实际上,正如美国版权法专家简·金斯伯格教授所言,“构思”阶段要求的是为作品制定一个完整的创作性计划;而“执行”阶段,只要最终的表达元素直接来自作者的创作性计划或构思,作品的关键美学要素——内容、形式或构图结构——与作者的预设构思之间就不需要有绝对直接的联系。回到人工智能生成内容问题,上述要求看似可能会对人工智能生成内容的可版权性认定构成障碍:由于人工智能系统的“黑箱”特性,人类作者将无法准确预测或解释人工智能生成的内容。然而,人工智能的作用或者功能类似于人类通过学习、积累具备了一些能力和技能,它可以根据人类输入的文字描述生成相应文字、图片甚至视频,将人类的创作计划、构思进行有形呈现。通过不断地调整提示词,最终生成的内容只要属于作者的创作计划范畴之内,就不能排除其可版权性,因为这一调整、修正过程体现了人工智能使用者的审美选择和个性判断,创作出的内容也符合人工智能使用者的创作计划。正如欧盟法院的判例所指出的,只要作品是自由创作选择的表达就足够了。面对新技术革命带来的这种创作形态变化,固守建立在非人工智能时代基础上的概念和逻辑,对“创作”“作品”等进行诠释时,要求思想百分百的表达都必须与人的自由意志建立起一一对应的必然联系,显然是落后于人工智能时代的、应该被抛弃的过气观点和立场。
有反对观点试图以电子游戏画面的例证来否定人工智能的使用者能凭借其自由意志决定人工智能生成的内容,其指出电子游戏的画面本质是对各种预设的游戏要素根据预定的逻辑与规则组合而成,因此玩家的操作生成的画面都不可能超出游戏设计者的预设,只是不断对各种要素进行排列组合而已。首先,该观点有以偏概全之嫌,因为并非所有类型游戏的玩家均不能主张对游戏画面的版权。2020年4月,广东省高级人民法院发布了《关于网络游戏知识产权民事纠纷案件的审判指引(试行)》,其中第二十条第二款便肯定了玩家拥有在游戏中成为“版权人”的可能性。而相关司法判决也支持了上述司法政策的观点。例如,在“广州网易公司、上海网之易公司与深圳迷你玩公司著作权侵权及不正当竞争纠纷案”中,广东省高级人民法院认为玩家在沙盒游戏中创造出虚拟的物件、建筑、景观乃至游戏世界可能享有作品权利。美国有司法判决也支持上述观点。此外,在游戏产业的行业实践中也认可了上述观点。在著名沙盒类游戏“我的世界”的“用户协议”中,也约定了用户对利用第三方软件独立制作的游戏素材享有一切知识产权。因此,如果电子游戏为玩家留下了高度的自由表达空间,即便玩家利用游戏内的既有素材进行操作,其有可能属于玩家在游戏开发者提供的既有作品素材基础之上进行的再创作,符合独创性的前提下完全有可能构成演绎作品。可见,上述反对理由并不能否定人工智能的使用者能凭借其自由意志决定人工智能生成的内容。人工智能系统在设计时便引入了随机性,为使用者留下了高度的创作空间。人工智能使用者即便使用相同的提示词,最终生成的内容也是存在差别的。世间的字词组合乃至文字作品是无穷无尽的,人工智能使用者可以运用这些文字内容、拥有足够的空间创作出反映其总体创作意图、具有独创性的作品。其次,该观点没有认识到操作电子游戏与操作人工智能之间的区别。二者的根本区别在于游戏玩家的操作是按照游戏设计者设定的命令操作,而不是自己创设命令。而利用人工智能创作,所有的命令都是使用者自己创设。将二者相类比显然站不住脚。当然还有一些反对观点,由于本文篇幅有限,不一一展开论述。
一、人工智能生成内容能够具有独创性
(一)人工智能生成内容独创性的来源
国内的“AI文生图第一案”的判决中,北京互联网法院认为人工智能生成内容的独创性主要源自使用者对提示词的选择和安排。而2023年2月的《黎明的扎里亚》案中,美国版权局主张人工智能生成的图片是由“机器或纯粹的机械过程生成,它们是通过随机或自动操作而产生的,没有任何来自人类作者的创造性输入或干预”。本文赞同北京互联网法院的观点,认为美国版权局的观点值得商榷。在过去,非传统艺术形式的出现——如概念派艺术家创作的现成品(Ready-Mades)也曾引发关于作品独创性来源的争议。是什么将预先存在的现成的人工制品(如小便池或自行车轮子)升格为艺术品——即作者的作品?根据瑞士专家库默尔(Kummer)的观点,这里决定性的独创性行为是通过将人工制品作为艺术品呈现,将“现成品”(本身不受版权保护)的概念转化为受著作权法保护的表达。库默尔的“呈现理论”(Presentation Theory)暗示,仅仅是选择一个预先存在的对象的行为就足以将该对象转化为作品。虽然库默尔的理论存在一些争议,但从该理论可以看出,个人选择无疑有助于在人工智能生成内容中找到独创性。正如美国斯坦福大学马克·莱姆利(Mark A.Lemley)教授所言,人工智能生成内容的独创性在于产生这些结果的提示词的结构化。提示的措辞或细化方式会从根本上影响人工智能基础模型的输出结果。北京邮电大学人机交互与认知工程实验室主任刘伟评价大模型绘画工具时也认为,“这些软件(大模型)都有一个共同特点,就是‘欺软怕硬’——你的水平越高,它给你的东西越好;你的水平越低,它就泛泛而谈。”例如,在我国“AI文生图第一案”中,原告通过数十个正向提示词和数百个反向提示词,最终生成了涉案图片。《黎明的扎里亚》案中,克里斯蒂娜·卡什塔诺娃(Kristina Kashtanova)为了得到最终令其满意的图片,她还要就最初生成的图片不断向人工智能系统Midjourney发出成百上千条的新指令,使Midjourney不断生成修改后的图片,也就是通过“试错法”形成完美的结果。无独有偶,美国版权局处理的《太空歌剧院》案中,登记申请人艾伦在申请版权登记时,被美国版权局拒绝,艾伦声称其在Midjourney上至少经过了624次提示后才得到了初始版本的图像,而后使用Adobe Photoshop来删除缺陷并创建了新的视觉内容,最后通过Gigapixel AI来提升图像的分辨率和大小。上述内容的生成过程体现了人工智能使用者对提示词的独创性选择和安排。在一定程度上,著作权法中作品的独创性均来源于作者对某些元素的选择和安排,这是适用于所有作品类型的底层结构。尽管多数作品中作者对某些元素的选择和安排容易被分辨,进而判断其独创性,但也有作品难以直接辨认其独创性来源。例如前文提到的摄影作品,摄影作品的独创性来源于创作者对摄影作品的景物、构图、拍摄角度、曝光时间、明暗度等不受保护的机械性元素的具有独特个性的选择和安排。然而,上述选择和安排难以在最终拍摄完成的摄影作品中直接分辨,只能通过摄影作品本身的呈现效果来间接判断作者上述独创性选择和安排,但这也没有影响著作权法对摄影作品的保护,法院也未要求当事人提交全程记录摄影师拍摄照片过程的视频资料作为体现摄影作品独创性来源的证据。回到本文问题,人工智能生成图片的过程与用相机创作摄影作品的过程相比,只不过是将拍摄角度、曝光时间、明暗度等元素的选择与安排改为了对提示词的选择与安排,二者本质上都是人类操作技术工具的结果,共同点均在于独创性来源在独创性表达中的不可视性,这是由创作工具本身的技术特性所决定的,不应当成为版权差异化保护的理由。美国国会研究服务部报告亦进行了相似的类比,将人工智能的研发者类比为相机制造商,将促使人工智能生成特定作品的使用者类比为用相机捕捉特定图像的摄影师,使用者由此可以成为作者。
有反对观点认为,人工智能作画工具的使用者对人工智能绘图的文字提示和描述,即使再具体,也只是文字作品的创作,而不是美术作品的创作。所以,只有“作”画,没有“说”画,“说者”无法成为“画者”。本文认为上述观点值得商榷。首先,上述观点没有法律依据。《著作权法实施条例》第四条第(八)项指出美术作品是以“线条、色彩、或其他方式”构成的艺术作品,“或其他方式”也能看出,立法者并没有对美术作品的创作方法和创造过程进行严格限制,有意或无意为新出现的创作方法留下空间。而美术作品的独创性有无是通过对最终呈现的线条、色彩等因素进行判断的,无论是用传统的画笔绘画,还是像波洛克采用泼溅颜料的方式绘画,还是采用拼贴的方式创作“拼贴画”,甚至是马塞尔·杜尚仅仅通过选择将现成品上升为艺术作品,均不影响对其独创性有无的判断,只要最终呈现的美术作品能够体现作者对相关元素个性化选择和安排即可。既然上述多样的美术作品创作方式创作出的成果都有以美术作品的“身份”获得著作权法保护的可能,那么利用先进的技术手段、通过“说”的方式、基于多回合提示词的精细选择而获得的具有审美意义的整体画面又为何被差异看待呢?随着科学技术的不断发展,甚至“想”画也成为可能。例如,2024年1月,清华大学与宣武医院团队宣布成功进行首例无线微创“脑机接口”临床试验,脊髓损伤患者经过训练,能够仅凭意念控制电脑屏幕上的光标移动。可见,不能因为对艺术创作的方式和过程缺乏想象,便对创作出的成果加以否定。我国加入的《经济、社会及文化权利国际公约》对文化权利规定了三方面内容,患有疾病的人们同样享有上述文化权利,科技进步为患有疾病的人们提供了艺术创作的可能。我国加入的联合国《残疾人权利公约》第三十条第二款也规定了缔约国应当采取适当措施,使残疾人能够有机会为自身利益并为充实社会,发展和利用自己的创造、艺术和智力潜力。艺术创作的壁垒将逐渐消融于人工智能的普及中,实现博伊斯“人人都是艺术家”的预言。同时,这种智能高效的创作方式可以对人类手工创作方式形成有效补充,多层次地满足人类的审美需求。
其次,表达有无独创性,不问创作过程,只看创作结果。创作过程虽然可作为诉讼中判断作品是否独立创作、有无独创性的证据,但并非认定作品独创性的决定性因素。对创作过程中的独创性做主观判断产生最大的问题,是这种判断方法原本就不可靠甚至在很多场景下不可行。因为创作的过程经常是带有非理性成分的过程,要用理性方式解释创作过程本身就是一种矛盾。通过创作过程判断作品独创性进而确定作品类型的方法并不可靠,可能导致许多创作结果具有独创性的成果只因为创作过程的非常规性而无法受到著作权法保护。
综上所述,不以法律随意限制文学、艺术和科学作品的创作方式,利用先进的科学技术创新作品的创作方式,不仅有利于我国落实与人权相关的国际条约的义务,也符合《宪法》第四十七条对创作自由的鼓励以及《著作权法》保护作者的版权、促进社会主义文化和科学事业的发展与繁荣的立法目的。
(二)人工智能生成内容的独创性与版权侵权的判断
正如前文所述,人工智能生成内容的独创性来源于人们对提示词的选择和安排,而独创性表达与独创性来源是两码事,例如摄影作品和美术作品的独创性表达均为图像,但摄影作品的独创性来源于创作者对摄影作品的景物、构图、拍摄角度、曝光时间、明暗度等不受保护的机械性元素的具有独特个性的选择和安排;美术作品的独创性却来源于创作者对线条、色彩等元素具有独特个性的选择和安排。在对摄影作品和美术作品的独创性进行判断时,美术作品的独创性来源可以在最终表达内容中直观判断。但摄影作品的独创性来源只能通过最终表达内容间接判断。因为让创作者每次都用另外的工具记录创作过程既不经济也不现实,因此法院只能通过最终表达内容这一创作结果倒推创作过程的独创性。
而利用人工智能生成的内容,其独创性来源于作者对提示词的选择和安排,但上述独创性来源却同摄影作品一样,无法在最终呈现的表达内容中直观展现,这是照相机、人工智能等创作工具的特性使然。正因如此,人工智能生成内容的独创性判断可以比照摄影作品的独创性判断方式,只需要对最终的创作结果而非创作过程进行判断即可;提示词的选择和安排作为创作过程,对于人工智能生成内容的独创性判断,虽起证据性作用,但不能替代对创作结果独创性的判断。原因在于,只有适当放宽作品保护的门槛,才能让海量的小概率成果无需付出昂贵的事前界权成本就能实现合理的利益分配效果。如果仅以提示词的选择和安排作为独创性的认定标准,将不当地提高界权成本、挫伤创作热情,创作者在创作过程中难以把握选择和安排多少提示词才能使作品具有独创性;司法机关也难以把握认定标准,且本来对最终创作成果直接进行直观地分析就能解决问题,却让司法机关舍近求远,对各种提示词进行分析,这也变相将文学、艺术领域的问题变成了计算机、数学等问题,偏离了著作权法对文学、艺术等作品保护的初衷。正如前文所述,对利用与人工智能类似的技术工具照相机创作的摄影作品的独创性判断,也没有让原告提供创作过程的记录,这也是考虑到创作工具的特性以及社会成本问题。总而言之,照相机基本只能创作摄影作品这一种类型的作品。然而,利用人工智能却可以创作出文字作品、美术作品、视听作品、音乐作品等各种类型的作品,在判断其独创性时只需要对上述各种类型作品的最终表达内容进行判断即可:如果生成的是文字作品,就对具体的文字组合进行分析;如果生成的是美术作品,就对线条、色彩等进行分析等。当然,也无须担心过于简单的提示词生成的内容会被轻易认定为作品,这是因为,一方面,正如前文所述,提示的措辞或细化方式会从根本上影响人工智能基础模型的输出结果。原画师铂羽曾指出,人工智能呈现什么样的画面,创作者的美术基本功和审美能力决定了人工智能工具使用的上限。本身不会画画的人,不会依靠人工智能就突然变成高手。因为审美不能光靠看一些漂亮的图,只有手的水平追上眼,才能真正掌握。不可能手停了,审美还在不断提高。审美能力和创造美的能力,本身就是一体的,也相辅相成。可见,过于简单的提示词生成的内容可能本就难以迈过独创性的门槛。另一方面,即便有些简单提示词生成的内容被认定成作品,也不会产生过多负面结果。事实上,以同样利用技术工具创作而成的摄影作品为例,在司法实践中,往往原告在摄影作品的证明上只需展示其与作品间的创作关系即可,至于作品本身是否具备独创性似乎并不是证明的重点。实践中因为照片独创性不足而否定其作品地位的案件,可谓凤毛麟角。但也没有由此出现过多权利人滥诉等负面结果。当然,提示词在独创性判断中也并非无用武之地,其可以作为证据性材料来辅助论证人工智能生成的内容具有独创性。美国Feist案中,美国联邦最高法院认为,“独创性”满足“独立创作(而非从其他作品复制)”和“最低程度的创作性”即可。该标准也获得了我国司法实践的认可。可见,对“创”的要求并不需要达到专利法中创造性的高度,对创造高度的要求仅仅是一道极低的门槛,这也符合著作权法追求文化多样性的立法目的。如果原告提示词的选择和安排不是对他人现有作品以及提示词的复制,那么原告利用人工智能工具的创作行为就是独立完成的,可以辅助论证利用人工智能生成的内容满足“独”的要求;而对于“创”的判断,只需要达到“最低程度的创作性”即可,那么如果提示词的选择和安排并不司空见惯,就可以辅助论证利用人工智能生成的内容满足“创”的要求。当然,正如本文反复强调的,提示词在独创性判断过程中发挥的作用也仅仅是辅助性的,不能替代对人工智能生成内容的独创性判断。
独创性的判断通常出现在版权侵权纠纷的案件审理过程中,而涉及人工智能生成内容版权侵权的纠纷可以分为两类:一类是被告的涉案作品是由传统创作工具创作的;一类是被告的涉案作品同样是由人工智能生成的。版权侵权判定的规则为“接触+实质性相似”规则,在这两类纠纷中,提示词发挥的作用又有所不同。在第一类纠纷中,被告通常会从“实质性相似”人手,以原告的涉案人工智能生成内容不具有独创性为由进行抗辩。这是因为第一类侵权纠纷中被告并未使用人工智能创作,而是利用传统工具创作,以美术作品为例,被告是利用传统创作工具一笔一笔创作的,在没有使用提示词创作的情况下又谈何用提示词的独创性来洗脱自己侵权的嫌疑呢?且在互联网时代,原告作品在网络上非常容易被传播的情形下,被告也很难证明自己没有“接触”过原告的作品,只能通过“实质性相似”来抗辩。此时如前文所述,司法机关仅仅需要对原告利用人工智能生成的内容本身进行独创性判断即可,提示词仅仅在独创性判断中发挥辅助性作用。换言之,在侵权抗辩中提示词发挥的作用是次要的,决定侵权是否成立的仍然是创作结果。
而在第二类纠纷中,原被告的涉案作品均由人工智能生成。与第一类纠纷不同的是,被告不是用传统工具创作的作品,而是与原告一样以提示词的选择和安排为创作手段进行作品创作。此时基于人工智能的技术特点,提示词可以在侵权抗辩中发挥核心性作用,被告通常会从“接触”人手,以未曾接触过原告的提示词进行抗辩。这是因为过去法院在认定版权侵权时,由于互联网时代作品传播的便捷性和广泛性,“接触”要件通常被虚置化,法院通常很容易认定被告“接触”过原告的作品,进而直接进入“实质性相似”要件的判断。然而进入人工智能创作时代,尽管前文提到了人工智能系统在设计时被认为加入了随机性,即便双方输入了独立创作的提示词,但是如果提示词类似或者提示词与人工智能训练数据中已经存在的术语存在共性,那么生成的内容仍可能存在实质性相似,如果因为技术的局限性而从“实质性相似”角度认为被告构成版权侵权,则对于对提示词的选择和安排具有独创性的被告是不公平的。因为提示词不具有公开性,被告可能根本就没有“接触”过提示词,即便作品构成“实质性相似”,独立创作的情况下也不应被认定为侵权。但如果从“接触”要件人手,判断被告是否抄袭了原告的提示词,即被告是否对原告的独创性来源进行了抄袭,则更符合人工智能的技术特性:因为如果抄袭的提示词细节越多,则生成的内容也越相似,而提示词又不具有公开性,被告抄袭提示词的行为冲击了著作权法创设的稀缺性及其激励机制,理应具有法律上的可责性。在这种情况下,著作权法鼓励这种独创性努力是合理的。著作权法创设的稀缺性及其激励机制并不会因生成式人工智能的出现而消解和失灵,而是转移至人工智能生成内容背后的智力活动中。正如美国斯坦福大学马克·莱姆利教授所言,在基于提示词的版权体系中,真正的侵权判定标准不是“作品是否相似”,而是“我是否抄袭了你的提示细节”。正因提示词的重要性,现在很多公司都在招聘善于提出正确提示词的“提示词工程师”。
三、对人工智能生成内容版权保护疑虑的回应
基于上文讨论,本文认为,在符合作品构成四要件的情况下,人工智能生成内容能够构成作品受到著作权法保护。然而,人工智能创作工具的出现将作品创作的门槛大大降低,因此有观点担心如果现行著作权法仍然适用“最低程度的创作性”的独创性标准给予人工智能生成内容版权保护,将造成反公地悲剧。该观点认为,人工智能生成内容的产量将远高于人类作品,假设承认人工智能生成内容的可版权性,将直接导致大量碎片化的版权出现,一方面会增加交易成本,进而阻碍作品的利用;另一方面,由于大量人工智能生成内容的存在,会使创作者因担心版权侵权而导致其表达的选择范围受限,影响创作活动。还有观点担心大量人工智能生成内容获得版权保护,将冲击艺术家的创作市场,限制艺术家生存空间,阻碍艺术创新。本文认为上述观点值得商榷,理由如下两个方面。
(一)以版权保护人工智能生成内容不会造成反公地悲剧
首先,现阶段对于人工智能生成内容的版权保护,需要担心的是公地悲剧问题而非反公地悲剧问题。纵观全球,目前由于法律的滞后性等原因,鲜有国家对人工智能生成内容提供版权保护。然而从前文提到的几个国内外代表性的人工智能生成内容极为复杂的生成过程可以看出,人工智能生成内容蕴含了人工智能使用者对提示词具有独创性的选择和安排;大量人工智能生成内容能够丰富文化市场,为人们带来更多赏心悦目的作品,也为消费者提供了更多样化的选择。可见,人工智能生成内容有助于实现《著作权法》促进社会主义文化和科学事业的发展与繁荣的立法目的,将其纳入知识产权的制度框架加以保护,强化作品本身的市场价值,不仅符合知识产权制度的演进逻辑,而且对人工智能产业的长远发展具有重要意义。如果不将其纳入《著作权法》保护,将导致人工智能生成内容任意免费使用,依据激励理论,如果过度地允许免费使用人工智能生成内容,后来的模仿者将处于过分有利的地位,人们由于无法通过《著作权法》保护自己使用人工智能生成的内容,而将怠于使用人工智能,从而可能导致对人工智能这种知识财产创作工具进行投资的先行者数量减少,最终会导致公地悲剧。因此,为了防止这种现象,需要在一定程度上禁止免费使用的行为,当务之急是为人工智能生成内容提供版权保护,而非杞人忧天地担心反公地悲剧。其次,如果大量优秀的人工智能生成内容被赋权保护,导致交易成本上升,这也是市场经济使然,证明市场主体愿意付出成本获得优秀作品,这不是反对为人工智能生成内容提供版权保护的理由。最后,正如前文所述,在人工智能创作时代,“接触+实质性相似”的版权侵权判断规则中,“接触”将成为判断版权侵权的关键,即便两个创作者用人工智能生成实质性相似的内容,只要被告证明自己没有“接触”到原告的提示词、是独立运用提示词生成的内容,则被告也不构成侵权,其创作活动也不会受到影响。
(二)人工智能生成内容因缺乏真实性难以取代人类作品
在照相机刚刚出现的19世纪,艺术家深感艺术的终结,也曾担心照相机会威胁到其绘制的美术作品的价值:原来需要耗时耗力、运用长期积累的绘画经验才能绘制出一幅优秀的美术作品,而人们只需要按下照相机的快门即可拍摄出一张同样场景的照片。如今几百年过去,显然当初画家们担忧的情况并未出现,艺术并未就此停滞,一幅手工绘制精良的美术作品仍然能够创造出良好的市场价值。几百年来,艺术家们主动或被动地探寻艺术的新出路,从模仿和再现现实转向对内在精神价值的表达,从而推动了现代主义艺术的诞生。工业革命的历史就是一部人类劳动实现自动化的历史。过去人类手工艺术品被取代后,人们通常会对机器制造的新奇产品产生最初的迷恋。但是,随着这些工艺品的供应变得日常化和固定化,社会开始越来越重视人类手工生产的成果,尽管它们可能并不完美,效率也不高。事实上,人类手工生产的产品的不完美和稀缺性成为了“真实性”(Authenticity)的象征,而机器生产的产品的可负担性、可获得性和普遍性则成为了“非真实性”(Inauthentic)的象征。机械化可以自动地精确重复生产活动,使产品产出标准化,达到技术上的完美。人类失误造成的不稳定结果可以被自动消除,消费者可以源源不断地获得价格合理、样式统一和丰富的产品。但是,在这种生产规律的影响下,消费者们开始拒绝成本较低的自动化生产,转而追求生产速度较慢、成本较高的手工艺品,从而有效地以稀缺性取代了丰富性。工匠或传统方法被贴上“正宗”或“真实”的标签,而自动化生产则被诋毁为不真实,即使在生产质量等同于人类劳动的情况下,甚至在自动化生产在质量上优于人类劳动的情况下。错位的颜色、锯齿状的边缘、错误的拇指印都变成了人们所期望的个性化特征,手工艺品中的瑕疵甚至可能成为手工艺者人性价值的象征。因此,正如巴顿·毕比( Barton Beebe)所言,面对技术的丰富性,真实性重新造成了稀缺性。以著名的人工智能生成内容《下一个伦勃朗》为例,人们已经可以通过应用人工智能生成具有17世纪荷兰伟大的画家伦勃朗风格的画作,该画作被命名为《下一个伦勃朗》。然而,无论该画作的风格多么接近伦勃朗,只有最初的伦勃朗亲手绘制的画作才带有真实的光环;人工智能生成的复制品,无论其质量如何,都缺乏这种属性。人工智能生成的伦布朗风格的画作可能因其所蕴含的伦勃朗独特风格而在短期内受到某些人的青睐,但长远来看,却因缺乏伦勃朗真迹所具有的历史和文化价值而难以产生与真迹相当的市场价值。瓦尔特·本雅明就曾提出,没有了历史沧桑感的作品显然不能称之为艺术品。综上所述,历史经验证明,人类作品可能在短的时间内因人类的好奇心理等因素使然被人工智能生成内容所威胁。但长远来看,人类作品因其真实性不会完全被人工智能生成内容所取代,人工智能“类人性”的辅助艺术创作活动注定难以真正达到“属人性”的人类艺术创作所追求的“求真”“致善”“臻美”。
四、结语
人工智能时代已然来临,面对新技术革命带来的创作形态变化,既不能固守建立在非人工智能时代基础上的著作权法的概念和逻辑,以落后于时代的、应该被抛弃的过气观点和立场解读人工智能生成内容,也不要步入“马法”的误区,不假思索地一味呼唤制定专门规制人工智能的法律。以体系化的思维发掘现有版权法律制度的适应力,以开放、包容的心态积极运用著作权法对人工智能生成内容予以合理保护与规制,才能使著作权法更好地完成人民赋予其的保护创新的时代使命。