从“艺格敷词”到“以文生图”

2024-10-21 00:00华丹玫
中国版权 2024年4期

摘要:人工智能给各行业都带来巨大变革,现行法律制度也受到很多挑战。“艺格敷词”与“以文生图”这两个相反概念,展示了文字与图像的复杂关系,生成式人工智能给“语图关系”带来了新的变化。本文认为,参照康德提出的“图式”概念,按照合理使用的有关规定,如人工智能对于训练素材的使用符合“转换性使用”的具体要件,则应认定属于合理使用。在坚持独创性客观标准的前提下,人工智能生成物有可能构成符合作品定义,具备独创性要件,应当作为《著作权法》保护的作品。对人工智能生成物的使用如果发生侵权,使用者应承担侵权责任。面对生成式人工智能的时代之问和已经产生的经济利益,法律制度应当提供裁决和执行的规则,而非讨论该种经济利益是否应当得到法律的承认。这是按照法经济学指引对现实需求的必要回应,也是逻辑周延的必然选择。

关键词:艺格敷词;人工智能生成物;合理使用;独创性

一、前言

作为一项划时代的发明,人工智能给各行业都带来巨大变革,调整社会关系的法律制度也受到很多挑战,让人不禁忧虑,人工智能“不仅与已有法律秩序形成冲突,凸显现存法律制度产品供给的缺陷,甚至会颠覆我们业已构成的法律认知”,最严重后果可能造成“法律规制失灵”“法律秩序失调”。此种忧虑在知识产权领域尤为突出,其中最受学界关注的是生成式人工智能相关问题,其一是输入端,即模型训练所用数据侵权问题;其二是输出端,即人工智能生成内容是否具备作品要件问题。

在理论和实践层面,关于这两方面问题的争议不断,海外已有多起涉及生成式人工智能的集体诉讼,主张人工智能公司在数据训练中涉嫌侵犯版权、不当获取和使用个人信息、生成侵权作品等。我国法院作出的“奥特曼”案及“AI文生图”著作权侵权案判决分别从输入和输出两端给出了审判结果。“奥特曼”案中,法院认为,AI生成图片保留了奥特曼形象的独创性表达,侵害了复制权和改编权;“AI文生图”著作权侵权案中,法院认为AI作为创作工具,使用者通过提示词、参数调整具备“独创性”要件,故而生成的图片符合《著作权法》关于“作品”的定义。相关案件亦受到业界和学界广泛关注和热烈讨论。

从宏观政策层面审视,中国政法大学法治研究院等七家单位专家起草发布的《人工智能法(学者建议稿)》第二十三条、第三十六条规定了人工智能生成内容的知识产权保护原则,肯定了以使用者作为主体,人工智能生成内容可作为作品获得著作权法保护;第二十四条规定了模型训练数据的合理使用原则,允许不同目的或功能的训练使用。欧盟议会近期通过的《人工智能法》“鉴于”部分规定:开发和训练人工智能所使用受版权保护内容都必须获得相关权利人的授权,除非适用相关的版权例外和限制,并且还要公开所使用内容的摘要,以便权利人检视。本文拟从“以文生图”生成式人工智能原理切人,以期解决输入一输出两端的一些法律问题。

二、生成式人工智能技术原理的延伸思考

有业内学者认为,如果人工智能生成物没有在真实的人与人之间建立“对话”关系,该生成物就无法反映人的主体性,因而不具备独创性,并建议独创性判断引入审美要素。此论合理与否暂且不论,至少反映出版权领域与艺术领域存在一定的共通。

(一)语图关系的新发展

“艺格敷词”为希腊语,是古希腊跨艺术研究领域术语,指详细描述绘画、雕塑或其他视觉艺术作品的一种文学手段。“以文生图”则正好是“艺格敷词”的反面,即通过生成式人工智能将文字描述转化为图像、视频(连续的图像)。从艺术史的层面看,跨越古今的两个相反概念,恰恰展示了文字与图像的复杂关系——“后形式主义、图像学和符号学,都将艺术的核心问题阐释为‘语言与图像,的问题”。人类艺术史上,对于语图关系的讨论就从未停歇,图像是先于文字出现的,旧石器时代的先民用石块在岩壁上刻画自己的表达,信息通过岩画这样的介质和表现形式流传至今。语言文字出现后,占据了信息传递的主流。录音、摄影技术出现后,图像因其相比语言编码更丰富具体,成为了重要的辅助传播形式。

生成式人工智能给“语图关系”带来了新的变化,借助人工智能工具,通过设定提示词,以语言文字这一媒介,将思想用图像符号表达,普通人即使未经绘画训练,也可以将自己的思想映入现实,这是语图关系的新发展。人工智能专家的课题是通过深度学习技术实现文本特征动态地转化成图像特征,并在这个过程中通过提升图像一文本语义一致性来弥补文本和图像之间的语义鸿沟,最终目标是根据自然语言描述生成对应并具有足够视觉细节的图像,且在语义上与文本的描述保持一致。这一点与其说依靠算法,更多依靠的是标注。

(二)机器学习技术延伸分析

机器学习的核心是训练数据,训练的材料库图片中,主要对图片要素进行框选和标注,大量的标注与图像一一对应,最终让人工智能得以实现视觉与文本的特征对齐。如下图所示:

联系到当前“以文生图”输入端的核心问题,即生成式人工智能深度学习素材对受版权保护内容是否构成侵权问题。前文已述,立法的可能走向是通过合理使用制度,特别是“转换性使用”来达成权利人和人工智能之间的利益平衡。“转换性使用”源于美国《版权法》,是指“以不同目的或方式使用作品,并在原作品基础上增加了新表达、新意义或新功能”。讨论思想与表达二分法和合理使用制度,不得不谈到安迪沃霍尔案。该案中,对于同一表达(照片)的不同解构,美国最高法院认为并未增加不同目的,未产生新的表达,从而改判该案。这种逻辑还是基于思想与表达二分法,即相同表达的不同解构属于思想范畴,在艺术领域值得认可,但在法律特别是版权领域,仍然不得超越相同表达的保护范围。安迪沃霍尔对艺术领域的冲击来自他揭示了“艺术创作也不再是艺术家个人的创作技艺的实现过程而是集体生产线式机器操作与复制流程。同样,艺术家也不再是天才的个人而是文化工业中的生产者之一。”从这个意义上讲,将安迪沃霍尔与生成式人工智能、将安迪沃霍尔案中的合理使用问题与数据训练侵权问题结合讨论,具有现实意义和启示作用,下文将具体展开讨论。

三、机器学习数据的侵权问题

(一)机器学习对训练素材的使用方式

较为主流、智能较强的生成式人工智能,在机器学习阶段使用训练素材,使用方式和目的是通过标注将图片各个要素进行语图对应,其使用目的与原图片并不相同,只是统计学意义上的使用和收集,并不会从训练数据中复制受保护的表达并输出。

根据Meta发布的论文,其开发的生成式人工智能Emu学习分为知识学习和质量学习,知识学习阶段,人工智能通过11亿张图像一文本训练素材,预训练了一个潜在扩散模型;质量学习阶段,通过过滤器过滤出高质量照片,再聘请精通摄影原理的专业注释人员,遵循构图、照明、色彩、有效分辨率、焦点和故事性审美原则,筛选出高审美质量的图片,实现了语图对齐外,还实现了美学对齐。训练素材提供的只是要素性、概念性的图文对齐统计信息,即形成以自然语言生成图像的能力,而训练素材标注过程,依靠的是人类的认知能力和知识体系,至于后续专业注释人员的干预和筛选,从结果上大幅提高了生成图片的视觉表现和语图一致性表现,这个过程也涵盖了专业注释人员的专业知识和审美水平。

语图对齐并不是人工智能时代的特殊产物,贡布里希等传统的艺术史家也认为图画应被“阅读”,因为图像并非自然的、不证自明的,而是依照必须加以破译的视觉语言创造的。其本意并非强调文本重于图像,而在于更充分地关注图像的视觉本性。艺术研究领域的“后形式主义”,也已经关注到图像的视觉语言问题,这跟人工智能对于图片的意涵标注后进行机器学习异曲同工。

(二)“图式”概念的引入

康德在《纯粹理性批判》中提出“图式”概念,认为我们不能直接将纯粹的、普遍的范畴一般地应用于感性的、具体的现象之上,需要兼具二者性质的“图式”来充当中介。他举例称,任何“狗”的形象或图像只有根据“狗”这个概念的“图式”才能得以对应,它们也只有与这个“图式”相符才能被归入此概念。因此图式是概念规则的表象,它将概念与诸多对象联结到一起。西文生图人工智能模型训练核心是语图一致,在图到文再到图的两次转换中,知识学习阶段类似“艺格敷词”的过程,用文字描述训练图片中的各个要素,经过大量的训练让文本与图像趋于一致。用户使用时是反向过程,根据给定文字生成对应的图像。文生图人工智能模型通过大量“狗”图像的训练,总结出“狗”这个概念的“图式”,用户发出生成“狗”图像的指令后,按照“图式”和用户其他要求生成图像。

(三)是否构成转换性使用

从版权角度出发,在这种基于标注一训练一语图对齐的情形下,即便训练素材可能包含权利人作品,人工智能对于训练素材的使用也并非作品意义上的使用,而是图中各意向语义特征意义上的使用,使用目的和方式均与原作品不同,汇总海量训练素材形成的统计信息集合,构建出人工智能数据库中各个概念之“图式”,使得人工智能具备生成图片的能力,符合“转换性使用”要e538f0af7048dcca28ed6a3d59b08fbd件,应属于合理使用。

在前述艺术、技术、法学以及法哲学讨论的基础上,可以得出结论,在知识学习即“图式”归纳阶段,如果文生图模型对于训练素材的使用旨在实现要素提取构建“图式”的功能,而非再现作品本身的文学艺术价值或实现其内在的表意功能,则符合版权制度中转换性使用的情形,属于合理使用。对于训练数据权利争议案件,核心是要求公布算法和对于训练素材的使用情况,以此判定是否属于合理使用。

四、人工智能生成内容的版权问题

遇到新的问题、新的挑战,例如讨论人工智能生成内容的版权问题,需要从版权制度的功能和定位出发,回归立法本意去考量如何因应。

(一)版权制度的功能定位

在版权制度产生之前,人类的璀璨文明白有其生长流传的合理途径,著作权法的功能定位,应当符合民事法律制度本意,我国版权制度是随着市场经济、改革开放而诞生,版权制度亦是为了保护私有财产权促成交易、激发创作产生的一项创设性制度,故其功能应该表述为“分配基于智力创造成果形成的市场利益”。除该项功能外的其他功能均不应等同于立法本意和价值追求。近代版权是基于出版商保护需求产生,版权制度的真正功能是维系作品与资本的结合,后者属+近代的产业结构。

从历史的维度看,因政治体制和知识垄断,古代只有少部分人方可著书立作,此所谓立言。现如今,任何人都可以借助互联网技术通过社交媒体留下自己的独特表达,进入了“人人都是创作者的时代”。在AI技术的帮助下,公众不用经过长期的专业训练,也能生成符合自己心中所想的图片和视频,促进了表达的多元化,这种情况下,创作欲望已经得到了激励。与此同时,如果生成一幅作品,将思想转化为表达是简单易行的事,那么也无侵害他人权利、复制剽窃他人作品的必要。发展至今的版权制度,还肩负了繁荣社会主义文化,满足人民群众日益增长的精神文化需求的责任。版权制度在面临新技术、新客体是否应当纳入保护范围的时代之问时,应当采取包容审慎的态度,妥善应对。

(二)作品构成要件的客观性

我国《著作权法》对于作品定义是“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。《著作权法实施条例》第二条规定:“美术作品,是指绘画、书法、雕塑等以线条、色彩或者其他方式构成的有审美意义的平面或者立体的造型艺术作品”。其中的“审美意义”要件仅出现在美术作品和建筑作品中,故对于美术作品,需具备的要件为:1.具有一定表现形式;2.具备独创性;3.具备审美意义。从构成要件和理论渊源看,除了审美意义外,并不存在主体要件,即是否构成作品仍然属于客观判断。例如德国摄影师鲍里斯·埃尔达森的一幅作品赢得了“2023年索尼世界摄影奖”创意类别优胜奖。然而,获奖摄影师却公开表示,这幅作品其实是由人工智能生成的,并拒绝接受该奖项。该事例恰能说明,如果作者不予披露,无论凭借专业还是审美方面进行客观审查,一般情况下难以分辨作品是否由人工智能生成。即便证明作品构成要件包含(或隐含)主体要件,前例足以证明该要件仅有宣示意义,缺乏实际操作意义,如过度强调主体问题,则可能会对于作品概念、独创性概念的自洽带来冲击。故“独创性是一种客观概念,旨在保护作品本身所具有的创造力,而不是创造力的具体来源”。

独创性是一个拟制概念,很难精准界定其含义,诸多学者都希望能够抽象出一个既能体现法律色彩而又不失人文情怀的独创性概念,但都未能“尽其全貌”。独创性和创作,其区别在于“独”,关于“独”的解释有“独立创作”和“独特表达”等不同解释。世界知识产权组织认为“作品是作者自己的创作,完全不是或基本上不是从另一作品抄袭来的。”这个定义对于解释独创性具有启示意义,即非抄袭的个人创作成果为作品。人工智能的出现,对于“独创性”又有了新的挑战,用人工智能创作,是否属于“独立”创作,通过人工智能生成的内容,是否是使用者的“独特表达”。

在判例法中,每一个判例因事实部分不同,法官对独创性概念的解释也会有所不同,这种在概念解释上的灵活性和不确定性是中国法律制度所不允许的。随着科学技术尤其是数字化技术的发展,作品的种类不断增加,每一种新作品种类的出现都会对版权保护提出新问题,迫使人们从版权保护的目的出发重新认识创作的本质,检验、调整独创性标准,以适应新形势下版权保护的需要。有司法工作者认为,应对更加具体的案例,应当将“智力投入”作为衡量所有作品独创性的一般标准,即只要作者在作品中投入了智力劳动,就认为该作品具备独创性。这种观点有可取之处,并且可以从《著作权法实施条例》的规定找到依据,《著作权法实施条例》第三条规定“著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。”

(三)人工智能生成物的权利问题

需要厘清的是,人工智能生成物是否能够构成作品,和人工智能程序是否能成为作者是不同的法律问题,前者涉及作品的构成要件,后者涉及著作权法人本属性和关于权利人的规定。法律可以拒绝赋予人工智能作者身份,但是对于生成物是否构成作品应当采用客观标准。

文本空间与图像空间之间存在较大的语义鸿沟,正如“艺格敷词”之所以形成一种独特的艺术概念,就是因为文本和图像之间的鸿沟。那么作为“艺格敷词”的反面,“以文生图”的价值,就在于通过人机对话的往复,实现从文本到图像的转换。可以说人工智能极大地降低了艺术的门槛,进一步促进了文艺的民主化和平等化。

通过前文对生成式人工智能部分原理的描述,不难勾勒出人工智能生成物的产生过程。从图片标注文本形成一致性,到通过算法生成图片,再到模型质量控制时的选择、干预,生成的过程不是凭空而出的随机造物,也不是难以理解的“点石成金”,而是基于人类认知水平、知识、审美、风格的综合运算,人工智能本身的生成过程就充满了人的智力活动。至于人工智能使用者,本身的文本描述就属于其独特表达,对于生成物的选择、干预、修改,亦体现其自主取舍,均属于智力活动。人工智能生成物是符合作品定义,具备独创性要件的,应当作为《著作权法》保护的作品。

有学者认为,使用者无法控制人工智能生成过程,故对生成结果不具备支配性,不能视为其智力成果。但是否有脱离表达的思想,或没有思想的表达呢?“形式不是普通的感觉对象或事物的直接属性,而是人和物交融合一的产物,其中既包括现实性,又有艺术家的虚拟性。”不同表达的关键,正在于虚拟性,而非现实性。实际上从作品一旦生成,其表达就已经固定,但是其意涵还需要读者、观者的参与,对作品的理解也构成了作品解构的一个方面。著作权法并未拒绝无意识表达成为作品——例如使用颜料即兴泼洒产生艺术品等,但对于安迪沃霍尔的波普艺术,是对现有作品的复制,只是更改颜色和印刷方式,虽然产生后现代结构新的艺术含义,但拒绝认为构成作品。著作权法考量的不是因为对于思想与表达一致性程度,或表达过程是否可控制,归根结底是遵循思想表达二分法,核心是考察是否属于独特表达。

(四)人工智能生成物的权利主体问题

至于主体问题,互文理论认为,文本间的界限被打破之后,成为一个整体的话语的平台,写作不是所谓“创作”,而是词语的重新分配和重构。巴尔特认为:“一切文本都是互文本;其他的文本以不同的程度在它身上是在场的,或多或少可以得到辨认。”互文理论将“文本”进行生产资料式的解构,弱化了作者概念,而机器学习对海量素材的分析积累,正是将这种互文性践行到极致的新模式,对于何为创作提出了新的哲学艺术思辨,最终的解答或许要经过旷日持久的探讨,但法律面对的时代之间亟待解答。

人工智能缺乏自主的创作动机,需要人下达指令或设定程序,故其不能也不应当成为作者。《著作权法实施条例》第三条第二款规定,“为他人创作进行组织工作,提供咨询意见、物质条件,或者进行其他辅助工作,均不视为创作。”人工智能最多视为物质条件和辅助工作,不属于创作行为,人工智能的纯机器行为,也不属于其“智力成果”。此外,人工智能需要大量的学习、应用、反馈,其营利模式和迭代升级并不依托于出版者体系,开发者缺乏成为作者的动机,也可以通过用户协议即合同来解决人工智能生成物的作者署名问题。就目前而言,使用者作为作者符合法律和事实逻辑,亦不存在障碍。

(五)人工智能生成物的侵权问题

对于人工智能生成物侵害他人版权问题,如果不能确定权利人,谁来承担侵权责任就会成为难题。前文认为人工智能标注性机器学习构成合理使用,生成物构成作品,人工智能使用者为作者的结论,符合权利义务一体的内在逻辑,在讨论人工智能生成物的侵权问题时更能体现出这种逻辑自洽带来的体系价值。对于人工智能生成物侵权问题,如认定输入端机器学习阶段对训练素材的使用不构成合理使用,则人工智能开发者需承担相应侵权责任;如构成合理使用,技术提供者则无需承担训练开发阶段的责任,仅需考虑生成物的直接侵权问题,鉴于使用者对生成物的决定性作用,人工智能本身的辅助属性,生成物的产生是由使用者决定,该种情形下应当由使用者承担侵权责任。

对于他人侵害人工智能生成物版权的情形,除遵循一般的版权侵权判定原则外,还应考虑人工智能生成作品的特殊性,注意以下两个方面问题。一是使用者对风格、参数等生成环节不具权利。二是因相同人工智能模型的表达空间可能相对有限,是否构成侵权的实质性近似判断标准应当有一定的限制,使用者仅对其最终生成作品的选择、干预部分享有权利。被诉侵权人如提出证据证明其系独立使用人工智能生成而非直接复制,则应坚持较高的实质性近似标准。

五、结语

知识产权在现代经济中愈发重要,尤其在网络时代和人工智能时代,非实体性注定了知识产权制度是实现法治的重要工具.经济学家约拉姆·巴泽尔将产权定义为两种权利“经济权利”和“法律权利”。经济权利是最终目标,而法律权利则是达到最终目标的手段和途径。一般来说,法律权利会增强经济权利,但是法律权利不是经济权利存在的充分必要条件,法律权利的主要作用是第三方的裁决和执行。新的权利对应于新的经济力量而产生。权利从财产获益的能力意义上来说,很大程度上是一个经济价值,而不是法律概念的问题。面对生成式人工智能的时代之问,面对已经产生的经济利益,法律制度应当提供裁决和执行的规则,而非讨论该种经济利益是否应当得到法律的承认。这是按照法经济学指引对现实需求的必要回应,也是逻辑周延的必然选择。

(作者系中国司法杂志社编辑)