东村仁 臧可
摘 要:【目的】对人工智能生成物的法律属性进行准确定位,寻找人工智能生成物的潜在风险化解路径。【方法】从法律层面分析人工智能生成物的产生来源及过程,揭示人工智能生成物的本质。【结果】从人工智能“数据训练”创作方式和机器学习阶段分析来看,人工智能不具备民事主体资格,但其作品具有可版权性的可能性,应被赋予一定权利。【结论】赋予人工智能享有署名权的权利,以“使人工智能生成物成型确定下来”为分界线,在自然人范围内确定权属和责任承担者进行权利安排。运用实质性相似规则和市场替代标准化解人工智能生成物复制权和改编权侵权风险,同时适用过错原则,相应配置人工智能设计者、使用者“防抄袭设计义务”注意义务。
关键词:人工智能生成物;独创性;实质性相似;过错推定
中图分类号:D923.41 文献标志码:A 文章编号:1003-5168(2024)06-0116-08
DOI:10.19968/j.cnki.hnkj.1003-5168.2024.06.023
The Legal Nature of Artificial Intelligence Products and the Resolution of Copyright Infringement Risk
DONG Cunren1 ZANG Ke2
(1.College of Intellectual Property, Henan University of Economics and Law, Zhengzhou 450046, China;
2. School of Law, Northwest Normal University, Lanzhou 730070, China)
Abstract:[Purposes] This paper aims to accurately locate the legal attributes of artificial intelligence products and find the potential risk resolution path of artificial intelligence products. [Methods] The nature of artificial intelligence products is revealed through legal analysis of the source and process of artificial intelligence products. [Findings] From the analysis of the creation method of artificial intelligence "data training" and the machine learning stage, artificial intelligence does not have the qualification of civil subject, but the works have the possibility of copyright, which should be granted certain rights. [Conclusions] This paper gives artificial intelligence the right to enjoy the right of signature, and with "the formation of artificial intelligence products to be determined" as the dividing line, this paper determines the ownership and responsibility bearers within the scope of natural persons to arrange the rights. The substantive similarity rules and market substitution standards are used to resolve the risk of infringement of reproduction rights and adaptation rights of artificial intelligence products. At the same time, the principle of fault is applied, and the duty of care of "anti-plagiarism design obligations" of artificial intelligence designers and users is configured accordingly.
Keywords:artificial intelligence products;originality;substantial similarity; presumption of fault
0 引言
人工智能擁有极强的学习能力,在进行数据整合和模型建立后能够产出大量高质量的文字、绘画等生成物。人工智能的广泛应用以及它本身所具有的特性,给传统著作权法带来了巨大的挑战。根据目前的人工智能发展水平,人工智能需要在被“喂养”海量作品并进行机器学习后,才会形成人工智能生成物,因此有必要对人工智能进行著作权法研究。在著作权法背景下,人工智能侵权行为相较于人类作品侵权情况更为复杂,人工智能学习作品获取渠道的合法性和创作出的产物的可版权性值得研究。人工智能未经规范地获取、使用受著作权法保护的作品可能会侵犯人类作者的著作权,导致人工智能和人类作者之间的关系失衡,从而引发侵权纠纷。在认识到人工智能是文艺创作的创造性工具的前提下,对人工智能主体资格、权利归属有相对准确的定位,能更好地适用著作权法对人工智能生成物进行法律规范,促进版权市场健康发展。
1 人工智能的工具性和非主体性
以人工智能的特征为切入点,对人工智能侵权进行研究有一定的现实意义。应当从人工智能的属性入手,按照侵权要件确定人工智能在著作权法体系中的法律地位和侵权主体资格。
1.1 人工智能的工具性
1.1.1 人工智能生成物的形成过程。人工智能是一种智能化的机器。根据我国著作权法第二条和著作权法实施条例第三条规定,在严格意义上,只有自然人做出创作行为,其创作成果才有可能成为受著作权法保护的作品,法人或非法人组织属于著作权特殊主体,机器则完全被排除在著作权法规定的主体之外。然而在人工智能时代,随着科技进步,人工智能创作路径在不断变化,机器不再单纯是减轻人类体力劳动的辅助性工具,而是能和计算机、互联网、神经科学等科技手段结合,从事文案及代码撰写、绘画设计、数字或文字阅读处理等有一定难度活动的工具。
从人工智能创作的发展阶段来看,总体上有两种人工智能创作方式。第一种是“代码定义”,通过程序代码赋予机器人类的思维方式或思维结构,使其完成某种作品的创作[1],即事先向机器输入包含人类创作思维要素的代码编程。由于机器只是执行固定程序,因此在这一技术路径下机器对最终生成物的贡献度不高。第二种是“数据训练”,通过计算机算法对海量数据进行数据分析和建模,进而“模仿”人类创作的过程产出生成物。Mitchellt[2]在技术层面上对机器学习做出了明确的界定:“假定一个计算机程序从一个经验E中学会并完成一个工作T,那么,机器学习就是为了提升一个工作 T的执行能力P,并且当一个工作经历E累积时,它的执行能力P将会得到提升。”在这个概念中,“经验”其实就是一种机器可阅读的“数据”,即“经验”是机器可读形式的“数据”。吴汉东[1]把数据训练的过程分为数据输入—机器学习—结果输出,其以机器学习为技术支撑,实现在智力创造活动中。在数据输入阶段,人工智能对数据进行储存和分析,这些可供机器进行分析建模的数据多是受著作权法保护的作品,机器要么对其进行数字化副本处理,要么直接挖掘已数字化的作品。随后输入算法系统,然后进入核心阶段,即机器学习阶段,用训练集和测试集反复进行算法训练和模拟。最后进入“算法创作”的输出阶段,生成内容集算法编程、搭建神经网络、建立输出模型等。这不仅是对技术的综合运用,更可能是具有创造性的发挥,因此很可能成为著作权法所称的具有思想表達外观的作品。
对于机器学习阶段,Sobel和Benjamin[3]以机器输出内容中是否含有表达性内容为标准,将机器学习横向分类为表达型机器学习和非表达型机器学习。对于表达型机器学习,国内学者将之细分为普通型和特殊型。普通型不以特定作者为对象,特殊型则专门向特定作者学习[4]。用于普通型机器学习的算法训练数据来源于众多作者的作品。例如:2015年谷歌“Inbox”邮箱推出的“智能回复”服务产品,该服务产品选取了11 000余本爱情小说来训练算法,目的是让该产品能够写出活泼幽默、风格多变的语句;巴黎索尼计算机科学实验室用音乐家巴赫(Bach)的300首歌曲来训练其人工智能系统,“创作”出具有巴赫风格的音乐作品,报道显示有超过50%的被测试人员认为自己听到的就是巴赫的曲子。非表达型机器学习不输出表达性内容,进行作品复制并非为了学习作品中的表达性要素,而只是搜集事实信息。这些信息来源局限于某一固定方面。例如,人脸识别系统搜集大量人脸照片,仅学习照片中的显示人脸面部特征的要素以便准确识别人脸,这个过程既没有表达性输入和输出,作品复制亦未向公众传播。
1.1.2 人工智能本质上属于创作工具。人工智能拥有持续进阶的学习能力,采用数据训练方式的人工智能拥有一定的自主性,其输出过程并非按照预先设定好的编程进行,而是在特定领域或事务中不受外界干扰,部分或完全自主运行,只有少部分需要人类接管。深度学习环节正是人工智能实现一定自主性的关键。人工智能能够通过海量数据学习以及非既定性训练归纳出规律,并以此处理改造产出可能超出预期的“作品”。图灵测试相信在人机对话中,如果计算机可以成功欺骗人类,则认为该机器拥有人的认知与理解能力。也就是说只要机器的宏观功能与人类的智力行为是相同的,就可以用“智能”一词来描述这一功能。这是一种认知科学上高度的功能主义观点,即认为心智与大脑的关系可等价于程序与硬件的关系。20世纪80年代,美国哲学家John Searle设计了著名的思想实验“中文房间”(Chinese room),在这个实验中,计算机始终掌握的是无意义的字符,而非有意义的语义。他认为不可能通过某种程序操作从语言形式(syntax)中得到语义内容(semantic)。目前人工智能仍处于弱人工智能阶段,还没有脱离人类对其的控制,总是被人为设定的运行过程所限制,且受输入信息的约束。人工智能缺乏必要的认知情感与理性判断,是用来解释理论的科研工具。人工智能对数据训练所积累的规律的应用只是在模拟人类实践过程,显然这并不必然意味着人工智能的思考和决策过程完全等同于人类。因此,我们应当在承认人工智能自主性的基础上重新认识其工具性。
1.2 人工智能的非主体性
人工智能“数据训练”的创作方式和表达型机器学习的技术路径已表明,人工智能能够利用数据挖掘和分析来模仿人类创造性的智力活动,这是类人化的表现。从这个层面上来说,人工智能不再是纯机械性工具,而可能成为相对独立的“机器作者”或者说担任辅助创作的角色,与人类作者合作创作。人工智能到底能否成为法律主体,主要取决于其是否具备责任能力,能够对其行为负责,承担侵权责任。有观点认为,自然人法律人格的确立以理性意志为基础,但仍存在例外。因为自然人中存在着大量非理性、精神紊乱、意志力低下的人群,并且,法人法律人格的拟制在法律上亦能够被承认,赋予新型法律主体法律人格不一定需要该主体具有精神能力和意志力,因此应承认人工智能的法律人格[5]。本文认为,从民事主体基础理论和法哲学基础来看,人工智能不具有也不应有法律人格,应将其作为权利客体来看待,从哲学角度也只能将其看作是人实现目的的手段和工具。
1.2.1 人工智能没有民事权利能力。法律规定了法律主体的民事权利和义务,指引法律主体能做什么和不能做什么。人工智能因受到技术限制而缺乏规范认知能力甚至没有法律意识,让人工智能意识到自己有选择的自由并感知法律压力,不具有现实意义,因此也很难做出相应的决策和调整。
1.2.2 人工智能没有民事行为能力。“如果说民事权利能力是主体存在的必要条件,则民事行为能力就是作为主体的充分要件。”[6]人工智能没有自然人生理上的本能追求,对外表现出的是人工智能设计者的意思表示,人工智能无法产生从事民事活动的动机。
1.2.3 人工智能没有民事责任能力。人工智能无法真正理解人类社会中的抽象概念和规范,因此无法识别货币符号的价值和理解“财产支配、赔偿”的含义。部分学者主张采取“保险责任制度”和“赔偿基金制度”,在保额或基金范围内向受害人予以赔偿[7]。这仅是人工智能致损而承担责任的思路,不能将保险金额和基金视为人工智能的独立财产。
法人或非法人组织作为非人类主体被法律赋予人格并拟制成为作者,这一著作权立法模式使得部分学者主张效仿法人拟制制度建立人工智能拟制制度。“法人”这个概念由《德国民法典》首次创制,在法律上对满足特定条件的团体赋予权利能力,使其具备民事主体资格[8]。这其实是种拟制人格方式,即在法律框架之内将团体人格化。法人在法律上代表着人类团体意志的一种独立性,因此其具有独立人格,能够以自己的名义缔结法律关系,由法人机构行使权利和履行义务。法人统一于民事权利、义务和责任。法人有独立于团体成员且能够被法人独立支配的财产并承担财产责任,相比之下,人工智能没有可持有和处理的财产。即便如此,法人仍必须建立在人类的基础之上,是自然人的集合体。人工智能产业链条上都是独立存在的主体,例如,人工智能设计者、购买者以及使用者,这些主体不同于公司的董事、监事、高级管理人员等基于一个相同目的和意向而具有紧密联系。
综上,人与人工智能是一种控制与被控制的主客体关系。人工智能属于权利客体“物”的范畴,它能为特定人所支配,满足人类生产生活需要,直接赋予人工智能法律主体资格会违反主客体转换的原理。我们应当将人工智能看作人类实现一定目的的智能工具,它具备强大的计算机功能,能够高效地处理大量数据,还拥有类人的智慧,可以处理复杂任务,甚至自主地做出决策。因此,在适用法律方面必须充分考虑该系统的特殊性,采用除“直接进入公共领域”和“人格拟制”外的方法解决人工智能侵权问题。
2 人工智能生成物的可版权性与权利归属
即使是人类创作的内容,也必须先符合法律规定的作品构成要件,才能成为著作权法保护的对象,人工智能生成物更应如此。2022年文本描述自动生成图片(Text-to-Image)的AI绘画知名度急剧增加,一幅由MidJourney生成的数字油画获得了Colorado博览会艺术比赛的第一名。以目前人工智能发展平均程度来看,人工智能生成物在外观上和人类作品几乎完全一致,因此它是否可以成为著作权法的保护对象,重在其独创性的有无。
2.1 人工智能生成物可版权性探讨
2.1.1 实务案例对可版权性的考察。我国实务界关于人工智能生成物可版权性的讨论,主要集中在该类客体是否具有独创性,是否构成著作权法意义上的作品。北京互联网法院和深圳南山区法院在2018年和2020年先后审结了两个均被称为“人工智能著作权第一案”的北南两大案件,两案对人工智能生成文章作品做出了截然不同的判决。
两起案件都属于著作权侵权纠纷案件,双方纠纷产生焦点以及法院审理方向均一致。原告主张涉案文章系作品,侵害相关著作权,法院就原告是否为本案适格主体部分,分别判断涉案文章是否构成文字作品。北京互联网法院认为涉案文章不构成作品,其具有一定独创性,然而具备独创性并非构成文字作品的充分条件①。法院在判决书中认为,涉案软件开发者(所有者)承担软件开发,不涉及具体使用,软件用户也仅提交了关键词进行搜索,均未传递两者思想、感情的独创性表达;涉案文章采用软件的“可视化”功能自动生成,该分析报告外观形式符合文字作品要求,其内容也是软件对相关数据进行智能选择与分析后输出的,但是根据现行法律规定,文字作品应由自然人创作完成,自然人创作完成仍应是著作权法上作品的必要条件。由于分析报告不是自然人创作的,因此,即使威科先行库“创作”的分析报告具有独创性,该分析报告仍不是著作权法意义上的作品,依然不能认定威科先行库是该篇报告的作者并享有著作权法规定的相关权利。两年后的南山区法院在面临同样的问题时,从两方面判断涉案文章是否属于作品:首先,从Dreamwriter软件生成文章的外在表现上,认为其具有一定独创性;其次,从生成过程来分析,认为其体现了创作者的个性化选择、判断及技巧等因素,主创团队运用该软件在数据输入、触发条件设定、模板和语料风格取舍上的安排与选择,属于与涉案文章的特定表现形式之间具有直接联系的智力活动。法院认为在具体认定创作行为时,具有决定性的因素应当是相关创作行为能否被认为是智力活动,以及该行为与作品的特定表现形式之间是否具有真正关联②。人工智能的文章生成技术在两年后会发生较大变化,Dreamwriter软件的搜集素材、决定表达的主题、写作风格以及具体的语句形式都可以改变。有关生成内容的可选择范围相较于前案应当是扩大的,也就是说人工智能在文章生成过程中,其自主性行为对最终生成物的影响比例在增加,独创性的可能性会更大。南山区法院明确了人工智能独創性的判断步骤,在审理此类案件时做出了创新及探索,但法院仅说明人工智能写作软件的主创团队利用该软件的创作行为是智力活动,由相关人员的智力活动符合著作权法规定倒推软件生成的文字内容具有独创性,并没有阐明人工智能具有独立的创作能力的正当性来源。
2.1.2 人工智能生成物具有可版权性。自然人是创作作品的作者,独创性是自然人的创作思维在作品中的表现形式。人工智能没有著作权法上的法律主体资格,但这是否意味着因自由意志是人类独有而否定人工智能的创作能力?Disco Diffusion是2022年2月爆火的AI图像生成程序,可以根据描述的场景关键词渲染对应的图片。人工智能会根据描述词语的不同,生成不同风格的图片,即尽管数据库在短时间内没有更新,但根据描述差异,相同素材也会形成不同结果。人工智能具有一定的自主性已经表明,具有深度学习能力的人工智能已经能够摆脱“机械的延伸”这一刻板评价,深度学习能力可以认为是人工智能生成物具有独创性的源泉。人工智能以现代神经科学为基础,通过计算机建立结构神经网络来仿生人类神经信号从树突传递到轴突再到轴突末梢的过程。人工智能对输入数据的权值进行求和,然后计算出非线性函数,以提供给使用者最为合理的结果。因此能够高度模拟人类创作思维的人工智能创作与人类创作有一定的相似性,使得人们不会直接否定人工智能创作。自由意志的存否并非通过科学检验和证据验证的事实判断[9]。独创性不能完全理解成“人工智能生成物和人类作品的表达有区别之处”,其内容的表达体现着对于创作要素的能动性运用,人工智能生成内容与人类智力成果在生成过程中享有共同内在逻辑,两者在表现形式上则同样具有共同外在逻辑,何况人工智能自身本就是人智力活动的产物,因此它产生的内容天然具备人类智力成果的特征[10]。
ChatGPT是美国人工智能研究实验室OpenAI于2022年11月30日发布的一款聊天机器人程序,其可以流畅地与用户对话,也可以编写和调试计算机程序,对用户提供的数据进行分析总结。2023年1月巴黎政治大学宣布禁止使用ChatGPT等一切基于AI的工具,旨在防止学术剽窃。ChatGPT引入了RLHF(基于人类反馈的强化学习)新技术,能够实现算法自动优化,尽管它的目标任务和系统基础仍然由人类设定,但ChatGPT能根据使用者需求随时改变检索条件,从而增加数据结果的随机性,使其更加不可预测。再结合人工智能学习过程,在算法创作过程中,机器深度学习能力是使人工智能脱离人类的事先预设而实现个性化表达的真正源头,或算法自由实现了人工智能的个性化表达,且这是人工智能独立完成的。具体而言:
①人工智能生成物含有人格要素。“思想表达二分法”属于版权制度的基本原理之一,版权保护的范围是作品中含有的思想的特定表达,不能够扩展至作品中包含或体现的思想,然而思想在作品中所体现的程度大小只能通过表达来倒推。思想与表达仅通过外在形式连接,作者思想和人格在表达中的体现程度无法像“思想体现作者人格”所说的一样完整,思想体现人格只是理想状态下对人格是否在作品中有所体现的描述,这仅是应然层面,并非实际状态下实然层面上的描述。因此,著作权认定并不一定要只注重“思想”和“人格”的单一性,不应以此为由否认人工智能生成物成为作品的可能性[11]。人工智能基于前期设计能够形成观点或价值判断、依照用户要求对输出内容进行修改、可以对一些不怀好意的需求拒绝提供服务,这些都是人工智能人格的外在体现。
②作品是否构成实质性相似是独创性的重要标准。各类人工智能运行同一程序,因算法架构不同能够解析出不同策略,再采取该策略产生最佳结果。因此,人工智能生成物具有作品外观,且内容和原件作品不同,生成物吸收人类作品的创作特征。加之世界知识产权组织对作品独创性的规定是“作品是作者自己的创作,完全不是从另一作品抄袭来的”,本文认为可将人工智能生成物视为作品。创作者身份不应成为版权保护作品的必要条件,著作权法更应以实质标准以及评价标准进行考量:“机器作品”与他人作品不构成“实质性相似”;以人类读者为基础的“一般社会公众”认可,并不需要为了刻意将其与人类作者相区别而另设标准。
综上所述,人工智能生成物只要满足独创性要求、具有和人类作品相似的外观、有不同于人类作品的思想表达,在一般公众眼中难以区分是机器作品还是人类作品,即可认为其具有可版权性。在人工智能时代,传统制度中的“作者—著作权人”的著作权法结构应当增添新的涵义,以便著作权法及时对社会新事物给予回应,平衡人工智能生成物和人类作品的关系。
2.2 人工智能生成物权利归属
2.2.1 学界观点。关于人工智能生成物的权属问题,我国学者从人工智能表达个性、最低限度创造性原则、版权市场利益平衡等多个方面提出不同的见解。主要观点如下:
著作权归属于人工智能开发者。在著作权权属模式的证成中,对人工智能的作者主体资格与生成物客体资格进行适当分离。在机器作者与人类之间建立起一种可以被虚拟出来的委托创作的契约。如果机器作者创造出了具有独创性的作品,那么这时著作权就会被分配给人工智能系统的开发设计者,从而实现对作品版权的最初授权[9]。
著作权归属参照法人作品规定或按委托作品处理。在人机合成创作中,无论是“机器作者”还是人类作者,都为作品做出了实质性贡献。因此,从著作权法角度看,人工智能生成物可以被认为是代表设计者的意志而进行的一种创作行为的创作成果[12],因此按照法人作品规定确定其权利归属。
著作权侧重保护投资人的利益。当法律应该对人工智能生成物进行某种程度的保护,但同时也要将人类作品和人工智能生成物在法律保护上的不同之处表现出来时,人工智能生成物的权利就是为了保护投资者利益而存在的邻接权[13]。
从民法学角度解释著作权权利归属,即“知识财产孳息”,指生成物是独立于原物(即人工智能)所生之新物(即知识财产孳息)。该观点采用罗马法上的“原物主义”原则与日耳曼法上的“生产主义原则”,将人工智能创作物的权利归属于人工智能的开发者、使用者或者所有者[14]。
2.2.2 权利主体创作主体相分离。人工智能无法成为民法上的权利主体,人工智能生成物却有法律保护的必要,应当建立创作主体和權利主体分离的路径,破除人工智能生成物法律保护的首个障碍。传统主客体一致标准强调作品是作者意志的外化,在作者中心主义模式下摒弃作者身份承认作品的独创性是不成立的。“额头出汗”理论是版权法的基本原则之一,即创作时付出劳动即可获得版权。随着立法和司法的发展,1991年美国“Feist电话号码簿案”的法官认为尽管对电话号码簿的搜集和整理排序工作投入了精力和成本,但这种投入并不是人的智力创造性活动,达不到创作活动所需要的最低限度的创造性,故不具有独创性,重新确立了最低限度创造性原则。从这个理论分析来看,人工智能生成物更不可能达到独创性的标准,人工智能也无法因创作作品而享有著作权。而读者中心主义站在作者中心主义的对立面,认为作品脱离作者落入读者手中后,其意义是由读者赋予的。读者中心主义理论冲击了著作权法制度中“作者—著作权人”的结构,认为没有确定作者身份依旧不影响对作品独创性的判断。如孤儿作品无法确定作者但仍受著作权法保护。这是证成创作主体和权利主体相分离正当性的有利观点。在人工智能生成物能够成为作品的前提下,作者未必是第一著作权人,也就是说人工智能不作为第一著作权人,但仍可以受著作权法保护。人工智能生成物涉及多方主体,人工智能开发者、所有者和使用者都与人工智能生成物有密切联系,其可能参与了作品产生的一个或多个阶段。受人工智能主体限制,著作权法要完整保护作者和作品权利,就要对第一作者以外的其他主体也实施保护。
在现有著作权法制度下,赋予人工智能署名权是最佳选择。著作权法激励创作的指向对象的权利人只能是自然人和法人。当下人工智能多由法人组织充当主要开发者,公司或无组织自然人担任使用者,在这种情形下,以“使人工智能生成物成型确定下来”为分界线确定权利范围和责任承担者。人工智能并不天然具备创作动机,其创作动机和深度学习的标准是由人类提前植入规定的。人工智能以完成人类指令为起点,以满足人类需求为终点进行有限创作。可见创作作品的最终内核部分是由人类全权掌控确定成型的,因此开发者、所有者以及使用者可能是享有人工智能生成物著作权权利的主体,但投资者不符合著作权法中作品所有者的相关规则;设计者創造了人工智能,但并没有参与人工智能后续选择材料、深度学习、创作模拟至输出的过程,因此不能对人工智能生成物享有著作权;使用者若只是单纯使用该系统,未对成果形成任何实质性贡献,也不能享有同样的权利。本文认为,应当借鉴合作作品的权利分配思路,根据具体情况分别判断。人工智能等同于多个利益主体的代表,例如,其背后的实际控制者、用户和投资者,实际上扮演着一种“固定”作品的“合作者”角色,进行筛选素材、归纳总结、预测结论、情感模拟等工作[15]。将人工智能拟制成名义上的作者进而赋予署名权,人工智能系统开发者、所有者以及使用者根据实质贡献比例大小进行利益分配和责任承担。
3 人工智能生成物的著作权风险与解决思路
人工智能创作著作权侵权的最主要困境是,机器学习中数据训练作品获取和使用的合法性问题。对作品进行挖掘、处理、抓取等行为性质是合法还是侵权,决定了后续机器学习和输出行为是否具有正当性,同时也关乎人工智能技术发展趋势。著作权法不应固守只以自然人创作为中心的理念,应该调整机器作者和人类作者之间的关系,同时把握人类在人工智能开发、创作以及完善中的主导和引领作用,在著作权法变革中坚持立法目标和制度价值取向。
3.1 风险预估:实质性相似规则与市场替代
发生复制权侵权可能性最高的阶段是人工智能生成输出阶段。在人工智能创作中,虽然最终输出的生成内容具备了一定的独创性,但是它依然维持了数据库中某一作品或一些作品的基本表达,这应该是一种改编作品,这种创作行为如没有得到著作权人许可并向其支付报酬,那么就有可能侵犯改编权[16]。根据人工智能对数据的利用情况来看,可以分为“利用多人作品”和“利用同一人作品”两种。前者如《阳光失了玻璃窗》,这是一首由微软公司的“小冰”在对1926年以后500余名当代诗人的作品进行深度学习后写成的诗;后者如由微软开发的“下一个伦勃朗”人工智能,该人工智能通过深度学习伦勃朗的346幅画创作出了与原画相似度极高的绘画作品。二者都侵犯了作品改编权,区别在于前一个行为侵犯了不同作者创作的不同作品,后一个则侵犯了同一作者的多部作品。人工智能最终生成的内容和供机器学习的作品内容实质性相似度较高,根据“接触+实质性相似”标准进行判定或构成侵权,进一步采用“思想表达二分法”进行判断,构成相似的要素是思想而非表达,也不能认为其是侵权。判断实质性相似规则中的主体标准和客体标准在实践中主观性较强,妨碍了初步判定侵权结论的一致性。对于文学作品或者音乐作品应当以“一般公众”作为判断主体,以便将判断主体标准客观化[17]。也就是建立相关人工智能算法,训练算法对主体运用和创造水平的判断能力,判断内容包括综合提取作品片段程度以及使用范围等方面。人工智能能够精准适用整体观察法和抽象过滤法,并且减少先入为主对于判断的影响,对创作物与原作品的相似程度进行智能化、精确化和客观化的比对,成为合理适用相似性规则的技术支撑。
人工智能数据输入阶段是容易被忽略的一个阶段,数据输入同样也存在侵权风险。数据输入是人工智能生成物产生的前序环节,类似人类学习过程中“学习他人”的方法,人工智能要事先搜集海量数字化作品进行分析建模,提取作品中对创作有价值的概念、结构、规则、模式等进行深度学习。人工智能挖掘可供训练的作品大体有两种途径:一是扫描作品原件后将其转化成机器可读形式,如谷歌数字图书馆扫描世界范围内的图书是为了建立一个集成式数据库,用于人工智能进行文献翻译、语言搜索等创作需要。二是在互联网上直接抓取已经数字化的作品。机器学习的新型“复制依赖型”技术大致包括“接触、提取、挖掘、使用”4个环节。以机器学习挖掘纸质作品为例,第一步用影像技术将书本按页转换成电子图片;第二步用光学字符识别技术将文字从电子图片中识别出来,然后将其转换成二进制形式的数据集;第三步把转换好的数据集拷贝进人工智能计算机系统为后续使用提供来源。从现行《著作权法》第十条第一款第(五)项在原有7种复制类型基础上专门增加了“数字化”复制方式可以看出,这两种数据输入方式均属于法律规定的数字化复制,即对作品进行原封不动的全文复制并保存复制件,这同样是一种侵权行为[18],而恰恰这种复制行为在人工智能学习过程中是必不可少的。
为防止人工智能侵犯著作权,对其大量获得作品资料的行为进行限制,机器学习的作品集会因此减少,从而导致算法偏见。缺乏高质量作品的作品集本身就可能不全面或者带有偏见,人工智能的学习模式会加剧这种片面。机器需要规模巨大、种类丰富的数据进行学习,如果学习作品需要事先取得许可,由此产生的较高许可成本会打击一些人工智能开发者的积极性。人工智能拓展了作品的使用方式,但若不及时有效干预可能会极大损害人类作者权利。将市场替代作为侵权认定标准符合著作权法对保护著作权人垄断市场利益、平衡著作权人利益和社会利益以及促进科技发展的立法目标,即当侵权行为对版权人市场影响较小时,法院很可能不认定其为侵权。在2015年“谷歌图书馆”案件中,法院从谷歌图书馆对著作权作品的利用角度出发,全面考量了其对数字化图书馆的利用目标,并以此为依据得出结论:谷歌图书馆对版权人作品的“碎片化”搜索能力缺乏一致性、完整性,无法替代原创作品成果,且对版权人拥有的潜在市场收益影响不大,从而判定谷歌图书馆使用版权作品的目的和数字图书馆整体功能为“正当利用”,不构成“侵权”。在判定侵权时,可以用市场替代标准来弥补实质性相似原则的不足[19]。
3.2 侵权风险承担方法:过错责任原则
当人工智能程序的开发者同时也是使用者时,理应对该人工智能程序享有著作权,有权控制该程序的发表、发行和传播。如果一个程序开发者在对一个受版权保护的作品进行编码后,将其植入一个程序中,它所生成的内容融合了这个程序所产生的可被辨认的实质性表达,那么在这种情形下,这个内容的版权应该归这个程序的开发者所有[20]。而对于人工智能生成物,则要看人工智能生成过程。如果人工智能生成物依赖于使用者输入指令(无指令无输出内容的人工智能,无法自主生成具有独创性的内容),必须经过使用者进行数据筛选后才能输出内容(但输出过程并非对命令进行简单转译,符合人工智能可版权性的个性化表达标准),这时使用者既是人工智能的激活因素,也是使“人工智能生成物成型确定下来”的人。如人工智能深度学习功能支持对使用者提供的初始数据库之外的数据进行学习,由此产生的生成物可属于上述情况。反之,若使用者只是按下生成的按键而不参与任何输出内容的形成过程,则不能认定其对人工智能作品有实质性贡献。承担责任的重要基础在于行为人具有过错,使用者并不是在任何情况下都无须承担责任。
3.2.1 设计者的过错推定。对人工智能进行训练的人工智能开发者作为预防人工智能创作失控的第一环,理应履行一定的“防抄袭设计义务”(Obligation of Copy Prevention by design)的注意义务。它来源于隐私保护领域中的“隐私设计”(Privacy by Design)[21]。当今社会中数据信息使用和隐私保护间的冲突日益加剧,相关领域的“隐私设计”理念也逐渐时兴,这就要求网络产品和服务的提供者在其提供的系统中全面建立隐私保护理念,其中涉及系统开发目标、设计流程和操作步骤等。并要求遵循主动保护、默认保护、嵌入保护等原则,使人类社会对抄袭的道德谴责能够在算法层面转化成为实在的法律规制。
3.2.2 使用者的过错推定。人工智能使用者责任认定源于人工智能工具属性和自主性的交互关系。使用者既不应因开发者未合理获取学习数据而侵权,也不应因学习数据合法、算法创作过程自主进行而不对生成物承担侵权责任,即人工智能使用者不在设计者可见范围内启动人工智能创作,人工智能的使用方式和场景由其指令直接决定,并且使用者基于许可能够从人工智能生成物中直接获益。因此人工智能使用者应履行衔接流程的监管和控制义务,及时遏制侵权行为的苗头。
4 结语
人工智能是科技理性和人类智慧的有机结合,对人工智能的肯定既是对人类科技发展的支持,也是对人类意志的赞赏。具有深度学习能力的人工智能兼具工具性和创作自主性,虽不具有法律主体资格,但仍可根据独创性标准承认其生成物为作品并给予著作权法保护。人工智能的特殊性会导致复制权等著作权侵权问题,无救济则无权利,事先确定好权利归属才能更好地解决侵权问题。侵权责任的认定关乎创作者和作品传播者的激励,应当适用过错责任原则。科学技术向著作权法提出了新的挑战,我们应该正确对待人类智力活动和人工智能的关系,在维护法律稳定性的前提下用谦抑的方式实现法律与科技的良性互动。
注释:
①参见北京互联网法院民事判决书(2018)京0491民初239号。
②参见深圳市南山区人民法院民事判决书(2019)粤0305民初14010号。
参考文献:
[1]吴汉东.人工智能生成作品的著作权法之问[J].中外法学,2020,32(3):653-673.
[2]MITCHELLT M. Machine Learning[M].New York: McGraw-Hill,1997:22.
[3]SOBEL S,BENJAMIN L W. Artificial Intelligence's Fair Use Crisis[J].Columbia Journal of Law & the Arts,2017,41(1):49-79.
[4]李安.机器学习作品的著作权法分析:非作品性使用、合理使用与侵权使用[J].电子知识产权,2020(6):60-70.
[5]骁克.论人工智能法律主体的法哲学基础[J].政治与法律,2021(4):109-121.
[6]郭明瑞,房绍坤.《民法》[M].北京:高等教育出版社,2021.
[7]刘洪华.人工智能法律主体资格的否定及其法律规制构想[J].北方法学,2019,13(4):56-66.
[8]李扬,李晓宇.康德哲学视点下人工智能生成物的著作权问题探讨[J].法学杂志,2018,39(9):43-54.
[9]徐小奔.论算法创作物的可版权性与著作权归属[J].东方法学,2021(3):41-55.
[10]孙正樑.人工智能生成内容的著作权问题探析[J].清华法学,2019,13(6):190-204.
[11]孙山.人工智能生成内容著作权法保护的困境与出路[J].知识产权,2018(11):60-65.
[12]熊琦.人工智能生成内容的著作权认定[J].知识产权,2017(3):3-8.
[13]许明月,谭玲.论人工智能创作物的邻接权保护:理论证成与制度安排[J].比较法研究,2018(6):42-54.
[14]黄玉烨,司马航.孳息视角下人工智能生成作品的权利归属[J].河南师范大学学报(哲学社会科学版),2018,45(4):23-29.
[15]郭万明.人工智能生成成果的法律性质及著作权保护[J].出版发行研究,2022(5):58-64.
[16]焦和平.人工智能创作中数据获取与利用的著作权风险及化解路径[J].当代法学,2022,36(4):128-140.
[17]刘强,孙青山.人工智能创作物著作权侵权问题研究[J].湖南大学学报(社会科学版),2020,34(3):140-146.
[18]詹启智.论仅复制未发行侵权行为赔偿数额的确定[J].科技与出版,2016(9):63-66.
[19]曾田.人工智能创作的版权侵权问题研究[J].河北法学,2019,37(10):176-189.
[20]陶乾.論著作权法对人工智能生成成果的保护:作为邻接权的数据处理者权之证立[J].法学,2018(4):3-15.
[21]初萌.人工智能对版权侵权责任制度的挑战及应对[J].北方法学,2021,15(1):138-150.