人工智能学习创作的侵权困境与出路

2019-12-26 21:54马忠法肖宇露
武陵学刊 2019年5期
关键词:著作权人权利人工智能

马忠法,肖宇露

(复旦大学 法学院,上海 200438)

引 言

在1956年美国达特茅斯会议上,人工智能概念首次被正式提出[1]。而后经过数十年的发展,以大数据、人工神经网络和深度学习技术为基础的人工智能,正深刻而广泛地影响着人类生活工作的方方面面[2]。在文学艺术创作领域,人工智能也相继生成具有较高价值的人工智能创作物①。美联社使用写稿软件wordsmith平台,对公司财报的新闻进行自动化写作[3]。谷歌公司不仅研发出Magenta人工智能机器人,可以自主创作钢琴曲[4],同时还研发出Deep Dream人工智能绘画机器人,可以进行画作的创作[5]。这些画作曾在美国旧金山的一场拍卖会上进行拍卖,而最后拍得高达10万美元。

人工智能相关技术的快速发展及人工智能创作物的大量涌现,虽然繁荣了文化市场,但也给目前的著作权法律制度带来了极大的冲击[6]。当前法学界对于人工智能创作的法律问题研究,主要聚焦在两个问题:一是人工智能创作物的作品属性认定;二是人工智能创作物的著作权归属模式的选择[7]。但事实上,人工智能创作过程中,有一个步骤往往必不可少,但却总是被法律研究者所忽略。该步骤就是人工智能训练者②通过使用他人作品来训练人工智能,从而使其自主学习和理解作品的相关要素和概念,进而自主掌握作品创作的方法和路径。那么,这一行为是否会构成对作品权利人的著作权侵犯?如果答案是肯定的,如何通过一个合理的制度设计,来平衡人工智能技术发展和作品权利人之间的利益?要解决以上两个问题,关键是厘清人工智能学习创作的原理和过程,把握人工智能学习创作过程中对他人作品数据的使用情况。在此基础上,分析该行为是否侵权;如果是,再探讨如何走出困境。本文就上述问题进行分析和论证。

一、人工智能学习创作的原理和过程

(一)人工神经网络的构建

人工神经网络模型是一种模仿人类神经网络行为特征,由简单处理单元构成的大规模并行分布式处理器,其具有和人类相类似的向外界环境学习、获取知识的能力,并通过神经元之间的连接强度设定,来存储所掌握的知识[8]。构建人工智能神经网络系统,使得人工智能具备了完成学习任务的能力,可以通过模式联想、模式识别的方式,进行数学建模,设计解决问题的方案[9]。所以,人工智能神经网络的构建,是人工智能进行学习创作的前提,是人工智能拥有学习能力的基础。

(二)人工智能通过大数据进行机器学习

人工智能神经网络构建完毕后,人工智能训练者将数据资料,导入到人工智能程序中,人工智能神经网络将根据自身系统的学习模式,对数据进行挖掘,寻找特征量和目标任务之间的函数关系,从而建立数学模型。在目前的人工智能学习创作中,应用最多的是强化学习和无监督学习的两种机器学习技术手段[10]。它们的共同特点是,数据资料均不需要进行事前标记标号,而由机器进行自主的学习。它们的区别主要体现在外界环境和系统本身对于模型构建的影响方式和途径的不同[11]。所以,对于人工智能的训练而言,均涉及到将没有标记标号的作品数据复制到人工智能程序中,然后由人工智能对数据资料进行自主学习分析,而后建立函数模型,进而具备解决任务的能力,也即是创作能力。

(三)人工智能进行创作

经过以上两个环节后,人工智能已经构建出解决不同目标任务所需要的函数模型算法。此时,使用者可向人工智能发出创作要求和指令,人工智能将基于函数模型中的特征量和对应目标任务的构造,生成相应的内容。值得注意的是,此时人工智能所生成的创作物,并非是对用于训练的原作品进行剪切、杂合,而是通过深度学习,对原作进行抽象化的理解,进而构建出数学模型,并据此输出的创作内容。

二、人工智能学习创作的著作权侵权分析

根据我国《著作权法》的规定③,人工智能训练者使用他人作品,来训练人工智能学习创作,可能涉及到的著作权侵权行为,主要是指训练者未经作品著作权人的许可,而且无法律上的依据,擅自复制并使用他人作品,也即是对作品复制权④的侵犯。不过,有人指出,人工智能通过机器学习,然后生成创作物构成对原作品的演绎权侵犯[12]。然而事实上,人工智能学习作品后,已经以数学模型的方式抽象出对作品的理解。之后使用者要求其直接自由创作,人工智能也是根据函数模型,也即是算法程序,来进行创作,期间并没有对任何一件作品进行改编、翻译等等,所以人工智能根本不可能自主侵犯作品的演绎权和汇编权。除非使用者下达对某一件作品进行改编的指令,然后人工智能才会对该作品进行改编,而这过程显然是使用者的意志,而且与人工智能学习创作的过程无关。因此,人工智能学习创作过程中,只是对作品进行分析,寻找作品表达中的特征量和学习任务直接的函数模型关系。人工智能没有在原作品的基础上,对其加以创作,也没有对原作品或者原作品的片段进行选择和编排,并将其汇集成新作品,因此不构成对原作品演绎权⑤和汇编权⑥的侵犯。所以,本文将从著作权的复制权侵权构成要件出发,分析训练者使用他人作品数据,来训练人工智能学习创作的过程中,是否侵犯了著作权人的权利。

(一)侵犯作品的复制权分析

训练者在训练人工智能时,需要向它导入电子数据资料,而这一过程,就是通过电子数据形式复制保存作品资料的过程。然而,在实际操作中,训练者可能需要将传统形式的作品进行电子化和数字化处理,从而使得作品可以被人工智能有效识别。不过,有人指出,人工智能编创的复制具备非表达性使用,同时这种复制行为不能形成传递作者原创性表达的复制件[13]。但事实上,这是对人工智能学习创作原理和过程的误解。首先,人工智能学习创作需要事先复制作品,以电子化的形式保存到计算机硬件上,然后人工智能对作品进行分析。而这个过程不仅有对数据资料的永久复制,也有临时复制的缓存产生。虽然临时复制可能不属于著作权法意义上的复制权范畴,不构成侵权,但是永久复制作品数据的行为,就必然属于侵犯权利人作品复制权的行为。此外,在实际训练过程中,为了提高人工智能学习效率和确保数据信息安全,一般都是要下载数据资料到人工智能本地库,难以实现直接在线分析学习数据资料的技术操作。其次,人工智能复制作品不是自动程序性的操作,是训练者进行的主动性和选择性的操作,是有人为意志的作用。最后,人工智能对作品的使用,是为了掌握作品创作的方法。而创作就是进行表达性内容的生成,因此,人工智能学习创作,就要求其对作品的所有表达性内容进行学习、分析,而这个过程显然就是表达性使用作品。因此,人工智能对作品的学习,是一种基于复制行为的使用行为,构成对他人作品复制件的独立利用。

一般而言,用于训练人工智能的作品数据资料,来源于三种渠道:(1)公共领域的作品,训练者直接使用这一类的作品,显然不违反《著作权法》的相关规定。(2)获得作品权利人的授权,训练者合法地使用数据资料,这显然也是不具有违法性。(3)训练者未经作品权利人的许可,而使用其作品,给其造成损害,则该行为就具有违法性。但是,如若训练者获得并使用作品数据,具有法律上的合法原因,也即是符合合理使用和法定许可的情形,则阻却其行为的违法性,其行为也就不构成侵权。所以,下文将重点讨论,训练者使用他人作品数据,来训练人工智能的行为,是否符合合理使用和法定许可的构成要件。

(二)合理使用的判断

合理使用是指在特定的条件下,法律允许他人自由使用享有著作权的作品,而不必征得权利人的许可,不向其支付报酬的合法行为[14]。根据《著作权法》的规定⑦,就人工智能学习创作的情形而言,若要满足合理使用的构成要件,需要符合以下两种情况:(1)为学校课堂教学或者科学研究,翻译或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行;(2)为个人学习、研究或者欣赏,使用他人已经发表的作品。

对于第一种情况,只要训练者是为进行人工智能相关技术的学校课堂教学,或者从事人工智能技术的科学研究,而少量复制已经发表的作品来满足教学或者科研人员使用,是符合合理使用的构成要件的,因此本文不对此赘述。对于第二种情况,则需要重点讨论。因为训练者为了让人工智能学习研究创作,而使用他人已经发表的作品,是否属于法条中所要求的“为个人学习研究”之目的,具有较大争议[15]。从表面形式上看,训练者使用作品,确实是为了让人工智能进行学习研究如何创作,并非以训练者自身学习创作为目的,如此一来,则不符合法律的要求。但是,由于人工智能学习创作具有自身的特殊性和复杂性,因此我们需要从以下两个方面对其理解。

一方面,人类其实是参与到人工智能的学习过程。人工智能要学习创作,首先必须要由其设计者事先构建人工神经网络系统,从而让人工智能具备学习能力,这其中蕴含了设计者对于人工智能如何进行学习创作、理解作品的思考学习过程。换言之,人工智能学习创作的过程,可以看作是人类先把自己学习创作的思维通过人工神经网络来展示出来,然后再由人工智能神经网络来执行人类的意图。人类不再以传统的直接方式来学习作品,而是由人工智能替代人类进行作品的间接学习方式。此外,由于人工智能学习具有被动性,需要人类来帮助导入数据资料和启动学习。因此,训练者实质性参与到了人工智能的学习过程,所以严格来讲,人工智能其实并不完全是独立自主的学习。因此,人工智能学习创作,其实也是人工智能设计者和训练者在学习创作。

另一方面,人工智能学习创作是人类学习人工智能技术的过程。因为人工智能设计者和训练者研发人工智能技术的目的,就是为了创造出一个可以进行创作的机器。而人类为实现这一目标,必定需要经过学习研究人工智能技术的过程。而在人类学习人工智能技术的过程中,必定需要使用作品数据来训练人工智能,从而判断其性能。所以从整个人工智能技术的研发过程来看,人工智能学习创作是人类学习人工智能创作技术的一部分。换言之,是设计者和训练者为了实现自身学习人工智能创作技术之目的,而使用了作品数据,来训练人工智能。所以,人工智能训练者为了让人工智能学习研究创作,而使用他人已经发表的作品,属于“为个人学习研究”之目的。

然而,以上两种情况要满足合理使用之要件,还需要符合“使用他人已发表作品”和“非商业性使用”两个要件。也即是,用于人工智能训练的作品必须是他人已发表的作品,同时人工智能学习创作不能以商业性使用为最终目的。虽然我国《著作权法》没有明文规定,合理使用行为是否需要为非商业性使用,但是在学术界和司法实践中,都将非商业性使用作为合理使用的判断标准之一[16]。不过,在美国司法实践中,却以使用作品行为是否构成“转换性使用”来判断是否属于合理使用,并认为新作品所实现的转换性程度越高,商业性使用等合理使用其他判定要件的重要性就越低⑧。例如,美国谷歌数字图书案中,法院认为谷歌公司复制使用图书资料的行为具有高度转换性,从而构成合理使用⑨。

因此,有学者认为人工智能编创目的和内容均具有转换性,因此人工智能编创属于转换性使用[13],但这并不符合事实和法理。首先,我国法院引入转换性使用的方式,是将其纳入合理使用条款中“为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已经发表的作品”这一法定类型,并将“说明某一问题”作为转换性使用的同义语。也就是将原作品作为新作品表达的依据或论据来使用,而非重复原作品原来的使用目的[17]。可是,人工智能使用他人作品,并不是为介绍、评论某一作品或者说明某一问题,而是为了学习掌握作品的相关要素和作品的创作方法。因此人工智能使用他人作品的行为,在我国无法用转换性使用来进行法理解释。

其次,人工智能创作内容和创作目的也不具有转换性。一方面,人工智能不是在原作品的基础上进行再创作,而是对原作品的特征进行学习,从而掌握创作方法,再根据使用者的要求,进行不同于原作的创作。所以,人工智能创作属于全新创作,不是转换性创作。另一方面,人工智能使用作品的目的没有转换性,因为人工智能复制使用作品的目的本质上还是先复制作品,然后对作品学习,这和人类复制作品,学习作品的行为没有任何区别,无法体现出转换性。至于人工智能在使用他人作品的过程中,可以促进人工智能技术的发展,因此其行为具有公益目的的转换性使用。但事实上,很多侵权行为都具有或多或少的公益性,合理使用的判断关键,其实也是个人利益和公共利益之间的博弈与平衡。而且通过转换性使用来变相扩大对公共利益的考量,是否又陷入商业性使用的构成要件的判断循环呢?因此,以商业性使用为最终目的的人工智能学习创作而使用作品行为,完全不符合转换性使用的构成要件,故而也不符合合理使用的构成要件。

(三)法定许可的构成要件判断

法定许可是指在特定的情况下作品使用者可以不经著作权人同意而使用已经发表的作品,但必须依法向著作权人支付报酬[18]。根据我国法律的相关规定,法定许可的情形主要包括以下六种情形:其一,编写出版教科书⑩;其二,报刊转载⑪;其三,制作录音制品⑫;其四,广播电台电视台播放作品⑬;其五,制作课件的信息网络传播权⑭;其六,扶助贫困的信息网络传播权⑮。显然,人工智能学习创作而使用他人作品,均不符合以上六种情形,也即不符合现行法律下的法定许可的构成要件。

三、人工智能学习创作的侵权困境

通过上文分析,人工智能训练者若是出于商业使用之目的,未经他人许可,而复制使用他人作品,用于人工智能学习创作,则必定构成侵权。但事实上,商业化的大规模应用才是人工智能创作技术发展的最终目标。因此,对于以商业性使用为目的,人工智能学习创作而使用作品数据的侵权问题,是最为迫切需要解决的法律问题。此外,大数据资料是人工智能技术发展的基石,以人工智能研发公司为代表的利益集团和以作品著作权人为代表的利益集团将势必引起新一轮的利益冲突。

(一)著作权法的立法目的与利益平衡

著作权法是一部调整因作品的创作、传播和使用,而产生的各种社会关系的法律规范。著作权法的调整核心便是以作品中心而产生的各种利益关系。在某种意义上来说,著作权法就是一部对作品相关权益进行分配的法律,在作品获取成本与作者创作激励收益之间实现利益平衡。所以,为协调和平衡著作权人利益与社会公共利益,著作权法具有双重目的,即著作权既要充分保护作品著作权人的利益,又要维护社会公共利益[19]。保护著作权人的权益,是因为著作权法的保护客体就是人类的智力劳动成果,所以著作权法的核心就是保护著作权人对于作品所付出的创造性劳动,从而激励作者继续创作,促进科学文化知识的发展和传播[20]。而维护公共利益,是为了增加知识和学习的公共利益目标,促进作品的传播以及保障公众对作品接近的权利[21]。要实现著作权法的上述立法目的,需要在法律制度层面进行设计,使得作品著作权人和作品使用者之间实现利益平衡,也即是在知识垄断和分享之间实现利益平衡[22]。

对于人工智能学习创作而使用他人作品的情形而言,主要牵扯到以人工智能研发公司为代表的社会公共利益集团,以及以作品著作权人为代表的创作者利益集团。因此,在对人工智能学习创作而使用作品的行为进行法律规制设计时,需要厘清两者之间的利益冲突矛盾点,从而在利益平衡原则的指引下,针对性地对现有著作权法律制度予以调整和完善,实现利益相关主体间的和谐,为科学技术和文化事业的发展提供有力的法律支撑。

(二)人工智能学习创作的利益冲突

1.过于宽松的作品数据保护制度,著作权人的利益将受到损害。首先,著作权人通过作品所获取的经济利益将受到减损。由于目前人工智能属于计算机程序,是智能机器的一种,其不仅具有较强的学习和创作能力,而且可以连续快速地生成大批量的创作物,甚至可以实现“不停工”创作。这些人工智能创作物由于具有较高的艺术价值,往往可以卖出较高的价格,使得相关权益人可以获得较高的经济收入。但是反观人类创作者,囿于自身时间和精力的有限性,只能创作出数量极其有限的高水平作品。如此一来,人工智能创作物将大量快速地涌入文化市场,对现有的传统作品市场造成极大冲击。此时,文化产品消费者将有更多的作品可以选择,不再局限于传统人类创作的作品。在消费需求并无明显增长的情况下,传统人类作品的购买量必然大幅下降,使得作品著作权人无法通过既有的作品来获得更多的经济报酬。而更为严重的是,若实行过于宽松的作品数据保护制度,作品著作权人便无法通过自身作品用于人工智能学习创作而收取一定的经济报酬,来弥补自身作品销量下降而带来的损失,从而使得著作权人的利益进一步受到损害。

其次,作品的著作权人和使用人的地位将不再对等。以往,作品的使用者大都是个人,或者小公司、小团体等等,他们和权利人的地位大都相差不大,这使得著作权人和使用人可以相对平等地进行谈判,从而确保双方都可以实现较为理想的权利目标。但是,当前人工智能商业研发公司一般都是信息技术领域的巨头,例如谷歌公司、微软公司和腾讯公司等等。这些公司往往都是人力、财力非常雄厚,而著作权人却依旧是势单力薄的分散个体。这导致作品著作权人在与人工智能研发公司的谈判过程中,明显处于劣势,使得著作权人的利益争取变得愈加困难,这将不利于著作权人的权益保护[23]。此外,若人工智能研发公司侵害作品著作权人的利益,作品著作权人也囿于自身力量单薄,在取证、维权等方面,处于明显的劣势,难以有效地保障自身的权益。

最后,人工智能复制使用他人作品数据的违法行为通常比较隐蔽,难以被发现和取证,使得著作权人的维权成本将急剧增高,而且维权效果也不佳。现实中,人工智能研发实验室往往处于森严的安保环境内,而且作品数据的使用一般都是脱机操作,这导致一般人难以进入现场,及时发现和制止违法行为。此外,脱机操作导致难以利用互联网等网络技术手段对违法复制行为予以发现和记录。因此,人工智能违法复制他人作品的行为难以被有效发现,使得著作权人的维权难度较大和维权成本较高。另外,除了自主对作品进行电子化转换外,人工智能研发公司也可以借助网络平台,较为容易地获取大量作品数据。例如利用“爬虫”技术,便可对互联网上的作品数据进行快速大量的提取和保存,以便后续的使用。此外,由于研发公司实验人员的信息技术水平往往比普通大众要更高,这就导致人工智能公司可以较为轻松地规避一般的作品保护技术措施,从而复制使用作品数据,导致著作人难以通过有效的技术手段来保护自身作品不被非法使用。

所以,考虑到人工智能学习创作的技术优势,以及人工智能研发公司的雄厚实力,处于劣势的作品著作权人出于对自身利益的保护,往往不愿意,或者以非常高的价格,将作品授权给人工智能研发公司进行商业性的使用,从而阻止人工智能对于作品的学习和创作,以确保自身可以获得更多的经济收益。

2.过于严厉的作品数据保护制度,公共利益将受到损害。人工智能技术的快速发展,已经深刻地改变人类社会生活的方方面面。我国已从中央层面对人工智能技术的发展,进行了顶层设计和宏观规划,并印发了《国务院关于印发新一代人工智能发展规划的通知》。由此可见,促进人工智能技术的发展,是我国加快建设创新型国家,实施创新驱动发展战略和提升国际核心竞争力的必然要求[24],符合人民利益和国家利益。此外,促进人工智能创作技术的发展,不仅可以繁荣文化艺术作品的市场,丰富人类精神文化营养的选择,促进精神文明建设,也可以促进人类和人工智能创作之间的良性竞争,调整人类和人工智能在文化创作中的角色定位,实现文化产业的转型与发展,从而丰富社会文化的多样性,在整体上提升社会知识文化水平。过于严厉的作品著作权保护制度,将导致研发公司因无法获得作品的授权使用或者以极为高昂的代价获取授权使用,使得人工智能研发技术的成本急剧升高,或者使人工智能由于没有巨量作品数据的支撑而陷入“巧妇难为无米之炊”的困境。长期以往,人工智能创作技术将出现发展停顿,这将不利于国家科技强国战略政策的落实,也不利于作品的传播与推广,导致文化产业的发展陷入停滞、甚至倒退,这将损害了社会大众的公共利益[25]。

此外,作品数据授权交易的市场失灵,也将导致社会资源配置的浪费和混乱,进而损害公共利益。市场失灵包括市场存在垄断和控制力量、严重的信息不对等、交易成本过高、无法或者难以达成交易等等[26]。如若要求人工智能学习创作而使用他人作品数据,必须获得授权人的许可,将增大交易成本和交易时间。因为人工智能学习创作所需要的作品数据往往都是非常多,甚至达到巨量级别。但是,在互联网上,存在大量著作权人信息不明确的作品,这些作品中很大一部分是无法查清作者信息。而现实中作品和权利人的信息也并不是可以轻易获得。因此,在当下作品和权利人信息越发不明确和不对等的情况下,要求人工智能训练者逐一查清和联系所有作品数据的著作权人,在获得著作权人的授权后再使用,将耗费极大的精力和成本,而且真正能有效查清和获取著作权人同意的可能性还较低,这便相当于让研发人员在无法获得他人授权合法使用和直接侵权使用他人作品的行为中进行选择。为了技术研发,研发人员可能就会铤而走险,未经许可就使用他人作品,使得著作权制度失去应有的功能和作用。而且近年来,随着计算机数字技术的快速发展,作品著作权人越来越多地采用技术措施来控制和垄断作品的使用[27],导致训练者难以获得授权,或者授权成本过高而放弃对作品数据资料的使用。此外,由于技术措施保护程度较高,即使训练者想违法破解技术措施也变得较为困难使得训练者无法获取作品数据进行人工智能的训练,进而严重阻碍人工智能创作技术的发展。

所以,实行过于严厉的作品数据保护制度,人工智能将由于作品数据获取成本较高,或者无法获取作品,而导致人工智能技术发展陷于困境。因此,国家需要从立法层面,对人工智能以商业性为目的,而使用他人作品数据资料进行规定,既要保障作品权利人的合法利益,也要确保人工智能研发公司对于作品数据资料的使用权利,从而实现对作品著作权人的利益和公共利益的平衡[28]。

四、人工智能学习创作过程中侵权问题解决规范的完善

(一)法定许可制度的完善

通过上文对人工智能学习创作的利益冲突分析可知,若将人工智能学习创作而使用他人作品数据的行为,完全纳入到合理使用的法律范畴,则研发公司和训练者,无需获得任何许可以及支付任何费用,即可训练人工智能并进行创作,而获取巨大商业利益。但作品权利人却没有得到任何经济报酬,这必定极大挫伤人类创作积极性,不利于维护著作权的立法宗旨和目的。另一方面,如若要求研发公司和训练者,需要逐一获得作品权利人的授权许可,才可以使用作品。那么,作品权利人很可能会基于自身利益而不予授权,而且研发公司和训练者也无法确保能获得足够数量的授权作品,也就无法保证人工智能训练的效果,使得人工智能创作技术的发展变得举步维艰,不利于维护社会公共利益。

因此,为了更好地平衡双方利益,我国应在立法层面进行创新,将以商业性为目的,人工智能学习创作而使用他人作品数据的行为,纳入到绝对性的法定许可制度进行规制。也即是,训练者使用作品数据来训练人工智能学习创作,可以不经过著作权人的许可,同时著作权人也不可通过事先声明排除作品使用,但要支付作品使用报酬给著作权人。通过此制度设计,一方面可以避免著作权人不予授权作品数据使用权给训练者的情况发生,从而确保训练者可以使用足够的作品数据来训练人工智能。另一方面,该制度也可以有效地确保作品著作权人的权利得到尊重和保护,权利人可以通过报酬收入来获得经济补偿。

但是,单纯依靠法定许可制度,还是未能完全解决人工智能学习创作而使用作品数据所面临的困难和问题。首先,和以往传统作品的使用情况相比,人工智能学习创作而使用的作品数据往往是巨量级别,但现实中,这些作品数据往往都是出于分散的状态,使得训练者通常难以有效快速地获取这么多的数据。而且,相当一部分的作品数据不是以电子数字化的形式保存,这样也会使得每个训练者在筛选数据的时候,都需要逐一将作品进行数字化转换,而且数字化转换后的作品往往只是用于自身研发,其他训练者再使用作品时,还需要进行数字化转换,这无疑增加了人工智能研发的成本,要造成社会资源的浪费。其次,虽然训练者使用作品数据,不需要获得作品权利人的许可,但是仍然需要支付相应的报酬给权利人,否则便会构成侵权。然而现实中,权利人数量之多,分布之分散,使得完成支付的难度加大,导致权利人的经济报酬受到损失。此外,研发公司和训练者的数量也很多,作品权利人也无法及时掌握作品被使用的情况,也无法及时发现侵权行为,使得维权变得困难。最后,由于作品被电子化,使得其非常容易在网络上进行传播,因此,训练者获取作品数据之后,如何确保其只是仅用于训练人工智能,而没有在其他途径进行违法使用,从而确保作品数据的使用规范和使用安全,显得尤为重要。因此,鉴于人工智能学习创作而使用作品数据的情况具有较大的特殊性,除了完善法定许可制度外,还需要对著作权集体管理制度进行适度的完善,从而确保双方的权利得到充分保障。

(二)著作权集体管理制度的完善

鉴于人工智能学习创作而使用作品数据情况之特殊性,我国应由政府主导,成立作品数据的集体管理机构平台,负责用于人工智能学习创作的作品数据的管理,同时负责制定和调整用于人工智能学习创作的作品数据行业规范。为更有针对性地解决人工智能使用作品数据的困境,该集体管理组织还需要有以下几方面的创新。

1.建立全国统一的作品数据库。首先,所有市场上的作品权利人,都应依法将其作品及时地全部提供给该机构进行管理。如若作品不是以数字化的形式予以保存,那么可由该机构将作品进行数字化转换,使得作品数据便于保存管理,同时也方便人工智能后期进行训练学习。如若作品数据并未登记在该机构,而使用者需要使用该作品,则使用者在使用前,应将作品数据向该机构予以登记备案,然后才能合法使用。其次,著作权人应依法进行作品权利信息登记[29],从而构建全国统一的作品数据权利信息发布平台。这不仅有利于使用者对所需要的作品数据进行查询和申请利用,还有利于该机构收取作品使用费之后,及时地将作品使用信息和使用费转交到著作权人手中。另外,在网络环境下,存有大量著作权人身份信息未明的“孤儿作品”[30],因此该机构应主动收集“孤儿作品”数据,并将作品信息及时予以登记,并通过平台进行公开发布,寻找作品著作权人,亦或者相关人员在使用“孤儿作品”数据时,也应一并将作品信息向该机构予以登记备案。然后,该机构应对所有的作品数据建立统一的数字编码标准,将著作权权利管理信息编码记载于作品中,便于对作品数据库统一管理。最后,所有研发公司和训练者,如若需要使用作品数据,必须向该平台进行登记申请,说明使用作品数据的相关情况,然后通过该机构获取相对应的作品数据。如若研发公司和训练者,不是通过该机构获得作品数据,并无合法的抗辩理由,则应认定为侵权行为,予以严厉打击,从而保证作品数据使用的行业规范和准则得到严格遵守。

通过这一数据库,人工智能训练者可以方便快捷地检索和查询作品数据资源,然后申请获取所需要的作品数据,从而降低其获取作品数据的难度和成本,提高作品数据交易的效率。与此同时,作品权利人可以及时地掌握和追踪作品的使用情况,从而确保使用者及时地支付酬金,有效地保障了权利人的财产收益。此外,借助这一数据库,也有助于寻找“孤儿作品”的权利人,最大限度地保护著作权人的利益。所以,建立全国统一的作品数据库,可以有效管理和规范人工智能学习创作而使用作品数据的行为。

2.建立市场化的作品报酬收费机制。为促进人工智能技术的发展,在法定许可的制度下,作品数据著作权人的权利已经受到极大限缩,因此,充分保障权利人获取合理的作品使用报酬的权益,显得尤为重要。由于研发公司和训练者数量众多,而海量作品的作者数量更是数不胜数。因此,借助于人工智能作品数据使用的集体管理机构平台,可以减低双方沟通和交易的难度和成本,同时也可以提高作品权利人的议价能力[31]。根据我国《著作权集体管理条例》的规定⑯,我国并未将著作权集体组织与作品使用者的协商作为确定作品使用费收取标准的必要程序,也没有规定协商期限,更没有作品使用费的纠纷解决机制[32]。此外,我国法定许可机制下,付酬标准一般都是由国家有关部门直接确定[33]。例如,《教科书法定许可使用作品支付报酬办法》就是由国家版权局和国家发改委所颁布的。

因此,为实现作品数据的使用者和权利人双方之间的利益平衡,应当允许著作权集体管理机构和作品数据使用者进行平等协商,按照实际市场情况,确定作品数据使用费收取标准。同时,在双方对于收费标准无法达成一致时,政府相关部门可介入协调,从而避免由于收费标准难以确定,而影响人工智能研发的进度。此外,政府部门的介入,也可以确保该收费标准既不会过高,从而促进作品数据交易以及人工智能技术的研发,也不会过低,从而确保著作权人的合法财产收益。如若使用者使用“孤儿作品”,却无法支付酬金给权利人时,该机构应当代为收取和保管作品使用费一定期限。若查清作品权利人,应当转交酬金给权利人,否则将酬金用于文化事业的公益发展。此外,我国还应建立作品数据使用费纠纷解决机制,给当事人提供救济的渠道,公正及时地解决纠纷,保障双方的权益。所以,建立市场化的作品报酬收费机制,可以最大限度地保障作品权利人的利益。

3.实行更为严厉的作品数据技术保护措施。由于该机构拥有全国所有作品数据,而且这些作品均以数字电子化的形式保存,非常容易被复制和传播,造成著作权人的利益受损。因此,为了更好地保障作品权利人的利益,应进一步加强对作品数据的技术保护,防止作品数据被用于人工智能训练以外的目的。目前,数字化作品数据的技术保护措施主要有以下两类:第一类是接触控制措施,主要是用于防止未经许可接触作品;第二类是版权保护措施,主要是阻止侵权行为[34]。对于人工智能训练所使用的作品数据而言,一方面,可以通过接触控制的措施,确保只有申请使用者可以使用该数据,而其他无关人员无法使用。另一方面,可以通过版权保护措施,使得使用者只可以将该数据进行人工智能的训练,而无法实施复制、传播等其他侵权行为。

诚然,在现有的技术条件下,这些技术措施无法自主识别使用人未经他人许可的行为属于侵权还是属于合理使用[35]。因此,对技术措施的法律保护,可能会损害使用者的合理使用作品的权利[36]。然而,过于严苛的技术措施虽然使得作品数据的使用方式和使用价值被极大限制,但是对于作品数据库而言,其设立目的是非常明确而且唯一,也即是只用于人工智能训练。因此,若一般受众使用人,需要合理使用作品数据用于其他目的,例如浏览欣赏等,应通过其他方式来获取,而非以法定许可的方式通过该机构获取。另外,如若以非商业为目的而使用作品数据进行人工智能研究,使用者也可以直接向该数据库申请相关数据,从而确保其合理使用作品的权利得到保障。因此,实行更为严厉的作品数据技术保护措施,不仅不会导致使用者的合理使用作品权利受到损害,反而可以加强对作品著作权人的权益保障,同时规范人工智能训练作品数据获取的秩序。

结 语

近年来,随着人工智能创作技术的发展不断加快,人工智能学习创作过程中,擅自使用他人作品数据的情况也越来越突出。因此,我国需要尽快在立法和司法层面,对人工智能学习创作而使用他人作品的数据情况是否属于合理使用和法定许可情形予以清晰判定,从而使人工智能学习创作的法律风险得以提前防范,保障相关权利人的利益。而更为重要的是,当前人工智能训练者以商业性使用目的,利用作品数据来训练人工智能学习创作的行为,难以通过当前的法律制度予以有效的规制,使得著作权人的权益和研发人员的权益无法有效协调和保障。因此,我国应尽早完善著作权法定许可制度和集体管理制度,对以上行为予以规制。这不仅可以切实保护作品著作权人的利益,使著作权人的经济收益得到充分保障,同时也能规范人工智能技术发展秩序,使研发人员可以获得充分足够的作品数据来训练人工智能,然后进行作品的创作,从而实现著作人利益和公共利益的平衡,进而促进人工智能技术和文化产业的和谐发展及繁荣,为科技强国的战略实施提供强有力的法律支撑。

注 释:

①本文所称的人工智能创作物,是一种拟人化的表达,具体是指计算机程序,通过自主学习而掌握类似人类创作作品的能力,而后自主生成的内容。其和人类创作的作品相比,在最终作品的形式和内容上并无明显差异,都具有艺术欣赏价值。但是在作品创作过程中,人工智能由于具有自主性,可以自主确定作品的内容和形式,并直接导致最终作品的生成,较高程度地替代了人类创作过程中的部分工作,因而将其认定为人工智能创作物。

②本文所称的人工智能训练者,具体是指用于创作的人工智能的数据训练者,其主要负责对人工智能所需学习的数据进行筛选,并将数据资料导入到人工智能程序中,由其自主学习,最终使得人工智能具备创作能力。

③参见《著作权法》第48条规定:有下列侵权行为的,应当根据情况,承担停止侵害、消除影响、赔礼道歉、赔偿损失等民事责任;同时损害公共利益的,可以由著作权行政管理部门责令停止侵权行为,没收违法所得,没收、销毁侵权复制品,并可处以罚款;情节严重的,著作权行政管理部门还可以没收主要用于制作侵权复制品的材料、工具、设备等;构成犯罪的,依法追究刑事责任:(一)未经著作权人许可,复制、发行、表演、放映、广播、汇编、通过信息网络向公众传播其作品的,本法另有规定的除外;(二)出版他人享有专有出版权的图书的;(三)未经表演者许可,复制、发行录有其表演的录音录像制品,或者通过信息网络向公众传播其表演的,本法另有规定的除外;(四)未经录音录像制作者许可,复制、发行、通过信息网络向公众传播其制作的录音录像制品的,本法另有规定的除外;(五)未经许可,播放或者复制广播、电视的,本法另有规定的除外;(六)未经著作权人或者与著作权有关的权利人许可,故意避开或者破坏权利人为其作品、录音录像制品等采取的保护著作权或者与著作权有关的权利的技术措施的,法律、行政法规另有规定的除外;(七)未经著作权人或者与著作权有关的权利人许可,故意删除或者改变作品、录音录像制品等的权利管理电子信息的,法律、行政法规另有规定的除外;(八)制作、出售假冒他人署名的作品的。

④参见《著作权法》第10条第1款第5项规定:(五)复制权,即以印刷、复印、拓印、录音、录像、翻录、翻拍等方式将作品制作一份或者多份的权利。

⑤参见《著作权法》第10条第1款第13项、第14项和第15项规定:(十三)摄制权,即以摄制电影或者以类似摄制电影的方法将作品固定在载体上的权利;(十四)改编权,即改变作品,创作出具有独创性的新作品的权利;(十五)翻译权,即将作品从一种语言文字转换成另一种语言文字的权利。

⑥参见《著作权法》第10条第1款第16项规定:汇编权,即将作品或者作品的片段通过选择或者编排,汇集成新作品的权利。

⑦参见《著作权法》第22条规定:在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名、作品名称,并且不得侵犯著作权人依照本法享有的其他权利:(一)为个人学习、研究或者欣赏,使用他人已经发表的作品;(二)为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已经发表的作品;(三)为报道时事新闻,在报纸、期刊、广播电台、电视台等媒体中不可避免地再现或者引用已经发表的作品;(四)报纸、期刊、广播电台、电视台等媒体刊登或者播放其他报纸、期刊、广播电台、电视台等媒体已经发表的关于政治、经济、宗教问题的时事性文章,但作者声明不许刊登、播放的除外;(五)报纸、期刊、广播电台、电视台等媒体刊登或者播放在公众集会上发表的讲话,但作者声明不许刊登、播放的除外;(六)为学校课堂教学或者科学研究,翻译或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行;(七)国家机关为执行公务在合理范围内使用已经发表的作品;(八)图书馆、档案馆、纪念馆、博物馆、美术馆等为陈列或者保存版本的需要,复制本馆收藏的作品;(九)免费表演已经发表的作品,该表演未向公众收取费用,也未向表演者支付报酬;(十)对设置或者陈列在室外公共场所的艺术作品进行临摹、绘画、摄影、录像;(十一)将中国公民、法人或者其他组织已经发表的以汉语言文字创作的作品翻译成少数民族语言文字作品在国内出版发行;(十二)将已经发表的作品改成盲文出版。前款规定适用于对出版者、表演者、录音录像制作者、广播电台、电视台的权利的限制。

⑧See Campbell v.Acuff-Rose Music Inc.510 U.S.569(1994).

⑨See Authors Guild,Inc.v.Google,Inc.804 F.3d202(2nd Cir.2015).

⑩参见《著作权法》第23条规定:为实施九年制义务教育和国家教育规划而编写出版教科书,除作者事先声明不许使用的外,可以不经著作权人许可,在教科书中汇编已经发表的作品片段或者短小的文字作品、音乐作品或者单幅的美术作品、摄影作品,但应当按照规定支付报酬,指明作者姓名、作品名称,并且不得侵犯著作权人依照本法享有的其他权利。前款规定适用于对出版者、表演者、录音录像制作者、广播电台、电视台的权利的限制。

⑪参见《著作权法》第33条第2款规定:作品刊登后,除著作权人声明不得转载、摘编的外,其他报刊可以转载或者作为文摘、资料刊登,但应当按照规定向著作权人支付报酬。

⑫参见《著作权法》第40条第3款规定:录音制作者使用他人已经合法录制为录音制品的音乐作品制作录音制品,可以不经著作权人许可,但应当按照规定支付报酬;著作权人声明不许使用的不得使用。

⑬参见《著作权法》第43条第2款规定:广播电台、电视台播放他人已发表的作品,可以不经著作权人许可,但应当支付报酬。参见《著作权法》第44条规定:广播电台、电视台播放已经出版的录音制品,可以不经著作权人许可,但应当支付报酬。当事人另有约定的除外。具体办法由国务院规定。

⑭参见《信息网络传播》第8条规定:为通过信息网络实施九年制义务教育或者国家教育规划,可以不经著作权人许可,使用其已经发表作品的片断或者短小的文字作品、音乐作品或者单幅的美术作品、摄影作品制作课件,由制作课件或者依法取得课件的远程教育机构通过信息网络向注册学生提供,但应当向著作权人支付报酬。

⑮参见《信息网络传播》第9条规定:为扶助贫困,通过信息网络向农村地区的公众免费提供中国公民、法人或者其他组织已经发表的种植养殖、防病治病、防灾减灾等与扶助贫困有关的作品和适应基本文化需求的作品,网络服务提供者应当在提供前公告拟提供的作品及其作者、拟支付报酬的标准。自公告之日起30日内,著作权人不同意提供的,网络服务提供者不得提供其作品;自公告之日起满30日,著作权人没有异议的,网络服务提供者可以提供其作品,并按照公告的标准向著作权人支付报酬。网络服务提供者提供著作权人的作品后,著作权人不同意提供的,网络服务提供者应当立即删除著作权人的作品,并按照公告的标准向著作权人支付提供作品期间的报酬。依照前款规定提供作品的,不得直接或者间接获得经济利益。

⑯参见《著作权集体管理条例》第25规定:除著作权法第二十三条、第三十三条第二款、第四十条第三款、第四十三条第二款和第四十四条规定应当支付的使用费外,著作权集体管理组织应当根据国务院著作权管理部门公告的使用费收取标准,与使用者约定收取使用费的具体数额。

猜你喜欢
著作权人权利人工智能
著作权转让声明
著作权转让声明
著作权转让声明
著作权转让声明
我们的权利
股东权利知多少(一)
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!