□ 文 孟 琦
随着大数据时代的到来,人工智能技术也进入到了新的发展阶段,其应用已不再局限于传统的工业技术领域,在艺术领域,人工智能也创作出了众多令人惊叹的艺术作品。在美术领域,“下一个伦勃朗”人工智能可以生成类似伦勃朗风格的画作,微软“小冰”更是举办过个人画展,人工智能的艺术创作能力逐渐得到公众的认可。而随着技术的普及以及算法的开源,普通人也可以利用开放性的人工智能平台进行创作,如Stable Diffusion、mimic、Novel AI等。但是,和人类的创作历程一样,人工智能在进行创作前也需要学习并积累足够的素材,而根据我国著作权法的规定,未经许可擅自使用他人享有著作权的作品属于侵权行为,而人工智能在创作中将不可避免地大量使用他人作品作为素材,倘若无法平衡著作权人与人工智能发展之间的利益,最终将会阻碍文化艺术的发展与科技的进步。目前,学术界关于人工智能创作的研究多集中在人工智能生成物的定性以及著作权归属方面,对人工智能所使用的创作素材是否合法关注度不足。对此,本文将在合理使用制度的框架下,分析人工智能绘画中的著作权侵权困境,以期提出可行的解决方案。
人工智能创作能力的根源在于计算机神经网络技术,这是一种模仿人类神经元的技术,能够让人工智能像人类一样“学习”与“思考”,因此,与人类的创作过程相同,人工智能创作也经历了“输入、学习、输出”三个阶段。
首先是作品的输入阶段。与人类相同,为了能够正确地总结出不同类型画作的特征,人工智能也需要以大量的作品作为创作素材,但人工智能并不能直观地理解作品中的元素、结构与风格,其只能识别图片中的红、绿、蓝三种颜色的像素,因此,人工智能绘图在输入阶段需要将大量的数字化作品上传到数据库中以供后续的学习之用。
其次是人工智能的学习阶段。当大量的素材上传至人工智能的数据库后,人工智能将对这些素材进行初步分类与整理,当接收到使用者的创作指令时,人工智能将根据指令中的关键词匹配数据库中的素材,通过对同题材的作品进行分析,从中提取出这些作品的元素、结构、风格等,神经网络算法在反复地进行创作与优化过程中,最终总结出正确的创作规律。
最后是人工智能的输出阶段。经过反复地学习与训练,人工智能已经自主生成了相关的算法模型,使用者只需要输入相应的关键词,人工智能就可以输出大量同类型的作品,在经过后续的反馈与优化后,人工智能甚至能够生成有足够艺术价值的绘画作品。
人工智能对作品的使用分为“表达性使用”与“非表达性使用”。“非表达性使用”仅将他人作品当作事实性信息进行处理,而不涉及他人作品中的一些独创性表达。例如,为了训练人工智能的人脸识别能力而大量使用他人的作品就属于“非表达性使用”,因为这种使用方式仅使用了人脸中的生理特征等事实性元素,不会影响作品在原使用范围内的价值,此种使用并不属于著作权法意义上的使用,因此本文不再过多讨论。人工智能绘图主要涉及到作品的表达性使用,“表达性使用”指利用了他人作品中的独创性表达,最终在使用结果方面体现了原作者在创作中的一些特征。在此种情形下,人工智能会输出与原作品相似的新作品,对原作品的价值及潜在市场利益产生不利影响,不符合合理使用制度的规范条件,面临着著作权侵权风险。
绘图型人工智能数据库中的素材通常有三种来源:一是使用者将原本非数字格式的作品进行数字化后上传至数据库;二是使用者通过授权或非授权的方式将他人已经数字化的作品搬运至数据库中;三是人工智能利用脚本对选定图片网站中的作品进行自动抓取。根据我国《著作权法》的规定,以数字化的方式将作品制作一份或多份属于复制权的规制范畴,而上述三种行为都是在不改变原作品内容的情形下进行的全图复制,存在侵权的风险。而且与前两种情形不同,第三种情形对他人著作权的侵犯更为恶劣,这是因为同人类在计算机中保存作品不同,人工智能可以利用脚本轻而易举地绕过相关保护措施,直接获取到作品的原图。“500px”是一个版权保护措施较为完善的网站,普通用户若想将网站中的照片保存时,网站会弹出提醒并拒绝该请求。而人工智能则会利用脚本直接通过网页的开发者模式获取作品的原始文件,哪怕网站通过各种保护措施使人工智能无法用脚本获取原图,人工智能也可以通过截图的方式获取到作品。更有一些人工智能直接以盗版网站作为数据库,以他人上传的无版权作品作为素材,例如,“Novel AI”平台使用了争议极大的“Danbooru”网站作为数据源,该网站中存有大量没有授权的图片,因而在使用过程中很容易产生侵犯他人复制权的问题。
除复制权侵权风险之外,人工智能绘图也可能涉及对他人作品改编权的侵犯。人工智能进行创作时有三种可能的输出结果:一是输出具有独特风格的全新作品;二是输出与原作品构成实质性相似的作品;三是输出带有原作品创作元素等基本表达的新作品。第一种结果是人工智能创作所不懈追求的情形,没有侵权风险。而在第二种情形下,受限于“思想与表达二分法”原则,如果在作品的画面上构成实质性相似,则侵犯了他人的复制权;如果在作品的风格上构成了实质性相似,由于思想不受著作权法的保护,因此不构成侵权。但是在人工智能绘图的过程中,一些低等级的人工智能受限于算力和数据集的规模,很容易出现“过拟合”现象,从而在画面表达上构成了实质性相似,产生了侵权后果。第三种情形下,人工智能生成的作品虽然有一定的独创性,但是仍能从画面中看出其他作品中的一些元素,此种属于对原作品的改编行为,涉嫌侵犯其他作者的改编权。人工智能“下一个伦勃朗”利用伦勃朗画作中的创作元素,生成了与原画作相似又有别于原画作的演绎物。伦勃朗的作品已经进入公有领域,对其作品的改编行为不构成侵权,但在目前的人工智能绘图过程中,大量仍在版权保护期的作品被使用,这种情况下将对被学习的作品构成改编权侵权。
合理使用是指他人可以在法律规定的情况下,不经权利人的许可而自由合法地使用享有著作权保护的作品。根据前文所述,人工智能在作图过程中很可能侵犯他人作品的复制权、改编权等权利,而在我国现行《著作权法》所规定的合理使用框架下,人工智能很难以合理使用作为侵权抗辩的依据。
根据《著作权法》的规定,“为个人学习、欣赏或使用”他人享有著作权的作品构成合理使用。在个人使用人工智能平台进行创作过程中,如果由使用者个人将他人作品上传至数据库中,由于此种情形下的版权作品仅为使用者个人使用,输出的新作品也没有产生传播,因此可以根据“合理使用”规则进行抗辩;但如果使用者将输出的作品进行传播或商业化使用,则会侵犯他人的著作权。但是人工智能获取创作素材还有另外一种方式,既用脚本对网络中的作品进行大量且无差别的抓取,并形成一个开放性的数据库,在此种情况下,人工智能创作难以进行合理使用抗辩。这是因为在此种情况下,人工智能所抓取的他人作品并不是针对单个用户使用,而是开放给了社会公众,不符合规定中的主体要件。对于微软“小冰”“下一个伦勃朗”等人工智能来说,其控制者为具有一定技术实力的公司,因此也不符合个人使用的主体要求。而且从目的上来说,“为个人研究、学习、欣赏”要求不具有商业目的,而这些人工智能的创作由于被大型互联网公司所控制,很难说其没有商业目的。
根据《著作权法》的规定,在不出版发行的情形下,为科学研究而改编或少量复制他人作品构成合理使用,但是在人工智能的创作过程中很难以此作为抗辩的理由。首先,著作权法是出于公共利益的目的而设立了此种合理使用情形,因而该种情形是专门为科研机构设立的,应当仅限于科研人员使用,但是在目前的绘图型人工智能创作过程中,使用主体多为普通个人或大型商业互联网公司,不符合此条规定的主体要求;其次,规定中明确了使用的限度仅为“少量复制”,但是在实践过程中,为了避免人工智能产出的作品出现“过拟合”,尽可能输出完善且具有独特性的作品,人工智能必须大量且无差别地复制他人作品,不符合“少量复制”的要求,因此无法使用此种合理使用类型进行抗辩。
我国法院在司法实践中常混合使用四要素标准与三步检测法作为认定合理使用的辅助性方法。合理使用的四要素标准与三步检测法都要求在一定限度内使用他人的作品,并且不能对他人作品的正常使用产生影响,要考虑到作品的市场价值,不得不合理地损害他人的著作权利益。但是,目前主流的开放性人工智能绘图平台对他人作品的使用基本很难满足上述判断标准,即便在个案中认定了人工智能对他人作品的使用构成合理使用,但是由于缺少明确的法律规定,对于类似行为是否合法仍然难以产生合理的预测,反而容易因创设新的合理使用而被诟病为法官造法。
由于合理使用制度在绘图型人工智能的创作过程中存在失灵的现象,无法有效平衡人工智能发展与著作权人之间的利益,因而需要考虑采用其他更为合适的制度来解决问题。在我国著作权法的规定中,法定许可制度是与合理使用相类似的制度,但是与合理使用制度不同,法定许可规定使用作品需要向著作权人付费。但适用法定许可会产生三个问题:一是人工智能创作的侵权行为较为分散,单个作者的维权成本高;二是人工智能的创作过程中会在数据库中收集大量的作品,但每一件作品对最终输出结果的贡献度不同,由此产生了收费标准的问题;三是人工智能的学习过程具有较强的隐蔽性,加之绘图型人工智能多为开放性的平台,使用人数众多,著作权人难以发现自己的作品被侵权。对此可以通过引入著作权集体管理制度,辅以区块链及人工智能反向识别技术来解决。
著作权集体管理组织可以针对人工智能使用作品制定统一的付费标准,将众多被侵权的作品“化零为整”进行集中维权,有效降低著作权人的维权成本,弥补著作权人维权能力不足的问题。另外,考虑到人工智能所侵犯的主体众多且分散,对于没有参加集体管理组织的作者,可以通过引入“延伸性著作权集体管理机制”加以解决,在此机制下,无论著作权人是否属于集体管理组织的成员,该组织都可以代著作权人向人工智能平台发放使用许可,并向著作权人转付版权费。
对于作品的付费标准,需要根据被使用作品的市场价值、对生成内容的贡献等因素,建立市场化的收费机制。具体来说,在人工智能生成图片的过程中,使用者需要输入一些提示词来指定人工智能学习某一类作品并输出与之风格相似的作品,这些提示词不仅包括图片元素也包括画家的姓名。人工智能平台可以在每张生成图中量化各个关键词的贡献并将其视为画家本人的贡献,据此对画家进行收益分成。画家甚至可以进驻人工智能平台,将自己的高清作品标上关键词后上传至数据库中,号召用户使用其关键词进行创作,只要画家的关键词出图效果好,就可以被足够多的用户反复使用从而获取不菲的收益。在这一过程中,著作权集体管理组织需要定期对人工智能平台进行审核,考察人工智能对版权作品的使用及付费情况。
针对人工智能使用作品隐蔽性强,著作权人难以发现自己作品被侵权的问题,可以引入区块链与AI识别技术加以解决。区块链技术将会以区块的方式将作品的数据进行固定,并以密码的方式进行加密,确保作品信息不可随意篡改与伪造。创作者可以将自己的作品在区块链平台上发表,作品上链后的使用情况都会被完整、详细地记载在分布式账本中,以便追踪作品使用情况及确定许可费用。人工智能平台同样需要将输出的作品上传至区块链平台,以便于其他人查询该作品是否为人工智能创作,创作过程中参考了哪些作品,以及作品的使用情况。而对于没有使用区块链技术的作品,可以参考目前的论文检测技术,通过人工智能反向识别技术进行标注,当一件作品被展示性平台收录或进行商业化使用之前,可以通过人工智能进行识别,判断其是否为人工智能创作并标注出主要使用了哪些作品作为参考。
一直以来,艺术创作都是少数人的工作,但人工智能的发展极大地降低了艺术创作的门槛,普通人也可以利用人工智能创作出自己心中的画作。不可忽视的是,目前的绘图型人工智能平台在创作过程中对他人著作权的侵害现象十分严重,面对人工智能创作引发的困境,可以通过完善著作权集体管理制度,完善作品收费机制,引入区块链及人工智能识别技术进行规制,以确保在保护著作权人利益的同时,兼顾科技的发展与创新,实现整个社会的进步。