□ 文 宋先发 龚模干
2022年11月30日ChatGPT一经发布,便在科技界引起轩然大波,并且在不久的4个月后,超越GPT-3.5的模型GPT-4接踵而至。相较于GPT-3.5是在拥有3000 亿个单词的语料基础上预训练拥有1750亿参数的模型,而GPT-4的参数规模则是GPT-3.5的1-2倍。依据相关研究,深度神经网络的学习能力和模型的参数规模呈现正相关系。人类大脑皮层所拥有的突触总数超100万亿个,而当人工智能所拥有的参数规模达到100万亿时,意味着其将达到与人类大脑的同等水平。亦有人预测这或许意味着这一系统开始具备人类的自主思维,拥有与人类相似的创作能力。目前亟待解决的问题在于,这些由ChatGPT所“创作”的,外观上几乎与人类作品别无二致的“作品”,在《著作权法》上该如何定性?学术界对人工智能生成物的《著作权法》上的作品定性多采用肯定观点。然而,将该生成物认定为“作品”,不仅与大多数人的直觉相违背,并且在算法、算力等相关技术不断精进的今天,亦潜藏着巨大的危机。故而有必要从ChatGPT等人工智能的“创作”机理出发,综合考量相关的形式因素与实质因素,重新思考ChatGPT等人工智能生成物的著作权法定性问题。
ChatGPT是人工智能技术驱动的自然语言处理工具,通过理解和学习人类的语言来进行对话,实质并非一个强大的“搜索引擎”,其原理并非通过在庞大的数据库中以超高的运算速度快速比对文本找到相类似的内容,进而进行比对、拼接,得出结果。其机器学习所用到的大量学习材料并不会保存在模型之中。学习材料的作用是使得GPT模型能够进行“利用人类反馈强化学习(RLHF)”的训练。通过训练不断调整语言模型以得到通用模型,以使得ChatGPT能够回答未接触过的问题。因此ChatGPT也被称为生成模型。而就其语言生成功能而言,其可以概括为“自回归生成”模式,也可以形象地称为“单字接龙”,即给他任意的长文,它会依据自己模型去“生成下一个字”,再将此生成的“下一个字”与之前的上文组合,形成新的长文。而在“上文”模型相同的情况下,ChatGPT则是依据概率抽样来生成下一个字。由于抽样结果存在随机性,所以即使面临相同的问题,ChatGPT的回答亦各不相同。
关于ChatGPT等人工智能生成物该如何定性,是否属于《著作权法》上的作品这一问题,在《著作权法》上的分歧主要体现于“人工智能是否能成为作者”、“生成物是否具有独创性”以及“生成物是否属于智力成果”三个方面。
争议之一在于作者的范围是否包括人工智能。一般情况下,作者是指进行创作活动的自然人,而在某些特殊情况下,法人也被视为作者,而法人被视为作者的原因在于作品中体现了法人的意志。故而依据此原理,有主张在人工智能“创作”中,所有者为向人工智能注入意志的主体,人工智能可视为代表所有人创作,故而认可类推适用法人作者的规则,将人工智能所有者视为作者。实质上,无论是哪种形式的法人组织,法人的意志根源于自然人,法人作品根源于存在具备人类思想意志的自然人“创作者”。并且法人具有独立的民事权利能力,具备将其拟制为作者的条件。然而,在人工智能创作物的情形中,由于人工智能自身不具备独立民事权利能力,自不必说,其本身不得成为作者。再者,其作为实际“创作者”也无法体现出人类思想意志。可以说由于与“法人作者”的情形不具备类似性,因而无法类推适用“法人视为作者”规则的相关条件。
独创性是指由作者独立完成,源于本人,并且具有一定程度的智力创造性。在人工智能生成物是否具备独创性的问题上,主张不具备独创性者认为“人工智能生成的内容只是应用某种算法、规则和模板的结果,与为形成作品所需的智力创作相去甚远”,即使是不同的人,只要输入相同的内容,输出结果具有唯一性,故认为此过程实际上排除了个性化特征,从而不符合独创性的要求。此见解实际上描述的是“机械创作”的过程。
然而,就目前ChatGPT的技术原理而言,其实际上是属于“算法创作”而非“机械创作”,其是采用“自回归生成”的方式生成一篇长文,长文反映了概率抽样的结果。故而实际上即使输入相同的指示,也可能依据随机抽样输出不同结果。而算法创作中,人工智能可以通过深度学习自主地构建函数模型,而非依赖于设计者事先定义特征量和目标效果的函数关系。
主张具备独创性者则认为,基于上述“算法创作”人工智能的出现,由于结果具有随机性,故而可以认定其该不同次数的运算具备个性。并且,从现实中人工智能生成物与人类作品难以区分的现象上也可以看出,人工智能生成物可能具备“独创性”要件。因此就此客观意义上的“独创性”而言,人工智能生成物亦可能满足,即使受限于当前技术水平人工智能的“独创性”可能达不到某些国家法律规定或者专业人士内心的标准,但随着人工智能学习能力的提升,在不远的将来在客观上达到“独创性”的标准也只是时间问题。
依据《著作权法》第3条规定,作品是指“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。由此可知,独创性并非是作品唯一构成要件。除此要件之外,多数观点认为作品还需满足:属于人类的智力成果、是能够为他人感知的客观表达、是属于文学、艺术和科学领域的智力成果。在人工智能生成物作品定性中成为问题的除“是否具备独创性”问题外,还在于“其是否属于人类的智力成果”。也有将此要件的内容作为“独创性”中所需要具备的人格要素考虑者。但殊途同归,无论哪种对独创性要件的理解,都强调作品需要为“人的智力活动所产生的成果”。
对此要件,有观点通过《著作权法》中存在的法人作者的特殊规定,认为“智力成果”的主体并不限于自然人,同时认为将其解释为自然人主体限制有悖于《著作权法》第1条鼓励创作传播宗旨,同时会使内容生成式人工智能陷于滥用和版权混乱困境,故而认为应当将其解释为“与自然人脑力创作相当的新颖性、创造性的新内容”。此观点无疑混淆了法人作者制度的定位,法人作者规范是在生成物被认定为作品前提之下,调整作品著作权归属的规范,而非是解决是否成立作品的规范。法人作品中,依然存在自然人的智力创作活动,并未打破作品需要为“人的智力活动所产生的成果”这一规则。
更多的支持人工智能生成物作品论者则是企图从设计者对人工智能算法系统的搭建、训练者对人工智能学习数据的挑选标注、适用者对人工智能生成物原始数据的提供等方面,来论证的人工智能生成物中所蕴含的人类的智力创造因素。
然而《著作权法》所保护的并非是思想、思路、观念、理论、构思等本身,其保护的只是以文字、音乐、美术等各种有形的方式对思想的具体表达。据此,所谓作品中体现的人的智力活动亦应当具体到对作品具体表达形成的参与上,而不能仅仅停留于抽象的思想参与层面。原因在于,关于同一种思想可能存在无数种具体表达,能将同一主旨的作品区别于其他作品的关键点在于作者所选用的不同具体表达,此才能体现出作者的智力创作活动。如果以此标准来衡量人工智能生成物中人的智力参与的话,在ChatGPT的算法创作型人工智能中,设计者及训练者都不可能预知ChatGPT将来会输出怎样内容的生成物,自然难以称得上对最终ChatGPT生成物存在智力参与。而使用者所谓的原始素材提供也只是为人工智能创作提供一个方向,充其量仅是停留在生成物的“思想”层面,难对该生成物的具体表达有所预见,因此更别说使用者对生成物的具体表达存在《著作权法》意义上的参与了。
如果使用者并非是给Chat GPT,而是其他自然人提供素材、下达指令,由其他人完成的作品,是否能够视为使用者对该他人作品存在智力参与呢?其能够成为合作作品著作权人吗?答案是否定的。依据通说,只有实际参与了创作活动,对最终作品作出了独创性贡献的人才能成为合作作者,仅仅为创作提供咨询意见、物质条件、素材或其他辅助劳动的人并非合作作者。由此可知,《著作权法》意义上的创作的参与需要具体到表达,而不能仅停留在思想、素材层面。在人工智能生成物的情形下亦是如此,使用者的素材提供、指令下达行为无法成为人工智能生成物上的人的智力参与因素,人工智能生成物并非是“人的智力活动的成果”。可知,将人工智能生成物视为人工智能与人类的“合作作品”论者的观点亦难以成立。
如果上述理由仅涉法教义上的理由,那么,实质上将人工智能生成物排除出“作品”范围的更加实质的理由则在于以下几个方面。这也是对人工智能著作权问题的思考出发点,上述法教义上的理由仅是在于强化从此出发点形成的确信。
在2023年1月美国进行的一项千人调查中,有8 9%的学生表示曾在家庭作业中使用过ChatGPT,并且还有学生通过用ChatGPT完成作业取得了最高分。这使得美国一些高校纷纷宣布禁止学生使用ChatGPT完成作业。
各高校视ChatGPT为大敌的原因在何?从巴黎政治大学所发布一份禁止使用ChatGPT的声明中不难找到答案——“为防止学术欺诈与剽窃”。无疑,从高校的反应而言,在对于学生使用ChatGPT完成的生成物的态度上,几乎没有高校会认为其属于学生个人的“智力创作”。这是因为,人们普遍认为在使用ChatGPT进行“创作”的过程中,使用人仅通过下达指令参与“创作”,是无法体现出使用者对最终生成物存在智力贡献。毋宁说,频繁使用ChatGPT完成作业会助长学生的思维惰性,使得教育的目的发生改变。
《Science》亦明确发出声明,禁止在投稿中使用由ChatGPT生成的文本,如违法则构成学术不端行为。《Nature》则表示不能将ChatGPT列为论文作者,同时如果论文创作过程中使用过相关工具,则必须予以注明。
以上各学校、期刊的反应无不表明:ChatGP T的使用者将ChatGPT生成物作为自己的“创作”是不被容许的。使用者给ChatGPT下达指令的行为并不能归结于对生成物的“智力参与”,仅此无法达到能使该生成物能够视为使用者的“智力成果”的程度。就此而言可知,将人工智能生成物视为“作品”保护明显有违社会大众的观念,同时也将对教育、学术伦理带来巨大的冲击。
不论何种人持何种看法,在认定版权制度的本质是鼓励用头脑从事创作人这一点上,意见是一致的。文艺作品等由信息构成的成果之所以成为法律上的财产,是出于公共政策的需要。即《著作权法》第1条所规定的:“鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进社会主义文化和科学事业的发展与繁荣”。无论是动物还是机器,都不可能因《著作权法》保护作品而受到鼓励,从而产生创作的动力,只有人的行为才能为《著作权法》所鼓励。因而即使对人工智能生成物施加以著作权的保护,亦无法达到鼓励创作的效果,只因人工智能生成物的生成过程并不依赖于使用人的脑力创作活动。
或许有质疑观点认为,如果不对人工智能生成物施以著作权保护,将影响研发者们对人工智能研发的积极性。实际上,研发者们的算法研发所投入的智力可以通过计算机软件著作权得到一次保护,故而其创作热情并不会受到抑制。其次,ChatGPT等算法型人工智能的作用远不止“创作”,其亦具有“提供论文思路、框架”、“修改表达”、“翻译”、“问题解答”等辅助创作的功能。并且如上述所言,其生成物无法获得著作权保护本就是人们的普遍认知,故而其不会仅因生成物无法获得著作权保护而影响使用者的热情,投资者利益亦不会受到影响,因为投资者的利益完全可以通过收取使用费等商业手段得到弥补。
文字的排列组合在有限的空间内存在限度。恰如在18世纪生物学家赫胥黎所提出的“无限猴子理论”,即只要有无限多的猴子和无限多的打字机,即便是猴子,也可以打出《莎士比亚全集》这样极具艺术价值的作品。此理论无疑反映出文字作品的本质在于单个字母或字的排列组合。因一定长度的文字集合存在穷尽的可能性,并且借助于人工智能强大的算力,使该种穷尽更具可能。尽管有人从实现的角度提出此构想存在技术瑕疵,如存在算力或是存储空间不足等技术难题。但不难想象的是,随着技术的迭代,算力及存储空间的问题都将会被逐步解决,即便无法完全实现“穷尽”,也可以向“穷尽”不断靠近。
在此背景下,如果对ChatGPT等人工智能的生成物予以著作权的保护,则凭借人工智能强大的算力,即使无法提出“穷尽”的文字排列组合,其也能够计算出庞大的文字排列组合,在有限的排列组合背景下,人工智能生成物能够在短时间内迅速占领相关内容领域,造成自然人创作侵权风险大幅度提高,这无疑会挤占传统人类创作的空间。即使有观点提出在现行著作权制度中,即使后作与前作存在实质性相似,如果不存在“接触”亦不构成侵权,故认为无需担心人工智能创作会过度挤占人类创作的空间。在互联网几乎完全覆盖的今天,只要将人工智能生成物的存储空间在网上对公众公开,则在后作出相同创作者便将难以证明不存在“接触”,而人工智能挤占人类创作空间的事实也将现实地发生。
使人工智能生成物进入公共领域会带来何种弊端呢?支持将人工智能生成物纳入作品范围保护者的理由往往在于,使其直接进入公共领域容易出现大量将人工智能生成成果冒充个人作品的情形,最终将阻碍人类作品的创作积极性。此批评可以说并未切中要点,反而为反对论者提供了论据。相较于在否定人工智能生成物“作品”性质的立场下“偶发性”的冒充个人作品而言,无疑是在肯定人工智能生成物“作品”性质的立场之下,“常态化”的用人工智能创作对传统人类作品创作程度的阻碍程度更高。并且,以人工智能作品冒充个人作品的行为无异于抄袭,即使是在不存在人工智能的时代,抄袭现象也依然存在,依然会阻碍人类创作的积极性。故而此问题并非人工智能时代所特有,更非通过将人工智能生成物纳入“作品”范围所能够解决的。毋宁说重要的是在否定人工智能生成物“作品”定性的基础之上,健全相关的人工智能生成物区分识别机制,才能保全人类创作的“净土”。
自OpenAI发布ChatGPT以来,谷歌、百度等公司也争相研发竞品。GPT-4功能之强大让无数人感到“失业”的危机临近。人工智能的时代已经开启,人类不应回避,而应直面这项将给我们生活带来巨大变革的技术。对于需要明晰的人工智能生成物著作权问题而言,算法创作由于其无法体现为人类的智力创造活动,故不属于《著作权法》上的作品。并且对人工智能生成物施以著作权保护不仅有违《著作权法》立法宗旨,而且可能蕴含巨大的危机,亦明显违背民众的社会情感观念,故不宜对人工智能生成物施以著作权保护。