AIGC创作适用著作权合理使用的困境与出路

2024-10-27 00:00:00杨曦 邓臻宇
出版广角 2024年17期

【摘 要】根据现行著作权法的规定,AIGC创作存在侵犯复制权、改编权和传播权等多项著作权风险,现行合理使用制度难以有效适用于AIGC创作,扩大解释合理使用一般条款是AIGC适用合理使用制度的可行性路径。应建立“一般条款为主+法定列举情形为辅”的合理使用制度框架;从主体范围、商业性的使用、作品的正常使用、作者的合法权益等方面细化合理使用考量因素的判断标准,并根据是否构成非表达性使用对AIGC分类型适用合理使用制度;在合理使用制度外为AIGC创作增设义务,一方面要求AIGC开发者公开详细的训练数据摘要,证明其数字化作品来源合法,另一方面探索建立AIGC创作的训练数据统一登记平台,为著作权人在著作权框架范围外设置奖励。

【关 键 词】AIGC;合理使用;转换性使用;非表达性使用

【作者单位】杨曦,中南财经政法大学知识产权研究中心;邓臻宇,中南财经政法大学知识产权研究中心。

【基金项目】国家社会科学基金青年项目“文本和数据挖掘的著作权合理使用制度研究”(21CFX081)的阶段性成果。

【中图分类号】D923.41;TP18 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2024.17.013

人工智能技术的蓬勃发展对知识产权制度提出了重大挑战。2023年7月国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》,指出“国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展。生成式人工智能服务提供者应使用具有合法来源的数据和基础模型,并且不得侵害他人依法享有的知识产权”。在著作权领域,生成式人工智能(AIGC)创作能否适用合理使用制度引发了世界广泛关注。一方面,AIGC创作是科学研究、新闻出版等行业创新发展的重要技术支撑。以新闻出版行业为例,AIGC以已有的作品为基础,进行自动化编辑和个性化推送,逐渐改变了新闻出版行业的内容生产模式。另一方面,AIGC创作存在侵犯复制权和改编权等多项著作权风险,对AIGC技术创新发展和作品保护造成阻碍。

为回应AIGC技术创新发展所带来的著作权领域的难题,各国式地区通过调整著作权限制制度的方式为AIGC创作提供合法性支持。例如:欧盟的《数字化单一市场版权指令》规定了文本与数据挖掘的例外规则,该规则适用于AIGC创作;日本最新修订的著作权法中关于文本与数据挖掘构成合理使用的规定是探索AIGC创作构成合理使用的基础[1];我国著作权法合理使用的立法模式已由全封闭的规则主义修改为半封闭式,即“一般条款+常见情形”,但上述规定对AIGC创作的适用空间较为有限,在短期内难以重新立法为AIGC创作提供合法性支撑。鉴于此,本文从AIGC创作难以适用目前的著作权合理使用制度出发,剖析AIGC创作援引著作权合理使用的适法困境,并为其构成合理使用提供应对路径。

一、AIGC创作援引著作权合理使用的适法困境

面对著作权侵权风险,合理使用制度是AIGC创作具有合法性的有力支撑。目前我国著作权法虽然规定了合理使用的具体情形,但将AIGC创作应用于上述规定面临适法困境。

1.“个人使用”条款难以有效涵盖AIGC创作主体

合理使用制度中“个人使用”条款的适用主体范围仅局限于个人,适用目的仅限于非商业使用。在主体范围上,AIGC技术的开发主体多为大型互联网企业或科研机构,明显超出个人的范畴。尽管日本法院指出“个人”可以根据具体情形扩大解释为“在家庭或者有限的范围内的成员”[2],但AIGC创作仍不适用该条款。在适用目的上,“个人使用”条款仅限于非商业目的的使用,而AIGC平台多为营利性质,具有商业目的,不符合使用目的的要求。因此,合理使用制度中的“个人使用”条款无法涵盖AIGC创作的主体。

2.“教学、科研”条款难以满足AIGC创作的“复制数量”要求

合理使用制度中规定的“教学、科研”条款要求教学或科研人员少量复制他人已经发表的作品。就复制数量而言,AIGC在输入训练数据阶段,需对大量、多种形式的数字化作品进行规模性复制。这种规模性复制无法达到“教学、科研”条款中复制数量应是“少量”的要求,难以构成合理使用。因此,在Authors Guild诉OpenAI案中,美国作家协会和多名作家提交诸多证据证明ChatGPT的大量复制侵犯了作者的著作权。此外,该条款虽然规定了“供科研人员使用”,但此“科研人员”是指以公共利益为前提的国家设立的科研机构。由此可见,AIGC创作难以适用合理使用制度,无法依据“教学或者科研人员使用”条款证明其合法性。

3.新闻出版等单位难以适用合理使用条款证明其应用AIGC创作的合法性

新闻出版机构和图书馆等单位难以利用合理使用制度证明其AIGC创作的合法性。就新闻报道而言,其构成合理使用的前提是“不可避免地再现或者引用已经发表的作品”,而AIGC创作使用作品不具有必需性。因此,中国音像与数字出版协会在2024年施行的《出版业生成式人工智能技术应用指南》团体标准中规定,未经权利人和相关利益方的明确许可,不得以任何方式或授权他人将有关作品用于AIGC技术训练。就出版业而言,由于AIGC算法的“黑箱化”和训练数据的海量性,从业者难以辨别稿件是否为AIGC创作,鉴于审查难度和潜在侵权风险,国内外多家期刊都表示不接受含有AIGC创作的稿件。就图书馆而言,其合理使用的前提是为了陈列或者保存作品,适用对象仅限于本馆收藏的作品,如果复制本馆以外作品,仍需取得著作权人的同意。此规定将限制AIGC技术在图书馆中的应用,以上海云瀚智慧图书馆为例,该馆利用人工智能技术自动解读图书内容,但此用途超出了图书馆陈列或保存作品的范围[3],因而不符合现有合理使用制度的规定。

综上,根据著作权法的规定,AIGC创作存在著作权侵权风险,且现有合理使用制度难以为其提供合法性支撑。基于此,AIGC创作适用著作权合理使用的正当性是当前亟须探讨的重要问题。

二、AIGC适用合理使用制度的正当性考量

随着AIGC技术在作品创作与传播中的广泛应用,其技术发展亟须得到著作权制度的回应。就AIGC创作而言,基于利益平衡和制度优选的视角,将AIGC创作纳入合理使用具有正当性。

1.合理使用制度是实现AIGC创作合法性的最优制度

现行著作权法框架内AIGC获取并利用版权作品有三种合法途径,即授权许可、法定许可和合理使用。就授权许可而言,尽管其能够在一定程度上反映作品的市场价值,但难以有效运用于AIGC创作中。首先,授权许可模式难以满足AIGC对海量数据的需求,还会因为数据质量参差不齐加深数据偏见。其次,授权许可模式的交易流程冗杂,AIGC技术开发者较难与著作权人取得联系,效率较低[4]。就法定许可而言,其虽然不需要获得著作权人许可同意,但仍需向著作权人支付报酬。有学者提出采用集体管理组织的形式,但难以施行,这不仅有集体管理组织与AIGC开发者建立联系过程烦琐[5]的原因,还有法定许可费用的确定和调整复杂而无法达成协议的原因。因此,上述两种路径在实践上存在困难。

反观合理使用制度,其更适合AIGC创作。首先,从实施路径角度来看,开发者无须与著作权人取得联系,可应对使用海量作品的难题。其次,从公共利益角度来看,采用相对宽松的合理使用制度为AIGC技术发展提供了有益环境,降低了中小企业的准入门槛,有助于提升我国人工智能产业的国际竞争力。最后,从历史经验的角度来看,欧盟和日本为“文本与数据挖掘”提供的合理使用规定对AIGC创作构成合理使用具有借鉴作用。

2.实现AIGC技术发展与作品保护之间平衡的制度考量

数字时代,如果固守著作权严格保护的思路,则难以从知识经济向数字经济过渡[6],并将限制AIGC技术的发展。因此,实现AIGC技术发展与作品保护之间的平衡,对激励作品创作、促进作品传播、推动AIGC技术创新具有重要意义。

将AIGC创作纳入合理使用是实现技术发展与作品保护之间平衡的制度考量。在数字技术蓬勃发展的背景下,有学者提出了“技术性合理使用”的概念,认为如果某项技术如机器学习、文本与数据挖掘技术等人工智能技术,能够带来经济利益或积极效应,则更倾向于认定其构成合理使用[7]。目前,美国、日本和欧盟等诸多国家和地区出于对AIGC技术竞争和数字经济发展的考量,在著作权制度中设置了AIGC创作构成合理使用的相关规定。例如:美国在多项司法判决中认为创建数字复制件并提供给用户的行为属于典型的转换性使用,构成合理使用;日本在最新修订的著作权法中为AIGC创作涉及的文本与数据挖掘技术提供了著作权保护例外。就我国而言,《中华人民共和国人工智能法(学者建议稿)》第24条中明确指出,AIGC技术在利用数据过程中,如不存在影响该数据的正常使用,或不合理地损害数据权利人的合法权益等情况,可被视为数据合理使用行为,该建议稿为判断AIGC创作能否构成合理使用提供了依据。因此,为AIGC技术设置适度宽松的法律环境,使AIGC创作构成合理使用从政策建议上升为法律制度,将是中国未来修订和实施著作权法过程中亟待解决的重要问题。当然,将AIGC创作纳入合理使用并不代表AIGC创作的绝对合法化,通过对合理使用条款的详细解释以明确AIGC技术构成合理使用的具体情况,有助于平衡AIGC技术发展与作品保护之间的关系。

3.实现作品创作与新闻出版行业长效发展的政策考量

将AIGC创作纳入合理使用,是数字经济时代实现作品创作与新闻出版行业长效发展的政策考量,既有利于促进作品的创作,又有利于新闻出版行业发挥资源优势、推动文化传播[8]。

就作品创作环节而言,首先,AIGC基于数据、算法模型可以远快于人类分析的速度进行创作,这有助于促进文化的多样性,实现知识增值[9]。以新闻报道业为例,AIGC可以对海量数据进行分析,撰写出更具洞察力和独特视角的新闻报道。其次,在人工智能时代,设置合理使用制度旨在平衡著作权人与社会公众之间的利益。将AIGC创作纳入合理使用可帮助公众以更快速、多元的方式获取知识,还可以根据公众的偏好生成个性化的作品。以科学研究为例,目前OpenAI的Assistants API 增强并行查询重排和自动解析功能,可以更快地筛选数以万计的文件,为科研工作者高效地提供信息。

就新闻出版行业长效发展而言,首先,AIGC创作丰富了作品的传播途径,这与著作权法中增强知识广泛传播的目标相契合。其次,相较于AIGC的其他使用者,新闻出版行业从业者可以发挥作品资源的规模化优势,运用AIGC技术对已有作品进行信息采集、文本与数据编辑[10]。此外,对于需要进行实时信息收集的突发事件,从业者可以借助AIGC辅助产出内容,既提高了新闻的时效性,又使得从业者从机械化、低创造性的工作中解放出来。

综上所述,基于实现AIGC技术发展与著作权保护之间平衡的制度考量,以及作品创作与新闻出版行业发展的政策考量,将AIGC创作纳入合理使用具有正当性。虽然授权许可和法定许可能够在一定程度上减少AIGC创作的著作权侵权风险,但将其具体规则付诸实践仍有较大难度,相较之下,将AIGC创作纳入合理使用更符合现实考量。因此,需要进一步探讨如何将AIGC创作纳入合理使用制度体系。

三、AIGC创作纳入合理使用范畴的优化路径

将AIGC创作纳入合理使用制度体系,其实现路径主要包括以下两种:一是建立“一般条款为主+法定列举情形为辅”的合理使用制度框架,并概括性解释一般条款的主要考量因素;二是将AIGC创作直接纳入合理使用条款的具体列举情形中。鉴于我国著作权法的具体实践以及AIGC技术的蓬勃发展,遵循合理使用的一般条款,并在此基础上予以具体判断是将AIGC创作纳入合理使用范畴的切实可行路径。在AIGC创作适用合理使用一般条款的过程中,还应重点考虑AIGC创作的类型以及“三步检验法”的判断标准。

1.路径选择:建立“一般条款为主+法定列举情形为辅”的合理使用制度框架

将AIGC创作纳入合理使用所列举的具体情形能够较为直观地判断合法性。从既有立法经验看,日本和欧盟虽然尚未在合理使用条款中明确增设AIGC创作的相关内容,但对“文本与数据挖掘技术”设置了具体条款,然而这些条款难以有效解决AIGC创作衍生的新问题。鉴于法的安定性以及AIGC技术的发展现状,在我国现行的著作权法中增设AIGC创作的合理使用条款难以实现。相较之下,建立“一般条款为主+法定列举情形为辅”的合理使用制度框架是当前可行的路径。首先,新修订的著作权法合理使用的规则主义和要素主义相结合的半封闭式模式,为后续AIGC创作等新类型行为构成合理使用提供了空间。其次,在AIGC创作模式和创作类型均未固化的背景下,以前瞻性的视角从法律上界定AIGC创作行为存在立法困难,所以,目前通过合理使用的一般条款对AIGC创作进行判断是当下可行的路径,即建立以“一般条款为主+法定列举情形为辅”的合理使用框架。

2.要素考量:细化合理使用一般条款的判断标准

我国著作权法目前采用半封闭式立法模式,即“一般条款+常见情形”,这为AIGC创作构成合理使用提供了可能。美国以概括式的“四要素分析法”作为合理使用的判断标准,但在司法实践中,法官难以以抽象的概括条款准确判断新型创作行为是否构成合理使用。以我国目前采用的“三步检验法”为基础,借鉴美国的“四要素分析法”,AIGC创作能否构成合理使用应主要考量以下四个方面。

第一, 合理使用制度的主体范围应扩大解释,将AIGC纳入主体考虑范围。具体而言,我国立法中规定非商业性目的的科研团队属于合理使用主体是出于科学进步和公共利益的考量,而AIGC平台虽具有商业性质,但其对新技术的研发强度并不弱于非商业性质的科研团队,对科学技术进步具有推动作用,所以应将AIGC纳入合理使用的主体考量范围内,再结合其他考量因素对AIGC创作能否构成合理使用做进一步判断。

第二, 适用目的不应限于非商业性使用,商业性目的的AIGC创作也具有构成合理使用的可能。其一,无论是“三步检验法”还是“四要素分析法”,任何一种考虑因素都需要结合其他因素进行整体判断。其二,在现行科研主体与市场主体相互交融的模式下,商业性目的的AIGC创作构成合理使用的情形势不可挡。其三,我国合理使用总则并未将商业性质的使用排除于合理使用之外,司法判决中也有将商业性的使用认定为合理使用的先例。例如,上海市高级人民法院在针对《西部畅想》的合理使用诉讼案件中认为,被控侵权作品是否以营利性为目的并非判定被侵权作品不构成合理使用中适当引用的要件。因此,AIGC创作的商业性并非必然排除其构成合理使用的要素。

第三, 判断“不得影响该作品的正常使用”时应重点考量AIGC创作是否会对原作品的市场利益和市场竞争产生影响。根据《伯尔尼公约》的规范,正常使用是指一切可以获得经济利益或其他可能获得经济利益的使用行为[11]。该解释与美国“四要素分析法”中的不得对原作品的潜在市场或价值造成影响较为相似。根据此解释,如果AIGC创作可以构成合理使用,就意味着该行为不会影响原著作权人应获得的市场利益,也不得与原作品之间形成市场竞争关系。对AIGC创作而言,其在输出端并不会输出可供外界获取的原作品复制件,所以不会损害原作品的市场利益;其输入的数字化作品与输出的内容之间不存在直接的因果关系,不会替代原作品,因此,不会与原作品形成竞争关系。此外,欧盟2016年《单一市场版权指令草案》的立法提议中认为数据挖掘技术对原作品版权利益的损害是微不足道的[12]。目前,市场上大多数AIGC平台都将其参考的原作品的相关链接、来源附于生成内容末尾,供使用者使用查看,增加了公众接触原作品的渠道和机会,原作品的市场利益甚至因为AIGC创作得到提高。

第四, 针对“不得不合理地损害作者的合法权益”的判断。是否会损害著作权人的合法利益应从AIGC创作的类型、原作品的性质、原作者使用的数量和质量等多方面进行综合分析。其一,应结合AIGC创作的类型区分其是否属于“表达性使用”。根据“思想与表达二分法”原则,著作权保护的核心是作品的独创性表达,而“非表达性使用”没有利用原作品的独创性表达[13],属于合理使用。基于此,根据AIGC创作是否使用原作品的独创性表达可以将其分为表达型AIGC和非表达型AIGC。非表达型AIGC侧重于对知识的统计和收集[14],并未直接将具有独创性表达的内容向公众传播,应属于“非表达性使用”。其二,从原作品的性质来看,应重点判断原作品的独创性程度高低。通常而言,原作品的独创性程度越高,其越难以构成合理使用。AIGC开发者在输入端收集大量的训练数据,而训练过程中该作品的独创性程度高低难以笼统判断,需结合个案具体情况分析。其三,AIGC创作能够构成合理使用需要综合考量所使用作品的“数量”和“质量”。就“数量”而言,AIGC创作从输入到输出的过程涉及对原作品大量的复制,所以仅从复制“数量”上看,AIGC创作不符合合理使用的判断标准。就复制“质量”而言,应重点考虑AIGC创作对原作品的转换性使用程度,转换性程度越高,越容易构成合理使用。其中,非表达型AIGC并未直接引用原作品的独创性表达,而是在提取原作品必要表达要素的基础上创作新内容,转换性程度较高。表达型AIGC即便含有原作品的独创性表达,但如具有转换性使用的目的或用途,也将构成转换性使用。例如,上海知识产权法院审理“80后的独立宣言”案,认为对“黑猫警长”等美术作品的使用构成功能上的转换性使用,因为其引用是为了说明某一问题,而非展示原作品的艺术价值,构成合理使用。

3.条件限制:在合理使用制度外为AIGC创作增设义务

AIGC创作虽然具有适用合理使用制度的底层逻辑,但也应为其设置一定的条件限制,一是AIGC创作应合法获取训练数据,二是在著作权法框架外为原作品的权利人提供适当的奖励。

第一,应当保证获取原作品的合法性。欧盟最新颁布的《人工智能法案》规定了AIGC服务提供者应就训练数据制定公开详细摘要,以方便合法权益方行使和执行权利。我国可以借鉴此规定,要求AIGC开发者列出用于训练模型的主要数据集,并对所使用的数据来源进行叙述性记录并备案,这将有效提高AIGC获取数字化作品的合法性和获取行为本身的可追溯性。

第二,建立AIGC创作的训练数据统一登记平台,在著作权法框架之外为著作权人设置奖励制度。其一,设计登记平台。该平台应具备数据登记、分类、查询检索、统计和支付等基本功能。其二,完善训练数据的登记流程。AIGC开发者应在平台上提交使用训练数据的目的、用途等信息,平台应对登记信息进行形式审查,在审核通过后该平台将生成唯一的AIGC训练数据登记编号以用于后续的训练数据检索和统计。其三,设置经济奖励机制。一方面,该平台根据训练数据的价值、著作权人的贡献以及开发者的负担能力等因素综合设置合理的经济奖励标准。另一方面,该平台在固定周期内生成奖励金额结算清单,开发者应在规定的时间内支付费用,确保著作权人可以及时获得经济奖励。

四、结语

数字技术的迅猛发展使AIGC创作面临著作权合法性困境。数字时代,著作权制度应当有效平衡技术发展与作品保护、作品创作与新闻出版行业发展之间的关系。虽然授权许可和法定许可能够在一定程度上减少AIGC技术应用于作品创作所面临的著作权侵权风险,但难以有效实施,相较之下,合理使用制度更符合现实考量。现阶段,以更为灵活的方式适用合理使用制度的一般条款,并将其应用于数字经济时代衍生的新问题具有一定的可行性。因此,应建立“一般条款为主+法定列举情形为辅”的合理使用制度框架,对主体范围适当扩大解释,突破非商业性使用的限制,并在此基础上综合考量是否影响作品的正常性使用和作者的合法权益等判断要素。同时,考虑到AIGC等新技术的快速发展与训练数据的紧密关联性,为确保其训练数据来源的合规性,还需在著作权制度外要求AIGC开发者制定公开且详细的训练数据摘要,以提升训练数据的透明度和可追溯性,并通过建立AIGC训练数据统一登记平台为著作权人提供奖励,实现技术发展与作品创作的相互促进。

|参考文献|

[1]宣喆. 论分类保护视角下人工智能创作的著作权合理使用[J]. 出版发行研究,2022(3):81-87.

[2]冯晓青. 著作权法(第二版)[M]. 北京:法律出版社,2022.

[3]管育鹰. 我国版权立法中文本数据挖掘侵权例外规则的构建:兼论中国知网论文查重争议[J]. 中国版权,2022(6):7-12.

[4]刘艳红. 生成式人工智能的三大安全风险及法律规制:以ChatGPT为例[J]. 东方法学,2023(4):29-43.

[5]刘禹. 机器利用数据行为构成著作权合理使用的经济分析[J]. 知识产权,2024(3):107-126.

[6]张新宝,卞龙. 人工智能生成内容的著作权保护研究[J]. 比较法研究,2024(2):77-91.

[7]万勇. 人工智能时代著作权法合理使用制度的困境与出路[J]. 社会科学辑刊,2021(5):93-102.

[8]张明. 文本与数据挖掘适用著作权合理使用的解释论[J]. 出版发行研究,2023(2):51-56.

[9]徐小奔,杨依楠. 论人工智能深度学习中著作权的合理使用[J]. 交大法学,2019(3):32-42.

[10]陶乾,董川. 文本与数据挖掘的法律障碍与化解路径:以知识资源平台的数据再利用为研究视角[J]. 出版广角,2023(6):32-40.

[11]熊琦. 著作权合理使用司法认定标准释疑[J]. 法律实务,2018(1):182-192.

[12]石必胜. 合理使用认定的有罪推定:评国内首例谷歌数字图书著作权纠纷案[J]. 中国版权,2014(3):19-22.

[13]MATTHEW SAG. The New Legal Landscape for Text Mining and Machine Learning[J]. Ournal of the Copyright Society of the USA,2019(1):291-367.

[14] HUGHES J. The sub rosa rules of copyright fair use[J]. Arizona Law Review,2022(64):1-50.