人工智能生成内容的著作权法保护探究

2021-11-22 06:49:48周若玮

对外经贸 2021年9期

周若玮

（安徽大学法学院，安徽合肥 230601）

技术的发展创造了全新的领域，人工智能技术已经成为当前炙手可热的研究方向，在社会生活的各个方面也随处可见人工智能的影子。在科学与文化领域，人工智能生成内容在互联网中大量出现，“微软小冰”的诗集《阳光失了玻璃窗》也已出版。人工智能生成内容以及该内容生成过程中涉及的著作权问题仍有待探讨。

一、人工智能“创作”过程中可能涉及著作权侵权

人工智能（Artificial Intellegence,AI）就是让计算机完成人类心智（Mind）能做的各种事情，其重点不在于计算机，而在于计算机所做出的行为。在大数据时代到来之前，人工智能的创作方式以“代码定义”为主，设计者通过程序代码在机器人的运行过程中模拟人类的思维方式或思维结构，人工智能机器仅仅是承载设计者思维过程的创作工具。随着互联网与大数据技术的不断发展，“数据训练”成为人工智能的主要创作方式。人工智能通过对数据库内的海量数据进行统计分析形成与数据库内所有数据所展现的人类思维方式近似的逻辑组合，其智能程度与数据库容量和计算能力的提升成正比。此时计算机的创作不再一味追求理解人类创作中使用的元素的本意，而是通过提炼数据库中出现的高频率搭配并按照设定的数据模型生成人类可以阅读、理解的内容。数据训练的基础是机器学习，由数据输入、机器学习与结果输出三个阶段构成。

（一）数据输入阶段可能构成著作权侵权行为

人工智能生成内容能否取得突破性的进展，关键在于训练数据的完备性，数据输入是人工智能进行内容生成的重要基础。由于数据库的规模会对人工智能的“智能”产生直接影响，开发者或设计者往往在人工智能系统或实体的训练环节为其寻找尽可能多的训练数据。然而，训练数据作为以计算机可读形式呈现的知识和信息，难免会包括受著作权法保护的作品，对作品进行数字化处理并形成集合输入智能系统的行为是对文本数据进行挖掘，在本质上即是一种对作品的复制行为。[1]在著作权法上，缺乏著作权人授权而对作品进行复制的行为可能是合法使用，也可能构成侵权使用。

（二）数据输入阶段行为合理性之探寻

在人工智能的开发过程中，训练数据的著作权问题不可回避。机器对数据的获取与人类读者的阅读行为具有一定的相似性，是“机器读者”的一种数据输入行为；但“机器读者”批量阅读的阅读数量和阅读速度远远超过人类读者，其阅读目的与作品本身的艺术价值和表达价值并无关联，而是为了提炼常见的词语搭配和句式关系并形成元素合辑以便依据指令按照既定模式生成新的内容，与人类读者通过阅读获得文学艺术滋养、学习思想观点、与作者进行交流的阅读目的存在明显差异。一旦获取训练数据的成本变得高昂，人工智能设计者将倾向于更多地使用已处于公共领域的不再受著作权保护的材料用于人工智能系统或实体的训练。由于著作权法对自然人作品的保护时限为终身加身故后五十年，对法人或非法人组织作品、著作权由法人或非法人组织享有的特殊职务作品、视听作品的保护时限也从作品首次发表时开始计算长达五十年，①因此处于公共领域的材料往往已经不符合社会发展的现状，具有严重的时代偏见性和滞后性，以此类作品作为训练数据缺乏全面性与客观性，难以实现人工智能所要达成的科研目的。

（三）训练数据所处版权困境的解决方式

在当前的著作权法框架下，意图解决人工智能训练数据引起的版权争议存在多种方式。有学者认为，可以采取“选择退出”（opt-out）模式。传统著作权法模式采用的是“选择加入”（opt-in）模式，除法律规定的特别情形外，若要利用他人的作品则必须取得著作权人的许可，否则将构成侵权行为。“选择退出”模式则是将作品置于统一的“作品市场”之中，在法律规定的特殊情形下，作品的使用者从“市场”中选用作品并支付合理报酬即为合法，除非著作权人明确表示拒绝授权，即退出该“作品市场”，使用者应当停止对该作品的利用行为[2]英国则采用了“有条件例外”模式，将数据挖掘行为作为版权侵权的例外情形，并将数据挖掘行为严格限定在非商业使用的范围内。②美国和日本采用“无条件例外”模式，使用者对现有作品进行数据挖掘属于合理使用，是否为商业目的在所不问。其中美国以“转换性使用”作为裁判基础，通过判例法将文本数据存储、挖掘纳入合理使用一般条款的范围之内。日本则采取列举方式扩张了对作品合理使用的范围，将信息处理行为纳入侵权例外，但信息处理行为应当限于对作品的轻微利用，且不得不合理地损害著作权人的利益。③欧盟也采取了类似的方式，一方面将文本数据存储、挖掘的著作权例外使用主体范围扩展至具有商业意义的私人主体，另一方面有允许著作权人以明示的方式对将其作品用于非科研目的的文本数据分析表示拒绝。④最后，也有学者主张采用“法定许可”模式，即由法律明文规定允许人工智能的开发者或设计者无需事先获取著作权人的授权而直接使用他人享有著作权的作品，但需按照法律规定向著作权人支付合理报酬。[3]

（四）我国对人工智能数据输入过程中涉及的著作权问题的回应路径

训练数据的输入为人工智能实行“创作”的后续机器学习和结果输出奠定了重要基础，因此著作权法从制度设计上对其做出回应是必然之势。若采用“选择退出”模式或“有条件例外”模式，在人工智能开发和设计的过程中仍将面临较大的授权阻力，目前看来“无条件例外”模式与“法定许可”模式更具有可行性。采取“法定许可”模式一方面可以简化著作权作品的获取环节，另一方面可以有效保障著作权人的利益，但“机器阅读”与人类阅读仍然有本质上的差异，因此在支付合理费用时应当对这一事实情况予以考量。更为重要的一点在于，法定许可需要由法律进行明文规定，但这恰恰是立法的空白区域。若采取“合理使用”模式，我国可以效仿日本或欧合输入智能系统的行为是对文本数据进行挖掘，在本质上即是一种对作品的复制行为盟的方式，将文本数据挖掘行为新增为合理使用的具体情形；亦或是参考美国的立法方式，在著作权法中增加合理使用情形的一般条款，同时在对合理使用的法定列举中增加兜底条款以扩展该条款的适用范围。我国新修订的《著作权法》即对合理使用的条件作出了新的限制规定，并在法定列举情形中增加兜底条款⑤，为文本数据挖掘行为预留出了充分的制度空间。

二、人工智能生成内容的可版权性争议

（一）对人工智能生成内容是否具有可版权性的不同观点

人工智能输入内容的著作权问题得到合理解决并不意味着其生成的内容就必然具有可版权性，学界对于是否应当将人工智能生成内容作为著作权法上的作品予以保护仍然存有争议。有学者主张，当前并不具备在著作权法体系中为人工智能生成内容寻求著作权或邻接权客体地位的必要性与合理性。[4]著作权法的基本目标、作品的基本前提与特征均是对人工智能生成内容著作权法上的地位考察时不可或缺的必要标准，人类应当是著作权法意义上的作品的创作者，作品本身具有多样性、价值型与稀缺性的特征。多数学者主张，人工智能生成内容是算法遵循设计者的思维和设计方式运行的产物，应当属于著作权法上的作品[5]；“算法创作”的各个环节中不可避免有人类的参与，也为人工智能生成内容带来了充分的人格要素[6]；作品的可版权性判断应当以生成结果为准，其过程如何以及主体为谁在所不问[7]。还有学者提出，当今全球人工智能技术仍处于“弱人工智能”的状态，人工智能技术有限，还仅仅处于“创作工具”的地位，若该生成内容符合著作权法对作品的“独创性”要求，就应当将其认定为人工智能使用者运用工具创作的作品；未来技术发展至“强人工智能”时代，人工智能有能力在完全独立的情况下生成具有作品外观的内容，即使如此在人工智能的创作中也难以避免人类人格要素的参与，这也意味着该生成内容可能涉及人类思想的表达，因此在“强人工智能”时代著作权法对该类人工智能生成内容也不能轻易地采取排斥立场。[2]

（二）人工智能生成内容的独创性判断与智力成果属性的判断

我国《著作权法实施条例》第2 条⑥明确规定了著作权法上的作品应当满足的四个要件，人工智能生成内容从客观上看，明显符合“文学、艺术和科学领域”与“能够以某种有形形式复制”的要求，因此判断人工智能生成内容是否构成著作权法意义上的作品的关键之处即落在：生成内容是否具有“独创性”以及是否具有“智力成果”属性。

“独”与“创”结合构成“独创性”，“独”是指独立完成该成果，并非抄袭他人；“创”是要求生成内容至少表现出最低限度的智力水平。目前，针对“人工智能生成内容的独创性存在与否”应当采取何种判断方式，在学界存在两种截然不同的观点。观点之一认为，独创性判断应当采用主观主义标准，人工智能依据既定的规则生成目标内容的过程中并不具备创作主体应有的智力创作空间，对于相同的原始素材，其生成的内容是相同或类似的，不具有个性特征，因此不具有独创性。观点之二认为，采用客观标准才是独创性判断的正确渠道，内容“如何产生”以及“由谁生成”并不构成影响内容独创性的元素，应当站在受众角度仅从内容本身出发，对是否具有独创性作出判断。

对人工智能生成内容进行是否具有独创性的甄别应当采取客观标准。我国的著作权法体系对英美法系的版权体系和大陆法系的作者权体系报以兼收并蓄的态度，一方面注重作者与作品之间的联系，在著作权体系中首先规定了四项重要的人身权利；另一方面维护著作权人的财产权利，从而保障权利人通过创作作品获得利益的可能性，有效激发作者的创作欲望，从而实现著作权法促进社会文化和科学事业发展的基本目标⑦。若采取主观主义视角，过于注重人工智能生成内容中的“人格要素”，极有可能造成对内容独创性论证的机械化，即：欲证明该生成内容具有独创性，就必须证明生成物来自于人，则需要证明内容的生成者具有“人”的主体资格。但基于人类中心主义的伦理基础，人工智能无法具备“人”的主体资格。依据前述的机械化论证，人工智能生成内容永远无法具备独创性，著作权法始终不会对其予以保护。显然，这一论证结果与人工智能生成内容著作权保护的现实必要性之间产生了严重的冲突。

对人工智能生成内容的独创性判断应当坚持“人工智能创作工具说”的前提。人类是具有认识能力和实践能力的主体，具有理性与自主性，而人工智能的本质是物，可以被占有和利用，具有私人性和可占有性，因此赋予人工智能法律主体的地位使其享有权利和承担义务并不具有现实意义。在弱人工智能时代，任何机器的正常运转都依附于人类行为，人类的指令输入是其运行行为的发生原因，解决人类所提出的问题是其运行行为的目标和结果。在作品创作方面，人工智能本身不具备创作作品的冲动和欲望，生成作品的风格和所依照的模板由开发者或使用者事先设定，不具备自主意识。对于人工智能生成内容而言，其独创性的来源是人类而非机器。在人工智能的算法设计、数据纠偏、模板生成等各个环节，人类均有相应的参与和控制行为，并借此方式将自己的独创性意志融入到人工智能的生成内容之中。从这一角度来看，即使未来技术发展到强人工智能时代，人工智能的客体地位仍然不会发生改变，只能作为人类进行创作活动的工具而存在，因此对其生成内容独创性的判断不应当纠结于生成主体和生成过程，而应当专注于内容本身。

人工智能本身即为人类创造的智力成果，其依据人类的指令并模仿人类的思维生成的内容理应具有智力成果的属性。人工智能虽然无法理解人类输入的符号所代表的文化含义，但能够依据这些符号创设的规则即人类的思维逻辑进行内容生成活动，其生成内容与人的智力成果在外观上几乎没有差异，能够被读者准确理解，因此具有智力成果的属性。

（三）人工智能生成内容可版权性证成的意义

人工智能生成内容获得的著作权法上的保护是人工智能产业发展所带来的现实需求。以搜狐“智能报盘”、腾讯“Dream Writer”、新华社“快笔小新”以及Giiso 咨询机器人为代表的人工智能数据分析和新闻采编机器层出不穷，其生成内容的速度和体量都是人类作者难以企及的。但由于人工智能生成内容需要依照事先设定的模式或依照其通过自学习形成的某种现有模式，因此人工智能生成内容始终桎梏于现下存储的数据材料，无法像人类一样实现对当今创作水准的突破。若大量的人工智能生成内容充斥市场并处于公共领域，使用者无需付出任何代价即可获得，而人类的作品却因受著作权保护造成了使用成本的高昂，从而被束之高阁。不可否认财产权利是人类作者进行创作的重要原因之一，当作者无法从作品的使用中获取利益时，其创作欲望将会大大降低，此时文化市场将被大量创作水平“原地踏步”的人工智能生成内容占领，形成了“劣币驱逐良币”的不良局面，社会文化水平和科学事业发展将停滞不前。此外，明确界定财产权的边界有利于提高经济效率，降低交易成本。根据“知识产权法定主义”，由于知识产权客体具有无形性的特征，导致其无法通过合法占有排除他人的非法占有，知识产权的权利内涵与外延均依赖法律拟制，著作权的行使与保护均以法律规定为前提。在著作权法的保护体系内为人工智能生成内容创设一席之地将有助于文化市场的运行与发展。

三、人工智能生成内容权利的归属、义务的履行与责任的承担

（一）人工智能不具有著作权法上的主体资格

在一套成熟的权利体系中，权利的归属、义务的履行与责任的承担是永恒不变的中心话题，若权利义务确实存在却不明确其归属主体，无异于使该权力体系归于空白。人工智能技术的发展对现有的法律制度造成了重大冲击，欧盟甚至开始对是否应当赋予机器人以“电子人”法律地位的问题进行思考。本文认为，对于人工智能生成内容而言，人工智能本身仅仅是一种生成工具，无论是在“弱人工智能”时代还是“强人工智能”时代，甚至在未来可能存在的“超人工智能”时代，人工智能都无法拥有人类的自主意志，不具备行使权利的能力，没有独立的财产，更遑论履行义务与承担责任了。当人工智能的主体资格被全盘否定时，谁才是人工智能生成内容权利的归属、义务的履行与责任的承担主体呢？

（二）人工智能生成内容权利归属的观点之争

我国学者对于人工智能生成内容的权利归属从不同角度提出了多种学术观点。有学者认为，人工智能生成内容构成著作权法上的作品，具有独创性和必要的人格要素，在人机合作的情况下，“机器作者”与人类作者均对作品的产生做出了贡献，可以按照法人作品或创作者约定对作品的著作权进行安排。[8]也有学者主张，在人工智能著作权时代，投资者的是促成作品生成的重要主体，各相关法律应当将投资者权益纳入保护范围。但由于投资者的对于作品生成的贡献往往是“非创造性”的，因此对于人工智能生成内容的保护应当与人类作品的保护区别开来，即通过邻接权对投资者利益予以保护。[9]还有学者主张，人工智能本身是客体，人工智能生成内容则是客体之客体，实际上即为一类知识产权客体的孳息，依据民法中孳息的所有权归属原则，可以认定人工智能的开发者、使用者或所有者作为著作权人。[10]

（三）坚持“著作权属于作者”的一般原则并兼顾特殊情况

我国《著作权法》坚持“著作权属于作者”的一般原则，自然人的作者地位来源于其创作作品的行为，法人或非法人组织则在特殊情况下可以被视为作者。⑨著作权法对作者权利的保护实际上是对作者在创作作品时所贡献的创造性劳动进行保护，因此从原则上来看，对人工智能生成内容贡献更多的创造性劳动的主体理应成为作者。英国早在上世纪九十年代就对计算机生成作品的著作权归属做出明文规定，著作权属于“对该创作作品做出必要安排之人”。⑩“做出必要安排之人”的表述方式进一步印证了人工智能生成内容的著作权应当归属于在作品生成过程中做出实质性创作贡献的人。人工智能在作品生成过程中所贡献的是一种理性的计算能力，在当前的“弱人工智能”时期，人类指导、控制人工智能完成技术方案或生成智力成果，该成果本质上而言是人工智能开发者或使用者思维和意志的延伸。将人工智能生成内容划分为不同类型，在个案中对人工智能开发者和使用者所投入的创造性劳动程度进行对比，贡献更多的即为作者。例如，对于人工智能生成的文字作品，使用者所做出的贡献可能仅在于输入关键词，最终的生成内容与作品风格取决于人工智能开发者在开发过程中进行的数据输入和算法训练，开发者的意志对文字作品的生成起到了决定性的作用；对于人工智能进行照片处理生成的美术作品，使用者贡献了生成作品必不可少的基础材料，开发者对于作品的贡献则相对较小。

并非所有构成作品的人工智能生成内容都可以将人工智能开发者、使用者或其他参与者对其贡献的创造性劳动大小进行对比和排序，针对难以区分何人投入的创造性劳动更大的人工智能生成内容，实现作品流通和利用效率的提高，对新兴产业的发展予以保障和激励，是进行著作权权利配置时应当考量的重要因素。本文认为，将该类作品的著作权赋予人工智能使用者比赋予其他主体更有效率。人工智能的本质是计算机软件，是受著作权法保护的作品，即使人工智能生成内容的著作权未被配置给开发者，开发者也可以通过对计算机软件作品的权利的行使得到利益回报。一方面，人工智能开发者可以与投资者签订委托协议或依据特殊职务作品、法人作品的制度规则从投资者获取资金支持；另一方面，人工智能开发者将开发成果投入市场也能够获取可观的许可费用收入和流量资金收入。人工智能使用者在作品的生成过程中也做出了贡献，但却没有相应的权利保障，缺乏权利保障的使用者可能面临其他有权主体“二次赋权”的风险。此外，人工智能产品的使用者众多，将生成内容交由开发者管理需要消耗大量的财力资源，相比较而言，使用者对于自己在某事某地生成的某一特定内容进行管理将更为明晰，既能够提高人工智能生成内容在文化市场中的利用效率，也能够对人工智能产业的发展也将起到一定的激励作用，有利于实现著作权法促进社会文化和科学事业发展的基本目标。

此外，由于人工智能的开发需要大量的资金投入，对于部分学者主张的“注重对人工智能投资者的权益保护”的观点，著作权法本身从未忽视对投资者的权益保护，出于保护投资者所创设的委托作品制度、职务作品制度和法人作品制度在面对人工智能生成内容时的灵活适用足以充分保障投资者的利益。

四、结论

随着人工智能技术的发展，人工智能实现了新闻机器人自主采编新闻稿件，“微软小冰”甚至出版了诗集，著作权法不可逃避地开始迈入“智能版权”时代。人工智能实施“创作”行为依赖于完备的数据输入，在此过程中可能涉及对输入的训练数据造成著作权侵权的风险，我国新修订的《著作权法》通过在合理使用的法定情形列举中增设兜底条款，为将文本数据挖掘行为纳入合理使用范围预留了充分的空间，对这一问题做出有效回应。判断人工智能生成内容的可版权性的应当采用客观标准，从生成内容本身出发，与生成主体和生成过程无关。人工智能生成内容的可版权性也为文化市场的运行与发展提供了制度保障。人工智能本身无法成为其生成内容的著作权主体，不具备行使权利、履行义务和承担责任的能力。对人工智能生成内容权利归属的判断应当坚持著作权法上“著作权属于作者”的一般原则，对作品贡献更多创造性劳动的人是作者；若难以区分创造性劳动的贡献大小，应充分考虑著作权法的立法目标，将人工智能生成内容的著作权赋予更能鼓励作品的创作与传播、促进社会文化与科学事业发展的人工智能使用者。

人工智能技术的发展趋势是不可阻挡的，对于新的科学技术，人类应当遵循著作权法的历史轨迹，持有开放、包容的态度，沉着冷静地应对科技带来的挑战。

注释：

①《著作权法》第23 条。

②Copyright,Design and Patents Act 1988,29A: Copies for text and data analysis for non-commercial research.

③《著作権法》第四十七条の五：……著作権者の利益を不当に害……

④ Directive (EU)2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC.Art 3 Text and data mining for the purposes of scientific research,Art 4 Exception or limitation for text and data mining,Art 7 Common provisions.

⑤《著作权法》第24 条第1 款：在下列情况下使用作品，可以不经著作权人许可，不向其支付报酬，但应当指明作者姓名或者名称、作品名称，并且不得影响该作品的正常使用，也不得不合理地损害著作权人的合法权益：……（十三）法律、行政法规规定的其他情形。

⑥《著作权法实施条例》第2 条：著作权法所称作品，是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。

⑦《著作权法》第1 条。

⑧《著作权法》第11 条。

⑨Copyright,Design and Patents Act 1988,9(3): In the case of a literary,dramatic,musical or artistic work which is computergenerated,the author shall be taken to be the person by whom the arrangements necessary for the creation of the work are undertaken.