人工智能时代有声书的版权保护研究

2023-12-02 00:44朱景文

传播与版权 2023年22期

朱景文

［摘要］以人工智能技术为代表的数字技术正在深刻地改造着阅读媒介，有声书就是多种技术结合下的新型内容载体。人工智能时代有声书的发展应建立在规范有序的基础上，其无序的野蛮生长会造成难以估量的破坏。对此，相关部门应以著作权法这一法律制度为核心，围绕权属分配、侵权遏止以及平台责任三个方面构建有声书的版权治理与保护体系。

［关键词］有声书；版权保护；人工智能；媒介；出版

近年来，有声书成为人们进行阅读的重要途径与方式之一。人工智能技术的发展将有声书这一新型媒介形式推到了新的高度。据报道，国内某著名有声书平台已出现由AI创作、AI演播的有声小说［1］。相较于“冰冷”的机械合成声，由人工智能生成的声音风格多样，甚至传递出情感，大大提升读者的有声书阅读体验。据相关统计与预测，2021年全球有声书市场规模已超过40亿美元，预计到2030年将增长至超过300亿美元［2］。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确提出要“深入推进全民阅读，建设‘书香中国”，可以预见，有声书将在其中发挥重要作用。2023年8月31日，全国新闻出版标准化技术委员会发布《国家标准〈有声读物〉征求意见稿》（以下简称《征求意见稿》），将有声书国家标准的制定提上议程。可以看出，对有声书及其传播平台的规范化治理，已经成为当下热议的问题。

然而，当前有声书领域仍存在版权权属不清、侵权频发、平台治理混乱等问题［3］，阻碍了有声书行业的健康发展。与媒介发展的步调一致，版权制度的发展史也是一部技术发展史。随着传播技术的发展，使用者（有声书读者）和权利人（有声书权利人）之间就科技发展带来的利益分割一直无法达成共识，各方均试图最大化自身利益，由此极易导致行业陷入无序状态，而这就需要著作权法对此进行协调［4］。因此，如何合理运用著作权法这一工具，对有声书领域的版权保护问题进行规制，成为值得实务界研究的问题。

一、有声书的法律性质与权利归属

要合理地规范有声书行业发展，首先需要明确有声书项下的权属问题。有声书这一新型媒介是数字科技发展的产物，在人工智能的加持下呈现更加复杂的形态。

从定义的角度来看，有声书是将纸质书籍的文字、图形等信息转化为声音进行记录的新型载体形式。根据《征求意见稿》，“有声读物”指“以朗读、讲述或表演等为主要表现形式，以声音为主要呈现方式的阅读产品”。从制作流程的角度来看，有声书的制作可以分为两个主要環节：其一，利用传统的语音合成TTS（Text-To-Speech）技术或者人工智能技术将文本等信息转化为声音形式（由真人朗读的有声书不在讨论范围内）；其二，对转化后的声音内容进行录制，最终制作成完整的有声书。对有声书性质与权属问题的探究，应沿着上述两个线索展开。

（一）有声书的法律性质

首先需要回答的问题是，有声书成品的性质如何，即究竟应将其认定为著作权法意义上的“作品”抑或是“录音制品”？性质界定的不同，将会导致有声书保护规格的巨大差别，因此对这一问题的回答必须慎重。根据我国著作权法，“作品”指“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”，而“录音制品”则是指“任何对表演的声音和其他声音的录制品”。根据著作权法理，作品与录音制品之间是非此即彼的关系，两者区分的关键在于独创性的程度。著作权法意义上的独创性的含义指独立创作并且能够体现作者独特的智力判断与选择、展示作者个性。

在有声书领域，独创性标准的意义在于，满足独创性标准即被认定为作品，反之则应被认定为录音制品。我们观察有声书的制作过程及其最终呈现方式，发现其本质上是对原书（通常是纸质版，也可能原来已是有声版）进行形式上的转换，最典型的情况就是将文字逐一转化为语音形式，并将其连贯起来。在此基础上，判断有声书成品是否满足独创性的关键在于，以声音为表现形式的新载体相较于原来以文字为表现形式的旧载体，是否因具备独创性而演绎出新的作品？对传统的机械式合成有声书，由于没有表现任何“情感”与个性化选择，答案显然是否定的。对人工智能生成的有声书，由于其可以模拟出人类的情感，并且存在某些“个性化”的选择，因此认为人工智能生成物构成作品的观点不在少数。然而，至少在有声书领域，该回答依然是否定的—无论是机械式合成还是人工智能生成，有声书成品应被认定为录音制品而非作品。理由在于，即便是从真人有声书的角度来看，对同一本书由不同的人来朗读所呈现的效果也可能存在很大差异，一个技艺高超的朗读者能将书中的内容与感情完美表达出来。然而，此类朗诵依然无法达到著作权法对独创性的要求，因为朗读者所做的毕竟只是最大限度地展示原书的艺术美感。换言之，从读者的角度来看，朗读者都必须忠实于作品的内容，此过程中所进行的艺术发挥，相对作者对作品的创作而言，独创性程度是较低的［5］。从这个角度出发，即便激进地认为人工智能有资格与人类“平起平坐”，由人工智能生成的有声书仍不满足独创性的要求。实际上，正是为了保护此类不构成作品的形式，著作权法才新增了录音制品这一形式，使其能获得适度保护。总而言之，有声书成品的性质应被界定为著作权法意义上的录音制品，而非作品。

（二）有声书的权利归属

如果将有声书的法律性质界定为录音制品，那么将文本等信息转化为声音形式这一环节，实际上是对原作品的“表演”，由此产生的另一个问题是，人工智能能否取得著作权法意义上的“表演者”的地位？如果承认人工智能能够成为“表演者”，那么其将直接作为法律承认的主体并且享有相应的表演者权。由于我国著作权法并没有直接对“表演者”这一概念进行定义，因此“表演者”的概念范围并不清晰，我们需要从法律体系的角度进行分析。

要回答这个问题，人工智能能否作为作者受到保护的争论是一个理想的切入点。对人工智能能否取得作者身份，学界存在较大争论。支持人工智能可以作为作者主体的观点认为，在深度学习技术发展的背景下，人工智能虽是设计出来的算法程序，但其通过模拟人脑的神经网络已经具备独立学习与自我思考的能力［6］；同时人类是如何思考的本身同样不明确，因此人工智能通过深度学习后所进行的创作跟人类的创作并没有本质区别［7］。否定人工智能可以作为作者主体的观点则认为，著作权法意义上的作者只能限定在“人”的范畴，人工智能既不是人，也不可能受到著作权法的激励，因此不应被承认为作者［8］，肯定人工智能与人类的同等性可能会颠覆现存的法律基础。人工智能生成作品的权利归属问题，本质上是对人工智能法律地位的认识问题，而对这一问题的回答可谓牵一发而动全身，极有可能导致民法、刑法等法律体系的连环变动，同时涉及科技、伦理等一系列问题，因此该问题的答案仍然有待更严肃、全面的讨论。

对人工智能是否应取得作者地位的争论，当前在我国无论是在理论上还是在规范上均尚无定论。在此背景下，我们可以尝试借鉴其他国家的相关司法经验。例如，在近期宣判的“Thaler案”中，美国法院裁定单纯由人工智能生成的内容不符合版权保护的条件。在本案中，原告Thaler利用人工智能生成了一幅图像并向美国版权局申请版权登记，但是美国版权局拒绝对该图像进行作品登记，理由为该图像并非由人类所创作，缺乏适格的作者身份。而Thaler不服美国版权局的决定，遂提起诉讼。本案的争议焦点在于，单纯由人工智能生成的内容是否应有资格获得版权保护，从另一角度来看，就是人工智能能否获得作者资格的问题。对此，美国哥伦比亚特区地方法院法官在判决书中支持美国版权局的观点，强调即便历经科技的变迁，如照相机、摄影机的出现颠覆了作品的创作方式，美国版权法依然没有放弃要求人类对相关作品的实际参与以及对创造性的控制是得出新型作品属于版权保护范围这一结论的关键。简而言之，人类的身份是作品获得版权保护的最基本要求。无论人工智能所表现的“智力”水平有多么接近甚至超越人类，在当下人工智能与人类仍然存在明显的区分，这一前提若不改变，则人工智能无法获得作者身份。实际上，对法律问题的解释与回答不过是人类如何处理与人工智能的关系的一个缩影，这个问题糅合了政治、经济、文化与科技等诸多领域，其本质是技术时代人类对自身的再认识，在一定程度上已经超出了法律所承载的功能范围。

回到“表演者”身份的分析路径上，实际上，无论是国际条约还是域外立法，包括《保护表演者、录音制作制作者和广播组织罗马公约》《世界知识产权组织表演和录音制品条约》《视听表演北京条约》以及德国《著作权与邻接权法》、意大利《著作权法》在内的规范对“表演者”范畴的界定都仅指向表演作品的自然人［9］。从版权法体系与位阶出发，作者身份意味着著作权（狭义）的保护，而表演者身份意味着邻接权（录制者权）的保护。从体系解释以及目的解释的角度出发，对邻接权人的保护水平不应超过对作者的保护水平，由此可得出结论：对由人工智能生成有声书的情形，人工智能不能被认定为表演者。在明确这一前提的基础上，我们可以厘清有声书这一新型媒介之上的权利体系：无论是机械式合成还是人工智能生成，都不存在一个数字形式的“表演者”，有声书作为录音制品这一权利客体，其权利主体是制作这一有声书的人类制作者（包括法人），且作为录音制作者享有相应的邻接权。

二、有声书的版权侵权风险

在明确有声书的法律属性与权属问题的基础上，我们需要进一步探讨有声书的版权侵权风险。需要说明的是，借助语音转换、人工智能等信息技术，有声书的制作门槛并不高，将有声书上传至网络平台的往往是有声书制作者本身，由于制作者就是有声书这一录音制品的邻接权人，因此从邻接权的角度来看往往不涉及侵权。由此，下文将集中讨论上传、传播有声书所可能涉及的版权侵权问题。

对有声书的版权侵权，典型的形态为：在未经许可的情况下，将小说等文字作品制作成音频并上传至有声书平台进行公开传播。由此，我们可以将之拆分成两类行为：其一，将原作品“转换”成有声书；其二，将制作好的有声书上传至公开的网络平台。由于版权项下包括四类人身性与十三类经济性专有权利，不同类型的专有权利的保护范围并不相同，因此对有声书所涉的两类行为，应分别判断其侵犯何种版权专有权利。

对第一类行为，根据上文对独创性的分析，在这一过程中并不存在创造新作品的演绎行为，其本质是对原作品的录音，此种行为应落入著作权项下“复制权”的专有权利范围［10］。根据我国著作权法第十条第五款规定，“复制权，即以印刷、复印、拓印、录音、录像、翻录、翻拍、数字化等方式将作品制作一份或者多份的权利”。由此可知，对机械式生成或人工智能生成的内容所进行的录音，应受复制权控制；未经原书作者许可，擅自制作有声书的行为，可能侵犯作者的复制权。

对第二类行为，即将制作完成的有声书上转至公共的网络平台这一行为，司法实践通常认为该行为侵犯了原书作者的信息网络传播权。根据我国著作权法第十条第十三款规定，“信息网络传播权，即以有线或者无线方式向公众提供，使公众可以在其选定的时间和地点获得作品的权利”。对其中“使公众可以在其选定的时间和地点获得作品”的表述，主流观点将其与信息网络传播权的“交互式”特征联系起来，认为“选定的时间和地点”实际上與“交互式传播”是一体两面的表述。

在司法实践中，法院明确指出信息网络传播权区别于其他著作权专有权利类型的主要特点在于其交互式传播行为，即“使公众可以在其选定的时间和地点获得作品”。既然“选定的时间和地点”只对信息网络传播权划定了交互式传播与非交互式传播的界线，那么判断一个行为是否落入“选定的时间和地点”的范围，其实就是对这一行为是否符合交互式传播的判断。《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》（以下简称《规定》）第三条“通过上传到网络服务器、设置共享文件或者利用文件分享软件等方式，将作品、表演、录音录像制品置于信息网络中，使公众能够在个人选定的时间和地点以下载、浏览或者其他方式获得的，人民法院应当认定其实施了前款规定的提供行为（侵害信息网络传播权行为）”也印证了这一点。由于有声书平台大多是开放的网络平台，用户注册后可以自主选择时间、地点登录该平台获取特定的有声书资源，由此将有声书上传至公共网络平台这一行为已然具有交互式特征。因此，未经作者许可擅自上传有声书音频至公开的网络平台，就可能侵犯作者的信息网络传播权。

三、有声书侵权的平台责任界定

对有声书的版权保护研究，有声书平台的责任承担是其中的重要一环，也是极具争议的问题。伴随大数据、人工智能技术的飞速发展，有声书平台已从一个纯粹的有声书装载平台演化为集个性化推送、人工智能生成有声书等功能于一体的复杂角色，如何合理地界定有声书版权侵权行为发生时其作为平台的责任，是有声书产业治理的关键环节。

有声书平台应被定性为民法典意义上的“网络服务提供者”，根据《规定》第八条款项，应根据网络服务提供者的过错确定其是否承担责任，其中包括对网络用户侵害信息网络传播权行为的“明知”或者“应知”。因此，对平台责任的界定本质上是有声书平台对平台上存在的信息网络传播权侵权行为的注意义务构建。具体而言，相关部门可以通过以下三个方面对有声书平台的注意义务进行规范。

（一）依据“明知”认定注意义务

由于《规定》明确规定网络服务提供者没有义务对平台用户侵害信息网络传播权的行为进行主动审查，因此在版权相关法律规范中，确定有声书平台是否“明知”平台上存在侵害原书作者版权从而违反注意义务存在过错的工具是“通知—删除”规则。根据民法典第一千九百九十五条的规定，网络用户利用网络服务实施侵权行为的，权利人有权通知网络服务提供者采取删除、屏蔽、断开链接等必要措施；网络服务提供者接到通知后未及时采取必要措施的，对损害的扩大部分与该网络用户承担连带责任。民法典同时规定，著作权人向平台发出的通知应当包括构成侵权的初步证据及权利人的真实身份信息。

对用户上传至有声书平台的内容，应进行类型化的区分：一方面，对小说、专业著作等长篇幅文字作品的有声书，尤其是经出版社出版的书籍，往往著作权属清晰，并且绝大部分情况下不会由非权利人或个人用户进行上传，此种情况下有声书平台在核实通知人的权属信息后，应及时采取必要措施，如断开链接、下架有声书等，否则构成注意义务的违反从而存在过错；另一方面，对篇幅较短的作品，由个人用户自行创作并制作成有声书上传的可能性较高，此时从利益平衡的角度出发，应要求通知人承担更高的证明义务，对通知中未能对争议作品的权属信息做初步证明的，即便有声书平台接到通知后未采取相应措施，也不宜一律认定为其违反注意义务。

（二）依据“应知”认定注意义务

根据民法典第一千一百九十七条的规定，“网络服务提供者知道或者应当知道网络用户利用其网络服务侵害他人民事权益，未采取必要措施的，与该网络用户承担连带责任”。其中的“应当知道”也被称为“红旗规则”—如果网络平台上存在的侵权内容已经如一面红旗一样鲜艳，而平台却无动于衷，则平台违反相应的注意义务［11］。简而言之，即便权利人没有向有声书平台发出通知，只要有声书平台上存在明显的版权侵权行为，依然能够认定其违反注意义务。根据《规定》第九条，认定侵权事实是否明显，可以综合考虑以下几个方面：服务的性质、方式及其引发侵权的可能性大小；客体的类型、知名度及侵权信息的明显程度；平台是否主动对作品、表演、录音录像制品进行了选择、编辑、修改、推荐等；是否积极采取了预防侵权的合理措施等。对此，有声书平台可以重点关注以下几个方面。

其一，原书作品的知名度与热度。例如，在“《三体》有声书案”中，法院认为《三体》小说的知名度极高，有声书平台应当知道权利人不可能免费许可他人制作成有声书并上传。其二，有声书平台是否进行了选择、编辑、修改、推荐等。对网络服务提供者主动向用户推荐侵权内容的，司法实践中一般倾向于认定平台存在明显的主观过错。然而，这一问题在人工智能时代呈现更加复杂的特点，基于人工智能技术所实施的算法推荐存在高度自动化、个性化的特性，此时判断有声书平台是否应知所推荐的内容中存在侵权内容，存在一定的困难。对此，我们应对人工智能算法推荐的本质进行分析。人工智能算法推荐本质上也是平台的一种主动编辑行为，算法如何对平台信息进行编辑、排列，如何描述及设置索引，都是由平台设计和控制，因此平台本身应对其推荐内容中存在侵权风险具有合理的预期，在享受算法技术带来的高效率的同时应承担更高的注意义务，此种情况下平台仍构成“应知”［12］。其三，是否采取预防的合理措施。虽然有声书平台没有事前审查的义务，但是其仍应采取合理、有效的措施，以预防侵权行为的发生。对此，人工智能技术在为有声书平台带来更高的侵权风险时，也提供了预防侵权的技术手段。现阶段，人工智能技术已经在内容审核方面发挥重要作用［13］，有声书平台可以利用人工智能技术制订预防侵权的技术措施，如可识别原书是否仍在版权保护期内。

（三）依据商业模式认定注意义务

除了根据一般的注意义务确定侵权责任，当前司法实践还承认可依据平台特定的商业模式来确定侵权责任。在“北京梦之城文化有限公司诉杭州秀秀科技有限公司案”中，被告提供了一款“配音秀App”，用户可以在该软件上对作品片段进行配音、打赏，被告用户上传了原告享有版权的14段动画短片作为配音素材。该案审理法院认为，被告的服務模式在客观上存在诱导侵权视频上传的极大风险，其主观上亦能够预见涉案软件中可能存在侵权视频。由于被告未能尽到与其服务模式相适应的注意义务，对被控侵权行为属于应知，其行为构成帮助侵权。该案判决表明，我国法院在面对网络服务提供者新的商业模式和权利人利益保护之间选择了后者，存在较大侵权风险的商业模式即意味着被告很大可能具有过错［14］。

对有声书平台的商业模式而言，当前的有声书产业正在迈向用户付费时代。可以预见，未来内容付费将成为有声书平台的发展重点，这也意味着当前的平台商业模式将转变为基于有声书的平台精制模式。此外，随着有声书的需求愈发旺盛，有声开发、联合出版、视听小说、互动绘本、短剧、影视剧等内容将会在有声书平台成为一个连贯的体系［15］。无论是用户付费还是联合开发，有声书平台商业模式的进化意味着平台注意义务的提高。对用户收费模式而言，根据《规定》第十一条，“网络服务提供者从网络用户提供的作品、表演、录音录像制品中直接获得经济利益的，人民法院应当认定其对该网络用户侵害信息网络传播权的行为负有较高的注意义务”。有声书平台针对特定有声书进行收费应认定为从中直接获得了经济利益，因而需要承担较高的注意义务。对联合开发、出版的平台模式而言，有声书制作与出版涉及的权利主体、授权链条较为复杂，有声书平台亦应施以较高的注意义务。除此之外，根据《征求意见稿》，对由人工智能生成的有声书，制作者应对人工智能生成内容进行标识。从人工智能治理的角度来看，可以预测未来还会有更多的规范要求对人工智能生成的有声书进行标识，有声书平台应对该新型内容方式设立相应的注意与提示渠道，履行相关注意义务。

四、结语

媒介本质上是对人类文化与科技发展的反映，而版权制度自诞生之初就肩负着促进人类社会文化发展的重任。我国著作权法第一条即明确，“促进社会主义文化和科学事业的发展与繁荣”是著作权法的制定目的。因此，对有声书平台的规范治理，应以著作权法制度为核心，围绕权属分配、侵权遏止以及平台责任三个环节进行展开。从发展趋势来看，有声书这一媒介形式未来还可能进一步在人工智能技术的基础上进行媒体融合，并结合虚拟现实、大数据等技术发展出新的媒介形式，对此实务界可以在著作权制度体系下进行更加深入的探索。

［参考文献］

［1］AI创作时代来临！喜马拉雅出现由AI写作、AI演播的有声小说［EB/OL］.（2022-01-25）［2023-09-13］.https：//www.forbeschina.com/entrepreneur/59263.

［2］Audiobooks Market Size is expected to Reach at USD 33，538 Million by 2030，Registering a CAGR of 26.5%，Owing to Increasing Number of Younger and Adult Listeners ［EB/OL］.（2022-07-26）［2023-09-13］.https：//www.globenewswire.com/news-release/2022/07/26/2486464/0/en/html.

［3］王娟娟.我国有声书发展的现状、困境与破局［J］.科技与出版，2021（12）：63-67.

［4］冯晓青，胡梦云.技术变革与著作权法之间的关系：以法律史为基础的理论思考［J］.武陵学刊，2011（04）：79-88.

［5］王迁.知识产权法教程［M］.7版.北京：中国人民大学出版社，2021.

［6］刘强，彭南勇.人工智能作品著作权问题研究［J］.南京理工大学学报（社会科学版），2018（02）：35-43.

［7］盧海君.著作权法意义上的“作品”：以人工智能生成物为切入点［J］.求索，2019（06）：74-81.

［8］王迁.ChatGPT生成的内容受著作权法保护吗？［J］.探索与争鸣，2023（03）：17-20.

［9］王璐.我国著作权法“表演者”概念之厘清：以法学方法论为视角［J］.电子知识产权，2021（09）：26-33.

［10］郝明英.人工智能语音合成有声书著作权保护研究［J］.中国出版，2023（01）：55-59.

［11］王迁.论版权“间接侵权”及其规则的法定化［J］.法学，2005（12）：66-74.

［12］焦娅菲.算法推荐模式下网络平台著作权侵权责任认定研究［J］.科技与创新，2023（S1）：145-160.

［13］王欣辰.人工智能如何用于在线内容审核：Ofcom报告评述［EB/OL］.（2023-06-01）［2023-09-13］.https：//mp.weixin.qq.com/s/jFsrOMmWAuEScitDNU5YeQ.

［14］薛婳.网络服务提供者著作权间接侵权的差异与趋同：以中美两国的比较为基础［J］.私法，2022（04）：131-160.

［15］中国有声读物市场发展态势分析与投资战略调研报告（2023—2030年）［EB/OL］.［2023-09-13］.https：//www.chinabaogao.com/baogao/202202/572661.html.