□文│张媛媛
智能媒体时代,信息的生产与传播呈现出自动化、智能化与去人化特征。在内容生成上,人工智能技术的应用使得信息产出不再高度依赖人工参与。腾讯公司开发的新闻写作软件已能够自动生成新闻稿件,实现“一分钟推送”。[1]在内容传播上,算法推荐通过内容加签和用户画像技术,实现了基于用户偏好的精准推送,既降低了用户的信息搜索成本,也在很大程度上解决了互联网内容爆发带来的信息沉没问题。网络服务提供者借助算法进行的个性化推送,不仅能够提高用户对平台的黏性,同时也可提升信息分发的效率,因此算法推荐技术被互联网服务提供者广泛采用。据报道,利用算法进行的内容推送已占据互联网内容分发的70%左右。[2]
与此相伴的版权风险同样不容忽视——当算法推荐的内容为未经许可在网络中传播的作品时,网络服务提供者是否需要对由此而生的版权侵权承担责任时常成为纷争的焦点。在爱奇艺诉今日头条案中,爱奇艺享有热播影视剧《延禧攻略》的信息网络传播权,今日头条的用户未经许可上传了大量影视剧片段,爱奇艺认为今日头条利用算法推荐技术扩大了侵权作品的传播范围,应对本案中的版权侵权承担相应的责任。[3]该案折射出的主要争点为:算法推荐服务提供者是否应因技术提供而在版权侵权中承担责任,是否会因技术应用提高注意义务。在算法推荐技术广泛运用的智能媒体时代,上述问题的回答对算法推荐平台的行为边界及产业发展有重要影响,因此有必要基于推荐技术原理进行符合立法目的与基本原理的规范解释。
算法推荐的基本原理为通过数学算法,推测出用户感兴趣的内容并进行个性化推送。算法推荐与传统人工编辑推荐的区别之处在于推荐的自动化,整个过程不存在人工干预。但多有观点认为,技术中立不等于行为中立。算法推荐服务提供者在版权侵权中的主观状态及注意义务标准目前还存有争议。
由于算法本质上是客观的代码化计算方法,[4]在满足推荐条件时就会将内容自动推送给用户,在此过程中,不需人工对内容进行编辑审核,平台也无从知晓被推送的具体内容并对是否存在版权侵权作出判定。因此,有观点认为,基于算法进行的内容推送,与传统的出版编辑存在本质不同。算法平台既不生产内容也不对内容进行编辑与推选,不存在基于平台意志的主动推送行为。因此,算法推荐技术的应用不应成为网络平台注意义务提高的缘由,算法的中立性与无价值性也不会使平台在版权侵权中承担帮助侵权的责任。[5]也有观点指出,算法推荐的指标是量化、客观的,其运行过程不受人工干预,推送内容是用户以行为参与模型构建的结果呈现,且此种推送具有个性化,不同于一般网络服务提供者面向所有用户进行的内容编辑和统一推送。因此,算法推荐中不存在网络服务提供者的主动行为。基于技术中立原则,算法推荐技术的采用不应直接导致网络服务提供者的归责。[6]
与算法推荐中立论相对立的观点认为,算法推荐与人工推荐具有相同性质,平台应当因推荐算法的应用承担较高的注意义务。与传统的网络接入、搜索链接和信息存储服务由用户选择的被动性不同,算法推荐具有主动性。算法的应用使得信息的传播范围无限扩大,增加了网络用户获得侵权作品的概率。网络服务提供者主动利用算法推荐的行为提高了侵权作品的传播风险,因此应当负有较“一般理性人”更高的“专业人员”注意义务。[7]从技术上看,算法可以实现内容识别;从服务性质上看,算法平台已经脱离传统网络服务提供者被动提供服务的定位,实现了以平台为中心对用户与内容的双重管理;从服务效果上看,平台通过使用算法推荐获得了利益,基于权责一致的基本要求,应当对其所能管理的网络空间中的版权侵权实施控制。因此,利用算法进行推荐的网络服务提供者应当对版权侵权负较高的注意义务。[8]
著作权法理论中存在着直接侵权与间接侵权的区分。[9]未经许可实施受版权人专有权利控制的行为构成直接侵权;引诱、教唆或者帮助他人“直接侵权”,本身没有直接实施侵权行为,则构成“间接侵权”。间接侵权的认定以行为人具有主观过错和直接侵权成立为前提。[10]网络服务提供者利用算法对用户显现或可能的喜好进行发掘,并据此向其推送消息。算法本身并未改变内容在互联网中的传播状态,换言之,算法只能对已经存在于互联网中的内容进行指引式呈现,不会导致本不存在于互联网的内容在网络中的公开。因此,就平台的算法利用行为而言,其没有向公众提供内容,这种信息推荐行为不会使服务提供者承担直接侵权责任。若认定算法推荐服务提供者构成间接侵权,须证明其存在主观上的故意。
虽然算法推荐可能会增加侵权作品的曝光概率,但不能据此认为提供算法推荐服务的网络平台存在帮助侵权作品传播的主观故意。美国法院在“索尼案”中确定了“实质性非侵权用途”原则,即如果产品具有实质性非侵权用途,即使提供者知晓其可能被用于非法用途,也不能据此认为提供产品的行为构成帮助侵权。[11]例如,计算机生产者知晓其产品可能被用户作为传播盗版音乐或电影作品的工具,也不能据此认为生产和销售计算机的行为构成对特定版权侵权行为的帮助。原因在于,当产品并非仅具有侵权用途时,其在流通过程中如何使用超出了提供者的控制范围,且产品被如何使用,是社会工具利用能力等多重因素影响的结果。某一产品在问世时可能被大量作为侵权之用,随着社会管理水平的提高,转而被广泛用于正当用途。因此,不能因为提供者概括知晓产品可能被用作侵权而认定其对特定侵权行为具有帮助侵权的主观故意。
在没有人工干预的情况下,算法对用户数据形象的构建是客观的,内容推送也是因为参数耦合触发推荐机制的结果,在自动分析、自动识别、自动推送的过程中,算法推荐服务提供者无法对内容是否侵犯版权作出判断。此外,算法推荐的功能在于用户兴趣与内容的匹配与推送,在此过程中,推送的信息既可能是经授权在网络中传播的,也可能是违法传播的侵权作品,只要推荐服务提供者未在程序设计中加入对特定盗版网站的搜索指令,就不能认为推荐服务提供者具有帮助侵权作品传播的主观故意。算法在内容推荐中的应用可以有效地降低用户的信息搜寻成本,解决互联网内容过载带来的信息浪费问题。由于算法推荐技术在提高互联网内容传播效率中的重要作用,因技术应用而提高网络平台的注意义务并不合乎法目的,否则将会出现技术越先进、责任越重、运行成本越高的悖论。[12]因此,应当坚持算法推荐技术中立原则,不因推荐技术的应用而认为服务提供者存在帮助侵权作品传播的主观故意;网络平台注意义务的设定应当与其技术能力与信息管理能力相匹配,不因推荐技术的应用而有所提高。
算法推荐过程中,信息匹配与内容推送由系统自动完成,人工难以对推荐内容实施控制,但这并不意味着平台能够以算法推荐的自动性在所有的版权侵权中主张免除责任。《民法典》规定,网络服务提供者知道或应当知道用户利用其提供的服务侵害他人民事权益而未采取必要措施的,需要与网络用户承担连带责任。[13]“知道”作为被证明了的主观故意,“应当知道”则是“应知而未知”,[14]属于对侵权信息未尽注意义务的主观过失。网络服务提供者类型及其所采用的算法推荐技术的不同,会使平台在算法利用过程中承担不同的注意义务。若未尽与其服务类型及技术能力相应的注意义务,在版权侵权中仍可能被认为具有过错,进而承担版权侵权责任。
由于算法推荐指向内容推送,推送方式分为提供链接和对网站中的内容进行直接呈现,因此,利用算法推荐技术的网络服务提供者往往同时也为内容提供者、信息存储空间服务提供者或链接服务提供者。如果侵权内容由网络平台自己提供,无论使用何种推荐技术,都无法改变其内容提供者的身份,并须承担版权直接侵权的责任。若侵权内容由用户上传,平台仅提供信息存储空间,是否就可依据其中立的服务提供者身份主张不具有对侵权信息的发现能力?
虽然在我国网络服务提供者不承担对用户版权侵权行为的事前主动审查义务,[15]但并不意味着信息存储空间服务提供者没有机会发现明显版权侵权事实的存在。根据《互联网信息服务管理办法》的规定,通过互联网向上网用户提供信息服务的经营者,不得制作或传播危害国家安全、民族团结、社会稳定的内容以及有关暴力色情的信息。[16]因此,向用户提供信息存储空间的服务提供者,如短视频平台等,都需要设专任审核人员对用户上传内容的合法性进行审查,通过审核后方能在平台传播。[17]由行业协会制定的《网络视听节目内容审核通则》与《网络短视频内容审核标准细则》也对审核内容进行了细化。审核制度的存在,使得网络服务提供者能够对用户上传内容事前进行了解并采取干预措施。虽然审核的目的在于发现危害国家安全和有悖公序良俗的内容,并不要求平台识别其中存在的版权侵权风险,但审核程序的存在使平台能够尽一般理性人的注意发现其中明显的版权侵权内容。此种注意义务并不来源于算法推荐的使用,而是基于平台信息存储空间提供者的服务类型,在前置的内容审核环节因人工介入引发的一般注意义务。
版权侵权行为发现的难易程度与作品类型也有着密切的关系。文字作品与美术作品的创作行为较为普遍,创作主体既可能是普通用户,也可能是专业机构。审核人员在尽一般注意义务的情况下,仅依据内容与署名难以对版权归属作出判断。因此,在美术与文字类作品的版权侵权中,不宜因审核程序的存在而认为网络服务提供者对侵权作品的传播具有主观过错。而对音乐录制品及影视剧作品来说,制作者与版权人通常为专业的唱片公司与影视公司,当个人用户上传数字格式的音乐录制品、完整的影视剧或者片段时,通过账号信息与上传内容的简单对比,就可产生作品侵权的合理怀疑。在未加任何编辑的情况下,个人用户上传完整的音乐录制品及影视作品或片段,属于明显的版权侵权信息,应当引起审核人员的注意,否则会因未尽一般注意义务而与用户承担版权侵权的连带责任。
算法推荐的依据是用户偏好,而对用户偏好的刻画离不开用户信息的提取。一般来说,算法会从三个维度提取信息进行分析。一类是用户的基本信息,如年龄、职业等;一类是用户的行为信息,如用户的浏览历史、点赞、收藏内容的记录;一类为环境信息,如当前所处地点等。基于这些信息,算法推荐的依据大致可分两种:一是基于用户的个性特征进行的差异化推送,二是基于所处的时空环境进行的同质推送。
基于用户个性化信息进行的推送,是系统对用户个人基本信息以及行为信息进行分析后,对用户感兴趣的内容作出排列并进行实时推荐,因此不同用户界面呈现的内容也不相同,最终实现“千人千面”的信息流推送效果。根据司法解释的规定,当网络服务提供者主动对作品进行修改、编辑、推荐时,应当结合具体情况认定其是否应当知道存在版权侵权的风险。[18]作此规定的原因在于,当网络服务提供者主动对作品进行编辑或推荐时,对内容的接触增加了版权侵权发现的机会而使其负有与出版者类似的侵权防免义务。算法推荐不同于司法解释中所称的推荐行为。一方面算法推荐由系统自动计算并触发推荐程序,在此过程中不存在人工接触与发现侵权内容的机会;另一方面,人工主动推荐的结果是内容在平台中以显著方式呈现,任何人进入网站就可无差别地在明显的位置接触到作品,这种统一且显性的作品呈现方式也会增加对版权侵权的发现概率。而算法推荐的效果是千人千面,不存在固定的页面与固定的内容,因此不能认为算法推荐属于司法解释中网络服务提供者对内容的推荐行为,进而推定其应当知道推荐内容中存在明显的版权侵权信息。[19]
若基于共同所处的时空环境信息推送的内容涉及版权侵权,则应当根据侵权信息的明显程度来对推荐服务提供者是否应当知道侵权行为的存在作出认定。与基于用户信息进行的个性化推送不同,当算法根据公众共同所处的环境信息进行推送时,用户在既定时段登录网站页面将会接收到相同的内容。如在五一劳动节所有用户都可接收到与节日有关的视频或文章,这种推送的效果类似于在网站显著位置向用户提供特定的内容。如果短视频网站在五一劳动节置顶推荐的内容为电视台采访节目的片段,但上传者信息却显示为个人用户,根据常理,采访节目的版权通常由电视台享有,不会许可个人用户进行使用。这种明显侵权信息的存在会引发算法推荐服务提供者的注意义务。
系统进行个性化推送时采用的推荐方法主要有两种:一种是基于内容的推荐,即通过提取内容的标题、类别、标签、用户评论等信息,根据用户浏览历史的分析向其推荐相似的内容。[20]另外一种是基于协同过滤的推荐,分为基于用户的协同过滤与基于内容的协同过滤。前者的推送原理为通过用户的点击行为,将具有相似偏好的用户进行分类。在同类用户点击某一内容时,基于用户偏好的相似性向其他用户推荐同一内容。后者则是通过对内容的分类,根据用户浏览历史向其推荐相似内容。[21]
若平台基于用户协同过滤机制进行推荐,根据用户的点击历史对具有相同兴趣的用户进行分组,之后再将同一群组用户浏览的内容推送给其他用户,从技术角度观之不涉及对推荐内容的甄别,也无从发现侵权内容的存在。但若平台通过内容分析进行推荐时,就必须利用有关技术提取内容的标题、标签、评论等信息,通过关键词组合勾画内容所涉主题,而此技术同样可以实现对明显版权侵权的发现。发现的途径既可以是权利人发送的侵权通知,也可以来自行政部门或行业组织发布的作品保护信息。例如,国家版权局发布的重点作品版权保护名单中包含了某部热播电视剧,平台在基于内容分析进行算法推荐时,提取到有关内容的标题为“某剧完整版”,此种表述即为版权侵权的明显信息。既然基于内容分析的算法推荐在技术上可以实现对标题、标签、评论等关键信息的提取,同样的技术也可以用于对明显版权信息的发现且不会增加网络服务提供者的技术成本,算法推荐服务提供者就应当在其能力范围内通过关键词过滤,避免对明显侵权内容的推荐。
如上文所述,利用算法进行推荐的平台一般兼具链接服务或存储空间服务提供者的身份,权利人在发现版权侵权信息后可以向其发送通知要求移除链接或删除侵权内容。在用户创造内容成为互联网平台核心元素的今天,[22]用户每天都上传无数的文学艺术作品,[23]互联网巨大的信息体量中包含着海量的版权侵权内容。据谷歌统计,截至2022年5月6日,其收到的移除网址通知的数量约为57亿。[24]在此情形下,经算法推荐的侵权作品的传播范围也会进一步扩大。欲形成良好的作品传播生态,降低技术应用的负面效应,需要算法推荐服务提供者超越法定义务,构建从前端内容控制到末端用户监督的多元版权治理体系,降低推荐技术应用带来的版权风险放大效应。
当平台以链接的方式向用户提供内容来源的网络地址时,确实无法实现对推荐内容的选择与鉴别。例如对提供作品链接的新闻聚合平台而言,即使链接指向的内容构成版权侵权,聚合平台也不会因此而承担侵权责任。一方面,平台并非作品的传播者,其并未实施将作品通过网络向公众提供的行为,不构成对作品信息网络传播权的侵犯;另一方面,平台在信息推送中没有施加人工干预,无从事前知晓侵权信息的存在,不构成帮助侵权。当权利人发现链接指向的内容构成版权侵权时,可以向链接提供者发出侵权通知,平台在接到合格通知后采取断开链接等措施即可避免承担事后知晓的帮助侵权责任。
“通知—移除”规则作为链接服务提供者的责任阻断机制,虽然提供了网络服务提供者版权侵权责任认定的明确标准,但并没有为网络空间作品传播生态形成正向的制度引导。在侵权内容的链接被移除之后,用户往往会将内容再次上传,形成通知—删除—再上传—通知—删除的无限循环。美国作为“通知—移除”规则的来源国,其主要的内容产业从未对立法中的“避风港”规则表示过支持。[25]美国出版商协会在提交给版权局的关于《版权法》第512条避风港条款实施影响评估的调查通知中称,“权利人发送了数以百万计的通知,但这些通知对减少侵权材料的数量几乎没有任何影响”。[26]
大量侵权作品存在的后果即是巨量侵权通知的发送,网络服务提供者在核查通知适格性、采取移除措施、应对权利人的起诉中付出了巨大的时间与金钱成本。以提供链接的方式进行算法推荐的平台在运行中会面临同样的困境。若不加选择地以互联网中的所有内容作为推荐来源,平台生态将会进一步恶化。改善这一状况的措施之一即为限制算法推荐的内容来源,与拥有版权的内容平台进行合作,对链接指向的内容来源予以控制。该措施的采取能够从源头上保证作品的传播与利用秩序,对版权保护及平台有序运营形成良好的促进作用。
同时提供存储空间服务的算法推荐平台负有对用户上传内容安全性与合法性的审查义务。虽然审查的目的不在于对私权侵犯的发现,但人工介入环节的存在增加了明显侵权信息发现的概率。审查人员毕竟不是版权侵权判定的专业人士,基于审查程序的注意义务仅限于对明显侵权事实的发现。此外,这种注意义务还需要结合作品类型、作品的使用方式等作具体认定。比如用户并非原封不动地上传影视剧作品或其中的片段,而是加入了解说或其他内容,此时该视频片段属于合理使用还是构成对影视剧作品的侵权就不宜由审核人员进行判定。即使用户上传内容随后被认定侵犯版权,平台也不应因审核环节的存在而负相应的注意义务。
平台有限的侵权发现能力和注意义务决定了并非所有的侵权内容都可被准确滤除,因此,良好版权生态的构建还需要权利人与用户的共同参与。算法推荐服务提供者可以在作品初始推荐的环节,通过代码植入的方式,增加向相关群体推送的功能,以此来增加版权侵权信息的发现概率。例如,用户在今日头条中上传的内容会经历“冷启动”环节,为了提高新内容的曝光度,系统会增加对这些内容的分发权重,使其获得更多的关注。经历该环节之后,作品便进入正常的推荐程序。[27]在版权侵权信息发现方面,权利人较用户更为敏感。如果能在推荐程序中嵌入权利人名单,当初始推荐程序启动之后,加强对包括权利人在内的用户推送,就可在推荐程序启动的早期增加侵权发现的机会,降低侵权作品传播的概率。此外,用户作为最终的内容接收者,通过对内容的接触也可以直观地发现侵权行为的存在,故算法推荐服务者也应为用户提供通畅的投诉机制,构建起权利人与用户共同参与的版权治理体系。
“通知—删除”规则针对具体侵权行为的纠纷处理构造,不能为反复侵权用户的行为治理提供制度支持。用户行为的有效规制是减少版权侵权的根本措施,是良性运转的网络版权生态构造的起点。在实践中,网络服务提供者也通过与权利人合作,对用户行为管理进行了探索。例如,美国唱片业协会、美国电影协会与一些网络服务提供者签订了自愿谅解备忘录,创建了被称为“版权警报系统”的分级响应机制。[28]该警报系统的运行规则为:网络服务提供者在接到权利人的侵权通知后,会向上传侵权内容的用户发送警告。在第一次警告中,平台会告知用户行为违法,并会为其如何避免侵权和通过合法方式访问内容提供指导,如果用户继续利用账户从事违法活动,网络服务提供者将继续向其发送警告,并采取降低网速、暂停账户等措施。
提供信息存储空间的算法推荐服务提供者也可根据其技术能力构建针对反复侵权用户的分级管理体系。例如,对初次侵权的用户发送旨在提示教育的通知,对有过两次侵权历史记录的用户,减小其上传内容的推荐力度,而对长期利用平台服务从事侵权行为的用户采取封停账户等措施,以达致对版权侵权的有效治理。
注释:
[1]参见广东省深圳市南山区人民法院(2019)粤0305民初14010号民事判决书。
[2]70%网络信息内容由算法推荐[EB/OL].https://m.gmw.cn/baijia/2020-11/17/1301806457.html
[3][17][20][27]参见北京市海淀区人民法院(2018)京0108民初49421号民事判决书。
[4]吴汉东,李安.网络版权治理的算法技术与算法规则[J].网络法律评论,2020(23)
[5]刘文杰.算法推荐新闻的法律透视[J].新闻记者,2019(2)
[6][12]熊琦.“算法推送”与网络服务提供者共同侵权认定规则[J].中国应用法学,2020(4)
[7]李自柱.算法推荐下网络服务提供者侵犯著作权责任的判断[J].知产财经,2022(11)
[8]任安麒.网络服务平台算法推荐的著作权侵权认定规则[J/OL].北京航空航天大学学报(社会科学版):1-8[2022-04-19].DOI:10.13766/j.bhsk.1008-2204.2021.0801
[9]李明德,许超.著作权法(第2版)[M].北京:法律出版社,2009:23
[10]王迁.网络环境中的著作权保护研究[M].北京:法律出版社,2011:147-148
[11]Sony Corporation of America et al.v.Universal City Studios,Inc,.et al.464 U.S.417,449(1984)
[13]参见《中华人民共和国民法典》第一千一百九十七条:网络服务提供者知道或者应当知道网络用户利用其网络服务侵害他人民事权益,未采取必要措施的,与该网络用户承担连带责任。
[14]易健雄.从算法技术看网络服务提供者的“应当知道”——也谈《民法典》第1197条的适用[J].知识产权,2021(12)
[15]参见《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》(2020修正)第八条第二款。
[16]参见《互联网信息服务管理办法》第十五条。
[18]参见《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》(2020修正)第九条。
[19]参见北京知识产权法院(2020)京73民终2016号民事判决书。
[21]喻国明,韩婷.算法型信息分发:技术原理、机制创新与未来发展[J].新闻爱好者,2018(4)
[22]Senftleben,M..Institutionalized algorithmic enforcement the pros and cons of the eu approach to ugc platform liability[J].FIU Law Review,2020(2)
[23]Mind Blowing You Tube Facts,Figures and Statistics- 2022[EB/OL].https://toptennotch.com/youtube-statistics/
[24]Content Delistings Due to Copyright,GOOGLE: TRANSPARENCY REPORT[EB/OL].http://transparencyreport.google.com/copyright/overview
[25]Pamela Samuelson.Pushing Back on Stricter Copyright ISP Liability Rules[J].Michigan Technology Law Review,2021(2)
[26]United States Copyright Office.Section 512 of title 17—A report of the register of copyrights[R/OL].https://www.copyright.gov/policy/section512/section-512-full-report.pdf
[28]CNTR.FOR COPYRIGHT INFO.,Memorandum of Understanding (2011) (“CCI Memorandum of Understanding”) [EB/OL].https://www.musikindustrie.de/fileadmin/bvmi/upload/06_Publikationen/DMR/ifpi_digital-music-report-2011.pdf