邵天朗
(华东政法大学,上海 200042)
互联网技术的发展与普及带来了网络用户数量的增长,最新统计数据表明,我国网民规模已经达到9.89亿,互联网普及率达到70.4%;手机网民规模达到9.86亿,网民使用手机上网的比例达到99.7%[1]。网络用户数量的激增带来了信息的爆炸式增长,用户需求的多样化也对网络服务提供者提出了更高的要求。传统的人工手段既不能对网络上产生的海量信息进行分析与筛选,也不能满足不同网络用户之间高度个性化的内容需求,自动化的算法推送技术开始逐渐推广应用。算法的广泛应用一方面可以代替人工对海量数据进行自动筛选分类,有效提升信息分类检索的效率;另一方面可以通过对用户个人信息的抓取分析,精确捕捉其兴趣爱好并满足网络用户的个性化需求,增强用户黏性。但是,如果用户的偏好与特定受版权法保护的作品相关,那么互联网平台所应用的算法就可能将涉嫌版权侵权的内容推送给网络用户,从而产生间接侵权风险。人民网指出,包括今日头条等在内的智能信息平台,虽然拥有精密的算法和先进的数据抓取技术,却屡屡游走在法律的灰色地带①。
就目前在新闻聚合平台、短视频平台等广泛应用的算法推送技术而言,其在间接侵权主观过错认定中主要存在以下两个问题:首先,它在应用形式上与现行《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》第10条中“设置榜单、目录、索引、描述性段落、内容简介等方式进行推荐”的外观较为类似;其次,该技术的运用意味着网络服务提供者至少在一定程度上抓取了网络用户以及网络内容的相关特征信息,并对这部分信息进行了分析处理。相对应的两个争议焦点即:(1)以计算机程序为基础的算法推送技术是否等同于传统的人工推荐,应用该技术推荐侵权内容是否可以推定网络服务提供商对侵权行为存在应知的主观状态,进而认定间接侵权的构成;(2)算法推送技术是否等同于网络版权过滤技术,其广泛应用是否意味着网络服务提供商已经可以运用计算机技术对网络上流转的信息予以审查,拥有相比传统网络服务提供商更为强大的过滤审查能力,导致其应当对于通过算法推送的网络信息承担更为严格的注意义务。
网络服务提供者一般不直接上传、转载涉嫌侵权的网络内容,因而一般不构成直接侵权;而间接侵权的成立以主观过错为要件,因此,争议焦点即在于网络服务提供者对其网络平台上的直接侵权行为是否存在明知或应知。
首先,算法推送的应用不能直接推定构成主观过错中的明知。“明知”指网络服务提供者明确知晓相关网络用户实施了网络直接侵权行为,就目前的情况而言,明知的认定极为困难。在避风港原则免除了网络服务提供者一般审查义务的背景下,《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》仅规定了一种行为构成明知。只有在网络服务提供者接到权利人以法律规定的方式提交的通知及初步证据的情况下,法院才可以认定其构成主观过错中的明知;而对于热播影视作品的主题、内容主动进行推荐的,法院也仅认定其构成应知。尽管本文认为算法推送不同于该司法解释中的人工推荐行为,但即使将两种推荐方式等同看待,算法推送也不可能构成现行法意义上的明知。
在不能认定构成明知的前提下,主观过错的认定关键即在于应知的判断。将算法推送的技术原理与现有法律规定比较分析,本文认为算法推送技术既不等同于人工推荐,也不等同于版权过滤技术。该技术对侵权判定的影响,应当适用“实质性非侵权用途”规则,不能仅因为直接侵权人利用该技术导致了侵权结果,就推定网络服务提供者具有应知的主观状态。
根据2020年《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》,网络服务提供者对热播影视作品等以设置榜单、目录、索引、描述性段落、内容简介等方式进行推荐,且公众可以在其网页上直接以下载、浏览或者其他方式获得的,可以认定其应知网络用户侵害信息网络传播权。有观点认为,算法虽然在运行时没有人工干预,但算法本身由人工设计,按照人的意志运行,算法仅是网络服务提供者代替人力的工具,因此,机器推荐与管理员推荐并无差别②。但将两者比较分析可以发现,算法推送与现行法中的人工推荐存在本质上的区别。
1.推送算法并不实质性接触网络信息
运用算法推送的网络服务提供者,对网络内容的接触程度与对推送结果的控制程度远低于人工推荐,不足以直接构成人工推荐行为中的应知。首先,对于算法运行过程中产生的数据信息,网络服务提供者并不直接接触。在人工推荐过程中,从数据的收集、分析与筛选,再到最终的推送结果全过程,网络服务提供者必须直接接触网络内容本身,对其始终保持明确的知晓状态;而推送算法在数据的收集、分析以及最终的推送结果输出全过程中,始终以预先设定的程序为基础,以技术代替人力,网络服务提供者不直接接触网络内容本身。推送算法被广泛运用的出发点即在于网络信息浩如烟海,用户需求千变万化,人力分析信息数据并给出个性化推送完全不具备现实可行性,网络服务提供者只能借助于计算机完成信息处理的工作。在这种前提下,将算法对信息的“应知”直接等同于网络服务提供者对信息的“应知”完全背离了推送算法技术应用的背景与初衷。其次,传统人工推荐可以直接控制、选择最终的推荐结果;而对于算法推送最终产生的输出结果,网络服务提供者仅能通过算法设计间接影响,不能直接选择,不具备直接的控制力。毫无疑问,如果网络服务提供者修改算法程序中收集的数据类型、变更数据在推送中的权重占比,算法最终的推送结果必然会有所不同,但由于该推荐结果的运行输出过程完全由计算机完成,网络服务提供者并不能通过对初始程序进行指定的变更,以选择指定的内容进行推荐,不能认为其对推送结果具备与人工推荐等同的直接控制能力。因此,不能将算法推送对推荐结果的选择与人工推荐对推荐结果的控制等同对待。
2.推送算法是双向选择而非单向推送
算法推送实际上是双向行为,推送内容一方面取决于算法的程序代码,另一方面更取决于网络用户本身的行为模式。传统的人工推荐在网络服务提供者对热门作品的过程中,对作品内容的接触获取、分析到最终的推送,全过程仅由服务提供者本身完成,其直接目的就在于通过热门资源吸引流量,网络用户对推荐结果没有任何干预和影响。但与人工推荐不同,在算法推送的过程中,网络服务提供者仅提供已经预先设定完成的程序与算法,而无论是基于内容的推送还是基于协同的推送,算法一般情况下并不分析作品本身的实质性内容。算法推送实际上依赖的作品信息主要包括点击率、评论、点赞、转发等,依赖的用户信息主要包括个人偏好、浏览历史等,所有以上数据实际上均来源于网络用户本身。如果用户不向网络服务提供商提供任何相关数据,算法就无法根据用户的偏好给出合适的推送结果。算法推送并非网络服务提供者单方需求的技术工具,其技术功能与搜索引擎类似,是海量网络信息与网络用户之间沟通的桥梁。在对推送结果的影响程度上,网络用户的主观能动性并不低于网络服务提供者。算法推送的网络内容,实际上是以用户自己的行为作为基础,由网络服务提供商加以分析,最终“善解人意”地推送给网络用户。
综上所述,一方面,在对算法推送技术的应用过程中,网络服务提供者既没有对具体推荐内容产生实质性接触,也不能直接控制算法推送的特定结果;另一方面,算法推送实际上是网络平台与网络用户的双向行为,推送结果既包含算法程序的倾向,也包含网络用户的个性化选择。因此,算法推送不应当被认定为网络服务提供者“借算法之手”实施的人工推荐行为。
算法推送技术的应用对注意义务的影响,核心就在于信息管理能力的认定。如果网络服务提供者可以设计算法对信息进行收集与处理,是否意味着可以利用同等的技术完成对网络侵权内容的审查?本文认为,无论是对算法推送技术本身进行分析,还是将算法推送技术与类似技术进行比较,都可以得出相应结论:算法推送技术并不等同于版权过滤技术,该技术的广泛应用不能直接推断出网络服务提供者版权过滤能力的提升及相应注意义务的提高。
1.算法推送技术不等同于版权审查技术
有观点认为,算法推送和算法过滤在本质上是相同的,都是运用算法由机器完成对内容的筛选[2],但本文认为这两种技术在对内容的接触程度上存在实质性差别。算法推送技术的目的在于根据用户的历史行为,推送特定网络信息,满足用户的个性化需求;而版权审查技术的目的在于从海量网络信息中筛选出侵权内容,预防侵权后果的发生或损失的扩大,保障权利人经济利益。由于两种不同的技术应用目的不同,它们对网络信息的选择与处理方式也完全不同。
目前的算法推送技术主要包括基于内容的算法推送以及基于协同的算法推送,后者运用更为广泛;但无论是哪种推送技术,算法均不对网络内容予以实质性审查。基于内容的推送算法会通过信息过滤手段进行筛选,获取该特定内容的特征信息和描述信息,通过各种方法对该特定内容的特征属性进行定义,类似于现实中的记号与标签。它侧重于对信息有限特征的识别与抓取,包括标题、评论、作品类别等;至于该信息的实质性内容,算法并不予以考虑。而基于协同的推送算法则更进一步,根本不关注网络用户本身的信息特征或是网络内容本身的信息特征,而是通过对网络用户历史行为的相似度进行分析,找到兴趣偏好类似的用户群体,然后依据其中部分用户对既有网络内容的评价,向其他类似用户进行内容推荐[3]。实际上,算法推送技术根本不会对网络信息的具体实质性内容进行分析,自然也就无法进一步判断用户上传内容是否存在侵权可能。
目前的互联网侵权数量庞大,人工审查涉嫌侵权内容的成本无论对权利人还是网络服务提供者均难以承受;而版权内容过滤技术的日渐成熟,为网络版权保护提供了全新的解决方案[4]。但是,如果想要判断特定网络内容是否涉嫌著作权侵权,版权过滤技术需要综合运用文字分析、图像处理、机器学习等相关技术,对网络信息本身进行实质性的审查分析。在版权过滤技术的运用中,网络服务提供者往往会事先建立正版作品数据库,在用户上传相关内容时,网络服务提供者通过技术措施扫描上传内容,并将其与正版作品数据库加以比对,确定是否含有正版作品数据库中的内容。无论是对原有作品内容的录入、对上传内容的分析还是对两者之间的比较,版权过滤技术的运用,必须以对网络信息的实质性审查为前提;仅凭借算法推送所应用标题、作品分类等标签化信息,网络服务提供者完全无法将上传内容与在先作品进行实质性比较并得出是否侵权的判断结论。
综上所述,无论是基于内容的推荐还是基于协同的推荐,算法并不抓取或审查上传材料的实质性内容;而版权过滤技术的运用,必须以对网络内容的实质性审查为前提,否则无法进行内容比对。在对网络信息的接触、识别与分析上,算法推送技术与版权过滤技术完全不同,推送算法的广泛应用不能等同于网络服务提供者版权过滤能力的提升。
2.算法推送技术实质近似信息检索技术
从技术比较角度分析,算法推送技术更接近于信息检索技术而非信息过滤技术。“推送”这一用词的日常语义给旁观者造成了极大的误导,似乎算法给出的特定内容是由网络服务提供者单方面的选择,但实际情况并非如此,推送的结果选择实际上来源于用户。信息的筛选既是网络平台的需求也是网络用户的需求,算法推送与信息检索一样,是数据与用户之间沟通的渠道。
将算法推送技术与信息检索技术相类比,可以发现两者的运行模式极为类似,都是帮助用户筛选获取特定信息的方式。两者的主要不同点在于网络用户一侧提供检索关键词的主动性:在信息检索技术中,搜索引擎需要网络用户给出明确的检索关键词,然后结合其数据库中已有的信息检索,提供相对精准的搜索结果;而在算法推送技术中,网络平台主动收集用户已有的行为模式与个性化特征,然后结合其数据库中已有的信息检索,提供相对模糊的推荐结果。实质上,算法推送就是将网络用户过往的行为模式转化为了潜在的搜索关键词,主动帮助用户在数据库中检索,选取可能满足用户兴趣和需求的信息进行推送。
而在网络服务提供者一侧,无论是算法推送技术还是信息检索技术,两者对网络数据的版权过滤能力并无实质性差别。认为网络平台对算法推送技术的应用意味着版权过滤能力的提高,推送结果包含侵权内容即可推定平台构成应知的主观状态,实际上就等同于认为搜索引擎平台对其数据库的版权过滤能力应当同等提高,检索结果包含侵权内容即可认定平台构成应知的主观状态。按照这种逻辑,一旦搜索引擎的搜索结果中出现涉嫌著作权侵权的内容,法院就可以直接推定搜索引擎服务商存在主观过错、构成间接侵权,这显然不符合当前的立法及司法实践。因此,认为算法推送技术的运用意味着版权过滤能力的提高,进而导致注意义务的提高这一观点并不成立。
“实质性非侵权用途”规则并不是绝对的免责事由,不是指任何利用该技术的行为都不能认定构成侵权,而是指当技术具有实质性非侵权用途时,不能仅因为直接侵权人利用该技术导致了侵权结果,就推定行为人提供该技术的行为本身具有主观过错,应当承担间接侵权责任[5]。
网络服务提供者设计了推送算法,但提供技术这一行为本身并不能推定主观过错的存在,只有在有证据证明网络服务提供者的算法实质性增加了侵权风险的前提下,才能认定间接侵权责任的承担。推送算法对于数据收集、数据权重的选择毫无疑问存在价值判断与价值倾向,这种价值倾向可能来自于开发者在设计之初写入的逻辑判断,也可能来自于后续自发运行中产生的演绎结果,这种价值倾向毫无疑问可能产生潜在的负面影响[6]。但就目前行业广泛运用的推送算法来看,并无任何实证数据表明运用推送算法的平台在版权侵权的可能性上高于一般平台。也没有证据表明,在其他特征相近的情况下,算法更倾向于推送涉嫌侵权的内容而非合法内容。推送算法的固有功能是针对用户的兴趣爱好,收集相应信息,给出更加准确的个性化推送,提高用户黏性。而在对作品进行自动化筛选推送的过程中,虽然推送算法可能给出涉嫌侵权的推送结果,但目前并无事实证明这些算法对合法内容以及侵权内容之间进行区别对待。涉嫌构成直接侵权的网络内容与合法内容相比,并不会在算法中获得更高的推送优先级。
如果算法中人为可控的部分不合理地增加了推送侵权内容的可能性,那么法院可以结合其他相关事实,进一步去判断网络服务提供者对此风险是否存在应知的主观状态;但在不能证明现有推送算法的数据选择、数据分析、权重配比等实质上增加了推送侵权内容可能性的情况下,算法相对其他商业模式并没有创设更高的侵权风险,自然不应当承担更沉重的注意义务;仅应用算法推送侵权内容这一事实,不能直接推定网络服务提供者主观过错的存在。
虽然本文认为仅算法推送侵权内容这一事实,不足以直接推定网络服务提供者存在主观过错并构成间接侵权,但“实质性非侵权用途”规则并不是绝对的免责事由。一方面,运用算法推送技术的网络服务提供者应当承担与其他网络服务提供者相一致的注意义务;另一方面,运用算法推送技术的网络服务提供者还应当承担针对算法本身的监管义务。
首先,运用算法推送技术的网络服务提供者应当承担与其他一般网络服务提供者相同的注意义务。在现有互联网技术快速发展的背景下,司法实践以及行政执法已经不再拘泥于传统的“通知—删除”规则,转向侵权责任法中通用的过错责任原则[7],逐渐提高网络服务提供者对网络侵权内容的注意义务要求。
在行政执法中,2015年国家版权局《关于规范网盘服务版权秩序的通知》认为,网盘服务商应当运用有效技术措施,主动屏蔽、移除侵权作品;国家版权局在2016年《关于加强网络文学作品版权管理的通知》中重申上述要求,同时指出网络服务商应当依法履行传播文学作品的版权审查和注意义务;国家版权局等部门针对网络盗版侵权问题,自2005年起开展“剑网行动”共16次,最近的2020年“剑网行动”重点打击短视频侵权盗版等行为;2014年起至今,国家版权局每年公布多批重点作品版权保护预警名单,要求网络存储服务提供商禁止用户上传相关作品,并要求提供链接的相关网络服务商加快处理侵权通知并删除侵权内容。
在司法实践中,法院也将其他考量因素纳入主观过错的认定之中。在北京中青文文化传媒有限公司诉北京百度网讯科技有限公司侵害作品信息网络传播权纠纷案中③,法院考虑到侵权文档数量、先前相关诉讼、信息管理能力等因素,认定即使百度公司没有事先审查义务,仍然应当采取合理、有效的技术措施以发现网络用户侵害信息网络传播权的行为。在北京搜狐新媒体信息技术有限公司诉上海全土豆网络科技有限公司案中④,法院认为被告作为理性专业的视频分享网站经营者,理应知晓权利人一般不会将作品免费分享,网络用户上传的可免费观看的电影存在极高的侵权风险,但其并未采取有效措施,未能尽到相应的注意义务,最终认定被告具有主观过错。在韩寒诉北京百度网讯科技有限公司侵害著作权纠纷案中,百度公司说明其在人工审核之外另有反盗版系统,在将正版作品纳入正版资源库的情况下可以对涉嫌侵权的文档自动删除⑤。
因此,应用算法推送技术的网络服务提供者应当与其他网络服务提供者一样,对用户上传内容承担侵权责任法上的注意义务。如果存在重复侵权、行政机关“预警名单”等其他事由,网络服务提供者理应对特定作品施加更高的注意义务。如果网络服务提供者没有相应采取合理、必要的防止侵权的措施,无需通知程序,法院即可直接认定其主观上具有过错,承担间接侵权责任[8]。
虽然仅算法推送侵权内容这一事实,不足以直接推定网络服务提供者存在主观过错并构成间接侵权,但如果网络服务提供者设计的算法实质上增加了侵权风险,并对该风险的不当增加存在过错,其应当承担相应的间接侵权责任。在北京淘友天下技术有限公司等与北京微梦创科网络技术有限公司不正当竞争纠纷上诉案中,法院指出,对互联网中利用新技术或新商业模式的行为,应首先推定其具有正当性,而不正当性需要证据加以证明⑥,但现有事实表明,推送算法本身的确存在不当增加侵权风险的可能。例如,近期复旦大学孙金云教授团队发布的“2020打车报告”,通过长期的实证研究得出结论:网络打车平台凭借其垄断地位收集并积累了大量用户数据,利用信息不对称以及算法技术实行价格歧视,以实现其收益最大化的目的⑦。这说明,网络服务提供者有能力影响算法的设计,并利用该设计不合理地增加推荐侵权作品的可能性,以谋取不正当经济利益。因此,网络服务提供者有义务对其应用的算法本身进行监管,避免侵权风险的不当增加进而造成著作权人的经济损失。
一方面,网络服务提供者应承担消极义务,不得故意设计算法增加著作权侵权风险。虽然由于算法推送技术本身的特性,网络服务提供者一般情况下既不直接接触算法运算过程中的数据,也不能直接控制算法输出的特定结果,但网络服务提供商依然可以通过对算法中数据权重的选择,对结果产生影响。相比较不构成著作权侵权的用户生成内容,完整的受版权保护的内容通常形式完整、质量稳定、制作优良,因此也往往更容易吸引用户浏览。而通过对相关网络信息特征的筛选与识别,甚至加入推送算法本不需要的对网络内容的实质性接触,网络服务提供者有能力故意增加推送侵权内容的可能性,以增加网站浏览量,获取不正当的经济利益。因此,网络服务提供商在设计算法时不应当加入可能实质性增加侵权风险的要素,否则应当承担网络著作权间接侵权责任。
另一方面,网络服务提供者应承担积极义务,合理规避算法自发演绎而造成的潜在侵权风险。算法推送的目的在于根据用户的历史行为推送特定网络信息,满足用户的个性化需求,利用热门资源吸引用户流量。即使算法的设计并未故意增加侵权作品的推送可能性,版权作品由于其相对稳定的质量,本身也更容易获得用户的点击浏览。如果算法在长期运行的过程中,自发性地增加了对侵权内容的推送,网络服务提供者有义务采取修正算法或其他合理措施,以避免对著作权人利益的进一步侵害。如果著作权人能够证明网络服务提供者明知或应知算法不当增加了侵权可能性但是采取放任的态度,网络服务提供者应当承担相应的法律责任。网络服务提供者利用了算法技术超越人力的数据处理能力,获得了一定的经济利益,自然应当承担相应的监管责任。
本文认为,仅算法推送技术推送侵权内容这一事实,不能推定网络服务提供者主观过错的存在。一方面,算法推送与传统推荐不同,推送结果同时受到算法及用户的影响,网络平台并不实质性接触网络信息,不能直接推定网络服务提供者具有应知的主观状态;另一方面,算法推送技术与审查过滤技术并不等同,其原理更接近信息检索技术,算法推送的广泛应用不等同于版权过滤能力的提高。在没有依据证明推送算法实质性增加推送侵权内容可能性的情况下,应当遵循“实质性非侵权用途”规则。只有网络服务提供商在算法推送之外没有履行侵权责任法普遍上的注意义务,或者操纵算法本身不当增加侵权风险并获取相应经济利益,法院才可以结合具体事实认定其存在主观过错。
有学者指出,大量的阶段性多发的短期行为应当交由司法解决,不需要或者不太可能在法律中进行类型化,法律只应当规定具有稳定性和长期性的内容[9]。网络间接侵权认定中的避风港原则完全依赖于当时的网络技术环境,将本应交由司法认定的网络技术水平这一个案事实成文法化。互联网环境下,包括算法推送在内的新计算机技术以及相应产生的商业模式层出不穷,我国不应当拘泥于传统立法形式确定的责任分配,而应当赋予法院合理的自由裁量权,避免立法对新技术一刀切式的规定,损害行业新兴模式发展。
注释:
① 人民网三评算法推送:警惕算法走向创新的反面,载人民网2017年9月20日,http://opinion.people.com.cn/n1/2017/0920/c1003-29545718.html。
② 高艳东.“算法推送”不能免除服务平台之注意义务,载微信公众号“知产力”,2020年5月19日,https://mp.weixin.qq.com/s/BjSjdyD8zfuDS2Idb9oO1A。
③ 北京中青文文化传媒有限公司诉北京百度网讯科技有限公司案,北京市高级人民法院(2016)京民终248号。
④ 北京搜狐新媒体信息技术有限公司诉上海全土豆网络科技有限公司案,上海市第一中级人民法院(2010)沪一中民五(知)终字第130号。
⑤ 韩寒诉北京百度网讯科技有限公司案,北京市海淀区人民法院(2012)海民初字第5558号。
⑥ 北京淘友天下技术有限公司等与北京微梦创科网络技术有限公司案,北京知识产权法法院(2016)京73民终588号民事判决书。
⑦ 疯狂教授带队打了800多趟车,发现了什么秘密?载微信公众号“老孙漫话”,2021年2月17日,https://mp.weixin.qq.com/s/G2VzL9QJJU4Acsl8VvtGhw。