3B大战中强制网页快照的法律分析

2012-04-02 18:40杨华权周春慧北京理工大学法学院工信部电子知识产权中心
电子知识产权 2012年11期
关键词:搜索引擎网页百度

文 / 杨华权 周春慧 / 北京理工大学法学院 工信部电子知识产权中心

3B大战中强制网页快照的法律分析

文 / 杨华权 周春慧 / 北京理工大学法学院 工信部电子知识产权中心

在3B大战中,用户通过360搜索访问百度知道、百科、贴吧等服务时,将会强行跳转至百度搜索首页,并可以看到“点击这里继续访问您选择的百度知道结果>>”、“点击这里继续访问您选择的百度贴吧结果>>”或者“点击这里继续访问您选择的百度百科结果>>”等提示。这是百度采取强行跳转策略所致。对此,360搜索对所有来自百度相关服务的搜索结果,强制采用“网页快照”的方式向用户提供搜索页面。百度认为奇虎360“强制网页快照”侵犯了其版权。这里需要对“网页快照”以及“强制”进行分析。

一、网页快照的技术原理

(一)系统缓存

缓冲存储器,简称缓存,是中央处理器(CPU)的一部分,为了解决CPU和内存储器(内存)之间速度差异问题而设置。它介于CPU与主存储器之间,1.主存储器(主存)是计算机系统的主要存储器,用来存放计算机运行期间的大量程序和数据。它和缓存交换数据和指令,而缓存再与CPU打交道。当内存储器(内存)中只有主存而没有缓存时,内存储器就是主存储器。参见白中英:《计算机组成原理》,科学出版社1994年7月第1版,第94页。是计算机系统中的一个高速小容量存储器,用来临时存放指令和数据,加快程序执行速度。有了缓存之后,CPU读取指令和数据的顺序是先缓存后内存。如果从缓存中找到相应的指令和数据,就立即读取并发送给CPU处理;如果没有找到,就从速度相对较慢的内存中读取并送给CPU处理,同时把这个指令和数据所在的数据块调入缓存中,使得以后对整块数据的读取都从缓存中进行,不必再调用内存。缓存通常都是静态随机储存器(Random Access Memory,RAM),其中的指令和数据,因计算机关机、重启、后续信息挤兑等原因,原有的信息将可能消失。

在网络环境下,从客户端到目标网站之间的指令和信息传递,往往需要经过一个以上的中转服务器。为避免目标网站服务器与中转服务器之间的网络因流量剧增而发生拥堵,从而降低信息传递的速度,“系统缓存”起了关键作用,即:“在前一用户访问目标网站时,从目标网站服务器传输到中转服务器的信息,将被中转服务器自动地保存在其‘系统缓存’。当后一用户再次试图访问同一目标网站时,中转服务器就不再要求目标网站服务器重复传输相息了,而是直接将保存在其‘系统缓存’中的信息传递给用户,以此提高用户获得信息的速度。”2.王迁:“搜索引擎提供‘快照’服务的著作权侵权问题研究”,载《东方法学》2010年第3期,第127-128页。可见,“中转服务器在将从目标网站服务器获取的信息传递给用户之后,将本应立即删除的信息保留在‘系统缓存’中,使后一用户可以直接从‘系统缓存’中获得相同信息,从而省去原本必须经过中转服务器从目标网站服务器获取信息的步骤。”3.同前注2,第128页。系统缓存的目的是使用户访问目标网站时提高传输效率,只有在用户访问目标网站时才会形成。

(二)网页快照

“网页快照”与“系统缓存”既有联系,又有区别。如前所述,搜索引擎在抓取网页时,对网页进行备份并保存在自己的服务器缓存里。当用户点击“网页快照”链接时,搜索引擎将“蜘蛛”或“机器人”程序当时所抓取并保存的网页内容展现出来,保证让用户看到和摘要信息一致的内容,这就是“网页快照”。

网页快照是自动存储在搜索引擎服务器中的历史网页,用户可以直接从搜索引擎服务器中获取。这与搜索引擎提供正常的链接结果完全不同。当用户点击正常的链接结果,用户便离开搜索引擎,进入目标网站,此时用户是从被链接的目标网站的服务器获得相关信息。搜索引擎设立网页快照的目的是使用户有意不去访问目标网站,而直接从其服务器中获取信息。与系统缓存的功能不同,网页快照不是用户访问目标网站的必经之路,而是搜索引擎自己主动存储而非用户访问后被动形成的结果。

“网页快照”并非被动响应用户指令的结果,而是主动通过技术复制并存储网页(其中可能含有作品),并且可以长期保存在搜索引擎的服务器上。在没有经过权利人同意之前,且不能满足著作权法上规定的免责条件,则这种行为构成对他人复制权的侵犯。

二、网页快照是否构成复制与向公众传播的行为

(一)是否构成复制

各国和国际条约在复制的定义上稍有差别。日本1970年《著作权法》第2条第1款第15项规定:“复制意指使用印刷、照相、复印、录音、录像或其他方法有形地再现(作品)”。英国1988年《版权、外观设计与专利法》第17条第2款规定:“与文学、戏剧、音乐或艺术作品相关的复制是指以任何物质形式再现作品。此种复制包括种用电子手段将作品存贮于任何介质中”;第17条第6款还规定:“对作品的任何描述性的复制都包括制作临时的或附属于作品其他用途的复制件”。我国2010年《著作权法》第10条第5款也规定:“复制权,即以印刷、复印、拓印、录音、录像、翻录、翻拍等方式将作品制作一份或者多份的权利”。而1996年通过的《世界知识产权组织版权条约》(以下简称“WCT”)第1条第4款中,明确规定缔约各方应遵守《伯尔尼公约》第1至21条和附件的规定,并对此作出议定声明,即:“《伯尔尼公约》第9条所规定的复制权及其所允许的例外,完全适用于数字环境,尤其是以数字形式使用作品的情况。不言而喻,在电子媒体中以数字形式存储受保护的作品,构成《伯尔尼公约》第9条意义下的复制。” 根据2001年5月22日通过的《欧洲议会和欧盟理事会关于协调信息社会中版权和相关权若干方面的第2001/29/EC号指令》(以下简称“2001/29/ EC号指令”)第2条,作者享有禁止直接地或间接地、临时地或永久地通过任何方法和以任何形式全部或部分复制其作品的专有权。尽管对什么是著作权法意义上的复制,依然存在不同观点,但目前都倾向于将临时复制排除在复制权控制的范围,但“复制”肯定是指再现作品的一种形式。

对于“网页快照”是否也是一种复制行为,不同国家的司法实践也有不同做法。美国法院就采取比较宽松的观点,认为“网页快照”不构成复制,其缘由在于被告要构成直接侵权,其未经许可的复制必须是“受其意志控制的行为”,而搜索引擎自动对互联网网页进行存储,对所有被扫描的网页不作区分对待,因而不具备“意志”要素,因此不构成侵权。4. Gordon Roy Parker v. Google, Inc., Civ. A. No. 04-3918. (E.D. Pa. 2006).实际上,美国法院混淆了“复制是否在意志控制之下”与“复制是否通过技术手段自动完成”这两个不同的问题。“网页快照”确实是搜索引擎自动扫描的结果,但这并不意味着没有“意志”的要素。“网页快照”并非搜索引擎被动响应用户指令的结果,而是主动通过技术复制并存储网页(其中可能含有作品),并且可以长期保存在搜索引擎的服务器上。在设置这种技术手段时,搜索引擎服务提供者主观上要追求形成互联网网页复制件的结果,其实施“复制行为”的“意志要素”显然已经具备。5.王迁,同前注2,第131页。既然“临时复制”都是一种复制形式,那么“网页快照”更没有理由不是一种著作权意义上的“复制”。德国汉堡地方法院、西班牙巴塞罗那上诉法院在审理涉及Google“快照”服务的案件时,都是认定Google构成复制。在Copiepresse v. Google一案中,比利时两级法院均认为“网页快照”服务构成复制。在没有经过权利人同意之前,且不能满足著作权法上规定的免责条件,则这种行为构成对他人复制权的侵犯。

(二)是否构成向公众传播

WCT第8条规定了向公众传播的权利,即文学和艺术作品的作者应享有将其作品以有线或无线方式向公众传播,包括将其作品向公众提供,使公众中的成员在其个人选定的地点和时间可获得这些作品的专有权。关于该条的议定声明进一步强调仅仅为促成或进行传播提供实物设施不致构成本条约或《伯尔尼公约》意义下的传播。因此,将作品向公众传播的要旨在于公众中的成员在其个人选定的地点和时间可获得这些作品,不论其是否实际获得,只要具有这种可能性即可构成此行为。2001/29/EC号指令的序言(23)强调对向公众传播权应做广义的理解,即它覆盖了所有向传播发生地之外的公众进行传播的行为。该权利应当包括就某一作品通过有线或无线形式向公众进行的包括广播在内的任何此种传输或转播。该权利不包括任何其他行为。依照我国2006年颁布的《信息网络传播权保护条例》,信息网络传播权是“指以有线或者无线方式向公众提供作品、表演或者录音录像制品,使公众可以在其个人选定的时间和地点获得作品、表演或者录音录像制品的权利。”世界各国在著作权法意义上的“向公众传播”认识具有高度的一致性,即只要该种行为使得公众可以在其选定的时间和选定的地点获得该作品,该行为即构成向公众传播的行为。

向公众传播权的客体是作品、表演或者录音录像制品。对于网页的作品属性,目前已无太多争议。搜索引擎提供“网页快照”服务,其服务器上生成网页的复制件,并通过信息网络向公众提供。用户只要点击“网页快照”链接,即可得到相关页面的副本,满足了用户能够在选定的时间和地点获得作品的条件。相对于指引用户与原始网站建立超链接来说,通过点击“网页快照”链接,用户即可在搜索引擎的服务器上获得该页面的复制件,因此“网页快照”构成向公众传播的行为。

搜索引擎提供“网页快照”服务,其服务器上存有网页的复制件,用户只要点击“网页快照”链接,即可得到相关页面的副本,满足了用户能够在选定的时间和地点获得作品的条件,构成向公众传播的行为。

三、“网页快照”服务是否适用避风港原则

避风港原则最初来源于美国1998年《数字千年版权法》,其中有关网络服务商的在线侵权责任条款被编入美国版权法第512条6.《数字千年版权法》是对《美国版权法》的修改和补充。在《数字千年版权法》的SEC.202(a) 明确“Chapter 5 of title 17, United States Code, is amended by adding after section 511 the following new section”.“new section”意指网络服务商的责任内容,并明确将其编号为《美国版权法》的“SEC.512”。有人总以为这是《数字千年版权法》的编号,这是错误的。《数字千年版权法》最大的条文编号只是505。,该条(b)款规定了对履行系统缓存功能的网络服务商(Internet Service Provider ,ISP)的责任限制。ISP履行系统缓存功能时满足下列条件的,ISP不承担赔偿损失责任:①能在线获取的信息是由他人而不是由网络服务商提供的;②前述他人通过网络服务商的系统或网络将信息传输给另一人是按照该另一人的意志进行的;③信息储存通过自动化的技术处理过程实现。为此,还应满足其他一些条件,如存储必须是中介性和暂时性的,ISP不得改变缓存的内容,并且必须遵守行业普遍接收的信息更新规则;ISP一旦被告知其缓存的信息已在源址被去除、阻挡,必须立即去除或阻止访问缓存在其系统中的信息等等。

《2000年6月8日欧洲议会及欧盟理事会关于共同体内部市场的信息社会服务,尤其是电子商务的若干法律方面的第2000/3l/EC号指令》 (电子商务指令)第四部分也对网络服务商的相关责任作出了规定,其中第13条规定,成员国应当确保服务提供者不因对信息的自动、中间性和暂时的存储而承担责任,条件是:(a)提供者没有更改信息;(b) 提供者遵守了获得信息的条件;(c) 提供者遵守了更新信息的规则,该规则以一种被产业界广泛认可和使用的方式确定;(d) 提供者不干预为获得有关信息使用的数据而对得到产业界广泛认可和使用的技术的合法使用;以及 (e) 提供者在得知处于原始传输来源的信息已在网络上被移除,或者获得该信息的途径已被阻止,或者法院或行政机关已下令进行上述移除或阻止获得的行为的事实后,迅速地移除或阻止他人获得其存储的信息。如果服务提供者故意与接受其服务的用户合作以实施超越 “缓存”活动的非法行为,则其不得以“缓存”为由免责。2001/29/EC号指令第5条第1款也将临时复制排除在复制权控制的范围,只要这种复制是短暂的或偶然的,以及是技术过程中必要的不可分割的组成部分,并且其惟一目的是:(a) 使作品或其他客体在网络中通过中间服务商在第三方之间传输成为可能,或(b) 使作品或其他客体的合法使用成为可能,并且该行为没有独立的经济意义。

“避风港”原则针对是“系统缓存”,仅仅发生在信息从目标网站向用户的传输过程之中。“系统缓存”要适用避风港原则,还要满足上述规定的一些限定条件。尽管“网页快照”在技术上也可被称为一种“缓存”,虽然也涉及在搜索引擎服务器中对信息的临时性存储,但它并非一般意义上的“系统缓存”。从表象上看,网页快照和系统缓存都是将相关的信息存储在服务器当中,以较快地响应用户调取信息的需要,但是系统缓存所针对的临时性复制仅发生在信息从目标网站向用户的传输过程中7.详见王迁:《网络环境中的著作权保护研究》,法律出版社,2011版,第386页。,这种系统缓存的唯一目的只是能使信息的“继续传递”过程更有效率8.转引自王迁:《网络环境中的著作权保护研究》,法律出版社,2011版,第387页。。而网页快照则是给用户提供了一个备选,也就是用户可以直接在搜索引擎提供的网页快照上获取相应的信息,而不必非要进入原链接,对于这一获取过程,用户也能清楚地从搜索引擎网址中得知。也就是说,网页快照既不是一种临时复制,也不是一种响应用户请求的被动行为,并且用户获取信息的地址直接来源于搜索引擎的服务器中,与单纯的设置链接行为相比,提供“网页快照”服务对权利人利益的影响更大。这样的网页快照使搜索引擎网站可以代替原网站来提供信息,因此,无法享受DMCA 512(b)系统缓存的免责规定。

四、“网页快照”是否可以适用“限制与例外”条款

合理使用是对著作权权利人权利的限制,也是保护的例外,因此网页快照行为在无法享受系统缓存避风港的情况下,还应进行合理使用判断,才能最终决定是否能得出侵权的结论。关于“网页快照”能否适用“合理使用”或者“限制与例外”条款,不同国家也有不同规定。

合理使用制度来源于美国《版权法》第 107 条,该条列举了某一未经许可使用作品的行为是否侵权的四个判断因素,即:使用作品的目的、被使用作品的性质、使用作品的程度以及使用对于原作潜在市场或价值的影响,最重要的是第一个和第四个因素。其中,第一个因素决定对作品的使用是否为转换性使用,第四个因素决定对作品的使用是否会导致对作品市场的被替代。对作品的使用越具有“转换性”,替代作品市场的可能性也越小,则认定为合理使用的可能性就越高。在 Blake A. Field v. Google,Inc.案中,美国法院认为“网页快照”属于对作品的“转换性使用”,同时Google 的程序设计确保了对“网页快照”的访问不能代替对原始网页的访问,因而构成合理使用。9. Blake A. Field v. Google, 412 F. Supp. 2d 1106,(D.Nev, 2006).

2001/29/EC号指令序言(33)就指出:“复制的专有权应当受到限制,允许某些临时性复制行为的例外。这种临时性复制行为是短暂的或偶然的复制,构成技术过程中不可分割的和必要的组成部分,从事此种行为的惟一目的既是使第三方之间通过中间服务商能够进行有效的网络传输,也是为了合法使用作品或其他客体。有关的复制行为本身不应具有独立的经济价值。在满足上述条件的情况下,这项例外应当包括允许浏览的行为以及实施缓存的行为,其中包括允许传输系统有效运作的那些行为,只要该中间服务商未更改有关信息,也未阻碍被业界广泛承认和使用的、通过使用该信息获得数据的合法的技术上的使用。由权利人授权的使用或不为法律所禁止的使用,就应当被认为是合法的使用。”其第5条进一步规定了著作权法意义上的例外与限制条款。另外,2001/29/EC号指令第5条第5款进一步对“例外与限制”作出限定,即:对于该条前4款中规定的例外与限制,“应只适用于某些不与作品或其他客体的正常利用相抵触、也不无理损害权利人合法利益的特殊情况。” 这也是通常所说的“三步检验法”。布鲁塞尔上诉法院在上述判决书中也重点论述了Google的行为是否满足“三步检验法”的条件,认为在原始网站已经删除了原文之后或者只有付费之后才能获取的情况下,用户通过“网页快照”方式即可获得该文章,影响了对作品的正常使用,对权利人的合法利益也造成了不合理的损害,这显然不符合“合理使用”的要求。

我国现行《著作权法》第22条以列举的方式列出了12种合理使用的情形,而网页快照不能列入其中的任何一种情形。但我们仍然可以根据合理使用的原理来进一步分析网页快照是否适用合理使用原则。

吴汉东教授在《知识产权基本问题研究》一书中认为“ 著作权限制,……,其功能在于通过对著作权的适当限制,平衡创作者、传播者和使用者的利益,确保公众能接触和使用作品,以促进整个社会科学文化事业的进步。” 因此,合理使用作为著作权限制的一项,似乎是法律政策实现的工具之一,这意味着合理使用的规定和认定与社会经济、技术、产业发展关联度较大。在涉及网页快照是否属于合理使用时,同样需要平衡著作权人、搜索引擎服务商及网络技术发展之间的利益平衡。

事实上,在司法实践中,法院已经总结出了相应的判断方法。北京市高级人民法院颁布的《关于审理涉及网络环境下著作权纠纷案件若干问题的指导意见(一)》(试行)第13条规定:网络服务提供者以提供网页“快照”的形式使用他人网站上传播的作品,未影响他人网站对作品的正常使用,亦未不合理地损害他人网站对于作品的合法权益,从而未实质性代替用户对他人网站的访问,并符合法律规定的其他条件的,可以认定构成合理使用。该规定表明网页快照是否能使用合理使用制度需要经过上述几个要素的检验。

网页快照具有以下作用:1.网页快照能保留网页修改前的内容信息。2.网页快照能体现蜘蛛爬行网站的频率。3.网页快照能作为现有网站内容和蜘蛛抓取内容的参照。4.网页快照的能体现网站阶段性的内容更新状况。5、网页快照的能体现阶段搜索引擎信任度。10尤其是1、3、4项确实体现了网页快照不同于原网页的作用,但是笔者认为,这些益处仍然需要通过合理使用四要素的判断,尤其是“未不合理地损害他人网站对于作品的合法权益”和“未实质性代替用户对他人网站的访问”,如果网页快照导致用户无需点击原网站,直接在搜索引擎网站就能满足其信息需求,那么搜索引擎提供的网页快照就直接节流了本应属于原网站的流量,使搜索引擎网站与信息来源网站之间形成了直接的竞争关系,提供网页快照的网站实质性替代了原网站的信息提供作用。在3B大战中,这种实质性替代作用必然会影响百度对于百度知道、百科等产品的潜在市场和价值的受益。此外,虽然搜索引擎提供网页快照都是免费的,但是用户流量的节流会促进搜索引擎网站的商业收益,减少原网站的商业收益,典型的例子就是网页广告带来的收益。因此,不能单纯因为网页快照的转化性使用就一定适用合理使用,应综合考虑合理使用的其他要素。

五、3B大战中涉及Robots协议的分析

3B大战中,强制网页快照还涉及到网络搜索行业中非常重要的一个技术协议——拒绝蜘蛛协议(Robots Exclusion Protocol)(简称Robots协议)。如同其他互联网的公认协议(如http协议)一样,拒绝蜘蛛协议最初由几个工程师提出,并形成官方网站(www. robotstxt.org)。该网站汇集了关于拒绝蜘蛛协议的大量论文和著作,同时也是如何使用、改进拒绝蜘蛛协议的主要信息源。目前,世界上大多数的搜索引擎服务商(近300家)都严格遵循拒绝蜘蛛协议,其中包括:google,msn等,国内的搜索引擎中,百度、中搜等也都遵循这个行业规范,因此该协议属于世界上搜索引擎服务商行使和遵循的国际行业惯例。

搜索引擎的工作原理是搜索引擎的Spider系统通过抓取互联网上的某一个网页,同时因为每一张网页上都有很多超链接,链接到另外一些网页上,而这些网页上依然有很多超链接,又可以链接到另外一些网页上,通过这样像蜘蛛织网爬行的方式将互联网上的大量网页逐步抓取下来。Robots协议则是对Spider系统的回应,如果网站不想被搜索引擎访问或只想搜索引擎访问网站的部分内容,就可以在网站中创建一个纯文本文件Robots.txt,在这个文件中声明该网站中不想被Robots访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。一般来说当搜索引擎访问一个网站时,首先会检查该网站中是否存在Robots.txt文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围,因此也决定了所能提供的网页快照的范围。

Robots协议给网站提供了“禁止或允许所有搜索引擎访问网站的任何部分”、“禁止或允许某个搜索引擎的访问”等四种选择,作为一个行业内国际公认、并被世界绝大部分搜索引擎服务商遵守的技术协议,该协议在维护网络开放性前提下,维护了信息提供者的领地,这种动态平衡是互联网、网络搜索引擎行业健康有序发展的有力保障,也是各个商业或非商业主体参与互联网活动的行为准则。事实上,国际很多主流网站的Robots协议都采用白名单、黑名单制,允许一些口碑良好的搜索引擎进行抓取,而严格禁止某些搜索引擎进行网页抓取,这其中不乏很多网站是出于自身内容、用户上传内容的信息服务和产品的考虑而自主地设置Robots协议。

著作权法并没有有关于Robots协议的相关规定,但从司法判决来看,似乎可以推出,如果违反Robots协议抓取具有著作权的网页,那么恰恰证明了违反Robots协议进行网页快照的搜索引擎服务商具有侵犯著作权的主观故意。

但是我们也注意到,拒绝蜘蛛协议的官方网站(http://www.robotstxt.org/wc/noRobotss.html)特别声明,“It is not an official standard backed by a standards body, or owned by any commercial organisation. It is not enforced by anybody, and there no guarantee that all current and future robots will use it.”11从该声明可以看出,该协议并不是一个强制性标准,也没有任何强制执行力,虽然现在Robots协议被世界范围内的绝大多数搜索引擎服务商和互联网网站所公认并广泛执行,但该协议只是技术协议,并没有引入法律规范当中,因此违反该协议去提供被拒绝访问的网页的行为似乎只能放在商业道德的范畴来评价,并不会引起相应的法律后果。

值得关注的是, 2012年11月1日下午,中国互联网协会在北京举行《互联网搜索引擎服务自律公约》签约仪式,包括百度、奇虎360在内的国内12家搜索引擎服务企业现场签署了《互联网搜索引擎服务自律公约》。该自律公约第七条明确约定,搜索引擎企业应遵循国际通行的行业惯例与商业规则,要遵守robots协议。从这条约定来看,搜索引擎企业均以认可并赋予机器人协议(robots协议)作为循国际通行的行业惯例与商业规则的地位。该公约同时约定互联网站所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由。

因此,在百度严格按照Robots协议设置了相关文本拒绝360搜索所有来自百度相关服务的搜索结果的情况下,360搜索仍然执意继续提供该服务,直接威胁到了搜索引擎服务商的竞争生态。

从中国已经判决的涉及到网页快照的判例当中,我们可以推导出法院对于违反Robots协议行为的认定及态度。

在浙江泛亚电子商务有限公司诉百度在线网络技术有限公司、北京百度网讯科技有限公司侵犯著作权纠纷一案12中,北京市第一中级人民法院认为明示禁止收录与书面通知都属于是权利人针对搜索引擎服务的维权途径。同时在明示禁止收录中,明确举例网站创建Robots.txt文件拒绝搜索引擎收录全部或者部分内容为途径之一。

在北京源泉知识产权代理有限公司诉北京百度网讯科技有限公司、上海数字世纪网络有限公司案13中,上海市第一中级人民法院认为“如果要求网站都采用拒绝蜘蛛协议似乎有将搜索引擎业的自定标准强加于人的嫌疑。但是,如果考虑到互联网的本质属性即在于促进信息交流,那么可以推知,如果不是特殊情况,……那么他似乎也该有所作为。如果他仅仅在自己的网站上作个声明或者采用某种不足以阻挡搜索引擎的技术,那么就目前的搜索技术而言,要求搜索引擎服务商逐个甄别信息获取的合法性的确有点勉为其难,而要求网站采用拒绝蜘蛛协议的确可以说是一个比较简单而高效的方法。”从上述判决来看,虽然认为Robots协议的效力较弱,但从其后半段的表述,又是非常肯定Robots协议的采用对于搜索行业的意义,同时也排除了其他拒绝被抓取的形式(如文字声明等),从而从另外一个角度肯定了在搜索技术中Robots协议的重要性。

著作权法并没有有关于Robots协议的相关规定,但从上述判决来看,似乎可以推出,如果违反Robots协议抓取具有著作权的网页快照,那么恰恰证明了违反Robots协议进行网页快照的搜索引擎服务商具有侵犯复制权及信息网络传播权的主观故意。因此在侵权诉讼中,原告可以以被告违反Robots协议抓取其具有著作权的网页快照作为侵权证明之一。当然并不是所有违反Robots协议提供搜索连接的行为都会受到法律规制,这是因为Robots协议的非强制力所致,这点上面已经论述,在此不再赘述。在此种情况下,如果原告发出适格的书面通知,被告不采取任何救济措施,会形成“明知”或“应知”的证明,此时,搜索引擎服务商可能会承担共同侵权责任。反之,如果根据Robots协议允许搜索引擎进行网页快照的抓取和提供,并不意味着不会侵犯所涉作品的复制权和信息网络传播权,该行为同样需要依据著作权法相关规定进行判断。目前单独因违反Robots协议进行访问或抓取,还没有单独的案例,在该问题与著作权保护相结合的情形下,是否设置Robots协议,以及Robots协议是否允许搜索引擎访问或抓取,并不必然导致著作权法上的法律判断是是或否,其只是在特定情形下的证明之一。

结语

综上论述可知,百度服务器上的Robots协议设置了相关文本拒绝360搜索对百度知道、百度贴吧和百度百科进行搜索情况下,360搜索仍然执意抓取并直接向用户提供网页快照的页面,这些网页快照并不是系统缓存,不是临时的自动存储,而是固定存储或事先存储在360搜索网络服务器上,是对百度拥有著作权权利的作品的直接复制;同时,对于涉及内容较多的网页快照可以实质性地替代用户对他人网站的访问,也即360搜索强制网页快照的行为实质性地替代了用户对百度网站的访问,无法适用合理使用原则进行开脱。因此涉嫌侵犯了百度的相关著作权。

猜你喜欢
搜索引擎网页百度
Robust adaptive UKF based on SVR for inertial based integrated navigation
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
百度年度热搜榜
基于URL和网页类型的网页信息采集研究
网页制作在英语教学中的应用
网络搜索引擎亟待规范
百度医生
基于Nutch的医疗搜索引擎的研究与开发
百度“放卫星”,有没有可能?