搜索引擎数据的证据审查研究

2021-05-12 05:58赵长江李兆涵
关键词:完整性搜索引擎实务

赵长江,李兆涵

(重庆邮电大学 网络空间安全与信息法学院,重庆 400065)

随着科技迅猛的发展,人们获知讯息的途径也变得丰富。搜索引擎就是人们获得讯息所借助的众多工具之一。搜索引擎是由一系列技术组成的,具有相对稳定性检索功能的在线网络信息查询系统,它借助不同的网站服务器为网络用户提供关键词搜索、分类浏览式检索等查询服务。协助用户获得准确、全面地查询信息,满足自身的需求。[1]搜索引擎技术给商业巨头们带来了许多商机和利益,亦给人们生活带来了极大的方便,直接推动了世界的科技发展进程。其中,典型的例子包括:谷歌、百度、360、Bing等搜索引擎。他们很早就已经存在于市场当中,通过不断地完善技术和搜集更多的数据,使人们通过这类搜索引擎可以获取到更多、更丰富的资料和信息。与此同时在我国司法实务中,也已经出现了大量的运用搜索引擎检索的信息作为证据使用的现象。

一、搜索引擎检索电子数据的司法应用现状

为进一步了解实务中存在的运用搜索引擎检索的信息作为证据的案件情况,通过查看中国裁判文书网中公开的裁判文书,可探究我国实务中诉讼当事人对搜索引擎检索的证据的运用方式,以及法院对于运用搜索引擎检索到的数据作为证据采信的态度与观点,同时也能发现此类证据在实务运用中存在的问题。

案例数据来源:运用中国裁判文书网网站中的高级检索工具选择“2015年1月至今”、输入“百度检索/搜索、360搜索/检索、谷歌搜索/检索、搜狗搜索/检索、必应搜索/检索(分别输入)”、选择“判决书(包括一、二审)”进行搜索并剔除重复案例,最终获得包含搜索引擎检索电子数据作为证据的案件16177件,主要特点如下:

(一)从总量上看,搜索引擎检索电子数据在实务中呈上升趋势

以涉案最多的百度搜索为例。五年来,以百度搜索结果作为电子数据的案件达到了13750件,且一直处于上升趋势,直到2020年才有所下滑。在2015年时,有1078起案件、2016年有1296起、2017年有2121起、2018年有2339起、2019年达到了最高案件量,有3629起、2020年虽有所下降,但仍有1347起案件。这说明,在实务中存在大量运用搜索引擎检索到的结果作为证据的情况。

(二)从案件类型看,搜索引擎检索电子数据主要适用于知识产权案件中

从上述条件检索出的判决书所呈现的案件类型来看,发现此种证据的应用已渗透到了各种类型的案件,但总体主要集中应用在知识产权案件中。从最终数据统计结果看,侵害作品信息网络传播权纠纷对这类证据的使用频率最高,达到了2477起案件;著作权权属和侵权纠纷次之,涉及的案件量有1738起,其他类型的案件都有不同程度的涉及。(图1)

图1 案件类型统计

(三)从应用方式看,搜索引擎检索电子数据主要用于证明知名度

通过实践判例可以发现,多数当事人一般为了获得更多的赔偿,证明自己在相关领域的知名度和影响力,将涉案作品的名称在搜索引擎中进行搜索,以搜索后的检索量数据作为证据之一提交给法庭。

目前,实务中最为盛行的一种做法是,在侵权案件中,当事人为了证明自己的作品或者商标具有较大的影响力和知名度,直接向法庭提交或者在庭审过程中进行现场演示其在搜索引擎中搜索自己的作品或者商标的检索量。或者通过展示检索页面证明自身合法权益被他人侵犯的事实。司法工作人员可以较为直观地看到检索量的数字和检索画面,从而对当事人提交证据的证明力进行判断。当事人举证也非常方便,仅需在常用的搜索引擎输入关键词即可完成其举证责任,不需要寻求专业的取证技术人员、第三方证据保全机构帮助或者支付高昂的公证费,就可以完成证明,节约了诉讼成本。因此,在实务中只要是涉及到需要证明知名度或者有侵权事实存在的案件,当事人更愿意用搜索引擎检索的数据提交给法庭。

(四)从证据的采信结果看,搜索引擎检索电子数据大量被予以采信

从判决结果可以看出,目前实务中司法工作人员对此类证据多数予以采信,对于检索信息与待证事实之间关联性的有无、大小,以及证据的关联性、完整性,司法工作人员不会进行详细的审查。这也表明法院对于搜索引擎的运行结果是非常信任的。

搜索引擎检索的证据相较于其他电子数据来说稳定性较高,一般不会遭到“攻击”或被他人进行篡改。因搜索引擎在每个地区都有不同的服务器,且都有备用的服务器。一旦某一台服务器发生故障或者受到了攻击,马上会有备用的服务器进行支援,由此可见,对搜索引擎攻击的难度非常大,相对的,其故障的可能性也就非常小。搜索引擎是对事先准备好的数据库中的数据进行收集和挖掘。其仅仅是负责对搜索栏中输入的关键词在数据库中进行抓取和匹配,并将结果以排序的方式呈现出来。目的是向人们提供一种搜索服务,让人们可以方便、快捷地找到自己所需的目标网站。因此,除了搜索引擎这一项技术本身以外,对于人们来说“检索量”这一信息并无实际价值,并且如前所述,攻击搜索引擎的成本也非常高,人们攻击搜索引擎的可能性较小。全世界开发和运营搜索引擎服务的企业,在各自国家的市场竞争都处于优势地位,财力雄厚。必须承认,网络空间的安全与投资维护的成本成正比。据此人们对这类企业是非常信赖的,司法工作人员也不例外。据此,搜索引擎的稳定性较高,被篡改的可能性微乎其微。

从另一方面来看,对搜索引擎检索的证据审查没有涉及过多的技术问题。出于对企业的绝对信任,司法工作人员通常只需看一下搜索后的结果和检索量数据就可以对证据进行认证,解决了实务中对电子数据认定难的问题。

实务中已有大量案件运用搜索引擎检索的证据这一新的证据类型。但是,法院如何对此类证据的真实性、完整性和关联性进行审查目前没有较为系统的方法,此类证据在实务运用中存在一定优势,同时也存在一定问题亟需解决。

综上所述,可以看出运用搜索引擎检索的证据在实践中之所以得以盛行是因为法院对这类证据采信度高,审查也并不严格,当事人又便于举证,在很大程度上提高了整体诉讼效率。可以预料的是,这类证据今后势必会大量地出现在诉讼程序中。

二、搜索引擎检索数据在司法实践中的问题

2018年5月,南京市中级人民法院审理了一起深圳市赛诗电声有限公司与全景声科技南京有限公司侵犯注册商标专用权、不正当竞争纠纷案((2018)苏01民终1172号。)本案中,被上诉人(原审被告)全景声科技南京有限公司(以下称“被上诉人”)为证明上诉人(原审原告)赛诗电声有限公司(以下称“上诉人”)仅在“全景声”相关领域占据极小部分的信息,没有任何知名度,从而提供了通过百度高级检索引擎搜索到的信息作为证据提交给法庭。即在百度搜索页高级搜索中“包含以下全部的关键词”栏输入“全景声”,搜索显示的信息有340万条;在“包含以下全部的关键词”栏输入“全景声”,在“包含以下的完整关键词”栏输入“杜比”,搜索显示的信息有250万条;在“包含以下全部的关键词”栏输入“全景声”,“包含以下的完整关键词”栏输入“赛诗”,搜索显示的信息仅有66条,且基本为其自身在商务网站张贴注册的信息,产品类别为家庭影院、客厅影院或私人影院。最终,法院对于此项证据予以采纳,采纳的理由为与上诉人在一审中提交的62页网页宣传页面数字基本相符,可以辅助证明本院的上述认定。法院也依此认为,本案上诉人在相关领域不具有知名度,并综合全案证据进行分析,认为被上诉人未侵害上诉人的商标权与市场竞争利益,驳回了上诉。

在本案中,司法工作人员仅以数字基本相符为由从而对该证据予以采纳,证据采纳的理由也非常牵强,难以得到信服。

将搜索引擎所检索的数据作为证明案件事实的证据,与案件的关联性存在疑问。司法工作人员在审理案件过程中,碍于自身技术水平有限,且为了提高诉讼效率,对这类证据的关联性一般不进行实质性的审查。必须承认,运用搜索引擎检索的证据给司法实务确实带来了诸多便利,但是,在对其进行运用和审查时还是存在一定的困难和问题。具体表现为以下几个方面:

(一)针对证据的关联性审查困难

电子数据关联性的认定,主要是指电子数据证据必须与案件的待证事实有关。[2]正如上述案例判决中所写到的,被上诉人搜索到了66条与上诉人有关的信息,而上诉人在一审中提交的检索量为62条。单从数字上面来看,就已经出现了差异。这就说明搜索引擎每次搜索的结果并不一定是完全相同的。从我们日常所具备的一般经验来看,运用搜索引擎检索到的信息也并非都与设置的关键词有直接关联。比如:当我们在搜索引擎中输入一个关键词以后,搜索引擎会在事先整理好的数据库中机械的抓取与关键词有关或者是相关方面的网页,并根据网页与关键词的关联程度由高到低进行排序。从搜索结果来看,可能与关键词相符合的网页只有排在最前面的少数几条,排在后面的网页几乎与关键词毫无关联。但是搜索引擎在统计搜索结果和检索量时,势必会将这些几乎毫无关联的网页也统计进去,这就造成了搜索引擎检索的证据关联性不强、可靠性不高的问题。

由于多数情形下,当事人所提交的检索结果数量巨大。为提高诉讼效率,司法工作人员在对搜索引擎检索的证据进行审查时,无法对其中内容的关联性进行审查,一般只能通过对证据最后所呈现的数额来进行一个简单的比对,只要差距不大,就对证据予以认定并采信。然而,这种做法对证据的关联性无从保证。一旦有一方当事人质疑证据的关联性,司法工作人员也并没有适当的办法对证据进行审查。导致裁判文书中对于此部分的说理缺乏,逻辑不严谨等问题的出现。

(二)对搜索引擎数据的完整性审查困难

一般来说,电子数据的完整性包括了内容上的完整性和形式上的完整性。形式上的完整性是指电子证据必须保持生成之时的原状,包括格式调整在内的任何更改都将视为完整性受到损害。内容上的完整性是指电子证据自形成之时起,其内容保持完整、未遭到非必要的添加或删除。[3]从上述案例中可以看出,法院对于运用搜索引擎检索的数据并不进行完整性审查。当事人也未提交辅助证明该证据完整性的证据,导致证据的可靠性存疑。

在民事案件中,有时案件涉及的标的额并不大,当事人为了简化取证程序,通常直接在搜索引擎上进行检索。如果要求当事人提交此类证据的完整性校验值,当事人的取证成本就会随之增高,且失去了搜索引擎检索的证据在实际运用中的优势。因此,对于此类证据司法工作人员一般都会予以认证。

(三)搜索引擎数据的有限性与易变性

1.搜索引擎数据的有限性

在实务中,当事人一般仅提交平台的搜索引擎检索结果,以达到证明产品在该行业中具有一定的知名度或者影响力的目的。此做法显然并不能客观真实地反映产品的知名度或影响力。

(1)搜索引擎存储数据的有限性

搜索引擎是通过建立庞大的数据库,根据客户在搜索栏里输入的关键词,自动在数据库中进行匹配和抓取相关数据,从而达到服务于客户的目的。然而,搜索引擎的数据库本身是有限的。目前,没有任何一个搜索引擎平台能够保证其收集的数据是绝对全面的;更不能保证其搜索到的结果能涵盖所有与关键词有关的信息。正是因为搜索平台受限于其数据的有限性,运用搜索引擎所收集到的数据同样是有限的,无法客观真实地反应待证事实的知名度或影响力。实践中,若仅以此检索结果证明影响力的大、小,或者有、无,都不免有些以偏概全。

(2)证明范围的有限性

在方正国际软件(北京)有限公司与广州锵美电子有限公司等商业贿赂不正当竞争纠纷一案中((2019)粤0115民初707号),方正公司提交了百度搜索结果,以证明其具一定的知名度。结果显示,方正公司生产的“ifound”电脑显示器在天猫商城、京东等多个线上销售平台予以出售。法院认为,此证明事实仅能证明“ifound”电脑显示器在线上销售的事实,并不能证明该产品在其领域的知名度和影响力,最终并未对此证据予以采纳。据此可知,搜索引擎数据能证明的影响力也仅限于在网络中的,不能包含除网络以外的影响力。因此,搜索引擎数据在证明待证事实方面存有多方面限制,法院不宜不加审查地采信。

2.搜索引擎数据易变动

前述已反复强调了搜索引擎平台的主观性问题。平台中的所有数据都可以由平台的技术人员操控和改变,“竞价排名”就是典型例子。因此,在实务中经常存在立案时的数据与审判时的数据不一致的情况。例如:在前述南京市中级人民法院审理的案件中,在输入相同关键词的情形下,一审期间与二审期间搜索的检索量就已出现了不同。在搜索引擎中,“检索量”这一信息几乎每一分钟、每一秒都在发生变化,其既可能增加,也可能减少。而实务中,当事人又非常倾向于用检索量来证明待证事实。在这种状况下,司法工作人员对于此类证据的认定就会出现障碍。

(四)搜索引擎本身的倾向性导致的结果可信度问题

目前人们生活中较常使用的搜索引擎包括:百度、谷歌、360、Bing等搜索引擎。有学者对这四种搜索引擎的检索功能进行了测试和调查。其中,百度和谷歌中文的检索功能相比其他搜索引擎更为稳定和完善。尤其是百度,在国内的市场占比和用户数量上目前都遥遥领先。[4]通过对裁判文书的检索也可以发现,在司法实务中,百度搜索引擎出现在庭审中的频率远高于其他搜索引擎。这也带来一定问题,即司法工作人员本身并不懂技术,在对于搜索引擎检索的证据内容不知如何审查的情形下,唯有对证据的形式进行审查。比如:审查当事人所适用的是哪家企业开发的搜索引擎,由于多数当事人都使用百度进行检索,逐渐地形成了一种审查惯例。殊不知百度搜索引擎也并非是绝对可靠的。百度是商业平台,其搜索引擎供人们免费使用,百度并不靠这项服务本身赚取利益,而是依靠收取一些网站的广告费和推广费来营利。因此,百度搜索结果是可以靠人为来进行篡改的,一切都由百度操控着,检索量也不例外。

三、搜索引擎检索的证据的审查判断

通过上述对搜索引擎检索的证据在实务中运用的优势和问题分析,可以看出此种新型的证据类型给司法工作人员以及诉讼当事人带来了巨大的帮助,解决了很多实务中的难题。与此同时在运用此类证据的过程中,也发现了一些问题。针对提出的问题,在此提出以下几种应对建议:

(一)针对证据完整性的举证和认证问题

1.适当适用“谁质疑,谁举证”对证据的证明力进行判断

我国一直以来都是奉行“谁主张,谁举证”的原则。如《中华人民共和国民事诉讼法》第64条第1款规定:“当事人对自己提出的主张,有责任提供证据”。这样规定有利于司法工作人员查明案件事实。但针对搜索引擎检索的证据,由一方当事人提出后,一旦另一方当事人质疑该证据的完整性问题,司法工作人员对此类证据的审查难度会增大。相较于传统证据类型,搜索引擎检索的证据是由独立的第三方平台制作和检索的,且从一般经验来看,其检索的数据和呈现的结果都极有可能被平台篡改或者“注水”。在此情形下,当事人对该证据的检索、存储和提取等环节完全未参与,此时让举证一方当事人证明其所提交证据的完整性在操作上存在难度。如2008年12月,浙江省高级人民法院指出:“一般而言,证明电子证据完整性的举证责任应当由该证据的提交人承担,但由于电子证据的检索、存储、传输以及提取等环节可能出现的不公正、不正当、不规范、不完整性的事实大多为否定性事实,要求电子证据的提交人证明上述事实不存在则不具有操作上的可能性,因此证明这些否定性事实的举证责任可以适当分配给对电子证据完整性持有异议的当事人”。[5]即,在涉及搜索引擎检索的证据的案件中,当运用前几种方法都无法对证据的证据能力或者证明力进行判断时,可适当考虑适用“谁质疑,谁举证”。[6]

2.运用“网页快照”对完整性予以证明

我们平时用任何一个搜索引擎检索信息时,在其列表中,每一条信息都有相对应的网页快照。网页快照就是对网站内容的一次截图,当网页因为某些原因无法打开的时候,用户可以通过点击百度快照来查看网页的相关内容。简单来说网页快照就是对网页的一种“备份”。当网页被删除或者篡改以后,通过点击网页快照,可以显示该网页最原始的信息,即显示被删除或者篡改前的信息。因此当事人在举证过程中,可以考虑运用网页快照对证据的完整性进行证明。

(二)针对证据的关联性审查问题

运用搜索引擎检索的证据在实践中其数据“注水”情况严重。搜索信息的关联性存在着较大疑问。司法工作人员对此问题在审查上存在难度,在此提出审查建议。

通过对判决书的检索发现,在实务中当事人大部分都只提交一个搜索引擎平台的检索结果。前述已提到过,每个检索平台的数据库虽然都非常庞大,但也有限。搜索引擎只是在准备好的数据库中将网页与关键词进行匹配和抓取,最终以关联性由高到低的顺序进行排列呈现在用户眼前。由此可见,每个搜索引擎能检索到的信息是有限的,仅将一个搜索引擎平台的检索结果提交给法庭不利于司法工作人员对此证据的真实性与关联性做出准确的判断。因此,应结合使用多种搜索引擎平台进行检索,将每个平台的检索数据进行比对。这样可增强证据的关联性、可靠性,更有利于司法工作人员对案件事实的认定。

(三)针对数据反映事实的知名度的审查判断

如在部分侵犯信息网络传播权的案件中,当事人非常愿意通过提交搜索引擎检索量的方式来证明自己的作品在业内乃至社会上具有较大的知名度,且仅提交这一种证据予以证明。司法工作人员只能通过这一个证据对涉案作品的影响力和知名度予以审查和认定,因此就导致司法工作人员会过度依赖搜索引擎检索的结果。对此,可考虑运用多种方式来进行认定。若涉案的是作品,还可以通过审查涉案作品的阅读量来对作品的影响力进行认定。作者一般在授权平台和网站都有自己的个人主页,每个主页下方的是作者所创作的所有文章列表,点开每篇文章都可以看到该篇文章的阅读量,通过审查检索量和阅读量来对作品的影响力进行综合认定则更为可靠。另外,亦可结合作者在各个网站和平台的文章受欢迎程度的排名来对数据的关联性进行认定。

(四)针对数据反映事实的真实性的审查判断

在庭审中当事人仅提交运用搜索引擎检索的证据,从而对影响力予以证明显然不够充分,达不到民事证据规则所要求的“高度盖然性”。虽然搜索引擎技术已经足够稳定,但是其搜索的结果并不能保证客观、可靠。在这种情形下,司法工作人员在对此类证据进行审查的同时,还应结合其他辅助证明当事人影响力的证据进行审查。与其他证据相结合,综合分析、相互印证后再对证据的证明力加以评判和认定。若当事人仅提交运用搜索引擎检索的数据来证明自己的知名度和影响力,此证据的证明力不大,司法工作人员可以选择不予以采信。

综上,对电子数据的审查关乎着证据的实体真实,尽可能的还原案件的真实情况,也是诉讼程序一直以来所追求的价值目标。面对搜索引擎检索的证据,司法领域的对抗制仍然适用,可以帮助人们评价此类证据可靠与否的难题。[7]在实务中给司法工作人员和当事人在证据的举证、审查和认定方面都起到了积极作用;同时也发现了此类证据自身存在“注水”成分较高,数据的完整性和关联性存疑等缺陷。基于此问题,在证据的完整性审查方面司法工作人员可以适当调整“谁主张,谁举证”的模式。当要求举证人证明质疑事实不存在不具有操作上的可能性时,可适用“谁质疑,谁举证”的模式;另一方面,还可以审查“网页快照”对证据的完整性进行审查和认定。在证据的关联性审查方面,可结合审查多种搜索引擎平台,也可以审查不同的维度和模块,结合其他能够辅助证明待证事实的证据进行审查和认定。

猜你喜欢
完整性搜索引擎实务
关于《民法典》中不动产登记实务要求的新变化新思考
信托公司在破产重整实务中的机会
Chrome 99 Canary恢复可移除预置搜索引擎选项
关于防火门耐火完整性在国标、英标、欧标和美标中的比对分析
世界表情符号日
ELM及IS/OS完整性对年龄相关性黄斑变性预后视力的影响
更正说明
ICC TA858rev实务应用探讨
加保兑贴现信用证处理实务
基于Lucene搜索引擎的研究