高 波
( 厦门大学 法学院, 福建 厦门361005 )
大数据是一场革命,将波及学术界、政商界等几乎所有领域。大数据分析的范围从已知扩大到未知,从过去推向了将来。运用大数据挖掘(data mining)对数据进行挖山凿矿式的开采,其主要目的不仅要发现潜藏在数据表面之下的历史规律,还要对未来进行预测。大数据分析不仅使亚马逊知道人们喜欢的图书、淘宝网推荐人们可能需要的产品,甚至在识别犯罪、证据收集上发挥巨大的作用。面对大数据的冲击,迫使人们对电子证据的收集等问题的认识活动提高到一个新的水平。基于传统证据收集制度的思维与方式已完全不能适应大数据时代的步伐,因为“大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于因果关系各相关关系转化释放出来的潜在价值的态度,正是主宰这场游戏的关键”[1]。当我们进入了一个用数据进行预测的时代,世界许多在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。人们可能无法解释电子数据产生的背后原因,但是大数据预测产生的“可能证据”却会对证据法中的“可采证据”产生巨大影响。如何应对大数据时代带来的电子证据收集方式与思维模式的改变是保障当事人公平地接近证据的重要问题。
大数据的意义在于人类可以分析和使用的电子数据量巨大,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值。人类在现实世界的活动得到了前所未有的记录,这种记录的粒度(即数据的细化程度,细化程度越高,粒度就越小;细化程度越低,粒度就越大)很高,频度在不断增加,为电子证据的收集提供了极为丰富的数据资源。然而电子数据规模越大,处理的难度也越大。例如,美国司法实务上相当重要的Zubulake v. UBS Warburg LLC案中,依据电子数据的实体可存取性、取得的难易程度,将电子数据分成合理存取性及非合理存取性两大类。如果电子证据的收集须耗费极大的时间、人力及物力,那么此电子证据则会被认为是具有非合理存取性的。在大数据时代,通过传统的方式收集有价值的电子证据已是不可能完成的任务。以视频安全监控为例,连续不断的监控流中,对案件事实有重大价值的可能仅为一两秒的数据流;在360°全方位视频监控的“死角”处,也可能会挖掘出最有价值的证据。然而在海量电子数据中去寻找那一丝与诉讼相关联的证据犹如“大海捞针”。
从质量的角度看,大数据时代中所有数据集的规模或复杂程度都超出了常用技术按照合理的成本和时限收集、管理及处理的能力。与传统的业务数据相比,大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型,其复杂性的存在使它只能提示和解释某些事情,因此大数据时代绝对的精确不再是追求的主要目标。大数据适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力,但却动摇了证据的客观真实性。这种冲击相对于“海量数据”而言更不可小觑,因为“放在天平上的分量不是证据的数量而是由证据产生的盖然性以及案件的全部环境决定的”[2]。盖然性占优势证明标准意味着,凡是对于特定事实的存在有说服负担的当事人,必须以证据的优势确立其存在。证据的优势与证人的多寡或证据的数量没有关系[3]。因此,优势证据不是一项数量标准,而是一项质量标准,反映了证据的可信度和说服力。
我国《民事诉讼法》第64条规定,当事人有责任对自己提出的主张提供证据,即“谁主张谁举证”。但是20世纪中期以后,前述基本规则在诸如医疗纠纷、交通事故纠纷和产品质量损害赔偿纠纷等现代型案件中的运用经常导致实质上的不公正的现象。于是台湾学者提出“证据偏在”的概念,即在诸如环境污染纠纷等相类案件,由于当事人之间的能力、财力不平等,证据往往集中掌握于某一方,造成证据收集、因果关系证明困难等现象,如果严守“当事人主张有利于己之事实者,就其事实有举证之责任”的原则,难免产生结果的不公平,使被害人无从获得应有的救济,有违正义原则。因此有必要对特殊类型侵权案件中某些要件事实的证明责任,进行有别于基本规则的重新分配。我国台湾地区最高法院1999年台上字第836号民事判决认为,法院可视各具体事件的诉讼类型特性暨待证事实的性质,通过斟酌实体法的解释及政策论等重要因素探究法律规定的本意,相比较所涉及的实体利益及程序利益的大小轻重,按待证事项与证据的距离、举证的难易、盖然性的顺序,再依诚信原则,决定其举证责任或是否减轻其证明程度。
在大数据背景下,电子数据的持有者通常与计算机网络设备有极大的关联性,该设备的持有者,往往对该电子数据拥有所有权或管理的权限,而当事人却难以取得该电子证据,另外电子证据采集具有专业性强、技术性高的特点,并且在通常情况下,当事人如果不具备相应的技术知识就难以正确地收集电子证据,显然,电子证据偏在是非常突出的结构性难题,而证据偏在最大的危险是容易发生销毁与篡改证据。在大数据时代若电子系统欠缺良好安全机制,电子数据很容易遭到篡改、销毁,降低电子证据的可信赖性与不可否认性,增加案件审理的难度。
如何保障收集到的电子数据具备合法性、安全性和完整性,其证据效力得到司法机关以及社会各方面的一致认可,使用何种统一标准或方式收集电子证据,成为大数据时代电子证据最被人们关注的问题。大数据与云计算发展密切相关,大型云计算应用不可或缺的就是数据中心的建设,以云计算为基础的信息存储、分享和挖掘手段为电子证据收集提供了工具,但云计算在数据安全性与完整性方面也带来很多新问题。譬如,在云计算基础架构服务层(infratructure as a service,简称IaaS)主要有以下两类问题:一是新的安全问题,诸如信任问题(特指租客和云服务商之间),多租客之间的资源隔离问题;二是对已有的安全攻击,IaaS是否更容易被攻击,或者存在新的技术方法去避免这些攻击[4]。
电子数据的完整性影响着该电子数据证明能力的有无及证明力大小的确认。如果证据不具备完全的证明力,需要结合其他证据,才能够证明案件的真实情况[5]。一般来讲,在云计算基础架构层,虚拟化技术由于在资源整合、利用、管理等方面的优势,使得管理计算机资源不再是操作系统(OS),取而代之的是虚拟机器监控(virtual machine momitor,简称VMM)。VMM通过虚拟化物理的服务器资源,向租客提供相关的VM租赁服务。显而易见,租客之间的隔离是以虚拟机为单位的,不同的租客把应用或者服务布署在自己虚拟机内,那么,VMM的完整性存在新的安全挑战。由于VMM是控制硬件的特权软件,管理并调度着上层的虚拟机。如果有恶意软件攻破了VMM或者在VMM中植入Rootkit(Rootkit指被作为驱动程序,加载到操作系统内核中的恶意软件),就意味着在虚拟机运行过程中,恶意程序可通过VMM这个特权软件攫取或篡改用户的数据,因此基于云计算的大数据如何保证VMM的完整性是一个不能回避的问题。目前云基础架构层的数据安全问题的工作还处于比较初级的阶段,不过却受到越来越多大IT公司的重视,并被循序渐进地推动着。
互联网的“请求+响应”机制恰恰在服务器上保留了人们大量的前兆性的行为数据,把这些数据搜集起来,进一步分析挖掘,就可以发现隐藏在大量细节背后的规律。依据规律,可预测未来。收集分析海量的各种类型的数据,并快速获取影响未来的信息能力,就是大数据技术的魅力[6]。对此人们首先运用大数据来预测未来,事实上以大数据运用人工智能算法进行分析的准确率非常高。那么人们首先想到的是,是否可以用大数据来预防及惩罚犯罪。诚然,如果在犯罪行为发生之前,及时制止比事后再惩罚要好得多。基于一般逻辑,人们若用大数据分析来预防犯罪,就可能会运用司法手段进一步惩罚这个未来的罪犯,这样做即使对未实施的犯罪行为也可以起到威慑作用,因为人们通常会认为,如果只是阻止了某人的犯罪行为而不采取惩罚措施的话,他就可能因为不受损失而再次犯罪,但是这是一种非法治的危险做法。
在小数据时代,证据分析会放在一个特定的人群之中来进行界定,所采用的是“按图索骥”的方法。大数据分析规避了“按图索骥”的缺陷,因为大数据区分的是个人而不是群体,不会再通过“牵连犯罪”给群体中的每个人都定罪。但是大数据“预测”却将我们置于另一个司法难题中,即通过数据挖掘得到的电子证据能否直接成为诉讼中的证据。例如,在互联网中,用户在搜索引擎中查询过的每一个话题都被逐一记录下来,运用大数据挖掘技术完全可以得到某些有“价值”的信息。运用大数据分析,某人未来的可能实施的行为会被预测出来,但大数据分析却永远无法证实某行为是否会被实施。如果法律对其尚未实施的未来行为进行惩罚,这否定了刑事证据法的基本原则之一——无罪推定原则。因为当事人被追究责任,居然是因为当事人可能永远都不会实施的行为,而当事人也无法用证据来证明他未来不会实施的行为。这是大数据预测给证据法基本理念带来的威胁,不仅仅涉及到于当事人公平接近证据上,它还会威胁到任何运用大数据预测对我们未来行为进行责任判定的领域。
人们惯常审视电子证据的思维模式是寻求一种能够脱离开电子数据的虚拟世界而在现实生活中存在替代物。这种思维的基础是不相信在网络中流动的数字化信息的真实性。诚然,科学技术的发展使伪造电子数据资料变得极其容易,因此人民法院对于电子数据资料,应当辨别其真伪,不要被其表面现象所迷惑[7]。然而大数据现已成为时代变革力量,它不仅会为电子证据的收集与保全的方式提供技术方案,而且还会改变电子证据的收集手段。大数据对电子证据收集制度亦有积极的影响,因此电子证据制度要适应大数据时代的发展潮流。
大数据挖掘技术就是从平淡无奇的数据资料中发现、归纳和获取有价值的数据。“现代人从大数据里挖掘价值的过程与古老的沙里淘金有着惊人的一致性,只不过对象从实物变成了抽象的代码。”[8]美国布什政府曾于2002年提出了一项针对所有可获得的数据进行挖掘的计划,目的用于追踪恐怖活动,该计划被称为整体情报预警(total information awareness,简称TIA)。TIA计划无疑在隐私倡导者当中受到极大的关注,虽然最终它并没有被国会通过,但其实这种计划已被冠以其他名称而得以真正实施。基于“斯诺登事件”可知,显然TIA计划已被PRISM计划,即“棱镜计划”代替。
在法律实践中,最重要和最困难的任务之一是事实调查,因为事实调查涉及证据的分析和收集。利用数据挖掘发现电子证据“连接信息点”是证据分析与收集的一种方法,它最早最成功的应用是针对信用卡欺诈。通过搜集用户的刷卡记录,信用卡公司分析这些记录与持卡人信息的特点之间的关系,得出某类持卡人的一个典型消费模式,即当这张信用卡被盗刷,或持卡人意图进行信用卡欺诈时,信用卡公司会通过刷卡终端搜集到处于这个模式之外的消费信息,进而标记持卡人并准备后续调查或拒绝交易。如今,当文字数据化后,计算机就可以对它进行文本分析,例如中国知网利用其拥有的“中国学术文献网络出版总库”为全文比对数据库,开发出TMLC2、AMLC、SMLC等学术不端检测系统,就是利用大数据信息监测技术开展“数字知识产权”维权的证据收集的成功应用。
依据我国的证据收集制度,证据的收集与提供原则上都是由当事人来完成,法官除法律规定的职权调查外,原则上没有证据调查与收集的义务。显然这种证据收集制度规定得过于简单又富于弹性,从而缺乏可操作性并导致司法实践中的混乱。诚然,我国法律在证据的收集方面还有一些例外的规定,例如为了克服或避免当事人意志以外的因素导致证据收集权与证明权的不平等而设立了证据保全制度。证据保全制度一定程度上实现了证据收集和证明在实质意义上的平等,同时也使得通过保全方式获得的电子证据的证明力有所提高。然而,民事诉讼中法官一般不会主动积极地帮助当事人调查证据,而需要由当事人申请,那么从申请到保全行为的实施必然有很大一个时间跨度,在电子证据可能随时灭失的紧急情况下,这种取证方式则可能因贻误时机而难以发挥其作用。同时,相同的电子证据因收集渠道和方式的不同也可能在可靠性上有所差异[9]。
在大数据时代最需要做的是努力使传统工作模式借助于大数据处理技术发挥更大作用,在大数据技术的基础上探讨如何促进人类自身发展,这才是推动人类社会前进的认知方式。电子证据往往以数据流的形式存在,具有很强的时效性,可充分利用云数据处理技术去收集保全电子证据。例如,美亚柏科的“公证云”、“存证邮”等电子取证服务平台等,构成大数据时代的事件快速反应措施。利用互联网云服务平台对电子证据的收集与保全的益处主要体现在以下三方面:首先是取证准备工作。在必要的时候,可以利用基础架构服务提供的条件,为用户建立一个专门的取证服务器,当事件发生需要取证时,只需要支付在线存储所产生的费用,而不需要额外配置人员去管理远程登录及其软件,所要做的只是操作云提供商web界面中的一些按钮。如果一旦产生多个事件反应,可随时调取,然后进行快速分析并得出结论。不过,为了充分发挥这项功能,取证软件供应商需要由过去传统的软件许可转变到新型网络许可模式。其次是缩短了取证时间。云服务平台的电子取证是24小时不间断地运行,随时都能发送、保存和展示信息。相比自然人,它的最大优势在于可完成与任何一种网上行为“同步工作”的要求,存储电子证据,根本不需要临时寻找存储设备,从而大大缩短取证时间。第三是电子取证可与司法鉴定、证据公证服务紧密结合。电子数据保存于云服务商专门设计的文件系统,为用户提供前期取证、中期存证以及后期出证的一站式服务,确保电子证据链条的完整性。
对用户而言,互联网云技术和智能手机的普及为开发大数据电子证据收集应用搭建了最好的虚拟第三方平台。一般而言,中立的第三方,资信状况比较可靠。由无利害关系第三方提供电子证据,理论上电子证据“保管链条”比较完整,在很大程度上能够保障电子证据的真实可靠性。
我国法律对收集证据的权利作了概括性的规定,但从整体上看,当事人的电子证据收集仍缺乏有力的法律保障。在现实世界中,许多行为看起来是“雁渡寒潭,雁过而潭不留影;风吹疏竹,风过而竹不留声”。但人类社会正迈进普适计算的时代,所有的电子设备都可以留下数据痕迹,人类的行为可谓“处处行迹处处痕”。这些设备和使用它的人,通过互联网互相交流,又形成了另外一个庞大的数据源。如何充分利用大数据技术挖掘有价值的数据信息、收集与保全电子证据,建构完善的公平接近证据权利义务体系,成为大数据时代电子证据收集的制度机遇。
我国现行法律制度关于当事人电子证据收集权利与义务的规定不科学,造成了当事人权利义务的不对等。如果从更深层次去考虑这一问题时,当事人电子证据收集权利与义务的失衡,不仅造成了当事人电子证据收集难的问题,而且在不能保证当事人充分收集电子证据的前提下,直接适用证明责任进行判决也会造成事实上的不公平[10]。当事人不能公平地接近证据,这一问题的存在已经影响到程序公正与正义,更有甚者将严重阻碍实体公正的最终实现。在大数据时代下完善电子证据收集权利与义务制度,是当事人公平地接近证据、实现其诉讼权利必不可少的手段。
(1)平衡电子证据的“隐匿事证自由权”与证明请求权
我国《最高人民法院关于民事诉讼证据的若干规定》第75条规定,有证据证明一方当事人持有证据而“无正当理由”拒不提供的情况,并且对方当事人主张的该证据内容是对证据持有人不利的,那么就可以推定该主张成立。也就是说,除非有正当理由而拒绝提出电子证据的情况,法院是不得推定对证据持有人不利的主张成立,或者是该证据应证的事实为真实,此规定在我国台湾地区被称为证据持有人享有的“隐匿事证自由权”。我国法律并未明确规定“正当理由”是什么,一般理解认为,持有证据的当事人享有某种值得保护的利益,足以与证据收集权能受保障的当事人的利益相抗衡的,自应允许其拒绝提出文书,方属妥当,或者是享有“合理隐匿权”。
民事诉讼法在赋予“隐匿事证自由权”的同时,也应当赋予当事人享有证明请求权。所谓证明请求权,是指对于在认定事实上所必要的证据上,应享有提出证据以证明事实的权利。如果不赋予当事人证明请求权,而持有证据一方享有“隐匿事证自由权”,这样的权利分配,则是回归到举证责任分配的基本原则性规定,当事人需要对于其有利的法律规范要件负举证责任。而经济学认为人是理性自利者,愿意自我承认不法情事者,恐怕只有圣贤人才会如此做,所以当然不会在没有法律规范的要求下,就自愿地将相关电子证据双手奉上。因此,理性自利的当事人自然会践行“隐匿事证自由权”,拒绝将相关事证提出,此一结果在大数据时代电子证据偏在的情况下,更显现出不公平、不公正的结果。也因此在特定情况下,举证责任分配的原则均有例外。如我国台湾地区《民事诉讼法》第 277条规定:“当事人主张有利于己的事实者,就其事实有举证的责任。但法律别有规定,或依其情形显失公平者,不在此限。”在大数据时代电子证据极易产生证据偏在的情况下,有扩大当事人文书提出义务范围的必要。我国台湾地区最高法院1999 年台上字第1361号民事判决认为“知悉事实、持有证据之当事人,在经请求时,必须说明事实、提出证据”的义务。所以,应当赋予当事人“证明请求权”,才不会因为证据偏在的情况而影响案件真实的发现。
(2)建构相应的法律制度以矫正电子证据偏在
证据偏在最大的危险是证据的销毁与篡改容易发生。为实现诉讼中“真实发现”、“公平”的基本价值,大数时代下电子证据偏在只能运用诉讼中的证据制度加以克服。一是对持有电子数据的当事人设置一定范围内的公法义务,强制其提交相关事证,例如借鉴书证的提出命令制。传统书证是指以文字、符号、图画等记载的内容和表达的思想来证明案件事实的,从法律角度来看,电子数据证据与传统的书证在传达案件信息的方式上是没有区别的。书证提出命令制是赋予举证当事人据以搜集他方所持文书作为证据的机会,可要求持有文书的对方当事人或第三人开示与诉讼有关联的文书资料,以贯彻当事人之间武器平等原则,保障其公平接近证据的证明权,并维持当事人在诉讼上公平公正竞争,促进诉讼及发现真实。很多国家立法都对当事人收集书证的程序作出了相关规定,只是在具体程序规定上存在一定的差异。如法国民事诉讼法规定了强制提出书证制度,即法官可以应他方当事人的请求,要求对方提交其持有的某项证据材料,如果该当事人拒绝提交,法官有权科处逾期罚款。在德国,文书提出命令是当事人所享有的主要证据收集方法[11]。而依据我国台湾地区民事诉讼法第342条、第343条规定,当事人有权“声请命他造提出文书”,即在申请状中载明他造有提出文书义务,而文书由他造所执者,则应由当事人申请法院命他造提出。法院认为应证事实重要,并且申请人请求正当,即可裁定命他造提出文书。
二是设置电子数据证明妨碍制度来约束持有电子数据的当事人的行为。传统的证据发现和电子证据发现最重要的区别是电子存储信息的数量和删除的难度不同。由于有巨大的存储容量的电子系统,越来越多的数据被保存,但当新技术致使以前的系统过时,恢复这些数据却是不容易的。掌握电子数据证据的当事人利用种种故意或过失行为来损毁证据方法形成证明妨碍,那么就会使负有证明责任的当事人陷于证据缺乏的境地,进而使案件事实处于真伪不明。根据诉讼法基本原理,受国家司法权管辖的任何人,只要其了解案件的事实情况,就有向法院作证的义务。日本在修订民事诉讼法时将这种义务扩展到文书提出范围上,即实现了文书提出行为的一般义务化。因而一般认为,“当事人应对法院用以查明事实真相的诉讼程序中所运用的证据加以保存负有普遍性的义务。”[12]这种义务或来自于法律规范的强制;或来自当事人自愿承担;或产生于案件提交法院,其权益受到威胁;或合理预见到以后会形成讼案时。当客观存在这种证明协力义务,而义务人无正当理由拒绝履行义务,对案件待证事实具有不可替代性的证据材料或证据方法构成妨碍致他人产生不利的裁判后果,即构成证明妨碍。
无论是民事、刑事或行政诉讼的案件,当事人可能为了掩饰自己的行为或其他影响自身权益的事证,往往会通过销毁、篡改证据的方式,让执法者难以追诉责任、他造当事人难以主张权利的结果。如果电子证据系统欠缺良好安全机制,则相关实证数据很容易遭到窜改、湮灭,降低电子证据的可信赖性与不可否认性,那么以篡改电子证据的内容或毁损数据的方法构成证明妨碍,就会使负有证明责任的当事人陷于证据缺乏的境地,致使案件事实真伪难辨。为此大数据时代电子证据规则中建置证明妨碍机制,若法律规范有要求当事人设置电子数据储存设备及保存相关电子数据的具体规范,对于诉讼进行中或预知诉讼发生可能之际,却以妨碍对方使用为目的,故意将相关涉及诉讼案件的电子数据证据灭失、隐匿或设置障碍使用等行为,则可以将此等行为视为证明妨碍,而可以考虑实行行政罚款,并认可对方关于该文书的主张或依该文书应证的事实为真实,或者是调整举证责任等措施,以有效遏止当事人此种违反协力义务的行为,这样能达到追求发现真实的目的。
从保障当事人电子证据收集权能的角度观察,在大数据时代电子证据偏在现象突显,当事人一方因证据的结构性偏在而无法取得另一方所持有的电子数据证据,有碍其诉讼上的主张与举证,违反当事人之间的实质平等,电子证据制度自当借鉴文书提出命令、证明妨碍制度的设置对处于弱势地位的当事人提供了保护手段,使诉讼双方当事人能够获得充公提供审理所需要的电子证据的能力或渠道。
(1)预测与偏见
有史以来,对于我们人类而言,遗忘一直是常态,而记忆才是例外。然而由于数字技术与全球网络的发展,这种平衡已经被改变了。运用大数据技术,如网络爬虫(webcrawler)技术使互联网记住了人们所有在网络中的行为,留在网络上的电子痕迹将在某一天成为证据,那是无法被擦除的。但基于过去行为而对未来进行判断这种判断本身是不完善的且易出错的,然而它们在商业决策特别是在招聘中却是经常使用。如史黛西·施奈德(Stacy Snyder)因为在个人网页上的一张海盗打扮喝酒状的照片被应聘学校搜索出,学校被以学生可能会看到教师喝酒的照片而受到不良影响为由而拒绝聘用[13]。但基于过去行为而形成的品性判断在司法领域却是受到严格限制的。《美国联邦证据规则》认为,品性证据可能导致陪审团偏见。品性证据在法律上被视为双刃剑,既具有证明价值也可能引起偏见。由于它具有误导倾向,对于如何应用品性证据,其要求既严格又往往给予复杂的限制[14]。
大数据预测给证据法基本理念带来的改变,不仅仅局限于当事人公平接近证据上,还会影响到任何运用大数据预测对我们未来行为进行责任判定的领域,也就是说基于当事人过去行为的点点滴滴进行分析来预测未来的行为,极易令裁判者产生“推理型偏见”和“道德型偏见”。大数据预测的准确性越来越高,那么通过大数据预测的结果在人们犯错之前,就可以提前采取某些措施。因为预测结果几乎不可反驳,人们也就无法为自己开脱。但是这种基于预测得出的惩罚不仅违背自由意志原则,同时也否定了人们会突然改变选择的可能性。当法官给当事人判定责任时,必须牢记人类意志的神圣不可侵犯性。人类的未来必须保留部分空间,允许我们按照自己的愿望进行塑造。否则,大数据将会扭曲人类最本质的东西,即理性思维和自由选择。通过大数据挖掘对未来可能行为进行惩罚是对公平正义的亵渎,因为公平正义的基础是人只有做了某事才需要对它负责,毕竟,想做而未做不是犯罪。社会关于个人责任的基本信条是:人只为其选择的行为承担责任。
(2)因果与相关
结构化数据的特征是“逻辑性强”,每个“因”都有“果”,非结构化的大数据事实上却没有“显现性”的因果关系,大数据不再关注事物之间的因果关系。但人们又陷入了一个历史的困境,那就是人们活在一个“上帝已死”的时代。当大数据时代由探求因果关系变成挖掘相关关系时,人们思考如何才能不损坏建立在因果推理基础之上的电子证据收集与认定。如今在日常生活中,由于惰性或者是习惯性直觉的存在,人们很少慢条斯理地思考问题,所以还会经常臆想出一些因果关系,最终导致对世界的错误理解。在小数据时代,很难证明由直觉而来的因果联系是错误的,因为人们大部分的习俗和惯例都建立在一个预设好的立场上,那就是用来进行决策的信息必须是少量、精确并且至关重要的。但是,当数据量变大、数据处理速度加快,而且数据变得不那么精确时,之前的那些预设立场就不复存在了。然而人们已经习惯了从因果关系的视角来理解世界时,致使大数据总是被滥用于因果分析,而且人们往往非常乐观地认为,只要有了大数据预测的帮助,法官进行个人责任判定就会更高效。事实上,通过大数据获得的电子证据并不能告诉人们因果关系。相应地,进行个人责任推定需要行为人选择某种特定的行为,他的选择是造成这个行为的原因。总之,大数据技术并不是建立在因果关系基础上的,所以它完全不应该用来帮助法官进行个人责任的推定。
相关关系分析为分析因果关系奠定基础。正因如此,英美证据法将相关性作为现代证据法律制度的基本原则。同样,我国证据法中被普遍认可的证据的客观性、相关性与合法性中,证据的相关性是最基本的属性,它也是证据理论的核心问题之一。其实通过找出可能相关的事物,我们可以在此基础上进行进一步的因果关系分析,如果存在因果关系的话,可以再进一步找出原因,这种便捷的机制通过严格的实验降低了因果分析的成本。通过大数据挖掘可以从相关联系中找到一些重要的变量,这些变量可以用到验证因果关系的实验中去。因为在大多数情况下,一旦完成了对大数据中的电子证据的相关关系分析,知道了“是什么”后就会继续向更深层次研究电子证据之间的因果关系,找出背后的“为什么”。因此在大数据时代电子证据的收集完全可以从相关关系出发,形成初步证据链条后,再依传统的证据收集方式进行证据调查。大数据挖掘的电子证据提供的不是最终答案,只是参考答案,为司法提供暂时的帮助。
大数据专家维克多·迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中认为,就像互联网通过给计算机添加通信功能而改变了世界,大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化维度。大数据已经成为了新发明和新服务的源,而更多改变正蓄势待发。伴随着大数据技术的进步,新的事实确认方式已经开始在司法领域挑战传统的事实认定法[15]。如今许多证据不再是以纸面的方式存储,而逐步转换成以数字的型态呈现,电子数据将不再只是证据法的一小分支,而将快速地成为一个主要的型态。电子证据制度在面对大数据的影响,而有所扞格不入的结果,应当积极应对,利用大数据带来的技术便利更加保障当事人能公平接近证据的权利。
参考文献:
[1] 维克多·迈尔-舍恩伯格,肯尼思·库克耶. 大数据时代:生活、工作与思维的大变革[M]. 盛杨燕,周涛译. 杭州:浙江人民出版社,2013.25.
[2] 沈达明. 英美证据法[M]. 北京:中信出版社,1996.46.
[3] 摩根. 证据法之基本问题[M]. 李学灯译. 台北:世界书局,1982.48.
[4] 周宝曜,刘伟,范承工. 大数据:战略·技术·实践[M]. 北京:电子工业出版社,2013.61.
[5] 尹伟民. 证据能力规则之理性分析与现实选择——以民事诉讼为视角[J]. 大连理工大学学报(社会科学版),2012,33(3):117-121.
[6] 赵国栋,易欢欢,糜万军,等. 大数据时代的历史机遇:产业变革与数据科学[M]. 北京: 清华大学出版社,2013.21.
[7] 全国人大常委会法制工作委员会民法室. 《中华人民共和国民事诉讼法》条文说明、立法理由及相关规定[M]. 北京:北京大学出版社,2012.108.
[8] 郭晓科. 大数据[M]. 北京: 清华大学出版社,2013.61.
[9] 刘显鹏. 论电子证据的认证规则体系——以《民事诉讼法》修订为背景[J]. 大连理工大学学报(社会科学版),2013,34(2):87-91.
[10] 汤维建. 民事诉讼法全面修改专题研究[M]. 北京:北京大学出版社,2008.105.
[11] 何家弘,张卫平. 外国证据法选译(上)[M]. 北京:人民法院出版社,2000.485.
[12] 毕玉谦. 民事诉讼证明妨碍研究[M]. 北京:北京大学出版社,2010.265.
[13] 维克托·迈尔-舍恩伯格. 删除:大数据取舍之道[M]. 袁杰译. 杭州:浙江人民出版社,2013.34.
[14] 道格拉斯·沃尔顿. 品性证据:一种设证法理论[M]. 张中,张保生,王进喜译. 北京:中国人民大学出版社,2012.2.
[15] 米尔建·R·达马斯卡. 漂移的证据法[M]. 李学军译. 北京:中国政法大学出版社,2003.200.