刑事大数据证据现实论*

2023-03-04 00:50:18
关键词:证据

黄 健

(中国政法大学法律硕士学院,北京 100088)

一、问题的提出

“大数据几乎会改变我们对任何事情的观点与做法,包括法律实践的方式方法。”[1]具体到刑事诉讼,舍恩伯格率先提出:“(搜查、扣押的)‘合理原因(probable cause)’标准是否应当改为‘以概率表述的原因(probabilistic cause)’标准”的设问。①See Schonberger M V,Cukier K.Big Data A Revolution That Will Transform How We Live,Work,And Think,Houghton Mifflin Harcourt Publishing Company,2014,p.17.在大数据势必会介入并革新刑事诉讼的“技术决定论”理念下,我国学者通过对侦查信息化及美国预测警务(predictive policing)的观察,率先提出并探索了大数据侦查问题。②参见王燃《大数据侦查》,北京:清华大学出版社,2017年,第30页。鉴于搜集与固定证据是刑事侦查的核心活动之一,运用证据证成案件事实乃侦查活动的最终目的,学界继而以“大数据证据”为论题展开研究,③参见周蔚《大数据在事实认定中作用机制分析》,《中国政法大学学报》,2015年第6期,第81页;刘品新《电子证据的关联性》,《法学研究》,2016 年第6 期,第189-190 页;邵俊武《法律视野下的大数据问题研究》,《法治社会》,2016 年第2 期,第45-46页。同时,我国刑事判决书中也出现了“大数据分析报告”的证据材料。④参见陈某某故意伤害案,新疆维吾尔自治区乌鲁木齐市中级人民法院(2020)新01刑初45号刑事判决书。尽管如此,相较于大数据侦查,大数据证据的理论与实践探索尚无充足的案例样本与域外资料,这在引发研究难题的同时也形成了宝贵的研究机遇。对于何谓大数据证据、应属何种证据种类等基础问题的研究,虽呈现繁荣状态,但多为纯粹的理论思辨,且多采技术驱动下的革新立场,言必新增法定证据种类、新设证据规则。⑤参见郑飞、马国洋《大数据证据适用的三重困境及出路》,《重庆大学学报》(社会科学版),2022 年第3 期,第210 页;卞建林、曹璨《信息化时代刑事诉讼面临的挑战与应对》,《吉首大学学报》(社会科学版),2021 年第5 期,第26 页;张建伟《司法的科技应用:两个维度的观察与分析》,《浙江工商大学学报》,2021年第5期,第47页。此种技术支配下的对策论(Solutionism),虽具有显著的创新性,但缺乏对所研究事物现实存在样态的观察,进而呈现“技术乐观主义”。本文拟回归现实论(Actualism)立场,对刑事诉讼中“大数据证据”的实践现实做细致观察,并回归已有证据理论及制度,对大数据证据的理论繁荣做现实解读。

二、刑事大数据证据的实践现实

现实论(Actualism)是哲学领域的形而上范畴,主张任何事物均呈现为“存在”,并不存在任何超越现实存在的事物,存在就是现实。①See Christopher M."Actualism",The Stanford Encyclopedia of Philosophy,网址:https://plato.stanford.edu/archives/sum2022/entries/actualism/.访问日期:2022年3月21日。当探讨“大数据证据”这一技术驱动的新兴事物时,势必应对其实践中的存在样态进行观察,以免陷入对臆造之物的自说自话。下文将首先对刑事诉讼中“大数据证据”及相关革新语词的使用情况做直接观察;而后,由表及里地对现有依托大数据技术获取材料的运用情况展开考察。

(一)尚无“大数据证据”语词的直接使用

在大数据等国家战略性信息技术同各领域相融合的情势下,“大数据证据”这一革新性语词具有逻辑上的可接受性。然而,综观中国、美国刑事诉讼实践,却尚未发现“大数据证据”一词的现实使用。

1.基于我国刑事诉讼的观察

在已公开的刑事裁判文书中,尚未检索到包含“大数据证据”关键词的刑事案例。已有研究指出:刑事诉讼存在人脸、步态等数据比对,以及对嫌疑人员组织结构、案件资金数据等技术分析的大数据证据实践,②参见马明亮、王士博《论大数据证据的证明力规则》,《证据科学》,2021年第6期,第646页。也即基于数据库比对及算法分析的大数据证据。③参见林喜芬《大数据证据在刑事司法中的运用初探》,《法学论坛》,2021年第3期,第29-30页。鉴于此,笔者依托中国裁判文书网,以更为宽泛的“大数据分析”“大数据比对”“大数据检索”,甚至是“海量数据”等关键词进行搜索,可获得刑事裁判文书近百份。然而,通过对裁判文书的逐一筛选,排除前述关键词仅为涉案企业或人员业务内容描述、诈骗或传销手段说辞,以及其他并不涉及证据运用、裁判说理的偶然命中情况,仅剩裁判文书45份,④裁判文书检索和分析截止日期为2022年7月2日。随着时间的推移,检索所得裁判文书情况可能出现变化。具体内容涉及:运用大数据技术进行的身份比对⑤参见曹某某抢夺案,湖南省益阳市中级人民法院(2022)湘09刑终23号刑事裁定书。、车辆比对⑥参见王某、孙某某盗窃、抢劫案,河南省清丰县人民法院(2019)豫0922刑初180号刑事判决书。、指纹比对⑦参见尹某某故意杀人案,新疆维吾尔自治区巴音郭楞蒙古自治州中级人民法院(2018)新28刑初320号刑事判决书。;位置及行踪的分析与匹配⑧参见张某故意伤害案,甘肃省兰州市中级人民法院(2021)甘01刑初25号刑事判决书。;异常情况或犯罪嫌疑的发现与预警⑨参见张某某虚开增值税发票案,黑龙江省黑河市中级人民法院(2018)黑11刑初18号刑事判决书。、对超越人力分析能力的大量数据的机器分析⑩参见解某某组织领导传销活动案,陕西省咸阳市中级人民法院(2018)陕04刑终131号刑事裁定书。;基于特定数据库的数据检索等。⑪参见詹某某、陈某某、于某等虚开发票案,广西壮族自治区贺州市平桂区人民法院(2020)桂1103刑初114号刑事判决书。值得提出的是,即便此类刑事裁判文书中出现了“大数据+某某”的技术性语词,但大都一笔带过,并不会对相应技术的基本原理与操作方法做具体叙述。

在45 个案例中,有30 个将大数据技术运用所得材料及相关情况,转化为公安办案经过、说明材料,并用作证据使用。侦查机关“情况说明”,实则依托超越立法的突破性司法解释而产生,⑫参见谢波《我国刑事诉讼中“情况说明”的属性、样态与规制》,《甘肃政法学院学报》,2016年第5期,第12页。虽其证据属性及资格饱受争议,⑬参见黄婕《“情况说明”的证据学属性分析——兼论侦查人员出庭作证制度之构建》,《中国刑事法杂志》,2010 年第5期,第76-77页。但刑事审判实践对此类说明材料的采用率极高,⑭参见李勇、余响铃《侦查机关“情况说明”的证据属性研究》,《民主与法制》,2013年第6期,第181页;马党库《刑事诉讼中情况说明之于定案依据》,《人民司法》,2012年第21期,第26-27页。甚至呈现证据资格的自然认定、证明力优先接受的现实样态。⑮参见陈瑞华《刑事诉讼的中国模式》,北京:法律出版社,2010年,第183-189页。由此,情况说明的转化在使大数据材料畅通无阻地进入刑事审判的同时,也免除了对此类材料用作证据的深入讨论。此外,尚有案例将公安机关运用“海量数据分析系统”生成材料明确为书证⑯参见陈某某诈骗案,江苏省南通市崇川区人民法院(2020)苏0602刑初186号刑事判决书;包某某盗窃案、徐某某盗窃、妨害信用卡管理案,江苏省海门市人民法院(2020)苏0684刑初32号刑事判决书。、将经大数据技术获取的视频监控图像、人像比对截图直接以试听资料形式呈现法庭,①参见张某某强奸案,四川省彭州市人民法院(2019)川0182刑初429号刑事判决书。或是基于大量数据分析的技术属性,将分析结果明确归属于鉴定意见。②参见解某某组织领导传销活动案,陕西省咸阳市中级人民法院(2018)陕04刑终131号刑事判决书。仅有两个案例使用了“大数据分析报告”这一技术革新语词,以表征所涉证据形式。③参见李某故意伤害案,新疆维吾尔自治区乌鲁木齐市中级人民法院(2020)新01刑初57号刑事判决书;覃某某故意杀人案,广西壮族自治区来宾市中级人民法院(2021)桂13刑初16号刑事判决书。

基于以上分析,我国司法机关对于大数据引发的证据语词革新持谨慎态度,并未主动援引并使用“大数据证据”表述,即便刑事诉讼存在依托大数据比对、分析获取材料的实践运用,但大都通过办案情况说明的形式转化,将所涉大数据语词表述、技术应用问题模糊化;另有小部分案例将经大数据技术获取材料转归传统证据形式。由此可见,大数据驱动的证据语词革新同刑事诉讼传统实践存在张力,在大数据证据尚无立法抑或司法解释基础时,司法机关自然会慎用该表述。

2.基于美国刑事诉讼的观察

在大数据洪流之下,美国刑事诉讼也出现了若干顺应性革新。大数据预测及分析结果可成为侦查及量刑决策的重要依据,但对于大数据材料能否用于审判程序,能否作为定罪证据使用的问题,美国尚无明确探索。即便是在刑事诉讼(criminal procedure)、刑事司法制度(criminal justice system)整体视域下展开的大数据革新问题探讨,也仅聚焦审前拦截和搜查的“合理怀疑”与“合理理由”标准的算法预测与标准量化。④See Simmons R.Quantifying Criminal Procedure: How to unlock the Potential of Big Data in Our Criminal Justice System,Michigan State Law Review,2016,Vol.2016,Iss.4,pp.947-948.在美国刑事判例中也并未找到“大数据证据”(Big Data Evidence)的相关表述,甚至也很难找到诸如我国“大数据分析”“大数据比对”等类似语词。通过更为精细的判例检索,可以发现:美国同样存在运用面部识别软件分析结果进行人身同一认定⑤See People v.Reyes,69 Misc.3d 963,963-965(2020).、基于手机基站信息(Cell Site Information)证明被告案发时位置及行踪等证据实践,⑥See Commonwealth v.Augustine,35 N.E.3d 688,698(2015).但此类判例并未出现诸如“大数据”“大数据+某某”的技术性语词革新。

法官在人民诉雷耶斯案(People v.Reyes)中指出:使用面部识别软件得出的匹配报告,只是一个侦查线索(lead),在审判中不会产生可采的证据,甚至不能单独作为证成逮捕已达“合理原因”(probable cause)标准的证据。⑦See Gray M.Data and Detention:Big Data and Location Information in Pretrial Services,Belmont Criminal Law Journal,2019,Vol.2,pp.174-175.在爱荷华州诉布思比案中(State v.Boothby),法官认为:调查官基于被告通信记录及手机基站地理位置信息,得出的被告位置判断是基于日常经验的推理,属于“非专家证言”(lay testimony)。⑧See State v.Boothby,951 N.W.2d 859,878-879(2020).而在乔治和沃森诉亚拉巴马州案中(George and Watson v.State),嫌疑人及其辩护律师主张,政府方证人基于PenLink 软件及手机蜂窝基站位置信息,分析得出的嫌疑人在案发时的位置及行踪属于专家证言(expert testimony),并应接受州证据立法关于科学可靠性的检验;州最高法院法官则主张,前述证言应属于专家证言。⑨See George and Watson v.State,only the Westlaw citation is currently available,2021 WL 68997.在新墨西哥州诉莫里尔案中(State v.Morrill),被告主张无论是智能分析,还是电子物证工具软件(forensic toolkit)的检验结果均属于传闻,并主张智能分析结果应接受科学证据可靠性检验。主审法官及合议庭认为,人工智能软件或计算机自动形成的证据均无人为干预,不符合传闻证据的“主张人”(declarant)要件,而且前述自动生成证据的提出也并非要证明其主张的真实性。此外,分析软件已经受FBI 探员独立测试,若干调查官对分析软件的实际运用及检测已形成了有效的同行评议,因此,运用该软件生成的证据具有足够的可靠性,可被法庭采纳。⑩See State v.Morrill,only the Westlaw citation is currently available,2019 WL 3765586.

以上案例说明,基于遵循先例的判例法传统,以及复杂的可采性证据规则,美国刑事司法对于大数据驱动的证据语词革新更为谨慎,甚至体现出一定的“绝缘性”。即便同样存在大数据比对、分析等诉讼实践,但审判法官均将裁判思路回归现有证据规则体系,探讨所得材料可采性等基础问题。

(二)浮现中的“大数据证据”尚无实质革新

纵使“大数据证据”等技术驱动的革新性语词尚未被现实使用,但始终有观点主张,“刑事大数据证据”的实际运用确已在诉讼中浮现。然而,此类实践例证多是在数据量级持续增长背景下,循迹过往侦查信息化、电子数据分析的谨慎实践。大数据技术应用也仅是为了应对数据量激增,多体现为工具价值,而非基于海量混杂数据获取知识增量的核心应用价值。

就刑事诉讼中海量数据比对分析的实践运用而言,提及频率最高的当属公安人像大数据比对。公安机关通过对户籍数据、出入境数据、检查站数据等业务数据的收集,并采集各类证件照片和现场照片以形成海量数据,经由数据抽取、数据清洗、特征提取、多算法融合、比对结果可视化等技术处理,最终以比对值呈现人像比对、人员筛查等分析结果。①参见于晓昀、朱振华、钟鑫《基于公安大数据的人像比对系统设计》,《中国安防》,2018年第Z1期,第74-78页。类似地,美国依托其驾照数据库,构建了包含1.17 亿成年人图像信息的面部识别网络,以获取嫌疑人身份的比对信息或认定报告。②See Haddad M G.Confronting the Biased Algorithm: The Danger of Admitting Facial Recognition Technology Results in the Courtroom,Vanderbilt Journal of Entertainment and Technology Law,2021,Vol.23,Iss.4,pp.896-897.相较于上述基于大数据库的检索与比对,一个更为典型的“大数据证据”实践,即对大量涉案数据的技术分析,以挖掘案件关键事实要素。此类案例也多被用作“大数据证据”现实存在的核心例证,相关论述常援引的一个典型案例即e 租宝案,其资金交易流水多达几十亿条,集团OA 系统数据涉及200 多台服务器,全案数据总量达30TB 左右。③参见刘品新《论大数据证据》,《环球法律评论》,2019年第1期,第23页。经电子数据检验与司法会计鉴定的共同协作,最终证成投资人数与投资金额等案件定罪、量刑的核心要件要素。在美国的新墨西哥州诉莫里尔案中(State v.Morrill),涉儿童网络犯罪特别工作组特工欧文·佩纳运用Roundup 软件,对点对点的文件共享网络BitTorrent进行1周7天、1天24小时的无间断监控检查,并基于特定的哈希信息寻找可能包含儿童色情的种子文件(torrent files)。④See State v.Morrill,only the Westlaw citation is currently available,2019 WL 3765586.此类案件的核心问题在于,所需分析的涉案数据量较大,很难通过传统的人工分析与计算完成。因而,办案机关借助若干大数据技术,并发挥其工具价值,以高效、准确地获得案件事实认定的关键信息及证据。

然而,以上被认为是实践中正在浮现的“大数据证据”,均可在非大数据语境下找到其历史印记。传统的信息化侦查实践,同样存在借助侦查信息平台及各类社会信息系统实现嫌疑人自动比对与自动报警的技术实践。⑤参见郝宏奎《论侦查信息化》,《中国人民公安大学学报》(社会科学版),2005年第6期,第125页。早在20 世纪90 年代,美国政府便开始将资源投入电子人脸识别领域,并很快将运用嫌疑人图像与数据库中成千上万图像比对以确认嫌疑人身份的技术构想付诸实践。21 世纪初,北卡罗来纳州的联邦调查机关就已经开始使用驾照照片来寻找逃犯。⑥See Nawara J.Machine Learning:Face Recognition Technology Evidence in Criminal Trials,University of Louisville Law Review,2011,Vol.49,Iss.4,pp.607-611.不仅如此,即便是在小数据时代,诸如集资诈骗、组织、领导传销活动等犯罪,同样存在涉案“数据”量大、计算复杂的典型特征。诚然,此类涉案数据虽不可与大数据同日而语,但案件核心要件的证成,同样需要司法会计、电子数据检验鉴定人员完成对大量混杂数据的技术分析。在美国电子物证技术领域(digital forensics),一个永恒的经典话题即对不断增长数据规模的技术应对。早有研究指出:常规调查所面临的已达TB 量级的多样化数据,对于彼时的电子取证技术可能是压倒性的(overwhelming)。⑦See Richard G G,Roussev V.Next-Generation Digital Forensics,Communications of the Association of Computing Machinery,2006,Vol.49,Iss.2,p.78.由此,众多学者试图推介数据挖掘(data mining)、数据精简(data reduction)、分布式处理(distributed processing)、人工智能辅助,以及其他革新性技术,以提高电子取证在涉案数据持续增长背景下的应对能力。①See Quick D, Kwang K, and Choo R.Impacts of Increasing Volume of Digital Forensic Data: A Survey and Future Research Challenges,Digital Investigation,2014,Vol.11,Iss.4,p.292.

由此可见,当前所谓的“大数据证据”实践,只是由于涉案数据量级增长到一定程度,而不得不依托大数据技术的工具维度应对,并没有改变小数据时代数据比对、挖掘、分析的基本原理。如基于大数据平台的信息检索,其仅是运用大数据挖掘技术获取基础数据层保存的原有数据;又如涉案大量数据分析,也仅是运用大数据采集、预处理、挖掘等技术,对基础数据所蕴含固有信息的简单加成。此类实践并没有显现依托大数据获得知识增量的目的属性,也即并不能证成“大数据证据”区别于已有证据实践的实质性革新。

三、刑事大数据证据的理论现实

相较刑事诉讼实践对于大数据证据语词创新及适用革新的审慎态度,若干理论研究却呈现出“技术中心”立场上的“制度革新论”。具体而言,大数据证据概念的学理界定尚处于彰显话语个性的自由解读阶段。其中,将大数据证据解读为不同维度的“系统论”,奠定了大数据证据不同于已有证据形式的创新观点。然而,我国刑事证据制度以证据种类划分为基础,在主张大数据证据概念、种类划分,以及后续审查认定规则革新的同时,尚需考虑现有刑事证据理论及制度的现实、创新主张与制度稳定间的矛盾平衡。

(一)系统性并非大数据证据独有

大数据概念本身在数据、技术、应用三个维度的多义性,直接导致了大数据证据集海量基础数据、大数据技术、分析结果于一体的系统论解读。该系统性证据概念虽看似革新,但实为“大数据”+“证据”概念的简单组合。同时,之所以某类证据会呈现为系统性,是因为此类证据所蕴含内容的获取,需要借助专门技术手段以实现证据原始形式与应用形式的转化,系统性是所有蕴含非显见信息的证据的共有属性。

1.大数据证据的“系统论”

谈及“大数据证据”,一个最为直观的理解就是能够证明案件事实的大量数据。然而,实践中鲜见大量数据之于认定案件事实的径直使用,从证据运用的各个环节进行观察,大数据的直接运用均难以发挥证明作用,②参见谢君泽《论大数据证明》,《中国刑事法杂志》,2020年第2期,第126-127页。甚至出现有学者提出的“数据倾倒”现象,即掌握数据一方通过“倾倒”海量数据,致使对方无法参与阅卷、质证等诉讼活动。③参见程龙《论大数据质证的形式化及其实质化路径》,《政治与法律》,2022年第5期,第98页。大数据实现其巨大革新力量的关键,在于通过对大量数据的分析以获取对特定事物的新知识、新见解。“运用大数据分析手段对信息进行处理,得出的报告、结论、意见在办案中发挥着越来越大的证明作用。”[2]由此,相关学者在探讨“大数据证据”时,将其限定为“基于海量电子数据形成的分析结果或报告”。④参见刘品新《论大数据证据》,《环球法律评论》,2019年第1期,第25页。更为典型的,有学者在行文中虽使用了“大数据证据”的概念表述,但全文贯穿式地呈现了“大数据分析”可作为一种新的证据手段,在证据推理中发挥作用的主要观点。⑤参见周蔚《大数据在事实认定中作用机制分析》,《中国政法大学学报》,2015年第6期,第66-78页。

上述概念解读是对于大数据运用初始样态抑或终局样态的一维观察,尚有学者从多个维度提出了大数据证据的“系统论”。例如,有学者主张大数据证据应由“大数据集”和“大数据算法结论”两部分构成,“算法结论”作为大数据证据的一种客观反映,与作为大数据证据本体的“大数据集”密不可分,二者共同构成大数据证据。⑥参见元轶《证据制度循环演进视角下大数据证据的程序规制——以神示证据为切入》,《政法论坛》,2021 年第3 期,第132页。又如,大数据证据的外延,不仅包括最终呈现的数据材料,还应当包括关于案件的全数据,对于非结构化数据处理所采用大数据技术的说明材料,对于大数据分析方法(主要包括算法)运用合理性的说明材料,有关案件关联性、合法性、真实性等内容的说明材料。⑦参见徐惠、李晓东《大数据证据之证据属性证成研究》,《中国人民公安大学学报》(社会科学版),2020 年第1 期,第50页。有学者更为概念化地将大数据证据界定为:“建立在大量弱关联的电子数据之上,通过数据挖掘、数据碰撞、模型建构等技术增值得到的具有强关联性的、能够用来证明案件事实的分析报告。”[3]83此种“二维一体”甚至是“三维一体”的概念界定,呈现出的典型特征即指称事物的复杂性。这种复杂性也成为大数据证据不同于现有证据形式的创新论基础。

2.“大数据”与“证据”概念的直接组合

大数据证据概念的多维度“系统论”,直接源于大数据概念本身的多维度定义,可视为“大数据”+“证据”语词复合解释的必然结果。对于什么是大数据,尚不存在明确的通说性概念。从字面构成进行直观理解,大数据似乎就是大量的数据集合。但不论是麦肯锡、亚马逊、纳斯达克,还是国内外的相关学者,在将大数据解读为大量数据集合的同时,均涉及数据处理、管理、分析等技术。①参见大数据战略重点实验室《大数据概念与发展》,《中国科技术语》,2017年第4期,第44页。国际数据公司(IDC)甚至直接将大数据定义为:“为更经济地从高频率的、大容量的、不同结构和类型的数据中获取价值的新技术。”可见,大数据“通过数据集的挖掘,最终达至超越数据自身价值的目标。”[4]“大数据的战略意义不在于掌握庞大数据信息,而在于对这些含有意义的数据进行专业化处理。”[5]除在大量数据集合基础上突出大数据技术属性外,其他概念界定还将大数据引申至应用价值及社会发展的角度。②参见大数据战略重点实验室《大数据概念与发展》,《中国科技术语》,2017年第4期,第45页。也就是说,大数据最终在应用层面得以呈现,就是基于大数据集合和大数据技术以支持决策。③参见朱扬勇、熊赟《大数据是数据、技术,还是应用》,《大数据》,2015年第1期,第80-81页。大数据概念集数据、技术及应用之“三维”为“一体”。与此相对应地,大数据证据可呈现为包含大量基础数据、大数据技术及大数据分析结果或意见的三个维度的系统。其中,基础数据层是应用层的数据来源,应用层的比对、分析结果是证据材料呈现的最终形式,数据层与应用层的联通则为大数据技术与人类专门知识的共同作用。

3.依专门知识解读证据的系统性呈现

有学者主张,大数据证据相较于其他证据种类的独特之处,在于集海量基础数据、大数据分析技术、大数据分析结果于一体的表现形式。④参见严若冰《以定义为中心的大数据证据独立种类研究》,《山东警察学院学报》,2020年第5期,第88页。然而,多维度系统性呈现并非大数据证据的专属特征,依靠专门知识解读的物证运用也呈现类似的系统性。诚然,前述系统性并未被普遍认识,这是因为案件事实证成有着对证据内容的天然重视,而相对忽视证据的存在形式。诉讼实践对于言辞证据的依赖更是强化了“重内容轻形式”的偏好。

德国、日本等大陆法系国家将证据概念解构为“证据资料”与“证据方法”两个层面,证据资料即是在内容层面与待证事实相关的内容或素材;证据方法则是在形式层面调查证据资料并证明待证事实的手段。“手段”一词具有抽象性与模糊性,有学者认为,手段实指“作为认定事实素材的人或物”[6],由此可将证据分为人证、物证和书证。更为具体地,手段就是指“法官得籍由外在感官而为调查的有形物”[7],包括人证、鉴定、书证、勘验及当事人陈述五种。我国学者将证据简明地分解为证据事实与证据载体两个方面。证据载体可简单地理解为证据的外在表现形式,而证据事实则为证据内部蕴含的事实片段。⑤参见陈瑞华《刑事证据法》(第三版),北京:北京大学出版社,2018年,第89-92页。

蕴含显见证据事实或称证据资料的证据,如口供、书证、一般物证等,并不需要专门技术的介入以获知证据内容,从证据获取到证据认定亦无须转变证据载体或称证据方法;而对蕴含非显见证据事实或称证据资料的证据,尤其是尚需专门知识方能获知内容的物证,其在诉讼中的运用,自然呈现出多个维度的系统性。以DNA 证据为例,其原始证据载体为血液、唾液、精斑等人体体液,而将此原始载体直接呈现法庭并不能发挥证明作用,尚需基于DNA分析技术,以形成专门性意见的证据载体形式,方能有效地展现蕴含的证据事实。同理,大数据证据的原始载体为大量基础数据,将其直接运用于诉讼不仅具有技术障碍,同时难以发挥证明作用;为挖掘蕴含于大量基础数据中的证据事实,需要大数据技术及人类专门知识的共同作用,并最终以小数据或意见性证据的形式呈现。大数据证据的系统论,实为通过借助专门技术手段实现证据载体或称证据方法的转化,以获取非显见的证据事实或称证据资料。

(二)新增大数据证据法定种类亦无必要

革新论者提出的新设大数据证据种类的主张,并未考虑我国刑事证据制度的现实,大数据证据与我国现有法定证据种类并非同一位阶的概念。在认可大数据证据概念的系统论解读的基础上,应分别观察其海量基础数据的原始载体形式与分析结果呈现的最终载体形式,“分而治之”地划归于不同的法定刑事证据种类之中。

1.新增“大数据证据”种类的反思

纵使我国封闭式法定证据种类列举饱受质疑,①参见龙宗智《进步及其局限——由证据制度调整的观察》,《政法论坛》,2012年第5期,第6-7页。但该立法模式根深蒂固,且可作为其他证据规则的逻辑起点。②参见孙远《论法定证据种类概念之无价值》,《当代法学》,2014年第4期,第99页。创新论者同样主张:大数据证据是技术驱动下的新证据形式,与现有法定证据种类存在显著不同。具体而言,“大数据分析报告应当单列出来作为独立的新型证据种类,也即大数据证据”[8]。之所以将大数据证据视为新型证据种类,是因为与电子数据相比,大数据证据具有混杂、多元、依赖复杂分析方法的显著不同;而与鉴定意见相比,大数据所依赖的鉴定方法又存在本质差异。③参见徐惠、李晓东《大数据证据之可行性研究》,《山东警察学院学报》,2019年第6期,第72页。值得注意的是,将大数据证据视为新证据种类的创新论,并非简单的观点主张,尚需考虑对现有证据理论及制度影响。更为宏观地,确立大数据证据种类的主张,同样会涉及在法治与改革、法律的稳定性与社会变动性之间的矛盾平衡问题。④参见陈金钊《法律如何调整变化的社会——对“持法达变”思维模式的诠释》,《清华法学》,2018年第6期,第80页。“将大数据证据独立为一种新的证据形式显然是一种逃避问题的做法,这种将难以归类的证据材料独立处理的‘打补丁’方式长久来看不利于形成稳定的证据制度,甚至会给司法裁判活动造成阻碍。”[3]85

不仅如此,将大数据证据独立为新证据种类的观点本身亦难成立。首先,正如有学者主张:“大数据证据与我国刑事诉讼法所规定的法定证据种类并不是同一位阶的概念。它是站在证据生成层面,以‘证据的生成是否建立在大数据原始素材基础之上’的标准对证据的概括,而不是建立一个完全独立于现有法定证据种类的、完全崭新的证据类型。”[9]而后,笼统地谈论大数据证据应归属哪一证据种类的问题,既不可行又不具有实践指导意义。在对大数据证据概念进行多维度解读后,对其应归属何种证据种类的探讨应“分而治之”,当分别观察大数据证据原始载体形式及最终可能呈现的载体形式后,可以发现,创新论者之于新设大数据证据种类的主张尚不具有充分的必要性,基于现有证据理论及制度即可对大数据证据的种类归属做自洽性解读。

2.在现有证据种类体系中的划归

大数据证据的原始载体为电子数据,最终表现形式则需具体问题具体分析:当以分析报告呈现时,则具有“准鉴定意见”的证据地位;而当以经技术处理获取的小数据形式举证时,则可能表现为书证、试听资料、电子数据等传统证据。

首先,大数据证据的原始载体为电子数据。尽管有学者主张,相较于电子数据,大数据证据呈多样、混杂、非结构化,且需要更为高阶分析方法,但此类差异不足以使大数据证据独立于电子数据。对于电子数据的概念界定及特征表现,学界众说纷纭,但大都认为:“电子数据的主要特点应当是‘数字化形式存储、处理、传输的’信息”[10],即证据载体为数字信号,⑤参见龙卫球、裴炜《电子证据概念与审查认定规则的构建研究》,《北京航空航天大学学报》(社会科学版),2016 年第2期,第42页。可被机器识别与运算。美国学者在谈及electronic evidence 或digital evidence时,也提到了由计算机或其他设备存储或生成⑥See Goode S.The Admissibility of Electronic Evidence,The Review of Litigation,2009,Vol.29,Iss.1,p.2.、争议事实证明材料的计算机化(computerized)版本等特征。⑦See Grimm W P,Capra J D,and Joseph P G.Authenticating Digital Evidence,Baylor Law Review,2017,Vol.69,Iss.1,p.2.由此,电子数据具有的数字性——以二进制码为其内部载体,及处在计算机、服务器、网络、云等虚拟空间的特性,⑧参见刘品新《电子证据的基础理论》,《国家检察官学院学报》,2017年第1期,第152-153页。奠定了其与其他证据种类的不同之处。大数据概念的产生,正是基于自动监测设备(automated observation)、可穿戴技术(wearable technology)及物联网(internet of things)引发的数据量级的阶梯形飞跃。⑨See Mohanty H,Bhuyan P,and Chenthati D,Big Data A Primer,Springer India,2015,p.31.在前述数据采集端不断聚积的数据自然是电子化或数字化的,与此同时,大量电子化数据常存储于由数据接口或网络技术连接的外部存储设备、作为分布式存储数据节点的存储设备,①参见杨俊杰、廖卓凡、冯超超《大数据存储架构和算法研究综述》,《计算机应用》,2016年第9期,第2466页。以及由计算节点组成的具有共享及虚拟化属性的云存储系统之中。②参见谭霜、贾焰、韩伟红《云存储中的数据完整性证明研究及进展》,《计算机学报》,2015年第1期,第164-165页。由此,大数据证据的原始载体——大量混杂数据,自然具备电子化及存在于虚拟空间的两大要素,毋庸置疑地属于电子数据范畴。“大数据证据是电子证据的一种演进,一条条的电子数据累积而成大数据。”[11]

其次,最终以分析报告形式呈现的大数据证据,属于“准鉴定意见”的证据形态。有观点指出,大数据技术主要基于机器算法展开,而传统的鉴定则由人类凭借专门知识并借助专业仪器进行。这一观点人为割裂了大数据技术运行中的人机交互。大数据的技术体系涉及大数据采集与预处理、存储与管理、计算模式与系统、分析与挖掘、可视化及大数据隐私安全等方面。将原始大数据转化为呈堂证据形式的大数据技术至少要涉及计算模式与系统、大数据分析与挖掘,以及结果的可视化。前述技术的运行均有专业人士参与的空间,如计算模式的选择、数据挖掘前的打标签、挖掘结果的审查修正等。即便通过不断迭代,前述过程均可自动运行,但最终结果的可视化,仍需借助人类专门知识予以解读。此外,大数据分析总是呈现诸多元素间各种各样的相关关系,这虽然能够迎合人们希望获取事物间普遍联系,以提升认知的目的,但将大数据分析结果用作证据时,必须要从杂乱无章的或然性关系中建构出能为诉讼所用的归纳性结论,而这一数据专家的专业思维活动无法被机器取代。根据《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第100条规定,大数据分析并不属于当前司法鉴定业务范围,可暂且赋予大数据分析报告“准鉴定意见”的证据地位。不仅如此,基于海量数据比对得出相似度匹配的专门意见,具有超越传统同一认定鉴定意见证明作用的巨大潜力。“传统鉴定意见是对犯罪嫌疑人与犯罪现场发现痕迹进行1:1 同一认定,而算法是将犯罪现场发现的生物痕迹进行1:N 数据库比对。”③参见马明亮、王士博《论大数据证据的证明力规则》,《证据科学》,2021年第6期,第652页。

最后,当最终以从大量混杂数据中分析获取的“小数据”举证时,则自然可归属于书证、试听资料、电子数据等范畴。大数据技术分析结果并非均以报告形式呈现,一些情形下,可获取与案件相关的部分数据。诚如学者主张:直接由大数据平台导出的信息记录,可归属于书证种类之下;④参见罗文化《大数据证据之实践与思考》,《中国刑事警察》,2019年第5期,第20页。大数据中跟案件相关的数据信息可纳入电子数据范畴,⑤参见何家弘、邓昌智、张桂勇等《大数据侦查给证据法带来的挑战》,《人民检察》,2018年第1期,第56页。相类似地,当海量数据中的某一或部分数据其本身可以作为定案依据时,应当认定其证据形式为电子数据。⑥参见吴春妹、叶萍、黄成等《大数据证据的定位与运用——以互联网金融犯罪案件为切入点》,《人民检察》,2020年第3期,第56页。

四、结 语

综上所述,刑事诉讼尚未出现“大数据证据”的语词使用,所谓正在浮现的“大数据证据”实践亦不具有实质的革新性与典型性。理论上,大数据证据系统论并非其特有,因而亦无须在立法中新增大数据证据种类。以上极具现实色彩的观点主张,并不意味着对大数据巨大变革潜力的否定,亦非热衷已有证据理论及制度的“怀旧主义”。对刑事大数据证据实践及理论现实的审视,意在识别并无存在基础的、纯粹主观臆造的破坏性革新(disruptive innovation),同时,着力探索具备理论与实践支撑的可持续革新(sustainable innovation)。未来,刑事大数据证据发展可呈现两种现实样态,一是大数据要素仅发挥工具价值,以获取海量基础数据中固有信息作为认定案件事实的材料;二是大数据要素进一步发挥核心应用价值,通过基于海量数据分析获取的信息增量作为认定案件事实的依据。就第一种样态而言,即使不会改变刑事司法证明的逻辑机理,但大数据以工具属性与刑事证据运用的融合,必然会对证据合法性与真实性审查带来重要影响。就合法性而言,应增加对技术手段应用合法性、新兴权益(如个人信息、数据权利)保护合法性等考量。对于真实性,可借鉴英美科学证据理论,评估所用大数据技术的科学可靠性,并在程序上探索算法开示、专家辅助人有效参与等质证举措。①参见王燃《大数据证明的机理及可靠性探究》,《法学家》,2022年第3期,第70-71页;卫晨曙《论刑事审判中大数据证据的审查》,《安徽大学学报》(哲学社会科学版),2022年第2期,第85-86页。至于第二种现实样态,可能会引发以大数据相关关系取代传统因果关系的事实认定机理革新,应重点审视该认识论革新在刑事诉讼中的可接受程度,甚至是潜在的伦理道德隐忧。应审慎对待此种更为激进的大数据证据发展样态,可以美国证据法上的限制可采性(limited admissibility)为制度范本,②See Blinka D D.Ethical Firewalls,Limited Admissibility,and Rule 703,Fordham Law Review,2007,Vol.76,Iss.3,p.1239.探索构建我国特定目的下大数据证据有限使用规则,如仅作为侦查决策、量刑裁量等非定罪证据使用,或作为证成犯罪目的、动机、明知等主观要件要素的证据,以在填补证据空白的同时,相应降低证明难度。

猜你喜欢
证据
垃圾袋里有证据
大灰狼画报(2022年2期)2022-05-23 12:57:16
火灾调查中直接证据与间接证据的运用
水上消防(2021年3期)2021-08-21 03:12:12
隐藏的证据
如何实现行政证据和刑事证据无缝对接?
证据会说话
幼儿园(2017年8期)2017-06-06 08:15:56
对于家庭暴力应当如何搜集证据
红土地(2016年3期)2017-01-15 13:45:22
手上的证据
“大禹治水”有了新证据
家庭暴力证据搜集指南
手上的证据