摘 要:大数据证据质证形式化是实践中亟需解决的难题。根据大数据证据运用方式,可将其分为报告分析型、识别比对型与预测推论型三种类型。大数据证据多由控方持有,且质证对象是由原始数据衍生而来的派生材料,法院对大数据证据的认可度较高。由于质证规则缺失、质证质效不高等原因,大数据证据出现“实质不能”的质证困境。需针对大数据证据构建询问、对质、异议等一般质证规则;根据报告分析型、识别比对型、预测推论型等不同类型大数据证据确立质证要点;从坚持直接原则与言词原则、加强控辩双方的平等对抗、注重大数据证据运用能力提升三方面优化大数据证据质证环境。
关键词:大数据证据 质证规则 交叉询问
随着大数据在司法领域的深度运用,作为承载机器算法与人工智能技术的“数据资料”成为证明个案案情的关键。关于大数据证据的概念,目前实践中存在不同看法:一是根据证据来源来界定,认为利用大数据侦查手段取得的证据即大数据证据,而大数据侦查手段包括了数据查询、数据比对及数据挖掘等方式。[1]二是根据实质标准来判断,即有人工智能与算法的介入。[2]三是根据分层理论来建构,即大数据的层次性决定了单纯的数据资料难以作为证据使用,只有结构化处理后的数据信息,才能成为大数据证据。[3]四是根据现有法定证据类型来转化,即大数据证据不是独立的证据类型,需将其转化为现有法定证据类型方可使用,实践中出现了四种转化形态:(1)书证;(2)鉴定意见;(3)情况说明;(4)专家辅助人意见。[4]
上述认识上的差异体现了大数据证据的多元属性。从总体来看,大数据证据是为了实现诉讼目的,而对庞大的原始数据资料进行分析所得的证明案件事实的材料。关于大数据证据的研究成果多聚焦于证据获取及风险控制上,庭审质证环节的研究略显不足。
一、大数据证据类型及质证的实践现状
由于大数据证据的外延过于宽泛,在不同的情境下会呈现不同的样态,因此,需先对大数据技术应用予以分类,并在此基础上就大数据证据质证情况进行分析。
(一)大数据证据的类型
从证据类型的划分来看,大数据证据与法定证据类型之间存在着不一致性,关于其归属亦充满争议。根据大数据证据运用的方式及目的,可将其分为报告分析型、识别比对型与预测推论型三种类型。
1.报告分析型大数据证据。其逻辑起点在于利用算法程序对某一数据库相关数据进行归纳及分类,通过分析得出发展趋势及结论。该类证据主要适用于如下场域:一是在重大经济犯罪案件中,对涉案金额及资金走向进行分析。二是在涉案人数众多案件中,对人员加以分类分级得出组织架构。如:“e租宝”案件涉及受害人115万余人,涉及几千家银行、几万个数据账户、数百家公司。如果仅凭人工对上述证据进行梳理,显然在法定办案期限内难以完成。在该案的侦查过程中,侦查机关通过对阿里云平台上涉及的海量数据进行分析,得出了经营者之间的不同层级关系,并最终确定了进出流水数额,锁定了主要犯罪事实。[5]
2.识别比对型大数据证据。即为了实现对相关数据的同一性认定,对数据库中相关数据进行分析比对所得到的材料。实践中运用最为广泛的是人脸识别、DNA鉴定等。其基础在于利用特定人的生物信息及社会信息,在数据中进行搜索比对,从而锁定与之相关联的匹配信息。这种大数据证据需要先进的技术及庞大的数据库作为支撑。如:对DNA的比对,需要相关对象的脱氧核糖排列信息片段,并转化为与之对应的计算机二进制信息符号,在对大量数据进行比对的基础上才能得出关于相似度的结论。
3.预测推论型大数据证据。该类型证据大多用于预测未来走向,即基于某些行为的惯性特征及不同个体的特殊爱好,通过大数据提前预测其接下来的行为,主要适用于对犯罪嫌疑人的侦查和逮捕。但需注意的是,要提升预测的精准性,不仅需要对被预测者的行为数据进行分析,还需结合其他行为主体进行对照,极易出现侵害其他主体个人隐私的情况。数据库中绝大多数的数据都属于个人隐私,如在进行预测的过程中进行采集、比对,难免有公权侵犯私权之嫌,需平衡侦查犯罪需要与个人隐私保护之间的关系。
(二)大数据证据质证的实践特点
1.大数据证据持有者多为控方。在刑事诉讼中,公诉人与辩护人皆可提供证据,并针对对方证据发表质证意见。理想化的质证模式应当是“你来我往”,但由于控方处于较强势的地位,因此“证据偏在”现象一定程度存在。而在大数据证据的运用上尤为明显,大数据证据多由控方持有且用于证明对己有利的事实。辩方几乎在庭审质证过程中不提交大数据证据,仅作为申请质证的主体存在。在整个庭审质证过程中,大数据证据的运用几乎呈“一边倒”的现象。
2.质证对象多为派生材料。大数据证据在实践中的适用,主要是采取对基础数据材料进行加工从而得出派生材料的方式,控方向人民法院提交的大数据证据亦不是原始的数据材料,而是派生材料。主要有检验报告[6]、鉴定意见[7]、分析报告[8]、情况说明[9]等,原始数据资料作为质证对象的情况较为少见,往往只是作为抽样样品与勘验对象出现。
3.质证内容主要围绕关联性展开。大数据证据质证往往围绕待证事实与证据之间的关联性展开,从而实现其证明价值。直接证据的证明力较之间接证据更大,大数据证据大多数为间接证据,直接利用原始数据材料进行证明的情况较为罕见。因此,关联性便成了主要关注内容。同时,对大数据证据真实性与合法性的争论主要聚焦于数据扣押、储存设备移交及数据保管上,质疑原始数据材料真实性、运算过程等的情况极为少见。
4.大数据证据认可度较高。由于大数据证据的特殊属性,对其质证有时需依赖于技术专家。人民法院通常不会主动要求控方就合法性、合理性等进行说明,在判决书中也往往就质证情况一笔带过。[10]只有少数案件控方才对专业性问题进行回应,聘请技术专家出庭质证的情况亦较为少见。对于此类证据,人民法院的认可度较高,亦不会要求控方就合法性、合理性等进行说明。
二、大数据证据质证的困境
根据《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第71条规定,证据未经质证等法庭调查程序查证属实,不得作为定案的根据。大数据证据与传统类型的证据相比具有特殊性,不能完全借用传统类型证据质证规则。在实践中主要存在如下三方面问题。
(一)质证规则缺失
质证规则是保证质证程序规范高效运行的关键和前提。我国现行法律关于大数据证据的质证规则存在不足,既体现在基本证据规则的缺失上,亦体现在操作规范的不健全上。如,控方一般在提交大数据证据的同时,会向人民法院另行出具一份情况说明,在庭审过程中除非辩方主动提出,否则一般不会就该证据进行专门的调查。此外,基于控方所处相对优势地位,有时会出现将其所有“裸数据”全部出示给辩方的情形,辩方难以在短时间内对海量数据进行分析、确认。
(二)质证质效不高
部分大数据证据原始数据处理、分析方法完全隐匿于“暗箱”中,这种不公开性在报告分析型大数据证据中,显得尤为突出,主要体现在两个方面:一是控方很少主动就该证据涉及的技术原理进行解释;二是专家证人等专业技术人员很少出席法庭对技术原理予以阐释。再加之法院对于大数据证据认可度比较高,相关证据材料的质证极易出现“形式化”。
三、大数据证据质证困境的化解
(一)构建大数据证据一般质证规则
大数据证据质证规则的构建,需立足于其技术性和专业性特征,在明确举证规则的基础上,从询问规则、对质规则、异议规则三方面构建一般质证规则,将质证重点聚焦于算法技术上。
笔者认为,大数据证据举证规则的构建,应当至少包括如下五方面的内容:一是明确举证目标。由于举证责任在控方,因此举证目标的确定主要由控方确定。总体来看,控方的责任在于证明被告人罪名及罪重罪轻,关涉上述事实的大数据证据皆要呈于法庭并予以重点阐释,以证明案件事实。二是出示证据材料。在庭审过程中,举证要做到思路清晰,目标明确。原则上控方作为证据持有者,需对大数据证据中涉及的算法原理、数据来源作出全面说明,同时亦需对可能存在的误差等进行厘清。三是明确举证顺序。大数据证据的举证顺序,可以借鉴传统举证规则中“公诉人——被害人——辩方”的顺位。首先由公诉方向法庭出示证据,其后由相关技术人员出席说明情况,接着听取被害人陈述,讯问被告人。四是确立排除规则。设置刚性的大数据证据说明意见排除规则,可以较好地保障当事人合法权益,最大程度确保相关技术性证人能够出庭说明情况。其应出庭而未出庭的,应当对该大数据证据加以排除,不能作为证据使用。五是明确举证重点。由于大数据证据多用来证明定罪量刑问题,因此有必要加以单独和重点举证。控方不仅要出具原始数据源载体,亦要提供由此形成的派生材料。
一般质证规则建议从如下方面构建:
1.询问规则。关于大数据证据的质证,控辩双方皆有权利在法庭上发问,发问对象主要是相关技术人员及该证据的保管者、鉴定者等。但是在发问时,应当遵循如下规则:一是关联性规则。控辩双方针对大数据证据的发问必须与案件事实相关,不得提问与之无关的问题。二是辅助性规则。经申请审判长同意,发问方可以借助相关模型、照片等就大数据证据的技术性问题进行发问。三是不公开规则。对于涉及国家秘密及个人隐私的大数据证据,应当在非公开的状态下进行发问。
2.对质规则。首先,明确对质范围。在整个对质过程中,应当以辩方为核心进行。具体而言,被告人及辩方律师可与公诉人、相关技术人员、大数据证据的保管者等进行对质。其次,完善对质程序。对质程序的启动包括依职权与依申请两种模式。依职权模式的启动主体为审判长,在必要时亦可以赋予法官启动的权利。只要当事人提出申请,无特殊理由法院应当准许。最后,设置对质条件。当控方与辩方就相关案件事实及证据存在不同意见时,应当组织质证。
3.异议规则。异议规则的构建包括异议主体、对象及处理、救济程序等。一般而言,异议可以在整个质证环节提出,包括大数据证据及证明行为。法官可以对双方提出的异议进行发问,要求进一步阐释异议理由,或者可以要求异议提出方通过意见陈述的方式加以说明。倘使异议理由成立,法院应当予以支持;对于不能当庭确定理由是否成立的,可以休庭;若异议理由不成立,则应当当庭驳回。在救济程序方面,应当将异议过程载入庭审笔录,不服异议裁决的,可在上诉或抗诉时一并要求人民法院进行实质审查。
(二)不同类型大数据证据的质证要点
一是报告分析型大数据证据的质证要点。在质证时需要对利用原始数据生成派生大数据证据材料的算法技术及设计动机进行合理说明。算法技术要合法、中立、客观,不能侵害其他主体利益。同时,要采取相对公开原则,在做好代码技术等保密的基础上,尽量阐明算法技术原理。二是识别比对型大数据证据的质证要点。要注重听取专业技术人员的意见,必要时专家辅助人要出席法庭并就相关原理予以阐释。可以运用多种系统对大数据证据进行验证,着力提升识别比对运算系统的精准性。三是预测推论型大数据证据的质证要点。由于预测推论型大数据证据直接影响到犯罪嫌疑人的定罪,因此在质证时要重点阐释预测推论型大数据证据与待证事实之间具有关联性。因为其以证明“未来的行为”为要点,本质上在于“类似性”的判断,必须确定犯罪嫌疑人即将实施的行为与预测推论的行为具有相似性。
(三)大数据证据质证相关配套措施
1.坚持直接原则与言词原则。刑事诉讼直接原则包括实质上与形式上两方面的内容。形式上的直接原则要求参与主体亲自到场,而在大数据证据方面则强调控方主体到场,包括大数据证据的保管者、鉴定者等一系列与之相关的责任人员均应出庭,对大数据证据的相关问题接受询问并作出说明。实质上的直接原则强调证据的原始性,应当将所有数据源存储于介质之中一并提交人民法院,在整个移交过程中要确保完整性。
言词原则必须满足如下两方面的要求:一是在法庭上必须以陈述的方式进行,对于控方提供的证据,必须接受质证。不能以大数据证据“情况说明”作为认定案件事实的依据。二是证据的调查必须以言词方式进行,对大数据证据的质询、回应等皆要以言词的方式进行,必要时可以其他手段进行辅助,但不能取代言词方式的主导地位。
2.加强控辩双方的平等对抗。质证的形式主义影响着刑事证据的实质审查。为此,有必要从交叉询问规则的要求出发,加强控辩双方的平等对抗。一方面,要着力完善专家辅助人出庭制度。对于所有种类的大数据证据,只要需要对专业技术问题进行说明,皆可要求专家辅助人出庭予以阐释。对于重大、疑难、复杂案件,如辩方无能力邀请专家辅助人,法院应当为其指派。另一方面,提供大数据证据的一方应当承担算法解释的客观义务。大数据的提供者多为控方,应当注重从欲要证明的结果出发揭示其形成依据。[11]对于大数据证据涉及的算法技术,除非出于保密需求,否则一律应当公开。
3.注重大数据证据运用能力的提升。大数据证据运用能力主要体现在举证、质证及辩论的对抗性上。此外,庭前准备工作亦是关键所在,需要控辩双方归纳大数据证据与待证事实之间的争议焦点,提升庭审应对技巧。法官亦应根据庭前控辩双方提交的证据材料,确定是否有必要由专家辅助人、鉴定人等出席庭审。加强大数据证据运用能力的培训是实现大数据证据质证实质化的关键,应当通过组织定期授课和业务培训的方式,促使司法人员全面把握大数据证据的特点及质证要点。