司法大数据证据运用中律师有效辩护的困境及其化解路径

2024-05-09 23:24付静宇
关键词:辩方控方证据

付静宇

(中国政法大学 刑事司法学院,北京 100088)

随着人工智能技术和大数据侦查模式的不断推进,大数据证据在刑事诉讼中的运用方兴未艾。理论探讨及司法实践都认可了大数据证据对于证明案件事实的重要作用[1]。然而,目前与大数据证据相关的研究多集中在大数据证据的取证和运用及其证据属性的界定等方面,关于大数据证据运用对刑事辩护影响的研究则处于起步状态。尽管有学者已经注意到大数据这一技术对传统辩护制度的冲击,但对大数据证据运用中的辩护权保障并未深入细致研究。此外,在司法实践中,大数据证据运用也进一步加剧控辩双方对抗能力的不平衡,对辩护律师阅卷权、取证权、质证权等传统权利产生明显挑战。

为此,本文深入分析大数据证据运用对律师辩护权有效行使产生的影响,从而揭示大数据证据运用中律师有效辩护的缺失和困境,进一步探讨如何在大数据证据运用背景下回应有效辩护的制度要求。同时,本文讨论的有效辩护,是一种狭义的有效辩护,是以辩护律师“行为导向”为研究背景的,仅从辩护律师角度出发,强调辩护律师应当尽职、尽责、尽力提供充分有效的法律帮助。

一、大数据证据的内涵及其特点

当前,大数据证据已经出现在刑事案件中,并在相关判决书中表述为“大数据检测技术”(1)参见《安徽省宿州市埇桥区人民法院一审刑事判决书》(2017) 皖1302刑初218号。“大数据分析”(2)参见《浙江省宁波市江北区人民法院一审刑事判决书》(2017) 浙0205刑初357号。等。大数据证据在刑事案件中的应用必然会呈现不断增多的趋势,其原因可归为以下方面。一是随着信息技术的发展,人类社会开始向数字社会转型,“在数字世界里,我们都会留下电子脚印或电子指纹”[2]。犯罪嫌疑人智能化、隐蔽化的犯罪行为必然会留下相应的犯罪信息,控方可以利用大数据证据对犯罪嫌疑人留下的犯罪要素或犯罪片段进行分析、比对,从而侦破犯罪。二是网络时代的快速发展导致电信诈骗、非法侵入计算机系统等网络犯罪不断涌入人们的生活,犯罪逐渐呈现出犯罪时空的复杂性、犯罪手段的多样性、犯罪对象不确定性等特点。在此背景下,越来越多的大数据材料作为这类新型犯罪的相关证据涌入庭审之中,有必要对大数据证据的内涵及证据属性等进一步讨论和分析。

需要明确的是,并非所有与大数据相关的证据就是大数据证据,必须将大数据证据与通过信息技术获得的信息区分开来,如侦查机关利用大数据平台所获取的被追诉人个人信息可以作为电子证据使用,而非大数据证据。此外,大数据证据也并不等同于电子数据。大数据证据突出强调对数据的加工、对比等分析过程,其兼具证明案件事实和分析思维、方法、技术的综合体[3]。

纵观之,大数据证据的内涵应包括以下内容。一是以大数据为基础。“大数据”强调数据体量之大、数据类型和格式多样化,存在复杂化、非结构化等特点。“实践证明,大数据的简单算法比小数据的复杂算法更有效。”[4]因此,通过利用在规模上、内容上足够大的数据,能够最大化地挖掘出证明案件事实的有效信息。二是以算法决策为核心。这是大数据证据与其他证据区别的关键所在。算法作为一种数据处理路径,具有智能化、自动化等特点,算法通过对海量数据进行自动识别、筛选、对比,实现对数据的深度学习[5]。大数据证据利用算法将相关主体和案件事实之间的关系还原出来,这一算法决策是隐蔽的、晦涩的,难以被其他主体所理解。具体而言,大数据证据在刑事诉讼过程中的运用呈现以下特点。

第一,专业性。大数据证据的专业性主要表现在两方面:一是大数据证据本身是智能化算法决策的结果,具有专业性;二是大数据证据的获取、分析需要一定专业能力。大数据证据是以电子数据为外在物质载体的,由于网络空间和现实空间存在间隔,再加上数据体量巨大,大数据证据的获取往往需要凭借专业人员的技术协助[6]。同时,由于大数据证据最终呈现为智能化的算法结论,其对海量数据进行提取、对比、筛选等过程并不具有可知性,需要专业人员协助相应主体进行审查。

第二,衍生性。大数据证据属于间接证据,具有衍生性。根据证明来源的不同,证据可以分为原始证据和传来证据。前者强调证据未经复制、转述,具有较强证明力,例如,刑事案件中被追诉人的供述。一般认为,原始证据是最佳证据。后者强调证据来源于间接途径,包括他人转述等,其证明力弱于原始证据。大数据证据是算法对与案件事实相关的海量数据进行二次挖掘和对比分析所得出的数据,本质上是算法二次加工后的数据。例如,在解某某组织、领导传销活动案中,控方提供的被追诉人管理的网络层级、账户收支情况的证明,正是运用大数据分析方式从而实现了对被追诉人海量数据的筛选。

第三,相关性。大数据证据的相关性是指其相关性证明逻辑。算法通过收集、提取、筛选与犯罪案件事实相关的数据,形成相应的分析报告以发挥其证明作用。这其中凡是与算法模型相关的数据都会被提取。在传统司法证明中,控诉方提供的证据与案件事实之间是一种逻辑意义上的严密推理和论证。与传统因果性证明逻辑的强相关性相比,大数据证据具有弱相关性。由此看来,大数据证据的相关性证明逻辑与传统司法因果性证明逻辑存在明显差异。例如,在“彭某某侵犯个人信息案”中,控方从公司官方的 70台数据库中调出的200 条个人信息,与被告人私人 U 盘中的 50 条个人信息重合率高达 76%,这仅能说明两者存在相关性,但并不能证明这 50 条信息就是从公司数据库中拷贝出来的,并不能得出其具有因果性(3)参见四川省成都高新技术产业开发区人民法院(2018)川0191刑初94号刑事判决书。。

大数据证据的上述属性和特点决定了辩方不能对其采用和传统证据一样的辩护策略,同时,现有的辩护制度设计难以适应新型的大数据证据,导致有效辩护的实现遭遇重重障碍。具体而言,其衍生性强调算法对大数据的二次加工,这就导致其决策过程易产生“算法黑箱”和“算法歧视”,即辩方在不知情的情况下难以行使辩护权,增大了有效辩护难度;其专业性造成辩方在缺乏专业知识的情况下难以有效阅卷,辩护空间大大压缩;其相关性的证明逻辑加大了辩方的质证难度,降低了有效辩护的可能性。

二、大数据证据运用中律师有效辩护困境

有效辩护理论在1932年美国鲍威尔诉阿拉巴马州的案件中被确认,即辩护律师的有效帮助是正当程序的必要条件。此后,美国经过一系列判例将不符合有效辩护的情形予以排除,并确立无效辩护及其判断标准,丰富了有效辩护的内涵和概念[7],既要求律师达到形式意义上的参与辩护,又要求律师做到实质辩护。目前我国理论界抑或实务界对“有效辩护”的内涵和概念存在诸多争议,对“有效辩护”的准确含义并没有明确规定,这就导致律师辩护是否有效难以准确判断,这背后隐含着有效辩护究竟是行为导向抑或结果导向的讨论,即有效辩护是强调律师进行了有效辩护还是被追诉人获得了有效辩护。本文从辩护律师的行为导向而非结果导向为切入点进行有效辩护困境的探讨,即辩护律师应当充分行使辩护权,尽职、尽责、尽力地履行其辩护职责。但是,大数据证据的专业性、衍生性、相关性等特点,令律师的阅卷权、取证权、质证权等诉讼权利难以发挥作用,因而很难实现律师的有效辩护。

(一)阅卷不能大大压缩有效辩护空间

阅卷权是律师有效辩护权的核心内容。其基本逻辑是庭审质证时间受限,辩方难以在控方举证后立刻予以反驳,需要充足的时间和机会进行诉讼准备,完成对控方案卷事实和证据材料的阅卷[8]。 因此,在阅卷权难以有效行使的情况下,辩方无从行使辩护权。我国《刑事诉讼法》第40条规定:“辩护律师自人民检察院对案件审判起诉之日起,可以查阅、摘抄、复制本案的案卷材料。”一方面,阅卷权是辩护律师进行有效辩护的前提和基础。通过查阅相关案卷,辩方可以知悉司法机关掌握的被追诉人所涉的犯罪事实及相关证据材料等。另一方面,阅卷权符合平等武装原则的要求。平等武装原则强调被追诉人面临司法机关指控时,具有与之相对抗的力量[9],辩方通过阅卷可以改变控辩双方“信息不对等”的局面。然而,随着大数据证据不断被应用于案件事实证明,传统阅卷权无论是其阅卷范围还是实际效果都难以应对司法信息化改革的挑战[10],主要有以下表现。

第一,大数据证据运用造成辩方阅卷范围狭窄。一是辩方对大数据证据的阅卷范围仅限于算法对碎片化数据运作后的最终结论,无法查阅大数据证据的数据源、算法等,难以针对其程序不足或者证据瑕疵等展开辩护。大数据证据包含显性信息量和隐性信息量。前者是指对海量数据运用算法得出的最终结论,后者则包括数据存在的软件环境,以及海量数据生成、存储等过程中形成的附属信息和相关痕迹等标识与算法运作过程等。然而,辩方查阅案卷相关材料难以获取其隐性信息量。控方在不考虑控辩双方实际数据分析能力差异的情况下只提供最终证据的做法,构成“数据倾倒”,是一种实质上的不平等[11], 辩方难以在全面阅卷、充分掌握信息的基础上进行有效辩护。二是数据和算法会成为“有罪推定”的帮凶,控方对案件事实的价值判断会影响大数据的合理利用[12],造成辩方对大数据证据的阅卷范围受限。大数据证据不仅可以证明被追诉人有罪或罪重,也可以发挥其有利于被追诉人的证明作用。由于办案机关提供大数据证据的主要目的是证明被追诉人有罪,因此,司法实践中的大数据证据多是以有罪证据的形式出现,其证明被追诉人无罪或罪轻作用被忽略,这实质上已经构成了控辩双方的不对等,阻碍了有效辩护的开展。再加上辩方受制于技术劣势,难以自行收集大数据证据证明被追诉人无罪或罪轻,其辩护效果大打折扣。三是辩方对大数据证据的阅卷范围受商业秘密、个人隐私保护等限制。大数据证据的数据源、算法往往是由网络信息服务提供者及商业主体等第三方平台提供,考虑到大数据证据所依据的算法属于商业主体的专利技术、大数据证据的数据源有可能经过重组转为涉及个人隐私的信息等情况,出于保护商业秘密和个人隐私等目的,辩方难以阅卷。

第二,大数据证据运用影响辩方实际阅卷效果。辩方行使阅卷权主要有两个目的,且目的是否完成、完成效果如何直接决定了辩方阅卷效果的好坏。具体为:一是发现对被追诉人有利、不利的证据,为之后庭审对不利证据进行反驳、对有利证据进行利用打下基础;二是识别刑事案件中的重点及难点部分,为辩护律师的辩护策略和辩护突破点提供线索。然而,大数据证据的应用严重影响了阅卷效果的正常发挥。一方面,控方受“有罪思路”影响,出于发现犯罪、惩罚犯罪的目的,往往是运用大数据以查获被追诉人犯罪事实,这就导致大数据证据多是以有罪证据的形式出现,辩护律师难以获取对被追诉人有利的证据。另一方面,由于缺乏相应的专业知识和技术水平,即使案卷笔录出现有关大数据证据的相关材料,辩方也难以知悉大数据证据的证明链条对其进行证据资格的质证,也难以对此制定针对性辩护策略。因此,与传统证据相比,大数据证据无论是数据体量还是技术复杂性都决定辩方单方面的阅卷行为难以满足其辩护需求,需要控方为其提供相应技术协助义务。控方除了向辩方出示相关案件材料外,更要求其应当以辩方可以理解的程度向其出示,避免辩方有阅卷之形而无阅卷之实。

(二)反驳性检验机制受阻降低有效辩护的可能性

反驳性检验机制强调形成判决基础的信息能够得到控辩双方的相互检验[13]。该机制的实现不仅依赖于有效辩护的存在,而且反过来促进有效辩护的发挥。其包括两项内容:质证权和取证权。质证权包括控辩双方面对面质证和交叉询问两部分。取证权包括调查并提交有利于被指控主体的证据。在法庭庭审中,质证一直以来作为司法证明的重要环节而存在。例如,最高人民法院在司法解释中明确规定证据未经当庭出示、辨认、质证等法庭调查程序查证属实,不得作为定案的根据。然而,质证的权利属性长期以来并无相应的规范性法律文件进行规定,导致辩方在申请证人作证等方面存在困难。直至2021年《新刑诉法解释》颁布,质证权才作为一项明确的诉讼权利存在。取证权和质证权相互依存,共同保障有效辩护的顺利进行。大数据证据的运用对传统意义上的反驳性检验机制产生了重大冲击。在质证权方面,主要有以下表现。

第一,大数据证据交叉询问规则的缺失。事实上,交叉询问作为质证的基本方式之一,主要目的是控辩双方按照相应顺序对证人进行发问或对证人证言的真实性进行质疑,以发现其漏洞或瑕疵,从而降低证人证言的证明力。大数据证据遵循与专家证人意见证据相同的证明机理[14]。 一方面,大数据证据是算法在海量数据基础上对其进行分析、对比等深度加工而形成的证据,无论是数据的获取、固定还是算法模型都需借助专业知识完成,其类似于专家证人证言。换句话说,大数据证据可以看作是程序代码生成的新型专家证据[15]。另一方面,在司法实践中,大数据证据也通常以大数据分析报告的形式出现,可以看作是大数据的鉴定意见,明显具有专家证人证言的特征。根据我国相关法律规定,辩护人可以对证人、鉴定人发问,可以申请法庭通知有专门知识的人出庭,就鉴定人做出的鉴定意见提出意见。由此可见,大数据证据也应当接受交叉询问。但我国法律对交叉询问规则规定得过于原则和简单,且控辩双方采用交叉询问方法调查证人证言的情形并不多见[16],交叉询问规则不够完善。此外,针对大数据证据存在专业性、复杂性等特点,辩方缺乏相应有针对性的询问技巧,大多采取直接询问而非间接询问的方法,导致对大数据证据的询问更多关注其形式合法性,欠缺对其实质内容的询问,包括数据源、算法运作的合理性等,难以发现其瑕疵或缺陷。

第二,大数据证据的证明逻辑导致辩方质证不能。与传统证明侧重逻辑上的因果关系不同,大数据证据的运用强调相关性,其将因果关系数据化,因果关系演变为变量之间的数理关系[17],主要体现为数据之间的相关,是一种概率意义上的推断。需要明确的是,相关性不等于因果性。相关性是统计学上的概念,侧重两个或多个变量的关联程度。因果关系是逻辑学上的概念,指原因引发结果,强调逻辑上的先后性。不可否认,大数据证据对待证事实有证明作用,其相关性符合证据的基本属性要求,可以作为证据在庭审中运用。需要考虑的是,一方面,大数据证据中的相关关系是建立在海量数据基础上的概率分析,并非所有数据都与待证事实存在相关关系,可能存在“伪相关”关系,表现为两个相关变量出于巧合或者第三个变量的影响而没有直接因果关系。正如上述所提及的,这一模糊性与“事实清楚,证据确实充分”的证明标准相冲突。在因果性证明逻辑中,辩方只需推翻行为与结果不具备直接性的前后关系即可,这一时序性和确定性通常是辩方推翻某一证据的质证重点,然而,相关性证明逻辑造成辩方难以发现并否定大数据证据对待证事实的相关性,引起实质上的质证不能。

第三,“证据转化”现象剥夺了辩方抗辩的权利。“证据转化”规则是在当前司法实务中处理证据能力的规则,指的是侦查机关采取不符合法律规定的手段获取的证据转换为合法证据而使用的规则[18]。目前法律规范并未对大数据证据的审查判断规则予以明确规定,可能存在相应机关将大数据证据转换为其他证据种类以逃避审判对大数据证据的合法性审查。例如,侦查机关通过大数据分析手段,挖掘、对比相关信息数据从而发现犯罪嫌疑人从事网络犯罪的证据,为避免其取证行为是否合法的争议,侦查人员往往向犯罪嫌疑人出示证据以获取其有罪口供,从而实现证据转化[19]。“证据转化”规则是对非法取证行为的掩盖,大大增加了冤假错案发生的可能性。更为重要的是,辩方无从得知证据转化前所存在的证据来源、取证手段是否合法,等同于直接剥夺其质证的权利。

在取证权方面的主要表现有以下两点。第一,第三方协助义务缺位导致辩方自行取证不能。与传统证据相比,大数据证据具有数据体量大、技术性强等特点,需要侦查机关调取、处理大量数据信息,这其中除了侦查机关内部的数据库之外,大量数据由网络平台等第三方占有或控制,因此,相关法律规定第三方平台有为相应国家机关提供技术协助的义务。例如,根据《网络安全法》第28条的规定:“网络运营者应当为公安机关、国家安全机关依法维护国家安全和侦查犯罪的活动提供技术支持和协助”。实际上,辩护律师受制于大数据证据复杂性、专业性等特点,自行调查取证往往需要借助第三方平台的信息协助。与此相对的是,相关法律条文尽管规定辩护律师有自行调查取证的权利,但并无明确规定第三方具有为辩护律师提供技术协助的义务。这就导致第三方存在以保护通信秘密、个人隐私等为由拒绝向辩护律师提供相关数据等情况,导致辩方自行取证不能。

第二,取证必要性的审查导致辩方申请代为取证不能。辩护律师除了可以自行调查取证之外,更多依靠申请相应机关代为取证的方法。根据《刑事诉讼法》第43条:“辩护律师可以申请人民检察院、人民法院收集、调取证据。”但是,最终仍然要由人民检察院、人民法院决定是否有取证必要,实践中存在办案机关以办案时间紧张、与本案无关等理由拒绝代为取证的情况,对于相应机关拒绝取证的情形,辩护律师并无相应的救济权,导致辩方取证权利受阻。此外,办案机关对于取证必要性的考察可能引起程序延迟,造成数据难以及时提取和保存,客观上阻碍了辩方取证。

(三)大数据证据的技术障碍增加了有效辩护难度

与其他证据类型不同,算法的科学性和准确性事关大数据证据本身的证据能力。通常观念认为算法决策的准确性远远大于人类的决策,大数据证据具有天然的可靠性。然而,事实并非如此,大数据证据的算法运作引发“算法黑箱”是不可知的,“算法黑箱”所具有的不透明性为“算法歧视”披上了合理的技术外衣,导致歧视行为难以被辩方发现,而“算法失灵”所带来的数据误差更是加剧了大数据证据的事实认定错误风险。总之,“算法黑箱”“算法歧视”和“算法失灵”这一系列问题直接影响控辩平衡,导致辩方在算法误差和模糊性的前提下,难以对大数据证据的真实性和合法性进行质证,增大了辩方进行有效辩护的难度。主要表现为以下三个方面。

第一,算法黑箱。算法黑箱包括技术层面的“算法黑箱”及程序层面的“算法黑箱”[20]。具体而言,在技术层面上,大数据证据包括原始数据、算法运作、结论输入这三个环节。但其所依据的海量数据库本身并不存在“黑箱”,存在“黑箱”的是在算法对海量数据进行分析、对比、碰撞的这一过程。例如,在“李某等非法吸收公众存款案”中,辩方并不清楚算法是如何对数据库中的原始数据进行分析进而得出“e租宝”的实际控制者及非法获利情况。算法透明是保障辩方知情权和正当程序权利的必要前提,算法如果不透明,辩方往往容易对大数据证据本身的合理性和正当性产生怀疑,然而“算法黑箱”的存在又导致辩方质证不能,这一恶性循环严重压缩有效辩护空间。在程序层面表现为辩方申请算法公开与保护商业秘密之间的冲突,这一程序“黑箱”反过来加重了算法的隐蔽性。例如,在“人民诉查布斯(People v. Chubbs)”这一案件中,法院驳回被告的算法开示请求以保护商业秘密,该案件也成为美国刑事案件中法官肯定商业秘密特免权的首例[21]。尽管我国刑事司法实践并没有保护商业秘密的规定,但是控方通过将大数据证据转化为证人证言、电子证据等,或是通过出示鉴定意见的方式,直接剥夺了辩方请求算法公示的权利。因此,无论是算法技术本身还是算法决策程序所存在的“黑箱”问题,其实质都是对公开透明程序的违反。

第二,算法歧视。算法决策是建立在原始数据基础上的核心运作机制。算法歧视大致分为三类:一是算法设计者有意或无意将个人偏见植入算法系统所引起的;二是算法学习过程中的数据偏差多引起的;三是外部因素干扰算法运行所引起的[22]。首先,算法系统是由商业公司等第三方主体所研发的,由于设计者文化背景、接受教育程度、思维模式和观念等存在不同,其研发的算法系统不可避免地带有个人偏见色彩。其次,算法本身是可以学习的,包括自主式学习或半自主式学习。然而,无论是自主式学习或半自主式学习,如果算法所依据的数据不准确,会造成算法决策出现偏差,产生“算法歧视”。最后,算法的外部干预包括程序不规范、外部隐形权力等导致“算法歧视”产生。

第三,算法失真。主要表现为算法具有自主学习性,其会对数据进行再加工,引发原始数据、图像等失真的现象[23]。例如,AI软件对照片进行加工导致其准确性降低[24],这一现象造成大数据证据本身的稳定性和准确性不足,也加剧了辩护困境。

三、大数据证据运用中有效辩护困境的化解路径

(一)有效辩护的前提:增加控方数据开示义务

与传统证据不同,大数据证据专业性、衍生性等特点加大了辩方阅卷权行使的难度,如阅卷范围狭窄、阅卷效果不受保障等。为此,有必要在阅卷权基础上增加控方的大数据证据开示义务,以保障辩方充分享有大数据证据的知情权,使有效辩护落在实处。需要指出的是,证据开示义务的重点体现在两方面:一是扩大阅卷范围,妥善处理阅卷权与保护商业秘密、个人隐私的关系,实现辩方全面阅卷;二是保障阅卷效果,控方应积极履行协助义务,实现辩方有效阅卷。

第一,针对阅卷范围这一问题,一是对大数据证据涉及被追诉人人身权、财产权等权利的,控方应当承担相应的公示义务,公示内容包括大数据证据所依据的原始数据和算法决策。对于其中存在的辩方阅卷受到商业秘密、个人隐私保护限制这一问题,应当妥善处理好不同主体的利益,要求控方在搜集海量数据时应当遵守正当程序,明确收集手段和方式并详细记载在相关材料中,尽可能避免造成个人隐私泄露,为辩方阅卷提供便利。必要时可以通过签署协议等方式,要求辩方履行保密义务,对于辩方利用商业秘密、个人隐私进行非法活动的行为,予以刑事处罚。二是应当确立“数字无罪”理念,其主要目的在于发掘数据和算法有利于被追诉人的证明作用[25]。明确大数据证据所具有的双重证明作用,需要控方针对可能有利于辩方的数据设计相应的判断指标和规则[26],从而助力算法识别并生成有利于被追诉人的证据。相应地,网络信息服务者等第三方平台应当为有效辩护提供必要的协助,不能简单以保护商业秘密、个人隐私为由拒绝辩护人行使权利。

第二,针对阅卷权难以保障阅卷效果的问题,需要控方积极协助辩方获取、分析、运用相关证据。与阅卷权不同,履行证据开示义务的主体是控方,控方需积极、主动协助辩方完成有效阅卷。阅卷权的主体则是辩方,辩方有权查阅相关案卷和证据材料,但是控方并没有协助的义务。因此,证据开示义务并不等同于阅卷权,证据开示义务是确保辩方精准、全面阅卷进而实现有效辩护的重要途径之一。此外,控方应当为辩方提供相应的技术协助。面对专业性极强的大数据证据,辩方的知识和技能存在局限,控方应当负责为辩方申请专业人员辅助,帮助辩方准确全面地分析、解决相关证据运用问题。

(二)有效辩护的重点:合理改造辩方对大数据证据的质证和取证思路

传统意义上辩护律师通过书面审查案卷笔录和证据材料即可发现证据之间的矛盾和疑点。然而,传统的辩护策略难以对大数据证据进行有效质证,交叉询问的缺失和相关性的证明逻辑都表明对大数据证据的质证应当在传统三性基础上凸显大数据证据的不同属性,才能更好发挥其辩护效果。

第一,辩方对大数据证据的质证可以从真实性入手。一方面是完整性,即电子数据载体、基础数据、算法、结论这四方面的内容全面、完整、准确,不存在恶意篡改或伪造情形。具体而言,辩方对其完整性质证可以从以下方面入手。其一是电子数据载体是否确保数据完整、准确,包括保管链条是否完整、是否出现破损或更换等情形;其二是输出结论是否全面、完整、准确地揭示其与基础数据的关系,根据基础数据能否合理推导出结论等;其三是算法是否通过符合性校验等;其四是基础数据在收集、对比过程中是否存在伪造、误差等情形,大数据与全数据的偏差是否属于合理范围等。此外,辩方还可以对基础数据运行所产生的附属信息进行质证,以判断其完整性。基础数据生成的同时会产生关于该数据收集、存储等行为相对应的时间、地点、设备名称等,这些信息一般不受人的主观因素影响[27],具有稳定性和可靠性,在辩方审查大数据证据的完整性和同一性中发挥积极作用。同时,辩方可以应用哈希值来进行电子数据和证据的电子签名、文件一致性检验等以判断其完整性。另一方面是科学性。大数据证据的科学性是决定其是否真实可靠的必要前提。辩方可以围绕基础数据分析是否具有可复现性进行质证。事实上,计算机对基础数据进行的筛选、比对、加工等过程,本质上是按一定标准逻辑归纳数据的过程,其最终结果具有稳定性和可重复性[28]。因此,以大数据分析的整体过程是否可复现作为检验大数据分析结果的标准为辩方质证提供合理依据。此外,辩方还可以进行算法目的符合性校验以判断其科学性,无法通过该校验的算法,表明其算法内部决策存在错误,即运用该算法的大数据证据不具有证据资格。

第二,辩方对大数据证据的质证还可从相关逻辑出发,论证其只能作为补强证据而存在。大数据证据中数据格式和标准多样,没有预定义的数据模型,这一非结构化特征决定了其难以按照传统的关联性标准对数据信息进行明确划分,也就是说,大数据证据是建立在基础数据之上的“二次加工”,根据关联性原则,所有的基础数据都是证据,都应当移送法庭,这一相关性证明逻辑与刑事诉讼的精确性等原则存在冲突,“可能产生以概率推断替代事实推断的隐忧”[29]。因此,大数据证据并不能独立证明案件事实,可以通过其相关性补强其他证据的证明力,即通过大数据证据与待证事实的高概率性,强化其他证据的证明力。此外,辩方可以利用大数据证据的相关性证明逻辑转变其辩护策略,即辩方仅需证明其存在合理怀疑,即可否认对被追诉人有罪或罪重的指控。

第三,有必要适用专家辅助人制度保障辩方有效质证。大数据证据以算法决策为核心,其专业性、复杂性是辩护律师有效辩护的实质障碍,这一技术上的不对等加剧了控辩双方的不对等。《最高法解释》第100条规定:“因无鉴定机构,或者根据法律、司法解释的规定,指派、聘请有专门知识的人就案件的专门性问题出具的报告,可以作为证据使用。”这一规定为大数据证据质证引入专家辅助人制度提供了规范依据。其主要作用是补强辩方对大数据证据相关专业知识的欠缺,提高其有效辩护水平。其主要工作内容包括:辅助辩方对控方提出的大数据证据的算法决策进行相应说明和解释,围绕基础数据、算法原理、相关结论的真实性、完整性、科学性与控方大数据证据的鉴定人员进行讨论和辩论。需要明确的是,专家辅助人在法庭审理中不享有独立的诉讼地位,其服务于申请主体一方。其参与法庭庭审所获知的大数据证据涉及商业秘密、个人隐私的,应当履行保密义务。

此外,对于办案机关存在的“证据转化”问题,应当加强规范取证监督,保证辩方有效质证。一方面,应当加强对办案机关大数据证据取证程序的合法性审查,包括证据来源、取证程序是否合法等。域外已经设立的技术侦查司法审查制度值得借鉴,即由中立的第三方主体对是否进行技术侦查进行事先审批[30]。同样地,办案机关对大数据证据的运用也可以适用第三方司法审查制度,保证其取证程序的合法。另一方面,辩方应当对办案机关所提交的案卷笔录和证据材料进行实质检验并综合判断,存在疑问的,可以申请有关的侦查人员出庭说明大数据证据收集的情况并做出相应解释。

在保障辩方取证权方面,应当赋予控方调取有利于被追诉人的大数据证据的义务。一方面,控方如果获得有利于被追诉人的大数据证据,应当立即调取并举证。这一义务本质上是对控辩双方取证能力差异的弥补和平衡,要求控方不得隐匿证据,也是诉讼真实和实体真实的体现。另一方面,控方应当为辩方获取大数据证据提供必要的技术协助,对存在有利于被追诉人的证据,应当及时告知被追诉人的辩护律师,并为其证据提取、分析等提供帮助。辩方申请办案机关调取大数据证据,控方无正当理由不应拒绝,必要时,可以申请法院调取相关证据。

(三)有效辩护的保障:赋予控方有限度的算法公开和算法解释义务

需要明确的是,无论是“算法黑箱”“算法歧视”抑或是“算法失灵”,本质上都是算法监管的缺失,规制这一系列算法问题的关键是保持算法运作封闭性的同时,加强其与外部的相互沟通[31]。因此,算法公开是有效监管和规制算法的重要途径。一方面,算法公开是保障大数据证据真实性、合法性的必要前提。另一方面,算法公开对确保辩方知情权并进行有效辩护具有重要意义。

第一,关于算法公开的内容。一是对于运用大数据证据证明被追诉人犯罪事实的,控方应当履行必要的告知义务。司法实践中存在控方为逃避辩方对大数据证据的质证,将大数据证据转化为书证、案件经过材料等进行应用,这一行为既违反了正当程序,也剥夺了辩方的知情权。二是算法公开包括算法所依据的数据库、算法原理的公开,但是算法公开是有限度的,源代码反映的是算法的技术水平,公开源代码并不会增加辩方对算法的可信度,反而可能会引发黑客恶意攻击系统等危险。例如,美国纽约市通过“1696法案”,规定了算法的源代码应当予以公开并据此成立“算法问责特别工作组”。然而,商业公司强烈反对公开算法源代码的行为,认为此举严重损害其竞争优势。最终立法者进行妥协,在法案中取消了对算法披露的要求[32]。因此,有学者主张公开源代码并非唯一选择,可以将参数权重、公式及理由解释、结果告知等内容进行相应公开,以提高算法的透明度[33]。

第二,关于申请算法公示的主体。在控方履行告知义务的前提下,应当赋予辩方申请算法公开的权利。在刑事诉讼中,由于控方享有技术优势和政策层面的支持,大数据证据多是以有罪证据的形式由控方出示以证明被追诉人有罪或罪重。因此,对于大数据证据可能涉及被追诉人定罪量刑的犯罪事实或者重大权利的,应当保障辩方对大数据证据内部算法决策的知情权。

第三,关于算法公示的保障。对于辩方申请算法公开而不予公开的,应当说明必要的不公开理由,如大数据证据对定罪量刑有重大影响、被追诉人及其辩护人有异议,而控方无正当理由拒绝公开的,一般应当排除相关的大数据证据。

除此之外,为确保算法公开,提高算法决策透明性,有必要在大数据证据应用中引入算法解释权,由算法使用者即提供证据的控方承担对大数据证据与犯罪事实之间的相关性证明逻辑进行解释的义务,以达到缓和甚至克服算法自身技术局限所引发的黑箱和歧视风险的目的。具体而言,一是其主要目的在于通过对大数据证据内部算法模型、特定算法决策过程的解释说明,在控辩双方产生争议时,确定并辨别大数据证据在相关性证明逻辑演绎下是否存在相应漏洞,进而维护大数据证据的证据能力和证明力。二是对于大数据证据内部算法决策的真实性和客观性存在异议的,辩方有权要求提出证据的控方提供相应算法决策解释。三是原则上算法使用者即提供大数据证据的控方承担算法解释义务,但由于大数据证据内部算法并非由其自行设计,控方可要求网络服务提供者、保险公司等算法应用平台及算法设计者承担相应协助解释义务,这有助于减少甚至消弭控辩双方之间的数字能力差距,实现权力与权利之间的再平衡。四是关于算法解释的标准和内容,欧盟《一般数据保护条例》第12条规定,算法控制者负有以“简洁、透明、易懂、易获取并清晰直白的语言”提供信息的义务[34]。 具体在司法实践中,控方应当以一般人能够理解的自然语言向辩方做出解释说明,包括大数据证据通过算法对海量数据的“二次发掘”、大数据证据与所要证明的犯罪事实的证明逻辑等。如果仅是向辩方提供复杂难懂的源代码或算法工作原理,算法解释权也就失去了实际意义。

四、结语

综上,与传统证据不同,大数据证据的专业性、衍生性、相关性等特点决定了其在刑事案件的应用势必会对辩方阅卷权、质证权、取证权等传统诉讼权利造成冲击,而其算法运作过程的内在局限也会进一步加大了辩方进行有效辩护的难度。对此,有必要以加强辩方有效辩护为出发点,赋予控方相应数据开示义务和算法公开义务以保障辩方阅卷权和知情权,并对辩方质证思路进行调整和改造。本文仅仅是在分析大数据证据的有效辩护困境的基础上,提出的一个初步的、概括的完善方案。未来如何使大数据证据自然而然地融入现有的辩护制度并发挥其独特优势,仍然需要司法实践和理论研究进一步发展。

猜你喜欢
辩方控方证据
法律人工智能视角下的辩方论证
正当防卫的证明责任主体研究
庭审中心主义下辩方诉讼地位的提升及保障
非法证据排除也应适用于辩方
刑事庭审辩论阶段的转述声源研究
对于家庭暴力应当如何搜集证据
手上的证据
“大禹治水”有了新证据
手上的证据