职务犯罪大数据证据研究

2020-05-14 04:04
科技与法律 2020年1期
关键词:职务犯罪证据

丰 叶

(中南财经政法大学法学院,武汉430000)

引言

随着计算机和网络技术的普及,大数据作为一种分析手段、研究方法,逐渐在社会、经济、政治、文化、法律等各个领域蔓延开来。云计算、物联网、移动网络、云存储、人工智能这些耳熟能详的词汇充斥着社会生活的方方面面,小到个人购物,大到政府决策,都受到大数据分析的深刻影响。司法实践中,人工智能办案系统①206刑事办案辅助系统作为一款横空出世的推进以审判为中心的办案改革软件,在对上海几万份刑事案件的卷宗、文书数据进行学习后,以大数据、云计算和人工智能为技术内核,获得了初步抓取、校验和分析证据信息的能力,并于2019年首次以辅助工具的身份进入庭审,利用语音识别将庭审信息高效准确地转化为庭审笔录,智能审查证据,基本实现了从立案、侦查、报捕、起诉、审判均在“206系统”内运行。中国法院网:https://www.chinacourt.org/article/detail/2019/01/id/3713361.shtml 2019年11月1日最后访问。、大数据侦查方式也在如火如荼的展开。大数据以其 4V(Volume、Variety、Velocity、Value)特点,通过对海量数据进行筛选、过滤、分析,使用算法形成结论。由于加入了电脑逻辑,大数据分析呈现出超越人脑的新样态,使人类的认识决策迈上了新台阶。习近平总书记指出“数据是新的石油,是本世纪最珍贵的财产……”。2015年,国务院发布《促进大数据发展行动纲要》中提出“推动政府治理精准化,完善大数据监督和技术反腐体系,促进政府简政放权、依法行政。”2017年,最高检印发《检察大数据行动指南》中部署了依托大数据及智能语音等前沿科技,打造“智慧检务”的任务。如何探索把统一适用的证据标准嵌入数据化的办案程序中,实现“用数据说话、用数据决策、用数据管理、用数据创新”是司法实践面临的全新挑战。大数据究竟为何?大多数学者认为目前对“大数据”一词还没有有效的定义,美国学者Ju⁃lie Cohen提出:“大数据”是技术与过程结合的简称,该技术是一种信息处理硬件的配置,能够在很短的时间内筛选、排序和查询大量数据,这个过程包括从数据中挖掘“模式”,将模式提炼为预测分析,并将分析应用于新数据。”[1]其他学者和专家解释说,大数据是一个广义的、不精确的术语,指的是在数据科学和预测分析中使用大数据集。”

大数据究竟是一种研究方法还是一种分析工具,大数据分析在侦查/调查、审查起诉、审判中能否作为证据使用,如何作为证据使用,其证据属性为何,在理论界莫衷一是。赞成者认为,大数据分析因其具有科学性、精准性、高效性,理应作为定罪量刑的依据。由此形成了几种观点:(1)“独立的证据种类说”。该说认为大数据分析报告应当作为独立的证据种类单列出来,它是一种不同于电子证据的新的证据形式,是将有关犯罪嫌疑人、犯罪行为的原始数据进行二次挖掘后,在对海量数据进行过滤、分析的基础上,形成的反映案件深层次特征的新的分析数据,这些分析数据改变了原始数据的形态,是人工智能的一种体现[2];(2)“鉴定意见说”。该说认为如果以大数据分析报告作为证据,就应当将其纳入法定证据种类之中,它不是原始数据,是经过加工、分析、甄别、判断、汇总而形成的新数据,所以在现阶段应当将其归类为“鉴定意见”,尽管其与现行法律中所规定的鉴定意见尚有差异,但就其专业性、科学性而言,赋予其“鉴定意见”的地位不失为权宜之计[3];(3)“电子数据”说。该说认为大数据证据是基于机器算法产生的一系列分析数据,最终以电子数据形式呈现,它的收集、调取、运用方式(冻结)也与电子数据一致,这是它的本质[4]。反对者则认为,大数据分析报告使用平均数据形成决策指引,而不考虑极端情况和潜在的异质性,它的本质是文本的,但它无法解释自己,而且机器算法缺乏透明度和问责制,所以其风险远大于价值,难以作为证据使用[5]。对于上述争论,笔者持赞成观点,大数据分析报告不仅应当作为证据使用,还应当单列出来作为独立的新型证据种类也即大数据证据。这是因为,其一,大数据分析由于加入了人工智能的分析结论,已经远远超越了电子证据仅借助电子载体承载的静态证据形式,这种分析既具有总结性、智能性,又具有预测性、易变性,与电子证据是不可同日而语的;其二,就鉴定意见的证据属性来看,它是由专业人士就案件专业问题给出的专门意见,鉴定意见是由“人”作出的,大数据分析是由“机器”产生的,鉴定意见的作出具有程序性、可评估性,这就必然导致二者的性质、适用程序、证据规则大相径庭。所以,只有肯定大数据证据的证据地位,才能从法律角度对其予以针对性、专门性地规制。

“互联网+”时代下,职务犯罪呈现出犯罪行为多样化、犯罪形式隐蔽化、犯罪手段智能化的特征,传统的口供中心主义受到诸多非议。随着职务犯罪案件监察调查的转型,各地监察机关利用大数据优势,通过大数据比对监督、精准画像,开启了制度化、信息化、公开化的监察调查路径[6]。大数据分析手段已经成为监察全覆盖的重要支撑和科技反腐的必由之路。大数据分析报告如何在监察调查程序、审查起诉程序、审判程序中作为证据使用,如何防范大数据证据的适用风险,都给传统证据理论造成不小的冲击。

一、大数据证据的理论证成

我国《刑事诉讼法》采取列举式证据,将其分为8类,大数据分析因其特殊性,难以归入任何一个证据类项下,但不能因此否定它独立的证据地位。社会“数据化”的结果是越来越多的信息以数字化的形式呈现[7],这是不容逃避的现实,是否能从科学的视角审视大数据证据,突破传统的证据观,赋予其合理的证据地位决定着大数据分析未来的发展方向和刑事诉讼证据理论的进步。笔者认为,用传统的证据理论难以解释这种新兴科技产物给证据理论带来的冲击,只有借助循证法治决策理论、个人化的概率评估理论、结构主义理论才能跳出“个人主义”的藩篱,为大数据分析在刑事证据家族中找到一席之地,实现理论逻辑与实践逻辑的统一。

(一)循证法治决策理论

随着循证医学②循证医学的核心思想是医疗决策必须以客观的研究结果为依据,既强调临床经验又强调科学研究的依据。的发展,循证方法逐渐进入社会科学的研究视野,学者们随即提出了“法循证学”。基于法循证学产生的法循证方法是在结合信息技术的基础上,强调法学研究必须以客观结果为依据,这为法学领域高质量决策提供桥梁。“法循证学”认为,证据的价值在于为司法裁判提供合法性依据。由此产生刑事诉讼领域的“循证法治决策”理论是指,证据经历了从感性证据(例如,神明裁判)到理性证据(在法律中规定证据种类,例如,书证、物证等)的发展过程,对犯罪案件法律真实的认定也经历了从司法决策(通过法律创造理性证据规则,遵循法定程序寻求法律真实)到法治决策(依据法律规定的理性证据以外的其他证据判断法律真实[8],通过挖掘新的资源,激活多元化、客观化、系统化的证据决策因素,实现证据决策最优化)的进步。因此,大数据背景下的法治决策不再是理性证据基础上所决定的司法决策[9],即使是司法决策也是在综合感性、理性、客观、主观、人情、天理等证据基础上(而非仅仅是法律文本上所载的证据种类)作出的综合全面的法治决策。大数据采取关联性分析的方法,将人口、车辆、话单、资产、电子数据、历史案件信息、身份信息等进行汇总,从而发现犯罪线索和证据,抓捕犯罪嫌疑人[10]。这正是法治决策的表现形式,大数据证据通过将海量数据(事实)收集加工,形成分析报告,经过法定程序进行评价和选择,挑选出了个案证据,最终又将个案证据用于形成新的社会认识[11]。这种新的决策机制在司法活动中逐渐蔓延开来,因此,承认大数据证据的正当性和地位,是“循证法治决策理论”对寻求法律真实方法的更具合理性、科学性的要求。

(二)个人化的概率评估理论

个人化的概率评估是贝叶斯创立的利用事件的先验概率和新的证据得出新概率的方法。如果裁判的准确性是指事实认定与经验真理的符合性,那么这种符合性从来都是不确定的但却是可能的[12]。在犯罪案件侦查/调查、审查起诉、审判过程中,会不断地出现新证据来修正“犯罪事实如何发生、由何人所为”等事件的概率。根据贝叶斯定理,在个人化的概率评估中,事件发生的比率与决策者(犯罪人)的决策相关,决策者的信念程度应当具备内在一致性,这样的信念可能建立在相关事件发生的频率上。贝叶斯定理的主要作用就在于不断运用新证据、新信息修正对事实的认定。例如,在职务犯罪案件中,如果已知A1(补偿款未发放到位)的条件下假设事件T(张某犯贪污罪)的概率,当决策者获得了T的先验概率P(T)以及偶然出现的A1的概率P(A1),A1就是事件T发生的条件概率③P(T)是贪污罪T的先验概率,是事件A1(补偿款未发放到位)的预判概率,P(A1)是事件A1的先验概率,是事件T的预判概率,P(T/A1)是事件T(贪污罪)的后验概率,这一概率可以作为新信息的先验概率,其他的新信息会不断修正事件T的概率。,P(T/A1)就可表示为贪污罪T发生的后验概率,P(T/A1)=P(T)•P(A1/T)。当不断有新的信息A2(村民甲未收到补偿款的证言)、A3(张某的银行账户有来源不明的收入)……An导入时,事件T的概率会不断被修正(提高或降低),可以将这一概率再用作先验概率继续评估证据或信息,就会得出一个结论:证据总是不完整的,出现任何一个新的事件都可能修正这些概率。由于大数据证据所涉信息量巨大,这就扩大了相关证据的收集范围,为事件的认识源源不断地提供新信息,这些统计数据进入司法证明领域,增加案件事实的信息源,修正经验性证据对事实的信念,增加概率评估韧性,提高证据的可信度,从而影响裁判结果,使之无限接近案件事实,这是贝叶斯定理的新发展[13]。

(三)结构主义理论

结构主义理论最初由奥地利哲学家路德维希•维特根斯坦提出,他认为世界由许多状态组成,每一种状态都是由多种事物组成的锁链,这些锁链都处于特定的关系中,它们互相影响并产生作用,这种关系就是这个状态的“结构”。结构主义的核心观点即“整体优于部分”。证据学中的“结构主义”则表现为“证据链”。“证据链”是指,证据证明的对象是案件事实(法律真实),刑事证明的对象分为待证事实与证据性事实。待证事实与证据性事实之间的关系被称之为“相关性”,证据性事实能否推导出待证事实是存在疑问的,因此就需要不只一个证据性事实发挥作用,多个证据性事实形成的即为证据链[14]。大多数学者认为,证据发挥效能的原因在于证据与事实之间的因果关系,但在司法实践中,单线性的因果关系是难以呈现的,这种因果关系并不能周延。相反,基于证据链形成拓扑结构图的分析方式称为结构主义,可以以这种证据链结构主义弥补因果关系的缺陷,实现证据链向纵深推进[15]。从刑事证明理论来看,孤证不能定案,所有的证据都具有偶然性。大数据证据提供的是可能性证据,在大数据证据的内部,需要对千千万万数据进行排列组合、筛选、过滤、评价、分析,这千千万万的数据形成大数据证据内部的“子结构”并通过不断出现的新数据修正“子结构”的形态。申言之,大数据证据“子结构”中的各个数据并不是基于因果关系组合在一起,这是大数据证据自身的“结构”。在大数据证据的外部,则需要有其他相关证据与之形成正向强化关系或负向削弱关系,来判断大数据证据与其他证据是否具备可采性,是否形成完整的证据链[16],达到1+1>2的效果。

此外,我国《刑事诉讼法》采取列举式证据方式,这种列举式必然存在不周延的情形。在司法实践中,交通事故责任认定书、未成年人社会调查报告、品格证据等虽然不是法定证据种类,但也可以作为量刑的依据[17]。值得论及的是,证据与待证事实之间应当存在生成关系,品格证据、社会调查报告因不具备这种关系而不能成为定罪证据,但大数据证据却符合这种生成关系,这也是其正当性所在。根据我国证据规则所确立的以法定证据种类为横向坐标,以“材料——证据——定案根据”为纵向审查步骤的基本框架[18],证据的产生、发展、运用是一个动态变化、审查排除、更新递进的过程。因此,基于脑科学、智能认知手段形成的大数据证据在职务犯罪案件监察调查、审查起诉、审判中与其他证据之间更重要的价值功能或判断标准在于证据之间互相印证。在此基础上,充分认识和挖掘大数据证据,肯定其证据地位并将其作为独立的证据种类是可行的,也是十分必要的。

二、监察调查视域下:大数据证据的运作机理

2018年内蒙古乌海市监察机关办理的“齐国荣受贿案”运用大数据优势,成立了四个财产查询大数据信息组,成功查获齐海荣的犯罪证据,开启了内蒙古监察机关运用科技办理职务犯罪案件的先河。在此基础上,他们先后与37家单位部门建立查询专线、数据接口,构建信息查询中心,汇总整合数据137项,引入信息查询机器人,实现数据共享。过去由2名侦查人员查询3天才能完成的信息,现在由机器人不到2小时就能完成④《内蒙古纪检监察机关大数据系统建设:查证一键知晓办案省时省力》,https://baijiahao.baidu.com/s?id=1630574736421158115&wfr=spider&for=pc,2019年9月7日最后访问。,实现了从跋山涉水到一键获取的飞跃式进步。

大数据证据的作用机理在于对海量数据进行关联性分析从而得出结论。关联性分析的创新之处在于将各种与犯罪嫌疑人有关的数据汇总在一起,利用统计原理、集合原理、关系圈原理,对各种数据进行交叉关联分析,区别于传统侦查模式下,大量分散的证据碎片难以发现并整合为一体,单独分析得出的不确定、片面的结论,关联性分析大大提高了工作效率,不仅增加了分析的准确性,而且有利于及时发掘与预防犯罪,这是人力所不能及的。在职务犯罪监察调查中,所涉数据种类繁多,包括:公安数据、检察院数据、通信数据、工商数据、税务数据、房产数据、民政数据、住宿数据、民航数据、银行账单数据等[19]。而职务犯罪数据资源整合系统,通过数据采集、数据处理、数据存储、数据决策分析对结构化数据、半结构化数据、非结构化数据进行提炼整合[20],一方面利用网络爬虫技术,自动抓取行政机关的组织构架、人事变动等信息;另一方面,与相关政府职能部门协作,畅通数据信息收集渠道,开通专项数据接口⑤中央纪委国家监委网站:《大数据给职务犯罪调查带来哪些变化?——访中国人民公安大学陈刚教授》,http://www.ccdi.gov.cn/toutiao/201902/t20190212_188423.html,2019年9月10日最后访问。。例如,浙江省金华市建设的“大数据廉政信息分析”系统,搭建起涵盖全市行政人员的人事、权力等信息,通过房产、车辆、行政审批等信息查询对行政人员进行监督,实现“以事找人”、“以人找事”⑥中央纪委国家监委网站:《运用大数据,提高精准监督能力》,http://www.ccdi.gov.cn/yaowen/201806/t20180624_174369.html,2019年9月10日最后访问。。

刑事证明有“七何要素”:何事、何时、何地、何情、何故、何物、何人”,这是证明犯罪事实的基础[21],职务犯罪证据既包括证明犯罪嫌疑人自然情况的证据,例如姓名、国籍、年龄、精神状况、婚姻状况等,又包括对其身份和履职情况的证明,还包括犯罪动机、犯罪行为等犯罪构成各个方面的证据。然而,并不是所有的证据都需要通过大数据分析的形式获取,只有隐蔽性强、关联程度高并且已经数据化的信息才望成为大数据证据。在职务犯罪案件中,由于大数据所涉信息量巨大、类型多样,如何选取信息,选取何种信息,为什么选取这种信息,信息源头的差异化处理,都会影响大数据证据的形成。

(一)关联指引——对“类罪证据分布理论”的修正

我国《刑事诉讼法》将证据分为8类,但在不同的犯罪案件中证据分布各具特点,同一罪名下的证据分布具有规律性,这就是“类罪证据分布理论”[22]。提出该理论的学者将刑事判决中定案的证据作为类罪证据分布的“映射”进行研究,从大量判决中得出部分罪名证据分布的不同特点。例如,盗窃罪的证据以证人证言、被害人陈述、被告人供述与辩解、鉴定意见为主,其中被告人供述与辩解约占90%,被害人陈述、鉴定意见约占60%,其余证据约占20%。受贿罪以言词证据为主,证人证言约占95%,被告人供述与辩解约占95%,书证约占60%,物证、鉴定意见、视听资料、电子数据分别约占10%[23]。笔者认为,从刑事判决中得出的类罪证据分布数据具有一定的合理性,刑事判决中的定案依据在一定程度上反映了某类案件的主要证据类型,因此,将“类罪分布理论”应用于职务犯罪大数据分析,指引大数据证据的捕获方向具有重要意义。但作为判决形成依据的证据经过庭审的举证、质证、认证过程,是鉴别、筛选之后形成的,不能完全体现审前阶段的证据特点。如果将大数据证据运用于职务犯罪调查、审查起诉、审判的全过程,就不能仅仅局限于裁判文书中所载的静态定案证据,还应当全面分析影响职务犯罪证据形成的因素,关注证据动态收集、举证、质证、认证的全过程,从而得出职务犯罪证据的分布方向,为大数据信息采集提供指南。值得论及的是,该学者通过类罪证据分布理论得出的结论是,受贿罪主要以言词证据为主,这说明传统证据理念仍然占领高地,落后的司法意识与先进的科学技术互为掣肘,而大数据证据的正确适用刚好可以缓解“口供中心主义”带来的调查障碍,助推人权保障迈上新台阶。

由于职务犯罪行为结构具有稳定性,这体现在:犯罪主体可控性(国家机关公职人员)、表现形式相似性(利用公职行为进行权钱交易损害国家利益)、行为模式固定性(行为跨度时间长、建立稳定单一的利益输送关系),具有共同的犯罪特点[24]。因此,笔者认为职务犯罪中的“类罪证据”收集分析应当从职务犯罪的犯罪构成着手,以职务犯罪行为为关节点展开,关注犯罪实施的动态过程,获取与犯罪行为紧密相关的证据。

(二)重心转移——以“职务行为”为基点散射展开

笔者通过对中国裁判文书网公布2018年全年审结的贪污贿赂案件(贪污罪判决书1 774份、受贿罪判决书2 310份)中的部分裁判文书进行分析得出,以贪污罪为例,贪污罪存在取证难、查证难,可获取的证据类型少、赃款认定追缴难度大、证据环节多等问题[25]。贪污罪时常伴随受贿罪、滥用职权罪、挪用公款罪等一起发生。在裁判文书中体现出:贪污罪的犯罪嫌疑人通常采取侵吞单位资产、捐款、房租、会议费,收入不记账,侵吞拆迁补偿款、征地补偿款、政府拨发的资金,隐匿国有资产,骗取、窃取企业改制费、土地出让金、税费,虚增款项据为己有,虚开发票等方式将国有财产据为己有。这些行为通常表现为利用职务便利或利用其他公职人员的行为,可以大致分为几类:第一,利用职务便利,侵吞国家特定资金、财物;第二,利用职务便利,以虚开发票、虚列合同、虚增款项等方式骗取资金;第三,利用职务便利,窃取国有资产。以受贿罪为例,受贿罪的犯罪嫌疑人利用职务便利为他人在签订合同、招标投标、承揽业务、工作调动、人事升迁、子女入学、征地拆迁、项目推进、土地使用、土地转让、资金拨付、设备采购、开设赌场等方面提供帮助,从而通过收受实物、礼金、购物卡、入股、以明显低价购买商品等方式获取利益。尽管裁判文书中所呈现的内容具有一定的局限性,但足以说明职务犯罪案件中“利用职务便利”是实施犯罪行为的关键。

“利用职务便利”是职务犯罪的必要行为方式,无论是贪污罪、受贿罪、挪用公款罪还是滥用职权罪,都围绕职务行为进行。并且有学者指出,职务犯罪证据具有“层级性”特点,这表现在:犯罪行为通常隐藏在内部会议纪要、政策文件、规划方案、审批事项的档案中,呈现出层级系统的“职场”与权钱交易人员“交易现场”分离的状态,“权”与“利”的交易环节“模糊不清”甚至“阻隔”的情况,导致调查取证难[26]。因此,大数据证据的收集方向应当着眼于公职人员的职务行为,以此为基点散射展开,根据不同的职务、职务所涉范围,具体分析履职行为过程中涉及的人、财、物、事、时、空,推及到由此形成的“亲缘、地缘、友缘、情缘、业缘”[27]关系圈、数据链,有目标有范围有针对性地进行数据筛选、分析,形成定罪量刑的证据,转变将分析重点集中在被调查人的交易信息、银行账户信息、出入境信息、购房购车信息等内容上的调查思路,这类信息本身也属于个人隐私,只有在正式立案后才能采取调查手段获取。而通过大数据监察系统对公职人员履职行为的监督本身就是监察机关的职责,对这类信息可以适时监控、精准把关,也是及时发现犯罪迹象防止失去调查先机的重要环节。

图示以“职务行为”为基点散射展开

(三)逆向助推——利用“再生证据”寻找大数据证据

由于职务犯罪案件的犯罪手段具有诡秘化、隐蔽性特征,获取证据十分困难。但职务犯罪嫌疑人具有特殊主体身份,犯罪行为往往牵涉广,所以实施犯罪后,往往与其他犯罪嫌疑人、利害关系人隐藏、转移、销毁赃物,制造“迷魂阵”,扰乱调查人员的调查思路和调查方向,阻碍调查行为向前推进或者进行其他反侦查活动,由此会形成能够证明“原生证据”存在的事实材料,也即再生证据[28]。再生证据具有逆向性,与大数据相关的再生证据通常表现为对计算机原始数据的篡改、隐匿转移财产关系数据,销毁犯罪数据,伪造履职行为相关数据(例如伪造发放补偿款、救济金等)。在监察调查过程中,可以通过再生证据逆向寻求大数据证据。由于“利用职务便利”这一犯罪构成中的行为要素在不同的罪名中具有不同的含义,例如,贪污罪中“利用职务便利”是指利用本人主管、经手、办理公共财物的便利;受贿罪中“利用职务便利”既包括利用本人主管、经手、办理职务行为的便利,也包括利用职务上有隶属关系的其他国家工作人员的职务行为之便。因此,原生证据的辐射范围也因罪名不同而各具差异,原生证据的范围影响着再生证据可能存在的范围。这就要求在监察调查活动开始后,调查人员应当通过大数据信息系统对被调查人实行“实时监控”,根据不同罪名、不同犯罪构成、不同犯罪嫌疑人的具体情况、不同犯罪特点,结合职务犯罪规律、办案经验,制定差异化的调查方案对于职务犯罪被调查人因职务行为产生的关系链、朋友圈、利益网进行筛查,对于发现隐匿、毁灭、伪造数据信息的行为及时抓取,对于再生证据进行历史记录查询、同类比较、关键词搜索,运用“纵向比较+横向比较”的方法[29],利用再生证据的依附性,及时、精准地找到再生证据所承载的原生证据,并对原生证据进行补强。

三、职务犯罪大数据证据的规则构建

(一)算法的理论嵌入

有的学者提出,大数据分析作为证据的关键在于对大数据证据真伪的判断。如前所述,大数据分析结果由机器算法产生[30],算法决策已经成为司法实践的辅助工具,无论是在发掘数据、侦破案件方面,还是在预防犯罪方面都发挥着不可替代的作用。算法的有效性和公正性同时取决于数据的真实性与算法本身。由于可能产生的算法歧视⑦算法歧视包括:偏见代理的算法歧视、特征选择的算法歧视、大数据杀熟等。,大数据分析并非都具有客观性、关联性[31]。这是因为,职务犯罪监察调查过程中,依赖大数据分析得到的线索和证据,可能会因为调查人员的调查行为、数据选择、调查策略、优先级甚至遗漏而改变大数据分析的算法,众多的数据可能造成“垃圾输入、垃圾输出”[32]。正如反对论者所主张的,大数据存在病毒式传播的风险,因为数据本身是主观的、不完整的。这使大数据的效率、质量、透明度都受到了一定的质疑。同时,大数据证据存在严重的证据偏在现象,会导致职务犯罪被调查人完全受制于掌握技术优势和资源的国家监察机关。在此情形下,大数据证据的获取可能导致控辩双方权利失衡,而唯一解决这一结构性缺陷的办法就是承认人类判断在决策中的价值和作用[33]。鉴于此,在职务犯罪案件中对大数据分析的机器算法进行法律规制和理论指引是保障大数据证据得以有效运用的前提,这种规则表现在:

第一,线索筛查评估规则。在职务犯罪案件监察调查过程中,根据机器算法形成的大数据证据,一方面应当具备合法性、可验证性、公平性[34]。另一方面应当符合证据的基本属性,才能作为定罪量刑的依据。这就要求,监察调查中收集大数据证据应当从源头把关,坚持“全面收集+重点突破”原则,这期间涉及大数据信息的应当进行分类、比较、鉴别、筛选,防止因为信息量巨大造成取证方向偏差,避免缺乏关联性的线索进入大数据分析决策的基础信息中。因此,应当通过法定程序规范大数据证据的形成和收集过程。由于大数据分析所具有的深度和广度,更容易侵犯被调查人的隐私信息,因此,对于初查阶段获得的大数据犯罪线索,应当报请上一级监察机关审批,由上一级监察机关进行研判审查后决定是否展开收集,并决定“由点及面”进行大数据分析。对于形成分析报告的大数据证据,经过上一级监察机关的批准以云平台存储方式进行冻结并写入保护措施。以此通过大数据线索筛查审批机制层层把关,形成大数据证据并移送审查起诉。

第二,证明责任分担规则。很多学者认为,算法不是人,我们不能保证算法会产生“合理性分析”[35],所以“人的因素”在算法中至关重要。给算法确定一个标准,与给人的判断确定一个标准是不同的,但实际上算法的优越性会创造更高的合理性[36]。对于算法合理性的评估,则需要由人来作出判断。在监察调查阶段,基于机器算法产生的大数据证据应当告知被调查人,允许其陈述、辩论、申诉[37],对于大数据证据提出异议的应当由监察机关承担相应的证明责任;在审查起诉阶段,职务犯罪嫌疑人、辩护人、近亲属对大数据证据提出异议,可能影响定罪量刑的,检察机关可以要求监察调查人员对大数据证据的收集情况作出说明或提供相关证明;在审判阶段,前述人员对大数据证据提出异议,可能影响定罪量刑的,应当要求监察人员出庭说明情况,必要时应当允许专家证人、专家辅助人到场参与大数据证据的举证质证过程。对于犯罪嫌疑人、被告人、辩护人、近亲属提出调查人员以非法手段获取大数据证据的(故意篡改大数据信息、改变优先级等),检察机关、审判机关应当及时进行审查并要求监察调查人员作出合理解释或进行补正,对不能作出合理解释或补正的应当予以排除。

(二)诉讼化的初步审查

如何评估大数据分析的科学有效性是法律调查的核心。美国法院在“Daubert”案这个具有里程碑意义的案件中决定,初审法官应当对科学证据是否可靠进行初步评估。例如,审判法院必须评估科学专家提供的科学证词是否是基于科学有效的方法作出的。初审法院必须进一步确定科学推理是否被普遍接受,以及这种科学方法或科学推理能否正确和一贯地适用于所涉事实[37]。Daubert式的法院初步审查模式有助于对这些新兴科学证据进行概念化评估和监督,它代表了一种趋势,说明了法律对待科学的方法:在证据纳入审判之前,证据的科学有效性必须达到最低的证据阈值。由此衍生出对科学证据最低证据阈值的确定:1.应当以经过科学检验的理论或技术为基础;2.经同行评审或发表意见;3.虽然有已知或潜在的错误率,但这种错误可以被认知;4.能被社会公众普遍接受;5.能被相关科学领域普遍接受。对科学证据可采性的研究并不仅仅限于美国,大多数欧洲国家也在努力寻找这类证据的审查路径。例如,欧洲有国家规定:法庭对于专家证据、科学证据的说明和论证必须透明;专家可以请求协助;法官可以接受科学技术培训等等。如果科学界认为某一程序或过程是不可靠的,则依据该程序或过程产生的证据不得在法庭上使用[38]。Daubert式的法院初步审查模式在很大程度上还取决于具体的案例、法院和办案的法官,它要求法官从相对被动的评估者转变为积极的探究者,去寻找科学证据的潜在本质。从Daubert案中衍生出的科学证据规则对我国职务犯罪大数据证据的收集、审查、判断、运用、排除具有一定的借鉴意义。

我国监察机关对职务犯罪案件调查终结移送检察机关审查起诉的,检察机关应当对案件进行初步全面审查。这其中既包括对犯罪事实、情节、犯罪嫌疑人身份等违法要件与责任要件的审查,也包括对证据的审查。由此有学者提出“职务犯罪案件司法审查”的概念,所谓对职务犯罪案件的司法审查是指检察机关、审判机关对于监察机关移送起诉的职务犯罪案件依照《刑法》《监察法》和《刑事诉讼法》的规定进行的专门检察、审判活动[39]。“司法审查”是一个舶来品,由于我国《宪法》赋予检察机关作为国家法律监督机关的性质定位,这与西方国家“三权分立”的国家权力结构不可同日而语,所以,对于“中国式司法审查”的这种概念界定是符合我国现代化的刑事诉讼制度的,而对于如何实现对职务犯罪案件的司法审查,尤其是对大数据证据的审查,笔者窃以为,应当由检察机关通过建立诉讼化审查模式,实现对大数据证据的初步实质化审查,这包括:一方面,设置初步审查多方参与规则。我们可以借鉴美国Daubert式的审查模式,在检察机关进行初步审查时聘请同行业技术专家到场,辅助检察机关对大数据证据进行审查,对于监察机关移送的大数据证据应当及时告知犯罪嫌疑人,允许其提出异议,犯罪嫌疑人、辩护人、近亲属对大数据证据的可信度、科学性提出异议的,可能影响定罪量刑的,可以进行诉讼化的审查方式,组织由专家证人、专家辅助人、监察调查人员、犯罪嫌疑人、辩护人、近亲属等共同参与的初步审查程序,对大数据证据的合理性、合法性提出意见。另一方面,完善权利保障规则。使用大数据进行职务犯罪案件调查的,应当将专家辅助人纳入法律援助的范围,在被调查人/犯罪嫌疑人/被告人对大数据证据的准确性提出质疑的,应当允许其申请专家辅助人对大数据证据的真伪进行鉴别。

(三)印证证明的动态实现

一直以来,学者们对我国“印证”证明模式提出诸多争论和质疑,并将其置于与自由心证进行类比的研究框架之中[40]。对印证证明的价值也发出不同的声音。肯定者认为,印证作为一种证据分析方法,是对证明标准客观化的追求,具有主体无涉性、技术中立性。印证需要一定的证据量,能够相互印证的证据应当具有独立的信息来源。有一定的“广度”和“厚度”[41]。否定者则提出,印证证明规则是案卷中心主义时期机械化的证据认定标准[42]。在大数据时代下,印证证明与大数据分析是“人类理性主义”与“数据经验主义”的对立,在大数据碎片化信息的轰炸中,印证证明逐渐式微,自由心证将代替印证证明而存在[43]。中立者则提出,我国的刑事印证证明规则应当被称之为“新法定证据主义”[44],它将证据的证据能力和证明力用具体的法律规则予以规制,印证证明的作用之一是验证犯罪案件是否达至法定证明标准[45]。由此有学者表示,我国的印证证明是一种证明方法,区别于“原子主义”与“整体主义”的证明路径,即使是“原子主义”与“整体主义”也会内含印证的证明逻辑[46]。但印证证明中依据的融贯论主要体现在追求证据内容之间的一致性方面,且它的外延仅限于实质证据,在“一对一”类型的犯罪,例如受贿罪中,实质性证据天然缺失会导致印证证明难以实现。无论是用最佳解释理论对其进行修正抑或舍弃印证证明采取自由心证的证明方法都不能解决职务犯罪大数据证据的证明问题。

笔者认为,对于不同的证据、证明任务应当设置不同的证明方法和标准。相比之下,自由心证更加注重证据认定的内省性,但对案件事实的认定本身就是主观见之于客观的过程,所以印证证明也并非机械地排除自由心证。印证的前提是证据具有共同的指向性,这是认识证据的最低标准,但印证证明并不仅仅是静态地要求多个证据之间具有同一性,职务犯罪证据的作用在于查明职务犯罪案件的真相。再现案件需要一个过程,不可能一蹴而就,职务犯罪案件在监察立案、调查、审查起诉、审判各个阶段需要证明的事项不断增加、深入、杂糅,尤其是大数据证据,可能一直处于信息源不断更新、变动的过程中,因此,对于职务犯罪大数据证据应当将其置于“整体主义+原子主义”动态结合印证过程中加以诠释:大数据证据本身基于海量信息而形成内部印证(单个证据)从而得出分析数据,它的内部互相影响,由多种因素决定其证明力,也即“原子主义”(如前文中贝叶斯的个人化概率评估论),但囿于大数据证据的收集过程缺乏透明度,所以还需通过“整体主义”的外部印证对其能否作为定罪量刑的依据进行检验。申言之,直接言词原则并未在庭审中真正实现,这可能给职务犯罪大数据证据的交叉询问、举证质证带来了一定的现实困境,这就更需要职务犯罪书证、证人证言、犯罪嫌疑人供述、电子数据对大数据证据加以印证,强化职务犯罪大数据证据的融贯性与符合性。

结语

大数据证据的出现改变了传统的证据模式,出现了人和证据分离的情形,否定了证据的亲历性。受大数据影响,新的时空观、证据观逐渐产生。尽管大数据分析助推人类的认识迈上了新台阶,创造出人力所不能及的新成果,但是“人的认识”仍然应当在大数据证据的获取过程中发挥主导作用。大数据证据的再创性决定了其举证、质证、认证程序的特殊性,同时也难以避免证据偏在现象造成控辩双方不平等的现象,这对我国刑事证据规则的发展提供了新的机遇与挑战。

猜你喜欢
职务犯罪证据
垃圾袋里有证据
监察机关办理职务犯罪追诉时效问题研究
隐藏的证据
涉农专项资金领域职务犯罪浅析
当前村干部职务犯罪高发的思考
手上的证据
家庭暴力证据搜集指南
手上的证据
关于地、县级供电企业“预防职务犯罪加强对权力使用的制约”的几点思考
榆树支行积极开展廉政风险法制教育 建设预防职务犯罪长效机制