杨二慧 古 剑
2023 年1 月9 日,习近平总书记在中国共产党第二十届中央纪律检查委员会第二次全体会议上发表重要讲话,强调“要把不敢腐、不能腐、不想腐有效贯通起来,三者同时发力、同向发力、综合发力,把不敢腐的震慑力、不能腐的约束力、不想腐的感召力结合起来。进一步健全完善惩治行贿的法律法规,完善对行贿人的联合惩戒机制。严厉打击那些所谓‘有背景’的‘政治骗子’。”①2023年7 月25 日,刑法修正案(十二)草案提请十四届全国人大常委会第四次会议审议。该草案加大了对行贿犯罪的惩治力度,同时增加了惩治民营企业内部人员腐败相关犯罪的条款,进一步发挥了刑法在一体推进不敢腐、不能腐、不想腐体制机制中的重要作用。②由此可见,我国对腐败问题秉持零容忍态度。近年来,大数据技术迅猛发展,腐败犯罪发生场域也随之逐渐从物理空间向虚拟空间转移,网络的技术驱动性与普及性使我国社会进入了不同于传统社会的网络社会形态,并对社会治理体系和治理能力现代化提出了新要求。③在此背景下,如何推进腐败治理现代化建设成为不可回避的议题。
大数据的情报研判、风险预警、可视化信息分析等技术为我国科学地作出腐败犯罪防控决策插上了翅膀。关于大数据技术在腐败犯罪治理现代化的具体应用,学者们莫衷一是。持否定论的学者从个人隐私与人权保障等角度质疑其本身的合法性;持肯定论的学者则认为大数据技术不同于传统的理论模式和阐释方法,其依托于技术能够提高犯罪防控决策的科学性与精确性,并最终取代传统的犯罪防控模式进路;持折中观点的学者认为大数据技术方法为传统的犯罪理论模式提供了新的阐释进路,并必将引起传统犯罪学研究范式的变革。但是传统的犯罪学理论在数据导向的犯罪防控模式中始终处于理论假设与方向引导的地位,大数据技术的运用与传统的犯罪学理论模式之间并非冲突关系,而是可以并存且互动的合作状态。过去延续至今的腐败治理是被动的、静态的事后处置模式,而大数据技术的出现为防线的迁移提供了条件。当前,腐败治理的模式正在向动态监督方向发展。基于此种理念,本文拟从大数据推进腐败治理现代化的亮点、难点和发力点三个方面展开论证,希冀提出中国方案。
在长期的反腐倡廉建设过程中,我国逐渐形成了刑法、刑事诉讼法以及党内法规、纪律等一系列法律、法规约束机制,实现了权力监督约束理论、制度反腐理论等诸多治理腐败犯罪方面的理论突破,监察委员会的成立更是我国腐败治理工作的一大创新与亮点。但是,随着腐败犯罪呈现出的智能化、隐蔽化等特点,这种主要局限于定性的研究方法与因果关系探讨的政治体制改革并没有脱离传统思维的束缚,仍具有一定的局限性。而以计算为中心的理念逐渐转变成以数据为中心,形成数据思维方式的大数据治理腐败模式,其能够打破传统反腐模式的思维定式,是人类在不断探索自然、研究社会中发现的区别于实验验证、理论推导和科学计算的新型研究范式,即“第四范式”。大数据技术相对于传统的“小数据”,具有“海量数据、类型多样、处理快速、低密度”的特点,遵循“样本就是总体、重视相关关系、允许不精确”的思维方法,区别于传统的重视因果关系,追求精确性的思维。其避免了小数据下主观偏见与客观存在的障碍,具有预测性。它能够提高腐败犯罪防控决策的效能,为以政治体制改革为主导的反腐路径提供侧翼,是腐败犯罪治理方法与技术上的创新。④
大数据时代下,云计算、物联网以及Web 等技术飞速发展,任何行为人的行为都不再是一个简单孤立的事件,而是在经过系统的数据收集、分析后,形成一个相互联系的信息链,如电商平台能够通过客户的消费情况分析出其消费偏好、消费结构,甚至未来的消费倾向;网络视频客户端能够通过分析节目的播放量、网友们的评论等内容获取大众的精神需求与观看口味。具体到腐败犯罪,各种结构化与非结构化数据、权力机关内部数据与外部数据拓宽了信息来源,增加了数据源的广度与深度。行为人的社交朋友圈、通信记录、交易记录等客观的个人生活行为,以及官方部门建立的视频监控、互联网记录和网民通过各种社交平台提供的举报线索等信息在数字化的时代将得到永久性的保存。对信息收集分析并挖掘其内在的价值之后可形成易于获取的电子证据,从而可成为行为人涉腐的关系图。因此,大数据反腐模式下腐败线索的收集不再局限于公民的举报或纪检部门获取个案信息,而是对所有数据轨迹的全面覆盖,节约了人力、物力成本,适应了当下腐败治理的现实情境。
反腐败不是世界上某一个国家或特定时期内的问题,而是全球范围内一直普遍存在的问题。随着社会不断发展,腐败的形式和特征变幻多端,但是并不代表我们无计可施,而是要发现腐败的本质和规律并进行有针对性的预防、惩治。以古典犯罪学理论为基础的传统腐败犯罪预防理论主张通过刑罚惩罚犯罪人,从而预防其再犯并对其他人形成潜在的威慑。事实证明,这种犯罪威慑理论不仅成本高昂、无助于减少犯罪、不利于预防未然;而且以线索为导向的传统反腐模式通常就线索寻找线索,随着立案数量的增大、审查周期的缩短、取证难度的加大、腐败样式的多样化与隐蔽化,已经越来越表现出力不从心。即使近些年卓有成效的网络反腐依然是以公众举报信息的主动披露为开端,权力机关却处于信息的末端,且面临信息真假难辨的困境,因此其仍然属于制度反腐的范畴。
大数据反腐模式的出现为发现腐败犯罪规律并有效作出预测提供了可能。腐败犯罪的本质是权力的拥有者以权谋私,进而导致权力异化的结果。因此,腐败治理的根本途径是保证权力在法律所规定的范围内行使,避免权力的异化。现代公权力的行使,无论是权力的决定、执行,还是权力的监督,始终处于动态的时空范围。其所涉及的资金、人事、项目等在开放的大数据时代都可以通过各种正式与非正式的路径获取,并在经过分析、鉴别之后形成系统的、具有价值的数据信息,绘制出规范的权力运行轨迹图,一旦发现权力延伸的触角,便能够及时发现异常并予以阻止。另外,治理腐败犯罪的有效路径是寻找到腐败犯罪的规律,从而达到标本兼治的目的。通过对互联网上公职人员的评价信息去伪存真,并就其个人信息变动情况进行整合,大数据能够迅速透过零碎的现象找到他们之间的普遍联系,并揭示其背后蕴含的规律性。
传统的反应式(Reactive)调查有诸多弊病,例如调查基于举报而驱动,因此未被民众或内部举报的招投标项目不会引起侦查机关的重视。绝大多数侦查机关缺少科学和高效的案件筛选调查评估方法和流程,调查主要依赖于主观经验展开。这导致一方面多数案件因缺乏实质性证据而难以指控,另一方面侦查机关在时间、人力和物力上的投入成本显著飙升。而基于机器学习的大数据反腐技术不仅可以通过既存案件归纳关联性特征,而且可以提供可量化预警和识别精准度指标,提升腐败犯罪的预防能力。目前算法在电商反作弊、金融反欺诈和风控领域用于对可疑借贷、交易、商户、偿还能力等实体的预警和识别。算法能够通过数据分布特点高效地自动学习,再根据这些差异不断对自身模型进行迭代训练,最终形成最优的预测模型,实现对未知标签数据的预测。例如世界银行(The World Bank)研发的可疑腐败合同识别算法,将可疑案件指控率提升了约84%。究其原因在于,世界银行反腐败调查由原先依靠民众或内部举报驱动逐渐转向由算法以特定方式对举报案件进行分级和排序推动,进而为调查人员推荐高优先级的案件。此类合同算法的训练涉及诸多维度的数据,需要通过人工分析和特征工程筛选出一千四百多个特征,这其中包括合同总金额、项目地址、供应商名称、合同所处行业(如医疗、建筑工程、信息工程等)。
以招投标腐败案件为例,可以将存在犯罪嫌疑的特征归纳为三个方面。其一,在涉嫌腐败的招投标中,供应商通常会以低定价提高中标成功率,但在中标后会陆续申请几次追加资金。其二,中标供应商的工程启动日与合同中标日间隔时间较长。其三,在特定某一个行业中标的供应商在其他的行业中标。基于这些特征,在算法训练(包括随机森林、逻辑回归、Ada Boost、SVC、Gradient Boosting 和K 最近邻)和对比后,最优模型Gradient Boosting 能达到70%至80%的推荐精确度。这表明在司法资源有限的情形下,最优模型推荐存在腐败风险的合同中会有70%到80%通过侦查收集实质证据,最终形成有效控告。基于机器学习的腐败合同的自动识别和推荐系统能够有效地为调查机关集中调查资源到腐败可能性最高的案件上。结合现有的其他案件信息,对自动识别、预警和推荐系统进行研发,可辅助调查人员高效捕捉和分析腐败情报,优化司法资源配置。
大数据时代下,网络是公众表达民主意识的重要平台,亦是社会公众思想情绪的蓄水池。一旦对涉腐网络舆情处理不好,很可能会造成现实社会的不稳定。近年来,随着人们民主政治参与积极性的提高,人们在期望实现司法公正的同时,还要求以看得见的方式实现程序上的正义,部分案件易因信息的不对称而引起网上热议。第十七届中央纪委五次全会提出,“拓宽群众参与反腐倡廉工作渠道,加强反腐倡廉舆情网络信息的收集、研判和处置,积极回应社会关切”。就传统反腐模式来说,权力机关通常出于犯罪黑数的存在、国家机关工作人员廉洁形象及政府权威的维护等原因不公开或选择性公开腐败案情,这会加剧公民对权力机关的信任危机。即使在网络反腐模式下,网民的不理性、网络信息的鱼龙混杂、政府机关的超常规回应等都会促使公众舆情危机的爆发。
因此,通过大数据了解公众在网络上关于腐败舆情信息的发展态势对于整个腐败犯罪的治理至关重要。大数据技术能够有力地促进网络反腐舆情的监控和预测,这主要体现在:其一,科学、有效地管理涉腐舆情。作为全球大数据的权威,巴拉巴西认为,“93%的人类行为是可以预测的,人们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似,人类行为看上去很随意、很偶然却极容易被预测。”⑤大数据立足于收集、整理、挖掘大量涉腐信息背后的价值,通过信息之间的相关性预测涉腐舆情的发展趋势,从而使得涉腐舆情的管理更具有科学性、时效性。其二,监控的动态性、灵活性。通过对各种网络社交平台,如微博、微信及新闻客户端等数据信息进行统计、分析,能够克服传统的静态的、单一的舆情监测,实现监控的动态性、全面化,从而掌握最为真实的涉腐网络舆情并对其及时回应,以实现司法机关与社会公众的良性互动。其三,高效、便捷、安全。大数据反腐模式下,腐败人员的行为记录、生活轨迹等信息都会形成不可磨灭的痕迹,经过分析之后可形成有效的证据。这其中,既包括政府机构自动监测到的行为,也包括公民的网上举报。就公民的举报来说,由于大数据反腐自身的隐蔽性、便捷性、高效性等特点,检举人不会因实名揭发而遭致被检举人的打击报复,自身安全系数与积极性大为提高。检举人只需要一部手机,即可通过举报网站或公共论坛将信息传至五湖四海,而且通过网上各种公开透明的网络平台查询反腐进度。其四,增强信息公开性,取得公众的信任。阳光不仅是最好的防腐剂,而且是顺应民心的润滑剂。大数据反腐模式下的一切信息都是公开的、可查询的,权力机关在正确行使权力的同时与群众积极互动,化被动为主动,能够有效地消除民众内心疑虑,赢得公众的认可,避免舆情危机的发生。
大数据技术运用于腐败犯罪的关键在于各部门之间的数据库支撑,通过各数据库之间信息的开放、共享,并对获取的数据进行分析、整合,实现腐败犯罪的预防。就数据维度层面而言,需要从各种渠道采集与腐败行为相关的数据。打通数据孤岛,是目前大数据反腐面临的关键挑战。数据分析和算法应用方法,需要结合投标数据、工商数据、税务数据、银行及金融数据、公开披露的财务数据等进行综合分析,而这些数据都存储在独立的局域网以及不同类型的独立数据库中,因此需要建立高权限的反腐大数据网络,结合以上各个相关部门及机关子网络的权限机制,建立访问各个目标局域网的终极权限体系。⑥我国各级政府在不断的信息化过程中,取得了一定的成绩,陆续有3000 多个数据库,80%的社会信息数据库已经为各级政府所掌握,不断地突破了信息建设孤岛、网站建设孤岛、系统孤岛的困境。但是,仍然有70%的数据库相互之间并没有连通,信息孤岛仍然是一个客观存在的事实。具体来说,数据信息之间的连通,既包括工商、税务、社保、民政以及公安等部门之间的横向沟通,也包括从中央到地方纵向部门之间信息的有效衔接。虽然《中华人民共和国政府信息公开条例》的颁布标志着我国在信息公开的道路上迈开了关键性的一步,但是公开的程度仍然非常低,具体信息的公开范围、程度等在大数据反腐对数据的需求下亟需明确。另外,回溯腐败案件治理过程中的巨腐官员,他们一路上踩着边腐边升的红线,由最初的“苍蝇”发展成“大老虎”,甚至有的从一开始就为自己准备了各种退路。如果实现财物、消费等部门之间的信息共享,及时察觉腐败的苗头,便可以做到防微杜渐,起到事半功倍的效果。⑦
大数据可以为分析者、执法者和决策者提供完整多样的数据报表、数据可视化图表和预测结果,但是机器学习算法所能预测的结果都是基于目前已知的违法案例而完成学习,最终输出识别、预测和推荐结果。对于历史中未被发现且数据分布模式与已知案例有较大差异的案例,机器学习算法并未进行学习,因此无法预测和识别该类案件。一旦数据样本采集或分析、挖掘等环节存在数据失真,都可能造成结果偏差。与传统模式相比,大数据技术反腐通过分析、整合大量的数据,挖掘出腐败犯罪的生成规律,相对来说更具有客观性。凡事都有两面性,虽然大数据反腐模式能通过挖掘以往信息的规律进而达到预测将来腐败犯罪的目的,但是其很可能会造成不可避免的风险。首先,其对特定人群的监控与偏见很可能因其无法实现预测的精确性与缺少因果关系的判断而使得某些人被潜移默化地标签化。其次,大数据技术注重通过对已有信息予以分析,并根据数据之间的相关性而作出预测,甚至对尚未实施的未来行为予以惩罚;而非行为人实施的具体行为,大大增加了刑事错案的风险,违反刑事证据法的基本原则——无罪推定。再次,通过大数据技术分析来预防犯罪,其目的在于惩罚未来的罪犯或者试图对其起到一种威慑的作用。令人怀疑的是,这种单纯威慑未来的罪犯而不加以惩罚的模式,极有可能导致行为人因没有任何犯罪代价而下次真的实施犯罪的恶果。最后,由于数据来源的复杂性与多样性,以及系统自身存在的基准谬误,很容易出现细节的错误。但是,这种错误所造成的损失却是巨大的,如某个系统存在0.1%的误报率和0.1%的漏报率,那么在检查了万亿条信息的情况下,系统就会产生10 亿的误报。腐败犯罪发现成功率的提升,愈加强化了人们对系统的信赖心理,导致人们即使面对错误时也没有勇气去否定。值得注意的是,大数据的本质在于大而非全,因数据的不平等收集或个体被忽略等特殊因素的存在,类似“黑天鹅事件”不可避免,数据的全面性有待质疑,故而导致刑事错案的风险不可避免。
大数据技术作为客观记录人们行为的手段,受其影响最为深刻的莫过于诉讼法中证据的收集、范围以及适用规则。一方面,大数据背景下,人类在现实世界的活动得到了前所未有的记录,这种不受时空限制的信息储存为电子证据的收集提供了极为丰富的数据资源。⑧然而,丰富的数据资源并不等于证据,只能说证据来源于数据资源。因为数据信息的获取、处置、管理等流程的难度与复杂性的存在,无不提示我们应当从宏观上考察事物的相关性而非微观上绝对的真实性与精确性,在海量的电子数据面前,试图获取与诉讼相关联的证据犹如“大海捞针”。这种注重宏观的相关性、规律性,忽略微观的精确性、真实性的理念一定程度上动摇了证据的客观性。另一方面,尽管我国三大诉讼法以及相关司法解释均将电子数据规定为证据类型之一,但是在大数据时代下,电子证据的脆弱性与稳定性并存,脆弱性表现在易于串改和伪造,证据偏在的问题更加凸显,证据的真实性难以确认;稳定性表现在即使篡改和伪造也难以完全消除。⑨因此,由于人为的因素导致证据异变的原因将大为减少,而数据与数据之间补强的可能性大为增加。这些电子证据的发展变化都需要细化法律规则,进一步完善电子证据体系。
大数据技术为腐败犯罪的治理提供新的思维与视角时,也不可避免地侵犯了个人的信息安全。首先,在大数据反腐的过程中,大数据管理技术仍然不够成熟,一些涉及公职人员的教育、晋升、家庭、财产等情况经过人肉搜索极易曝光,从而导致公职人员的个人隐私甚至与其相交往的亲属、朋友等人的信息无限制地遭到泄露。这会牵涉到一系列对个人名誉的侵犯,甚至导致敲诈勒索等犯罪的发生。其次,通过对网上各种举报平台、政府信息公开、网民的举报线索予以整合分析,举报人的个人信息遭致公开,其人身安全性面临着被打击报复的风险。如果因个人信息泄露而导致其人身安全得不到有效保障,那么犹如向公民的积极性泼了一盆冷水,浇灭的是全民参与反腐的热情。而且,随着个人信息的不断扩展,侵犯的样态不再局限于个人信息,而是逐渐出现侵犯样态的群体化及被害人的全民化现象。⑩最后,关于公民个人隐私的法律保护滞后且不健全。目前,我国的宪法、民法、刑法、诉讼法等相关法律对公民的个人隐私保护作了相关规定,但是可操作性较弱,尚不足以适应目前对公民个人隐私保护的需要。大数据时代下,个人信息保护中蕴含的人格利益、信息自由流通权益与经济利益、公共安全等公共利益之间形成了巨大的张力,这种矛盾和利益冲突将被进一步激化。⑪因此,问题的关键在于如何能够在确保个人信息安全的前提下,将大数据技术合法、合理地运用到腐败治理的过程中。
大数据管理技术掌握的娴熟程度决定了大数据反腐模式运行的好坏。大数据管理技术集数据的获取、存储、挖掘、分析等为一体,是一个动态的、持续的过程,整个大数据反腐模式的良好运行离不开每一个过程的成熟和完善。首先,就数据的收集、存储来看,大数据时代下的每个人的一举一动都会留下蛛丝马迹,受到大数据“第三只眼”的注视,因此,各种数据信息呈爆炸式的增长。而由于大数据本身价值密度较低,庞杂的信息总量中必然充斥着诸多不相关的信息,这些信息真伪难辨,为国家机关在最短时间内获取最关键的反腐情报造成了极大的阻碍。另外,这种批量式的、类型化的收集容易使得收集丧失个性化,以致缺乏全面性,从而形成反腐盲区。其次,大数据分析技术是数据管理过程的关键。数据分析的过程中,网络反腐舆情监测系统以及其他监测设备每时每刻都会收到成千上万的数据信息,大数据技术以对事物之间的相关性分析为核心,这可能导致从杂乱无章的数据中得出很多事物之间存在相关的结论,但却并没有真正的价值,而且任何一个细节分析的错误必然导致错误率的成倍增长。最后,正如富兰克斯所言:“成功分析的关键不是工具和技术本身,使用这些工具和技术的人才是取得成功的核心要素。”⑫大数据的发展需要一大批懂技术、懂管理、懂统计的复合型人才的推动,如大数据分析师、数据开发工程师等。故而,大数据在腐败治理过程中最终是否会产生良好效果以及产生多大效应,关键在于是否拥有掌握过硬技术的大数据人才。
大数据技术用于腐败治理的关键是通过分析数据资源之间千丝万缕的关系,发现犯罪的规律,从而实现腐败犯罪预防的目的。因此,数据的价值在于相互之间的整合而非档案室中的陈列。正如上文所述,各个部门之间的信息仍然处于相互隔绝状态,一定程度上影响了大数据技术的发挥。要打破这种信息孤岛现象,实现互联互通。互联互通有利于促进协同高效的数字法治政府建设,有利于建立开放的平台生态系统而促进平台经济高质量发展。⑬故此,建立跨地区、跨部门、跨领域的信息数据库,既包括从中央到地方的纵向信息分享,也包括司法、行政、工商、农医等各个横向部门之间的沟通,将公职人员的相关行为置于数据信息的监控之下,一旦发现异常情况便可以予以及时阻止,避免诸如“房叔”“房婶”等“大老虎”的产生。2023年3 月,中共中央、国务院印发了《党和国家机构改革方案》,其中涉及组建国家数据局的内容。国家数据局的组建有利于我国数据基础制度的建设,有利于数据资源的整合共享和开发利用,更有利于国家重要信息资源的开发利用与共享及信息资源跨行业跨部门的互联互通。应充分发挥国家数据局职能,构建反腐倡廉数据库,使其在大数据反腐上凸显优势。通过登录数据库,公职人员的信息经过财政、纪检等部门的“诊断”,可以明显发现其是否存在贿赂犯罪以及违反纪律方面的“病史”,即使是很小的问题,通过对其予以比对分析也会留下“病历”记录。如此一来,不仅能够防止病情由小变大、由单个病变成传染病,而且能够根据病历上的病因进行有针对性的治疗,从而对症下药。
任何事物都有风险,大数据技术也不例外。我们应当尽可能地提高大数据技术分析的精确性,从而避免大数据技术在腐败治理模式中造成刑事错案的风险及违反无罪推定原则。具体来说,首先,采取定性与定量结合的统计方法,设定具体的阈值实现对风险的控制。大数据技术运用定量的方法,通过对海量的信息予以挖掘,从而对腐败犯罪予以预测,但是可能导致与实际的偏离。通过对现象的归纳总结,找出事物本质的定性研究方法则能够弥补定量分析方法的缺陷,而定性分析过程中的不确定性与主观性一定程度上又可以由定量分析方法对其进行互补。在腐败犯罪防控的决策过程中,应当同时对犯罪嫌疑可能性风险与具体刑事强制措施的风险性进行评估。例如,根据大数据技术分析的结论,对王某定罪的可能性为2%,那么根据合理怀疑原则就不能对其实施刑事强制措施;如果对其定罪的风险高达50%,便可以对其采取刑事强制措施。具体阈值的设定应当参考犯罪的种类、案件的发生率、证据的充分性等多种因素予以衡量。⑭其次,对于大数据反腐得出的结论应保持审慎的态度。大数据通常注重具有相关关系的数据信息,如此便会忽略因果关系的、非数字化信息的判断。而腐败犯罪是一种极为复杂的社会现象,具体的每个公职人员的主观心理与客观情形存在差异,因此,我们应当结合具体的情形综合考察其结论的真实性与准确性。再次,依靠但不依赖大数据,注重情报收集的人工化。一方面,要树立大数据技术的思维、理念,从而判断出行为的大致走向;另一方面,设置人工收集情报渠道(热线电话、微博、微信等)并对结论予以分析,以避免错误的发生。最后,大数据技术能够预测具体的某个人在某个时空内实施犯罪的风险,但在决定是否采取刑事强制措施时,则依赖于对精确度的具体把握。应当以具体的标准为依据,保证信息和数据的真实性与安全性,排除不相干的数据以防止影响精确度。
大数据技术反腐模式的确立,在一定程度上影响了电子证据的适用规则。针对上述证据规则适用的困境,可以从三个方面着手。首先,应当引导树立正确的证据法基本理念。大数据技术通过分析涉腐人员过去的行为预测未来的行为,这种逻辑下的分析模式随着预测的精确度越来越高,极有可能导致推理型的偏见,从而在行为人的行为或结果发生之前采取措施,违背意志自由原则,否定了人们未来改变的可能性,容易走向英美法系品性证据的极端。我们应当始终坚持理性原则与意志自由的不可侵犯性,坚持行为人只能对自己的行为负责。其次,在大数据时代下,记忆是常态,被遗忘是例外。但是,在存储容量巨大的电子系统中,可能会因为新旧技术系统的更新换代,或者涉腐当事人最初就为自己准备好退路,通过删除、毁损的方法造成证据缺失,从而使得案件处于真伪不明的状态。对于此种证据偏在的情况,应认为电子证据与传统的书证二者中包含的信息对于案件所起的作用是相同的。因此,可以借鉴法国、德国的规定,仿照书证,规定电子证据的当事人在一定范围内有强制其提交证据的义务。可以引入电子证明妨碍制度,针对以妨碍对方使用为目的,在诉讼前或诉讼中故意采取将案件的相关电子证据灭失、隐匿或其他行为,则可以将其视为证明障碍,对其予以行政罚款并认可对方就该文书的主张事实为真实。最后,大数据技术改变之前探求事物之间因果关系的认定,寻求事物之间的相关性,并认为这种分析逻辑更为有效。但是,我们认为相关关系只是为因果关系的分析奠定了基础,因为在大多数情况下,一旦完成了对大数据中的电子证据的相关关系分析,即知道了“是什么”后并不会止步于此,而是会找出背后的“为什么”,即电子证据之间的因果关系。⑮因此,相关关系的分析并不是电子证据收集的唯一方式,仍然要根据传统的因果关系进行证据的调查。
大数据技术在为准确地预防腐败犯罪发挥冲锋陷阵作用的同时,也像是一把利刃刺向数据最为敏感的核心——数据隐私。因此,寻求克服大数据技术安全风险的对策,保护公民个人的数据隐私,才是未来大数据技术能够更好地发挥自身价值的应有之义。对涉腐数据中关系到国家安全的信息,应当按照《生成式人工智能服务管理暂行办法》《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《中华人民共和国科学技术进步法》等法律法规精神,采取分级的管理方法,以国家安全保护为核心,对其安全级别予以划分,并对与国家安全有关的信息采取专项化管理,设置查看与使用权限的等级。⑯
对涉及公民个人的数据隐私保护,应当从技术的提高、法律制度的完善等方面着手。首先,从技术上看,提高技术是数据安全隐私保护的根本之策,如果没有过硬的技术保护公民的隐私,那么任何数据安全保护策略都是泡影。应当不断地研发安全管理技术,提高安全管理手段,为数据安全提供最佳屏障。具体应从内外两个方面予以防范:就内部而言,对国家安全数据、个人隐私数据进行特殊标记,并就访问用户予以相应限制;从外部来说,不断开发安全管理技术,就各种政府信息平台、举报平台、社交论坛平台上的公民信息及敏感信息如生物识别信息等采取防火墙技术加密处理,以防数据遭到黑客的恶意攻击。其次,法律是数据安全保护的制度保障。美国预测警务将保护公民隐私作为其执法的前提,其第四修正案及相关公民隐私权法案规定,警方在收集和使用个人隐私数据时,应当遵循公开原则、收集限制原则、目的明确原则、使用限制原则等基本原则。⑰我国《宪法》《刑事诉讼法》等法律以及相关的司法解释都有个人信息保护的相关规定,但是较为原则且分散。因此,可以从四个方面予以健全和完善:第一,进一步细化并落实《生成式人工智能服务管理暂行办法》规定,在促进生成式人工智能健康发展的同时,维护国家安全和社会公共利益,保障网络安全和数据安全。第二,优化《中华人民共和国个人信息保护法》与刑事法的衔接,完善数据的采集、处理、利用以及司法救济与违法责任相关规定;进一步细化关于公民尤其是国家工作人员相关的财物数据、身份数据和消费数据等具体使用规则,以实现信息的充分保护与有效利用之间的均衡。第三,修订现行《中华人民共和国刑事诉讼法》,明确规定在腐败案件的侦查中,如果牵涉民众隐私信息则应当事先获得司法机关令状许可,否则其获取的证据不具备可采性。对于网络非法取证行为,确立网络证据非法排除规则;对于侵犯个人信息的行为,《中华人民共和国刑法》应当设置相应的刑事责任配套机制。⑱第四,根据心理学家斯坦利·米尔格莱姆的“六度分隔理论”,任何两个陌生人之间,最多只需要通过6 个人便可完成两人之间的联系。那么,在互联网时代背景下,人们通过对若干支线的数据点予以分析,就能够调取任何个人信息。因此,应当严格限制大数据分析的数据库连接,而且只能基于直接证据的数据相关性作为数据库连接的标准,禁止对间接证据所引发的相关性的数据予以挖掘。
世界上诸多国家都将大数据技术水平的高低视作未来衡量国家综合竞争力的一项重要标准,并将其提升到战略性的高度。大数据技术的有效应用关系着大数据反腐模式的良好运行,如果没有大数据技术,大数据反腐也就成了无木之本、无源之水。因此,国家应当加大财政投入,不断扩大基础网络设施建设,将腐败治理等其他社会事务纳入大数据的监控之下,建立“政府事务云”,不断创新与应用诸如印度的“我行贿了”的分析方法与数据软件,提升政府的数据分析能力。同时,针对上述信息技术管理过程中存在的问题,一方面要将传统的因果关系判断与相关性关系的判断相结合,由“是什么”进一步延伸到“为什么”;另一方面,要注重发挥人工在数据的收集、分析过程中的作用,以弥补系统自身存在的局限性。⑲此外,大数据技术作为一门新兴的技术、一种“硬”的技术,还是要依靠于“软”人才的掌握,实行“软硬兼施”。应当引进与培训大数据技术人才,建立人才数据库,培养适应现代大数据技术形势的人才队伍,加强培训力度,增强其信息分析能力与数据处理能力,从而为大数据反腐提供有力的智力支撑。大数据反腐的基础是数据,只有来源广泛且质量可靠的数据才能为高效反腐提供强有力的支撑。因此,对于不适宜由政府承办的业务或者更适合由其他机构承办的事项,应当积极地与技术先进的企业进行合作,从而提高大数据反腐的质量与效率。
传统的反腐败研究多将精力集中在宏观的制度层面,希冀通过制度改革驱动腐败治理现代化。大数据技术的出现使一种新型腐败犯罪治理模式成为可能,腐败治理的模式正在向动态监督方向发展。大数据的情报研判、风险预警、可视化信息分析等技术为我国科学地作出腐败犯罪防控决策插上了翅膀。但是在大数据技术反腐败模式推进的过程中,也存在关联数据共享程度偏低、数据偏差可能诱发刑事错案、证据规制适用困难、个人信息安全受到威胁、数据管理水平不高等困境。对大数据技术反腐这一新鲜事物,如何能够扩大其适用范围,尽可能地发挥其价值,并规避随之而来的风险,才是未来课题研究的重点。