目前,数字检察的主要实践路径包括通过大数据法律监督模型批量挖掘监督线索、通过区块链技术实现数字监管与执行监督、利用生成式人工智能辅助诉讼活动以及利用新技术实现线上个性化检察服务。数字检察的发展已初步将技术发展优势与检察工作逻辑相结合,实现了场景化应用。但是,在科学技术深度融合的同时,数据壁垒未打通、数据模型融合不够深入及算法治理、权利救济保障相对滞后等问题在一定程度上制约了数字检察效能的充分发挥,应予以重视。
一是数据利用问题。数据是检察业务数字化的核心要素,实践中,各机关部门间数字壁垒尚未完全打通,检察数据的存储和利用仍存在不畅通的问题。现阶段,检察大数据的主要来源有“自上而下”和“自下而上”两种方式:前者的大数据来源于全国检察系统数据资源。检察业务应用系统 2.0就是重要的数据来源平台。自上而下的数据资源建设能够最有效解决数据合法性问题。后者的大数据来源于一线检察机关自行获取的数据资源。当前,对下级检察机关获取数据的基本政策仍是唤醒和盘活现有数据资源。
二是算法技术的应用风险问题。数字检察的基础是以数字赋能监督而非以数字技术取代检察官的监督主体地位。生成式人工智能赋能数字检察能够充分发挥其“高拟真度”和“多维度应用能力”的优势,在学习理解法律语言的基础上自动生成相应法律文书和推进法律程序,但这也会带来机械应用生成式人工智能技术导致司法正义失衡的风险。
三是人员和配套机制的问题。实践中,部分检察机关和检察人员不能较好适应数字检察工作新模式,还没有充分认识到大数据赋能法律监督的意义和方法。
正确理解数字正义内涵及其实现条件。司法人工智能通过技术理性与司法实践理性相融合,揭示司法改革的运行规律,其主要特征是,以大数据和人工智能等新科技来提升司法质量、实现公平正义,司法体制改革的成效也以数字化的形式得以呈现,因而其背后的法理表达为一种“数字正义”。数字正义的内涵包括数据正义、算法正义以及程序正义的可视可感。就此,实现数字正义的实质化,需要从以下三方面着手:
首先,实现数据正义的实质化,要进一步打通数据壁垒,充分发挥数据要素对数字检察的作用,解决数字检察的“生产资料”问题。数据是支撑数字检察大厦的基石,充分获取各项司法数据是数字检察工作顺利开展的前提条件。数字中国战略的一项重要内容就是促进公权力机关之间数据互联互通,建立与完善信息公示与共享制度。可以探索通过搭建联盟链的方式实现数据的协同共享。目前,区块链技术根据准入标准可以分为专有链、公有链和联盟链三种。其中,联盟链可以设置访问人员的具体权限,在保留分布式存储和去中心化特点的同时,还能保留一定的中心控制功能,技术人员可以根据数据需求对访问人员的权限进行设置,在确保数据安全的同时允许相关人员访问并处理数据。因此,联盟链以其低成本、高可信度和可靠的安全性成为政府间组织搭建数据协同处理平台的重要技术力量。
其次,实现算法正义的关键在于规制算法权力。规制算法权力是数字法治制约监督体系建设的基本路径,集中体现为对算法辅助、赋能执法司法裁量裁决的规范与制约。立足检察制度体系实际,着眼于各类监督贯通融合,应迭代推进以下三方面措施:第一,制定数字检察规制体系,针对数字化司法决策的随机性及算法的复杂性、不透明性,建构算法程序运行规则,避免数字化道德责任分配困境。第二,以检察人员为中心,将检察办案主体的判断置于核心地位。大数据技术的研发应用不能突破依法独立行使检察权的原则,更不能削弱检察权。第三,建立算法的可解释性规则及流程监控规则,实现反算法歧视和算法透明。克服司法算法偏见可从事前预防、过程管理、事后追责三方面着手。就事前预防而言,可以开发消除偏见程序,保证算法程序的公平、透明,以此审查和分类数据;设计偏见修正机制,系统识别偏见后及时进行校正。就过程管理而言,建立算法审查机制,针对算法中的变量因子是否有偏见倾向,运算规则的权重差异是否在合理限度内等问题,由算法专家进行测试,保障算法运行公正。就事后救济而言,建立责任追究机制,跟进立法。
最后,保障知情权和程序参与权。人工智能介入刑事司法的最大危机是不断消解当事人参与诉讼的行动空间、影响范围以及救济渠道,导致被追诉人享有的知情权、参与权、异议权以及救济权受到消解,以致影响司法裁判的公信力和实效性。对此,一方面,公检法机关在使用预警软件和犯罪风险评估工具时,应根据案件具体情况,在明确自动化司法决策可能出错的前提下,向被追诉人及其辩护律师详细说明作出决策时所依赖的计算机生成的事实或法律调查结果。另一方面,对于实体权利和程序权利可能面临人工智能决策不利影响时,应保障当事人的知情权和提出申诉的合理渠道,若被追诉人对决策结果持有反对意见,认为司法工作人员不当使用或过度依赖智能司法系统,阻碍其依法行使诉讼权利的,可以向同级或者上一级检察院申诉或者控告。
加强法律监督类数据合法性管理,完善数据安全管理体系。数据安全管理要求检察办案人员处理涉案主体信息时遵循边界规范,包括不同流程节点的二次处理及数据深加工中的权责配置。注重检察数据的分级分类保护,区分保密内容与公开信息的边界,保障数据权益安全。探索建立与政务执法机关对接的“四大检察”办案系统、建设政法机关一体化办案系统。一言以蔽之,就是要严守数据安全法、个人信息保护法等法律法规,设置针对法律监督数据在调取、存储和管理等各环节的程序规则,并制定相应的权力清单。同时,建立健全检察机关数据管理体系,对数据进行依法有序的管理、标识、清洁,严格遵守权限要求查询、使用数据,确保数字检察的法治化运行。
加快探索完善智能辅助“深度学习”机制,推动数字检察的技术方案迭代升级,解决数字检察的“生产技术”问题。以深度学习驱动司法知识图谱构建,是破解法律监督模型融合创新的关键一环,也是数字检察实现从弱人工智能向强人工智能转变的技术保障。数据标注是司法知识图谱构建的重要基础,要以数据标识、清洁、过滤和归集为起点,探索建立健全“深度学习”机制。要推动数据清洁与模型参数设置由技术衔接进入法律规范表述的有机统一,并贯穿至智能辅助深度学习的表征(内涵)、实现、评价等环节,融合在模型假设、评价函数和优化算法等模型建构各部分,通过监督办案要素的代码化,实现对“法律代码化”合法性、公正性的监督与保障。同时,要充分发挥技术正当程序的规制功能,有针对性地设置算法矫正模型,监督修正要素式智能裁判、智慧司法等人机协同程序,确保诉讼当事人的参与权、知情权与必要的选择权,进而发挥技术正当程序的风险控制功能。
(摘自9月2日《检察日报》。作者分别为中国人民公安大学教授、博士研究生)