司法大数据辅助审判应用限度研究*

2023-01-08 06:24蔡立东
浙江社会科学 2022年6期
关键词:审判裁判法官

□ 蔡立东 郝 乐

内容提要 立基于“发展优位”的推进思路,我国司法大数据辅助审判应用得到长足发展。但由于未能超越技术中立观和工具论,对技术的宰制性和司法人工智能的辅助性地位缺乏应有的自觉,对技术发展的阶段性和复杂性之于大数据辅助司法审判应用的制约、对大数据技术在司法领域应用的适配性考量不足,尚未实现对司法大数据辅助审判的数据算法风险、功能异化风险、司法规律抵牾风险及应用实践问题的有效规制。通过技术赋权与技术限权加强技术应用规制,通过核心禁区与业务痛点分析明确应用场景限定,通过程序规制与合理限度设置强化应用主体管控,能够促进对司法大数据辅助审判应用的有效限定与规制,推进大数据在司法审判中的深度融合应用。

引 言

司法与大数据技术的结合为我国司法体制改革注入了前所未有的创新活力,中国的司法大数据辅助审判应用已走在世界前列,“智慧法院”建设实现从跟跑到领跑的跨越式发展。基于“发展优位”的司法大数据辅助审判推进思路,对司法大数据的应用规制相对宽松。与此适成对照的是,域外国家和地区对司法大数据的应用则较为审慎,不但对司法大数据的收集、使用设置较多限制,而且其应用较少涉及审判等法院核心业务。如欧盟通过《通用数据保护条例》《算法责任与透明治理框架》等建立了较为严格的数据和算法应用规制机制;①法国通过“司法大数据禁令”直接禁止基于“法官画像”的司法裁判预测;②美国则将司法大数据智能辅助系统的适用限定于特定领域,并对其应用发展采取“渐进式”监管。③司法大数据辅助审判往往旨在提高司法效率、促进司法公开,较少向其加载规范法官自由裁量、促进统一法律适用、提高司法公正等价值目标。

司法大数据应用为一把双刃剑,在推进司法效率提升,实现司法审判流程重塑、规则重塑的同时,也将给司法裁判活动、司法伦理观念等带来深刻的冲击与挑战,这在司法大数据与人工智能技术结合产生的司法大数据辅助审判领域体现得尤为明显,不仅其应用成效未达预期,还产生“上热下冷”“内热外冷”的重要实践面相。④当前,司法大数据辅助审判应用,很大程度上仍局限于通用大数据技术在司法场域的平移运用,对于大数据技术在司法领域应用的有限性和适配性考量不足,导致大数据与司法场域的结合性程度不高、融合性应用不强; 对技术的宰制性和司法人工智能的辅助性地位缺乏应有的自觉,对于司法大数据辅助审判的数据算法风险、功能异化风险和司法规律抵牾风险难以进行合理管控与有效规制。基于此,本文聚焦于分析司法大数据在审判中的应用限度,藉由对我国司法大数据辅助审判应用现状的考察,揭示其应用带来的潜在风险及问题,剖析问题产生的原因,进而提出司法大数据辅助审判的限度与规制策略,以期助益于大数据技术在司法审判中的深度融合应用。

一、司法大数据辅助审判的应用现状

大数据在司法审判中的应用持续迭代升级,学界对其认识和理解也不断深化。关于司法大数据的概念,有三种典型的阐释进路:有学者基于数据来源和面向对象,认为司法大数据是人民法院“在司法工作中形成的审判流程、执行信息、法律文书、庭审活动信息、司法政务、司法人事、外部协查等数据的总和及其关联关系”;⑤有学者以大数据作为技术、工具和方法为视角,认为司法大数据是“利用大数据技术挖掘、分析和处理司法数据并解决有关司法实务问题的过程和方法”;⑥也有学者从大数据的基本特征出发,认为司法大数据是“由司法机关内外快速产生和流转的案件、数据、视频、音频等多样数据类型组成的,超越常规提取、储存和分析能力且能够分析和预测未来的海量数据”。⑦在本文看来,司法大数据既有资源面向,也有技术面向。司法大数据辅助审判,是通过大数据技术处理法院审判执行业务中形成的司法数据(包括各类结构化数据、半结构化数据和非结构化数据等),为司法审判提供必要的辅助支持。

目前,对司法大数据的应用,已形成“平台化+智能化”模式。平台化建设实现了对司法数据的资源整合,为司法大数据辅助审判提供支撑与前提。2013年,最高人民法院印发《人民法院信息化建设五年发展规划(2013—2017)》,提出建设国家司法审判信息资源库,筹建全国法院数据平台。2013年底,人民法院数据集中和管理平台初步建成。2016年,数据集中和管理平台升级为大数据管理和服务平台。2017年,国务院印发《新一代人工智能发展规划》,明确要建设集审判、人员、数据应用、司法公开和动态监控于一体的智慧法庭数据平台。2021年,最高人民法院发布《人民法院信息化建设五年发展规划(2021—2025)》,要求基于大数据管理和服务平台,构建司法数据中台、智慧法院大脑和司法链综合平台。

我国现已基本建成覆盖全国、覆盖全部案件的司法大数据平台。一方面,对内通过大数据管理和服务平台汇聚来自全国法院的全量司法数据。截至2020年底,该平台已汇聚全国2.24 亿条案件信息和6.13 亿份司法文件,成为全球最大的司法审判信息资源库。⑧另一方面,对外基于可公开信息搭建中国审判流程信息公开网、中国庭审公开网、中国裁判文书网和中国执行信息公开网四大平台。司法数据资源的汇聚整合,使多样化的司法大数据分析与挖掘成为可能,推动了大数据技术在司法领域的深度应用,产生了辅助审判决策系统、辅助审判支持系统、辅助案件管理系统等司法大数据应用,实现了智慧审判、智慧管理、智慧执行等业务功能,形成服务审判执行、服务监督管理和服务司法公开的司法大数据应用格局。⑨

(一)司法大数据的特点及其对辅助审判应用的制约

大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,具有 “4V 特征”:即数据体量大(Volume)、数据类型多样(Variety)、数据处理速度快(Velocity)和数据价值密度低(Value)。但“4V 特征”在司法大数据应用场域有其特殊性。从数据体量观之,司法大数据与大数据其他应用领域的海量数据无法相提并论。从数据处理使用观之,当前的司法大数据应用基本局限于结构化和半结构化司法数据,对于图片、视频和音频等非结构化数据的分析使用相当有限。而且,由于数据化程度、应用技术水平和司法现实需求的差距,司法大数据的增速和处理速度与大数据的其他应用领域存在明显差异。此外,司法大数据中典型个案的单体价值可能远高于普通海量裁判文书的参考和适用整体价值。因此,司法大数据与大数据的基本特征存在一定程度的偏离。

不仅如此,司法大数据具有超出“4V”特征的其他特点。首先是客观真实性(Veracity)。作为辅助审判应用的数据样本,司法大数据是人民法院工作积累的司法数据集,需要完整保留司法活动记录,妥善保管各个程序步骤的材料,以确保其客观性与真实性。而冤假错案、程序不规范等问题在司法实践中现实存在,能够反映客观真实司法活动的数据,未必都是司法大数据辅助审判应用的可用数据,需要进行慎重的数据筛选和处理。其次是动态性(Vitality)。法律随着经济社会发展而不断调整,新旧法律规范的更迭,导致大量“过期数据”产生。受司法政策等因素的影响,不同时期的裁判取向也存在一定的差异。如在不同的历史阶段、针对不同地域范围和人群的犯罪特点,会形成特定的刑事政策和地方性的政策指引。司法大数据的案件样本随之更新变化,司法大数据辅助审判决策的分析结果也会因此不断发生改变。在一定程度上,司法大数据对大数据基本特征的偏离,以及司法大数据超出“4V”特征的自身特点,决定了司法大数据辅助审判应用的相对有限性,也意味着通用大数据技术直接平移运用于司法领域的不适配性。

(二)司法大数据辅助审判的应用场景及成效

1.司法大数据辅助审判决策系统

司法大数据辅助审判决策主要实现司法裁判结果预测和类案推送(类案检索)等功能。基于大数据、机器学习等技术,通过对大量已决案件的生效判决进行深度学习,可以实现司法裁判结果预测。其中的典型是上海刑事案件智能辅助办案系统(以下简称上海“206 系统”)的“量刑参考”功能,该系统通过司法大数据分析、刑事文书标注和机器学习,建立量刑预测模型,为刑事案件量刑提供参考。⑩类案推送则通过司法大数据的分析、比对,筛选并推送以往相似度较高的已决案例,为法官对相似案件的裁判提供参考。最高人民法院2018年推出“类案智能推送系统”,该系统通过对司法文书中案情事实、法律适用等要素的提取构建案件画像,进而辅助法官从海量已判决案件中发现类案。截至2020年,该系统对全部案由的识别准确率已达70%,民事和刑事案件排名前10 位案由的识别准确率已超过95%。⑪

2.司法大数据辅助审判支持系统

司法大数据辅助审判支持应用主要体现为司法文书自动生成、虚假诉讼识别等。通过对司法大数据资源的有机整合,可以自动生成司法审判所需的文书。河北省高级人民法院研发的具有文书自动生成功能的智审系统,能够减轻法官30%以上的案头事务性工作。⑫虚假诉讼识别系统通过云计算、大数据和智能算法等技术运用,能够实现对于风险人员、风险案件的智能识别认定,辅助法官甄别虚假诉讼。江苏省高级人民法院研发的“套路贷”虚假诉讼智能预警系统,从140.8 万余案件中识别出疑似“套路贷”虚假诉讼案件1.9 万余件,助推了对虚假诉讼的有效打击和源头治理。⑬

3.司法大数据辅助审判管理系统

司法大数据辅助审判管理主要作用于量刑偏离度预警、同案不同判预警、案件繁简分流等。对于“同判度”较高的类案,基于司法大数据智能分析可以生成司法裁判结果预测,在裁判结果与之发生重大偏离之时可以自动预警。如北京法院的“睿法官”系统,在判决结果与预测结果发生重大偏离时,系统将自动预警,可实现监督的效果。通过司法大数据智能分案系统可以对各类案件进行精细化处理,针对不同类型案件的特点,综合各项权重系数,自动测算案件所需办案力量,并据此分配案件,提高“人”与“案”的分类科学性和适配程度。上海市第一中级人民法院建立的案件繁简分流分类处置平台,通过对案件的智能分类与分流,优化了审判资源配置。⑭

二、司法大数据辅助审判应用的风险与问题

随着大数据在司法领域融合应用的不断深入,司法大数据辅助审判所面临的风险和实践问题逐渐显现: 大数据技术赋能所带来的数据算法风险对司法公正、司法权威构成潜在威胁;出现的功能异化风险僭越了辅助性地位,导致对司法固有属性的削弱。由此对审判权的独立行使、司法责任制度落实、司法伦理观念、司法传统文化等造成的挑战与冲击,给司法领域带来的风险同样不容小觑。此外,各类司法大数据辅助审判应用的实践效果未达预期、应用口碑两极分化也成为实践中亟待解决的难题。

(一)技术赋能层面:数据算法风险

1.司法大数据辅助审判应用的数据风险

首先,数据瑕疵已然显现。2020年,一份“假法规” 被多地人民法院在裁判文书中频繁适用,⑮虽然2018年最高人民法院已通过民事裁定确认该“法规”并不存在,但截至2021年10月,以其为关键词在中国裁判文书网中仍然能够检索到三百余篇裁判文书。⑯具有瑕疵的司法数据,以及违背事实和法律作出的错误裁判一旦成为数据分析源,基于司法大数据的裁判结果预测、类案推送等辅助审判应用,实际上可能形成掩饰、固化甚至放大错误的效果,影响司法公正的实现。

其次,数据缺失问题尚待解决。在部分案件中,对于司法裁判具有重要影响的信息并不完整,以刑事案件为例,通过实证研究建构的量刑结构方程模型显示,从裁判文书中提取的人身危险性和社会危险性等量刑情节(因素)并不能百分之百地对量刑结论进行解释。⑰部分对案件处理具有影响的案外信息(如特殊的被害加害关系等),部分对定罪量刑具有决定性作用的信息(如适用量刑情节的理由等),在裁判文书中没有完整体现。虽然司法大数据具有客观真实性,能够完整记录司法审判过程,但并非所有的司法数据都能服务于司法大数据辅助审判应用的研发,如记录法官分析过程和实质考量要素的合议庭笔录、案件审理报告、审判委员会的会议纪要等内部数据,目前就无法成为研发司法大数据辅助审判应用的底层数据。此外,数据壁垒、数据孤岛的现实存在也造成一定的数据缺失。调研发现,大部分公安机关、检察机关的文书并不能被扫描、标注并汇集到法院使用。司法数据的缺失,无疑会严重影响机器学习的质量。

2.司法大数据辅助审判应用的算法风险

大数据与司法的不断融合,“算法黑箱”“算法歧视” 等已经成为司法大数据辅助审判应用所要面对的难题。“算法黑箱”的存在可能会加剧公众对司法裁判的不信任,也会导致追责机制和监管制度难以落实。司法大数据辅助审判决策的目标是克服法官个人主观性所带来的裁判偏见和歧视,但算法决策本身也会产生“算法歧视”,而且这种歧视具有较强的隐蔽性,⑱当事人很难挑战这种歧视并获得有效救济。2016年,美国“威斯康辛州诉卢姆斯案”所引发的争议,意味着司法大数据辅助审判所招致的公众质疑已经从单纯的理性探讨转化为必须回应的现实。在该案中,被告认为初审法官参考基于大数据识别犯罪风险程度的评估工具COMPAS 对其量刑,侵犯了其未经正当程序不被剥夺自由的宪法权利,而COMPAS 的算法保密导致其无法质疑风险评估的科学性和公允性。虽然被告的异议被终审驳回,但该案体现出的因算法风险而引发的信任危机,成为将来司法大数据辅助审判应用发展不容忽视的问题。

(二)应用场景层面:功能异化风险

1.司法固有功能的削弱

大数据技术在其他场景的应用优势,反而可能成为颠覆司法固有属性的潜在风险。一方面,当前部分司法大数据辅助审判应用不仅适用于司法裁判,还兼有司法管理、监督功能,无形中可能变成对办案法官“绑手缚脚”的锁链,导致其在裁判时过多地考虑案外因素,而不是或很难不受干涉地独立行使司法裁判权,这催生了其与亲历性、封闭性等司法固有属性的冲突。而且,司法大数据辅助审判应用的开发一般都外包给数据服务商或科技公司,技术人员可能通过算法设计和数据篡改不当地介入和影响司法,而这种潜在的对审判权独立行使的干涉又难以被识别和发现。

另一方面,司法大数据辅助审判应用的泛化适用,实现了对司法全流程的技术、算法监控。如上海“206 系统”的功能涵盖了刑事司法的审前、定罪和量刑程序,几乎涉及了刑事司法裁判的所有流程。通过司法大数据等先进技术“构建静默化、自动化、可视化的全流程监控系统,可以加固‘廉政边界’,构筑‘数据铁笼’,强化‘科技控权’”。⑲但在此过程中,“数据决策” 也将不断影响、监控“法官决策”,审判权的独立行使可能在技术赋权中被不断消解。中国的司法文化始终蕴含着人文精神的光辉,司法裁判的情理法之平衡与社会道德伦理观相契合,具有较强的说服力和社会认同感,可以促进司法“定分止争”目的的实现。司法裁判中关于情理法的衡平因素,大数据量化分析难以有效挖掘,更遑论那些并未呈现于裁判文书中,但已然内化于法官心中并应用于司法裁判中的人文精神和价值判断。此外,通过司法大数据的可计算性、可预测性模式以及现实功利的自觉与非自觉作用,习惯使用司法大数据辅助审判决策的法官,会被渐渐“培养”成为工具性、技能性极强的个体,这种技术理性力量对自我的侵入将直接导致法官个体丧失其行为本身应有的道德禀赋,也致使司法的固有功能被削弱。

2.辅助性地位的僭越

司法大数据辅助审判应用所具有的司法裁判结果预测、刑事量刑参考、同案不同判预警、量刑偏离度预警等功能,在司法实践中,极易发生功能异化,这种功能异化的直接后果是司法大数据辅助审判应用由辅助性地位,向指导性乃至监督性地位的转化。司法大数据辅助审判应用的功能异化肇因于其“辅助性” 定位和实际所具有的指导性、监督性等宰制功能发生“混同”。当多重功能归于一个身份之上时,纵然定位清晰,其不同功能也会在事实上相互影响,或在“此消彼长”的拉扯中各行其是,或导致作用的相互消解,某一或某几个较为强势的功能吞噬其他功能。如果任由不同的功能属性相互“竞争”,直接的后果是辅助性地位的反转,指导性、监督性乃至主导性地位的确立。即使没有造成辅助性地位的颠覆,在这种无制约、无秩序的“竞争”中,司法大数据辅助审判应用的辅助性地位也会变异,影响其功能发挥。

(三)应用效应层面:司法规律抵牾风险

1.司法责任落实受到阻碍

司法大数据辅助审判可能会动摇法官审判权的独立行使,为司法责任的落实设置障碍。首先,“审理者裁判”的核心意旨可能被虚置。如多数刑事案件智能辅助办案系统的使用者,不限于法官,而扩展至法院内部、外部与刑事诉讼活动相关的多种主体,极有可能导致办案法官的司法裁判受制于法院内外部的多重力量,与司法责任制所追求的由“审理者裁判”相背离。其次,“裁判者负责”的责任认定机制将会被悬空。司法大数据辅助审判应用的研发,算法工程师、数据分析师等技术人员必然参与其中,对应用功能的实现发挥关键作用。虽然在国家层面,技术研发风险已得到一定的重视,⑳但是司法大数据辅助审判应用的设计程序复杂、参与主体较多、算法不公开透明,即使程序设计出现问题,往往难以被使用者所发现。而且,很多科技公司对司法大数据辅助审判应用的研发几乎不存在相关的制约规范与问责机制。一旦这些由多主体研发、多主体使用的司法大数据辅助审判应用被法官习惯性适用并形成过度依赖,将形成“审理者仅主导裁判,裁判者无法负全责”的尴尬局面,对其中可能存在的司法错误如何追责,将成为一个新的实践问题。

2.司法伦理观念受到冲击

司法大数据辅助审判应用基于强大的数据分析和自我学习能力,在裁判结果预测、量刑预测、类案检索等方面具有不可小觑的优势。在这种强大的优势面前,人类会不知不觉丧失主导地位:是更相信自己的经验判断,还是海量数据的分析结果? 隐藏在问题背后的阴霾可能给我们带来更多的恐慌与不安: 司法大数据辅助审判应用在预测裁判结果时,难免影响案件中的伦理道德抉择。面临艰难的人性抉择和拷问时,人常常会选择逃避或寻求帮助,这时大数据智能分析结果便成了理想的避风港。随着大数据和人工智能技术对司法裁判参与程度的不断加深,年轻法官关于价值判断的经验积累将不断削弱,而这种机器生成的“伦理道德判断”会逐渐侵蚀甚至代替人的价值抉择。或许这在现在还是“危言耸听”的奇思,但“信仪器还是信医生经验”的难题,在人工智能应用席卷已久的医学领域早已有所显现,对于司法大数据辅助审判应用给司法裁判带来的伦理道德价值抉择危机之顾虑绝非杞人忧天。

(四)应用实践问题:实效未达预期

对于司法大数据辅助审判的技术风险和应用风险之反思与规制尚属“防患于未然”,对当前已暴露的应用实践问题,则属于司法大数据辅助审判应用必须面对和需要首先解决的现实难题。

1.对司法效率的提升未达预期

首先,在“案多人少”的压力下,作为司法大数据生产者的一线办案法官,缺乏录入数据的激励。当前,大多数司法大数据应用平台基础性建设并不完善,完成数据录入需要耗费大量时间。如北京互联网法院目前实现了无纸化办案,为电子卷宗的智能深度应用打下良好基础,但电子诉讼系统尚不能完全实现对电子化材料的自动分类、自动编目,当事人上传的材料往往混乱无序,且有近20%自行上传的材料不符合法院电子化材料的标准,需要逐一辨别与调整,加重了办案法官的工作负担。其次,录入数据的规范性也难以得到充分保障,而且“数据孤岛”“数据壁垒”的存在,导致法院对公安机关、检察机关掌握的案件材料无法尽然使用,在一定程度上降低了数据质量,使司法大数据的应用实践效果受到影响。此外,当前的司法大数据辅助审判应用的系统精准度有待提高。如大多数法院使用的类案检索系统,一线法官认为检索类目不够细化,检索结果的针对性和适配性不够,无法实现高效的检索和推送,反而加重了法官甄别检索结果的业务负担。

2.对应用实效的评价两极分化

法官对司法大数据辅助审判应用的评价呈现明显的两极分化。一方面,部分基层年轻法官面对办案压力,对司法大数据辅助审判的需求和期待较高,对于各类辅助审判支持系统的应用比较积极。然而有法官也坦言,现有系统的设计功能较难实现,法官对司法大数据辅助审判应用的信任度不高,如有的智能系统能够实现信息的自动提取和标注,但法官往往选择自行标注。司法大数据辅助审判的应用实效与法官真实的业务需求之间存在一定差距,各种辅助系统在实践中使用效果远未达到预期。另一方面,部分法官对司法大数据辅助审判应用甚至给予了较为负面的评价。对某省刑事案件智能辅助办案系统使用情况的调研表明,该系统基本没有在刑事审判中得到应用,甚至有受访法官对此持完全的否定态度,认为该系统仅仅处于起步阶段,根本无法达到预期效果。㉑

三、司法大数据辅助审判应用问题成因剖析

(一)对司法大数据辅助审判应用存在认识偏颇

目前,不论理论界还是实务界,主流观点均主张和强调司法大数据应用对于审判的“辅助性”地位。但辅助性地位的厘定,大多立基于技术工具论及技术中立观,这种解读忽略了现代技术对自身边界的超越与异化。朴素的工具论或许在技术并不发达的工业社会具有其历史合理性,但已无法实现对现代技术的复杂性、丰富性的经验描述,更无法厘清技术与社会的互动关系。一味的技术慕强心态和对“技术乌托邦”的沉迷,逐渐被关于现代技术的理性反思所牵缚。在现代社会,技术早已成为人类文化、文明和社会不可分割的一部分,无法将技术与其应用截然分开。技术的本质体现的是人性和物性的自洽,是社会属性和自然属性、恒定性与变动性的辩证统一。㉒事实上,技术并非中立意义的存在,而具有二重性。技术权力本质上具有利他性、整合性、竞争性、(隐性)操纵性等综合特征。大数据技术权力利他性和整合性在司法场域中体现为司法大数据可以赋能于法官,从而提升司法效率、降低司法成本。但同样不能忽视的是,技术权力具有竞争性与操纵性等属性,大数据技术在司法审判中的应用也可能形成技术宰制性,以至于消解司法的固有属性,限制法官审判权的独立行使,颠覆司法大数据在审判中应用的辅助性地位。

历史发展和人类解放从根本上源于技术的发展,但同时,技术是异己的力量,不能为了技术发展而忽视技术对人的支配。㉓在“人机合作”模式下,机器虽然未能达到与人具有同等法律地位的程度,但其作用已远远超过了传统“工具论”的工具范畴。相较于以往的传统技术,大数据与人工智能技术的独特性在于其自主性,这种自主性或来自技术本身,或来自应用过程中社会赋予它的角色,此种属性也是技术宰制性形成的内在机理。因此,应该在充分认识技术的自主性之前提下,明确司法大数据辅助审判应用作为“工具”的技术和参与“决策”的技术之间的区分。此处所说的参与“决策”,并不限于让司法大数据辅助审判应用能直接进行决策,也包括其应用对人们的观念、行为与相应的社会关系形成影响。司法大数据辅助审判应用对法官司法决策的多方“参与”,就成为功能异化风险的肇因。

当将问题重新聚焦司法大数据辅助审判应用,大数据技术赋能对于司法审判的影响,不仅在于为法官提供便利工作、提高效率的简单工具。随着各类司法大数据辅助审判应用的出现,其在司法审判活动中已不再纯粹作为一种中立性的存在,而可能加剧控辩审力量的失衡。甚至也无法保证司法大数据技术不会被别有用心的技术赋能者不当操纵。司法大数据辅助审判,打破了司法审判活动各方参与主体之间原有的衡平关系,其带来的是技术赋能对于社会资源、司法资源的再分配,将诱发司法活动参与者呈现出“强者更强、弱者更弱”的马太效应。

一方面,随着大数据技术与司法融合程度的不断加深,由于各主体对技术的占有和使用基础不同、认知能力各异,赋权效能将会出现较为明显的分层,形成对主体的技术参差赋权。另一方面,作为司法大数据辅助审判应用的主导开发者,司法机关掌握着数据喂养、算法设计的决定权,将有助于提升其办案质效的规则体系嵌入其中,占据技术赋能的“金字塔”顶端。诉讼参与人则更像是司法大数据技术的被适用者,只能被迫接受嵌入司法机关意志与规则设计的应用系统,处于较为弱势的赋权地位,不可避免地沦为技术赋权场域的弱势群体。司法大数据的技术参差赋权在司法实践中已不鲜见: 在法官已经能够使用各种司法大数据审判辅助应用时,老年人等技术弱势群体还不知如何使用智能手机登陆“移动微法院”;在年轻法官充分享受着技术红利带来的司法效率提升时,年长法官还在耗费更多的时间为了绩效考核不得不适应司法大数据辅助审判应用。应该警惕的是,司法大数据技术的应用仅让少数司法活动参与者受益,而带来对部分诉讼参与人诉权保障的牺牲。因此,应该坚持人性化的走向,从司法大数据应用于司法审判的实践出发,在充分考虑人、社会和技术之间的互动与牵制关系上,摒弃对于司法大数据辅助审判应用的技术中立观和工具论,重新审视司法大数据技术的本质及其异化的风险,并以此作为考察、建构和审慎限定司法大数据辅助审判应用辅助性地位的重要理论基点。

(二)对司法大数据辅助审判功能限度的反思未达充分

现阶段的司法大数据辅助审判应用未理性正视大数据与人工智能技术发展与应用的阶段性、复杂性特征,未充分考量司法数据质量对大数据技术应用的制约,未充分重视大数据分析对司法论证说理的不可达,未有效化解司法大数据辅助审判对法官自由裁量的削弱,未充分反思技术在司法场域的应用限度。

首先,司法大数据辅助审判应用建立在大数据和深度学习之上,司法数据的质量至关重要。从我国司法大数据的“量”来看,虽然大数据管理和服务平台汇聚了全国法院的司法数据,解决了数据“有无”的问题,但并未达到数据的海量性。大多数司法大数据辅助审判应用的研发,以中国裁判文书网等可公开的非全量数据为基础,大量不公开的司法裁判文书无由成为大数据分析样本。从司法大数据的“质”来看,我国的司法裁判文书公开制度尚不成熟,大量格式不规范、内容不完整,甚至有错误的公开裁判文书没有及时清理,司法数据的完整性、规范性、正确性无法得到保障,导致司法大数据的可靠性有所贬损。数据瑕疵虽可以通过规范裁判文书内容、提高裁判文书质量得以缓解,但在短期内难以得到有效改观。此外,数据标注是司法知识图谱构建的重要基础,主观选择的数据标注决定了部分司法大数据辅助审判应用功能的实现程度。如上海“206 系统”的研发采取了人工标注和自动标注两种形式,人工数据标注的质量受限于标注者专业知识水平,自动标注也需要人工进行审查校正,数据标注质量难以保障。而相应地,基于此开发的司法大数据辅助审判应用就无法实现准确的裁判预测等功能。

其次,司法大数据辅助审判应用的计算不能等同司法论证说理。大数据辅助审判决策的基本方式,是通过将开放的司法数据进行自然语言处理后,输入机器学习的算法之中,得出一种或多种预测案件结果的模型。在通常情况下,此种算法并未实现对法律推理的复现,而是通过数据计算寻找判决中各个参数之间的相关性。㉔相关关系表征的是两个或若干因素之间的关联密切程度,不能揭示司法过程的推理和运作逻辑,即便把握了相关关系,也不能以此直接溯寻导致结果发生的原因。依据当前的大数据技术分析处理案件中的因果关系,得到的仅是量化关系的强度和正负性质,丧失了原有的必然性和方向性,㉕即量化后的裁判因果关系将蜕变为变量之间的相关关系,原有的裁判因果关系中某些重要的性质被改变,这将导致司法论证中结果性事实与原因性事实的联结、原因性事实与特定法律后果的联结被遮蔽。㉖司法大数据虽然能在事实认定上发挥积极作用,但对司法大数据辅助审判决策的应用不慎,将可能导致以数据计算的相关关系“颠覆”司法推理的因果关系,对公正裁判产生负面影响。

最后,大数据技术无法实现司法实质理性。司法的实质理性依凭司法的能动性,强调法官在司法裁判中价值选择、经验总结等主观作用的发挥。在认知智能领域,大数据与人工智能技术的应用尚难望人类项背。人类有语言,有概念,才有推理,概念、意识、观念等都是人类认知智能的表现。机器在重复性、规律性工作中已经表现出更好的效率,但还很难从事掺杂情感、道德、价值判断等的事务,而这正是在解决疑难案件过程中法官需要做的主要工作。经验产生于不同时间、不同地域、不同社会背景下,机器意义上的同案很可能并不是裁判意义上的同案。一个好的裁判,尤其是高级别法院的裁判,需要充分考虑裁判可能对社会秩序、社会价值取向产生的影响,而不是机械地照搬已有的他人经验。基于“同案同判”作出的量刑规范化的努力,也存在以“机械正义”取代“个案正义”之嫌。从量刑制度改革来看,围绕“电脑量刑”的争议已存在多年,㉗司法大数据辅助审判应用在刑事司法裁判中对于量刑的辅助,致使相关问题的龃龉加剧。大数据与人工智能技术虽能使司法辅助审判应用更加精确化、标准化,但在客观上却将不断挤压法官的自由裁量权,不利于真正实现个案裁判的实质公正。

(三)对司法大数据辅助审判本体限度的考量有待加深

大多数司法大数据辅助审判应用的研发,局限于对通用大数据技术在司法领域的平移使用。目前在司法大数据辅助审判应用的系统开发具有优势地位的科技公司间,存在相关技术标准不统一、系统不兼容等问题,技术壁垒导致在数据利用、深度学习等方面难以实现关键性、实质性的技术突破,也未真正实现大数据技术与司法领域的深度融合,使司法大数据辅助审判应用不能真正回应司法的现实需求。

首先,未充分考虑裁判逻辑、司法推理的特殊性。以类案推送为例,目前常用的关系抽取方法有关键字匹配法、向量空间法、知识图谱法和深度学习法等,无论是采用通用的文本相似度模型“词频—逆文本词频模型”(TF-IDF),通过词频来计算案件相似度,还是利用“基于Transformer 的双向编码器表示模型”(BERT),通过不同文本之间的向量计算相似度,类案推送系统都采用自然语义识别技术自动抽取情节,再通过情节匹配程度来推送类似案件。㉘这种算法模型的建构与应用在其他领域或许可行,但在司法领域却面临极大的适应性难题。所谓类案,需在基本事实、争议焦点、法律适用问题等方面具有相似性,㉙词频、文本等情节的匹配或许能够找到事实情节相似的案件,但并不必然意味着案件法律关系、争议焦点相似。如法官在办理“非法拘禁”案件时,传统的类案推送系统会识别“非法拘禁”标签,进而推送数据库内援引刑法第二百三十八条的裁判文书。但是不是“非法拘禁致人重伤、死亡” “使用暴力致人伤残、死亡而构成故意伤害罪、故意杀人罪”以及“非法拘禁罪与故意伤害罪或者故意杀人罪数罪并罚”则在所不问,导致大量的裁判文书被打包推送,需要法官自行甄别其中有参考价值的判决。通过此种方式完成的类案检索,不能有效捕捉句子在法律论证中发挥的功能,从简单的法律用语信息检索转换为真正的法律论证检索,司法大数据辅助审判的技术发展路长且阻。

其次,未充分考量司法场域的适用性。司法的固有属性、现实需求使其对技术的专业性、精确度有着极高的要求。司法的公正性、权威性,也决定了社会与公众对司法错误的容忍度相当有限。引发公众强烈质疑的案件,可能会造成司法权威的断崖式下跌。对于通用大数据技术而言,数据质量的判断通常为形式性的,但在司法场域应用大数据,则应通过专业人士对裁判文书进行实质性审查,以充分保障样本数据的正确性,进而提高司法大数据辅助审判应用的准确性与适用性。如短视频平台基于用户画像生成个性化推荐,只需要根据用户的搜索、浏览记录等个人信息提取兴趣偏好并形成用户画像,从而进行特定视频内容的推荐服务。在此过程中,仅需要进行形式性判断,不需要考虑样本数据中兴趣爱好本身的“对”与“错”、“好”与“坏”。作为司法大数据辅助审判决策的司法裁判结果预测、类案推送等应用,在算法训练时应该对于法院判决的对错进行判断,对错误数据、过期数据等不匹配数据进行筛选、剔除,如果机器学习的历史裁判文书中存在错误判决,将可能会辅助法官作出错误的判决。此外,对于某些通用大数据技术的应用,也应秉持相对谨慎的态度。如出于对法官隐私保护、审判权独立行使等方面的考量,对基于法官“画像”的司法裁判结果预测也需要进行严格约束与限制。

四、司法大数据辅助审判应用的限定与规制

以对司法大数据辅助审判技术中立观和技术工具论的批判性反思为前提,以对司法大数据辅助审判应用在技术、功能和本体层面的局限性之剖析为基础,可以为司法大数据辅助审判应用限度的明确锚定重要面向与有力抓手。具言之,以坚守司法大数据辅助审判应用的辅助性地位为主轴,防止其向技术宰制性地位蜕变。在技术规制层面,重视技术的赋权与限权之衡; 在应用场景层面,明晰核心禁区与业务痛点;在应用主体层面,强化程序规制与合理限度管控,进而强化对司法大数据辅助审判的安全管理与风险防控,合理规避与化解司法大数据辅助审判应用的风险及实践问题,实现对司法大数据辅助审判应用的有效限定与规制。

(一)技术规制层面:技术赋权与技术限权

从赋权之促到限权之缚,明确司法大数据辅助审判应用的实践指向。超越简单的技术工具论和纯粹的技术中立观,摆脱形而上学的技术观之束缚,化解司法大数据在审判应用中所面临的风险及问题,通过合理的引导,使司法大数据成为提升司法质效的重要手段。“技术赋权”思想揭明了社会公众通过新的技术手段实现自我增权的现实途径,以“技术赋权”实现司法的人权保障与司法大数据辅助审判的互动与融合,可以为充分激活大数据技术的正面价值提供理性指导。但从根本意义上讲,“技术赋权”与技术中立观一脉相承,难以真正解决司法大数据辅助审判应用的技术研发和适用难题。因而,在强调技术“赋权”的同时,必须基于大数据技术的负荷所带来的隐忧,重视对技术的“限权”。与“赋权”所发挥的效用来自于技术本身一样,“限权” 强调通过对大数据技术本身的限制,实现对于司法大数据在审判中的应用规制。

通过充分考量技术的正向效应与负面价值,实现技术“赋权”与“限权”之间的衡平,重塑司法大数据辅助审判技术观。建构司法大数据辅助审判应用的治理原则和规制框架,达成对于司法大数据应用的风险防控、安全管控和合理适用。从实现路径来看,可以从两个层面“双管齐下”:

首先,加强内部重构。对于司法大数据技术风险的防控,首先应深入算法的“顶层设计”,比照“阿西莫夫机器人三大定律”,以遵循伦理和安全原则为基础,为规范司法大数据辅助审判应用的研发筑牢基本准则和底线,使司法大数据辅助审判应用做出的决策参考不会违背和挑战基本的司法伦理。其次,加强外部监管。实行设计问责和应用监督并重的双层监管结构,实现对人工智能算法设计、产品开发和成果应用等的全流程监管。㉚从事前的规制到事后的问责,监管应该贯穿司法大数据辅助审判应用的研发和适用全流程。在遵循司法规律的前提下,强化对“算法歧视”“算法偏见”的法律规制,有序稳妥地推进数据及算法的优化,防范和规制司法大数据辅助审判的技术赋能风险。具体而言,通过建构并完善司法大数据应用研发规范,确立司法大数据辅助审判应用研发的审核机制与问责机制,区别司法大数据应用的研发者和使用者责任;针对技术的鲁棒性、数据算法风险等确立风险预防机制,强化对司法大数据应用的技术风险管理,以确保司法大数据辅助审判的可靠性; 加强司法大数据辅助审判应用的可追溯性、可解释性和算法的公开,推进司法大数据应用技术透明度的提高,以增强司法大数据辅助审判的可信赖性; 提升司法审判活动中相关主体在司法大数据应用设计中的参与度与监督作用,促进司法大数据辅助审判应用的技术“平等赋权”,实现对技术弱势群体的权益保障。

(二)应用场景层面:核心禁区与业务痛点

司法大数据辅助审判所带来的技术风险、司法制度抵牾风险,很大程度上来自于对司法大数据应用在审判全流程不加区别、不加限定的适用。因此,应结合技术发展的阶段性特征,考量司法活动特点、司法现实需求和大数据在司法审判中应用的潜在风险等,并对其进行适配性调整,实现对于司法大数据辅助审判应用场景的有效限定。

首先,明确业务痛点,限定适用场景。现阶段的司法大数据辅助审判应用,其主要功能是辅助进行信息的高效处理。因此,应将大数据信息处理的优势和司法需求充分结合,明确司法大数据辅助审判的应用场景。其一,为缓解法院“案多人少”的压力,司法审判中重复性、机械化、可替代性的工作可以委诸司法大数据辅助审判应用。如文书自动生成等司法大数据辅助审判支持应用,能有效减轻法官的事务性工作负担。其二,利用司法大数据辅助审判应用对司法形式理性实现的重要作用,发挥其在规范办案程序、单一证据校验等方面的核心优势,减少司法任意性。其三,通过司法大数据辅助审判算法决策,能够以程序性、公式化计算来优化诉讼程序与处理简单案件。如利用司法大数据辅助完成对简易案件的速裁,使法官从简单案件中脱身,处理专业化需求更高的重大疑难案件。其四,利用司法大数据辅助审判应用促进对司法资源的合理分配,如通过案件繁简分流等司法大数据辅助审判管理应用,促进办案质量和审判效率的提高。

其次,确定核心禁区,建立负面清单。基于司法大数据辅助审判存在的技术风险、技术应用限度,明确其适用的范围与边界。通过对核心禁区的明确,建立司法大数据辅助审判负面清单,限缩司法大数据辅助审判应用的适用领域。其一,从技术层面,要充分发挥技术对司法的赋能作用,但对于不符合司法规律、未能与司法固有属性充分融合的司法大数据辅助审判应用,应明确限定其使用的核心禁区。如鉴于司法大数据辅助审判在认知智能方面的发展限制和天然缺陷,需要进行价值判断的疑难复杂案件,不应该使用司法大数据辅助审判决策功能。其二,从应用层面,凡可能存在无法避免的重大技术风险,或可能导致无法控制的司法规律抵牾风险,乃至冲击司法基本价值与功能的司法大数据辅助审判应用都应列入负面清单,禁止其在实践中的适用。当然,因应技术的未来发展、法律的变动,核心禁区和负面清单需要动态调整。

(三)应用主体层面:程序规制与合理限度

司法大数据辅助审判应用辅助性地位的限定,主要是对于技术工具属性的重申和司法者主体地位的再强调。对司法大数据审判辅助应用的适用,应以保障法官的自主性和能动性为前提,通过程序规制与技术设计,将其适用严格控制在一定限度内。

首先,严格限定使用权限。严格限制司法大数据辅助审判应用适用主体的权限,具有裁判结果预测、量刑参考等辅助审判决策功能的司法大数据应用,其辅助决策对象只能是办案法官,而不能是司法管理者、监督者。当然,司法管理者、监督者可以在其职权行使范围内使用司法大数据辅助审判应用的部分功能,但其享有的使用权限不应该与办案法官完全相同,司法管理者、监督者获取的相关个案信息应经过一定的处理,如量刑偏离度预警只能展现一定的偏离程度(分为轻微、中度、严重)等,上述数据也不能直接作为法官绩效考核和司法监督权行使的依据。公检法不同机关主体,应该有区分地适用司法大数据辅助审判应用的辅助功能,不能因片面强化公检法互动,背离以审判为中心的诉讼制度改革的内在逻辑。既要保证司法大数据在审判工作中有效发挥作用,又要充分保障办案法官的判断权和裁量权。

其次,充分限定使用限度。司法大数据辅助审判的功能异化主要体现为其“辅助性”定位和实际上所具有的指导性、监督性等宰制性功能发生的“混同”。司法大数据应用的辅助性,应该以办案法官和司法大数据辅助审判应用的职能分立为基础,强调办案法官的优先地位。必须自觉地将司法大数据在审判中的适用严格定位为“辅助性”,从制度上保证其监督性和指导性作用的发挥不能突破辅助性功能的限度。如在具体的功能设计上,可以将司法大数据辅助审判应用中影响司法决策的司法裁判结果预测、量刑参考等功能严格限定为办案法官“自查”的手段,由办案法官自主决定是否适用,法院内部和外部任何主体不得强制办案法官适用,变外部监督为办案法官的自我监督。只有这样才能够真正使司法大数据在审判中的应用始终处于辅助性地位,在充分发挥其应有功能和作用的同时,避免僭越辅助性地位而形成技术宰制性。

最后,明确限定使用程序。为了既不突破司法大数据辅助审判应用的辅助性定位,又有限发挥其指导性和监督性作用,实现办案法官的自我监督,需要限定司法大数据辅助审判应用的适用程序。如在具体的流程设计上,可以对司法大数据辅助审判应用不同功能适用的时间段作出严格限定,同案不同判预警、量刑偏离度预警等兼具司法管理、监督的功能,在办案法官完成裁判文书的初步写作、得出一定的裁判结果之后,才能作为一种“校验”来使用。是否使用此“校验”功能,也应赋予办案法官最大程度的自由决定权。

结 语

在“发展优位”的推进思路下,我国司法大数据辅助审判应用在未充分考量司法大数据的基本特征、技术发展与技术本质的前提下展开,对技术的应用限度认知不足,对于技术的宰制性体悟不深,对辅助性地位的坚守不彻底,导致其在技术赋能层面存在数据算法风险,应用场景之中蕴含功能异化风险,应用效应层面产生司法规律抵牾风险,以及应用效能未达预期等实践问题。面对大数据在司法领域融合应用中的风险与问题,需要立足司法大数据技术的辅助性,通过技术的赋权与限权之衡实现技术应用规制,通过核心禁区和业务痛点的明确达至应用场景限定,通过应用程序和合理限度的厘定强化应用主体管控,进而完成当前阶段对司法大数据辅助审判应用限度的确定。最高人民法院可出台相应的司法大数据辅助审判应用规范,为大数据在司法审判中的深入融合应用提供有效指引,以完善对司法大数据辅助审判应用的规制,将“发展优位”顺势转变为高质量发展优势。

注释:

①European Commission for the Efficiency of Justice(CEPEJ), European ethical charter on the use of Artificial Intelligence in judicial systems and their environment, https://book.coe.int/en/computers-and-law/7842-european-ethicalcharter-on-the-use-of-artificial-intelligence-in-judicialsystems-and-their-environment.html.

②王禄生:《司法大数据应用的法理冲突与价值平衡——从法国司法大数据禁令展开》,《比较法研究》2020年第2 期。

③在美国,如刑事案件智能辅助系统的适用仅局限于警情预测、人脸识别、取保候审和量刑风险评估等特定领域,美国法院和州立法机构分别通过判例和法案的形式对其应用进行规制。See Artificial Intelligence:Emerging Opportunities, Challenges, and Implications for Policy and Research, https://www.gao.gov/products/gao-18-644t.

④左卫民:《热与冷: 中国法律人工智能的再思考》,《环球法律评论》2019年第2 期。

⑤⑬孙晓勇:《司法大数据在中国法院的应用与前景展望》,《中国法学》2021年第4 期。

⑥⑨大数据在司法审判中的融合应用研究课题组:《限度与深化:大数据在司法审判中的融合应用研究》,《中国应用法学》2021年第2 期。

⑦张嘉军:《司法大数据的价值功能、应用现状及其应对》,《郑州大学学报(哲学社会科学版)》2018年第1 期。

⑧⑪陈盨、田禾主编:《中国法院信息化发展报告No.5(2021)》,社会科学文献出版社2021年版,第15 页。

⑩崔亚东:《人工智能与司法现代化》,上海人民出版社2019年版,第114~115 页。

⑫乔文心:《智慧路上 “从头越”——人民法院加强信息化建设综述》,《人民法院报》2018年4月27日,第2 版。

⑭上海法院:《构建要素模型 优化资源配置——上海一中院启用案件繁简分流分类处置平台》,http://shfy.chinacourt.gov.cn/article/detail/2018/10/id/3533021.shtml(2021年10月20日访问)。

⑮澎湃新闻:《一“处理意见”被多地法院引用判案,最高法明确“没出台过”》,https://baijiahao.baidu.com/s?id=167 3711834549068530&wfr=spider&for=pc(2021年10月12日访问)。

⑯该“假法规”为“最高人民法院关于审理民事纠纷案件中涉及刑事犯罪若干程序问题的处理意见”,虽然最高人民法院早已通过民事裁定明确“本院没有出台过该处理意见”。但以其为关键词在中国裁判文书网进行检索,仍能得到318 篇裁判文书,检索时间:2021年10月12日。

⑰李安:《量刑实证研究的方法论检视:从实证观念到实证技术》,《中外法学》2009年第6 期。

⑱罗洪洋、李相龙:《智能司法中的伦理问题及其应对》,《政法论丛》2021年第1 期。

⑲闵凌欣:《智慧法院: 释放不一样的司法红利》,《福建日报》2018年4月21日。

⑳《新一代人工智能发展规划》强调,要制定人工智能产品研发设计人员的道德规范和行为守则,实现对于人工智能算法设计、产品设计和成果应用等的全流程监管。

㉑李训虎:《刑事司法人工智能的包容性规制》,《中国社会科学》2021年第2 期。

㉒刘同舫:《技术的当代哲学视野》,人民出版社2017年版,第8 页。

㉓管锦绣:《马克思技术哲学研究》,湖北人民出版社2015年版,第92 页。

㉔郭锐:《人工智能的伦理和治理》,法律出版社2020年版,第156 页。

㉕王天思:《大数据中的因果关系及其哲学内涵》,《中国社会科学》2016年第5 期。

㉖冯洁:《大数据时代的裁判思维》,《现代法学》2021年第3 期。

㉗关于“电脑量刑”的争议,有学者认为“电脑量刑”将量刑简化为“刑的量化”,并未对影响刑罚的所有因素进行综合考量与平衡; 也有学者提出刑事诉讼 “事关人命、自由、国家目标以及社会正义”,因而“更需要保留基于人格修养的心证以及感化的余地,也更难于进行数码机械化的技术处理”。参见虞平:《量刑与刑的量化——兼论“电脑量刑”》,《法学家》2007年第2 期; 季卫东:《电脑量刑辩证观》,《政法论坛(中国政法大学学报)》2007年第1 期。

㉘刘艳红: 《大数据时代审判体系和审判能力现代化的理论基础与实践展开》,《安徽大学学报 (哲学社会科学版)》2019年第3 期。

㉙《最高人民法院关于统一法律适用加强类案检索的指导意见(试行)》第一条规定:本意见所称类案,是指与待决案件在基本事实、争议焦点、法律适用问题等方面具有相似性,且已经人民法院裁判生效的案件。

㉚《新一代人工智能发展规划》,http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm(2021年12月10日访问)。

猜你喜欢
审判裁判法官
牙医跨界冬奥会裁判
Chapter 20 Extreme torment 第20章 极度惩罚
裁判中存在“唯一正解”吗*——对《司法裁判中的道德判断》的批判性研读
大象法官分银币
法官如此裁判
法官如此裁判
猴子当法官
“五个到位”推动未成年人案件审判试点工作
未来审判
巴总统总理挺过审判日