智慧司法的算法隐忧及其规制

2023-02-07 17:50冯浩波
四川行政学院学报 2023年6期
关键词:司法智慧算法

冯浩波

(中国人民公安大学,北京 100038)

一、 问题的提出

互联网信息技术的发展,带来了新的生产方式的变革,大数据、人工智能技术作为新的生产工具,孕育了新的机器智慧,引发了制度变革和创新模式,极大地提高了工作效率。我国司法领域也积极顺应潮流,探索运用互联网新兴技术释放司法动能,寻求“智慧司法”的实现。但数据质量瑕疵会导致算法输出结果的偏差,过度依赖算法技术又会将这种偏差进一步放大甚至招致冤假错案,此外,算法黑箱的存在也在冲击着算法的公信力。如何顺应智慧司法发展的趋势,化解智慧司法带来的算法风险,进一步促进人工智能与司法实践优化适配是我们必须慎重考虑的问题。

二、 智慧司法的算法逻辑及实践应用

(一)智慧司法的算法基础

智慧司法以计算机算法技术为基础,目前的智慧司法系统主要建立在“知识图谱+机器学习”的基础上。所谓知识图谱,是指通过将图形学、应用数学、信息科学、信息可视化技术等学科的理论和方法与计量学共现分析、引文分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论[1]。机器学习可以通过计算机在海量数据中学习数据的规律和模式,从中挖掘出潜在信息,广泛用于解决分类、回归、聚类等问题[2]。在智慧司法领域,“知识图谱+机器学习”的应用,首先是收集相关案例,将海量的司法案例以数据化的形式转化为机器语言,并通过法律逻辑与技术逻辑的相互衔接,构建起数字化的类案知识图谱。其次,通过机器学习,从知识图谱中深入挖掘并总结隐含信息,并在此基础上进行消化、学习,形成算法模型,对相关问题进行预测、分析,在形成的类案图谱中,实现算法技术的智能学习。当前我国运行中的司法辅助系统诸如类案推送、辅助量刑等功能的实现都建立在这种算法逻辑基础之上。

(二)智慧司法的实践应用

现阶段,在相关政策的引导与推动下,我国智慧司法系统也愈加完善和成熟。2018年1月5日,最高人民法院就推出了“类案智能推送系统”,该系统一经上线就受到了广大法官、律师等的广泛好评。这一系统可以通过对案件事实、诉争焦点、法律适用等要素的收集进行画像,辅助用户快速从海量历史案件中发现相似案例,提供类案精准推荐服务。各个地方法院也分别发展起了各自的智慧法院系统。北京高级人民法院推出“睿法官”智能系统,立足于法官办案的核心需求,运用大数据、云计算、人工智能等新兴技术,通过智能机器学习,多维度数据支持,全流程数据服务,实现为案情画像,为法官判案提供统一全面的审理支持;上海“206”系统立足于智能辅助办案,通过证据规则指引、证据校验审查以及智能辅助庭审等方式,真正实现了公检法办理刑事案件网上运行、互联互通、安全传输、数据共享,整个刑事诉讼活动全程可视、全程可控、全程留痕、全程监督,防止司法任意性[3]。除此之外,河北法院“智审”审判辅助系统、移动微法院、南通法院支云庭审系统等技术的投入使用,承担了司法信息公开与检索、在线诉讼服务、简单裁判工作智能化、在线监督管理等任务,为法官决策提供了有力支撑。

三、 智慧司法的算法隐忧

智慧司法系统的应用极大地便利了审判工作,提高了案件的处理效率,减轻了司法工作人员机械性、重复性工作的压力,有效地缓解了案多人少的矛盾。但不可否认的是,现阶段的人工智能还处于弱人工智能阶段,难以达到替代人脑的状态,当前智慧司法仍然受到算法技术发展水平的限制,无法摆脱自身的机械性、滞后性的桎梏。伴随着智慧司法的普遍推广,我们应当警惕随之而来的算法隐忧。

(一)数据质量影响算法决策

计算机算法作为智慧司法发展的基础,为智慧司法系统的研发、运行提供了强有力的技术支持。可以说,计算机算法是推动智慧司法系统平稳运行的引擎,而这个引擎以海量的数据为燃料。因此,燃料质量的好坏将直接影响到司法辅助系统的运行状态。在算法的机器学习中,存在着“GIGO”的现象,即垃圾输入、垃圾输出[4]。数据的质量决定着算法结果的准确性。轻微瑕疵的数据通过计算机算法进入司法系统,在蝴蝶效应的影响下,也会成为影响司法公正的巨大风暴。为此,要防范算法风险,必须保证数据质量。

数据质量包含“质”和“量”。作为司法大国,我国司法大数据总量庞大。截至目前,我国裁判文书网收纳的裁判文书已经达到140,824,154篇,从“量”上来看,数据资源似乎能够满足智慧司法的机械学习需求,但是综合来看,这些数据广而不精,难以满足“质”的需求。其一,这些数据相对孤立且片面。目前我国主要存在的智慧司法系统,或是区域性的综合系统,例如前文已述的北京“睿法官系统”、上海“206系统”等;或是全国性的单一类型的数据库,例如中国裁判文书公开网。前者数据资源相对综合,但是局限于局部地区,不能与其他范围内的数据进行对比分析,综合研判;后者虽然整合了全国的数据,但只局限于裁判文书这一种资源,难以提供综合的参考借鉴。虽然这些司法系统数据库有丰富的资源,但却似一个个信息孤岛,难以实现资源的有效流转和利用。其二,司法数据的时效性弱。目前所谓的人工智能是以过去的数据为基础,试图解决未来的类似问题,但是,类似问题在不同时期会有不同解决方案[5]。这要求作用于算法的数据必须与时俱进。而现阶段,司法数据往往是不加选择地涌入智慧司法系统,这其中不乏冗余的过时的历史沉积数据资源,难以适应法律适用的发展性。其三,数据不完整导致算法偏差。从人工智能的角度来看,审判过程中出现的任何信息都有可能是知识图谱中的一环,并与审判结果之间存在或多或少的关联[6]。中国古代就有“辞、色、气、耳、目”五听断狱审判法,放之现在,依然有一定道理。庭审参加人员的言辞、神态、语气等信息都有可能影响到案件结果,然而这些信息难以以数据化的形式被捕获,也无法通过计算机算法表现出来。也就是说,应用于智慧司法的数据并不包含这些细节,而案件的全景往往是由这些细节——一个词、一组数、一个微表情等拼接出来的。基于这种不完整的数据进行算法学习,带来算法结果的局限性就在所难免。

(二)算法黑箱妨害司法公正

阳光是最好的防腐剂,司法公开才能保证正义以看得见的形式存在。在智慧司法领域,算法黑箱却似乎存在于阳光无法透射的隐秘角落。所谓黑箱,是指为人类所无法知晓的,即不能打开,又不能从外部观察其内部形态的系统[7]。智慧司法领域的算法,是建立在计算机基础上的以二进制代码形式表达出来的机器语言,相较于人类语言,这种机器语言表达的是计算机系统的思维方式。智慧司法系统的辅助功能的发挥,都是通过计算机系统运用预设的思维方式通过大量的繁琐复杂的机器学习和数据处理来实现的。而体现在实际使用过程中,也许只是简单的点击、输入、检索等简单操作。复杂的操作系统被封装起来,成为一个无法被打开、无法被窥视的算法黑箱,它的存在,极易损害司法的公信力。努力让每一个人民群众在司法中感受到公平正义,要求以公开促公正,以透明保廉洁[8],而数据黑箱与智慧司法系统的应用如影相随,即便公开,也只是一组复杂难懂的数据代码,难以为公众所理解和接受。通过智慧司法系统所输出的结论,也面临着监督不能的局面。

其次,数据黑箱的存在限缩了当事人及辩护律师的权利。受数据黑箱的影响,当事人在参与司法活动中的许多问题得不到具有说服力的解释,法律推算的过程难以得到当事人的理解,对当事人权利保障形成极大挑战。例如,美国的“卢米斯案”,就折射出运用智慧司法算法裁判带来的信任危机。美国威斯康星州在运用COMPAS再犯风险评估系统对卢米斯进行再犯可能性评估后,认为其再犯可能性较高,并因此判处其六年有期徒刑。卢米斯认为,COMPAS再犯风险评估系统的保密算法使其无法了解判决依据而据此充分辩驳、补充理由,并以此为由提起上诉。法院虽然援引了智能裁判的结果,却并未对对量刑结果起到决定性、关键性作用的智能程序的处理过程进行说明,只是在判决书中澄清了案件事实输入的准确性。这实际上显现出,如果司法机关放任司法算法的肆意,不采取积极的解释和保障措施,当事人的权利将会受到算法结果独裁专断。如果作为权利保障最后一道屏障的司法机关不能对司法算法严格把关,必然会导致司法公信力的崩塌,司法公正就无从实现。

(三)算法依赖挑战司法权威

智慧司法的推广应用在辅助办案中起到了极大成效,提高了司法工作的效率,但也带来了司法机关对算法的过度依赖。智慧司法辅助系统不断推陈出新,算法功能愈发完备,在证据分析、事实认定、法律使用等方面的作用越发凸显。而这种技术性辅助系统在解放生产力、提高工作效率的同时,也在悄无声息地侵蚀着司法人员的主观能动性。惰性是人与生俱来的天性,司法工作人员作为独立的正常的“人”,也不可避免地具有这种天性。在人工智能的发展越来越高效化、精准化、人性化的趋势下,司法工作人员会对算法结果产生越来越高的信任和依赖,而放松对算法结果的检验和校对。此时,司法人员作出司法决策,如同医生放弃了对患者倾诉症状的听取,转而只对化验结果、检测报告和病例检查照片保持信任,用一种片面的观点取代了另一种片面的观点[9]。例如,经过人工智能系统检验的证据材料,会被办案人员披上“经由人工智能检验”的外衣并因此对这些证据材料放松警惕。然而如前所述,基于算法技术的局限性,结果偏差的存在不可避免。如果司法人员的主观能动性丧失,算法结论的错误就不可避免。这些算法的错误结论如果没有被及时地发现和整改,将会对司法公信力产生不利影响。

另一方面,算法技术能力的缺失和对算法理念的忽视也加剧算法技术依赖[10],而过于依赖算法技术在不断侵蚀专属于司法机关的裁量权。基于计算机技术的专业性,仅依靠司法机关的力量难以建立起一套完整的智能系统。技术公司与司法部门合作的情况已经成为常态。例如,阿里巴巴、擎天科技等互联网企业为江苏“智慧法务”智能平台的建设提供技术支持[11];上海的“206”系统由科大讯飞与上海市公检法系统联合建设;在全国范围内推广运行的人民法院“智慧法院导航系统”依托于百度地图建设而成[12]。这种通过社会购买方式建立起的智慧平台,在一定程度上透析了权力专属原则。类案检索、量刑建议评估等系统是智慧司法平台建设的重要组成部分,这种算法评估的设计初衷是为司法工作提供参考,但它们在潜移默化地影响法官自由裁量权。法官对案件的裁判,应当建立在对法律解释、利益衡量、道德伦理和价值判断等因素进行综合考量并形成自由心证的基础上,而智慧司法系统将这些本应由法官进行综合考量的自由心证通过算法技术推演出来并获得法官的信任。“法官的自由裁量”被人工智能技术所侵蚀,变成了“算法的自由裁量”。

四、 智慧司法的算法隐忧应对

算法技术在司法领域的深度应用,展现出智慧司法的广阔前景,但同时面临着算法结果偏差、妨害司法公正、挑战司法权威等风险。在新形势下,应当明确智慧司法的发展方向,对算法技术进行法律规制,以修正技术风险,应对风险挑战,破解司法难题。

(一)优化数据质量,规范算法决策

如前文已述,数据质量在智慧司法算法技术中扮演着十分重要的角色,智慧司法体系的建设亟需优质充足的数据资源。为此,必须强化数据库建设,对进入智慧司法系统的数据进行严格筛选。

其一,应当加强各地区、各平台的数据资源共享,打破数据壁垒,实现公检法各机关之间的数据互通共享。将可能影响案件裁判的各项数据资料尽可能地纳入智慧司法系统,才能充实算法逻辑,在最大程度上还原案件现实,避免“一叶障目”的情况出现。“如果司法的数据孤岛不被打破,大数据的全面存储集中管理是不可能的;如果各分立的功能区域无法被整合在一个集成平台,在各个系统间的重复登录和切换只会令人不胜心烦”[13]。此外,要加强偏远地区的智慧司法系统建设,尽可能将这些地区的司法资源接入智慧司法数据库,对这些地区司法状况进行实时监控。引导这些地区司法程序规范的同时,为智慧司法的算法学习提供更多的个案研究实例,保证数据资源的横向拓展,为智慧司法学习各地不同司法习惯提供参考数据,保证个案公平。其二,设置数据预警机制,及时清查可疑数据。数据资源库是智慧司法算法技术的基础保障,必须保证数据资源的纯洁度。为此,要建立起一套数据清洗和筛选机制,结合法律规范的更新状态,对不符合法律发展、不符合社会观念的数据及时剔除。在智慧司法系统的程序设计过程中,可以写入信息预警模块。当司法人员对用以参考的法律信息进行更新后,通过算法模块自动分析筛选出与该更新后的法律信息不相符的数据并给出预警提示。此外,通过预警模块的自主算法学习,可以在智慧司法中形成自洽的数据逻辑,并通过这种逻辑去验证和筛查与逻辑相悖的数据。例如,在刑事司法中,证据的来源及其内容一般情况下应当合法且符合逻辑,当预警模块掌握这种逻辑之后,就可以筛查出来源不明、不符合逻辑的证据,从而排除非法证据。总之,数据预警模块的设置,可以及时对数据清查,保证数据的时效性和纯洁性。

(二)建立算法公开和解释机制,克服算法黑箱困境

算法黑箱与智慧司法的算法技术相伴而生,要使智慧司法在阳光下运行,就必须建立算法的公开和解释机制。实际上,算法黑箱中所隐藏的,只是一串串晦涩难懂的代码和数字,即便向社会公开,也不能起到接受社会监督的效果。加之算法公开可能会面临涉及第三方机构的商业秘密等方面的阻力,其公开应当进行一定的限制。

首先,就算法技术的源代码公开而言,应当限定在政府部门委托的专业机构或者设置的专门机关而不必向全社会公开。比如有学者认为,可以通过专家辅助人的方式对智能系统的运作原理进行质询[14]。目前投入使用的智能算法平台,多是由技术公司与司法部门合作开发。如果要求这些算法公司对外公开其算法代码,将会对他们继续发展相关系统的积极性产生致命打击。这些公司为开发、维护平台运行,已经投入大量精力和成本,其收益也主要依赖于这些算法技术,若强行要求其公开算法,无疑是对其知识产权的侵犯。一旦这些秘密算法被公开,大量盗版技术也会蜂拥而至,严重扰乱司法权威。再者,将算法代码对全社会公开并无很大意义。毕竟司法公开的目的在于使其接受更好监督,而算法由于其代码专业性,就算向全社会公开也并非所有人都能理解其价值所在。有关部门可以招募专业人士对算法进行分析审查,同时又可以通过保密协议等措施将涉及商业秘密的算法技术严格限定在一定范围,防止算法技术外泄,将算法公开的主体限定在政府委托或者设置的专门机构是最优选择。

其次,应当建立算法解释机制,保证公众的算法解释权。由于算法具有复杂性、专业性等特点,对社会公众的公开不会起到预期的效果,因此可以建立算法解释机制。一方面,由相关部门积极对智能算法的原理和运行方式,以公众可以理解的方式进行主动解释,同时又要赋予公众享有相应的算法解释权。这里的算法解释权,在欧盟《一般数据保护条例》中有迹可循。《一般数据保护条例》第七十一条中提出了算法解释权的概念,即“数据主体有权获得人工干预,表达其观点,获得针对自动化决策的解释并提出异议的权利。”[15]目前智能司法系统的发展,还有许多诸如算法偏见等未能解决的瑕疵,如果不建立起一套完整的算法解释体系,不能赋予当事人在遭受算法不利时获得解释和救济的机会,则很难保证他们会受到公正的处置。在相关机制的设置上,可以明确解释告知程序,比如对于辅助量刑系统算法逻辑及时告知,便于当事人就此提出抗辩意见;对于当事人不能理解的智能程序,采取通俗方式进行解释,保证其对诉讼程序的参与感和监督权。

(三)把握技术边界,减少技术依赖

随着法院信息化的不断发展,智能技术过分侵入司法裁判的后果也愈发严重。一方面,必须明晰技术边界,限制智能技术对司法裁判的过度侵犯,另一方面,应当明确责任划分和追责机制,提高司法人员的忧患意识,使他们在司法决策过程中时刻保持警惕。

其一,应当重视智能算法平台研发中的能动性空间设计。随着智能信息技术的不断发展,智能司法辅助平台的深入推广,同时基于提高审判效率的需要,智能算法在司法活动中的定位似乎已经出现了偏差,从程序设计上的“司法辅助”走向实际应用中的“算法主导”。这是由于现在的算法技术决策的准确率、完成度越来越高从而导致司法人员对算法结果过度信任。为此,在智能算法系统的设计中,应当留有主观能动性的发挥空间,避免技术的机械性侵犯人的主观能动性。例如,在类案推送系统应用过程中,尽可能设置全面的人机互动程序,将案件相关人员的心理、情感和道德等因素嵌入司法裁判的过程中,提升司法人员的参与度,使推荐类案更贴合需求。此外,有研究表明,由于在系统中选择“其他”按键必须单独填写理由,就导致法官为了避免额外的工作量而往往选择一个相近但不准确的选项,进而扩大结果偏差[16]。因此,在构建智能司法辅助系统的架构时,应当给予重视法官主观能动性的裁量空间,避免司法决策对智能算法的过度依赖。

其二,要完善责任追究机制。有学者认为,智慧司法辅助系统应用过程中的责任追究应当适用过错推定原则,应当由司法工作者优先承担失误责任。这样可以有效督促司法工作者认真审核、监督人工智能的工作状况,及时发现问题、及时改正失误,有效防止因司法工作失误危害社会公众利益。同时又能防止人工智能的关联主体之间相互推卸责任[17]。通过建立完善的责任追究机制,一方面可以倒逼司法人员提高责任意识、警惕意识,使其明确责任分工,各司其职,尽职尽责,保证司法活动的正常运转。另一方面,能够规范智能司法系统的研发和利用,使其在制度规定的范围内运转,不敢干预案件的实质性审理过程,不敢为司法人员怠惰提供依靠,防止技术对司法的直接干预。

(四)加强理论研究,培养复合人才

人工智能司法辅助是一个主体多元、领域复杂的综合性议题。应当加强复合交叉学科建设和理论研究,培养塑造一批综合性人才以实现智能司法全过程、全流域的治理。在理论研究层面,应当从法理、伦理层面继续探究算法技术与司法活动融合的正当性基础,还需要探讨智能时代算法技术介入司法活动的合理路径,为法律法规制定、机制建设、方案设计提供理论支撑。另一方面,应当加强复合型人才的培养。有学者在调研我国智慧司法实践后指出:目前我国智能司法实践面临着人才失调的问题。首先,法律人群体不参与智慧司法创新的需求提炼、方案制定、科学研究、产品研发甚至试点运用等工作,而是纯粹地期望购买产品;其次,科技人群体不了解基本法律知识,也不全面学习司法体制改革的内容和导向等[18]。这种人才结构的失调状态,难以呼应智慧时代下司法工作的现实需求,导致智能系统与司法实践现状的割裂。总之,在司法智慧化程度越来越高的今天,培养技术、法律综合人才已成为当务之急。为此,在法院层面,可以着重引入新型技术人才,优化人才队伍配置,实现技术与司法实务的契合;再次,对技术研发人员展开相应的法律培训,可以建立相关人才挂职机制,确保技术人才技术平台研发与司法实践的能力适配。从长远来看,应当从高校人才培养阶段就注重综合类人才的培养。2017年7月8日国务院印发的《新一代人工智能发展规划》明确提出:“鼓励高校在原有基础上拓宽人工智能专业教育内容,形成‘人工智能+X’复合专业培养新模式。”在高校法学教育中,适当融入计算机教育,鼓励培养计算机技术与法学双学位人才,以顺应新一代人工智能背景下算法司法的改革潮流。

猜你喜欢
司法智慧算法
制定法解释中的司法自由裁量权
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
司法所悉心调解 垫付款有了着落
非正式司法的悖谬
进位加法的两种算法
一种改进的整周模糊度去相关算法
论司法公开的困惑与消解
有智慧的羊
智慧派