吴朋穗 简卓彦 毛翊璇 戴 鹏
广东警官学院,广东 广州 510405
近年来人工智能热度席卷世界,法学领域也因此产生巨大变革。但是与其他领域相比,人工智能在法学领域的发展不算快。法学的研究对象——法律现象体量庞大,且产生的样本数据以体量为基数快速增长。以数据处理能力和计算能力见长的人工智能却在样本丰富、数据充足的司法领域中多有冷遇,事实认定领域就是其中之一。
人工智能赋能事实认定必经三个步骤,将证据转换为数据、运算和整合数据、输出的结论为人理解。[1]证据是事实认定的基础,在理论和实践中刑事证据都是人工智能赋能事实认定的一个主要研究切口。我国司法实践中有上海“206系统”,该系统在许多司法实践中的表现十分优秀,但似乎唯独在刑事证据指引的法律实践中表现不如人意。[2]但这并不能全盘否定人工智能介入事实认定,而是让人思考如何优化还是换一个跑道来解决人工智能在事实认定领域水土不服问题。
人工智能在事实认定中的运用没有达到预料中的效果,反而成为法律实践中的掣肘,其主要原因是人工智能与事实认定的耦合度低。法律实践必然要求人工智能与事实认定相耦合,耦合性越高,独立性越低。现阶段人工智能与事实认定的耦合性低,独立性高。在某些司法领域应用中人工智能不够专门化,不能适应司法规律与特征。[3]但人工智能在事实认定领域出师不利不全然是人工智能的错。
人工智能与事实认定的耦合性低的原因有三类。(一)从人工智能的角度出发,可以分两种,一种是人工智能的纯技术问题,人工智能算法低效,算力低下;另一种是人工智能本身的特质,人工智能算法具有“黑箱性”,与司法公开透明相背离。算法的专业性与法律的大众普及性相矛盾,算法学习的不稳定性与法律的求稳性相抵触。(二)从司法领域的角度出发。司法领域在某些地方不能满足培养人工智能的需要,例如数据,再如同时精通人工智能算法和法学的复合型人才。(三)从现实应用角度出发。首先是控辩平衡一定程度上会受到人工智能的影响;其次人工智能应用于事实认定阶段会导致决策权让渡。[4]综上,法律实践没有意识到人工智能赋能事实认定的潜在困境和风险,人工智能赋能事实认定在中短期内难以实现。
现阶段人工智能在事实认定运用中的主要风险有三:数据、算法和控辩失衡。
(一)优质数据不足导致人工智能能力不足。现在法律数据有四个问题:法律数据不充分、法律数据不真实、法律数据不客观、法律数据结构化不足。[5]我国的法律数据经这四个条件层层盘剥下来,所剩的优质数据数量依旧可以培育一个较为成熟的人工智能。但是数据样本太多,筛选难度太高,筛选的成本也太高。以致样本数据过少,法律人工智能表现十分低能,没有胜任事实认定工作的可能。
(二)人工智能赋能事实认定加剧控辩关系失衡。我国刑事诉讼领域的突出问题之一就是“控辩双方未能实现平等、有效对抗,庭审难以实质化”。[6]人工智能赋能事实认定后控方获得和分析数据的能力更强,在数据方面控方的优势是压倒性的。在这种情况下,辩方在纯粹诉讼能力上的武装与控方有巨大的差距。即便辩方是在庭前证据交换获得了控方所得的数据,辩方也没有数据抓取和分析的能力。控辩双方的信息严重不平衡,更难实现控辩双方有效对抗和庭审实质化。因此,人工智能赋能事实认定会加剧控辩双方力量失衡,这与控辩平等原则背道而驰。人工智能赋能事实认定前必须要解决控辩失衡加剧的问题。
(三)事实认定环节算法存在运用困境。第一,算法黑箱危及司法公正。人工智能进行事实认定时用了什么信息推理和如何推理,只有算法知道。而算法又因为商业机密和知识成果保护难以公开,产生了算法黑箱。第二,算法霸权限制当事人权利。算法具有专业性、复杂性和黑箱性,因而产生霸权,也衍生出算法歧视和算法黑箱等问题。[7]一般的当事人与其他诉讼参与人不懂算法,难以置喙。某种程度上,科学技术阻碍了当事人维护其合法权益。第三,算法错判没有制度保障。人工智能介入事实认定一般在侦查阶段、逮捕和起诉阶段。人工智能错判的事实最终会写在起诉状上,检方基于错误事实起诉被告。若致使法官错判,此时为了纠正错误必须重新审理错判案件,造成司法资源的额外消耗,还要给予因此受到损失的当事人补偿,因此需要建立制度来预防算法错判。
现在人工智能处在弱人工智能阶段,只根据技术逻辑运行的人工智能,无法理解人的感情和伦理性,无力单独承担事实认定工作。因此人工智能在事实认定中只能是辅助。在事实认定环节采用“人机结合”的半人工智能模式,并建立以司法人员为中心的人机协同系统。融合人的实质理性和人工智能技术理性,更好地防范人工智能决策出现极端情况。[8]
(一)人工智能辅助筛选证据主要是对证据进行形式审查。一是审查证据获得的程序合法性,例如搜查时是否有搜查证;二是审查证据的形式要件,如笔录、清单等是否齐全,笔录上的日期、签名等信息是否完备。但为排除刑讯逼供证据,必须人工审查。认罪认罚案件因有口供,证明难度降低,实践中存在降低证明标准的误区,[9]且刑讯逼供自带隐蔽性,人工智能难以穷尽各种复杂情况。
(二)人工智能辅助分析证据主要是提取和分析证据细节。对证据的证明力审查主要是人工实质审查。因为与判断证据能力实行的法定主义不同,判断证据的证明力一般遵循自由心证主义,实质审查会涉及价值权衡、司法政策、法律解释等因素。[10]人工智能主要是对证据内容、细节进行提取然后分析,然后指出证据与证据之间的相互印证程度或相互矛盾程度如何,还可以调用大数据对专业性知识对证据进行分析,与专攻法律信念、伦理和价值的主观色彩较重工作的司法人员形成互补,提升对证据认知的质效,同时扩大司法人员的视野。
(三)人工智能辅助认定事实的任务是形式逻辑推理。事实认定思辨是形式逻辑和经验逻辑的复合逻辑结构,[11]现阶段人工智能只能负责形式逻辑的部分,司法人员负责伦理性和常识性强的经验逻辑部分。运用在事实认定的人工智能应是由人主导的交互式的辅助办案工具。在进行认定事实的推理的过程中,不仅司法人员和人工智能是沟通交流的,推理过程还应该是相互可视的。司法人员必须对推理过程细节了如指掌,因为在审判程序是由检察机关的司法人员与被告对簿公堂,而非人工智能;人工智能也必须把握推理进程,不然无法提供相应的辅助。
在人工智能介入事实认定前,需要行之有效的对策来规制和防范算法、数据及控辩平衡方面的巨大隐患。
(一)积累高质数据培育高智智能。人工智能需要大量优质数据锻炼模型。出于对成本和法律数据自带滞后性的考虑,笔者以为应当号召全国有意识产出优质数据并保存,从表达规范化工作做起。创建案件信息收集系统,每办一个案子在系统里按照规范要求填写信息。这个方法在解决数据不够规范化问题的同时还解决了数据不充分的问题。数据真实客观与否虽然很大程度上取决于司法工作人员工作时是否诚实客观,但是也不是毫无办法,可以将检验数据真实性的任务通过司法信息公开交给社会公众。
(二)鼓励扶持建立民间法律数据分析机构。在人工智能介入司法领域后,控方与辩方的力量必定会拉开差距,一般在人工智能辅助的情况下,控方在庭审前所获的数据无论从数量上还是质量上,都比没有人工智能辅助的当事人多且好,在准备上控方优于辩方,最后庭审控辩双方难以形成有效对抗。对人工智能赋能事实认定带来的控辩失衡加剧风险进行规制的关键是提高辩方的数据抓取和数据分析能力。政府可以鼓励扶持民间法律人工智能机构制造数据抓取和分析的法律人工智能。由民间法律人工智能产业来为有需要的当事人提供服务,从而提高辩方在数据抓取和分析方面的能力,以达到控辩双方平等武装的目的。
(三)建立合理的制度来治理算法。第一,建立算法公开制度。人工智能的推理逻辑主要是依据算法模型的设计,算法不透明与司法公开相悖,有损司法公正。为规制这一风险应当建立司法公开制度。一是外包的司法辅助人工智能不能参与司法决策和裁判。二是算法必须公开,日常维护和优化修改的信息要公开发布,注明修改内容信息。第二,建立算法对抗制度来规制算法霸权。在算法公开的前提下,完善并推行专家辅助人制度。鼓励当事人聘请有专门算法知识和相关资格的专家辅助人,找出算法的遗漏或者错误,并证明算法的遗漏或者错误损害当事人的合法权利,并出具意见,由法院判决。算法存在遗漏错误处要通知技术人员及时处理,并公布处理结果。第三,建立算法规制制度。算法规制制度主要是规制算法设计者的制度。其目的有两个,一是对算法设计者的内在要求作出指示,二是规制算法设计者的外在行为。忠于法律,精于技术,这是对算法设计者的内在要求。对算法设计者行为的外在规制需要发布适当的文件来一一说明,如设计的算法不得违反法律、算法不得掺杂主观意念等等与法律人工智能算法有关的事项。
人工智能已经成为世界各行各业发展的绝佳“燃料”,世界的发展被人工智能快速推进。但在享受人工智能带来的好处的同时也要对它保有怀疑,要给人工智能上一把锁。随着社会发展,人工智能介入司法辅助是必然趋势。未来是人工智能的时代,法律人工智能的未来还有待各位学者和技术工作者共同构筑。