以审判为中心的诉讼制度改革:大数据司法路径*

2018-11-13 01:54
暨南学报(哲学社会科学版) 2018年7期
关键词:司法人员量刑司法

王 燃

引 言

《中共中央关于全面推进依法治国若干重大问题的决定》提出“推进以审判为中心的诉讼制度改革,确保侦查、审查起诉的案件事实证据经得起法律的检验”。围绕此精神,改革措施全面展开。制度设计层面,最高人民法院等六部委联合颁布《关于推进以审判为中心的刑事诉讼制度改革的意见》,对本次改革提出上层制度设计和具体实施路径;最高人民法院颁布的《关于全面推进以审判为中心的刑事诉讼制度改革的实施意见》则从司法原则、庭前程序、审理程序、证据规则、优化司法资源等方面为法院改革提供具体指引。理论层面的研究则更早也更为成熟,学者们多从改革的理念统一证据标准、加强辩护权、实施繁简分流机制、强化司法监督等具体机制阐明改革的要义。如沈德咏大法官曾撰文阐明改革意义、原则及具体实施路径,重点提出司法公正、司法规律、司法审判标准、庭审实质化等多个关键词,为改革的具体落实指明理论、方向和路径。

除立法及理论著述外,“信息化建设”也开始纳入改革范畴。周强院长在2017年最高法院工作报告中强调,“司法改革和信息化建设作为人民法院的深刻变革,已经成为人民法院工作发展的车之两轮、鸟之双翼”。看似无关的“两轮”、“两翼”,实则密不可分,信息化为司法改革提供技术支撑,司法改革精神引领信息化发展。习近平总书记在党的十九大报告中强调“深化司法体制综合配套改革,全面落实司法责任制”。面对“深化”、“配套”的司法改革要求,大数据无疑是最佳路径。大数据作为当代最重要的信息化技术之一,将为司法改革提供核心支持。本文试从“大数据司法”角度来探讨诉讼制度改革路径。作为技术,大数据本身是中立的,当下应以审判为中心的诉讼制度改革为契机,将改革的良好价值愿景融入技术中,以大数据司法来促进改革目标的实现。

一、原理论:大数据司法推动诉讼制度改革的基础

(一)基础条件:推进大数据司法的现实可行性

本文的“大数据司法”,是指以海量司法数据源为基础,以算法、人工智能等技术为核心,通过对司法活动、司法业务规律的数据化分析,以数据规则来辅助司法活动的实现。当前,无论是国家战略,抑或是数据资源、相关技术的发展,都为大数据司法的推进提供了有利条件。

1.国家战略的支持

自2015年党的十八届五中全会提出国家大数据战略后,“大数据司法”的建设逐步提上日程。2016年两会的“两高”报告中提出要加快建设“智慧法院”、“智慧检务”;2016年《国家信息化发展战略纲要》将建设“智慧法院”、“智慧检务”均列入国家信息化发展战略;2017年两会的“两高”报告中进一步提出要深化智慧法院、智慧检务建设。在国家战略的支持下,实践中已涌现出不少大数据司法应用的成功案例,如贵州检察机关的大数据司法办案辅助系统、案件智能研判系统,为司法办案提供全方位智能化支持;江苏检察机关的“案管机器人”对案件办理过程全程留痕、全程监督;苏州市法院推出“电子卷宗+庭审语音+智能服务”一体的智慧审判模式,极大地促进了审判效率的提升。

2.司法数据的积累

任何领域的大数据应用都必须以海量数据源为基础。司法活动的特殊性、秘密性所带来的数据资源匮乏,曾一度成为大数据司法发展的挚肘。随着司法公开的推进,裁判文书、检察文书等司法大数据的逐步开放,为大数据司法建设提供了丰富数据源。当前,大数据司法所依据的数据源主要有如下三种:(1)司法案件数据。司法案件数据是指与案件办理相关的文书数据、司法流程数据等,其中尤以司法文书数据为重,如起诉书、判决书、抗诉书等。作为司法活动的阶段性概括,司法文书一定程度上反映了司法规律,凝结了司法人员的办案经验,是最优质的司法数据源。当前,“两高”均建立了司法信息公开平台,用以开放司法文书等海量司法数据。除了公开的数据外,司法系统内部的数据也是主要数据资源。如“人民法院大数据管理与服务平台”通过数据共享机制汇聚了全国四级法院办案数据。(2)司法行为数据。司法行为数据是指司法人员基于办案行为所产生的数据。前信息化时代,囿于数据采集技术的局限性,司法办案行为转瞬即逝。随着在线办案方式的普及,以及“人—机”交互系统、物联网技术的发展,办案行为能够以数据形式固定下来,实现在线行为自然沉淀、办案数据全程留痕。司法行为数据是实现大数据司法管理、监督等业务的重要基础。(3)社会行业数据。工商、银行、税务等其他社会行业数据为大数据司法提供“外力”支持。它们与司法数据融合后能够实现更多主题、维度的信息刻画。例如法院系统与公安部身份证查询中心、国家工商总局、银监会等机构的 “执行数据”共享机制,实现了对被执行人财产的全方位查控,有效化解了“执行难”的问题。随着政府数据开放共享战略的推行,社会行业数据与司法大数据的共享必将成为常态。

3.相关技术的成熟

当前,数据采集、数据分析等大数据技术的发展已足够为大数据司法应用提供支持。就数据采集而言,除了上文所提的物联网、人机交互等技术外,目前常用的还有OCR(Optical Character Recognition)等数据转化技术,它能够将纸质卷宗转化为机器可读的数据格式,为盘活司法数据资源提供关键技术支持。就数据分析而言,自然语言处理、神经网络、决策树等技术都可以应用于司法领域。例如自然语言处理是分析司法文书的核心技术;决策树算法则与司法决策产生的过程相似,可作为审查批捕等司法业务的模型依据。另外,随着当前人工智能浪潮的席卷,机器深度学习能力加强,为大数据司法提供了更为强劲的技术支持。

可见,大数据司法的发展已是大势所趋。如何将大数据司法与诉讼制度改革相融合,通过大数据司法去有效推进诉讼制度改革,则需要从原理、价值等方面去寻求二者的契合点。

(二)原理契合:大数据司法原理与诉讼制度改革的关键词契合

实践中,大数据司法逐渐形成一些约定俗成的普适性原理,如大数据量化思维、大数据要素思维、大数据画像思维等。这些原理性思维既不等同于大数据技术本身,也不同于法律原理,而是基于司法业务和大数据技术碰撞所产生的共性特征。它们将数据技术与法律业务相融合、衔接,打通法律与技术之间的壁垒,在此基础上更好地开展大数据司法应用。在诉讼制度改革背景下,首先从原理层面寻求大数据司法与诉讼制度改革的契合点。

沈德咏大法官曾提出以审判为中心的诉讼制度改革三个目标阶段:近景目标是要改革审判方式、统一司法标准;中景目标是实现审判对侦查、公诉活动的有效制约;远景目标是建立符合法治规律的刑诉制度。据此,我们归纳出本次改革的三个关键词:统一司法标准、有效制约以及司法规律。从原理层面出发,大数据量化、大数据画像等思维为改革目标关键词的实现提供了新视角。

1.契合一:“统一司法标准”与“大数据之量化思维”

以审判为中心的诉讼制度改革要确保案件事实证据经得起法律的检验,要求“以司法审判标准为中心”,且核心在于证明标准的统一。依据《中华人民共和国刑事诉讼法》相关规定,我国的侦查、审查起诉和审判环节的标准都是“事实清楚,证据确实、充分”。看似字面统一的证明标准,落实到司法实践则差异很大。不仅各个阶段的司法标准各不相同,不同地区、不同司法人员对标准的把握也难以一致。针对证明标准难以统一的难题,不妨借助大数据量化原理寻求解决办法。

大数据之父迈尔·舍恩伯格曾说过,“大数据时代一切皆可量化”。“量化”作为大数据原理性思维之一,意指将事物、现象等转换成数字形式,以数学方法对事物进行计量。本次改革中提出“统一司法标准”、“证明标准同一性”,这里的“标准”本就带有量化色彩,也是其与量化思维相契合的关键点。具言之,与证明标准的传统定性判断不同,大数据量化思维将证明标准要求转化成可计量的数据形式,以具体阀值设置合理的证明标准区间;配置证据相关性、合法性和真实性的计量方式,计算个案证据的综合证明力,并与既定的证明标准区间相匹配,从而以大数据量化方式更有效、精准地推进“统一证明标准”的落实。

2.契合二:“有效制约”与“大数据之要素思维”

长久以来,我国刑事诉讼是“线型模式”构造,强调公、检、法三机关“分工负责、互相配合、互相制约”,但实务中却异化为“侦查中心主义”。审查起诉和审判阶段的功能被架空,后阶段程序没有起到对前阶段程序的把关作用,并产生庭审虚化等问题,案件质量难以从程序上保障,冤假错案也因此而生。对此,本次诉讼制度改革虽强调审判中心地位的回归,以审判来制约侦查及审查起诉环节,以“审判中心”来倒逼审前程序提高标准和要求,发挥后一诉讼阶段对前一阶段的实质化把关作用,从而真正落实三机关之间的“相互制约”关系。

当前,落实审判对侦查、起诉环节的制约主要依靠制度及规则的约束,如贯彻证据裁判原则、规范侦查取证程序、优化案卷移送制度等。在此基础上,可运用大数据司法的“要素思维”对相关制度、规则进一步细化,从数据角度实现程序的制约。“要素思维”意指对整个诉讼流程进行分解,对案件进行碎片化处理,将案件化解为一个个“要素”,以“最小公约数”形式将整个诉讼流程打通。例如贵州省检察机关提出“犯罪构成要素”概念,即将某一案件中所有涉及定罪量刑的法定要素全部抽取出来,并与标准要素进行比对,从而实现案件质量的把关。同理,可以在案件解构思维基础上,将办案过程每一步骤数据化,通过各维度要素提取从纵向上打通整个诉讼流程,例如分别提取全案的证据要素、程序性要素等。在打通诉讼流程的基础上,后一阶段对前一阶段的制约功能就容易实现了。例如,侦查阶段即抽取出案件中证据要素,并以审判阶段证据标准进行审查,从而及时发现证据问题并补正,以防证据“带病”进入后续环节。可见,大数据司法从数据角度分解案件要素,通过要素的审查来加强整个诉讼流程的可控性,以更加科学的方式促进审判中心主义的回归,实现审判程序对审前程序的有效制约。

3.契合三:“司法规律”与“大数据之画像思维”

“司法规律”是本次改革的高频关键词。习近平总书记曾指出“司法活动具有特殊的性质和规律,司法权是对案件事实和法律的判断权和裁决权”。从宏观角度,相较于人类社会的其他活动,司法活动有既定的规律,包括公正、权利保障、证据裁判等内涵。从微观角度,司法活动还有着具象的内在规律,不同法律领域、不同司法业务甚至不同罪名的案件都有着自成体系的内在逻辑。微观层面的司法规律,对于司法实践更具切实指导意义。

在大数据视野中,微观的、具象的司法规律可体现为“大数据画像”思维。 “大数据画像”衍生于商业领域,商家通过对用户的画像来改善服务。司法大数据画像范围相对广泛,对犯罪嫌疑人、案件甚至司法业务等都可以进行画像。通过对数据化的描述,来归纳嫌疑人、案件等所呈现的特征、规律。相较于传统对司法规律的定性化解读,“大数据画像”从定量角度对司法规律进行更为具象的剖析。以犯罪嫌疑人为例,其能够以数据形式归纳出嫌疑人在人际交往、行为偏好、兴趣爱好等各方面所呈现的规律;以某类刑事案件为例,其能够总结该类案件在案发时间、地点、人群、手段方式、所判刑期、证据类型等方面的规律;以某类司法业务为例,其能够刻画该类业务在数据层面所呈现的规律,并转化为具体的算法模型。需要注意的是,大数据司法画像仅仅是一种思维、方法,其对司法规律的提炼最终还需服务于具体的司法应用,例如犯罪嫌疑人画像多应用于案件侦查,案件画像多用于辅助办案决策及犯罪预防、治理等,司法业务画像则以该类业务共性规律指导个案的办理。在以审判为中心的诉讼制度改革下,尤其应注重归纳具有中国特色社会主义的司法规律,刻画本土的“数据化”司法经验,以推进诉讼制度改革及整体法治社会的发展。

二、价值论:大数据司法推动诉讼制度改革目标的实现

诉讼制度改革主要针对当前司法实务症结,并将其具体化为疑罪从无原则、庭审实质化、规范侦查工作等具体制度。相较于以制度、规范推进改革实施的路径,大数据司法有着独特的工具性优势,将改革目标融入具体的系统设计、业务应用中,有效推动司法公正、司法效率等改革目标的实现。

(一)提高司法效率

功效和效率是检验一项新技术是否成功的首要标准。实际上,大数据司法的初衷即为提高司法效率,实现智能化的办案方式,与诉讼制度改革的目标不谋而合。(1)解放司法劳动力。针对案多人少的矛盾,大数据司法的出发点即以数据算法替代部分司法劳动力,提高整体工作效率。以“智能语音”应用为例,当前不少司法机关在庭审、讯问等场景配备了语音识别系统。机器将庭审发言、讯问过程同步以文字形式记录下来,书记员只需事后进行校对即可,不仅解放了书记员的繁冗工作,更有利于推进庭审过程的连贯性,推动直接言词原则的落实。(2)节约司法成本。大数据司法在解放人力劳动的同时,也大大节约了司法物力成本、时间成本。以智慧法院“苏州模式”为例,其整个办案系统建立在电子卷宗的基础上,将整个办案过程、证据材料进行数据化处理。数据化卷宗能够在公、检、法之间快速流转,打破了部门间地域上的限制,节约了办案时间;同时,数据化的卷宗有助于司法人员快速、精确定位至所需材料、证据,并且为相关大数据司法应用的开发提供了基本数据源,极大提高办案效率。

(二)促进司法公正

公正历来是人类社会所追求的崇高美德和最高理想,正义也是法律制度所必须应当具备的优良品质。司法公正是诉讼制度改革的终极目标,“以审判为中心,归结到一点,就是为了实现司法公正”。实践中,司法公正往往体现为“同案同判”,即同样的案件应当在同一尺度内定罪、量刑。以往司法人员多通过寻找相似案例并参考其判决的方式来确保“同案同判”。相较于传统“经验式”、“零散化”的同案查找方式,大数据司法则为同案同判提供了数据化的实现方式,并细化为同案推送、大数据量刑、偏离度预警等一系列应用支持。例如“大数据同案推送”机制能够在案件要素、法律问题等特征提取基础上,通过个案与海量案件库的多维度比对来实现同类案件推送;“大数据量刑”机制则是根据历史案件的裁判规律,以定量方式统一类案的判罚标尺,消除裁判的不一致性。在上述应用基础上,还可以进一步建立大数据偏离度预警机制,以“数据”对“司法公正”进行精准度量,将“公正”量化为不同的要求并分散至相应司法业务中,对偏离法律标准的司法行为实时预警,从而保证诉讼流程的规范化、法治化运行。

(三)强化司法监督

诉讼制度改革需要司法体制改革相配套。随着“员额制”改革的推行,入额法官、检察官享有越来越大的司法权,十九大报告中也特别强调“全面落实司法责任制”。如何对扩张的司法权进行监督这一问题提上日程,大数据则为司法监督提供了有效解决办法。根据“万物皆可数据化”的原理,大数据利用“人—机”数据交互系统对司法办案、办公过程数据进行全程留痕,建立数据化的司法监督机制。具言之,对每位司法人员的办案过程以数据进行固化,将案件流转数据、文书数据、系统在线时长等进行全方位实时数据采集。在此基础上,督促办案进程、考核文书质量,对办案数量、案件类型等进行自动统计,实现对司法人员的数据化动态监督、管理。另外,结合上文所提的大数据偏离度机制,将案件直接对应至责任法官、检察官,实现“人—案”相关联的案件质量监督机制。

相较于传统的“人为”监督机制,大数据司法监督更为全面化,能够实现对各业务环节监督点的全面覆盖;大数据司法监督更为科学化,将定性的监督点转化为定量的数据表达,以数据约束权力,将权力关进数据铁笼;大数据司法监督更为及时化,通过数据的实时采集、分析,能够实现同步监督甚至是事前监督。大数据司法监督体系有助于形成“透明化”办案方式,并倒逼司法人员提升办案水平、规范司法行为,并由此带来以监督提升司法透明度、强化司法公信力的良性循环。

三、实践论:大数据司法推动诉讼制度改革的实施路径

在诉讼制度改革背景下,结合当前大数据技术发展水平及司法实务需求,可以在定罪、量刑、证明标准、控辩焦点分析等业务领域探索大数据应用。

(一)路径一:促进同案同判之大数据司法路径

“同案同判”是司法公正最直观的体现,也是诉讼制度改革的主要目标。具体到大数据司法应用中,大数据同案推送、大数据量刑、大数据定罪等机制共同构成“同案同判”保障体系。

1.大数据同案推送

“同案同判”的首要前提就是找到“同案”。无论是英美法系的判例制度,还是我国的案例指导制度,初衷都是通过典型案例来指导同类案件的办理,通过“同案”来确保法律适用的一致性。以往同案的获取大都通过查找指导案例、其他类似案件等方式来实现。相较于传统零散化、经验化的同案查找方式,大数据为同案的查找提供了新的路径。当前,国内已经有相当多的大数据平台能够实现同案的推送功能,其原理是在海量案例数据集基础上,通过同案由、同罪名、同情节等要素关联出相同、相似的案件。

正如世界上没有两片完全相同的树叶,也没有完全一致的“同案”。“同案”是个相对的概念,不能仅仅僵化理解为案件基本事实的相同,而应是基于司法办案的需求,实现“同案”的个性化认定和推送。司法人员遇到的可能仅仅是案件中个别问题的判断困难,找到涉及同样问题的案件则可视为“同案”。据此思路,首先通过文本分析技术对案件进行碎片化解构,抽取出案件“最小化”要素,以实现要素的自由选择及组合。在此基础上,司法人员可基于办案需求关联出任意“同案”,且选择的要素条件越多,“同案”的相似度就越高,从而实现“同案”的个性化、精准化推送。另外,在“同案”基础上还可以开发其他智能化推送,如通过同案关联并推送高频引用法条,推送相关法律业务知识等。

2.大数据量刑

大数据量刑是发展相对成熟的大数据司法应用。就国内而言,如山东省淄博市淄川区人民法院开发了“刑法常用百种罪名电脑辅助量刑系统”;黑龙江省大庆市让胡路区检察院开发了“量刑规范化软件”。就国外而言,澳大利亚南威尔士的SIS量刑系统(Sentencing Information System)较为有名,该系统建立在JIRS(Judicial Information Research System)庞大数据库基础上,通过分析海量同类历史案件的裁判规律来指导个案的裁判;此外,荷兰的北极星求刑系统、德国的JURIS资料库、我国台湾地区的量刑资讯系统等也取得了实践成功。

早期的机器量刑原理较为简单,多采取“案例+法规”、“量化+计算”的方式,将某罪名的相关量刑法律规则进行数据式转化,以量刑情节作为自变量、刑期作为因变量,再结合个案中的量刑要素抽取,以“线性函数”计算出刑期。这种方式简单明了,但无法解决量刑规则中本就不确定的浮动区间。例如某量刑软件的操作规则为:“对于量刑有刑期区间的,选择中间值;对于量刑有比例区间的,选择中间值”。这里“中间值”的选取并没有合理的依据,仍是人为主观化的随意定性。可见,早期的“线性函数”量刑模式仍夹杂着司法人员的主观裁判,不能科学合理地解决量刑不一致问题。

随着数据处理技术的发展,“线性”量刑方法逐渐暴露出短板。在数据图谱上,量刑情节与刑期之间的关系可能呈曲线、散点分布等非线性的、复杂的关系,需要更精密的数据模型来涵摄。目前,学者们多在海量历史案件基础上,通过机器学习的方法来归纳某类案件所呈现的量刑规律,通过多元回归分析、神经网络等模型来表达某类罪名的量刑公式。这种量刑方法更为精准化、个性化,能够确定每一法定量刑情节在具体刑期确定中所占的比重,只需带入个案中的情节事实,即可得出确定刑期。例如,有学者以九万多份“交通肇事罪”判决书为训练样本,通过回归分析算法得出该罪的量刑公式。作为大数据量刑的代表,该方法以法官集体经验为基础,对各量刑情节与刑期之间关系进行“数据化”精准表达,统一类案量刑标尺,有效地解决了实务中量刑不均衡的难题,促进了同案同判和司法公正的实现。

3.大数据定罪

当前,大数据定罪机制尚未完全成熟,但实务中已经开始有相关探索。例如,有专家利用大数据对欧洲人权法院584个案件进行预测,达到了79%的准确度;有专家运用随机森林算法对美国最高法院的判决进行预测,达到了70%以上的准确度。

实际上,从大数据视角出发,法律文书可以看作是文本化“数据”,法律定性问题可以转化成文本数据的分析、计算问题。大数据对法律文书的解读不是从 “基本信息”、“本院查明”、“本院认为”等业务角度出发,而是将其看成由一个个词语、文本所构成的集合体。通过对某类案件海量裁判文书的文本分析,对其中事实、情节与罪名等要素之间的关系进行训练,能够归纳出每类罪名的数据化模型。例如,欧洲人权法院判决预测中,研究团队主要运用自然语言处理和机器学习技术,从公开的判决书中抽取文本要素,提炼案件所呈现的文本模型规律,根据“文本”与“结果”之间的关系来预测法庭判决。试验结果达到79%的准确度;试验结果还发现,案件“事实部分”(“facts” action of a case)与判决结果之间的关系最为密切,“主题内容”(topical content of a case)对案件结果也有重要影响。

国内也出现了类似研究。有学者以交通肇事、危险驾驶、强奸、故意伤害、抢劫、盗窃这六个罪名为研究对象,各选取2万份判决书,每个罪名以其中1.6万份判决书作为训练数据集,通过词向量、深度神经网络等技术算出各类罪名的文本定罪模型,再以剩余的0.4万份判决书作为测试集,最终定罪的准确率达96%。可见,从技术上来说大数据“定罪”具有相当的可行性。大数据定罪可辅助司法人员对案件罪名进行认定,特别是在遇到罪与非罪、此罪与彼罪不清的疑难案件时,“大数据定罪”可为司法决策提供有效依据。

(二)路径二:统一证明标准之大数据司法路径

以审判为中心的诉讼制度改革要求以司法审判标准为中心,统一司法证明标准,从庭审角度对侦查、审查起诉环节的证据收集、审查提出要求。目前,国内证明标准方面的大数据应用以贵州“证据标准数据化”系统为代表。早前,针对诉讼制度的改革要求,贵州省出台了《刑事案件基本证据要求》(以下简称《证据要求》),对刑事案件的基本证据要求进行规范,并对故意杀人、故意伤害等六类罪名提出具体的证据要求。“证据标准数据化”系统即以《证据要求》为依据,从横向、纵向两个角度展开应用。横向角度,依据《证据要求》的相关内容,建立具体个案的证据要求。办案人员在电子卷宗基础上建立“要素—证据”关联机制,抽取每一证据所对应的要素、所证明的事实,并辅助司法人员对每一证据的真实性、合法性、关联性进行判断。纵向角度,将刑事案件的证据要求嵌入整个办案流程,指导侦查、审查起诉人员按照庭审证据要求去收集、审查证据。通过类案证据清单制度,辅助司法人员将所收集证据及时与系统中证据规格相匹配,对错误、缺少的证据实时预警。

目前实务中的大数据证据标准系统多与“贵州模式”相似。这种模式以庭审要求去指导侦查环节的证据收集,在确保证据种类、证据数量及证据合法性方面起到了有效作用;同时辅助司法人员对证据的“三性”进行审查判断。然而,该模式仍离不开司法人员对证据的主观评价,尤其是在涉及证明力问题时,并没有发挥实质性作用。笔者认为,未来大数据司法应致力于“证明力”方面的建设,依托贝叶斯、可信度等算法,以量化的方式制定证明力公式。系统在证据真实性、关联性审查基础上,通过单个证据可信度的计算以及全案证据证明力的计算,并以阀值等方式实现证明力与证明标准的匹配判断。运用大数据算法对证明力科学量化、计算,才是实现“统一证明标准”的合理路径。

(三)路径三:推进庭审实质化之大数据司法路径

1.控辩要点分析

我国庭审虚化相当一部分原因在于司法人员对庭审把控力不足,担心证人、鉴定人员出庭带来不可控的风险,从而导致过分依赖书面卷宗、庭审走过场成为常态。加强庭审中对证据的质证、推进控辩双方辩论的展开,是实现庭审实质化的重要途径。对此,可运用大数据技术对庭审质证规律、控辩双方争辩规律进行归纳。尽管尚未有成熟案例,但公诉人、律师等司法实务人员对此应用反映出强烈需求。方案设计上,可依托“智能语音识别—庭审笔录”技术,在类案庭审笔录数据基础上提炼质证焦点、询问证人要点、法庭辩论集中点等规律。同时,将庭审质证要素、控辩要素与判决结果进行关联分析,细化质证方式、控辩要点被法官的采纳程度、对判决结果的影响比重等。通过大数据控辩要点分析为公诉人、辩护人的出庭方案制定提供切实指引,促进其出庭技能的提升,并间接推动证人、鉴定人、专家辅助人出庭,推动庭审实质化的改革。

2.文书智能生成

在上述业务应用基础上,能够实现起诉书、判决书等基本法律文书的智能生成。法律文书本就有固定的格式要求,为其智能化生成提供了天然优势。在各类文书的固定模板基础上,抽取电子卷宗中相关数据及大数据业务应用中的分析结果,即可自动生成文书。以“起诉书”为例,对于当事人、案情介绍、证据等内容,可以在电子卷宗基础上抽取要素来生成;对于案件程序性内容,可结合办案系统中对程序流程数据的采集来生成;对于具体犯罪事实的描述,可以结合犯罪构成知识图谱、证据摘录来生成;对于罪名、刑期确定及相关法条引用等内容,可以在大数据定罪、大数据量刑及同案推送等应用基础上同步生成。另外,文书智能生成系统中应当留有修正补全功能,尤其在分析说理部分应当留有人工编辑功能,并通过人工对文书整体进行核对、补充及校正。

在当前繁简分流背景下,可考虑在简易程序、速裁程序中先行试点文书智能生成。通过对简易案件办理流程数据的自动抓取来同步生成各阶段所需文书。对此,不妨参考杭州互联网法院的诉讼经验,将简易案件的诉讼流程实现全面在线化、格式化。“格式化”诉讼流程为法律文书的智能生成提供了绝佳模版。例如苏州中院的“智慧法院系统”,即建立了简易裁判文书自动生成系统,对数量多、案情简单的案件,通过自动提取电子卷宗信息自动生成裁判文书,有效地推动了案件繁简分流机制。

(四)路径四:落实司法责任制之大数据司法路径

十九大报告强调要深化司法体制综合配套改革,全面落实司法责任制,特别是在员额制改革完成后,如何建立合理的员额遴选及退出机制、约束扩大的司法权成为切实问题。实务中逐渐有司法部门探索出“大数据绩效考核”机制,通过大数据方法对司法人员进行管理,建立数据化的考核监督机制。相比于传统经验式、主观化的考评机制,大数据绩效考核有以下突出优势:(1)科学与效率并重。大数据绩效考核数据多来源于司法办案系统,机器通过对数据的自动采集、计算来生成考评结果。数据技术的运用不仅能大幅度提高考核效率,且能够有效防止主观因素干扰,更具客观性和科学性。(2)办案数量与质量并重。大数据绩效考核系统不仅是传统的“计件”模式,更注重对案件量的综合统计。根据不同案件类型、当事人数量、证据要求、争议难度等要素,科学分配案件“系数”,对办案数据及质量进行综合考评。(3)历史考核与实时监督并重。大数据绩效考核系统不再是传统的季末、年末定点式考核,其能够对数据进行实时抓取、实时考核,从而实现对司法办案质量的动态管理。在此基础上,还可以进一步开发针对司法人员个性化的法律法规、类案推送机制,科学配置专业化办案团队,识别司法腐败现象等功能。

综上,可初步构建起“以审判为中心的诉讼制度改革”及“深化司法体制综合配套改革”语境下的“大数据司法”体系。依托现有的司法数据资源和数据分析技术,在大数据量化、大数据要素及大数据画像等基本原理基础上,以改革基本原则、精神为指导,探索大数据同案推送、大数据量刑、大数据定罪、大数据证明标准、控辩焦点分析、大数据司法管理等具体应用,以实现同案同判、庭审实质化、落实司法责任制等改革目标,从数据角度构建诉讼制度改革的新型路径。

四、博弈及对策论:数据与法律的问题解析

当前大数据司法正处于发展上升期,司法部门精力多集中于业务功能的开发,而对技术发展所带来的法律问题则关注较少。技术发展的前提是在法制框架内进行,不能突破、贬损基本的法律原则、诉讼原理,尤其是改革中所蕴含的无罪推定、正当程序、人权保障等基本原则。当大数据司法与诉讼改革相交融时,数据技术与法律原则之间的矛盾协调同样应纳入初始的方案设计中,确保大数据司法在法治轨道上良性发展。

(一)大数据的精确性与司法自由裁量权

尽管法律有着不同于其他人文领域的逻辑体系,但法律仍然存在模糊性、不确定性。法律事实的判断、法律条文的适用等都依赖于司法人员的经验判断和定性分析,“法律的生命并不在于逻辑而在于经验”。然而,大数据讲究精确性、讲究量化的研究范式,大数据司法核心就在于将法律问题转化成数据问题,寻求数据科学的解决路径。大数据在运用量化、计算等方式提高司法精准性、统一裁判尺度的同时,也将极大压缩司法人员的自由裁量权。以“大数据量刑”为例,该应用旨在设计出每一类罪名的精确化量刑公式,消除裁判的差异性,代入案件情节要素便自动得出所判刑期,完全不需要司法人员自主裁判。在一些简单案件中,司法裁量权的压缩无可厚非,但实务中司法人员常常面临着难以定性的、模糊的法律问题,其表现为法律规则之间的冲突,以及事实与规则之间不存在完全对应关系。此类疑难问题难以用既定的数据模型解决,因为在法律文本、法律规则背后还需要面对价值博弈,需要考虑社会背景、政策、价值、伦理等法外因素,一味地套用模型反倒是折损了裁判结果的准确性。

针对大数据精确性与自由裁量权之间的博弈,可从最初的业务应用设计层面寻求解决办法。大数据司法应用在设计时应预留自由裁量权的功能空间,例如文书智能生成中设置司法人员校准、编辑的功能,同案推送中设置司法人员对同案标准定义的功能等。需注意,功能设计应兼顾比例原则,不同诉讼程序中自由裁量权渗入程度应有所不同。在一般性司法程序中,司法人员可以直接适用大数据分析结果,如案件要素提取、控辩焦点总结、同案推送等;在对当事人诉讼权利产生实质性影响的重要诉讼程序中,如定性、量刑及证明力判断等,应明确大数据司法的辅助性定位,确保司法人员主观裁量的空间。通过技术设计与业务特征相渗透、相协调,寻求大数据精确性与司法自由裁量权之间的最佳平衡。

(二)大数据的僵化性与司法的灵活性

大数据司法模型多建立在对过去司法经验总结的基础上,通过对海量历史案件数据的分析提炼出规律。相较于以往法律规则的直接适用,大数据司法模型更为明确化、精准化,但面对千变万化的法律实践,大数据精准性特征必然带来法律适用的僵化性。

(1) 集体经验的僵化性。大数据司法是对司法人员的“集体经验”规律的提炼。然而,司法裁判差异性所带来的集体经验本身就参差不齐,不能保证所有的集体经验都在法律标准范围内。集体经验中还可能有潜在的“错判”,而一个“偏差”的案例就可能会破坏数据源质量,影响业务模型的准确性。甚至一旦某个法律问题的判断产生了集体性偏差,那么依此经验所产生的业务模型也必然带有偏差,并以“数据形式”为这种偏差披上科学的外衣。以“偏差”的业务模型来指导司法实务,必然会带来更为严重的“偏差”结果。

(2)数据模型的僵化性。大数据司法产生于对过去经验的总结,原理是依据“过去”来预测“未来”,且为了确保结果的精准性,一般都具有固定的系数及模型。然而司法实践日新月异,“未来”的案件很可能与“过去”不一致。在面对新型违法行为、“非普遍性”案件时,缘于过去的大数据司法模型则无法完全套用。考虑到法律体系的复杂性,有些“个性化”案件往往还需要考虑法律文本之外的“潜规则”,如公序良俗、政策等,而这些“潜规则”无法在成文法中所体现,自然也不会被大数据司法模型所识别、表达。

从本质上来说,上述矛盾源于大数据与法律两个领域思维方式的根本差异。大数据讲究量化思维、定量分析,司法活动则讲究主观化经验判断。反之,也可以换一种思路,充分利用两个领域的特征优势来寻求矛盾解决办法。从技术角度出发,可运用数据处理技术将“偏差的”司法经验、错误的历史数据剔除出去,确保初始数据源的合法性、准确性。例如在“交通肇事罪”量刑模型设计中,设计者通过实际刑期与标准刑期之间过大的残差值来发现量刑偏重、偏轻的案件,并将这部分数据从样本中剔除,优化样本数据源。同时,还要确保样本数据的充分性,数据的时效性,并根据数据源的变化来及时修正模型参数。从法律角度出发,可结合上文所述的自由裁量权保障措施,通过司法人员的自由裁量、主观判断来对实务中的新情况以及法外因素进行灵活协调。

(三)模型的经验性与罪刑法定原则

大数据司法模型的产生主要有以下两种路径:一种是直接将法律规则转化为数据规则;另一种是通过对海量历史数据的研判分析,将历史经验、司法规律提炼为数据模型。司法实务中,越来越多的大数据司法模型的设计采取后一种方式。究其原因,法律规则习惯于以单一的线性关系去分析法律问题,将其直接转换成数据模型,并没有带来方法上质的突破。而在大数据视野下,复杂的法律问题不再单纯体现为线性关系,可能呈现出曲线、散点等多元化的非线性关系,而这些多元化关系恰恰就是司法实践差异性、个案特殊性的数据化体现。因此,从技术上来说,后一种司法模型能够更切实、准确地还原司法实践。

然而,技术上的合理性却带来法律上的困惑:若基于集体经验大数据司法模型推广应用,尤其是在定罪、量刑等影响当事人重要权利的诉讼程序中运用,那么司法人员裁判时依据的不是法律规则,而是同类案件中司法人员的“普遍做法”、“集体经验”。换言之,司法决策所依据的模型不是来源于“法律上”的关联性,而是“数据上”的关联性,这一现象是否有违“罪刑法定”原则呢?

对此困惑实则不必过于担心。首先,大数据司法模型虽建立在海量历史案件数据基础上,但海量案件中要素提取的内容、范围须严格依据法律规定,即模型产生的数据要素是以法律规则为依据的。这一过程所暗含的前提便是“罪刑法定”原则。例如上文所述的“交通肇事罪”大数据量刑模型设计,首要步骤就是依据《刑法》、《最高人民法院关于审理交通肇事案件具体应用法律若干问题的解释》等相关法律规则,抽取文书中所涉的法定量刑情节,并据以产生数据模型。而“集体经验”的作用主要在于确定各情节之间的数据关系,以及各情节对刑期的影响比重,在法律规则基础上对模型参数进行细化和修正。其次,为保障罪刑法定原则的落实,应对大数据司法模型的分析结果进行检验,确保其在法定范围内。例如就量刑而言,依据法律规则,每一案件中能确定被告人的法定量刑区间,可以此“法定区间”来检验大数据量刑结果是否符合法律要求,确保分析结果落在法定区间内。综上,大数据司法模型的框架以法律规则为依据,模型参数依据集体经验来调整,以多元化数据关系来涵摄个案的差异性,兼顾合法性和司法实践多样性的要求。

(四)大数据的黑箱效应与司法的透明性

大数据的“黑箱效应”已饱受诟病,喻指其运行、决策过程的不透明,只能看到其输入和输出结果,而对其运算过程则一无所知。大数据司法同样面临此问题。实践中,一般先由司法机关提出业务需求,技术公司根据需求开发设计模型,最终呈现给司法人员的只是便捷化操作界面,各业务模型的运行过程呈不透明状态,模型的技术原理、算法更是属于核心商业秘密。例如我国某公司研制的大数据定罪量刑系统,只需输入基本犯罪事实,系统便自动输出所认定的罪名、具体刑期及相关法条。然而该系统对原理的解释仅为一句话:“本系统是根据用户录入‘犯罪事实描述’,经过人工智能机器学习的方法,从大量的实际案例中分析出的结果。”具体的运算机理完全无从知晓。

实务中,大数据司法的“黑箱效应”会带来一系列连锁法律问题。(1)大数据司法的不透明给司法文书说理造成障碍。大数据司法推广后,不同的业务、不同案件中都对应着不同的数据模型,如证据的采纳采信、行为定性、刑期的确定等。它们的设计过程极为复杂,且各种应用之间往往环环相扣,而司法人员大都不具备专业的数据知识去理解、解释模型的运行过程,对相关文书的释理说明带来了极大的挑战。(2)大数据司法的不透明进一步影响当事人的知情权和抗辩权,有违正当程序原则。作为实体正义和程序正义的基础,正当程序要求保障被告人及时获知被指控的罪名和理由,保障其辩护权和公平质证权,且正当程序的要义应贯穿于整个诉讼过程。然而,大数据司法的不透明很可能使被告人上述权利全部落空。首先,在法律文书释法说理不足的前提下,面对大数据分析所带来的不利结果,被告人无法获取足够的信息对其进行质疑、抗辩,辩护权的行使被架空。其次,即便是公开算法,被告人及辩护人也根本不具备专业知识对大数据司法结果提出有力质疑。(3)怀疑论者甚至担心大数据司法不透明的运行机制及其所带来的“机器审判”,威胁数字化时代的基本人权,进而引发大规模社会效应,造成民众的抵制和反抗。

对此,可以通过程序性规则来构建大数据司法的透明机制。首先,对于定罪、量刑等涉及当事人重要实体权利、程序权利的诉讼环节,应赋予当事人程序上的选择权,由当事人自行选择“机器审判”抑或“人为审判”,从根本上保障当事人的数字化基本人权。其次,一旦涉及当事人重要实体权利、程序权利的诉讼事项运用大数据司法模型时,司法人员应及时、明确告知当事人大数据的应用情况。在文书说理部分对数据源、算法原理、数据分析结果等进行解释说明。再者,针对如强制措施、定罪、量刑等程序中的大数据分析结果,当事人为确保其辩护权、质证权的充分行使,可申请数据领域专业人员作为专家辅助人,协助其辩护权的行使;同时,控方也可申请系统开发者作为辅助人,出庭接受辩方的质问。

(五)大数据的“监控”效应与个人信息保护

大数据时代,我们的社会正日趋成发展为 “大数据监控”社会,个人信息受到前所未有的威胁。尽管“数据监控”一般针对普通民众而言,但在大数据司法管理语境中,大数据监控也有着自成体系的逻辑。虽然基于国家公权力的行使,司法人员的个人信息权在管理考核机制中应做出一定让步,然而很多系统对数据的采集和监管已经突破了“合理”的限度。首先,司法实务中不少系统对司法数据的采集超过了“办案”的范围,如对司法人员网页浏览历史、社交工具等与办案无关数据的采集监控。其次,在此基础上,系统大多还会对司法人员办案规律、行为习惯进行深度分析,进一步突显个人隐私。再者,很多时候大数据绩效考核系统具有一定的秘密性,相当一部分司法人员并不知晓自己的相关数据被机器所采集和分析,以及用作考核依据。

对此,应结合个人信息保护的基本原则与司法管理宗旨,将相关性、比例原则、个人参与等个人信息保护基本原则融入大数据绩效考核系统设计中,在二者利益协调的基础上构建规范性规则。首先,要保障司法人员的知情权。司法机关应将系统拟采集数据的种类、范围,以及绩效考核系统的算法原理予以事先公示。其次,司法机关要确保数据的采集和监控仅与办案有关,不得涉及与办案无关的数据。再者,要保障司法人员对个人数据的控制权,允许司法人员对个人数据进行实时查看,对错误数据及时提出纠正,确保考核结果的准确性。另外,司法机关还应保障数据的安全性及系统的稳定性,对数据访问人员进行身份认证和控制,留存访问日志。

结 语

随着大数据时代的深入发展,数据技术、人工智能对司法领域的渗透已向纵深方向发展,“向科技要战斗力”成为重要的司法发展战略。大数据技术本身是中立的,如何让技术更好地服务司法实践,则需要以人类价值需求、社会政策导向对其进行引导,将诉讼需求合理吸收至系统设计中。以审判为中心的诉讼制度改革下的大数据司法路径,无疑给“向科技要战斗力”的司法战略提供了最佳实践范本。尤其是改革背景下大数据司法在应用中所呈现的法律问题具有相当的启示意义,提示我们在发展技术的同时要遵守法律原则、保证程序公正,技术的发展不能突破法律的框架。同时,借助技术与法律双重优势,通过技术方案的设计、法律规则的协调来寻求二者的平衡。在此基础上,方能充分发挥“司法改革”与“信息化建设”两者间的互动双赢效应,共同推进社会主义法治的深化发展。

猜你喜欢
司法人员量刑司法
服务大局司法为民忠实履职
网络司法拍卖如何更具公信力
舆论监督权滥用对司法人员履职的影响
司法人员职业保障机制的检视
论司法办案的多维度思维
“冒充司法人员实施电信诈骗”犯罪的防控对策研究
英国司法周开幕 系中国法院首次举行国别司法周活动
量刑改革:让法官的“内心活动”明确起来
从司法公正角度审视量刑建议应对电脑量刑
论量刑程序独立的可行性与必要性