司法数据的再利用及其规则配置

2021-12-05 22:37戴文怡
中州大学学报 2021年1期
关键词:司法规则案件

戴文怡

(湘潭大学 知识产权学院,湖南 湘潭 411105)

一、引言

2019年3月,法国颁布的2019—222号法律第33条禁止对基于法官个人的身份数据进行分析、比较、评估与预测。[1]这可理解为法国禁止出于某些可能影响案件结果的目的,运用司法数据对法官进行“精准画像”,从而限缩了法国司法数据应用的场景,更准确的说是对应用司法数据的目的进行限制。虽然在全球司法数据应用如火如荼的大局面之下,该禁止条款的制定显得“不合时宜”,但并不代表它没有存在的意义。对于一个成熟的国家来说,法律的出台绝不会任意为之,政策或是法律的制定总有其存在的现实需求,那么法国的考量又是什么呢?有学者认为“该禁令的出台是法国立法机关对司法数据与法官隐私、司法独立、司法权威和司法公正之间法理冲突的回应”[2]。对于我国司法数据再利用有什么启示呢?

大数据时代,数据是新的“石油”已然成为共识。2019年10月,党的十九届四中全会明确提出数据作为生产要素参与分配。2020年3月,中共中央、国务院出台《关于构建更加完善的要素市场化配置体制机制的意见》,提出“加快培育数据要素市场”[3]。近年来,在国家促进大数据发展等政策和“推动互联网、大数据、人工智能和实体经济深度融合”的指示之下,数据产业热火朝天,有关数据领域的研究与日俱增,数据安全、数据交易皆是学界的研究热点。司法数据作为数据的一种,它的研究占据着数据研究的一席之地。在司法数据研究领域,学者们的研究方向有所不同,在司法改革方面,主要有对司法大数据下的司法责任制改革进行分析[4]、详细描述司法大数据对司法公开实现的作用[5]、司法数据公开的程序规则[6];更多的学者对我国司法大数据的价值功能[7]、现状、困境进行分析研究,并提出相关对策[8]。有学者针对性地对司法数据再利用的某一类场景进行分析研究,比如探索司法数据在类案裁判中的应用,对类案推送系统的运行机理、前提以及目前问题进行分析[9];对基于司法数据的文本挖掘和量刑预测模型的构建进行研究[10]。还有学者评述域外司法数据的应用,论对我国司法数据应用的启示[2,11]。然而遗憾的是,现阶段学界对司法数据的研究基本还是停留于司法数据具体应用层面,更多的是对司法数据的应用进行场景描述,解决的是如何利用的问题,却较少涉及应用行为所可能引发的后果,或者可能带来的风险,更遑论对于司法数据再利用进行规则配置。我们不能仅仅允许司法系统享受司法数据再利用所带来的红利,社会治理、数据产业发展同样应该是该红利的享受者。

司法数据相较于一般数据而言,其涉及的内容具有复合性,不单单是对某个案件内容本身的解读,其中往往包含着个人数据和其他数据。基于司法数据本身的特殊性,如何平衡司法数据再利用和安全成为关键。新事物的出现对现有制度提出新的挑战,对原有规范的修修补补已满足不了需要,我们需要全新的制度规范。我国司法数据的应用正处于方兴未艾的阶段,规则制度体系并不完善,故有必要对司法数据再利用进行规则配置。

二、司法数据及其类型化

配置司法数据再利用规则,对于不同类型的数据应该选择不同的规则,实现分类分级管理。司法数据类型化是司法数据规则选择的基础,基于类型化的司法数据有针对性地选择规则,而明确的概念、准确界定司法数据的范围是类型化的前提。

(一)司法数据的概念

概念乃是解决法律问题所必需的和必不可少的工具,没有限定严格的专门概念,我们便不能清楚地和理性地思考法律问题。司法数据概念的界定是司法数据再利用规则选择的前提。然而,无论是学术界还是实务界皆未能对司法数据进行明确的定义。有学者认为“司法数据应当是指司法机关在司法活动中采集的各种数据”[6]。该定义仅仅是包含了“采集的数据”,但是在司法活动中,采集的数据只是一部分,参与该司法活动的主体也会产生数据,比如裁判文书、庭审视频等。数据是“大数据本身”的构成要素,数据与司法大数据本质相同。有学者将司法大数据分解为“司法活动”+“大数据科技”,认为司法大数据“是司法活动与大数据科技的结合,是将数据收集、储存之后运用在司法领域的一种数据科技”[5]。该定义认为司法大数据是一种运用数据于司法领域的数据科技,是数据与技术结合的产物,与现有一般“司法大数据”本身概念观点存在差异,上升到大数据的应用层面,所以在该定义中司法大数据指的应该是“司法大数据技术”。有学者基于对司法大数据基本特征归纳,认为司法大数据“系指由司法机关内外快速产生和流转的案件、数据、视频、音频等多样数据类型组成的,超越常规提取、储存和分析能力且能够分析和预测未来的海量数据”[7]。其实,该定义的主体是司法+“大数据本身”的概念,区别在于该定义纳入相关的数据类型以及功能,在一定程度上缩小了司法大数据的范围。显然,学界对于司法大数据的内涵还未能达成共识,为避免造成理解的误差,相较于司法大数据,司法数据的称谓更为恰当。

司法数据的本质无可非议是数据,与数据相比主要是范围的限缩,司法数据是被限定在司法领域的数据,特定的产生于司法活动中,根据司法活动的特殊性,最终数据都会汇集到司法机关。所以,司法数据是指司法机关在司法活动中收集、获取、产生的与案件有关的数据。

(二)司法数据的类型

司法数据类型化是指对司法数据进行分类,根据司法数据的属性和特征,按照一定的标准和原则对司法数据进行分类、分级管理,目的是为了更好地利用司法数据,实现司法数据利用与安全的平衡。基于司法数据的特征,对司法数据的分类需要从不同的角度出发,按照不同的分类标准,可以将司法数据分成不同的类型组合。

基于业务分工的不同,司法数据可分为审判司法数据、检察司法数据以及侦查司法数据;根据案由的差别,可以将司法数据分为刑事案件数据、民事案件数据、行政案件数据、国家赔偿案件数据、执行案件数据以及其他案件数据;按照案件类型,实行类案司法数据分类,比如,离婚纠纷案数据、借贷纠纷案数据、劳动纠纷案数据、交通事故案数据等,由于类案的种类较多,故不在此一一列举;按照载体的区别,司法数据可分为文本数据和视频数据等;按照是否属于个人数据,将司法数据分为个人数据和非个人数据,个人数据之下按照主体的不同,可分为当事人数据、司法工作人员数据和其他诉讼参与人数据。然而上述的划分标准要么过于繁杂,要么过于简单,无法对规则配置提供支持。其实,以是否涉及国家秘密为划分界线,将司法数据划分为涉密司法数据和非涉密司法数据是较为清晰且有意义的划分标准,该种分类方式可操作性强,能够很好地实现司法数据的分类分级开放。

三、司法数据再利用的现实需求

2015年习近平总书记提出“深化司法体制改革,建设公正高效权威的社会主义司法制度”,努力让人民群众在每一个案件中感受到公平正义是深化司法体制综合配套改革的目标。计算机技术的快速发展,云计算、人工智能技术的成熟,为我国的司法改革提供了新思路和新手段,“数字法治”和“智慧司法”成为司法改革新的目标。如今,无论是建设智慧司法,提升司法公信,还是促进社会治理,司法数据都必不可少。

(一)建设智慧司法

建设智慧司法是深化司法体制综合配套改革的关键部分,《“数字法治、智慧司法”信息化体系建设指导意见》提出信息化建设的目标,形成大平台共享、大系统共治、大数据慧治的信息化格局[12]。

智慧司法是指“公安司法机关为实现司法的公正高效,充分运用互联网、大数据、云计算、人工智能等信息技术,以推进司法运行和管理体系的信息化、智能化与现代化”[13]。司法信息化、智能化和现代化是智慧司法建设的目标,基于信息技术的司法数据共享和利用是建设智慧司法的重要部分,共享是更好利用的前提。然而在司法系统内部,“数据孤岛”和“数据割据”不可避免,不同法院之间,不同检察院之间,以及检察院和法院之间亟须破除数据壁垒,实现司法数据的共享。目前,“智慧法院”的信息化建设已经基本完成[14],司法数据的共享和利用已有成功实例,“类案检索意见”“类案推送”“案件繁简分流”“司法知识图谱”“司法事理图谱”等功能上线运行。贵州法院依托司法大数据,成立了全国首家大数据审判庭,在“云上贵州”的基础上打造了“法院云”,实现了公、检、法数据共享。上海法院“案件繁简分流分类处置平台”开始运行。深圳法院的“深融·多元化平台”实现调解立案、在线调解、司法确认、类案推送、在线评议、转诉讼立案六大功能。相对于地方法院,中国司法大数据服务网设定更为全面的司法数据利用项目,涵盖“案件分析研究、司法知识服务、涉诉信息服务、类案智能推送、智能诉讼评估以及司法自主统计”。

2017年6月,最高检印发《检察大数据行动指南(2017—2020年)》,旨在推进全国检察机关大数据的应用,打造“智慧检务”。在此之前,北京市检察院、浙江省检察院、贵州省检察院已相继建立大数据平台或者应用中心,将大数据与检务结合,实现司法数据的二次利用。无论是最高院还是最高检,都充分认识到建设“智慧法院”“智慧检务”需要基于司法数据的再利用,更准确的说应该是“智慧法院”“智慧检务”的实现是司法数据再利用的结果,故智慧司法的建设需要以司法数据为基础,司法数据是智慧司法的必需“原材料”。

(二)提升司法公信

司法公信源于社会公众对司法权力的一种认知和态度,以及对司法运行及其结果的信任和尊重。司法公信源于司法公正,司法公正是司法公信的必然前提。通常情况下,法官在明确的标准之下审判案件,此时法官的自由裁量范围窄。然而当遇到事实证明模糊、适用法律不明确案件时,案件结果的作出很大部分依靠于法官的自由裁量。然而不同的法官对于同类案件的自由裁量有所区别,“同案不同判”的情况时有发生,由此法官对案件的自由裁量是一个范围,而非特定的一个数值,所以为达到规范法官自由裁量的目的,准确划定法官的自由裁量阈值是必要的。自由裁量的阈值确定以司法数据为样本(如裁判文书、庭审视频等)支持,通过智能化的手段,设定不同的要素,对司法数据进行对比分析,在排除不合法的定点的前提下,根据某一类案件判决的自由裁量的最高点、最低点以及集中点确定合适的自由裁量阈值,以此为案件判决是否合法的检验标准,更进一步可以实现检测该案件的审判是合法且合理、合法但不合理的情形。当某一个案件进入系统,若该案件不符合系统中自由裁量阈值的,可以实现及时预警,这不仅是对当事人的保护,同样也是对法官的负责。自由裁量阈值的确定,使得法官审判同类案件的自由裁量在一个确定的范围,基本实现阈值之下的“类案同判”“同案同判”,而最理想、最佳的发展状态是同类案件的审判都达到既合法又合理的状态,最终实现统一裁判尺度的目标。“同案同判”“类案同判”的实现是司法公正的重要体现,同时审判结果也会得到人民群众的信任和尊重,而信任和尊重的态度是司法公信的表现,司法数据再利用有利于提升司法公信。

(三)促进社会治理

社会治理是指“在现代公民社会不断发展的背景下,政府与民间、公共部门与私人部门合作互动,进行公共事务管理,实现社会秩序,增进公共利益的一种新的统治过程”[15]。在大数据时代,无论是提升司法透明、助力公众参与司法,还是建设社会诚信体系都离不开司法数据的再利用。

其一,提升司法透明。随着我国司法公开要求的明确提出,司法透明成为司法运行的基础和落脚点。《现代汉语新词语词典》中将“透明”解释为“把事情公开,不隐藏。”由此,可以认为司法透明与司法公开实质相同,但司法透明更倾向于是一种状态,与神秘相对应,指的是公众可以随时获取,而司法公开是司法神秘主义转向司法透明化的手段。司法系统积极响应,逐步地将司法数据对外公开。在检察院系统,2014年10月,人民检察院案件信息公开网开通。在法院系统,中国审判流程信息公开网、中国裁判文书网、中国执行信息公开网、中国庭审公开网四大开放平台相继开放。司法机关为公众揭开司法审判的神秘面纱,通过四大开放平台,公众可以清晰地了解审判流程、判决结果、执行信息,甚至可以随时观看庭审视频等。其中,自中国裁判文书网正式上线以来,截至2020年10月,裁判文书的总量达到10372万余篇,访问总量超过503亿人次。

其二,助力公众参与司法。依靠大数据,智能诉讼评估系统上线运行,且对外开放使用。当事人应用智能诉讼评估系统对案件相关的内容进行预测,依据预测的结果做出明智的决定。基于对成本的智能预测,选择合适的纠纷解决机制[8];基于诉讼结果的智能预测,对案件的判决结果有一定的心理预期;基于诉讼风险的智能预测,提前对诉讼风险进行防范。最高院的中国司法大数据服务网的“智能诉讼评估”项目下的“离婚纠纷”案件的智能预测已经开通,“类案智能推送”中应用场景有法官用户、公众用户以及律师用户,其中,在公众用户和律师用户场景中,提供裁判结果预测的服务。

其三,建设社会诚信体系。诚信是立身之本,但失信已成为社会普遍现象[16],“老赖”现象层出不穷,社会诚信体系的建设是解除信任危机的关键部分。在大数据时代,社会诚信体系的建设需要与数据相联系。基于云计算、人工智能等计算机技术,国家机关、金融机构利用司法数据实现个人或者企业涉诉信息的全面查询、精准预测,从而做出明智的决策;通过数据平台实现司法数据共享,为第三方征信机构、公众用户评估自然人或者组织机构的信用等级提供参考,从而为社会诚信体系建设提供有力支撑,促进社会的健康发展。

四、卡—梅框架下司法数据再利用的规则配置

司法数据再利用是大势所趋,然而有关数据的立法始终未能出台,在此情形之下,为司法数据的再利用配置规则已是迫在眉睫。卡拉布雷西和梅拉米德提出“财产规则”(Property Rules)、“责任规则”(Liability Rules)和“不可让与规则”(Inalienables Rules)[17],被称为卡—梅框架[18](C&M Framework),有学者在原始结构的基础上增加了无为规则和管制规则,扩展和重构“卡—梅框架”的救济分类和规则结构[19]。根据我国对数据的立法态度,将禁易规则、管制规则、财产规则和责任规则进行组合,以禁易规则确定司法数据开放范围,管制规则限定司法数据再利用的主体,财产规则明确司法数据交易对象,责任规则确保司法数据再利用的效率,从而实现司法数据再利用的规制配置。

(一)禁易规则:实现司法数据分类分级开放

禁易规则禁止法益以某种或者所有方式进行私自转移,即禁止私人转移,目的在于取缔目标市场[19]。对于司法数据的开放而言,禁易规则可以延伸到“禁止司法数据开放”,制定禁易规则实现司法数据分类分级开放。司法数据之所以称为司法数据,是因为其是产生于司法活动,司法活动的主体涉及司法工作人员、诉讼当事人以及其他诉讼参与人,必然会有个人数据蕴含于司法数据中;司法活动的对象是相关案件事实,该事实可能涉及国家秘密、个人隐私、国家安全以及公共安全等等,作为复合型数据,有必要对司法数据实行分类分级开放。

根据司法数据是否涉及国家秘密划分为涉密司法数据和非涉密司法数据,涉密司法数据禁止开放,但非涉密司法数据并非绝对开放。非涉密司法数据根据敏感程度划分为四个等级,分为公开司法数据、轻度敏感司法数据、中度敏感司法数据以及重度敏感司法数据。对于涉及国家安全、公共安全、个人隐私和商业秘密的司法数据应该划分为重度敏感司法数据,原则上该类司法数据禁止对外开放。对于涉及案件主体个人基本信息的可以划归为轻度敏感司法数据,进行匿名化开放,未进行脱敏处理的轻度敏感司法数据禁止开放。然而现阶段,裁判文书中有关司法活动主体的信息都未进行脱敏处理,这是需要注意的。对于涉及未成年人的司法数据应该划归于中度敏感司法数据,有条件地匿名化开放,即未满足开放条件的或是满足条件但是未脱敏的中度敏感司法数据禁止对外开放,但是不排除内部共享。我国刑诉法规定“未满18周岁的人犯罪,判处有期徒刑5年以下的,封存案件的相关材料”,可见对于涉及未成年人司法数据的有条件开放已经有法可依。而对于公开数据,完全对外开放。

(二)管制规则:限定司法数据获取主体资质

管制规则是指法律明确了法益的归属,在满足法定条件的基础上允许法益的私人转让,并且制定和审核相应法定要求的并非是当事人双方,而是代表国家的第三方权威机构,其实质是国家对私人交易的介入,主要是为了维护公共利益[19]。“法定条件”的内容可以有多种,交易价格的限定、交易方式的限定等。司法公开要求司法数据的开放,但司法公开的目的在于实现司法透明,由于司法数据再利用技术条件的限制,在司法数据再利用中,企业、机构、单位等是主导,对于司法数据获取主体的选择成为关键,遵循管制规则设定相应的资质取得条件。资质条件的设置可以从是否有数据泄露的前科、使用目的、信用等级出发,每一项条件都有一票否决权。资质申请主体必须同时满足以上三个条件,才有可能具有司法数据获取主体资格。是否有数据泄露的前科是从数据安全角度出发,提前了解知悉该主体数据安全保护能力,为司法数据安全提供基础保障;使用目的合法是获取主体资质的又一条件,主体对司法数据合法利用是更深的要求,一是防止“数据孤岛”的发生,二是在于不少主体“挂羊头卖狗肉”获取数据之后,并不对数据进行处理利用,而是将其出售给其他主体,成为贩卖数据的“黄牛”,扰乱市场秩序;适应社会的发展,鼓励企业诚信经营,现阶段我国企业信用评级按照三等十级来划分,信用程度由高到低为A、B、C三等,可以设定司法数据获取主体需要达到A等,选取信用程度较好的主体可以有效避免司法数据获取之后产生的纠纷。

(三)财产规则:明确司法数据权利初始归属

明确的法益权属是财产规则的前提,允许私人转移法益,自愿交易是法益转移的唯一合法方式[19]。无论司法数据权利初始归属于谁,司法数据进行交易是必然的,但是初始权利的归属决定了司法数据交易的走向,而司法数据的转移是再利用的基础。从安全性和成本两个角度出发,明确司法数据权利初始归属于司法机关是最合适的。

从安全性来说,司法机关不存在追求利益的理由,必然不会像企业或者个人那样,为了追逐利益而进行数据交易,从而降低司法数据因交易而面临的风险;而且司法机关作为数据实际“控制者”,其有能力对司法数据进行保护,无论是对企业还是个人来说,司法机关具有很大的威慑力,不会随意地伸出罪恶的双手。再退一步说,即使当司法数据面临泄露等风险时,司法机关也能及时地补救和制止。

从成本来说,无论司法数据的生成者是谁,司法数据最终都将汇聚于司法机关,比如一篇裁判文书中荷载诉讼参与人、司法工作人员以及其他的数据;再比如司法数据包含着司法机关收集和生成的数据,生成的数据当然归属于司法机关,那么收集的司法数据呢?在该司法数据允许开放交易的前提之下,与将司法数据归属于司法机关相比,将司法数据归属于不同的主体,会大大增加司法数据交易的成本。因为首先需要对司法数据主体相对应的数据进行划分,哪些司法数据归属于当事人,哪些司法数据归属于司法工作人员,还有哪些司法数据归属于司法机关,其中可能会增加评估费;然后多对多的交易成本肯定是远大于多对一或者一对一的,包括时间成本和金钱成本,与司法机关交易时,司法机关很大概率上会免费转移,但对于其他主体交易时代价为零的机会不大。故无论是从安全性角度还是成本角度考虑,相较于将司法数据权利初始归属于其他相关主体,将司法数据权利初始归属于司法机关是最合理的。

(四)责任规则:确保司法数据再利用的效率

责任规则是指法律明确法益的归属后,以支付法定价格强制交易的方式转让法益[19]。责任规则突破财产规则的限定的自愿交易,允许“强买强卖”,其提供的是权利主体被“强制交易”后寻求救济的权利,但该救济请求的范围不得超过该“法定价格”[19]。“法定价格”必须是第三方主体确定的一个价格,至于该价格到底是多少,可以是行政执法机关决定也可以是司法审判机关决定,还可以由评估机构确定。依据责任规则,给予司法数据交易的买方一定的“灵活性”。与传统交易有所区别,在司法数据交易中,“强卖”的现象基本不存在,主要是“强买”。比如,在司法数据交易的过程中,权利主体为了限制司法数据的访问获取量,严格限制获取司法数据的程序,以避免一次性大批量的获取。而“强买方”为了节省时间成本,追求效率,会选择越过这些繁杂的程序而直接获取司法数据。此时,司法数据的买方违背购买程序,对权利主体造成损失,“强买方”可能需要为其所实现的效率支付一定的“法定价格”,或者说权利主体发现后将资格主体诉诸法院,这时“法定价格”将会根据法律规定确定。通常情况下,当“法定价格”低于资格主体因获取的司法数据再利用创造的价值时,买方会乐意选择支付“法定价格”;但是当“法定价格”大于因该行为而所能获取的利益时,买方不会选择“强制交易”,此时的“强制交易”所起的是禁止交易的效果。需要强调的是,“强买方”并非必然需要支付“法定价格”,判别是否需要支付“法定价格”可以从目的、必要性等相关因素出发,比如当出于国家安全、公共安全等目的时,“法定价格”应该为零。

猜你喜欢
司法规则案件
少捕慎诉慎押刑事司法政策下侦羁关系的反思
服务大局司法为民忠实履职
撑竿跳规则的制定
一起放火案件的调查:火灾案件中的“神秘来电”
数独的规则和演变
制定法解释中的司法自由裁量权
“左脚丢鞋”案件
奏好人大内务司法监督“三步曲”
让规则不规则
TPP反腐败规则对我国的启示