熊晓彪
(中山大学 法学院,广东 广州 510275)
长期以来,证据标准被视为证明标准的另一种提法,混同适用于司法实践之中,不具有独立的地位与价值。2014年,“以审判为中心”的诉讼制度改革拉开帷幕,同时也掀起了司法机关借助大数据、人工智能等现代科技手段“统一证据标准”的热潮。在此背景下,越来越多的研究开始对证据标准予以关注。有学者从理论层面对证据标准的概念进行了重新界定与澄清,即证据标准是指对被允许进入审判阶段的案件,其证据需要具备证据能力且满足各项要件事实对推论链条完整性的基本要求[1]191-208;也有学者对证据标准进行溯源,指出早在中国清代刑事案件的处理与审核实践中,就存在“诸证一致”的证据标准要求[2];还有学者与时俱进,运用基于现代互联网与人工智能发展形成的知识图谱技术,探索实现证据标准数据化建模的原理与方式[3]。此外,从中央到地方各级司法机关,也在积极推进对刑事、民事、行政三大诉讼分别制定“统一的证据标准指引”的试点工作。
与此同时,另有研究注意到证据标准可能导致的潜在法律风险以及对统一数字化证据标准的不同意见。有学者指出,证据标准指引建立在证据规则的基础上,而证据规则受法定主义的影响,因此证据标准的推进不可避免地会加剧法定主义倾向,同时过分精细化的标准也会导致证明标准的客观化,对自由心证造成侵蚀[4]87;有学者基于证据标准发展的基准等同于客观化的证明标准之论断,提出证据标准可能导致诸多负效应,如加剧证明模式转型困难、损害司法治理的有效性、导致司法平庸化、动态调整不足以及加剧司法的封闭性等[5]97-99;还有学者指出,由于目前人工智能算法运行效率低下,因而难以真正解决证据标准统一共享的问题[6];也还有学者反对统一证据标准的做法,主张对刑事案件的证据标准进行差异化规定,是开展证据审查、进行大数据积累和运用以及引入人工智能技术辅助办案的必由之路[7]。
作为在中国通过自然演进而形成的本土化概念,证据标准有其适用语境与优势,也有一定的缺陷和不足。尤其是与新技术的结合,必然会给其带来许多未知的风险。不过,有些关于证据标准的负面评价可能是由于对其认知偏差所导致的,而有些则可能是现行司法实践对证据标准的偏离所造成的。对于这些问题,有必要予以进一步的探索与澄清。同时,在“司法智能化”浪潮下,数据化统一证据标准究竟如何实现以及可能存在哪些潜在风险等,也需要进行具体的论述分析。笔者拟作如下尝试:首先,从证据标准的理论根基入手,对其具象维度予以揭示;其次,基于证据标准与证据充分(分量)标准之间的区分,纠正和澄清实践中关于证据标准的适用与认识误区;最后,在证据分布规律与证据发现图示的基础上,结合自顶向下的知识图谱技术,对数据化统一类案证据标准的原理及可能面临的潜在风险与挑战予以探讨,以期为学界今后的相关研究贡献些许智识上的力量。
2016年,中共中央政法委员会率先发起“借助现代科技统一证据标准”的号召,全国各级司法机关纷纷响应,积极投入类案证据标准制定与“数据化统一证据标准系统”的研发之中。在刑事案件的诉讼过程中,“证据标准”的提法与适用也逐年增多。那么,实践中制定的是何种证据标准?司法实务人员又是如何对其进行适用的?要回答这些问题,需要对证据标准在司法实务中的适用情况进行具体考察。
2016年7月,中共中央办公厅和国务院办公厅发布的《国家信息化发展战略纲要》第29条规定:“建设智慧法院,提高案件受理、审判、执行、监督等各环节信息化水平。”[8]同年9月,时任中央政法委书记孟建柱在贵州调研时指出:“要把科技创新与司法体制改革融合起来,特别是在推进以审判为中心的诉讼制度改革中,通过强化大数据的深度应用,把统一的证据标准镶嵌到数据化的程序之中,减少司法的任意性,既提高审判效率,又促进司法公正。”[9]随后,贵州、上海和北京等地的地方司法机关率先开展了结合大数据、人工智能等科技手段统一证据标准的试点工作,并取得了一定的成果,典型如贵州省高级人民法院(以下简称“贵州高院”)的智能辅助办案系统和上海市高级人民法院(以下简称“上海高院”)的“上海刑事案件智能辅助办案系统”(又称“206系统”)等。由于上述系统均是将证据等材料数据化之后进行识别、处理及运作,因此,可将之统称为“数据化系统”。
迫于案件“井喷式”增长与员额制改革后法官人数锐减所导致的巨大办案压力,加上中央关于建设“智慧法院”和“借助现代科技统一证据标准”的顶层设计,贵州高院于2016年率先引入专业的大数据分析团队,对全省三级法院的历史案件数据进行采集,再通过大量同类案件数据分析,建立了全国首个司法智能辅助办案系统——贵州法院大数据办案系统。该系统主要通过将提前制定好的公、检、法三机关统一适用证据标准数据化、模块化之后,嵌入三机关互联共享的办案系统中,以此来实现证据标准在侦查、审查起诉和审判阶段的统一适用[10]。2017年,上海高院联合科大讯飞公司共同研发出206系统。与贵州法院大数据办案系统类似,206系统也是先制定好类案证据标准,然后进行数据化建模,形成证据标准库。因此,上述智能辅助办案系统中的证据标准,其内核实际上是预先制定好的证据标准规范文本,如贵州省司法机关联合制定的《刑事案件基本证据要求》和上海高院制定的《上海刑事案件证据收集、固定、审查、判断规则》等。
贵州、上海两地制定的证据标准具有如下特征:其一,对常见类型的犯罪需要收集哪些证据作了详尽的规定,如《上海刑事案件证据收集、固定、审查、判断规则》按照三种类型(当场抓获型、重要线索型和网络犯罪型)对盗窃案件应收集的证据分别规定了相应的证据形式规格、收集程序及过程证据;其二,不仅对定罪证据作了具体规定,而且还对立案证据、案件侦破证据、刑事责任能力证据以及量刑证据等进行了明确要求,如贵州《刑事案件基本证据要求》对故意杀人、故意伤害案件规定了4种立案证据、3种案件侦破证据以及2种刑事责任能力证据;其三,对如何收集证据以及证明收集过程合法性的证据也都作了巨细无遗的规定,如贵州《刑事案件基本证据要求》对勘验、检查和搜查证据该如何进行提取、固定、制作和保管,以及相应的过程证据(如现场勘验检查工作记录,提取痕迹、物证登记表,登记保存清单,必要的拍照、录音、录像等)都作了详细规定。
将证据标准细化为案件从立案到侦破再到定罪量刑的具体证据规格形式以及具体的合法性要求,能够指导、规范甚至确保侦查取证符合审判对案件证据的具体要求,同时也能够有效防止不符合要求甚至“带病”的证据进入审判程序,这将便于法官进行审理与定罪量刑。然而,上述做法也可能会导致如下后果:一方面,作为案件证据准入尺度的证据标准变相沦为定罪量刑的充分性标准。一旦侦查阶段收集的案件证据符合此种证据标准,就意味着法院必然要作出所控罪名的定罪量刑,此即所谓的“填鸭式”定罪。因为这些证据标准都是法院对于定罪量刑的具体明确要求,如果侦查、起诉都严格按照该标准执行,那么法院显然没有理由“自己否定自己”。另一方面,将证据标准制定为巨细无遗的定罪量刑证据规格形式要求,忽视了个案的具体差异,容易导致许多案件因不符合此种形式化的证据规格要求而无法进入审判程序,同时也会造成侦查、检察人员过分追求这些证据形式要求而忽视证据本身的内容,甚至为了结案而不惜弄虚作假、非法取证等。
证据标准在数据化系统中沦为一种定罪量刑的充分性标准,那么,在实践中又是如何被理解适用的呢?为了对实践中的证据标准进行考察,笔者在中国裁判文书网搜索“刑事案件”和“证据标准”词条,检索到808篇裁判文书(时间跨度为2011—2021年)。再逐一对检索到的裁判文书中涉及证据标准的内容进行梳理分析,归纳出证据标准在实践中的不同适用情形,如表1所示。
表1 证据标准在实践中的不同适用情形
由表1可知,证据标准在刑事司法实践中大致存在8种不同用法,分别作为证明标准、充分性标准、定案依据判准、证据资格、立案标准、类案证据要求、推论链条完整性标准以及判处死刑标准来使用。从类型上来看,第1~3种用法与案件事实认定有关,要么直接将证据标准等同于证明标准,要么将证据标准作为定罪的充分性标准或判断证据能否作为定案依据的标准;而第4~7种用法都不涉及事实认定,仅是关于单个证据是否具有证据能力(资格)、案件证据是否符合立案起诉标准以及推论链条完整性的标准(下文将会指出,实际上它们都属于真正意义上的证据标准);至于第8种用法,则属于量刑标准,这是一种复合型标准,既涉及量刑事实(区别于案件事实)的证据要求,也包括量刑事实的认定标准。鉴于目前所指称的证据标准仅与案件事实的证据要求有关,因此暂时先忽略作为量刑标准的用法(笔者后续将另行撰文论述)。
证据标准尽管是认定案件事实在证据方面的基本要求,但是并不涉及案件事实的判断标准;然而,在实践中却频繁被当作事实认定的标准来使用,由此导致证据标准异化为证明标准、充分性标准以及证据采信标准。学界对证据标准的负面看法也由此产生,将证据标准直接等同于客观化证明标准并对其予以批评[5]91-93。原因在于:一方面,由于在规范制定上就有意将证据标准细化为定罪量刑的充分性要求,致使司法实务人员直接“依葫芦画瓢”;同时,地方司法机关借助现代科技打造的“智能辅助办案系统”加剧了此种趋势。另一方面,证据标准与证明标准、充分性标准之间的实质区别没有完全被揭示,以至于司法实务人员在理解和适用过程中容易将其混同。据此,在理论上对证据标准与事实认定标准进行有效区分,不仅必要而且迫切。要实现此目标,首先需要对证据标准有一个具象的认识。
证据标准是关于案件证据是否符合审判要求的一种判准或尺度,然而,对于证据标准的具体内容为何,却没有统一的答案。有学者指出,证据标准不是简单的证据清单,而是由证据链条串连起来的一个多层次的证据体系[11];还有学者通过实践考察,认为证据标准主要是以个罪的定罪量刑为证明对象,就证据的种类、形式乃至数量所提出的具体要求[12]。从证据标准自身的功能和定义来看,其实际上存在单个证据审查标准与案件整体证据判准两个具象维度。
一项证据要被允许进入法庭,其需要具备一定的能力或资格。该事项在英美法系国家被视为证据的“可采性”问题,而在大陆法系国家则被视为“证据能力”或“证据资格”问题。所谓证据的“可采性”,是指“在听审、审判或其他程序中被允许进入证据的品质或状况”[13]。
关于证据能力的定义,学界存在多种版本:第一种定义直接将其与可采性等同[14];第二种定义将证据能力“作为认定事实依据的资格”[15];第三种定义用“证据准入”一词来表示“证据能力”,即准许证据进入审判程序的资格,证据只有在被准许进入法庭之后才能用来作为证明案件待证事实的根据[16]。显然,证据能力与可采性存在一定区别,因此不能完全将二者等同,而第二种定义更是未注意到允许证据进入审判的资格与作为定案依据资格之间的区分,也欠妥当。近年来,一种先审查证据能力,再评价证明力的两阶层证据判断模式,已经逐渐成为中国刑事诉讼学术界和司法实务界共同认可的模式。证据要想转化为定案的依据,应当具备证据能力和证明力这两项基本的资格要求。
据此,采纳上述第三种定义是一种较为合理的做法,即证据能力是指准许证据进入审判程序的资格,亦即“证据准入”。然而,对于这种证据准入的具体条件或要求是什么,目前也存在争议。传统观点认为,证据能力具体包括证据的“三性”,即关联性、合法性、真实性。有学者持不同意见,主张证据能力要件只包括关联性与合法性[17]。也有学者认为,证据能力要件包括4个方面,即证据的取证主体、证据的表现形式、证据的取证手段以及证据是否经过合法的法庭调查程序[18]。还有学者通过对最高人民法院2017年出台的“三项规程”①进行考察,认为刑事证据能力的作用时点已经前移至庭前会议或者法庭调查的第一阶段,因此,对将“经过法庭调查程序”作为证据能力要件的观点予以否定。同时,该学者还将关联性排除在证据能力要件之外,认为倘若将关联性作为要件之一,将混淆事实考量与规范评价之间的关系。最后,该学者仅保留了合法性作为证据能力要件,并结合“证据能力消极要件”理论,提出了无证据能力而被排除使用的5种要件类型,即因取证主体不合法而无证据能力、因取证手段不合法而无证据能力、因取证程序违法而无证据能力、因证据的表现形式不合法而无证据能力以及因取证对象不合法而无证据能力[19]。
相较而言,最后一位学者的划分更好,其将“经过法庭调查程序”这种在功能上作为事实认定者评价证据证明力的独立程序保障机制排除于要件之外,并具体提出了不满足合法性的5种类型。然而,这种仅基于合法性对证据能力所进行的要件划分,范围和视野都过于狭窄,致使证据准入的要件标准沦为了非法证据排除规则。
首先,证据准入并非只具有排除、过滤证据的作用,更重要的是,其还具有指导证据的收集获取以及尽可能多地采纳有价值证据的功能。这些功能的实现依赖于证据的相关性审查判断。该相关性具有三层含义:第一层是证明性,即证据可能证明待证事实真伪程度的一种能力[20];第二层是实质性,是指证据与要件事实存在实际联系;第三层是待修复的相关性,但很容易被学界所忽视。所谓待修复的相关性,是指当相关性的存在取决于某个事实,而该事实又缺乏相应证据支持时,其就会处于断裂状态,需要提出证据支持该事实以对其进行修复。据此,可以通过审查判断证据相关性的上述三层内容,从而实现证据能力规范与促进更多有证明价值且“不带病”的证据进入法庭之功能。
其次,证据准入还应将真实性纳入考查范围。所谓真实性,对应的英文为authenticity,并非强调所谓的“真相”“与事实实情一致”或“合乎事实”等方面,而是指称证据来源的同一性,即证据的来源是无可争议的,举证方所出示的证据与其本源的状态是一致的。在中国语境下,证据的真实性有两层含义:一是从“证据载体”的角度来看,证据本身必须是真实存在的,而不能是伪造、变造的;二是基于“证据事实”的视角来看,证据所反映的信息内容必须是可信的,而不能是虚假的[21]。因此,证据的真实性主要是指证据来源的同一性和证据载体的可靠性,而证据内容的真实性则又属于可信性的内容。例如,有学者提出电子证据的真实性具有三个层面的内容——载体的真实性、数据的真实性和内容的真实性,其中检验载体的真实性的方法即为鉴真[22]。在此意义上,可以将真实性纳入证据准入的考量因素,只有当证据满足了真实性要求之后,才能准许进入法庭。具体包括两项内容,即证据来源的同一性和证据载体的可靠性,可以通过鉴真、辨认以及规定作证条件(如要求亲身知识)等方式,在审前阶段对其进行审查判断。
最后,证据准入还应当蕴含如下考量,即基于促进或确保其他社会重要价值而限制某些相关性证据进入法庭。“在各种法律程序中,查明事实真相的价值并非超越一切的。人们通常承认,某些社会需求和价值因素束缚了获得正确事实认定的努力。”[23]对这些重要价值的考量与陪审团审判无关,而与一个有序良善的法治社会所应倡导和鼓励的价值行为有关。和谐,作为一项证据政策同时也是证据法所追求的主要价值之一,体现的是求真与求善之间的平衡。抑制某些诉讼行为以促进相应基本行为朝着和谐价值方向发展,可以通过证据准入规则的设置而实现。例如,在特定关系(如律师-委托人、医生-患者、丈夫-妻子等)之间设立作证特免权,可以有效鼓励和促进社会中的各种特定职业活动,保护特定的法律关系。还有一类被称作“不能用以证明过错或责任的证据”,禁止这类证据进入法庭主要是为了促进社会中的善良与和谐价值或鼓励公共利益行为。
总体来看,促进和谐性证据的范围相当广泛,主要包括:事后补救措施、和解和提议和解、支付医疗费或类似费用、撤销的自认或有罪答辩以及作证特免权(主要有律师-委托人、心理诊疗师-患者、夫妻等之间的作证特免权)。
综上可知,单个证据准入要求的要件包括相关性、真实性、合法性及促进和谐性四大类,具体结构层次如图1所示。其中,相关性又可进一步分为证明性、实质性和待修复的相关性3个方面;真实性具体包括证据来源同一性和证据载体可靠性2个方面;合法性则由5个具体要件共同构成,即取证主体合法、取证手段合法、取证程序合法、取证对象合法以及证据表现形式合法;促进和谐性则涵盖5种不允许进入法庭的证据。
图1 证据准入的具体结构层次
长期以来,学界和司法实务部门都将“证据充分”作为案件整体层面证据判准的要求。有学者指出:“过去我们常说的证据确实,往往是指单一证据的真实可靠性;证据充分,则指的是群体系列证据的整体证明力。”[24]31这种将证据标准视为证明力程度的观点还混同了证据标准与证明标准。之后,有学者提出不同于证明标准的证据标准概念,将证据标准的内容从证明力转向了证据能力[25]。然而,这种界分仅注意到了单个证据的准入要求,却忽视了案件整体证据层面的证据标准。近年来,有学者从证据标准的功能出发,指出其涉及单个证据的证据能力审查和证据对各项要件事实的支持是否形成完整的推论链条之判断两项内容。后一项内容即为证据整体层面的证据标准,具体包括要件证据、相应附属证据和要件事实推论链条的完整性[1]200-201。据此,只需要预先知道一个具体犯罪的构成要件,以及这些构成要件的完整推论链条可能要求哪些要件证据和相应附属证据,就能构建出案件整体层面的具象证据标准。
前一个事项(即单个证据的证据能力审查)基本不存在疑问,因为实体法已经对各项罪名的构成要件作了具体规定。至于后一个事项(即证据对各项要件事实的支持是否形成完整推论链条)的实现,则需要借助证据分布理论与证据发现图示。证据分布理论表明,同一犯罪构成要件之下,个罪案件中的证据分布呈现规律性的特点[26]。证据发现图示则反映,根据对一项新假设的回溯性检验过程,可以发现一系列可观察到的证据[27]。然而,证据发现图示仅是探讨与揭示基于一项(异常)证据溯因能够对其进行合理解释的新假设,再对该新假设进行回溯性检验从而发现新证据的过程与机理。不过,如果将证据发现过程中的新假设替换成要件事实,再结合庭审中的事实命题层级和内部推论结构,就可以得出案件整体层面要件事实完整推论链条结构框架,如图2所示。
图2 案件整体层面要件事实完整推论链条结构框架
中国相关立法一直将侦查终结、审查起诉以及审判定罪的标准统一表述为“证据确实、充分”(以下简称“证据充分”),这导致了两个方面的误区:一是将证据充分等同于据以认定案件事实的证明标准;二是将证据充分作为庭审对案件证据的基本尺度要求,即混同于证据标准。通过上述实践考察可见,无论是地方司法机关在数据化系统中嵌入的证据标准,还是实践中适用的证据标准,都频繁出现将证据标准当作事实认定的判准使用。这不但偏离了证据标准自身的真正意涵与功能定位,而且导致了“填鸭式”定罪等问题。因此,亟须对实践中证据标准的错误理解与适用进行纠偏,使其从事实的判准回归本来的意涵。
从标准设置的功能来看,证据标准只是对案件的单项证据与整体证据是否符合庭审要求作出的最低尺度要求。这实际上是为案件准入设置的一种最低尺度证据门槛,其只能确保案件证据符合庭审事实认定的基本要求,但不能保证案件证据足以作出结论性的判断(即次级决定),而后者正是证据充分标准旨在实现的目标。在此意义上,现行《中华人民共和国刑事诉讼法》(2018年修订)第176条规定的提起公诉标准“证据确实、充分”,其实并非证据标准,更非证明标准,而是一种“分量”标准,而只是检控官关于法官能否基于当前证据作出案件事实认定结论的判断,属于上述所说的次级决定标准,而非主要决定标准。
证据标准能够实现在证据能力(相关性、真实性、合法性)和要件事实推论链条完整性方面符合庭审要求的案件证据进入法庭,并禁止促进和谐性的证据为事实认定者所接触。但是,其并不能促进更多有证明价值的证据提交于法庭,为裁判者作出最终的事实认定打牢决策的基础。该功能的实现,依赖于证据充分标准。在中国,证据充分标准是通过控方在审判中所承担的证明责任向审前的延伸性功能来得以体现的,并由此有效弥补了证据标准在此方面的不足。也就是说,在审前证据审查程序中存在两种标准,一种是审判对案件证据的最低尺度要求,即证据标准;另一种是控方为了履行证明责任而所需满足的证据充分标准(分量标准),这是一种次级决定标准,不能将其与事实认定的证明标准相混淆。需要强调的是,此种证据审查程序不涉及实体案件事实的认定事项,否则有将审判前移与虚置之嫌。
国外有学者很早就对证据充分进行专门研究,提出了一种称作“凯恩斯分量”的理论与方法来描述和解决该问题。20世纪20年代,美国学者凯恩斯(Keynes)在其《关于概率的论述》一书中,率先提出了证据的“分量”(weight)概念,指出当在论证中增加了相关的新证据时,无论该证据是支持还是削弱该论证,其对作出结论而言都是一个更加丰富的基础,这种新证据的加入所导致的变化可以用论证的分量得到增加来表达[28]。南斯(Nance)对凯恩斯分量作了进一步研究,并指出凯恩斯分量具有两方面的意涵:一是数量上的凯恩斯分量,即凯恩斯分量的改善是由于获得更多数量的相关证据(如用100次取代10次)来实现的;二是质量上的凯恩斯分量,即凯恩斯分量的改善是因为获得了在质量上更好的证据(如以10次机械抛掷来取代10次人工抛掷)[29]。
基于凯恩斯分量理论,南斯将不确定性下的事实认定区分为“主要决定”和“次级决定”两种类型。主要决定是关于最终结论的决定,其涉及一种被南斯称为“区分力量”的判断,在司法事实认定语境中即证明标准问题;次级决定是“关于决定的决定”,即决定是否根据可获得的证据信息来决定预期的命题,或者选择推迟该“主要决定”,直至获取到与足以作出决定的相关额外信息。此种“次级决定”的判断,取决于凯恩斯分量是否足以保证“主要决定”的作出。因此,在决策过程中,应该将对于凯恩斯分量的“充分性”判断置于优先性地位。
至于这种关于凯恩斯分量判断之“次级决定”的判断标准是什么,南斯也作了具体论述,指出在凯恩斯分量上的缺乏程度,实际上是决策者选择的结果。即,认为凯恩斯分量应该更高或者增加,就是在预设凯恩斯分量能够被增加或者至少应该已经被增加。但是,他同时也强调,这种增加受到来自3个方面因素的制约:一是获取额外信息(证据)的成本;二是在获取额外的信息(证据)上有多少调查被保证,还取决于决策的利害关系;三是关于决策的额外证据获得之限制,还与所考虑的证据可能对决策产生的预期影响有关。
南斯关于凯恩斯分量的论述,旨在构建一种整体证据层面的“实践优化”机制,以实现事实认定的“牢固性”证据基础。在他看来,凯恩斯分量的审查判断由作为守门人的法官负责,而不属于事实认定者的决定事项。法官管控凯恩斯分量,并使用可获得的工具去确保由当事人所提出证据之分量是实践最优的状态;而陪审团负责评估区分力量,并基于适当的标准进行检验。综上可知,作为中国立法层面对案件证据的一种规范性要求,证据充分性实际上是关于凯恩斯分量的审查判断,即属于一种次级决定标准,并非在主要决定层面关于案件事实最终判断的证明标准,更不是案件准入层面的证据标准。证据充分是证据分量在质与量上的实践最优状态,其目的在于促进将现有条件下的最佳证据提交于法庭,使得裁判者在作出事实认定之时拥有牢固的证据基础[30]。
如上文所述,为响应中央号召,地方司法机关积极研发借助现代科技手段统一证据标准的办案系统,并取得了初步的成果。那么,这些智能辅助办案系统又是如何实现证据标准的数字化以及统一适用的?数字化证据标准又可能存在哪些潜在的风险?
通过对贵州、上海等地借助科技手段统一证据标准而研发的智能辅助办案系统的考察,得出数据化统一证据标准的实现,大致需要经过三步程序:一是制定统一的类案证据标准;二是对类案证据标准进行数据化建模;三是将数据化证据标准模型嵌入公检法三机关共享的计算机系统,真正实现侦查、审查起诉、审判三个阶段的统一适用。下文主要对前两步程序原理进行阐述:
1. 制定统一的类案证据标准
如上文所述,证据分布理论表明,同类案件的证据分布具有一定的规律性。这就为类案证据标准的制定提供了理论依据,而制定类案证据标准正是数据化统一证据标准的前提。至于如何具体制定类案的证据标准,实践中基本上是采取“大数据提取+人工筛选”的方式来进行编制。例如,贵州省高院引入专业大数据分析团队,对全省三级法院历年办理的大量同类案件之证据进行分析,提炼出故意杀人、故意伤害案件,抢劫、抢夺、盗窃案件以及毒品案件这三大类常见多发案件应当收集的证据种类与形式,取证、固定、保存的方式以及相关过程证据等②。上海高院则根据本地区常见多发、重大、新类型刑事案件历年办案经验,分别成立了命案组、盗窃罪组、电信网络诈骗组以及非法吸收公众存款组,专门对近5年办理过的4种类型案件具体证据进行提取,然后按照8种法定证据种类进行归类,并明确各种证据的收集程序、形式要件、内容要素和不可采情形,最后形成了命案、盗窃、电信诈骗和非法集资等案件的基本证据标准。
不过,从内容上来看,地方司法机关制定的这些所谓“证据标准”,实际上已经属于必须满足裁判者认定犯罪事实所需的充分证据,而不再是一种最低尺度的证据准入标准。其对证据的收集程序、形式要件以及内容要素等作出了事无巨细的规定,既缺乏逻辑结构的层次性,也有违标准的抽象性与精炼性。证据标准是对类案证据的一般共性进行一定程度的抽象与精炼表达,而非琐碎的证据种类和形式的逐一列举[1]200。此外,这种过分追求类案证据外在种类、形式及数量俱全的僵化做法,还可能导向法定证据主义,从而引发许多潜在的法律风险。
2. 类案证据标准的数据化建模
在制定统一的类案证据标准的基础上,还需将其转化为计算机系统能够识别和处理的内容,这就涉及证据标准的数据化建模。所谓数据化,是指一种把现象转变为可制表分析的量化形式过程[31]。证据标准的数据化,则是将其转化为由一系列符号逻辑表示的计算机系统可以识别、运算和推理的数据体系。数据化之后的证据标准以计算机系统能够识别的符号、关系和规则表达式作为外在形式,但是其内在语义仍然是司法语境下的证据规则体系。因此,该过程需要以运用为目标进行特定领域建模,即把已经制定好的类案证据标准映射至相应的逻辑数学模型中[32]。
为了形成可以嵌入计算机系统的模型及标准化知识库,需要事先对类案证据标准体系进行结构化。通用的建模技术一般采取自顶向下分析法、自底向上分析法或图谱分析法等。中国地方司法机关在对类案证据标准进行数据化建模的过程中,大多采用的是自底向上分析法。以上海高院的206系统为例,其在构建命案证据标准模型时,对2012—2016年上海各基层法院审理的591件命案进行分析,最后归纳总结出7个环节、13项查证事项、30种证据材料和235项证据校验标准[33]。然而,根据此种建模方式得出的证据标准模型在结构层次上仍不够清楚,难以反映同类案件中要件事实的构成及其推论链条完整性对证据的基本要求,更无法体现证据与证据、证据与要件事实之间的逻辑关系。
而在此方面,图谱分析法则不仅能够提供契合于计算机系统的数据化证据标准模型,而且还可以将证据要素之间的关系与结构层次通过图示的方式清晰地表达出来。知识图谱(Knowledge Graph)是2012年 谷歌公司提出的概念,被运用于Web搜索引擎,能够以图形的方式向用户反馈结构化的知识,快速实现对知识的准确定位和深度获取。知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体1-关系-实体2”三元组,以及实体及其相关属性-值对,实体间通过关系相互连接,构成网状的知识结构[34]。知识图谱的架构按照自身逻辑结构可划分为数据层和模式层:数据层是存储在图谱数据库中的所有数据以事实(三元组是事实的基本表达方式)为单位构成的庞大实体关系网络;模式层位于数据层之上,是知识图谱的核心,其存储的是经过提炼后的知识,通过本体库来对其进行管理,并借助本体库对公理、规则和约束条件的支持能力来规范实体、关系以及实体的类型和属性等对象之间的联系。
证据发现图示的开发,单项证据准入标准以及要件事实完整推论链条结构示意图的提出,使得自顶向下知识图谱被运用于类案证据标准的数据化建模成为可能。所谓自顶向下,即指从结构化的数据源中学习本体,得到术语、顶层概念、同义和层次关系以及相关规则,然后进行实体学习,将实体纳入本体的概念体系中的过程;自底向上的过程则正好与此相反,是从归纳实体开始,对实体进行进一步的抽象,逐步形成分层的概念体系。证据标准图谱自顶向下的构建过程如图3所示。
图3 证据标准图谱自顶向下的构建过程
1. 诱发法定证据主义倾向
法定证据是盛行于欧洲中世纪时期的一种证据制度,因其过分强调以证据的形式、数量定罪,导致刑讯的滥用并违背了诉讼认识规律,启蒙运动之后逐渐退出历史舞台。法定证据最大的缺陷在于,其以法定的方式将具有不同证据的不同证明价值加以绝对化,强行要求法官无视案件具体状况对证据进行机械、划一的评价。在该制度下,事实裁判者对案件证据的评价和事实认定都没有自由可言,只能机械地遵照法律规定的证据价值等级和定罪需要的证据数量进行裁判。每一种证据的证明价值都是由法律明文规定的,法官没有评判的自由,也不能根据其内心确信和良知意识作出认定[35]。
作为一种最低尺度的证据准入门槛,证据标准并不涉及案件事实认定事项。尽管其也对证据的种类与形式有着一定的要求,但只是关于证据能力、要件事实推论链条完整性等方面的规定,所以一般不会导致法定证据主义。然而,在中国当下司法实践中,却把证据标准制定成了证据充分标准,并将之作为认定案件事实的判断标准(证明标准),从而与法定证据主义产生了联系。在实务部门对证明标准不作主客观区分,特别是中国长期持客观化证明标准的语境下,证据标准可能会被潜在地等同于证明标准[5]96。当证据标准变成了裁判者认定案件事实对证据的充分性要求之后,在侦查、审查起诉以及审判三阶段进行统一适用,就容易导致法定证据主义倾向。从侦查阶段开始就直接对标审判,只要案件符合此种证据充分性要求,就意味着进入审判之后必然定罪判刑;而一旦案件证据在种类、形式或数量的某些方面不符合该种充分性标准,那么其就可能过早地止步于侦查阶段。显然,这与法定证据主义机械且僵化的全有或全无适用相当近似。有学者也注意到了这一点,指出“证据标准的推进不可避免地会加剧法定主义倾向,同时过分精细化的标准也会导致证明标准的客观化,对自由心证造成侵蚀”[4]87。
2. 单项证据准入标准的自动校检难题
单项证据准入标准包括证据相关性、真实性、合法性以及促进和谐性四大要素的审查判断。其中,合法性判断涉及取证主体合法、取证手段合法、取证程序合法、取证对象合法和证据表现形式合法5个方面的审查。一般而言,对于证据合法性的判断,将会转化为类似三方诉讼构造下的程序(违法)性事实评价过程,需要裁判者结合相应的程序性证明规则与证明标准,综合考虑违法性程度与后果等因素,才能得出准确且适当的结论[36]。而在此方面,目前仍停留在对于证据外在表现形式与静态信息识别提取的证据标准模型,显然还难以实现此种动态化的程序违法性事实评价。未来,基于“深度神经网络模型”等人工智能技术对海量案件数据的深度学习与训练,可能有助于解决该难题。
此外,对于单项证据准入标准中促进和谐性证据的判断,目前的数据化证据标准模型也存在一定问题。尽管上文列出了作证特免权、事后补救措施、和解及提议和解、撤销的自认或有罪答辩以及支付医疗费或类似费用5个事项,但促进和谐性证据实际上是一个开放性的概念,需要审查者结合案件的具体语境作出判断。然而,现行证据标准模型还属于一种趋向于封闭式的计算机系统,难以承载此种开放式术语的完全校检。一个退而求其次的解决办法是,辅以人工审查。当然,中国现行的类案证据标准模型,并未加入促进和谐性证据禁止准入这一要素,因此,应该只是作为未来证据标准模型的改进事项之一。
3. 现有技术缺陷导致的系统困境
证据标准数据化统一系统的运行原理,实际上是基于本体学习过程在计算机系统中生成类案证据标准本体知识库,然后通过实体学习过程对案件证据信息进行识别抽取、加工融合,再运用实体链接技术将这些处理后的证据实体链接到证据标准本体知识库中相应位置,最后输出符合本体知识库的“产品”。在本体学习阶段,由于目前的证据标准数据化建模主要是采取“大数据提取+人工筛选”的方式,因此难以构建出具有层次性开放结构的类案证据标准模型。如上文所述,证据发现图示、单项证据准入标准与整体层面要件事实完整推论链条结构框架的提出,能够直接映射到计算机系统之中生成数据化证据标准模型,有助于该问题的解决。
在实体识别阶段,挑战接踵而至。该阶段可分为命题抽取和知识融合加工环节。命题抽取主要包括实体抽取、关系抽取和属性抽取3项内容。目前已经开发的相应算法主要有:在实体抽取领域的人工预定义实体分类体系和面向开放域的实体抽取和分类技术等;在关系抽取领域基于自监督学习方式的开放信息抽取原型系统;在属性抽取领域基于规则和启发式算法的属性抽取算法等。对于这些算法能否从案件信息文本中有效抽取证据标准所需的全部命题,目前是合理存疑的。尤其在对构成要件事实完整推论链条的要件证据、概括及其附属证据的抽取方面,除了依赖实体法构成要件相关性逻辑之外,还涉及社会知识库(有些甚至取决于个人背景知识)等内容,这就对上述广义算法提出了挑战。
退一步而言,就算现有算法真的能够提取到全部的命题,而对其进行融合加工以实现符合证据标准本体知识库的各项要素,也十分困难。在知识融合加工环节,主要是通过实体消歧、共指消解和知识合并等技术获得无歧义的精炼表达命题。目前采用的方法主要有聚类法和自然语义分析等技术。聚类法即通过计算指称项与实体对象之间的相似度,将所有指向目标实体对象的指称项聚集到该对象之上;而自然语义分析是指,基于自然语言的句法分析、语义分析及语义背景分析技术,将表述不同但语义相同的多个指称项归类到同一实体对象上来。相似度计算容易产生偏差,尤其是对非数据化的案件文本信息而言更容易出错。此外,对同一个证据要素术语来说,可能存在无数种非规范性表达,这也进一步加剧了共指消解的困难。在此方面,构建标准化的证据要素数据库,并对案件文本信息进行规范化表述,是一种可行的解决思路。
注释:
① “三项规程”指《人民法院办理刑事案件庭前会议规程(试行)》《人民法院办理刑事案件第一审普通程序法庭调查规程(试行)》和《人民法院办理刑事案件排除非法证据规程(试行)》。
② 参见:2016年贵州省高院、省检察院、公安厅联合发布的《刑事案件基本证据要求》(黔高法〔2016〕47号)。