文 姬
(湖南大学法学院,湖南长沙410082)
再犯危险性评估也就是我们通常所说的“再犯可能性评估”。在评估再犯危险性的时候,我们将初犯可能性变形为一种“基率”,①参见文姬:《危险性评估的证据资格》,载《刑事法评论》(2011年,总第28卷)第271页。作为评估再犯可能性的因素之一。基率证据能够被法庭所采纳的原因,也就是再犯危险性评估能够被应用的逻辑推理,本文将通过贝叶斯定理来解析这一问题。
基率,通俗的说,就是具有某种属性的个体,在总体中所占的百分比。本文试从下面的出租车撞人的案例来解析基率的基本含义。
丹尼尔·卡尔曼(Daniel Kahneman)②Daniel Kahneman凭借《不确定状况下的判断:启发式和偏差》获得2002年诺贝尔经济学奖。其突出贡献在于“把心理学成果与经济学研究有效结合,从而解释了人类在不确定条件下如何进行判断”。提到过这样的案例:某晚上,一辆出租车撞人并逃逸。该城市只有两家出租车公司,车的颜色一家是蓝色,一家是绿色。假设第一种情况,知道的信息是:(1)该城市中85%的出租车是绿色,15%是蓝色;(2)目击者确认是蓝色,实验证明目击者的准确率是0.8。求撞人的出租车是蓝色的概率;假设第二种情况,知道的信息是:(1)两家出租车公司规模相等,但是通过事故调查,得知85%的事故是绿色的出租车制造的,15%是蓝色车制造的;(2)目击者确认是蓝色,实验证明目击者的准确率是0.8。求撞人的出租车是蓝色的概率。丹尼尔·卡尔曼给出这两种情况,事故车是蓝色的概率 E 都等于 P×T/(P×T+(1-P)×F),③这是贝叶斯公式的一种形式,其中P是基准概率(也叫基率或者先验概率),T是目击者认人的准确率,F是目击者认人的错误率,E被叫做后验概率(也就是事故车是蓝色的概率)。即0.15×0.8/(0.15×0.8+0.85×0.2),最终结果等于 0.41。④参见[美]Daniel Kahneman、Paul Slovic、Amos Tversky:《不确定状况下的判断:启发式和偏差》,方文等译,中国人民大学出版社2008年版,第166页。
在上面这个案子中,第一种情况是以蓝色车在全部车中所占比率作为基率P,第二种情况是以蓝色车在事故车中分布的比率作为基率P。为什么基率可以是两种不同的比率呢?
对于第二种情况,比较容易理解。事故发生后,事故车是一个总体空间,事故车又可以分为蓝色车与绿色车(也可以表述为,蓝色车和绿色车是事故车的完备事件组),我们需要的信息是蓝色车在事故车中所占的比率。所以,在第二种情况下,蓝色车在事故车中的比率才可以作为整个空间(事故车)的一个基准概率(也就是基率)。在增加一个与颜色有关的信息的情况后(例如某人目睹蓝色的车发生事故,或者得知蓝色车在事故发生的时间和地点上经过的比率等),根据上述贝叶斯公式,我们可以得到事故车是蓝色的概率。
对于第一种情况,基率可以设定为蓝色车在所有出租车中的所占的比率,是因为,贝叶斯统计学有这样一个假设前提:所有的出租车都有可能发生事故。在不知道事故的分布概率的情况下,假设各辆车发生事故的概率相同(随机分布的假设),这样,空间的总体可以从事故车扩张到所有的出租车。
丹尼尔·卡尔曼将蓝色车在事故车中的比率叫做原因基率,而将蓝色车在所有车中的比率叫做偶然基率。一个基率如果暗示着一种因果因素,它能解释为什么某特定情况比其他情况更容易导致某种结果,那么这个基率就被称为原因基率。而一个被称为偶然基率的基率,则无法导致这样的因果推断。①参见[美]Daniel Kahneman、Paul Slovic、Amos Tversky:《不确定状况下的判断:启发式和偏差》,方文等译,中国人民大学出版社2008年版,第164页。
对基率的不同理解,正是经典统计学和贝叶斯统计学的主要分歧之一。在经典统计学中,把样本看成是来自一定概率分布的总体,而总体中的参数是普通的未知变量,也就是一个未知常数。所以在上面的例子中,蓝色车在事故车(总体)中的比率是一个常数,对于这个常数,我们只能够根据总体信息和样本信息对这一个常数进行估计(也就是参数估计),我们可以主观的规定参数估计的置信水平(也叫显著性水平,一般是选择95%或者99%,但是为什么选择这两个数,也是一种主观经验),但是不能够一开始就对这个总体参数进行主观的估计(也就是根据历史经验主观设定先验概率或者基率)。就上面的案例来说,经典统计学认为,如果不知道蓝色车在事故车中的比率,那么只能够通过无数次抽样的方法或者收集所有事故记录的方法来确定这一比率,而不能假设每辆车的事故率相同,从而将基率设定为蓝色车在所有车中的比率。而贝叶斯统计则把任何一个未知参数看作随机变量,都具有不确定性,并且这个未知参数服从一个概率分布,根据历史经验或者其他可以得到的信息,可以得到这个未知参数的一个先验概率(基率),而在进一步的统计推断中,只需要利用新的样本信息(或者说相关事件),在先验概率的基础上,推断出这一参数的后验概率。所以,在上面的例子中,在不知道事故的分布的情况下,假设各辆车发生事故的概率相同(随机分布的假设),从而将总体空间的从事故车扩张到所有的出租车,是贝叶斯统计的典型思维。经典统计学派攻击贝叶斯学派很重要的一点就是贝叶斯统计中先验分布选择的主观性。但是,有研究表明:在贝叶斯检验中,先验信息的变化引起拒绝域的变化,相当于经典统计检验中选择不同的显著性水平。因此,两者都有主观性,在贝叶斯统计中,可以通过对参数进行设置,使得其拒绝域和经典统计中的拒绝域具有相同的形式。②参见谢俊:《贝叶斯统计方法与传统统计方法的比较与展望》,载《中国商界》2009年第4期。可见,不管是何种方式对参数进行估计,在不确定状况下,主观性都是难以避免的。所以,总的来说,对基率进行主观估计并不是“不可原谅的错误”,而是一种“不可避免的无奈”。正如贝叶斯学派所回答的那样:“几乎没有什么统计分析哪怕只是近似地是‘客观的’,因为只有在具有所研究的问题的全部总体数据时,才会得到明显的‘客观性’……但是大多数统计研究都不会如此幸运……。”古德说得更直接:“主观主义者直述他的判断,而客观主义者以假设来掩盖其判断,并以此享受着客观性的荣耀”。③刘乐平、袁卫:《现代贝叶斯分析与现代统计推断》,载《经济理论与经济管理》2004年第6期。
就上面的案例来说,原因基率显然比偶然基率要更接近于我们需要的信息,但是,在没有原因基率的信息下,偶然基率也是对后验概率的一种影响因素。所以,不管是原因基率还是偶然基率,在对不确定情况进行判断时,基率的充分利用也就是信息的充分利用。在信息比较充足(样本量比较大)的情况下,基率信息的利用可能起到的作用不大,但是在信息不是很充足(样本量不大)的情况下,基率信息的利用就显得十分重要了。总的来说,经典统计和贝叶斯统计并非对立的,而是相互补充的,正如当代杰出的贝叶斯统计学家O’Hagan指出:“劝说某人不加思考地利用贝叶斯方法并不符合贝叶斯统计的初衷。……如果存在只有贝叶斯计算方法才能处理的很强的先验信息或者更复杂的数据结构,这时……能够热情地推荐贝叶斯方法。另一方面,如果有大量的数据和相对较弱的先验信息,而且一目了然的数据结果能导致已知合适的经典方法,则没有理由去过分强调贝叶斯方法。”①刘乐平、袁卫:《现代贝叶斯分析与现代统计推断》,载《经济理论与经济管理》2004年第6期。就上面的案例来说,也就是说当原因基率存在或者很容易得到的时候,我们显然没有必要利用偶然基率了。
不管经典统计和贝叶斯统计如何不同,他们都没有否认基率数据的运用价值。但是针对上面的案例,有人会提出,在没有原因基率的情况下,直接运用目击者0.8的准确率进行判断就可以了,没有必要考虑偶然基率。也就是说,他们认为上面案例中撞人的出租车是蓝色的概率就是0.8。这种观点是典型的忽略基率的“代表性启发式偏差”。从统计学的角度看,也就是对信息的一种浪费。这里固然可以看成是一种的基率的忽略,但是从贝叶斯公式来看,只考虑目击者的准确率得到的结果,和假设事故在蓝色车和绿色车中均匀分布(也就是说先验概率是0.5)的结果是一样的。②当基率是0.5 时,利用贝叶斯公式得到的事故车是蓝色的概率都是0.5 ×0.8/(0.5 ×0.8+0.5 ×0.2),结果是0.8。所以当事故车的先验分布和出租车的先验分布都不知道的时候,这种假设的均匀分布也可以当成一种估计的先验分布信息来使用。
尽管从经典统计和贝叶斯统计的角度来看,基率信息的充分利用有助于我们的决策,但是,丹尼尔·卡尔曼却指出,人们往往在很多问题上却看不到基率的作用或者低估基率的作用,而只有在以下三类案件中注意到基率的作用。
第一种就是当没有样本信息的时候,人们往往能够认识到基率的作用。例如,在乙肝的检测实验中,如果没有检查呈阳性的信息,那么,他会估计自己患有乙肝的概率就是乙肝的流行率,即10%。
第二种是当基率以频率的形式,而非条件概率的方式出现时,人们更倾向于使用基率。例如,在讨论诸如投硬币、扔骰子、抽奖等重复多次实验的时候。这样的基率容易被认识到的原因,主要是这种情况下所讨论的问题具有明显的统计结构,也就是说这个问题具有一个清楚的抽样空间,一个清楚的抽样过程和重复性。③参见 Jonathan J.Koehler,When Do Courts Think Base Rate Statistics Are Relevant?Jurimetrics Journal,2002(42).p.394.特别是重复性,它给人们很强的具有关联性的直觉。
第三种就是当基率利用的参照集合(reference class)④这里的参照集合也就是基率中总体空间的选择,例如出租车案例中的事故车就是我们所说的原因基率的参照集合,而全体出租车就是偶然基率的参照集合。的属性与需要考察的属性十分接近的时候,人们比较容易利用基率。上面关于出租车的例子就是如此,事故车这一总体的典型属性就是我们要考察的车子出事故的属性,而出租车这一总体并不包含车子出事故之一属性,所以人们更容易接受蓝色车在事故车中的比率作为基率,而不太容易接受蓝色车在出租车中的比率作为基率。
但是,在实际的判例中,以上三种基率也并不是都会被接受。
在美国的判例中,既存在法庭采纳基率的例子,也有拒绝基率使用的例子。而支持使用基率信息的例子基本上也属于以上所描述的三种情况。
第一种类型是当几乎没有样本信息,只有基率信息的情况下的判例。在Kaminsky v.Hertz案中,Michigan上诉法院根据基率证据,判Hertz公司赔偿被汽车撞伤的原告。案件中唯一没有异议的证据就是撞伤原告的汽车有一个Hertz图标。另外,原告还提出另外一个基率证据,那就是在有Hertz图标的汽车中Hertz公司拥有90%的比率。上诉法院认为这一基率证据不仅具有相关性,而且为辩方提供了一个可以反驳的推定,从而使辩方通过答辩来结束简易程序。但是,在Guenther v.Armstrong Rubber Company案中,联邦上诉法院认为Sears商店出售的轮胎75-80%是来自于Armstrong Rubber公司的基率证言,并不能够证明伤害原告的轮胎就是来自于Armstrong Rubber公司。联邦法院总结说,建立在“无保证统计证据”上的判断“充其量只是一种猜测”而已。这两个案子都是简易程序的案子,并且都发现在几乎没有样本信息,只有基率信息的情况下,但是两个案子的判决却截然相反。当然,他们的唯一值得一提的区别就是基率的大小稍微不同,前者是90%,而后者是75-80%。
在几乎没有样本信息,只有基率信息的情况下的案件中,有两类案子中一般都利用基率信息:一类是预期收入的损失赔偿案子,一类是集体诉讼中的市场份额责任的案子,前者如Contemporary Mission Inc.v.Famous Music Corp.和 Wilson v.B.F.Goodrich Co,后者如 Sindell v.Abbott Labs.和 Mullen v.Armstrong World Industries等。①参见谢远杨:《论侵害人不明的大规模产品侵权责任:以市场份额责任为中心》,载《法律科学(西北政法大学学报)》2010年第1期;鲁晓明:《论美国法中市场份额责任理论及其在我国的应用》,载《法商研究》2009年第3期。在预期收入的损失赔偿案子中,法院不仅认为类似原告的参照集合的基率证据是相关的,并且基率证据还不需要太精确。特别是在Wilson v.B.F.Goodrich Co一案中,因为原告是没有工作经历的年轻人,所以法院要求参照集合不要太专门化,按照最一般群体的基率来确定反而会更好些。②参见 Jonathan J.Koehler:《When Do Courts Think Base Rate Statistics Are Relevant》,Jurimetrics Journal,2002(42).p.398。而市场份额责任在美国已经是十分成熟的制度,虽然有一些关于参照集合的专门化的争论,但是对其中基率的采用已经没有什么疑问。当然,市场份额责任的适用也是受到严格限制的。
第二种是当基率以频率的形式出现,案件具有明显的统计结构的判例。这种案例主要涉及到随机匹配率(random match probabilities)③如涉及到DNA、指纹等的案子。案例可以参见Michael O.Finkelstein、Bruce Levin:《律师统计学》,钟卫译,中国人民大学出版社2008年版,第87页。、被怀疑的死亡调查④如类似Wood案的案件。一般是用基率来反驳被告的“意外死亡”、“巧合”等辩护。Paul Woods死亡时仅仅8个月,他死于发绀。Woods家是收养他的第二个地方。但是,他在最初被收养时,并未患上任何呼吸系统疾病。而当Paul在Woods家开始出现这类症状时,有几家医院曾对他进行治疗。在住院期间,Paul从未出现过持续发绀的症状。当Paul死亡时,内科医生无法确定其死因。然而,一名法医病理学家Dr.Vincent DiMaio却怀疑Paul死于窒息。他作为专家证人在证人席上声称,自己相信Paul死于窒息的可能性为75%,死于某种未知疾病的可能性是25%。他指出法庭现有的证据并不能排除Paul死于谋杀的合理怀疑,并且控方还有另一证据支持Dr.Vincent DiMaio。控方指出,在过去的25年中,被告Martha曾照料过许多儿童,有9个孩子至少20次出现发绀症状,其中7个孩子已经死亡。而且,与Paul案相似之处在于,这些孩子在离开Martha而呆在住院期间,均未出现呼吸系统的问题,并且,对于这些孩子的死亡,主治医生都不能确定这些孩子们的死亡的确切原因。这20个以外的指控行为相似的事实证据使得陪审团认定Martha有罪,而且上诉法院也确定了这一定罪。Woods案其实来源于英国的Rex v.Smith案,也叫“浴室新娘案”。被告George Smith与一位名为Bessie Mundya的女子举行了婚礼,她从其父亲处继承了一大笔遗产。Bessie后来被发现溺死于浴缸中。被告宣称她的死是意外事件,与自己没有关系。但是控方指出,被告在此之前曾与其他两名妇女结婚,而她们“也被发现溺死在与被告居住的浴缸中”。一审、二审都采信了这一证据。、测试舞弊调查⑤参见Michael O.Finkelstein Bruce Levin:《律师统计学》,钟卫译,中国人民大学出版社2008年版,第100页。一般也是用基率来反驳“巧合”的辩护。等。这一类案件只要基率特别高或者基率特别低,法庭一般都会采用。
第三种是基率利用的参照集合(reference class)的属性与需要考察的属性十分接近的判例,也就是基率的参照集合专门化的判例。在State v.Sage案中Ohio上诉法院允许多重枪伤自杀的基率(0.4%)来反驳被告关于死者的枪伤是来自于自杀。这里的参照集合对于要证明的属性来说十分狭窄和专门化,虽然还存在比它更狭窄的参照集合(如死者死亡地区的多重枪伤死亡的集合),但是案件中提供的全美多重枪伤死亡的参照集合已经足够专门化,从而让法庭看到它的证明价值。在Kirk v.W.R.Ashcraft案中,New Mexico最高法院认为原告2年内出售的劣质圣诞树的基率证据与它是否提供给被告高比率的劣质圣诞树有关。这里的参照集合是包括“出售劣质圣诞树”这一属性的被告自己以往的行为的集合。当然,对参照集合专门化的要求主要看我们所关心的属性是否被其所包含,而不是刻意的追求过分的专门化。如果是那样,任何参照集合最终专门化的结果就是只能包括被告这一个案件(或者被告一个人),因为要与所证明的属性完全相同的案件(或者个人),只能是被告一个了。
在State v.Davis案中,New Jersey最高法庭对于基率的运用应该是最前沿的。被告提供了“与自己同样情况下”的其他人在无期徒刑服刑期间的再犯基率(也就是再犯危险性的精算方法或者SPJ方法的危险性评估得到的再犯基率)作为辩护理由。但是,不同的法院对于这一基率的证据效力有着不同的看法。初审法院认为:“Davis提供的这一基率并没有告诉我们关于Davis本人的任何事情”,从而拒绝了这一请求。但是上诉法院肯定了再犯基率的相关性,并且最高法院明确声明“这一证据具有相关性和可采性”。当然,对于运用再犯危险性评估得到的再犯基率,在美国也有很大一部分法官对此持反对意见。①参见 Jonathan J.Koehler:《When Do Courts Think Base Rate Statistics Are Relevant?》Jurimetrics Journal,2002(42).p.380。
法庭在是否采用基率的态度上是矛盾的,基率的采用受到道德原则、具体政策、证明标准和各种情景因素的影响。正如我国有学者针对“美国法庭对‘专家证言’的前后矛盾的态度”所言:“产生这些矛盾,除了没有对科学证据(包括基率)的清楚认识外,最为根本的问题是科学与法律之间的矛盾,如科学真实与法律真实之间的矛盾、科学真理的非终极性与审判的效率性与判决的终局性之间的矛盾、科学真理的不确定性与法庭审判的确定性之间的矛盾、科学的普遍性与司法审判的特定性之间的矛盾、科学的创新与进步和法律的保守性之间的矛盾等等。”②梁慧莹:《刑事诉讼中的科学证据问题研究》,中国政法大学2009年硕士论文,第23页。虽然存在上面所说的矛盾,但是合理的运用科学证据(包括基率)仍然是证据法学需要研究的问题。本文虽然不能够体系性的总结出应该如何利用基率证据,但是,还是可以找到一些运用基率证据的规律。除了上面所说的三点外,基率证据在下列情况下,比较容易被法庭所采纳。
第一,在基率特别大或者特别小的时候。这可以从上面的Kaminsky v.Hertz案和Guenther v.Armstrong Rubber Company案的对比,DNA鉴定和“指纹鉴定”对比,还有被怀疑的死亡调查、测试舞弊调查等案例中都可以看出。从贝叶斯公式来看,如果基率极端一点,那么得出的后验概率(事故车是蓝色车的概率或者某人犯罪的概率)也就大些。例如,DNA的随机匹配率一般都低于0.0000001,那么,根据贝叶斯公式得出的后验概率就等于99.9999%。也就是说DNA匹配,说明凶手99.99%是提供DNA的这个人。又例如,在一个刑事案件中,假设只有唯一的证据,就是目击证人A宣称在500米远的地方亲眼目睹了甲实施了杀害乙的过程。另外,还有两个资料是:(1)根据实验得知:A在500米的地方认人的准确率是0.8;(2)根据暴力危险性量表HCR-20,甲所属人群的暴力犯罪率是0.5。那么,乙是甲杀害的概率是多少?根据贝叶斯公式,我们可以得到,后验概率(也就是乙是甲杀害的概率)E等于0.8。当条件(2)改为“根据暴力危险性量表HCR-20,甲所属人群的暴力犯罪率是0.9”时,乙是甲杀害的概率E等于0.973。当条件(2)改为“根据暴力危险性量表HCR-20,甲所属人群的暴力犯罪率是0.1”时,乙是甲杀害的概率E等于0.308。如果,我们将证明标准设定乙是甲杀害的概率必须大于等于0.95才能够定罪的话,那么,第一种情况和第三种情况都不能够被定罪,只有第二种情况才能够被定罪;反之,如果我们需要为犯罪嫌疑人洗脱嫌疑的话,那么,犯罪嫌疑人的犯罪可能性至少要小于0.5,第一种情况是不能够使犯罪嫌疑人得到无罪释放的,而第三种情况则可以。可见,高于90%的再犯危险性对后验犯罪率的影响还是比较大的,而10%的再犯基率完全可以帮被告人摆脱嫌疑。
第二,基率在民事案件中比较容易得到承认,而在刑事案件中不容易得到承认。这里存在几个原因:第一个原因,就是刑事案件的证明标准比民事案件高。刑法中要求达到“排除合理怀疑”的证明标准,而民法中只要求“盖然性”的证明标准;第二个原因,就是刑事案件中基率的适用,往往牵涉到对刑法的基本原则的讨论。例如,利用基率是否触犯到“无罪推定”的原则,利用基率是否涉及到“种族歧视”等等一系列的法理和道德问题。在这些问题没有得到充分讨论之前,法院是不敢枉然的适用基率的,以免遭到非议;第三,就是反驳“意外事件”和保护弱势群体的时候,法院倾向于采纳基率。反驳“意外事件”是基率作为一种概率在证明主观罪过上的一般作用。③参见文姬:《危险性评估的证据资格》,载《刑事法评论》(2011年,总第28卷)第280页。而对于保护弱势群体的时候能够被法庭广泛接受,是因为利用基率往往会给人有“不公正的偏见”的直觉,而如果是用这种“不公正的偏见”来“保护弱势群体”,法庭似乎找到了一个可以与之抗衡的一个价值指标,人们也比较容易容忍这种情况下的轻微偏见。
基率是把我们需要考察的对象看成是相关参照集合的一个抽样。如果这个抽样具有和参照集合相同的属性,那么,它就属于这个参照集合。如果对象不具有参照集合同样的属性,那么,它就不属于这一参照集合,而属于与参照集合相对应的补集。这里有三个关键词,即考察对象、参照集合和属性。
在法庭上需要考察的对象很多,有人类的某些特征,例如DNA和指纹、发绀和各种死亡原因、再次犯罪的危险性等,还有客观世界的物体或者事件,例如测谎仪器、轮胎、事故车、药物、圣诞树、考试、损失等等。而需要考察的属性是DNA、指纹的匹配,各种死亡原因的自然发病情况,再次犯罪的情况,测谎仪器的准确性,轮胎的缺陷,产品的质量,事故车的颜色和标志,药物的毒性、圣诞树的优劣,试卷的雷同,损失的平均数等等。有了上面的需要,我们现在唯一还需要的就是寻找一个适当的参照集合。在上面的案例中,我们选择了不具有血缘关系的DNA、正常的8个月大的婴儿、多重枪伤死亡的人、危险性评估得分相同的人、随机抽样的一部分测谎仪器、Sear商店出售的轮胎、A城所有出了事故的出租车、有Hertz图标的汽车、随机出售的圣诞树、随机抽取试卷、与原告相同职业的人等等。与之相对应的基率是:不具血缘关系的DNA的匹配率、正常的8个月大的婴儿发绀死亡的比率、多重枪伤死亡的人中自杀的比率、危险性评估得分相同的人中再次犯罪的比率、随机抽样的一部分测谎仪器中的准确率、Sear商店出售的轮胎中来自于被告公司的比率、A城所有出了事故的出租车中蓝色车的比率、有Hertz图标的汽车中来自于被告公司的比率、随机出售的圣诞树中劣质树的比率、随机抽取试卷中雷同的比率、与原告相同职业的人的平均损失等。
从逻辑推理来看,这些案例是没有区别的。它们都是将参照集合总体的属性当成样本的属性,他们的基率都是客观存在的。所以,既然其中的一些被认为具有相关性和证明价值,那么其它的应该也有,所不同的是属性的性质。所谓的“将总体的属性看成是样本的属性”,其实也就是这种属性的一种“推论”。虽然利用贝叶斯定理的推论比较理性,并且有客观的数据作为基础,但是,在刑法上有些东西是严格禁止推论的,如被告人的精神属性。主要原因是,在刑法的定罪活动中,客观主义一直强调的是,我们定罪活动的对象是“人类的行为”,而非“人类本身”,并且是“这次行为”,而非“某人的所有行为”。可见,客观主义是绝对不会允许对人的精神特性进行推论的。客观主义唯一允许的,就是根据人类的某些固有弱点,对“人”进行“出罪”。而这种意义上的“出罪”,也非真正的“出罪”。因为定罪的犯罪构成的核心永远是“行为”,即使根据“行为人”而出罪,但是从“行为”这一角度上,他还是犯罪了。①也就是说,这种出罪只是一种“有责性”的排除,而非“违法性”的排除。所以,如果刑事定罪的对象在法理上永远限定在犯罪人的“这次行为”上,而绝对排斥“人”这个概念,那么,在定罪程序中运用人的精神方面的基率就永远没有合理性。
上面案例的属性分别是DNA和指纹的匹配、各种死亡原因的自然发病情况、再次犯罪的情况、测谎仪器的准确性、轮胎的缺陷、产品的质量、事故车的颜色和标志、药物的毒性、圣诞树的优劣、试卷的雷同、损失的平均数等。而这些案例中,DNA和指纹的匹配、各种死亡原因的自然发病情况是人的生理属性、测谎仪器的准确性、轮胎的缺陷、产品的质量、事故车的颜色和标志、药物的毒性、圣诞树的优劣、试卷的雷同都是客观事物的物理属性。只有再次犯罪的情况是既包含人的生理层面又包含人的精神层面的属性,并且,它还是对审判的“最终结论”——是否犯罪的直接推论,所以在入罪程序中遭到反对。
对于人的生物属性的基率,法庭一般是予以采用的,但是,很多时候人们都没有意识到这一点,而错误地认为法庭采用了人的精神属性的基率。例如Woods案表面上看似乎是对被告的虐童品格进行推论,但是它实际上是对发绀死亡原因的推论;“浴室新娘案”表面上好像是对被告的暴力品格进行推论,但是实际上它是对溺死的基率进行推论;“圣诞树案”表面上看似对被告的欺骗品格进行推论,但是实际上是对劣质树比率的一种推论。这些推论都是对客观事物的物质属性进行推论,所以法庭准予采纳。但是,对于人的精神属性的推论,法庭并没有采纳为入罪的证据。
再犯危险性评估虽然被排除作为入罪的直接证据,但是其作为出罪证据却被广泛的接受。
刑法中的证明标准被表述为“排除合理怀疑”,与民事案件的“优势证据”的证明标准相比,“排除合理怀疑”显然要高得多。但是,对于“排除合理怀疑”到底对应着一个什么样的具体概率,不管是法院还是法学家都讳莫如深。形成这种情形的原因有很多,包括“用数字说明这一问题本身就是错误的”,“根据罪名的严重程度进行证明标准的调节”,“确保刑法制度口径的统一”等等。①参见[美]Ward Farnsworth:《高手,解决法律难题的31种思维技巧》,丁芝华译,法律出版社2009年版,第215-220页。但是,我们可以用再犯危险性评估的概率,来对特定人犯罪的概率进行估算。下面,本文通过一个假设性刑事案例比较说明。
在该案件中,假设只有唯一的证据,就是目击证人A宣称在500米远的地方亲眼目睹了甲实施了杀害乙的过程。另外,还有两个资料是:(1)根据实验得知:A在500米的地方认人的准确率是0.8;(2)根据暴力危险性量表HCR-20,甲所属人群的暴力犯罪率是0.5。乙是甲杀害的概率是多少?笔者将这种情况和条件(2)的甲所属人群的暴力犯罪率是0.95和0.1时作对比,得出3个后验概率(乙是甲杀害的概率)分别为0.8、0.973 和 0.308。
对于后验概率为0.308的情况来说,我们可以对乙进行出罪,而对乙直接出罪的理由源于罗克辛的预防必要性理论。罗克辛的责任原理不仅包括罪责,还包括预防的必要,两者构成的范畴的罪责称为“答责性”。他清楚的指出:“刑罚的目的只能是预防性的,亦即只能是为了防止将来的犯罪……刑罚还要有特殊预防和一般预防的目标。通过刑罚的安排,必须实现让被处罚者尽量不为再犯的目标,……同时,刑罚也要对公众产生作用,具体也就是,刑罚要能促进人民的法律意识,并且让他们注意到可罚举止的后果。”②[德]罗克辛:《刑事政策与刑法体系》,蔡桂生译,中国人民大学出版社2011年版,第76页。在罗克辛的责任体系中,预防的必要取代了一些责任阻却事由,成为排除责任的基本原则之一。但是,罗克辛并没有给出具体衡量预防必要的方法,而仅仅给出了“人性的弱点”、“良心”等抽象的衡量标准。那么,罗克辛所说的预防必要性的衡量标准是不是和我们所谈的再犯危险性评估中的再犯危险性衡量指标一致呢?根据我们的研究,再犯危险性的衡量包括行为人的违法历史、人格特征、药物滥用、人际环境等等主要因素。那么,罗克辛的预防必要的衡量因素是什么呢?
罗克辛指出:“我们的任务并非单纯的惩罚,而是必须预防,为了达到这一功能,在责任主义的前提下,犯罪人是否会再犯、事件发生的情景是否具有‘非常规的不可重复性’成为考察必要。例如,对于‘错误论’中的正当化前提事由认识错误,不能用行为理论、故意理论来解释,而应该回答‘按照刑法的任务,是否要将当事人作为故意犯罪人来处理?’……即所谓的各种错误论应该单独建立在刑罚目的理论的基础之上。……这种观点也同样适用于力图中的中止……就法官而言,该问题涉及的并不是刑罚免除;他们需决定的是,在中止的场合下到底还要不要施加刑罚。而实施了回撤的行为人的举止,到底需不需要加以制裁,则是一个纯正的刑罚问题。……人们从这些事例中得出这样的印象,即基于刑罚目的理论的刑事答责性的体系化工作,可以为一些长期争论的问题提供一个更为别样和更有前途的方案。”③[德]罗克辛:《刑事政策与刑法体系》,蔡桂生译,中国人民大学出版社2011年版,第43页。通过对“错误论”和“力图的中止”的讨论,他指出,对于特定的刑事政策上的问题,必须用责任理论来体系化,而所谓的“个人刑罚阻却事由、超法规刑罚免除事由”等理论,只会使得理论“碎片化”。虽然没有对预防必要性的标准进行更深一步的阐述,但是,从他的论述中我们可以发现,他将具有违法性和罪责的行为,但是出于纯粹的刑事政策考虑(而非一般的法政策的考虑)不需要动用刑罚的因素,包含在预防必要性的标准之中。
所谓的纯粹的刑事政策的因素,笔者认为不外乎有两个方面的原因:一是犯罪人本身的特殊情况能够引起人们的怜悯,或者没有动用刑罚威胁的必要;二是犯罪所发生的情景十分特殊,不太可能重现。当计算出来的后验概率(乙是甲杀害的概率)小于0.5时,④后验概率小于多少的时候可以认定为没有预防必要,其实也是一个社会容忍度,或者说刑事政策需要考虑的问题。我们这里取0.5,是因为,当我们不知道社会的整的治安情况和某种犯罪的犯罪率的情况下,我们认定每个人犯罪的概率为均匀分布,即为0.5。我们认定犯罪人不太可能再次犯罪,所以没有预防的必要。
虽然,在刑事入罪程序中排斥再犯危险性评估的运用,但是在量刑程序和行刑程序中,再犯危险性评估的运用得到了“允许”,至于被“允许”的根本理由,在于在量刑和行刑程序中“行为人”成为了考察的对象。当然,再犯危险性评估在量刑和行刑程序中被允许运用,还基于再犯危险性评估作为“基率”证据的一些特性。
在再犯危险性评估中,主要包括被告人三方面的内容:以往的错误行为或者定罪行为;触发被告人犯罪的环境因素或者抑制被告人犯罪的环境因素,例如社会交往和社会支持;被告人的认知能力和控制能力,以及自我调节的技巧等。根据被告人这些因素的情况,对被告人进行打分。然后再根据被告人的总分将其归入某类人群。这其实是一个多维分类的情况。我们将被告人看成是与他得分相同的人群中的一个抽样,也就是说,这里的参照集合就是危险性评估量表中得分相同的人群。因为被告人属于这一参照集合,所以被告人拥有这一参照集合的共同属性,即再犯危险性相同。其实,这里也可以这么理解,因为上面三类型的因素都是与被评估人是否再犯有关的因素,所以这一量表得出来的分数是反映被评估人的再犯危险性,而不是被评估人的营养状况、智力程度等,所以分数相同的人是具有相同的再犯危险性,而不是相同的营养状况或者智力程度。如果根据对参照集合总体的抽样估计,这一参照集合总体的再犯危险性是60%,那么,被告人的再犯危险性也是60%。
这一分类方式也是对参照集合专门化的结果。例如,甲被怀疑是一起性暴力犯罪的凶手,即使在没有任何直接证据的情况下,我们也可以根据在整个案件发生的月份的性暴力犯罪数除以案件发生的地区的总人口数,得出一个性暴力犯罪发生的基率,来估计甲犯罪这一案件的可能性。实际上,也就是我们把甲看成是这一地区的总人口的一个抽样。如果仅仅这么估计,我们就是将参照集合设定为案件发生的地区的总人口。这一参照集合显然过大,所以我们设法将它专门化:首先,我们利用“以前是否有过性暴力犯罪”这一属性将总人口分为两类。我们假设甲有过此类犯罪记录,那么甲就属于有过的参照集合A1,我们再计算这一参照集合的性暴力犯罪率,得出了参照集合总体的估计,作为甲的属性;其次,我们在将参照集合A1按照“是否存在触发被告犯性暴力犯罪的环境”这一属性进行分类,得到一个参照集合A2……依次类推,我们得到了最后的参照集合A。这就是再犯危险性评估的整个逻辑推理过程。
这里还需要澄清的是,再犯危险性评估的这些因素是对被告人性暴力危险性的评估或者其他具体危险性的评估。这种危险性,可以如上面所描述的对被评估者现在的性暴力犯罪可能性的估计,也可以是对他将来再次犯性暴力危险性的估计。这主要取决于我们的抽样过程。因为在刑事定罪程序中不允许使用这种分类方法,所以,在现有的再犯危险性评估中,选择的抽样过程都是与被告人具有相同分数的人这一参照集合在将来再次犯罪的危险性的概率。因此,从理论上来说,再犯危险性评估既可以对现在的危险性进行评估,也可以对将来的危险性进行评估,并不一定是将来的概念,只是实践中我们只运用来评估将来的危险性而已。
很多人都错误的将精算工具最后的结果解释为罪犯有60%的可能再犯,其实精算工具的最后结果表述的意思是,在这一分数的人群中,100个人中有60个人再犯,40个人没有再犯。罪犯有可能属于60个人中的一个,也可能属于40个人中的一个。通过对基率的解释,我们就更能够理解这意思了。其实,我们估计被告人的各种危险性,实际上也是试图将罪犯归入某个类别,是对犯罪人的一种分类方法,只不过它的分类指标是我们评估的各种因素指标经过我们的统计分析而形成的一个综合指标,即危险性。这一类别就是再犯率为60%的这一人群。罪犯拥有这一人群的共性,所以我们把他归入其中,而60%的再犯率也是这一人群的共性之一。在这一人群中,罪犯到底是归入60个再犯的子人群,还是归入40个没有再犯的子人群呢?我们只能说罪犯有60%的可能性会属于再犯的子人群,有40%的可能性会属于不再犯的子人群。这也是精算评估提供给决策者的最终极的信息。这一说法在概念量化问题上有一个比较成熟的名词,叫做模糊集合。
我们得出“罪犯有60%可能性属于再犯的子人群,有40%可能性属于不再犯的子人群”这样一个结论后,就可以重新解释贝叶斯公式①这里指的贝叶斯公式的形式为:P(G|E)/P(~G|E)=(P(E|G)/P(E|~G))×(P(G)/P(~G))。的含义了。因为被评估者60%属于犯罪(或者再犯)的子人群,40%属于没有犯罪(或者不会再犯)的子人群,所以贝叶斯公式中P(G)和P(~G)可以解释为被评估者的犯罪可能性(或者再犯可能性)和没有犯罪的可能性(或者不会再犯的可能性)。我们将P(G)/P(~G)记作O(G),代表被评估者的犯罪先验优势,那么P(E|G)/P(E|~G)就是证据E的似然比,把P(G|E)/P(~G|E)记作O(G|E),代表被评估者的犯罪后验优势。贝叶斯公式可以表述为:O(G|E)=(P(E|G)/P(E|~G))×O(G)。根据这一公式算出被评估者的犯罪后验优势后,我们就可以根据这一比率对被评估者进行量刑。假设某种刑罚的效用函数是U(d),②对于刑罚的效用国外也有研究,最近国内的经济学界出现了犯罪经济学这一研究方向,对此也有研究。那么U(d,G)表示某种刑罚对于犯罪者矫正的贡献,而U(d,~G)表示某种刑罚对没有犯罪的人的损害,那么,这种刑罚对于被评估者的总的效用函数就是:U(d)=U(d,G)×P(G|E)+U(d,~G)×P(~G|E)(以下称效用公式)。③Dennis V.Lindley,The philosophy of statistics,The Statistician,Vol.49.No.3(2000),p.317.其中P(G|E)是在各种证据下证明的被告人再犯可能性,P(~G|E)为各种证据下证明的被告人不再犯可能性。效用公式可以用于对被告人的量刑。它不仅考虑到了被告人的再犯可能性,也考虑到了被告人不会再犯的可能性,客观的体现了现实中的实际情况。效用公式也是量刑规范化的途径之一,并且因为考虑到了被告人不会再犯的情况,根据效用公式进行量刑,更加有利于对死刑的限制。
按照效用公式的思路进行量刑规范化,要考虑刑罚效应U(d)的最大化,就必须考虑不同的刑罚对不同人的效应,当然,这需要进一步的分类细化。而对于被告人再犯可能性的评估,已经有比较成熟的经验和量表工具,所以,按照效应公式的思路进行量刑规范化是可行的、科学的。
2010年我国最高人民法院印发了《人民法院量刑指导意见(试行)》(下文中简称为《意见》),对量刑的规范化进行了大胆的改革,确定了量刑起点、量刑基准、调节幅度等概念的确定方法,并规定了检察院的量刑建议权和法庭审理的量刑辩论阶段。《意见》的重要亮点是确定了量刑的“三步走”,即量刑起点确定、基准刑确定和宣告刑确定,他们分别对应基本犯罪构成事实(定罪情节)、犯罪构成事实和量刑情节。④参见熊选国:《量刑规范化办案指南》,法律出版社2011年版,第3-69页。《意见》确实对量刑的规范化起到了很好的作用,但是,针对量刑情节对于基准刑的调节幅度的确定,仍然缺乏体系性和实证基础。在确定基准刑之后,对剩余的量刑情节分别给予不同幅度的调整权限,这一点从“问题性思考”的角度来看,确实可以解决具体个案的个别量刑。但是,各个量刑情节之间的关系如何,各个量刑情节对犯罪人再犯可能性的影响等,这些都没有在量刑中得以体现。所以,这一量刑方法从“体系性思考”的角度来看,使得量刑理论“碎片化”,从而容易出现法律漏洞。
当然,按照效应公式来进行量刑规范化的理论准备还不充足,还不能够用来进行实际操作。按照《意见》进行的量刑规范化,应该说,只是量刑规范化工作的开始。量刑规范化的发展和完善,需要更多的理论和实践来支持。