量刑均衡的中国经验:基于强奸罪的实证研究

2021-05-18 07:48熊谋林李稚宁胡景宣
法治现代化研究 2021年2期
关键词:量刑省份差异

熊谋林 李稚宁 胡景宣

一、 引 言

量刑差异在21世纪初曾是司法大热点,并因此推动最高人民法院在2005年决定开展量刑改革。(1)参见最高人民法院:《人民法院第二个五年改革纲要》(2005年10月26日),法发〔2005〕18号。值得疑问的是,过去10余年的量刑规范化运动是否起到显著效果呢?目前尚无可信的研究认真评估最高人民法院量刑指导意见的实际影响,尤其是2010年10月全国试点以后的量刑评价更是急缺。有鉴于此,我们以强奸罪为视角,对8个省份的量刑情况展开多元统计分析。这不仅有助于明晰量刑改革后的司法现状,正确评估量刑规范的实施效果,而且对于提升司法公信力、了解中国刑事司法的进步具有重要意义。

中国的量刑规范化司法运动,起源于2003年江苏姜堰市人民法院和山东淄博市淄川区人民法院的内部规范。2007年8月,最高人民法院在淄川区人民法院召开量刑规范化试点工作会议,指定在该院及北京海淀区、上海浦东新区、江苏姜堰市、陕西西安新城区和云南个旧市等6家法院开展量刑程序改革试点工作。2009年初,试点范围增加到12家法院,当年6月又增至120多家法院,最高人民法院紧随其后首次颁布《人民法院量刑指导意见(试行)》,对盗窃、交通肇事、故意伤害、抢劫、毒品犯罪予以规范量刑。

2009年11月,最高人民法院再颁布《新增十个罪名的量刑指导意见(试行)》,设置强奸、非法拘禁、诈骗、抢夺、职务侵占、敲诈勒索、妨害公务、聚众斗殴、寻衅滋事、赃物犯罪等十个罪的量刑基准及其相应量化幅度。经过一年的改革试点,2010年10月1日最高人民法院印发《人民法院量刑指导意见(试行)》,正式在全国范围内对十五个常见犯罪开展量刑规范化试行工作。在此基础上,各省份高级人民法院结合自身的刑事审判实际,陆续颁布各自的省级量刑实施细则。2013年12月23日,最高人民法院正式出台《关于常见犯罪的量刑指导意见》。2017年4月1日,修订后的《关于常见犯罪的量刑指导意见》开始实施,十五种犯罪的量刑规范全面深入推进。2017年5月1日起,最高人民法院开展对危险驾驶等八个犯罪的第二批量刑规范试点工作。

在改革的第二阶段后,最高人民法院委托北京大学实证法务研究所开展评估,以决定是否开展下一步试点改革。(2)参见蔡曦蕾:《量刑失衡的克服:模式与选择》,载《中外法学》2014年第6期。随着最高司法机关的全国规范化运动,刑事法学界在过去20年里似乎已达成量刑差异的共识,蔡曦蕾甚至明确指出,中国司法实践中存在量刑失衡这一观点几成定论。(3)参见蔡曦蕾:《量刑失衡归因论》,载《法制与社会发展》2015年第1期。在论证这个结论时,他以一个累犯故意伤害案为例,在2010年1—5月对全国209家法院的问卷调查基础上,得出量刑失衡率在30%左右。(4)参见蔡曦蕾:《克服量刑失衡二元体系之构建——基于对我国量刑失衡现象的实证分析》,载《政治与法律》2013年第11期。紧接着,他利用2009年9月至2010年9月获取的3051份全国31个省份的交通肇事罪刑事判决书,从中抽取465份判决书分析得出整体量刑失衡率为29.74%。然而,熊谋林等在2014年借助于四川省德阳市五家基层人民法院的盗窃、故意伤害、抢劫罪的1039个样本,基本否定了量刑差异或失衡这一基调。(5)参见熊谋林等:《重考量刑公正与量刑差异——德阳市五个基层法院的定量研究证据》,载《犯罪研究》2014年第6期。在回应量刑差异的共识性问题时,熊谋林等认为极端个案的比较是形成量刑差异“常识”化的重要原因,并夸大了实践中存在的量刑差异。在最近的研究中,白建军教授利用全国2000年至2016年的14.7万件交通肇事罪量刑所作的区间描述统计显示,31个省份的缓刑率和刑期长短平均为82.9%、525.62天,但分别只有5个省份的缓刑率偏离均值的15%、刑期偏离60天。(6)参见白建军:《基于法官集体经验的量刑预测研究》,载《法学研究》2016年第6期。由于白建军根据交通肇事罪的全样本总结出了法官的“集体经验”,这比任何推论分析更有说服力,从而再次证明熊谋林等早期提出的量刑均衡和公正论有其合理性。

尽管近年来已有多篇研究从故意伤害罪、盗窃罪、受贿罪等角度有力地宣传了量刑的地区差异。然而,这些不同地区的“共识性”研究,主要针对最高人民法院量刑规范化普及运动以前,并且部分研究方法和结论欠妥当。前者主要表现在,量刑规范试点初期法官尚未充分掌握,(7)参见董桂武:《故意伤害罪量刑幅度分布实证研究》,载《刑法论丛》2012年第2辑(作者收集了2006年至2011年间12家中级或基层人民法院故意伤害罪2823份判决书);前引②,蔡曦蕾文(作者收集了21个省、77家法院2006—2009年间盗窃、故意伤害、交通肇事罪22450份判决书);前引③,蔡曦蕾文;前引④,蔡曦蕾文(作者从2010年1月至5月,采用给定故意伤害案例的方式,调查了30个省、42家法院、209个法官的量刑反映)。或者受贿犯罪尚未开展量刑规范化运动。(8)参见王剑波:《我国受贿罪量刑地区差异问题实证研究》,载《中国法学》2016年第4期(作者收集1341份裁判文书,按东北、华北、华中、华南等7个地区展开研究)。后者主要表现在,尽管已有的研究基本显示出相对均衡性,但研究者仍用未经检验的绝对性相等来描述量刑差异,(9)董桂武的研究基本难以做结论;蔡曦蕾的研究局限在于,有关量刑差异的评估仅以二元分析评价法官裁判结果的量差,多元分析稍显不足。参见前引⑦,董桂武文;前引③,蔡曦蕾文。甚至在普遍不存在显著性的情况下,仍然高度肯定其差异。(10)例如,王剑波所比较的7个地区中(一个参照组),在不考虑控制变量的情况下,只有1个地区间的量刑有显著差异,剩下5个地区间的比较均无显著性差异。然而,即使如此,作者仍坚持用“我国部分地区的受贿罪量刑存在显著差异”。参见前引⑧,王剑波文。此外,近年来的个案研究文献依然继续用极端个案渲染量刑差异,但这种比较本身并无意义。(11)参见王刚:《我国贪污受贿罪量刑存在的问题和完善建议——以200份贪污受贿案件判决书的实证分析为基础》,载《湖北社会科学》2016年第11期(作者所用案例显示,在我国各地的判决中,存在贪污受贿数额为6万、9.1万、129万均被判处5年有期徒刑);曹建煜等:《同罪定罪量刑差异化问题研究》,载《中国检察官》2013年第20期(作者仅以两人情节类似,分别被判4年零6个月、1年有期徒刑,就认定我国存在量刑差异)。冉利军基于323个盗窃罪案例,通过独立样本t检验,发现四川藏区在刑罚强度以及有期徒刑量刑上均显著轻于汉区,藏区的罚金量刑也远低于汉区。(12)参见冉利军:《四川藏汉地区盗窃罪量刑差异的法社会学研究》,四川省社会科学院2015年硕士学位论文。他的研究揭示出跨文化群体中的量刑差异,这对解释量刑差异的背后机制因素具有重要作用。这也说明即使存在地区之间的量刑差异,也可能有其特定的文化和司法背景。

自2009年11月最高人民法院公布强奸罪的量刑规范以来,有关强奸罪的地区和量刑差异问题并未获得充分关注。当前,关于强奸罪的量刑研究仍以刑法理论探讨为主,少量的实证研究,或单纯地调查描述,或主要讨论强奸的相关影响因素。(13)参见苏惠渔等:《量刑与电脑:量刑公正合理应用论》,百家出版社1989年版,第12页;张妮、姜玉梅:《量刑的模糊评价研究》,载《中国刑事法杂志》2011年第12期;柯葛壮:《强奸罪情节与量刑关系的调查分析》,载《政治与法律》1989年第6期。在最近的研究中,夏一巍等研究了法官性别对量刑的影响,并得出男女法官之间不存在差异。(14)参见Yiwei Xia, Tianjian Cai, Hua Zhong. “Effect of Judges’ Gender on Rape Sentencing: A Data Mining Approach to Analyze Judgment Documents”, The China Review, 2019, 19(2), pp.125-149.与此同时,熊谋林和魏帅借助于河北和四川两个地级市非对称年份的资料,对不同犯罪类别下的法官和被告人性别交互影响的分析结果也显示出类似结论。其中,87份强奸罪样本的分析显示在是否缓刑和量刑长短的区间比较上没有区别,唯有多层多元回归分析后的29份样本显示了量刑长短的差异。(15)参见Shuai Wei, Moulin Xiong. “Judges’ Gender and Sentencing in China: An Empirical Inquiry”, Feminist Criminology, 2020, 15(2), pp.232-239.然而,这份研究关注于法官和被告人的性别对量刑的影响,局限在于强奸罪样本量太少,故两个地级市的结论难以推广到其他地方。因此,继续探索量刑公正或差异这两个竞争性话题,不仅可探索差异是否存在,而且有助于充分了解中国刑事司法中的有益经验。

当然,数字层面上的绝对“量刑差异”肯定不能否认,但相对意义上的量刑差异还有必要论证。尽管有关30%量刑失衡率的计算方法和标准还需讨论,(16)参见前引③,蔡曦蕾文;前引,苏惠渔等书,第160-179页。但这基本上肯定了至少有2/3的地区不存在量刑差异。根据焦点理论(focus concern theory)、经验观察理论(perceptual shorthand theory),法官可能在司法经验和管理机制作用下判决相似的量刑。(17)参见前引⑤,熊谋林等文。对于中国的特殊国情来说,其政治体系和刑事司法管理方面在全球刑事司法背景下均有显著不同的特征,这说明中国的量刑均衡也有可解释的理由。熊谋林和魏帅认为,中国之所以没有出现诸如美国一样的量刑差异,这与中国长期的司法管理和诉讼结构不可分割。一方面,审委会、法院考评、合议庭、检察院监督机制,本身就有助于规范管理量刑活动;另一方面,最高法院多年来统一量刑指导意见,留给法官的自由裁量空间很少。(18)See note , pp.240-243.因此,无论是评估司法改革效果,还是探索量刑差异本身的客观存在性,这均是极为严肃的学术话题。

本文关注于中国的量刑实践,我们并不打算对全球刑事司法的特征展开比较分析,故全文写作重心放在强奸罪的区间比较上。之所以考察强奸罪,主要在于本罪在犯罪形态和法定刑设计上相对于其他罪更加简单。故全文的结构安排如下:第一部分主要介绍研究资料的收集和整理过程,以及分析过程中的方法考虑。第二部分论证有关量刑均衡的研究发现。根据本文采集的8个省份的强奸罪的量刑资料,在二元背景下展开整体观察、多组间比较,并运用多元回归分析技术,以黑龙江省为参照和各省份交替参照展开验证性分析。第三部分为讨论部分,围绕统一法政体系下的中国司法经验分析量刑均衡的主要原因:一部刑法、一个指南、一个司法管理体系。第四部分为结论和政策建议,围绕中国刑事司法的有益经验,为学术和法治建设提供参考。

二、 研究资料和方法

在理想状态下,检测量刑公正或差异最好是拿到全样本做描述统计,但这种做法并不现实。结合先前的研究经验,我们认为以强奸罪作为考评量刑差异更加合适。一方面,在强奸罪的基本量刑幅度中,没有造成重伤或死亡的情况下,可以避免如时间长短(如非法拘禁)、行为复杂性(如盗窃罪)、财产数额大小或伤害程度(如抢劫罪)对量刑的影响;另一方面,强奸罪的基本量刑幅度是起刑为3年以上有期徒刑,除可判10年以上有期徒刑、无期徒刑、死刑的加重情节外,犯罪严厉程度或既遂评判的标准相对简单。这就决定了,各省份的量刑幅度或犯罪体系存在差异的空间相对较小。因此,本文以量刑的区间差异为核心,以省份为单位比较强奸罪量刑均衡情况。具体来看,包含如下三个方面:① 各省份是否存在量刑差异,包括缓刑与否以及刑期差异;② 如果有差异,量刑差异存在于个别省份之间还是都有差异;③ 如果有差异,这些差异是否可以解读,是法律或事实因素造成的,还是法律外固有因素引起的。回答这三个问题,不仅对于正确评价强奸罪的量刑活动至关重要,而且也可以此类推作为检测其他犯罪量刑的方法。有鉴于此,我们以刑事判决书为观察视角,利用多种统计方法展开实证性探索。

(一) 研究资料

研究资料来源于中国裁判文书网上公布的强奸罪一审刑事判决书,时间跨度为2010年10月1日至2017年4月30日。基于探究强奸罪是否存在量刑区间差异,按东西南北中的地域选择黑龙江(东北)、上海和江苏(华东)、河南(华中)、河北(华北)、广东(华南)、四川(西南)、新疆(西北)等8个省份。不同地区各选1—2个省份,而非局限于个别省份之间,可以更为广泛地公正评价各省份的量刑情况。我们根据高级搜索中的“强奸罪”“一审”“基层法院”功能筛选,再用“省份”关键词搜索定位各省份的文书,并下载所有显示的强奸罪裁判文书。

研究小组从2017年5月1日开始,于5月30日完成所有文书下载工作,共涉及86个市辖区(县、县级市)基层人民法院。根据文书特征设计出编码表,利用Epidata软件,通过分试录入和调整录入两个阶段,于2018年1月底初步完成数据录入工作。经过两轮交叉核对和奇异值核实后,于2018年9月1日完成数据复核工作。数据分析显示,所有强奸罪判决书共946份(共1256个被告),排除2人免予刑事处罚后,最终涵盖1254个被告样本。样本覆盖8个年度,93.7%的样本集中在2013—2016年,2012年和2017年分别有2.32%和3.59%,其余两年共5件。从各省份情况来看,江苏的样本最多,新疆的样本最少(见表1)。从刑种来看,样本中的强奸罪量刑几乎全是有期徒刑,只有4人被判拘役,分别是广东2例、四川1例、河北1例。这与刑法第236条“3年以上有期徒刑”的最低法定刑的刑种、刑期设置有关。

(二) 编码与变量

从法律上讲,量刑包含是否免予刑事处罚、是否缓刑、刑种、刑期。但如前述,只有缓刑和刑期适合分析。因此,我们将是否裁决缓刑(是=1),以及监禁刑(非缓刑,以月为单位)的刑期长短作为因变量。核心自变量是省份,按类别变量的特性编码分析,用于考察不同省份是否出现量刑差异。基于强奸罪的最低刑是3年以上有期徒刑,因此忽略拘役和有期徒刑的刑种影响,直接以月为单位按实际裁量刑期分析。根据法律和司法解释以及有关量刑研究的文献,我们按六个维度考虑可能影响强奸罪量刑的因素。控制变量分别为与受害人的关系、本次定罪涉及的强奸次数、自首、立功、赔偿、持有凶器(木棍、刀、枪、玻璃瓶和酒瓶等)、辩护人信息、犯罪完成形态、共同犯罪、前科/累犯(区分是否强奸)等10个可能的影响因子(见表1)。

表1 变量及描述统计(N=1254)

本研究的量刑评估未严格按照刑法第236条所载的加重情节进行分类,原因在于各种信息缺损、样本稀少、表达差异,故通过可查阅的基本信息最大限度地描述犯罪相关事实的共性。例如,裁判文书中的年龄信息缺损量较大,1/3的样本中被告人无年龄或出生日期,1/2的受害人年龄信息缺损,其他人口信息更是稀缺。故难以对被告是否未成年人、是否针对幼女等人口变量展开分析。本数据库中的预备犯只有3个,故在分析时直接将中止和预备放置在同一类别。立功只有7人,也没有分析必要。因强奸罪的生理特性,女性并不能单独构成犯罪,因此未考虑被告性别。同时,简易或普通程序对量刑具有很大影响,这在刑事诉讼法中已明确说明,故也未纳入。此外,因2010年以后的量刑指导意见总体上差别不大,模型探索也未发现年度差异,故未控制年份。

(三) 研究方法

基于前述主旨,我们按由简到繁采用三种主要分析方法。首先,采用一元方差分析法,判断缓刑比例和刑期平均值在省份间的差异存在性,并用皮尔逊卡方和F值共同作为判断标准,Stata命令为“oneway Y X”。在对缓刑进行比较时,因虚拟变量兼具类别变量特性,故还采用列联表卡方比较方法予以验证,Stata命令为“tab Y X,chi2”。其次,采用一元方差内的多组比较法(Scheffe配对比较),判断具体存在差异的是哪些省份。由于一元方差或卡方分析的结果受个别省份的影响较大,只要任意两省份存在差异,就可能引起整体上的显著差异。如果仅以此得出结论,就可能忽略其他组的比较结果,从而无法判断量刑区间差异是普遍情况还是个别情况。多重比较法可以弥补这个缺陷,而且主要用于不均衡组间样本的比较。再次,为了检测和分析影响量刑的因子,使用多元对数回归(Multiple Logistic Regression)和广义线性回归(Generalized Linear Model)模型,分别读取优势比(odds ratio)和回归系数(coefficient)。由于量刑长短呈明显左集中和右偏结构,我们使用自引导(Bootsrap)50次后的标准误及相应显著水平作为稳健评价的基础。数理统计所要求的完美条件,在绝大多数应用统计和实证研究中都无法满足。GLM及其适当的修正程序,可以放宽一般线性回归(OLS)所要求的数据条件,从而避免积极或消极错误风险。在省份差异问题上,我们先以黑龙江省为参考,再以多省份交替参照展开相关的多元统计分析,这可以避免单一参照引发的片面结论。

回归分析在控制各种变量后,有助于理解各种因子及其差异对缓刑或刑期的影响程度。例如,在检测犯罪形态时,我们将未遂、预备/中止与既遂做比较,观察不同形态下的量刑情况;在检测累犯情节时,将有累犯以及何种累犯、前科与无累犯/前科的情节做比较,检测不同情形下再犯情节(累犯或前科)对量刑的影响。可以肯定,实践中真正影响量刑的因素会更多,本文不可能将所有影响因子纳入。原因有二:一是量刑是一个错综复杂的过程,根据焦点和经验理论,只能在海量因素中选择主要因素;二是部分量刑因子难以获取,强行纳入后必然因数据缺损造成误差过大。在开展回归分析前,我们对多重共线和方差齐性进行了诊断。结果显示,在缓刑问题上前科/累犯与多个变量(含初犯)之间存在多重共线性,亲属相奸全部判处实刑,故在分析中都未纳入模型。(19)单独分析不同类型累犯或前科对缓刑的影响时,无论是按五类分析,还是将累犯和前科单独区分,与无前科或累犯做比较时均存在共线。然而,在把累犯和前科合并成一组时,累犯或前科对缓刑的作用非常显著(odds ratio=0.062,p=0.006)。结合刑法和司法常识即可以判断,只要有累犯或前科,就基本不可能缓刑。排除是否有立功、前科/累犯情节后,纳入多元对数和广义线性回归模型变量(见表1、表4)的方差膨胀因子(VIF)平均值分别为1.45、1.54,且是否为亲属外关系变量的最大数值均小于5的经验法则(分别为3.59、3.76),这说明多元回归分析没有问题。为进一步保障结果的稳健性,我们也报告了标准误供读者参考。

三、 主要研究发现

本部分按不同分析方法层层展开,在此过程中可能会出现不同结果。这源于分析方法的不同,一些简单的二元分析或描述统计虽反映出差异,但这种没有考虑其他任何因素的伪差异容易引发不真实的误导结论。随着多元分析的展开,控制多个变量后将有可能消除这些差异,这主要是因为犯罪事实和情节的不同影响造成的。我们提示读者,判断强奸罪的量刑差异主要应以多元回归的参数分析结果为依据,一元方差分析因非参数分析忽略了其他因素而可能出现不当结论。(20)熊谋林和魏帅对1977年至2014年间有关法官性别和量刑差异的方法进行了回顾。他们发现,那些肯定量刑差异的文章,主要是因为不当运用简单二元或非参数分析方法所致。反之,如果考虑到每个案件的不同情况,而运用多元回归分析方法以后,没有证据证明法官的性别对量刑有显著影响。按此逻辑,有关量刑差异这个大主题,多元分析方法得出的结论可能更加客观。See note , pp.222-226.

(一) 整体观察

表2为8个省份的缓刑百分比以及非缓刑刑期长短情况比较。从整体上看,8个省份间的缓刑率和刑期均值似乎存在一定差异。8个省份的缓刑比例的平均值为7.11%,河南的缓刑率最低(1.94%),四川最高(14.08%)。一元方差分析肯定了8个省份间的缓刑比例差异(F=4.01,p=0.002;Pearsonx2=232.318,p=0.000),列联表卡方关联度分析也显示缓刑与省份有关(Pearsonx2=27.617,p=0.000)。从非缓刑的刑期来看,8个省份的平均值为47.136月,新疆的量刑均值最低(37.355月),黑龙江最高(52.922月),中位数比较也有类似结果。尽管违反均方差的前提条件会降低比较的可信度(Pearsonx2=119.966,p=0.000),但这只是8个省份间整体上存在刑期差异(F=4.27,p=0.002)。一元方差分析只能反映出“是/否”有差异,但无法核实是哪些省份之间存在差异,更无法考察多元背景下的量刑比较情况。因此,本部分的结果只是暂时肯定了强奸罪量刑存在显著差异,这个结论可能会在进一步观察后被否定。

表2 省份间的缓刑与刑期情况比较(N=1254)

(二) 多组间比较

如表3所示,将各省份两两配对后发现,缓刑比例只有河南和江苏(7.9%)一组有差异,剩余27组间的比较均没有差异。正是由于河南和江苏之间的显著差异,才导致表2中的缓刑区间比较出现显著水平。从刑期长短的均值来看,各省份之间两两比较后均没有发现显著差异。对比两种刑期分析结果,Scheffe多组间比较的修正结果在定量研究中更容易被接受。尽管量刑长短只有河南和广东相差13.137月,为差异显著(p=0.022),但其他组间比较均未达到可接受的显著水平。当然,本文数据库收集的新疆、四川、黑龙江的样本较少,这或许是差异不显著的重要原因。但从28组间的比较结果来看,只有一组有差异,差异概率小到可以忽略不计的程度(3.57%)。

表3 量刑裁判的区间差异的一元方差组间配对比较

因此,本部分结论是,各省份的强奸罪量刑在总体上并不存在显著的区间差异。但这个结论仍需谨慎对待,因为一元方差分析没有控制各种量刑影响因子,且方差分析运用到虚拟变量分析中还需检验。在控制量刑因子后,各省份的量刑比较可能会出现差异,也有可能继续保持不变,下文将利用多元回归分析进一步探索。

(三) 以黑龙江省为参照

表4是以黑龙江省量刑为参照,多元对数回归和广义线性回归分析的最终结果。缓刑模型中的优势比以及量刑长短的回归系数显示,各省份之间仍不存在显著量刑差异。尽管模型显示,除了河南比黑龙江可能判缓刑更少以外,其他省份的缓刑率都比黑龙江高。尤其是在上海,罪犯获得缓刑的概率是黑龙江的5.284倍,但未达到可接受的显著水平(p=0.071)。同理,除四川省的量刑比黑龙江稍长以外,广义线性回归系数显示其他几省份均比黑龙江省的刑期更短,但只有广东省与之差异8.084月,较为显著(p=0.010)。上述有关省份之间的量刑比较与表2的百分比或均值描述相吻合,这说明控制变量在一定程度上并未改变数据结构。

控制变量显示,强奸罪缓刑主要受被告人与被害人有恋爱关系(优势比=7.729,p=0.014)、犯罪未遂(优势比=2.694,p=0.000)、犯罪预备/中止(优势比=2.914,p=0.031)、自首(优势比=2.637,p=0.001)、初犯(优势比=2.694,p=0.002)、从犯(优势比=4.672,p=0.040)、赔偿(优势比=8.923,p=0.000)所影响,拥有这些情节的人更容易获得缓刑。与此同时,上述情节也可造成显著更短的刑期。但强奸罪的刑期还受前科/累犯、主犯、持有凶器三个重要因素影响,每多强奸一次重判4.216月(p=0.000),主犯比个人犯罪重判41.661月(p=0.000),持有凶器重判8.047月(p=0.010),强奸和非强奸累犯分别重判18.269月(p=0.000)、7.124月(p=0.002)。主犯重判,这主要与轮奸作为10年以上有期徒刑的法定加重情节有关,仅常数和主犯效应相加达88个月就基本可以印证10年左右的刑期。然而,是否聘请律师对于缓刑和刑期长短并无影响,这说明法官量刑裁判主要依靠自己的判断,留给律师辩护的空间较小。

结果显示,影响强奸罪的量刑因素主要是刑法和量刑指南上的情节指标,但持有凶器(83.67%的凶器是刀)是法律外的重要量刑因素。(21)样本中一共识别出49人持有凶器的强奸,分别是41人持刀、3人持木棍、4人持玻璃瓶,1人持枪。纵观刑法和量刑指导意见,均未将持有凶器这一重要的裁量因素作为法定从重或加重情节。然而,各省份在量刑实施细则中,明确将持有凶器作为加重基准刑的情节。决定系数(拟合优度)R2显示,缓刑和刑期模型分别解释了25.9%和52.7%的量刑差异。这说明还有若干影响因子未纳入考虑,尤其是缓刑裁判还有更多因素需要探索。

表4 量刑影响因子及区间差异的多元回归分析

(四) 8省份交替参照

表4的分析模型仅以黑龙江省为参照,这难以看出各省份间相互比较的详细情况。表5的8省份交替参照多元分析表恰好可以进一步判断省际量刑差异,控制变量的分析结果因与表4相同而未报告。与以黑龙江省作为参照相比有所不同,在控制其他变量的情况下,各省份之间的交替参照显示:河南的缓刑率显著低于江苏(优势比=0.133,p=0.000)、上海(优势比=0.068,p=0.000)、广东(优势比=0.202,p=010)、四川(优势比=0.091,p=0.000)、河北(优势比=0.194,p=0.006)。然而,剩余省份除广东的缓刑率只有上海的1/3(优势比=0.336,p=0.047)外,其他相互比较均未发现显著差异。这依然说明河南省的缓刑率低并非普遍现象。强奸罪刑期差异主要与广东的刑期较短有关系,黑龙江(优势比=8.084,p=0.010)、江苏(优势比=4.861,p=0.004)、四川(优势比=10.643,p=0.002)、河南(优势比=4.882,p=0.011)比广东的平均刑期均较长,四川的刑期又比新疆长8.879月(p=0.025)。因此,我们的结论依然是刑期不存在普遍差异,缓刑也不存在普遍差异。至于河南的缓刑率显著低于其他几省份,如果能通过该省的犯罪特征予以解读,那么也可否认量刑差异。

表5 8省份交替参照量刑差异多元回归分析结果

本部分用三种方法、四个步骤分别揭示不同情形下的区间比较结果,既有不同之处,也有相似之处。前后差异主要来自于分析方法上的考虑和考量,这再次说明在有关量刑差异的实证研究中,方法的恰当性和稳健性是理论的关键。也正是如此,我们认为,先前以刑期长短的简单比较得出的量刑差异结论基本上来源于方法不当,以及作者自身的偏见。但无论如何变化,8省份之间的量刑均衡这一基调并未改变。值得疑问的是,是否量刑情节分布影响了河南省的低缓刑率呢?表4已经显示出诸多控制变量的影响,下文将围绕法政体系、量刑指导意见以及若干显著情节的分布进行讨论。如果量刑情节能够解释河南与其他5省份间的差异,那么这又从反面说明各省份之间的缓刑裁判恰恰是均衡的。

四、 讨论:围绕法政体系的量刑机制探索

研究中国量刑机制时应注意中外刑事司法的背景差异,否则容易被海量的外文文献所误导。只有深入剖析法官裁断所依据的法律和司法机制,才有可能解决刑事司法中的真实问题。这也就说明缓刑和刑期的区间差异探索,必须回归到中国的法理和司法背景中来展开,而不能不分青红皂白地进行理论嫁接。(22)有关法理中国化的议题及重要性,这是近年来讨论的共识话题。参见熊谋林:《三十年中国法学研究方法回顾》,载《政法论坛》2014年第3期;陈金钊:《法理学之用及其法律话语体系的建构》,载《法治现代化研究》2017年第3期;张文显:《法理:法理学的中心主题和法学的共同关注》,载《清华法学》2017年第4期;李拥军:《当代中国法理学的思维方式与研究路径》,载《法治现代化研究》2018年第4期;公丕祥:《新时代中国法理学的逻辑力量》,载《法制与社会发展》2018年第5期;南杰·隆英强:《中国气派之本土法学发展的道路选择——从法律史学与法理学研究的基本思路切入》,载《法治现代化研究》2019年第6期。

(一) 国家法政体系的宏观考察

根据宪法和立法法的规定,中国的立法机关只有全国人民代表大会,也只有全国人大才能制定犯罪和刑罚的刑事基本法律,或闭会期间由全国人大常委会进行与刑法基本原则不相冲突的补充或修改。(23)参见《中华人民共和国宪法》第58条、第62条、第67条;《中华人民共和国立法法》第7条、第8条、第9条。据此,我国只有一部统一适用于全国的刑法,各省份的立法机构只能在立法法框架下制定区域性地方法规,而不能制定与犯罪和刑罚有关的法律。在中央与地方的行政体系结构上,各省份属于国务院领导下的单一行政体系,财政支出绝大部分也由中央统一调配。全国法院系统被设置为最高人民法院领导下的四级二审体系,并由最高人民法院单独或与最高人民检察院制定通行全国的司法解释和量刑意见。在这种立法、行政和司法管理机制的统一体系下,全国上下使用共同的刑法、刑诉法、司法解释,可以为量刑均衡或量刑管理提供最大程度的保障。与此同时,无论是何地的法官或法院,所受的法学教育和职业培训均是基于《中华人民共和国刑法》而展开的,这在职业环境上构建了统一的司法文化氛围,从而保障了绝大多数案件本身的量刑稳定性。尽管我们到目前依然无法肯定这种量刑均衡到底是因为最高人民法院的规范化运动,还是法官本身的累积经验所解读,但无论是哪一点,量刑差异本身可以通过立法和司法管理,从而实现真正的量刑均衡。(24)参见Stacy Hoskins Haynes, Barry Ruback, Gretchen Ruth Cusick. “Courtroom Workgroups and Sentencing: The Effects of Similarity, Proximity, and Stability”, Crime & Delinquency, 2010, 56(1), pp.126-161; Mavis Chng, Michael W. Dowdle. “The Chinese Debate about the Adjudication Committee: Implications for What ‘Judicial Independence’ Means in the Context of China”, The Chinese Journal of Comparative Law, 2014, 2(2), pp.233-251.

熊谋林和魏帅的研究注意到中外刑事司法的重大差异,他们根据中国刑事司法管理的有益经验将量刑均衡的可管理机制介绍到了英语世界。(25)See note , pp.242-243.来自于中国香港的最新资料也进一步证明,统一的法政体系可以做到量刑均衡。郑国贤等对香港356个量刑毒品运输案例(Drug Trafficking Cases)及34个法官的量刑裁判数据进行了多层统计模型(HLM)分析,研究显示90%左右案件的量刑都在运输毒品的量刑指南范围内,且量刑差异主要由从(加,aggravating)重或从(减,mitigating)轻情节影响。在控制法官层面后,除了情节和法官经历有所影响外,法官间在决定量刑基准时本身没有差异。(26)参见Kevin Kwork-yin Cheng, Sayaka Ri, Natasha Pushkarna. “Judicial Disparity, Deviation, and Departures from Sentencing Guidelines: The Cases of Hongkong”, Journal of Empirical Legal Studies, 2020, 17(3), p.580, pp.598-600.原因很简单,中央政府充分尊重香港的司法自治,香港地区只有一部法律、一个法院管理和法官遴选机制。香港拥有独立的司法和终审权,(27)参见《中华人民共和国香港特别行政区基本法》第2条、第19条。其法院管理和刑事立法、司法由香港立法会及终审法院管理下自主安排。与此同时,香港的量刑指南与美国确定的分格分档的量刑指南差异较大,但与内地给出一定的基准刑和各种情节的加减系数具有相似性。这依然说明,统一的法政体系可以实现量刑均衡,或量刑差异主要由法律、司法管理不同的法政体系造成。

与中国统一的法政体系形成鲜明对比的是,无论是刑事立法还是刑事司法,即使美国50个州之间量刑存在差异也不足为奇。首先,从立法体系来看,其联邦与各州之间相互独立,受立法双轨制的影响而有联邦的《犯罪和刑事程序法》(Title18CrimeandCriminalProcedure)和各州的刑法典。其次,在具体的量刑问题上,其宽泛的法定刑设置留给法官的裁量空间非常大。以联邦法律对一般强奸罪的法定刑为例,直接可以判处罚金、任意年份的有期监禁和无期徒刑。(28)参见Crimes and Criminal Procedure, U.S. Federal § 2242. (1) causes another person to engage in a sexual act by threatening or placing that other person in fear (other than by threatening or placing that other person in fear that any person will be subjected to death, serious bodily injury, or kidnapping); or (2) engages in a sexual act with another person if that other person is—(A) incapable of appraising the nature of the conduct; (B)physically incapable of declining participation in, or communicating unwillingness to engage in, that sexual act; or attempts to do so, shall be fined under this title and imprisoned for any term of years or for life.再次,美国各州刑法所设定的犯罪结构和刑罚设置差异较大,立法不同当然可能在各州出现程度不同的量刑差异。以强奸罪为例,阿拉巴马州一级性犯罪(含针对未成年人,下同)指控法定刑为1年零1天至10年,但阿拉斯加州一级性犯罪最高可判罚到30年,怀俄明州最高可判罚50年,佐治亚州的强奸可判10—20年有期徒刑、无期徒刑、死刑。(29)律师Brian D. Kent创办了美国各州性犯罪法律及刑罚的网站,对美国50个州的刑法均有详细介绍。限于篇幅,我们只列举四个州的刑法,读者可进一步查询其他州的详细介绍。参见Abuse Guidian. What Are The Laws On Sex Abuse & Rape In My State? https://abuseguardian.com/sex-abuse-laws/,最后访问日期:2020年10月7日。因此,从1980年明尼苏达州开始制定量刑指南开始,美国各州近几十年来陆续制定量刑指南,力图实现量刑规范和公正化。(30)参见Kevin R. Reitz. The Disassembly and Reassembly of U.S. Sentencing Practices, in Michael Tonry and Richard S. Frase (eds.) Sentencing and Sanctions in Western Countries, Oxford University Press, 2001, pp.225-228.然而,由于其立法本身所设定的法定刑裁量权过于宽大,其司法量刑指南所起的作用非常有限。加之根深蒂固的种族偏见,反复出现量刑差异和量刑指南这两个经久不衰的话题。但即使如此,仍然有文献认为并不存在差异,即使是差异也可运用法律、事实、文化、经济、教育等予以解释。(31)参见James Eisenstein, Herbert Jacob. Felony Justice: An Organizational Analysis of Criminal Courts. Lanham, MD: University Press of America, 1991; Rodney L. Engen, Randy R. Gainey. “Modeling the Effects of Legally Relevant and Extralegal Factors under Sentencing Guidelines: The Rules Have Changed”, Criminology, 2000, 38(4), pp.1207-1230; Noah Painter-Davis, Jeffery T. Ulmer. “Discretion and Disparity under Sentencing Guidelines Revisited: The Interrelationship between Structured Sentencing Alternatives and Guideline Decision-making”, Journal of Research in Crime and Delinquency, 2020, 57(3), pp.263-293.如此看来,有关量刑差异并非盖棺定论。

是否统一的法政体系均可以避免量刑差异呢?这个问题需要从统一的政治体系内部来寻找答案。欧洲或大陆法系国家实证研究不多,或许因不公开法庭资料或禁止分析司法数据所影响,故难以精准评估。(32)以上评价来自于Jakub对英文文献的回顾,我们也注意到有荷兰语和芬兰语文献出版,但欧洲总体上仍然呈现出有关量刑公正的实证研究不足。参见Jakub Drápal. “Sentencing Disparities in the Czech Republic: Empirical Evidence from Postcommunist Europe”, European Journal of Criminology, online first, May 22, 2018, p.3, https://doi.org/10.1177%2F1477370818773612.虽然荷兰和德国也有文献批评量刑差异,(33)参见Jakub Drápal. “Sentencing Disparities in the Czech Republic: Empirical Evidence from Postcommunist Europe”, European Journal of Criminology, online first, May 22, 2018, p3. https://doi.org/10.1177%2F1477370818773612; Peter J. Tak. Sentencing and Punishment in the Netherland, in Michael Tonry and Richard S. Frase (eds.) Sentencing and Sanctions in Western Countries, Oxford University Press, 2001, pp.175-177; Wolfgang Frisch, “From Disparity in Sentencing towards Sentencing Equality: The German Experience”, Criminal Law Forum, 2017, 28, pp.437-475.但这些文献仍然是在实证资料缺乏或过时资料的基础上所作的个案或个人臆断。(34)作者注意到蔡曦蕾论证过荷兰和德国出现了量刑差异,但其所直接使用的最新证据较少,主要为转引证或老旧文献的运用。为避免某个或某篇文献的影响,作者提醒读者尽量审慎地关注更多新近文献。参见前引②,蔡曦蕾文。也正因为如此,欧洲是否存在量刑差异还有争议,有限的研究中仍然不乏认为波兰、芬兰等欧洲国家中没有量刑差异。目前可供查阅的最新资料,来自于有关捷克司法部采集的86个地方法院所审重复盗窃、拖欠赡养费、拒不执行官方决定等三类案件。虽然作者声称运用多层对数回归分析6.6万份是否缓刑的案件证明了量刑差异的存在性,但从缓刑和监禁长度的平均值波动幅度来看差异并不大,且最大问题是只考虑了犯罪次数,而忽略与犯罪行为和结果相关的大量法律因子。(35)参见Jakub Drápal. “Sentencing Disparities in the Czech Republic: Empirical Evidence from Postcommunist Europe”, European Journal of Criminology, online, May 22, 2018, pp.1-18, https://doi.org/10.1177%2F1477370818773612.至于为何芬兰量刑差异较少,恰恰得益于其1976年的标准化量刑改革理念(notion of normal punishment),以实现统一的量刑实践(uniformity of sentencing practice)为目标。为此,《芬兰刑法典》第六章专门规定刑罚梯度和加减事由(Ladder Model of Penal Sanction),芬兰最高法院也从1980年开始制定量刑规范化意见,并用各种统计数据告诉法官适当的量刑是什么。从目前效果来看,芬兰犯罪学家Tapio的结论倒比较积极,充分论证其量刑均衡性。(36)Tapio Lappi-Seppälä. Sentencing and Punishment in Finland: The Decline of the Repressive Ideal, in Michael Tonry and Richard S. Frase (eds.) Sentencing and Sanctions in Western Countries, Oxford University Press, 2001, pp.93-138.

遗憾的是,国内学术界对中国法政体系的重大特征很少关注。基本是以美国或受美国影响的多元法政体系下的量刑差异为视角,不加鉴别地受英文原著或译著的研究所误导,从而高度相信量刑差异的理论普世性,尤其是诸多假说性论证习惯于个案比较,用超越量刑的事实问题去谈量刑差异。如果不从大量案例中寻找规律,或者仅仅是数字上的简单比较,这更加容易引发有关量刑差异的高度关注性。(37)有关个案的比较和正方面的论证,参见前引⑤,熊谋林等文。这种忽略国家立法、司法、政治结构巨大差异所催生出的误导性结论本应该值得检视。然而,受限于实证研究的“高贵性”,以及外语和文献知识的系统缺乏,很难从中寻找到唯我中华可用的刑事司法理论。

(二) 量刑意见的比较分析

本文提出统一的法政体系,在很大程度上解释了为何8个省份之间基本以量刑均衡的局面出现。但不可否认,以河南为中心的缓刑比较,以及以广东为中心的刑期比较,都显示了差异的客观存在性。本节比较了最高人民法院的量刑指导意见,(38)最高人民法院《关于常见犯罪的量刑指导意见》,法发〔2013〕14号(2013年12月23日)。以及各省份量刑指导意见的实施细则,(39)上海市高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》[沪高法(审)〔2014〕2号,2014年6月16日];四川省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(2014年7月1日);广东省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(粤高法发〔2014〕14号,2014年7月10日);新疆维吾尔自治区高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(2014年8月1日);江苏省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(2014年8月21日);河北省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(2014年3月24日);河南省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(2014年6月20日);黑龙江省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(2015年7月2日)。从而解释为何量刑指导意见之下存在多数省份的均衡以及个别省份的差异。

首先,在解释各省份之间不存在刑期长短的量刑差异时,不妨观察最高人民法院的量刑指导意见及各省份的量刑实施细则。表6是2014年最高人民法院量刑指导意见和各省份的实施细则,我们提炼出各种情节对量刑影响的指导性指标。除黑龙江省是2015年才公布实施细则以外,其他各省份的实施细则均在2014年公布。从各种指标来看,基本可以发现各省份的量刑细则严格地执行了最高人民法院的量刑指导意见。若干影响量刑长短的重要指标比较显示,各省份之间基本没有差异,甚至完全一样。例如,在自首或赔偿的减刑效果上,各省份均规定一般按基准刑减刑40%以下。这说明,最高人民法院在过去12年所作出的量刑规范化努力的确值得肯定,各省份制定的实施细则是解释量刑均衡的重要原因。当然,造成这种相似结果,还与各省份或各法院内部的审委会、发改率等重要管理机制,(40)He Xin. “Black Hole of Responsibility: The Adjudication Committee’s Role in A Chinese Court”, Law & Society Review, 2012, 46(4), pp.681-712; Julian V. Roberts, Wei Pei. “Structuring Judicial Discretion in China: Exploring the 2014 Sentencing Guidelines”, Criminal Law Forum, 2016, 27(1), pp.3-33.以及检察院和被告人的上、抗诉的诉讼机制有关。在多种诉讼和管理机制约束下,法官个人的裁量权很难超越一般水平,并因此造成较为均衡的量刑结果。受限于主题和篇幅,相关问题的探索还有待于进一步研究。

其次,关于以河南省为中心的缓刑率差异,我们发现这可能因为河南省高级人民法院2009年公布的《关于办理刑事案件适用缓刑的指导意见》。纵观最高人民法院及各省份的量刑意见,有关缓刑的详细裁判规则至今未普遍出台。以2014年最高人民法院量刑指导意见为例,有关缓刑的内容只有“综合全案犯罪事实和量刑情节,依法应当判处无期徒刑以上刑罚、管制或者单处附加刑、缓刑、免刑的,应当依法适用”。(41)最高人民法院《关于常见犯罪的量刑指导意见》(二、3),法发〔2013〕14号(2013年12月23日)。除了刑法第72条明确缓刑的条件外,如未成年人和孕妇等,缓刑裁判主要靠各地法院自行管理和裁判。

表6 各省份量刑细则关于刑法总则具体情节效果的比较 (单位:月)

就强奸罪本身而言,我们注意到江苏省量刑指导意见中规定“对强奸未成年人的成年被告人判处刑罚时,一般不适用缓刑”,这是8个省份中唯一一个明确说明强奸罪不适用缓刑的具体规范。(42)江苏省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(四、8)(2014年8月21日)。因裁判文书解释的受害人身份信息不多,或因涉及未成年人信息而未公开,加之江苏省并未与其他几省份形成显著差异,故这个规范的实际效果评价可以忽略。然而,在此之前,河南省高级人民法院基于某区的缓刑预告书制度,于2009年率先筹备发布《关于办理刑事案件适用缓刑的指导意见》,从而发起旨在提高全省轻微刑事犯罪缓刑率的规范指导活动。我们无法寻找到这个量刑规范文件的具体内容,但据网络资料显示,其有三个亮点:① 明确了应当判处缓刑的情形,如正当防卫或紧急避险超过必要限度,未成年人,丧失危害社会能力的聋哑人、盲人和其他残疾人,中止犯,犯罪后自首并有立功表现,被胁迫参加犯罪,过失犯罪等轻微刑事犯罪。② 具有故意犯罪中主观恶性不大,积极退赃,积极赔偿被害人经济损失、预交罚金,有自首、坦白、立功等法定或酌定从轻处罚情节的轻微刑事犯罪,合议庭可视案件情况自由裁量,宣告缓刑。③ 对存在不认罪、无悔改表现、主观恶性大等情形的轻微刑事犯罪分子,依法不适用缓刑。(43)参见邓红阳:《河南高院将下发意见鼓励基层法院对轻刑犯判缓刑》,载“中国新闻网”,http://www.chinanews.com/gn/news/2009/08-21/1828652.shtml;《刑事犯罪适用缓刑后重犯比例不足1% 河南高院将下发指导意见鼓励基层法院对轻刑犯判缓刑》,载“搜狐网”,http://news.sohu.com/20090821/n266125042.shtml,最后访问日期:2021年2月28日。然而,仔细研习前述三个亮点即可发现:由于强奸罪是起刑为3年的重罪,适用缓刑的可能性极低,基本可以用主观恶性较大而不适用缓刑来解决。这也就是为什么河南省强奸罪的缓刑率只有1.94%的根本原因所在。与此相比,其他各省份由于没有与河南省相似的缓刑裁判规范,缓刑适用的空间和幅度相对较大。

最后,从各省份的比较上来看,本文也发现广东省强奸罪量刑比其他各省份刑期较短(表2,4-5)的关键原因在于,未遂情况下的减刑幅度高于其他各省份。其理由在于:各省份间诸多实施细节所规定的指标相差很少,只有未遂比较基准刑减刑的幅度差异最大。最高人民法院量刑指导意见规定,“对于未遂犯,综合考虑犯罪行为的实行程度、造成损害的大小、犯罪未得逞的原因等情况,可以比照既遂犯减少基准刑的50%以下”,(44)最高人民法院《关于常见犯罪的量刑指导意见》(三、1)(法发〔2013〕14号,2013年12月23日)。各省份也基本在此基础上根据实行中了、未实行中了情况予以分别不同的量刑减刑幅度。但除上海市、广东省只考虑是否终了的维度外,其他省份还考虑了是否造成损害后果及其严重程度,进而再细分为四挡(如表6所示)。以四川省为例,四川省高级人民法院的实施细则规定:“① 实施终了的未遂犯,造成损害后果的,可以比照既遂犯减少基准刑的30%以下;未造成损害后果的,可以比照既遂犯减少基准刑的40%以下。② 未实施终了的未遂犯,造成损害后果的,可以比照既遂犯减少基准刑的40%以下;未造成损害后果的,可以比照既遂犯减少基准刑的50%以下。”(45)四川省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(三、8)(2014年7月1日)。与此相比,广东省高级人民法院规定:“① 实行终了的未遂犯,根据造成的损害大小,可以比照既遂犯减少基准刑的40%以下;② 未实行终了的未遂犯,根据造成的损害大小,可以比照既遂犯减少基准刑的50%以下。”(46)广东省高级人民法院《〈关于常见犯罪的量刑指导意见〉实施细则》(三、8)(粤高法发〔2014〕14号,2014年7月10日)。上海市除了实行中了与否的10%—30%或20%—40%差异比例外,其他内容幅度与广东省极为相似,但与其他诸省份的四档分类法相差较大。所以,在不控制其他变量的情况下,上海市和广东省的量刑平均只相差3个月,而与其他诸省份差异达6—13个月(如表2所示)。(47)虽然上海市还另外设置“不能犯的未遂比照既遂犯减少基准刑的30%—50%”,但不能犯发案的概率很低,样本中无一例不能犯,所以这基本对整体的量刑结果影响很少。由于未遂犯的比例本身较高,表1所示平均30.46%。表6所示广东省的即遂率为57.98%,所以40%或50%基准刑减少比例明显拉低了其量刑水平。也正因为如此,广东省在所有比较的8个省份里面,其平均量刑低至39.348月。

量刑司法不是自然科学,各省份间比较不可能做到百分之百的绝对相等。因此,量刑规范的核心使命是缩减法院或法官间的量差,从而尽量趋于均衡。但问题是,如果最高人民法院指导意见本身不明时,出现各省份在具体细则中制定出与其他省份不一致的文件时,这可能恰恰是解读部分差异的重要因素。本部分的各省份的量刑指导意见的异同性,恰恰解释了量刑均衡本身的存在机制以及量刑差异的客观原因。

(三) 犯罪事实的微观解读

在本节中,我们试图从犯罪事实中解释量刑差异还有可能因犯罪事实的不同引发不同的量刑结果,但这不是量刑差异本身的问题。换句话说,即使存在量刑差异,也需要观察其背后的犯罪事实机制。本部分围绕影响缓刑和量刑长短的显著因子的分布情况,以及最高人民法院、各省份的量刑指导意见或细则,讨论为什么河南省的缓刑与其他省份不同,为什么各省份的刑期又不存在差异。表7是影响量刑决定的显著影响因子在各省份的分布情况,从严因子包含强奸次数(2次及以上)、前科、既遂(非未遂、预备、中止)、持有凶器的百分比,从宽因子包含恋爱、自首、初犯、赔偿的百分比。因刑期不存在显著的区间差异,故因子探索主要围绕缓刑展开。

从严因子分析显示,多次强奸和既遂指标在各省份分布非常有规律,这是造成河南省缓刑率最低的重要因素。河南省的多次强奸比例最高,有31.06%的被告在本次审判中涉及2次以上强奸。与之相比,其他各省份中最高的广东省只有26.05%,江苏省与河南省的差异较为显著(p=0.001)。就既遂比例来看,对比江苏省(62.50%)、上海市(53.66%,p=0.011)、广东省(57.98%)、河北省(69.87%)、四川省(60.56%),河南省的强奸既遂比例最高(75.08%)。从这个角度来看,河南省的缓刑率显著低于其他几省也有一定道理,毕竟犯罪结果的危害程度不同。前科显示,上海市(6.50%,p=0.014)和广东省(6.72%,p=0.017)显著比黑龙江省(28.97%)低,也比其他省份低。从整个角度看,广东省比黑龙江省显著刑期更短,以及比其他省份较轻均有一定道理。综合持有凶器和前科来看,除黑龙江省外,也显示出河南省相对意义上的较高水平。例如,河南省持有凶器强奸的比例有3.24%,比四川省、上海市、河北省均高,累犯或前科的比例(14.56%)也高于上海、广东、河北三省市。

从宽因子未显示出明显规律,统计上的差异也并非都显著,但仍可从相对意义上看出问题。如表2所示,四川省(与上海市接近)的缓刑率最高,河南省(与黑龙江省接近)的缓刑率最低。四川省之所以出现最高的缓刑率,原因可能在于自首的比例最高(23.94%)。与此相对应,河南省的自首率只有11.0%,赔偿的比例也比四川省稍低。当然,其他显著影响因子的比较因各自的贡献程度不一致,很难将相关比较推广到除四川省以外的其他各省份。同时,新疆的初犯比例高达52.94%,这在一方面表征惩罚确定性的同时,也解读了为何新疆的刑期最短(37.355月,表1)。与之显著相比的四川省初犯率只有9.86%,新疆的初犯比例是四川省的5倍。

表7 强奸罪量刑显著影响因子详细情况(均值与百分比分布)

++加粗字体表示在0.05水平下,字母表示相应比较,一元方差多组比较分析差异显著。

表7的各省份的影响因子的整体平均水平进一步充分说明有关量刑差异的非普遍性和可解读性。围绕以广东省为中心的刑期长短比较显示,除广东省比黑龙江等4省份以及新疆比四川省量刑更短以外,其他诸省份比较均不存在量刑差异。就有差异的省份比较来看,从严因子除持有凶器的比例差异不显著外,多次强奸、前科、既遂的比例差异较大,从宽因子中初犯的比例差异也较大。但是,对于没有差异的省份来说,其从宽因子和从严因子基本持平。例如,多次强奸除河南省外,其他几省份的百分比基本维持平均水平。前科除黑龙江省、江苏省、上海市的前科累犯率偏离较大外,其他各省份的比例也基本维持在总体水平上下。赔偿率除黑龙江省较低(13.24%),自首除四川省(23.94%)外,其他各省份差别仅有4个百分点。对比多次强奸和初犯的比例,应当肯定新疆的打击性犯罪较为及时严厉。这从另一个层面也说明,量刑问题并非犯罪事实的简单考虑,而且还与刑事司法本身的惩罚确定性有关。惩罚越确定,犯罪必罚和初犯的比例就越高,刑期基于初犯的考虑也有可能更低。

综上所述,本文从国家法政体系、统一量刑指导意见、犯罪事实等三个角度解释了为什么绝大多数省份没有量刑差异,以及河南省的缓刑指导意见和广东省以量刑细则的未遂减刑幅度是造成缓刑率或刑期短的重要原因。因此,当某些数据或简单统计分析方法显示出量刑差异时,寻找到差异的法律和事实原因,比简单得出存在量刑差异的做法更加可取。原因很简单,量刑并非是一个单纯的一元或多元数学题,而是法律、事实、量刑认知等各种因子结合情况下的多种判断。当然,各种比例的差异程度还可能存在判断或认定标准的差异问题,或因裁判文书样本选择,或与法官裁判是否充分说明各种事实或情节有关。相关问题的解读,我们期望在将来以更多更广的资料进行解读。

五、 结论及完善建议

量刑研究常因差异符合“常识”而颇受学术青睐,但却有分析方法失当、忽视法政体系差异,或者学者个案比较得出失真结论的风险。当把法律文化、法律规定、司法管理、量刑意见等都考虑进去时,在统一的法政体系、焦点关注理论、法官经验等得出的量刑均衡结论并非奇谈怪说。因此,本文有关强奸罪不存在量刑差异的结论具有理论基础,我们在讨论部分中已从中国刑事立法、司法政治等多角度予以解读和论证。然而,量刑均衡的前提是法官的裁判标准明确可依,如没有统一的裁判基础或个罪的法定刑幅度太大,则量刑均衡仍然无从谈起。因此,有关量刑均衡这个问题,其研究和结论范围还有很大的讨论空间。

本文利用1254个强奸罪量刑样本,借助于各种统计分析方法发现中国的量刑均衡。我们的解释是,统一的法政体系是解读的关键原因,量刑指导意见和犯罪事实的异同也是重要因素。量刑并不仅是定罪后的刑罚问题,还与受害者关系、犯罪事实等多种因素有关,更与刑事司法的惩罚确定性有关。本文识别出,强奸罪缓刑主要受被告人与被害人的恋爱关系、未遂形态、自首、初犯、从犯、赔偿所影响,刑期还受持有凶器、前科累犯、强奸次数所影响。缓刑除河南省比例较低以外,以及刑期除广东省显著较短,新疆维吾尔自治区比四川省刑期更短外,其他各省份间基本不存在显著差异。河南省较高的既遂或多次强奸比例,以及其缓刑指导意见,解释了为什么缓刑率低于其他省份。广东省高级人民法院颁布的量刑实施细则对未遂的基准刑减少幅度大于其他省份,新疆维吾尔自治区的初犯比例是四川省的5倍,这在很大程度上解释了为什么其量刑比其他几省份更短。

然而,中国的量刑均衡实践到底是得益于最高人民法院的量刑规范化运动,还是法官基于刑法而自觉地以审判经验反馈,本文仍然无法得出结论。但无论结论如何,都应当肯定目前的量刑均衡趋势,并作为肯定最高人民法院量刑规范改革成效的依据。量刑规范化运动的终极目标是,以罪责刑相适应为指导实现个案的罪和刑均衡,从而实现类案罪刑均衡的司法公正。不过,实现这个目标并非易事,需要在形式和实质层面上双重保障罪刑均衡。在形式层面上,最高人民法院需要在刑法框架内制定出具有可操作性的量刑指导意见,包括缓免刑和刑期长短两部分。在实质层面上,量刑所依赖的事实和情节均需要有更明确的裁判标准,否则诸如有关未遂等情节的采信与否完全有可能出现不一样的结论。因此,要实现真正意义上的量刑规范化,不仅要在同样情节的刑罚适用幅度上做文章,而且还要用更加明确的规范实现相同的事实作出相同的裁判。有鉴于此,本文认为如下四个问题值得重视。

第一,以罪刑法定原则为准绳,最高人民法院可在各省份的基础上进一步细化和归纳可以适用于全国的量刑指南。最高人民法院虽然在总则里给出了一些裁判标准,但在诸如强奸罪的量刑意见上仍然较为抽象,反倒是各省份更加明确。目前各省份从强奸对象、伤害结果、强奸手段等角度对于具体的基准刑或从重从轻幅度均有不少尝试,但各省份的具体规定仍有一定差异。例如围绕增加基准刑问题上,各省份在20%、30%、40%的增加事由和标准上全然不同,甚至相差一倍。尤需注意的是,各省份的量刑指导意见虽名为“实施细则”,但实为创造新量刑意见或突破刑法规定并非少数。例如,8个省份明确将“携带凶器(或持有枪支、刀具)或者采取非法拘禁(或禁锢)、捆绑、侮辱、虐待等方式作案的”作为加重基准刑系数的方法,要么是做罪责的重复评价,要么是将犯罪问题作为量刑处理。又如,江苏等省的强奸罪法定刑基准是妇女4年或幼女6年,这明显突破刑法第236条“3年以上”的起点限制。又如,黑龙江省和江苏省等也规定,对无性防卫能力的人增加基准刑40%,其他省份甚至规定多种情节叠加可增加100%的基准刑。本文对各省份量刑的考察显示,实践中已持有凶器对量刑影响如此之大,很大程度上就是因各省份的量刑指导意见所致。

第二,量刑指南应包含是否判刑、判处何种刑罚、刑罚如何执行、刑期长短等多种明确的裁判规范。就目前的量刑指南来看,更关注于刑期长短问题,在前三个问题上所涉及的内容很少,尤以是否判处缓刑尚不清晰。最高人民法院量刑指导意见仅规定“综合全案犯罪事实和量刑情节,依法应当判处无期徒刑以上刑罚、管制或者单处附加刑、缓刑、免刑的,应当依法适用”,除刑法规定的未成年人和年满75周岁的缓刑还算清晰外,最高人民法院和各省份的指导意见看不出是否缓刑的具体指导。河南省以提高缓刑率为目标而率先提出量刑指导意见,但其结果是该省的强奸罪缓刑率最低。虽然缓刑率高低并没有绝对的评价标尺,但截至目前仍然未见国家层面的缓刑裁判规范。量刑规范化运动已经在中国开展10余年,最高人民法院可以参照一些影响指标,制定有关缓刑与否的评分系数或标准,指导法官准确适用缓刑。

第三,部分情节的认定标准需要明确,否则可能因情节采信与否而最终影响量刑效果。例如,强奸罪的预备、未遂问题在学术界有广泛讨论,但司法解释尚未明确既遂到底需遵从何种标准(如插入说、接触说、结合说等)。此外,尽管最高人民法院对自首、立功等有明确的标准,但从犯的界定也仍不明确。与此同时,这些从轻情节是否可以或可能成为决定缓刑的参考指标,以及在何种情况下(如不具有从重情节)可以适用缓刑,最高人民法院可以明确作出指引。否则,可能出现法官干脆不认定这些从轻情节,从而实质上未给予量刑优待。也或者,虽然名义上认定情节,但在其他情节的影响下实际未从轻处理。

第四,有鉴于各省份的实施细则和审判经验,刑法可以提炼一些影响强奸罪量刑从重或从轻情节。就强奸罪本身而言,本文的研究显示,各省份的法院的裁判实践中充分反映出“亲属相奸”、持有凶器强奸从重处罚,以及对正在谈恋爱的从轻处罚。同时,各省份也以不同形式表达出对“持有凶器或采取非法拘禁、捆绑、侮辱、虐待等方式实施强奸,强奸残疾、老年、怀孕、智障妇女;利用监护、职务、亲属等关系强奸的;冒充国家工作人员,实施强奸犯罪的;进入未成年人住所、学生集体宿舍实施强奸犯罪的”作为加重基准刑的情节。在目前刑法尚未修正的情况下,各省份已摸索出了影响强奸罪的“准法定”情节。刑法是否可以讨论增加从重从轻情节,或作出明确的注意性规定,从而对这些量刑细则作出回应。这属于立法学的问题,我们权当以此为将来刑法的修改和讨论提供视角。

本文得出的中国的强奸罪量刑较为均衡,我们重申这是法政体系和司法管理的共同结果。在本文初稿定型以后,最高人民法院《关于完善统一法律适用标准工作机制的意见》不期而至,(48)最高人民法院《关于完善统一法律适用标准工作机制的意见》(法发〔2020〕35号,2020年9月14日)。这从另一个层面也反映出本文以法政体系为中心,解读中国的量刑均衡具有逻辑基础。这主要表现在:一是,中国有且仅有一个司法系统,上传下达,上行下效,最高人民法院当然可以做到统一裁判规范。二是,近10年的量刑规范化改革,推动各省市以最高人民法院量刑指导意见为基准制定了各种量刑实施细则。三是,各级人民法院内部自上而下的审委会、发改考评等约束机制,在很大程度上避免了非常规量刑。回归中国统一的法政体系实践,明晰单一制和联邦制法政的基本差异,确保法律适用的统一性才是重点。因此,学术界尚需围绕中国特色的总结和改良,有甄别性地比较和借鉴国外经验,从而将独领世界的中国量刑经验展现于世界。

尽管我们已在讨论部分充分说明量刑均衡的合理性,但可能有人还会以河南省、广东省与其他省份的差异而坚持量刑失衡。这是本文的难点和疑点所在,故略作笔墨补充。如果将视角转移到整个中国的刑事司法体系,可以发现缓刑并不一定真正地源自法院裁判本身,而是其背后的法律程序和羁押等前置性因素。例如,熊谋林和魏帅的研究已表明,缓刑与否的重要因素是取保候审或监视居住,法官很少将羁押或非羁押转变为缓刑或监禁决定。(49)Xiong Moulin, Wei Shuai. “Unequal Treatment in Pretrial Detention in China”, British Journal of Criminology, 2017, 57(6), pp.1398-1419;熊谋林:《从证据收集看审前羁押——基于A市的实证研究》,载《华东政法大学学报》2016年第2期。在理论研究和司法观念中,人们常认为法官裁判是关乎被告人命运的决定性环节。然而,在真实的司法运作过程中,公安和检察院羁押与否的先行决定影响了缓刑裁判,法院判决多是验证而非关键环节。当然,这依然与刑事诉讼法规定和统一的司法文化有关,相关讨论将在其他研究中展开。

应当承认,本文以8省份的资料为基础探究强奸罪量刑均衡的中国经验,可能以偏概全。不过,白建军对全国31个省市区的14万交通肇事罪研究所归纳出的“集体经验”间接肯定了量刑均衡的客观存在性。(50)参见前引⑥,白建军文。既然交通肇事罪可以出现这种局面,为何强奸罪不能呢?此外,量刑研究还可能因“差异”或“均衡”的定义、幅度、分析单位不同,从而得出不同结论。这是一个相对可接受度的问题,我们并不打算为此做过多申辩。受限于技术和人财物力,样本不足和写作维度是本文不可回避的事实。作者对结论持开放态度,欢迎同仁用不同实证发现验明。与此同时,除最高人民法院的量刑指导外,中国统一的法律、司法制度或其他因素在解读量刑均衡问题上所起的作用也仍需继续探索。作者建议未来的研究关注更多罪名、更长时间段的量刑样本,深入探索中国固有的司法运作机制。

猜你喜欢
量刑省份差异
JT/T 782的2020版与2010版的差异分析
相似与差异
浅议认罪认罚从宽量刑建议机制的完善
找句子差异
男女生的思维差异
16省份上半年GDP超万亿元
22个省
论量刑事实的界分
从司法公正角度审视量刑建议应对电脑量刑
论量刑程序独立的可行性与必要性