蔡曦蕾
(北京警察学院,北京102202)
实证研究传统的缺失,导致中国理论界与实务界在涉及量刑失衡的问题上,往往习惯性地从一种直观感觉上得出中国存在量刑失衡的结论。然而,如果单纯以一种直观感觉将中国司法实践贴上量刑失衡的标签,这既是学术研究的不严谨,更是对法官群体职业劳动的不尊重。基于此,本文拟先对中国量刑失衡的存在与否以及其程度进行实证检视,在此基础上,归纳当前域外法治发达国家存在的三种量刑失衡克服模式,从而构建量刑指南与量刑信息系统二元体系来解决中国的量刑失衡问题。
量刑失衡是某一司法域下整体性地违反同案同罚原则的量刑现象,其与同案异罚紧密相联,因此,对中国司法实践中量刑失衡存否问题的考察,就可以转换到是否存在整体性的同案异罚问题上。然而,对同案异罚的探究,又不得不先解决怎样在司法实践形形色色的案件与其量刑中鉴别出哪些案件属于同案,哪些量刑属于同罚。“同案”包括裸罪同案和非裸罪同案。
裸罪是指在司法实践中,刚达到犯罪某一具体构成要件等级,并未有任何量刑情节获得法官认可的犯罪状态。在这一意义上,所有裸罪当然可以被视为同案,这就是裸罪同案。但是,那种由完全相同的法定事实组合而被认定为同案的场合是极少的,除此之外的绝大多数案件均是由各异的法定事实组合而成的,这些加入了各种不同的量刑情节的犯罪为非裸罪,其中量刑情节同一或近似的视为非裸罪同案。
量刑“幅的理论”认为“责任是有幅度的,在幅度范围内所确定的刑量,都是与责任相当的”。1作为量刑主体的法官在量刑过程中不可避免会受到其特有价值观的影响,而在量刑评价上无法保持绝对一致,要求对同案的量刑精确到点的相同是不现实的;从公众对公正认知的角度,也并没有要求公正必须统一在确定的点上。故,在“幅的理论”下,同罚的鉴别,关键在于如何准确把握允许差异与不允许差异的分界线,即同罚差异容忍度的取值,在此问题上存在从绝对期限说到相对期限说的演变。绝对期限说将同罚所允许的刑罚差异规定为一个固定的期限,假设为X,则同案之间在量刑上超过X就不属于同罚,而未超过X仍属于同罚,符合同案同罚原则。相对期限说认为对同案超过或低于集中趋势(Central Tendency,一般以均值表示)或预期量刑的某一特定比例X%的量刑就不属于同罚。2举例说,假设对于某一类型的案件,法官群体量刑的集中趋势或者预期的量刑应为20年,再假设对同案量刑之间的差异凡是超过集中趋势或预期量刑10%即不属于同罚,那么,对于该类型的同案的量刑差异只有在2年以下,才属于同罚,未违反同案同罚原则。笔者将采相对期限说。
判断是否存在量刑失衡的方法主要有个案比较法、随机分配法、量刑实验法和数据比较法。个案比较法通过对小样本的个案进行比较,试图发现这些个案之间是否存在显著的量刑差异,并能够间接反映宏观上的量刑状况,从而证明量刑失衡现象的存在与否。根据随机分配法(Random Assignment),“如果法院在分配刑事案件给法官的时候是随机分配的,那么,法官之间所审理的案件就是可相互比较的。如果在这种比较中出现了量刑上的不同,那么,这种量刑差异就属于量刑失衡现象。案件的随机分配这一前提,就造就了一种天然形成的量刑实验”3。量刑实验法通过控制相关变量而虚拟出一个案件,然后将此虚拟案件交由法官进行量刑,并对不同法官对该同一案件的量刑结果进行比较,通过实验为中介,从而证明量刑失衡存在与否的问题。量刑实验法在现实中又有两种具体操作办法,一种为实况量刑实验法,即完全依据量刑程序,由不同的法官依照完全真实的诉讼流程对虚拟被告人的犯罪事实进行量刑;另一种为问卷量刑实验法,即设定一个问卷,问卷中给出案件的案情,将此问卷交由具有量刑经验的刑事法官进行量刑。数据比较法通过将现实案件的犯罪事实以及量刑结论降解为各种变量,然后通过数据分析技术对这些变量进行分析,并根据分析的结果确定是否存在量刑失衡现象。就上述四种方法而言,依据个案比较法得出的结论虽然较为直观,但如果未遵守严格的案件抽样机制,此时除能说明比较个案存在量刑失衡外,并不能间接证明宏观量刑状况;随机分配法之所以能够不考虑案件之间实际上是否相同,而径直将不同法官审理相同犯罪的案件群视作同案,其理论前提就在于案件守恒定律,即从整体上来看,在一段时间内,只要没有发生剧烈的政治、经济、文化、法律的波动,全部案件在综合的严重性总量上是相等的。但是,案件究竟是否守恒,目前尚未有切实的证据;同时,中国法院刑事案件在分配上并不具有随机性,此方法不适用于中国实践。在分析方法上,量刑实验法立足于模拟量刑过程以获得量刑现状,而数据比较法则从现实判例中直接提炼量刑现状,两者均是发现某一司法域内是否存在量刑失衡的重要手段,本文将采用此两种方法。
1.量刑实验的基础:罪名与范围
本文所举的量刑实验的罪名为故意伤害罪,选择此犯罪理由有二:其一,故意伤害罪发案率较高,从而保证参与实验的刑事法官对实验对象有较为充分的了解,能够运用其既有的量刑经验对该案件进行量刑;其二,故意伤害罪是侵犯人身权利的犯罪,从而不会发生像侵犯财产权利的犯罪那样因地区经济发展水平的不同而在量刑中应区别对待的情况。用于量刑实验的案件基本案情源于现实中的一则案例,限于篇幅,在此仅罗列大致案情:被告人高某某,男,1970年2月17日出生(作案时年龄为39岁),因与被害人张某某在娱乐室赌博时,被被害人指责为出老千,遂伺机报复,持铁锹将被害人打成重伤后逃跑,被害人经治疗后未造成身体残疾。案发后,被告人主动投案自首,并由其家人主动赔偿被害人各项损失共计30000元,被害人已对被告人表示谅解。经查明,被告人曾因聚众斗殴罪被判处有期徒刑三年,属于累犯。本次量刑实验从2010年1月2日开始至同年5月31日结束,对30个省级行政区内不限法院层级的共42个法院中共209名刑事法官进行问卷调查,该30个省级行政区的问卷数量分布参见表1。
表1 量刑实验样本分布情况
2.量刑失衡的存否
在本量刑实验中,由于被告人属于累犯而不适用缓刑。根据案情,对被告人的预期量刑应为有期徒刑,在全部209份问卷中,量刑结果全部为有期徒刑实刑,符合预期。从全局来看,本次量刑实验所体现的量刑失衡现象可以清晰地体现于图1中。首先,在全部209份对相同故意伤害罪的量刑中,法官量刑从最低12个月到最高110个月不等,两者之间相差98个月;其次,法官群体对实验案件存在几个相对集中的量刑结果,按照出现频率的高低排列,分别为36个月(共有73名法官作出此量刑,占整体比重的34.93%)、48个月(共有43名法官作出此量刑,占整体比重的20.57%)、60个月(共有34名法官作出此量刑,占整体比重的16.27%)、42个月(共有19名法官作出此量刑,占整体比重的9.09%)、24个月(共有8名法官作出此量刑,占整体比重的3.83%)、30个月(共有6名法官作出此量刑,占整体比重的2.87%);最后,全部共209名法官的平均量刑为44.86个月。根据对图1的直观观察来看,可以基本得出结论:量刑失衡存在于本次量刑实验中。
图1:实验案件量刑全局图
3.量刑失衡的程度
同案同罚并不要求宣告刑的绝对相同,法官的量刑只要处于同罚差异容忍度内,即属于同罚;同案量刑只有超过了该同罚差异容忍度的情况下才属于违反同案同罚原则,从而构成量刑失衡。对于同罚差异容忍度的求值,前文已提到可以采取相对期限说;至于容忍度取值的对象上,笔者选择调查法官群体的容忍度。由于涉及对自身工作的评价,法官群体的同罚差异容忍度自然会最宽松,以此为标准对量刑实践的评价而得出严重量刑失衡程度的可能性也会最小,而一旦在法官群体同罚差异容忍度标准下,量刑失衡程度仍然呈现严重态势,那么,得出量刑失衡存在及其程度较为严重的结论就有一定的客观性。
在本次量刑实验中,除要求受调查法官对案件给出确定量刑结论外,还要求其回答如下问题:“如本案交给其他法官去量刑,在您的预期中,您认为其他法官对本案量刑的最低量刑可能为_____,最高量刑可能为_____?”根据调查,在全部209份问卷中,共有165名法官回答了此问题,将所有165份有效问卷的预期最高量刑减去预期最低量刑,就得出具体每个法官对本案的同罚差异容忍值,然后将该165个具体的同罚差异容忍值加以平均,得出本次量刑实验中,165名法官对该故意伤害案件的同罚差异容忍值的平均值约为14.2个月,也就是说,该165名法官的平均趋势认为,法官对于实验案件相互之间相差14.2个月是可以被接受的。在法官群体同罚差异容忍值已知的情况下,其同罚差异容忍度即可轻易得出。根据对该209名法官所作出的量刑结论的统计可知,全体209名法官的平均量刑为44.86个月,因此,法官群体同罚差异容忍度为0.3165(0.3165=14.2/44.86,或31.65%,取整数30%)。由此可见,法官群体对相同案件量刑差异的容忍度是非常大的,对于同案的量刑,不同的法官只要没有超出平均量刑的30%,就属于同罚,即符合了同案同罚原则。
在已知法官群体同罚差异容忍值(14.2个月)的前提下,亦已知全部209份量刑结论的平均值(44.86个月),该量刑平均值即为全部209个法官量刑的集中趋势,从而得出属于同罚的量刑区间为30.66个月至59.06个月。而根据统计,在本量刑实验全部209份问卷中,不属于该区间的量刑样本共有67个,占全体比重的32.1%。因此,可以得出结论:本量刑实验的量刑失衡程度为32.1%,即有32.1%的量刑存在失衡问题。
量刑失衡的核心是违反同案同罚,而同案又可以分为裸罪与非裸罪同案,这样,这两种类型同案之中不属于同罚的量刑样本,即属于量刑失衡的范畴,而其所对应的比重高低,也就是量刑失衡的程度。基于这种思路,笔者在下文中将运用数据比较法,对中国司法实践中量刑失衡的存否及程度加以研究。
同案不同罚的量刑失衡具有两种表现形式:一种为期限失衡,即某种刑种内部的失衡,虽然同案均被判处同一刑种,但在具体期限或数额上,却表现出极大的差异;另一种为种类失衡,即刑种与刑种之间的失衡,对于同案,却被判处了不同的刑种。就个体案件而言,一旦发生种类失衡,对被告人权利的侵害程度将非常大,其也会具有极强的外在征表性,种类失衡的量刑从而更容易被视为量刑不当而获得司法救济,因此其发生的几率会相对较低。如果司法实践中存在量刑期限失衡,那么,由于其外在征表性并不明显,甚至量刑的直接当事人也难以觉察到其中的失衡性,期限失衡的发生几率会相对较高,因而,期限失衡将作为本文的重点。由于刑种的不同,期限失衡可以表现为管制、有期徒刑实刑、有期徒刑缓刑等的期限失衡,笔者仅对实务中最适用的刑种即对有期徒刑实刑的期限失衡情况进行实证分析。
1.实证分析的基础:样本选择与变量设计
交通肇事罪发案率较高,是一个常见犯罪。故笔者将交通肇事罪作为数据比较分析的对象。本次交通肇事罪数据库生效裁判文书来自于全国除港澳台之外的31个省级行政区,平均每个省级行政区随机抽取15份交通肇事罪判处有期徒刑实刑的生效裁判文书,进而形成了465份生效裁判文书,由于一份裁判文书并不完全对应一个罪刑关系样本,在某些交通肇事罪裁判文书中,有数个被告人,从而就将表现为数份罪刑关系样本。因此,将该465份裁判文书中的所有罪刑关系单独提取出来,最终形成了一个共由473个交通肇事罪罪刑关系样本组成的数据库。
交通肇事罪是过失犯罪,因此,《刑法》总则中规定的某些量刑情节(如中止犯等),并不会出现在对本罪的量刑之中;同时,交通肇事罪的犯罪主体一般为机动车的驾驶员,从而在现实中也一般不会由精神病人、盲人实施。结合对判决书的浏览以及依通常情况,在交通肇事罪中影响法官量刑的因素主要有:责任程度、被害人过错、第三人过错、赔偿情况、特定违法行为、酌定从轻处罚情节、酌定从重处罚情节、伤亡情况、轻伤人数、逃逸情况、自首情况、未成年人、立功、逃逸致人死亡。虽然与量刑情节无关,但是对于分析目的有帮助的变量主要有罪量与刑量4。
2.罪量与法官量刑的等级均衡性检验
根据回归模型,得出每个样本所对应的罪量,根据罪刑均衡原理,罪量与刑量应当遵循相同的秩序,罪量小的样本刑量亦小;罪量大的样本刑量亦大。将数据库中全体样本的罪量从小到大等分为十组,则每个组别所对应着的刑量亦应该呈现出由小至大的顺序,据此,得出罪量与法官量刑的等级组(见表2)。
表2 罪量与法官量刑的十个等级组
根据表2,在平均罪量按照从小到大排列的十个组别中,法官的平均量刑也完全按照同样的顺序排列,这一方面反证了本实证研究中,根据回归模型中各量刑情节对量刑影响力度而得出的罪量这一变量是可靠的,否则,不会出现如上罪量越大刑量也越大的严格等级对应关系;另一方面,这也说明了在罪刑的等级性上,该交通肇事数据库的法官很好地遵循了罪刑的等级均衡性。但是,罪刑的等级均衡并不意味着数据库中每一个样本都保持了罪刑均衡,在具体的样本与样本之间,仍有可能出现罪刑失衡的现象,从而发生量刑失衡。下文将试图对单个样本之间的量刑失衡存否以及程度进行检验。
3.同案量刑失衡率
(1)裸罪同案的量刑失衡率
本交通肇事罪数据库的裸罪可以具体表述为:当交通肇事罪的责任程度为全部责任或主要责任,造成三人重伤或一人死亡,肇事后未逃逸,无自首情节,不属于未成年人犯罪,被害人以及第三人无过错,无赔偿被害人情节,判决书中未明确表述酌定从轻处罚以及从重处罚情节时,则属于仅仅达到交通肇事罪基本构成要件的情况,属于裸罪,裸罪与裸罪之间当然属于同案。据此,本数据库中共有裸罪样本32个。
对于该32个裸罪同案量刑失衡程度的求解,笔者同样以前文的量刑实验中法官同罚差异容忍度(30%)为标准,由于法官对该32个裸罪平均量刑为21.29个月,由此可知法官量刑在14.903个月到27.677个月的区间内,均属于符合同案同罚的量刑,而不属于该区间内的量刑,则属于失衡的法官量刑。根据统计可知,有11个量刑结果不属于该区间内,因此,裸罪同案的量刑失衡率大致为34.38%(34.38%=11/32%)。
(2)非裸罪同案的量刑失衡率
数据库中裸罪之外的样本,即属于非裸罪的范畴。在本数据库中,共有非裸罪样本441个。根据“综合同案鉴别法”的原理,在非裸罪的样本中,罪量相同的两个案件即属于同案。而仍以法官同罚差异容忍度为标准,则此时同案只要仍然处于30%的同罚差异容忍度范围内,均属于同罚;相反,则不属于同罚,属于量刑失衡的范畴。首先,在本数据库中,属于同案(即罪量相同)的非裸罪案件群有45组,共涉及237个具体样本。其次,分别计算每组同案案件中法官量刑的失衡率。以第10组同案为例,本组同案的罪量均为32.08,共有6个案件,而每个案件所对应的量刑分别为12、12、24、24、24、24个月,因此,该组同案的平均量刑为20个月。而以30%的同罚差异容忍度为评价标准,则本组同案量刑凡在14个月至26个月之间的,均属可以容忍的量刑差异,未违反同案同罚原则。统计可知,在该由6个同案组成的同案组别种,有2个案例的量刑分别各为12个月,不属于前述同罚区间,因此,本组同案的属于量刑失衡的样本有2个。而单独计算第10组同案的量刑失衡率,则其失衡率为33.3%(33.3%=2/6%)。最后,依据同样的方法,得出其余44组同案的量刑失衡样本。根据计算,所有45组非裸罪同案总共的量刑失衡样本有69个,占全体同案样本237个的比重大约为29.11%(29.11%=69/237%)。
(3)同案量刑失衡率
根据前文交通肇事罪数据库裸罪以及非裸罪同案量刑失衡率的调查可知,前者量刑失衡率为34.38%,后者量刑失衡率为29.11%。最终,综合该二者的量刑失衡数据,得出本数据库中同案样本整体量刑失衡率为29.74%5。由此可以直接证明,在笔者随机建立的交通肇事罪数据库中,量刑失衡不仅存在,而且较为严重。这进一步可以间接证明,中国司法实践中,在交通肇事罪的量刑问题上,量刑失衡不仅存在,而且较为严重;而假设法官在量刑均衡与否的问题上,不会在不同犯罪之间厚此薄彼的话,则根据本实证结论,可以将对交通肇事罪的量刑失衡率推及到整体司法实践中,认为中国整体的刑事司法实践中,量刑失衡现象存在,且在严重程度上亦不容乐观。
在前文中,笔者通过运用两种方法——量刑实验法与数据比较法,试图确定量刑失衡的存否及其程度,结果为:即使以法官群体30%的同罚差异容忍度为评价标准,仍然得出存在量刑失衡:在程度上前者为32.1%,后者为29.74%,两者大致相当,且程度较为严重之结论。当然,对于通过该两种方法所得出的量刑失衡程度值,不具有绝对意义。量刑失衡率,在罪与罪之间、时与时之间、地与地之间将出现波动,因此,量刑失衡率不能绝对量化,只能相对量化。在这一层面上,笔者给出两个结论:其一为绝对结论,即在本文中对量刑实验与数据比较两种方法的实践中,所得出的量刑失衡率分别为32.1%与29.74%;其二为相对结论,即根据本文运用量刑实验与数据比较两种方法所得出的量刑失衡率,笔者预计中国司法实践中量刑失衡现象存在,其程度大致为30%。由此结论可以得出两个事实:首先,在中国司法实践中,量刑失衡存在并且较为严重已是一个不争的事实,因此,在量刑领域内启动变革具有必要性;其次,30%左右的量刑失衡率,昭示着量刑领域同案异罚的严重程度,从而,开启量刑变革具有紧迫性。
从量刑失衡克服模式的高度出发,笔者将世界上主要国家或地区量刑失衡克服模式分为如下三类。
第一类,传统型量刑失衡克服模式。在该模式下,既不存在试图规范法官量刑的量刑指南实体法规范,也不存在大规模的量刑信息系统,而是寄希望于在不对现有量刑体系进行大幅度变革的前提下,通过完善现有的方法来达到克服量刑失衡的目的。这些方法大致包括:在成文法以及判例法上明确规定量刑基准(确定量刑目的、原则,相对细致地列举量刑情节等)、完善量刑说理制度、加强上级法院对下级法院量刑的审查、实施量刑判例指南(Guidel ines Judgments)制度、加强量刑建议制度等。
第二类,指南型量刑失衡克服模式。该类模式一般通过建立独立的或附属于司法机关之下的量刑委员会,由委员会通过对法官量刑经验的实证研究,规定所有犯罪或部分犯罪各种量刑情节的刑罚幅度,形成体系化的量刑指南,以此来指导司法实践中法官的量刑。在指南的类型上,根据其性质的不同,主要存在强制(Mandatory)指南以及建议(Advisory)指南两种6,前者要求法官在量刑时必须无条件地遵循指南的规定,而后者则认为指南上的规定只是对法官合理量刑的一个建议,法官的量刑完全可以与指南规定不同。美国明尼苏达州量刑指南,即属于典型的强制指南,而美国弗吉尼亚州量刑指南,则属于建议量刑指南的典型。在指南的表述方式上,主要有数字格状与文字叙述两种形式,前者采取数字格状(Numerical Grid)的形式,将罪刑关系加以精确数字化,其代表为美国联邦及其许多州的量刑指南;后者则采取文字叙述的形式,罪刑关系并未被精确化,其代表为韩国、英格兰和威尔士、新西兰等的量刑指南。在指南的范围上,有的包括了所有犯罪,如美国的联邦量刑指南即包括了所有的联邦犯罪;有的则仅针对个别犯罪,如目前为止韩国的量刑指南仅仅涉及7个最常见的犯罪,前者可以称为完全罪名量刑指南,后者可以称为不完全罪名量刑指南。在指南的形式上,有的体现在统一的量刑指南之中,如美国联邦以及许多州的量刑指南;有的则主要以具体某一类或某一种犯罪为标准,分别建立单独的量刑指南,如英格兰和威尔士的量刑委员会目前为止已经公布了共19部单独量刑指南;前者可以称为统一量刑指南,后者可以称为单独量刑指南。
第三类,信息型量刑失衡克服模式。该类模式主要采用的方法为量刑信息系统方案,因为必须借助电子计算机,我国有学者将量刑信息系统归入那种饱受批评的剥夺法官自由裁量权并将量刑结论作为一种程序“产品”的“电脑量刑”方法之中,7这实际上是对量刑信息系统运作机理的误解。“量刑信息系统的运用本质上具有自愿性。法官并不被强迫着去使用量刑信息系统,其也并未被强迫去根据量刑信息系统展示出来的量刑分配而选择一种具有普遍性的量刑结论。非常重要的一点是,量刑信息系统并不直接产生量刑平衡的结果,其更多的是作为法官实现其所认为的量刑平衡路上的一种辅助性工具”,8帮助法官更好地将“先例制度”运用到量刑领域中,通过发现生效量刑中的同案,从而对其他法官的量刑经验加以了解,以保证刑事司法体系运转的一致性。因此,量刑信息系统的基石即在生效案例库的建构,这也是为何量刑信息系统更多地出现在英美法系国家的原因。总的来说,从目前来看,并没有一个国家在整体上都施行了量刑信息系统。同时,那些施行量刑信息系统的地区中,有的在实施之初就预定了其量刑信息系统的实施计划,比如,加拿大四省:英属哥伦比亚、马尼托巴、萨斯喀彻温、纽芬兰在上世纪80年代中期开始6年量刑信息系统计划,从而注定其量刑信息系统只是一次实验;而有的则在各种因素影响下宣告失败,比如,澳大利亚的新南威尔士州建立了相对较为成功的量刑信息系统,而其维多利亚州以及昆士兰州也在参照新南威尔士州量刑信息系统的前提下,建立了自己的量刑信息系统,但最终都未能持续下去。苏格兰地区的最高法院苏格兰高等法院从上世纪90年代初开始建立的量刑信息系统,虽然“通过对运用了量刑信息系统量刑的法官的一系列调查,普遍反响认为这个系统使用起来非常简便,并且很有帮助”,9但最终由于政治原因而被搁置。因此,就目前而言,世界上没有任何一个国家或地区完全通过量刑信息系统来克服其量刑失衡现象。但是,量刑信息系统目前运用的困境并不绝对意味着其前景的黯淡,在克服了技术上、政治上等不利因素后,量刑信息系统将成为克服量刑失衡的有力工具。
指责中国不存在矫正量刑失衡的相关制度是不公允的,我国《刑法》总则第四章第一节对就量刑基准进行了明确规定。同时,我国也存在着量刑说理制度、上级法院的量刑审查制度、量刑指导意见以及在实践中探索十余年的检察机关量刑建议制度。但是,不可否认,前文中的实证研究以及人们的直观感觉均对上述传统型模式内诸制度对中国量刑失衡的克制效果持怀疑态度,克服量刑失衡需继续改革之路。
马克斯·韦伯从形式与实质(Formal/Substantive)、合理与不合理(Rational/Ir ra tional)这两条轴展开对法律决定的分类,从而,法律决定可以分为形式或实质合理性、形式或实质不合理性四种类型。将这种分类运用到量刑失衡克服模式的构建上,后两种显然是不恰当的,我们要建立的至少应当是形式或者实质合理的克服体系。依据形式或实质合理性这两者来构建量刑失衡克服模式,将呈现出各自的特征。就前者而言,其通过事先确定量刑理念,并在此理念之下建立明确的量刑规范,将法官的量刑过程统一在量刑规范辐射的范围之内,采取统一的、分步骤的量刑方法以实现前述量刑理念;就后者而言,其也会事先确定量刑理念,在此理念之下,法官在公正理念的统摄下,依据良心确信准则,运用其认为可靠的量刑方法,最终实现量刑理念。就该两者的弊端而言,前者过于程式化,其虽然能够指导司法实践中占绝大多数典型案件之量刑,但在少数非典型的极端个案上,很难或无法实现量刑公正;而后者则过于动态化,其虽然在少数非典型的极端个案上能够更大程度地实现量刑公正,但对于普遍性的典型案件,则由于其不具有外在规则制约而显得标准不一。笔者认为,在形式合理性的量刑决定类型下,更倾向于建立指南型量刑失衡克服模式,而在实质合理性的量刑决定类型下,则更倾向于建立信息型量刑失衡克服模式,而一套臻于完善的量刑失衡克服体系,则是两者的综合体。在此种构想下,笔者试图在我国目前已有的量刑失衡克服措施的基础上,构建一个包含指南型与信息型两种模式的二元的量刑失衡克服体系(参见图2)。
图2 二元的量刑失衡克服体系
根据图2,在该体系中,法官最终作出量刑结论的流程可以有以下三种形式:其一,可以根据实体量刑指南与程序量刑指南的限制性规定,直接得出量刑结论;其二,可以根据实体量刑指南与程序量刑指南的规定,再运用偏离量刑的权力,得出量刑结论;其三,可以根据实体量刑指南与程序量刑指南的规定,再结合量刑查询系统,最终得出量刑结论。当然,法官得出量刑结论所依据的具体信息,又可以通过量刑录入系统加以保存,成为一种量刑经验为其他法官所借鉴。在二元模式的相互关系上,指南与信息系统两者之间应有主次之分:量刑指南为主,量刑信息系统为辅。根据我国目前量刑改革的进程在中国构建此二元体系,应当特别重视以下两个问题。
第一,二元量刑失衡克服体系的关键在于存在对量刑指南与量刑信息系统的固定管理机构。在中国,在管理机构的设定上,主要有两种观点:一种观点认为,应当在立法机构内部设立专门机构来制定量刑指南;另一种观点认为,量刑指南的制定权应当属于人民法院。中国最终采取了由最高人民法院负责进行量刑规范化改革的进路,终结了量刑指南管理机构的主体之争。
虽然中国在管理机构的主体上选择正确,但却难谓具有固定性。在最高院2010年10月1日最终公布量刑规范化改革的实体文件《人民法院量刑指导意见》(试行)以及程序文件《关于规范量刑程序若干问题的意见》(试行)之前,具体的业务工作是由最高院刑事审判第三庭负责的,由于当时具有具体的管理机构,因此,量刑规范化获得了有力推进;但是,自量刑实体与程序文件正式公布之后,中国量刑指南的管理机构名义上为最高人民法院本身,但该管理权并未被委之以任何具体部门,而具体创制出上述实体及程序规范的刑三庭,从最高院机构职能的划分来看,也不能当然取得量刑指南的管理权。可以说,目前中国的量刑指南在本质上并不具有固定具体的管理机构。
从中国目前量刑规范化的现状来看,管理机构缺乏固定性对改革作用的消解已逐步展示出来。笔者曾在对最高人民法院量刑规范化改革试点的实证评估中发现:最高人民法院量刑指南在试点法院试点前与试点后相比,试点后所有判决书符合量刑指南规定的合规率仅比试点前的合规率上升10%左右。这意味着从相对层面上,最高人民法院的量刑指南在实践中的适用效果并不理想,缺乏固定管理机构,恐怕是造成此种局面的一个重要原因。总之,确定固定管理机构,是建立二元量刑失衡克服体系的关键。
第二,作为二元之一的量刑指南无疑是克服体系中最重要的部分,最高人民法院对此已有所作为,并在两次大规模的试点后,于2010年10月1日公布了量刑规范化的实体及程序指导文件。但是,对于量刑信息系统的重要性,却远未获得足够的重视。虽然在二元模式的相互关系上,量刑信息系统处于辅助地位,但其所具有的独特功能导致其必须成为二元体系中不可或缺的环节。其功能主要有三:其一,为个体法官借鉴其他法官的量刑经验提供便捷渠道,从而在典型与非典型案件的量刑上将更具实质合理性;其二,保证量刑指南的合理适用率。当量刑信息必须被系统记录并保存,法官在量刑时就会正视指南的规定,并将其作为自己量刑的依据;其三,为指南主管机构提供实践量刑资料,从而为指南的完善提供数据支持。
在笔者的二元量刑失衡克服体系中,量刑信息系统主要分为量刑信息录入系统和量刑信息查询系统两个部分。第一部分为量刑信息录入系统。该系统作为量刑信息的记录工具,首要功能在于促进量刑指南的完善。量刑指南的制定绝对不能一劳永逸,而需要定期修改,其制定者只有对量刑实践具有深度的把握,才能保证指南的规定符合司法实际。这就需要为制定者提供大量量刑实践资料,并务必寻找到一种沟通指南制定者和量刑实践资料之间的便宜媒介体,而信息录入系统正可以恰当地充当此媒介。在具体案件量刑结束后,由量刑法官(或书记员)将量刑信息输入系统中加以保存,并通过法院内网传输至指南主管机构,后者就可以运用系统数据库内的量刑信息对量刑指南进行完善;信息录入系统的运用,还能够弥补量刑指南本身所固有的一大缺陷。由于不存在量刑信息系统,在美国联邦量刑指南的运作过程中,出现了一种被称为“隐藏失衡”的现象,即当法官不愿受指南的约束时,其会根据自己的量刑经验,直接得出所希望的量刑结论;然后再根据该量刑结论,对照指南上的规定,将可达到该结论的量刑情节表述在裁判文书中,从而在形式上,这样的量刑结论符合了指南的规定,但从实质上,其却属于量刑失衡的范畴,只不过这种失衡被法官巧妙地隐藏了起来。在中国,一旦实施指南指导法官量刑,要求法官群体抛弃以往操作简单、裁决随意的估堆量刑法。这将会遇到极大的阻力,而信息录入系统的运用,则形成了一种促进法官群体遵守指南规定量刑的鞭策力。虽然估堆量刑法在得出量刑结论之时会比量刑规范化所推崇的分步量刑法更加简便,但是,当存在信息录入系统时,法官在权衡是采取估堆量刑法还是分步量刑法时,一旦决定采取前者,就必须在系统中输入量刑信息时臆造出其根本未曾考虑的信息。而这不仅存在违法之嫌,并且由于这样一份量刑裁决需要提交至录入系统中,在以后又可能会被指南的管理者审查,从而给其职业生涯增加了一份不确定性;而一旦决定采取后者,则在系统中输入量刑信息的过程仅仅只是将其依指南而做的量刑步骤真实地表述至系统中,在这过程中不需要另外发挥“创造力”。最终,在权衡利弊之后,估堆量刑法将会被弃用。因此,信息录入系统的存在,将无形中督促法官自觉将其量刑过程置于量刑指南的规范之下,保证量刑指南的规定在正常情况下得到遵循。第二部分为量刑信息查询系统。信息查询系统首要功能在于帮助法官了解其他法官的量刑经验。举例说明,最高人民法院的《人民法院量刑指导意见》(试行)中规定故意伤害案件是因婚姻家庭、邻里纠纷等民间矛盾激化引发的,“可以减少基准刑的20%以下”,但是,如果某一故意伤害案件确实是由于婚姻家庭矛盾而引起的,此时是减少基准刑的10%,还是5%呢?这是在指南模式下法官量刑过程中不得不考虑的问题。量刑指南对量刑的规范化仍然需要法官的自由裁量,而自由裁量显然是建立在充分量刑经验的基础上的,而量刑经验却又来源于法官长久以来直接或间接量刑行为的结果。而考虑到对某一现实的量刑情节具体适用多少调节比例是以前不曾有过的量刑行为,因而也没有量刑经验可循;这样一来,法官对此类问题的自由裁量,将丧失正当性基础。信息查询系统无疑提供了一个法官之间交流量刑经验的平台,在此平台上,法官可以了解其他法官对类似量刑情节所对应调节比例的取值,并且理性权衡,选择一种其认为最合适的取值。通过该系统的中介,法官群体之间就形成了一种统一(而并不同一)的量刑经验。同时,信息查询系统的存在,还有利于跳出个体法院司法传统的束缚。此外,该系统还能克服量刑指南的规定只能针对典型案件的弊端,当非典型案件发生时,也能提供借鉴。
注:
1冯军:《量刑概说》,《云南大学学报:法学版》2002年第3期。
2 Mar tin L.Forst,Sentencing Disparity:An Overview of Research and Issues,in Mar tin L.Forst(ed.),Sentencing Reform:Experiments in Reducing Disparity, Sage Publ ications, Inc. 1982,pp27,pp14,pp28.
3 Shari Seidman Diamond,Hans Zeisel,Sentencing Councils:A Study of Sentence Disparity and its Reduction,The University of Chicago Law Review,Vol.43,1975,P.111-112.
4所谓罪量,即根据具体的犯罪情节,结合回归模型中具体犯罪情节所对应的对量刑的影响力,从而得出的具体样本的犯罪严重程度之数值。所谓刑量,即每个罪刑关系样本中法官的量刑结论。由于数据库选取的均为判处有期徒刑实刑的案例,因此样本之间刑量的比较是非常直观的。
5交通肇事罪数据库同案整体量刑失衡率计算方法为:(裸罪同案的失衡案件个数+非裸罪同案的失衡案件个数)/(裸罪同案个数+非裸罪同案个数)%=(11+69)/(32+237)%=29.74%。
6除此之外,还存在一种假定(Presumptive)指南类型,但多数学者认为:假定指南本质上就是强制指南。
7臧冬斌:《量刑的合理性与量刑方法的科学性》,中国人民公安大学出版社2008年版,第181-182页。
8 Cyrus Tata,Neil Hutton,Beyond the Technology of Quick Fixes:Wi l l the Judiciary Act to Protect Itsel f and Shore Up Judicial Independence?Recent Experience f rom Scot land,Federal Sentencing Reporter,Vol.16,2003,P.68.
9 Nei l Hut ton,Cyrus Tata,John N.Wilson,“Sentencing and Information Technology:Incidental Reform”,International Journal of Law and Information Technology,Vol.2,1994,P.281.