[丹]斯文-埃里克·斯坎宁( Svend-Erik Skaaning)(奥胡斯大学政治学系,丹麦)游腾飞编译(华东政法大学政治学研究院,上海201620)
如何测量法治
[丹]斯文-埃里克·斯坎宁( Svend-Erik Skaaning)
(奥胡斯大学政治学系,丹麦)
游腾飞编译
(华东政法大学政治学研究院,上海201620)
摘要:现有的西方主流法治指数在测量规模、法治概念化、测量手段、数据聚合以及相关分析等方面均存在显著的不同,这些不同之处导致了法治指数评估形式的差异。虽然西方法治指数研究已经取得了比较丰硕的成果,但是这些法治指数仍然在法治概念化、数据来源、数据编码以及数据聚合过程等方面存在缺陷,这使其对同一个国家的法治测评难以得出相近的测量结果。因此,在构建和使用法治测量指数时,学者们必须采取一些预防措施来避免出现上述弊端。
关键词:法治;法治指数;法治指数测量;法治数据集
文章开头,作者首先就法治的发展史做了简单回顾。促进法治的努力经常与提高治理水平密切联系,20世纪90年代末,卡罗瑟斯( Carothers)认为,“如今,如果不将法治视为解决世界性难题的方法的话,那么,外交政策的争论就无法达成一致。”[1]因此,国际金融机构、援助机构和政府经常在涉及公民福利、社会稳定和经济增长的改革方案中强调法治的关键作用。
此外,在当前的社会科学研究中,关于法治因果联系的研究已经受到学者广泛的关注,许多研究者已经使用法治数据集( data set)的方法来促进其研究。作者秉持一种基本观点,即定量方法可以提升学者的研究能力。这种研究能力既指监测差异性国家在不同时期提升治理水平的能力,也指通过系统性比较发现各国法治的差异和缺点的能力。然而,研究者要达到这个目的并不简单,如果只关注数据的可靠性、有效性和等价性,那仅仅只是学术发展的一小步。因此,近年来,学界对法治指标的研发过程、质量高低和方法运用展开了激烈的讨论。虽然这些学术争论提供了宝贵的知识和建议,但是几乎没有学者重新系统性地审视现有的主流法治测量指数。
为此,作者从五个方面来对7个法治指数(详见文末表1)进行了比较分析,即测量规模、法治概念化、测量手段、数据聚合以及相关分析。通过对这五个方面的比较分析,作者认为这些法治指数存在明显的弊端,还有很大的改善空间。
表1 开发者、数据集和法治测量的规模
作者首先对这7个法治指数的测量规模提出了批评。他认为这7个法治指数的数据测量规模各不一样,但是,没有一个指数的数据来自于1984年之前,而且大多数指数的数据只覆盖了4年左右的时间。此外,这7个法治指数所覆盖的国家规模也存在不足。除了自由之家的全球自由指数和世界银行的世界治理指数勉强覆盖了世界上大部分的国家和地区之外,其他几个指数所测量的国家数量明显不足。虽然贝塔斯曼转型指数和世界各国风险指南测量的国家数量过百,但是这两个指数只关注经济大国,而忽略了一些相对重要的发展中国家和地区。自由之家研发的两个指数——“十字路口国家”和“转型国家”关注的国家数量就更少了,主要涉及欧亚大陆的前社会主义国家和其他一些转型中国家(如蒙古国)。
最后,作者总结说,这些指数的数据搜集在测量规模和来源上均存在明显的限制,不能及时、准确地反映所测量国家后续法治的发展情况;这种弊端导致这些指数不宜直接用于传统民主大国或小国间的比较分析,其科学性和客观性也受到了其他研究者的激烈批评。因此,法治指数的研制者应在数据搜集年份和数据规模上不断扩展,不仅要包括民主政体的经济大国,而且要涵盖那些威权政体的经济小国。
在进行法治的指数化评估之前,指数研发者首先需要对法治进行概念化操作。作者认为,目前学术界缺乏对于法治的精准定义,现有的法治定义存在将法治内涵过于扩大化和缩小化的问题。法治概念极为复杂且富有争议,作者为此提出了“形式法治”和“实质法治”的区别。形式法治要求法律的明确性、统一性和普遍适用性;实质法治要求法律必须体现公平、正义、自由和尊严的要求。但是读者仍可以发现学者关于法治的定义存在高度重叠的内容(详见文末表2)。
表2 不同学者关于法治原则的比较
此外,在大多数法治指数中,研制者对理论概念化所做的基础工作并不扎实。这些法治指数在将“法治”理念概念化的过程中,涵盖了许多不恰当的原则和要素,却将法治的基本原则排除在外。作者进一步指出,现有的法治测量指标一方面并没有完全涵盖形式法治的所有方面,另一方面却超出了实质法治的范畴。前者造成法治概念的缩小化,后者则导致法治定义的扩大化。虽然大多数法治测量指标强调司法独立和官员遵守规则的责任,但其难以评估法律的公开性、明确性、全面性、一致性和稳定性。上文提到的7个主流法治指数都没有完整地涵盖表2中相关学者关于法治原则的界定。因此,作者认为,法治测量指标的选取应包括对权威的服从性、公共秩序、法律平等性、个人自由和商业环境等领域的测量。
在法治指数的测量过程中,研制者对法治指标的编码十分重要。编码本( codebook)可以记录并公布编码规则和处理流程,进而保障法治测量过程的一致性、透明性和可复制性。
如文末表3所示,这7个法治指数的数据来源渠道多元,种类多样。其中,世界治理指数是对各种既有数据的聚合,而其他几个法治指数则是通过测量指标得分来对法治进行的评估。作者对这7个法治指数的编码方式进行了说明。他认为,自由之家的几个法治指数( FW、CC、NT)和贝塔斯曼转型指数( BTI)下的法治指数只对编码过程进行了叙事性的简单说明,全球廉政指数( GI)下的法治和正义指数对编码过程的描述较为详细,而世界各国风险指南( PRS)下的法治和秩序指数则缺少此种必要的编码说明。作者最后指出,这些法治指数的编码本并未随着时代发展而及时更新,这可能导致数据测量的偏差性。
表3 数据来源和编码者
此外,作者认为,法治指数的编码者同样重要。所谓的编码者,就是对指数各个指标进行打分的学者或专家。虽然这些专家打分受到评估委员会的审查,但是,这种专家打分方式缺少统计学意义上的信度检测[2]。总的来说,由于数据来源的不可靠性和专家打分的随机性会产生测量误差,导致这些法治指数所运用的主观测量方式受到了学者的强烈质疑。
数据聚集( Aggregation)是指研究者将各级指标的得分汇总起来并计算最终得分的过程。在作者看来,由于这些法治指数没有使用任何系统方式测试其数据集的客观性,导致这些指数所使用的数据并不能精准地反映出指标之间的相关性。因此,此种法治指数研制中的数据聚集方法并不具备理论或实证的合理性。作者对CC、BTI 和GI三个法治指数进行了因子分析,并得出了因素负荷量的分析结果(详见文末表4)。
表4 法治指数的测量维度
通过表4的因子分析结果可知,贝塔斯曼转型指数( BTI)和十字路口国家( CC)的法治指数的相关性是颇高的,这说明两个指数所测量的对象与指标设计高度一致。然而,全球廉政指数( GI)的“法官的安全保护”这个指标因子负荷是“.40”,这说明此指标与测量法治并没用太高的相关性,不能测量出法治的程度。此外,由于指标设计的抽象化程度不够,转型国家( NT)的法治指数的测量效度也相对较低。全球自由指数( FW)中的法治指数和世界各国风险指南( PRS)的法治指数则由于来源数据的低测量效度,导致数据聚集的最终得分可信度不高。总之,这几个法治指数的指标间相互关系存在共线性的问题,导致其数据聚集需要考虑加入适宜的权重。最后,作者总结说,这些法治指数既缺乏对测量指标的深度分析,又难以对数据进行有效聚集。
这7个法治指数在概念化、指标设计和测量方式等部分存在较大差异,作者尝试通过简单的二元变量回归分析来厘清这些测量结果的异同。
在文末表5中,世界治理指数( WGI)与其他几个指数的相关性颇高,这说明世界治理指数的测量结果与其他法治指数类似。但是,其他指数间的相关关系并不十分理想。比如,十字路口国家( CC)和世界各国风险指南( PRS)两个法治指数之间甚至呈现出负相关关系。简言之,十字路口国家( CC)、转型国家( NT)、世界各国风险指南( PRS)、全球廉政指数( GI)和其他指数的大部分指标之间表现出相对较低的统计相关关系;全球自由指数( FW)、世界治理指数( WGI)和贝塔斯曼转型指数( BTI)与另外几个指数的指标之间则表现出相对较高的相关关系。正如研究者预期的那样,贝塔斯曼转型指数( BTI)和自由之家的系列法治指数之间存在高度相关关系;世界各国风险指南( PRS)和世界治理指数( WGI)之间也存在类似的正相关关系。
表5 不同法治指数指标间的相关性分析
此外,作者还使用“曼—惠特尼U检验”( Mann-Whitney U test)来比较和检测英美法系国家与大陆法系国家的法治水平。文末表6的检测结果说明,如果使用世界治理指数( WGI)和全球自由指数( FW)两个法治指数分别对英美法系和大陆法系进行测量,所得出的结果存在显著差异。
表6 平均比较:英美法系与大陆法系
作者通过对7个具有代表性的法治指数进行比较分析,得出如下三个结论。
第一,这7个法治指数在测量规模、法治概念化、测量手段、数据聚合以及相关分析等方面均存在显著不同。第二,评估表明,这些法治指数存在的问题看似合理。比如,指数研发资金不足导致数据搜集难以深入,但这不能解释为何指标体系的理论构建存在弊端。全球自由指数( FW)、贝塔斯曼转型指数( BTI)、十字路口国家( CC)和全球廉政指数( GI)这几个法治指数最大的缺陷在于测量规模有限。除贝塔斯曼转型指数( BTI)外,其他法治指数的构建缺少完整的理论体系支撑。世界各国风险指南( PRS)和世界治理指数( WGI)两个法治指数注重测量公众遵守法律的程度,而全球自由指数( FW)、十字路口国家( CC)、转型国家( NT)和贝塔斯曼转型指数( BTI)等法治指数则将测量焦点集中在法律面前人人平等和民主权利两大方面。此外,世界治理指数( WGI)的评估指标并不能真正反映出评估的目的。第三,交叉比较的相关分析结果说明,这些法治指数的测量结果并不一致。对一个国家来说,采用不同的法治测评标准将会得出差别显著的测量结果。
基于此,作者在文末提出了几点改进意见。第一,需要重新设计测量指标和数据集。比如,扩大测量样本数量和增加客观数据。第二,学者应该重新审视现有指数存在的缺陷并采取更加具有针对性的措施加以改进。总的来说,虽然这些法治指数存在许多问题,但是作者仍认为不能够放弃对法治的量化测量方法,应该不断改进并寻求新的法治测量方法。
参考文献:
[1]CAROTHERS T.The Rule of Law Revival[J].Foreign Affairs,1998,( 77) : 95-106.
[2]HAGGARD S,MACINTRE A.The rule of law and E-conomic Development[J].Annual Review of Political Science,2002,( 11) : 205-234.
[责任编辑:巩村磊]
作者简介:斯文-埃里克·斯坎宁,男,教授,从事民主理论、政治学方法论和法治研究。 游腾飞( 1985—),男,助理研究员,政治学博士,从事比较政治学方法、国家治理研究。
基金项目:国家社会科学基金重点项目“全面推进依法治国与国家治理现代化研究”( 14AZD133) ;“华与罗世界文明与比较政治研究项目”
收稿日期:2015-11-08
中图分类号:D0
文献标志码:A
文章编号:1002-462X( 2016)02-0048-05