李 锦
(湖南大学 法学院,湖南 长沙 410082)
作为推动法治研究与法治实践的手段,法治指数不仅顺应了“指数化”运动的潮流与趋势,更是法治评价的重要标志和表征[1]143。与传统的以定性分析方法为主的法治评价不同,法治指数是通过经验数据的收集和整理、定量方法的运用以及计算机等技术手段,科学评估各国、各地区法治发展状况和水平的一种努力和尝试。
这种努力和尝试最早出现于西方。作为国家治理能力的一部分,自1996年以来,世界银行所推出的“全球治理指数”(WGI)成为最早对不同国家法治状况进行评估的社会指数。全球治理指数的评估范围包括212个国家和地区,采用多达30个不同组织所提供的调查数据。目前,该指数的法治指标已成为衡量各国法治水平的重要依据。其后,作为独立NGO机构的“世界正义工程”(WJP),为促动世界范围内的法治发展,推出以衡量国家法治发展水平为目标的“法治指数”,通过民意调查和专家测评的方式,对97个国家的法治水平进行评分。两者所代表的“法治指数化运动”,在世界范围内形成了示范效应和影响力,成为各国进行法治评估探索的模版[1]144。
受西方社会法治指数的深刻影响,在香港社会服务联会的倡导和支持下,2005年出台了旨在确定香港地区法治状况和水平的香港法治指数。而受惠于香港法治指数的诞生,浙江省杭州市余杭区在酝酿建设“法治余杭”的过程中,与中国社科院法学研究所、浙江大学光华法学院等机构通力合作,于2006年正式推出中国内地首个法治指数。该指数不仅将推进民主政治建设、提高党的执政能力等9个具体目标及其分解出的主要任务作为法治指数的评分标准,而且通过由内、外部评分组以及专家评审组的分别打分并结合群众的法治满意度调查结果,最后加权得出最终的法治指数得分。法治余杭指数的多年实验,形成了一套较为可行的法治评估方法和制度约束,能够预防行政行为的偏差,激励政府各个部门推动并励行法治建设[2]11。
但是,以余杭法治指数为代表的中国式法治指数的路径选择与西方国家法治指数的发展径路大相径庭。西方国家法治指数的出现,具有自下而上的特征,即试图以非官方的性质来触动国家的法治发展。而中国式法治指数的典型特征是自上而下的,并与建设法治中国的战略目标息息相关——这彰显出中国法治发展道路的特殊性,即在国家政权建设的背景下,由国家机关依照预设目标和阶段,自上而下且循序渐进推动中国的法治建设[3]68。政府主导下的法治建设,不同于自生自发的法治秩序,其内在的逻辑展开要求一套行之有效的考核体系。在此,中国式法治指数的推动与践行有两条清晰可辨的轨迹:一方面,国务院2004年发布《全面推进依法行政的实施纲要》,明确提出要“经过十年左右坚持不懈的努力,基本实现法治政府的目标”,并全面确立了政府推进依法行政、建设法治政府的行政纲领;另一方面,自2004年起,江苏、浙江、湖北、湖南、安徽等省份先后颁布各自的法治地方实施纲要,不仅构成国家法治建设在各地的具体实践,更是依法治省的发展和深化。在法治国家建设的既定目标和任务下,余杭法治指数不仅成为中国法治建设进程中的“一块试验田”,更直接触动全国各地的法治评估和法治指数活动:2011年,四川省司法厅完成了“四川省法治指数”的设计和调研工作;2012年,云南省昆明市成为全国首个发布法治指数的省会城市。
法治指数的建构与应用如今已为燎原之势,然而,法治指数的科学建构与规范应用却并非易事。受诸多因素和条件的影响,既有的法治指数或法治指标缺乏一个稳定不变的概念内核和指标体系,容易引发评价对象是否同一的问题。与此同时,法治指数的设计过于依赖主观指标的运用,而忽略遗漏了客观指标的重要意义,不可避免会引发指数失真或被操纵的质疑。最后,法治指数或法治指标虽然可以为法治水平的国别比较或法治建设状况的区域比较提供一定标准,但其内在限度决定了未经反思的规范应用会落入盲目评估的陷阱与窠臼。因此,冷静反思并揭示法治指数的建构和应用所存在的问题,将有助于建构更加科学的法治指数并避免可能误入的歧路。
法治指数或法治指标体系成功的关键首先是准确界定并厘清其评价对象的内涵与外延。法治指数的评价对象,显然正是被称之“法治”的事物。然而,遗憾的是,作为评估或测度的对象,“什么是法治”本身就具有一定的争议性。在理解“法治是什么”的概念层面上,不仅存在形式法治的弱观念与实质法治的强观念之区别,而且同一观念的阵营内部亦存在一定程度的区别。信奉形式法治的理论阵营,就可以依据形式法治的不同特质而大致区分为“依法治理”、“形式合法性”、“民主合法性”等模式[4]91。不同法治观念不仅使法治概念成为一个实质可争议的法律概念[5]164或如德沃金所言的解释性概念,而且使法治指数的评估选择成为一道棘手的难题。
法治指数虽以“法治”为自身的评价对象,但究竟以何种“法治”为蓝本而展开评价,仍有待澄清阐明。这就涉及到法治的“概念化”问题。所谓“概念化”,是指如何准确阐明一个具有一定抽象性的概念。理论上,任何概念应当在内涵和外延上保持一致性;在表述方式上具有简明性,无需借助其它有待解释的概念;此外,还应合理地区分于相邻的其他概念,且易于评估、测量和使用[6]40。概念的内涵与外延常常呈现为一种典型的反向关系。一个概念的包容性越大,其概念化的难度和挑战也会相应增加。法治的“概念化”问题,一方面,与有待容纳的复杂法治现象紧密关联,后者之繁复,既贵为政治理想,又落实为社会现实,既为建设之历程,又系践行之状态;另一面,则与法治的概念争议息息相关,争议使得概念的内涵变动不居,并导致评价对象或评估范围的选择问题。
从既有的法治指数来看,法治概念的争议往往使得法治指数的评估选择具有任意性。例如,全球治理指数的法治指标,其评价对象主要是:“社会行动者信任和遵守社会规则的程度,尤其是合同履约情况、警察和法院的执法状况、以及犯罪和暴力的可能性。”[7]其总体内涵属于形式法治的观念,即强调依法治理的状态和水平,以及社会守法的基本状况。而“世界正义工程”的法治指数则与之具有显著差别,它所评价的对象侧重于法治的四项普遍原则,亦即“政府及其官员受法律约束;法律应当明确、公开、稳定、公平,并保障包括人身和财产安全在内的各项基本权利;法律的制定、执行和司法程序应公开、公平、高效;司法与正义应由德才兼备的代理人和中立者所运送,其人数应充足、资源充沛并代表其服务之社会的各阶层”[8]。它所评价的“法治”混杂形式法治与实质法治观念的多个面向,既要求服膺于形式性的法律之治,又强调实质性的善法之治。
另外,法治现象的繁复同样会影响法治指数或法治指标体系的评价对象选择,影响法治的概念化问题。不同国家的法治径路和水平各有不同,因而存在英国“法治”和德国“法治”的不同模式。与西方国家强调法治的自生自发不同,我国的法治国家建设具有一定的自主性,强调自上而下的有序推进。这种自上而下型的法治国家建设由政府所主导,不仅设定了法治政府的应有之意及内在要求,而且规划了法治建设的纲领计划和时间进度表。作为政府主导的法治建设模式,各级政府的“法治作为”是法治政府建设的重点考评对象。在考核各级政府“按计划、有步骤”的法治作为时,其考核是全方位的,包括诸多具有自身国情特色的内容。例如,与国外对政党法治的考察不同,在法治中国的建设进程中,执政党的依法执政攸关法治建设的成败得失,因此,依法规范执政党行为的“法治政党”理应成为中国特色社会主义法治不可或缺的内容。在这一点上,法治的“地方性”或法治现象的繁复,向法治的概念化提出了一个新的要求,即在承认和保留法治的普适性要求时,应合理兼顾法治的地方性资源和内容。也就是说,科学的法治指数设计必须要兼顾法治评价对象和评估内容的普遍性与特殊性[9]。
最后,法治的概念化还应注意与相容概念或相邻概念的关系问题。很显然,根据对法治的普遍认识和理解,法治的概念必须兼容“分权与制衡”、“依法行政”等概念和内容。因为,从法治的最初理解来看,法治的要义相当于“有限政府”,即政府的权力必须有明文的授权方得行使之。“有限政府”意味着“分权与制衡”,更意味着“依法行政”、“依法治理”。至于,法治是否应相容于“民主”、“基本人权保障”、“反腐败”等概念和内涵,则多取决于使用者或评估者的使用或评估意图。例如,我国法治建设评价指标体系的建构依据通常是关键性的规范性文件,如国务院下发的《全面推进依法行政实施纲要》和《关于加强法治政府建设的意见》,或如江苏、浙江、湖南、湖北等省所颁布的法治地方实施纲要。该规范性文件不仅确立了法治政府或法治地方的建设原则和目标,而且对不同层面的法治建设提出了细致入微的规范要求,其内容涵盖法治政党、法治政府和法治社会等方方面面,包括民主法制建设、人权保障、政府清廉、社会稳定发展等诸多内容。但是,这种过于宽泛的理解往往使得“法治”概念成为一个无所不包的口袋,将相邻的概念内容亦摄涵其下,造成概念边界的模糊不清,进而引发概念混淆的问题。“余杭法治指数”就是一个明显的例证。它明确将“依法加强社会建设、推进全面协调发展”作为法治指数的重要指标予以评估,不免犯下与“经济、社会发展”之概念相混淆的错误。因为,虽然法治与发展具有正向之关联,法治可以促进和推动经济、社会的发展,而后者同样可以反刍法治的实现和达成,但两者终究只是一组相邻的概念,它们完全可以相互背离,亦即,经济发展可以践踏法治为代价,而法治的进步亦可与经济的衰退相同步。
阐明法治的概念仅仅是构建法治指数之初步,其结果往往是一组冠之为一级指标的指标集,并以法治的原则性规定和要求为具体形式。但是,这样的初步显然不够,仍难以达到量化评估的程度。在本质上,指数是一种数字化的量化工具和手段,通过多种数据取样进行综合、叠加、统计运算而获得相应数值,以衡量和评估复杂事物和现象的总体状况。作为一种认知手段,法治指数可以一种形象化、可视化的数字方式披露和展示法治现象的复杂面貌。为此,法治指数的建构需要细化到可以数字计量的程度,并落实为具有可操作性和可测度性的具体指标。
具体指标是评价或测量对象的替代物,从而为复杂概念或观念提供一个简化的测量[10]172。所谓“替代物”并非概念或对象的本体,而是不可见之概念或对象本体的现实映射。理论上,本体与替代物之间存在一定的包容与被包容关系,从而可用替代物来展现评价对象的现实状况。但实际上,如果指标选取不当,那么就有可能造成指标的替代观测要么与被测量的概念或对象根本无关,要么只能管窥事物的局部或片面。消费价格指数(CPI)就是一个典型。通常,它被用于反映和测量一国通货膨胀或紧缩的程度。但由于我国CPI指数所选商品和服务的价格多与人们的衣食相关,虽则官方统计的CPI没有造假,却与现实情况和实际感知的通货膨胀程度存在较大误差[11]。法治指数的指标选取亦可能如此。例如,二审的改判率通常被视为司法公正的一个替代性指标,它的高与低似乎可以直观地表明一审判决的错误水平与公正程度。然而,如果忽略相关细节的重要性,二审改判率的指标高低无法直接得出司法公正程度的判定,因为二审改判率可能仅仅说明上下级法院的法官们对同一案件的认识和理解不一[12]。鉴于法治水平无法直接测量而不得不依赖于替代性的具体指标,因此,如何选取、设定相关的法治指标就变得至为关键。法治指标的选定不仅需要严格的假设检验和有效性检验以确保被测度的事项与法治的概念充分相关,而且须考虑到指标是否包含反映测度事项的内容[13]324,亦即是否真正属于测度事项的替代物。
此外,与可替代测量的法治指标相关,法治指数的建构还需考虑数据收集和数据来源的可靠性问题。当前,各类法治指数所面临的一个共同难题是,缺乏可信的数据来源和客观数据。尽管公认的数据来源主要有四种,即:来自官方调查和统计的政府数据;法律文本与文献分析;专家投票;公众调查,但每种数据来源均有一定的限度与不足。以常见的政府统计数据为例,它被认为是政府行动的重要信息来源,但其准确性往往变动不居,且常因与测量对象无关的因素而随机波动:有时是政府统计口径发生变化,有时则因为负责采集与统计的相关部门有意伪造或瞒报真实数据。政府数据虽然记录了政府的接触面,但不可避免存在片面或低估的可能性。为了避免过于依赖单一数据来源而导致的系统性偏差,当前多数法治指数均采用组合式的法治指标体系,以兼采主观和客观指标之所长,或平衡单一数据源的系统偏见和误差。即便如此,若仔细考察组合式指标体系的具体构成,数据的可靠性问题仍然存在。例如,无论是世界正义工程的法治指数,还是浙江余杭的法治指数,为了平衡单一数据源的认知偏差,均采用了专家投票和公众调查的组合加权方案,并通过内外部评估组的对比分析和平均加权计算公式得出最后的评分值。通常,专家投票与公众调查的数据来源各有其优势和不足。专家投票适合于需要专业知识或经验的论题,而设计良好的公众调查属于公共舆论的直接测量,有助于平衡专家投票的专业偏见,但两者本质上仍然是对不同群体之感知测度,并可归属为主观评价的范畴。考虑到信息不对称和认知偏误的影响,再加上调查设计本身是否得当的问题,其信度和效度不免存疑。为此,法治指数的建构还应当慎重考虑数据收集和数据来源的问题,既借重于客观中立的事实数据,又博采不同主体的主观感知数据,以规避数据来源所引发的可靠性和真实性问题。
最后,法治指数的建构还是一个复杂的系统工程,每个环节和步骤都至关重要。2008年,经合组织(OECD)在《综合指数的设计手册》中曾经提到,一个理想的建构步骤与顺序,涵摄概念框架、数据选择、数据处理、多元分析、标准化、不确定性和敏感性分析、与其他指数的关联、分解为基础指标、结果可视化等环节。该手册认为,指数建构的每个步骤都极为重要,因为每个步骤和阶段所作的选择都将对其后的步骤及整体结果产生重要的影响[14]249。为此,每个步骤均应当根据不同阶段的任务和要求,采用妥当合理的科学方法来处理和分析,以免影响指数构建的系统性和有效性。
法治指数的科学建构,有着重要的应用意义。在描述的意义上,它是理论研究和分析的有效工具和测度方式,不仅可以综合测算法治发展的状态和水平,而且可以发现和识别法治发展过程的问题与不足。从应用状况来看,法治指数还为相关的规范性应用提供了基础:其一,作为以证据为基础的评估形式,它可以用于政府绩效评估的规范意图,以考核政府的施政行为与绩效,尤其是可以用于评估各地政府在推进法治政府建设的各项工作及其实效;其二,通过揭示励行法治过程中的问题与不足,法治指数可以成为诊断法治建设之病理的工具,从而不仅为法治建设的未来发展走向提供一定的预测价值,而且可以为完善相关法治建设指明改革的方向和重点。
值得注意的是,法治指数的应用同样存在一些问题和陷阱。首先是指数比较问题。当法治指数以特定的数值出现时,人们有可能会产生一种错觉,即评估结果可以互相比较高下。然而,指数虽然有用,却往往是不可比较的[15]165。其理由是,比较将不可避免地失去其语境或上下文[16]。一个简单的事例是,香港法治指数与余杭法治指数的最终得分虽然非常接近,但不能比较两地法治水平的高低,因为两者所采用的评价标准和指标体系是完全不同的。因此,即便余杭法治指数的得分低于香港法治指数的得分,却不能说明余杭的法治状况可与香港的法治水平相提并论。换言之,我们必须承认,不是所有的法治指数都可以进行比较。不同层面、不同标准的法治指数尽管以同样的数字形式出现,但失去其语境的比较是毫无意义的。这并不完全是法治指数本身的问题,而是我们应当如何解释和利用它们的问题。
法治指数的应用,总体上归属于法治指数的解释问题。也就是说,我们必须理解法治指数建构的语境与体系,并在相应的语境或体系中阐述法治指数所揭示的资讯。唯有如此,才能比较法治指数的得失。法治指数的比较是可能的,只是我们必须充分认识到其可能的限度。从事定量研究的学者们早已指出,为了能够进行比较,指数必须满足最低限度的技术要求,包括概念的一致性、标准化且可靠的数据收集,适当的汇总、赋值、加权和标准化方法等[10]165。在评价对象和范围一致、评估标准和指标统一的条件下,法治指数的跨国或跨地区比较才具有意义,它不仅能够对不同社会体制和文化进行比较分析和研究,而且可以使法治建设具体举措和绩效的评价趋于统一化[17]150。
法治指数应用的另一问题则是一个更为深层次的问题。当我们谈及法治指数可以为完善法治建设提供改革方向时,应警惕一种简单化的思维倾向,即将法治指数或法治指标的分值高低作为进一步努力完善或改进的方向。这种简单化做法,仅关注法治指数本身所提示的表面问题,并冀望法治指数或指标的改善,即足已表明法治建设的发展和进步。这种错误认知的问题根源在于,未能充分认识到指数或指标的转换原理,即目标对象的测量是通过间接评估相关替代物来实现的[18]184。例如,司法效率的评估通常采用法院的结案率作为考核的硬性指标,但该项指标的高低实际上不能完全反映司法效率的水平。这是因为,为了追求并实现高结案率,一些法院往往采取年底不收案,或将本年度的案件挪为下年度立案,或在年底采用突击办案、压缩办案周期等方法[19]164,人为控制立案数或结案数。如此做法虽有助于提高法院的结案率指标,却与司法效率的价值取向背道而驰。因此,如果仅关注于指数本身的得分高低,而不去认真剖析相关问题的产生根源,那么所采取的改善或改革措施只能是流于表面。
总之,作为复杂社会现象的量化评估形式,法治指数的建构是可能的,但是它不仅需要厘清法治概念的内涵及其与相邻概念的分野,而且需要科学方法和程序的辅助,确保被测度的事物与法治概念充分相关,并妥善解决数据来源和数据处理的问题。与此同时,法治指数的应用无论是在描述的层面上,还是规范评估的层面上,能否比较取决于评价对象与范围、评估标准的统一性和一致性,且不可避免依赖于特定的评估体系与语境。法治指数的规范应用进一步要求,不能仅仅停留在对法治指数得分的迷思上。法治指数的高低仅表明了成绩与不足,但其具体问题及其成因则有待挖掘和分析。
[1]钱弘道、戈含锋、王朝霞、刘大伟.法治评估及其中国应用[J].中国社会科学,2012(4).
[2]钱弘道.法治指数:法治中国的探索和见证[N].光明日报,2013(11).
[3]蒋立山.中国法治发展的目标冲突与前景分析[J].法制与社会发展,2009(1).
[4]Brian Z.Tamanaha.On The Rule Of Law:History,Politics,Theory[M].Cambridge University Press,2004.
[5]Jeremy Waldron.Is the Rule of Law an Essentially Contested Concept(In Florida?)[J].Law And Philosophy,2002(21).
[6]Gerring.Social Science Methodology:A Criterial Framework[M].Cambridge University Press,2001.
[7]World Governance Indicators[EB/OL].http://info.worldbank.org/governance/wgi/pdf/rl.pdf(2013-11-01访问).
[8]The World Justice Project Rule of Law Index 2012[EB/OL].http://worldjusticeproject.org/publication/rule-law-index-reports/rulelaw-index-2012-2013-report(2013-11-01访问).
[9]姚建宗.法治指数设计的思想维度[N].光明日报,2013(11).
[10]Jim Parson.Developing Clusters of Indicators:An Alternative Approach to Measuring the Provision of Justice[J].Hague Journal On the Rule of Law,2011(3).
[11]CPI真实反映了物价上涨程度?[EB/OL].http://www.infzm.com/content/51638(2013-11-01访问).
[12]孙华璞谈社会上反映的改判率比较高的问题[EB/OL].http://news.xinhuanet.com/misc/2006-03/11/content_4290739.htm(2013-11-01访问).
[13]Julio Rios-Figueroa,Jeffrey K.Staton.An Evaluation of Cross-National Measures of Judicial Independence[J].Journal of Law,Economics,and Organization,2012(3).
[14]Michaela Saisana and Andrea Saltelli.Rankings and Ratings:Instructions for Use[J].Hague Journal On the Rule of Law,2011(3).
[15]Juan Carlos Botero,Robert L.Nelson and Christine Pratt.Indices and Indicators of Justice,Governance,and the Rule of Law:An Overview[J].Hague Journal On the Rule of Law,2011(3).
[16]Bruce L.Berg.Qualitative Research Methods[M].Pearsons,2004.
[17]季卫东.以法治指数为鉴[J].财经,2007(10).
[18]高隆昌.社会度量学原理[M].西南交通大学出版社,2006.
[19]张军.人民法院案件质量评估体系理解与适用[M].人民法院出版社,2011.