摘要:随着社会的发展和法治进程的不断推进,中国本土法治评估运动方兴未艾。中国法治评估建立在理论、技术、制度和现实基础之上,具有一定的现实可行性。国外法治评估的引入与地方评估实践的开展,积累了大量关于中国法治评估的经验教训。当前,中国法治评估实践面临的问题主要包括“价值标准缺失”“制度指向混乱”“功能配置局限”及“数据真实与监测缺位”。建设中国本土化的法治评估,应当从“设立相对统一价值标准”“建立评估制度维度基本框”“明确自身功能定位”以及“建立规范的抽样与复核验证程序”四个方面入手,进行理论层面的解答和建构,为中国法治评估的调整、改进提供积极的意见或参考。
关键词:法治评估; 价值标准; 制度维度; 样本复核
时至今日,法治在全球范围内的诸多国家得到认可与适用,正如《民主与价值观念宣言》宣称“我们相信法治,它公正地尊重和保护着每个公民的权利和自由”,法治成为人们追求自由、平等、秩序等价值的保障与条件。“从国际经济领域的投资合作,到人道援助的成效考虑,一国的法治状况都受到相当多的关注,客观和准确地评估一国法治状况就成为一种现实需要” (钱弘道,2012a)。在这种背景之下,法治评估营运而生,从美国的兴起到传播至全球多个国际和地区,发展至一种国际化的法治衡量工具,也成为评价一国法治发展水平的标尺,得到全球范围内多数法治国家的认可与推行。中国就是在这种形势下引入该工具的,在引入法治评估的同时又赋予其新的功能与任务,着力将其打造为中国法治建设的“助推器”。然而,法治评估引入之后却出现种种争议和讨论,对评估法治内容的争论以及评估方法与技术的怀疑也甚嚣尘上,甚至有学者将法治评估视为一种数字化的工具或游戏(志灵,2008;陈林林,2013)。为此,笔者从法治评估的可行性出发,分析法治评估在国内外的实践样态,并通过对中国法治评估实践中基本问题的商榷和探讨,洞悉当前中国法治评估中的不足和缺陷,借此对当下中国普遍推行的法治评估提出合理与科学的改良建议。
一、中国法治评估的可行之基
法治评估在中国的应用首先应解决三个核心问题:其一是法治能否实现(中国)评估?其二是法治评估是否适合中国法治?其三是中国是否需要法治评估?这三个问题环环相扣,结合并指向法治评估的基础。笔者提出中国法治评估的法理基础、技术基础、制度基础以及现实基础四组基础维度,并对此进行详细的论证参见表1。
(一)理论基础:法治内涵的可分性
法治评估是指通过法治内涵的概念化和概念的操作化,建立法治相关指标,运用一系列实证方法,对国家、地区抑或是社会的法治状况进行评价的一项系统工程。法治评估的关键在于提取与法治概念对应的类型化要素,借此生成出细微的法治指标。事实上,类型化的法治要素在法治理论中早就存在。亚里士多德早就提出了法治的双重意义(亚里士多德,1965),古罗马和中世纪时期,法治的细化趋势也未停止,并形成三项法治划分的共识(夏勇,1999)。自由资本主义兴起以后,学者们对法治要素的划分也趋于精细。马克斯·韦伯提出法治秩序的主要标准(季卫东,2008)、富勒提出法律的内在道德亦即法治的八项要素(2005)、拉兹提出合法性法律模式的八项构成要素(2005)、菲尼斯提出法治八项要件(2005)等。我国学者吸收了西方学者的法治划分思路,基于本土法治国家建设的特征和需求,提出了中国的法治构成要件。李步云提出法治国家的十项原则和要求(2003),张文显提出实现法治国家的技术条件(2007),夏勇提出法治的十大规诫(1999)等。学理上概括的类型化法治要素,历经由简单到复杂、由模糊到明晰的过程,形成内容丰富且层次多样的划分标准,构成了法治评估可行的理论基础。现代各国,无论是成文法国家还是判例法国家,在保持法治价值追求的同时,开始在法治的形式上相互借鉴和学习,使得法治基本要素出现趋同,呈现出一种法治全球化趋势,这些理论上的共识和对法治要素的认同也使得法治评估在中国的开展具有了理论上的合理性和正当性。
(二)技术基础:指标与统计技术的成熟
在法治的概念可操作化为不同要素的前提下,如何将法治的各种属性和特征抽离成各种可测的、可数据化的指标,仍需要可行性的技术支持。这种技术支持主要源于指标自身的认知功能和先进的统计分析技术。
一方面,法治指标自身具有认知功能。作为一种测量尺度,指标能用来准确描述、反映、比较和评价法律现象及其发展与变迁的规律(冉井富,1999),准确反映法治建设中存在的普遍性问题和缺陷。认知功能强调法治指标具有可计量性、概观性、现实性概观性是指法治指标能够描绘某个国家、地区的整体法治图景。可计量性指法治指标所提供的信息和数据是具体、精确、直观的,是可以计算且可以用于横向比较的。现实性指法治指标是法治建设的现实反映,能够客观、真实地反映法治实施的运行现状、运行效果和运行变化等。,通过对法治概念的层级操作,使抽象概念下降到经验层次,形成可实际测量的法治指标。通过数据汇总并按照权重比例折算成为直观数字,评估区域对象的法治程度,对比不同区域的法治差异,并引导社会成员对法治建设形成最优行动选择。
另一方面,量化方法与技术的成熟与进步。在现代社会科学的研究中,以统计分析为核心的定量研究已经成为一种主流的研究模式。经过几十年的实践,量化技术包括指标操作、抽样策略等都较为成熟,统计应用也从最早的简单百分数等统计量发展到回归和方差分析,再发展到多元统计分析、结构方程、模糊综合评价模型等。这些技术手段从经济学、社会学领域逐渐扩展至法学领域,白建军以“死罪”案例为样本进行法律解释学的实证研究,作出死刑阶梯与关系的分析就是很好的例证。随着统计分析技术在人文社科领域的推进,通过计量与统计技术把握研究对象的共性问题成为现实可操作的方法,为法治的评估量化研究提供了充分的技术保障。
(三)制度基础:相对完备的规范体系
以法治作为立国之本已成为人们的共识,而法治评估的制度基础就是待评估地区或国家是否确认了法治的治国形式,这也是采用制度性进路开启法治评估的关键所在。制度性进路是指“以法治规范为维度组成法治概念并寻此进行评估操作化的方式”(张德淼,2014),这种方式较之价值性进路而言,可使研究更为聚焦(戴耀廷,2007),也符合当前中国法治建设的制度配置状况和对法治评估的特定需要。
法治评估的制度性路径要求评估区域或国家确立法治制度,而法律全球化背景下,无论是国际法的国内化,还是国内法的国际化,实际上都导致了在一国或一地区范围内的法律制度在更大范围甚至世界范围内得到推广(朱景文,2006),这也给制度性进路的法治评估提供了更广泛的可能。20世纪70年代末以来,中国在制定法律过程中吸收和借鉴了大量的外国法和国际惯例,这些普遍性的制度规范在长期适用中不断修改和增补,逐渐融合中国本土法治现实和法治需求,形成了既具有全球化特征又具有地方性特色的中国社会主义法律制度。2011年10月,国务院办公厅发布《中国特色社会主义法律体系》,实则是对业已形成并普遍适用的法律制度化、体系化的确认。中国现有的、相对健全成熟的法律制度及其广泛实施,恰恰构成了法治评估的制度性基础,给制度性进路的法治评估项目开启提供了充分的可行性。
(四)现实基础:中国地方法治实施的现实困窘
中国是全球法治化进程中的一员。中国共产党的十五大报告、十六大报告分别以“坚持党的领导、人民当家做主和依法治国有机统一”“深入落实依法治国基本方略列入实现全面建设小康社会奋斗目标”,对依法治国进行纵深推进。中国共产党的十八大报告提出“全面推进依法治国”“加快建设社会主义法治国家”,将法治治国提升至新的高度。十八届三中全会更是明确提出推进“法治中国”建设,并将“建立科学的法治建设指标体系和考核标准”作为法治发展的有力抓手。到了十八届四中全会,全面推行依法治国,建设法治规范、法治实施等五个体系成为会议主题,与之相对应的是各级政府、社会团体、个人的职务行为、组织行为、个体行为也被纳入到法治化轨道中。然而,在这种背景下,中国法治建设所处的阶段、状态和普遍性问题,学术界和相关部门仍然没有形成统一的认识,关于中国法治之路的选择以及内容取舍仍处于不断讨论中。
法治评估恰能回应这一悬疑。法治评估能够实现对不同社会体制和文化的比较,为改造权力结构提供更清晰的蓝图,以及使法制建设的具体举措和绩效的评价趋于统一化(季卫东,2008)。法治评估通过量化手段能够从整体上分析中国法治实施的状况、程度、问题,能够从纵向上反映法治建设投入实施之后的成绩和不足,从横向上反映不同地区法治实施的类似与差异,促使不同国家、地区之间进行法治领域的比较与沟通,为现行法律体制的发展完善提供资讯,追求更高水平的法治,改善法治环境。马怀德教授甚至认为,在中国推行法治与发展经济一样,需要来自政府的强大动力,“包括法治指标在内的较为全面的政绩考核标准,恰恰能够提供这样的动力”(马怀德,2011)。这大抵也反映了法治评估对落实依法行政、促进司法公正、推动法治进程的现实价值。
二 、法治评估的国外引介与地方实践
(一)国际法治评估项目的萌生与兴起
倘若将理论上法治的细化作为指标形式理解,法治评估的理论解说看似历史源长。但是,从操作层面建立法律指标却只能追溯至美国学者伊万。伊万在1968年提出法律与社会相结合的70项指标;1979年,梅里曼、克拉克和弗里德曼在欧洲和拉丁美洲国家法律与发展专项研究中,将法律制度分为立法、行政、司法等六个方面,在每个方面内部从机构、工作人员、程序和消耗资源四个方面进行考察,形成法律制度的分析结构(朱景文,1994)。截止1999年10月,专门编制民主、法治、治理等相关指数的研究报告与出版物至少有十多种,例如《世界自由度指数》《欧洲自由指数》《国家风险评论》《世界发展报告》《全球国家风险指南》《国家风险服务》《全球竞争力调查》《转型国家》等(占红沣,2011)。2005年,世界银行发布的《国别财富报告》正式提出“法治指数”的概念,以全球120个国家和地区为样本对公民守法意识及对该国法律制度的信任程度进行评判(The World Bank,2006)。2007年,由维拉司法研究所及阿尔特斯全球联盟主持的“世界正义工程”在沿袭西方法治理念的基础上确定了以合法政府、公布法律、正当程序、可实现的司法正义为原则的法治评估指标体系(Mark Agrast,2011)。2011年由联合国相关部门与世界银行联合发起的法治指标项目,旨在辨认不同国家或地区法治发展的状况及其间存在的问题,为各国法治改革提供参考意见。
近年来,随着法治视野的开阔和评估学认识的深化,特别是一些国家以社会系统工程为框架在各个领域推行目标管理模式,法治指标作为一种衡量标准和研究方法在各国得到了较为广泛的应用。例如美国政府颁布《政策规定绩效分析》(黄良进,2009),对政府工作的合法性和合理性进行考评,此类的实证性法治指标体系日益增多。香港法治指数调研,标志着法治评估开始引入并应用于中国部分地区;“法治评估试验田”的余杭法治指数在2006年发轫,法治评估作为中国法治建设的一种制度和方法创新得以兴起。
(二)中国法治评估的地方实践
2004年,中国社会科学院发布了中国首部法治蓝皮书《中国法治发展报告NO.1(2003)》,2008年国务院新闻办公室发布我国首部政府法治白皮书《中国的法治建设》,关注的法治重点从起初的“热点问题”解读转变为行政体制和司法改革实践,进一步发展为“国情调研”和“地方法治”等明显带有量化特色的实证研究。例如,《中国法治发展报告》2011年、2012年连续收录了“中国政府透明度年度报告”,《中国法治发展报告NO.10(2013)》还收录了“余杭法治指数报告” 《中国法治发展报告》关注重点的转变可从每年目录的变化中发现。2003年报告中突出强调个案形式的“热点问题报告”,而到2008年、2009年,法治改革、法治建设、法治实践成为报告的主体内容。2011年、2012年更是将实证调研、指标数据资料作为其重要组成,在“国情调研”和“地方法治”栏目中列入部分全国性量化数据和区域性量化数据报告,体现了法治研究方法的创新和突破。,2014年发布的法治蓝皮书进一步强化了地方典型法治经验的具体描述。
与学界的热烈讨论相比较法治评估在学界引起较多的关注和讨论,多数学者对法治评估持肯定态度,观点集中于“为什么进行法治评估”、“如何进行法治评估”等,有学者从法治基本理论出发,对法治评估的前提、正当性和功能作出论述,也有学者关注全国性或区域性法治指标的建构与推行。质疑者多集中于指标设立的条件和功能等问题,以及法治评估的本土操作化问题方面,对法治评估是否能够反映中国法治状态,法治评估方法是否真实有效存有质疑,而非绝对摒弃法治评估。,法治实践领域早已悄然出现以政府为代表的法治评估运动。2009年国务院办公厅发布《关于推行法治政府建设指标体系的指导意见〈讨论稿〉》以来,以行政级别与区划作为基本单位的各类法治评估项目层出不穷,例如,2010年湖北省颁布的《湖北省法治政府建设指标体系》,2011年辽宁省颁布的《辽宁省法治政府建设指标体系》,2012年广东省惠州市颁布的《惠州市法治政府评价指标体系》。近年来,中国法律发展指标研究为法治评估奠定了一定的基础(朱景文,2007、2011),立法后评估和司法绩效评估(张禹,2008;丁贤;2008;刘松山,2008)等立法、司法领域内专项评估的广泛开展也为法治评估积累了相当的经验教训。2006年,中国内地出现首个法治评估实验项目——余杭法治指数,设置“党委依法行政”等九组指标,以客观数据、考评及民调为方式,设置内部组、外部组和专家组对调查结果进行评议(钱弘道,2013)。2013年,中国政法大学政府研究院组织实施的法治政府评估项目,发布了《中国法治政府评估报告》(2013),覆盖到全国53个省会城市、较大的市,并做出相应的排序。2014年,司法文明协同创新中心项目组组织实施司法文明评估项目,覆盖全国9个省和直辖市,实现了对不同省市司法文明程度的量化考察。虽然这些评估项目涉及层面较为狭窄,内容相对简单,但其设置操作化指标,采用量化技术,保证了数据的丰富性和受访主体的多样性,具有积极和进步意义。
三 、中国法治评估面临的问题与挑战
正如吉尔兹所言:“法学与民族志,一如航行术、园艺、政治和诗歌,都是具有地方性意义的技艺,因为它们的运作凭靠的乃是地方性知识”(吉尔兹,1994)。法治无法摆脱地方性特征的约束,具有嵌入特质的法治评估也必须结合中国自身的体制结构特征、法律文化特征和公民意识状态作出,否则就可能出现“南橘北枳”的局面。那么,当前普遍开设的法治评估是否契合中国法治的本土情境,已开展的法治评估是否建立了富有操作性和科学弹性的评估方法,是否真正起到评价、预测中国法治的成效,仍面临着重重问题。这些问题同时也是一种挑战,查找法治评估在本土改造中的不足与缺陷,才会让我们有效调整和改善法治评估,发挥其真实功效。具体参见表2。
(一)法治价值标准缺失
量化法治的重要特征在于实践性,保持其实践性的前提在于定义法治。“法治是一种理想的运作体制和人类追求的目标……法治追求的目的是与特定的历史条件下权力主体的法律精神密切相联的……最终归结到法的精神与理想上去”(眭鸿明,1999),任何对法治的定义都必须承载基本的价值标准,否则终将背离法治的追求。拉兹、富勒等人提炼形式价值要素对法治作出抽象界分、自由主义者基于实质要素对法治作出理解以及塔玛纳哈提出的涵盖形式与实质价值的综合法治构想莫不如此。
已有国际法治评估项目中也能看到法治价值标准的应用,在“世界正义工程(WJP)”法治指数设计中,研究者提出“形式合法”“法律颁布”“正当程序”“可实现的司法正义”四项原则(理念),将这些要素贯穿于法治评估的全过程。在中国,法治建设在规范层面具有统一性,在价值层面也具有共通性,但多数法治评估却没有呈现出完整的、普遍的法治价值要素。譬如,“湖北法治评估指标体系”在“全面推进依法行政”中提出“权力运行的限制与制约”“民主建立健全”等价值相关要素,但其使用更像是对“依法行政”的操作细化而非价值要素的融入(湖北法治发展战略研究院,2013)。部分法治评估研究者认识到法治价值在法治评估过程中的地位和作用,但这些项目所提炼的法治价值要素相对片面,且使用上较为隐性。例如,余杭法治实验中提出“法治不仅是一个执政者和公民都应该遵守的法律规范系统,更是一个包含强烈价值内涵的观念与实践”,并就此提出“限制政府权力”和“保障公民权利”两项价值要素(钱弘道,2013)。从这两个价值要素概括中国的法治价值是否合适,是否能够满足中国法治评估的价值需求还有待商榷。
客观而言,“评估的基本逻辑……首先是确定价值尺度,即在什么样的标准下对评估对象进行评估才有意义”(Fournier,1995)。作为截取纷繁现实材料并剔除无关信息的一种筛选技术,指标之所以承载与反馈法治内涵与特征,是因为在从抽象层到经验层的推进过程中,我们能够建立一个贯穿于法治评估指标体系所有环节的价值尺度,赋予经验客观的测量指标以更加普遍性的法治价值指引,这也是“世界正义工程(WJP)”法治指数能够突破不同国家或地区法制多样限制,实现不同地区比较的关键所在,同样这也是中国法治评估屡遭诟病的重要原因。
(二)制度指向混乱
就中国主要采取的体制性进路而言,因其以制度结构要素作为指标划分的依据,研究的基点即制度指向尤为重要(张德淼,2014)。然而,在当前中国法治评估实践中,制度内容的选择与适用上仍处于一种混乱局面。
“法治指数是全球化时代绘制世界法律地图的一种新构想,也是全球法律散播的一种新形式”(鲁楠,2014),具体至中国空间维度上,各地推行的法治评估是国家法治思想散播的重要方式,但同时各省市也出现了林林总总、各行其是的评估指标的创设局面。例如,国务院和各省级机关的“法治政府指标体系”2009年国务院办公厅发布《关于推行法治政府建设指标体系的指导意见(讨论稿)》;2010年湖北省颁布《湖北省法治政府建设指标体系(试行)》、2011年北京市政府下发《关于加强法治政府建设的实施意见》、2013年4月广东省发布《广东省法治政府建设指标体系(试行)》。 、行业机构的“xx法治指标体系”2013年国家工商总局颁布《工商行政管理机关法治工商建设评价指标体系》;2012年江西省宜春市工商管理局颁布《宜春市工商系统法治工商建设考核指标体系》。 ,不同市区级机关的“法治城市建设指标体系”2008年发布的《青岛市创建法治城市目标责任分解》和《青岛市开展法治城市自测评估体系》;2012年颁布的《沈阳市法治政府建设指标体系》;2012年1月颁布的《惠州市法治政府评价指标体系(试行)》。,等等。再例如,余杭法治指数提出的九组指标中与各省市推行的法治政府指标体系在“依法行政”“规范市场”和“监督体系”方面较为相似,但在其他方面却大相径庭。
从时间维度上看,即便在相同空间范围内的法治评估内容仍有不同的表述。例如,2010年湖北省已经颁布实施《湖北省法治政府建设指标体系(试行)》,2013年又再次建立 “法治湖北”指标体系(方政军,2013),后者远突破前者关于法治政府评估的设定,并将经济、文化、社保等一揽子内容都归入法治评估名下,二者的区别显而易见。
无论在时间还是在空间维度上,中国法治评估都没有在法治制度适用上实现统一、规范的表述方式。法治指标体系的功能原本就是建立一个相对普遍适用的模式,实现对国家或区域的法治状况的客观与量化的描述,然而在中国内陆这个法制体制统一的范围内,不同地区、行业却出现各自为政、各自评估的局面。自己做自己的评委,与其他地区无涉的作法是否能够准确评价法治建设状态呢?这点仍存在疑问。同一地区并行的不同法治评价指标体系之间是相互补充还是相互拆台,抑或是各自为战,也很难作出合理和科学的解释。
(三)功能配置局限
量化评估有助于衡量和评价法治状态,但是量化研究方法亦存在先天不足。量化研究具有描述普遍性和整体性的功能,涂尔干在《自杀论》中用社会事实的因果关系分析反常的自杀,得出当个体同社会团体或整个社会之间的联系发生障碍时,会发生自杀现象的结论就是很好的例证(迪尔凯姆,2008)。但是,量化研究亦具有局限性,如未得到恰当和谨慎的使用,就可能形成不科学、不真实的判断。
在中国法治评估实践中,研究者倡导法治评估正向功能的同时,往往忽视掉其在应用中的功能局限。其一,功能逾越。如果说通过评估采集法治资源、测量法治信息的功能定位尚且合理的话,那么,将法治评估理解为指导法治建设、引领法治改革方向乃至加快中国社会主义民主法治进程却比较牵强。按照十八届三中全会对法治评估的定位,法治建设与法治评估是一种主辅关系,二者之间不是“一”对“一”而是“一”对“多”的模式。在法治评估之外,还包括“法律顾问制度”“规范性文件、重大决策合法性审查机制”“社会普法教育机制”等多种辅助手段。显然,在评估项目实践中,法治评估的作用被过度渲染。其二,功能错位。中国法治评估活动中,研究者习惯于将不同地区的评估结论数字化进行排序,用来衡量评估地区的法治化程度和地方政府的法治治理能力。但是,制度性进路的法治评估只能反映评估地区的法治相关规范、制度的落实情况以及问题与成效,而无法反馈该地区提供的法治环境与法治现实水平。至于地方公权力机关的治理能力方面,也会因当地经济、文化、民族等多重社会性因素而多有差别,制度性进路的法治评估实难衡量政绩的有效依据。不恰当地理解和应用法治评估,势必对地方法治建设的开展产生副作用。其三,功能空白。尽管多数评估项目也提出查找、捕捉法治问题的功能,但是多数评估结论大都是给出大概分值,例如余杭指数、法治政府评估等,对普遍法治问题、核心法治难题、法治实施缺漏的发掘和分析尚显不足。
(四)数据准确真实与监控缺位
法治评估的真实有效不仅源于指标设计的合理和科学,是否能够真实地收集资料、获取样本更是法治评估成功与否的关键,甚至决定了评估活动的价值和意义。目前,中国法治评估实践项目对数据收集的价值与作用有所忽视。其一,抽样方法混乱。抽样是一种选择调查对象的程序和方法(袁方,1997),抽样调查必须有整套严密思考且符合数理原则的选择程序才能保证调查结果的使用价值(卢汉龙,1986)。科学合理的法治评估问卷,只有通过概率抽样方法从整体框中抽取样本,才能保证样本的代表性和推论总体的可能性。以余杭法治实验调研来看,其设计的主观指标“人民群众满意度调查问卷”是通过实地民调500份以及网络民调649份完成的(钱弘道,2008)。但网络调查本身是典型的非随机抽样;实地调查的问卷来源是采用分层、多段、整群、简单随机等随机抽样方法,还是方便抽样、配额抽样和立意抽样也没有作出解释和说明。以此样本数据是否能够对余杭居民的整体法治满意度作出推论也存在疑问,这种做法在后续的法治政府评估中也同样存在。其二,样本数据质量监控问题。样本数据的真实性可能是量化研究最关注的操作问题,就余杭法治指数而言,客观数据来源于相关机构的统计数字,其数据的真实性处于无监督状态。以余杭信访局提供的“信访案件结案率”指标为例(钱弘道,2012b),2007年到2011年信访结案率均在99%以上,此类数字关乎政府机关的政绩,未经调取复核原始材料无法判断其真实性。而主观数据的复核主要可以采用回访等方式,实地调查的问卷尚可通过电话回访、实地回访等方式确认,但网络民调却无法复核查真。第三,研究人员的独立性问题。世界正义工程采用的是第三方介入的方式(Agrast,2011),而在余杭法治评估、中国法治政府评估乃至司法文明指数中转变为政府合作模式(钱弘道,2012a),政府既是被调查主体,又是与专家学者配合的资料收集主体,还是保证资料真实性的监督主体(王周户,2011)。尽管这与我国政府主导的法治发展模式有关,但由此对数据真实性产生怀疑也是合理的。特别是法治评估的结果用做评价官员工作的依据,很可能会促使他们干预法治评估,令评估的可行性及公正性受到质疑(戴耀廷,2013),甚至容易沦为投机者和政绩工程的工具,损害我国现行法治的良性运行和渐进发展。
其实,早在1997年中国共产党第十五次全国代表大会已经正式提出“依法治国”指导方略,法治的重要作用已经被接受和认识。随着立法、行政及司法改革的推进,特别在2011年中国特色的社会主义法律体系建成后,法治改革和创新也已经成为衡量地方政府、机关业绩的“软实力”。尤其是在十八届四中全会突出强调法治中国的建设,各地兴起政府主导的“法治评估热”是地方法治建设的刚性需求还是政绩工程掩饰下的利益争夺,我们仍需清醒和理性地看待。
四、中国法治评估的理论构建与应对
无论余杭法治指数,还是中国法治政府评估,抑或是司法文明指数,在一定程度上都属于中国法治评估的“实验田”,通过实验暴露问题,并反馈法治评估在更大范围内推广的可行性。钱弘道教授在余杭法治评估数年之后也提出中国法治评估存在一些亟需解决的问题,指出法治评估要进行转型(钱弘道,2015),同样关注评估实践得出的经验教训。法治评估不同于法治,它更多强调评估的建构特质,结合法治规律与中国法治本土特征的前提下,对中国法治评估作出理论层面的调整和改造,才会使这项活动真正观照中国的法治现实,衡量、评价和助推法治中国。参见表3。
(一)设立相对统一的法治价值标准
“法治状态或理想的实现,不仅是在制度的已有上而言的,它还需要信仰领域的支持”(仇延平,2008),法治价值的引领对中国法治建设道路选择意义重大,同样对以法治为对象的法治评估也非常重要。制度性进路开启的中国法治评估,任何维度与指标的设置都会面临价值上的判断与选择,香港法治评估研究者专门就“司法复核个案数的上升数字与法治程度高低的关系”提供了两种截然相反的判断,判断的关键就是该项目依托的价值标准。
在中国法治评估中,价值标准的选择应当遵循两个原则(李朝,2014)。其一,符合良法之维。“纯粹的形式法治包含着走向反面的必然性”(高鸿钧,2001),实质法治价值的匮乏会导致法治评估丧失识别和评判法治正当性的道德力量,无法给现有法治建设的规划提供更为有价值的、科学的咨询,反倒可能出现专制暴虐国家法治程度较高之结论。其二,符合法治普遍规律,兼顾地方性法治特质。“法治……表征的乃是人类共同的生活经验与生活理想”(侯学宾,2013),在推行法治的大多数国家中,各国共享着相同或相似的法治普遍价值,如同“生产力决定生产关系”一样,中国法治建设的前进道路也应当遵循这种基本规律。与此同时,法治评估也应当考虑到自身的地方性法治特征。尤其是近代改革图新以来,作为技术法的形式法治内容得以移植和吸收,在法治实践过程中形成不少地方经验做法和习惯规则,而西方相对成熟的自由、民主思想在中国人治传统中并未生根。在这种国情背景下,尤其是中国社会主义法治建设尚处于发展和完善阶段中,带有地方法治特征的伦理价值也必须在法治评估项目中得到相应的反映。
事实上,根据项目目标的不同,研究者可凭借上述原则进行相关价值标准的创设。例如,对旨在衡量不同地区法治政府建设程度和落实情况的评估项目,规制公权理应成为评估价值标准的主要构成,此外,规制公权后对公众相关权利实施的资源供给等价值要素也可列入评估价值标准中。笔者(李朝,2014)曾就综合性地方法治评估提出四组价值要素,即“法律至上与法制健全”“权力规制与权利保障”“程序正当与形式平等”“实体公正与合道德性”,这也是对法治价值标准创设的一种积极尝试。
(二)建立完整的评估制度维度基本框架
解决当前法治评估制度指向混乱问题的关键在于提供一个可供选择的、基本的法治制度维度框架,该维度框给法治评估特别是制度性进路的法治评估限定了一个基本的范围,承认在法治之外尚且有诸多法治无法覆盖的社会领域,并将视点聚焦至中国法治自身。无论是旨在反映地方法治完整样态的全面评估,还是旨在反映政府行政、司法公正等局部内容的专项评估,都可在这个基本框架中摄取与之相对应的制度要素,不致产生不同项目不同认识、不同选择的后果。考虑到“法治是一种源远流长的意识形态、治国方略和社会文化现象”(张文显,2002),围绕法治的制度或规范配置内容丰富且层级较多,需要以法治的核心制度要素组建法治制度维度,还要在不同法治制度维度之下界定该维度的主要法律制度或规范,明确法治制度维度的核心要素。
其中,法治制度基本维度框架可将“中国法治建设的规划与部署”作为指引,结合《中共中央关于全面推进依法治国若干重大问题的决定》,对之前法治制度规划或部署的持续状态作出判定,实现法治制度诸维度与中国法治实践的深层契合。在不同维度之下范围的选定上,借鉴与应用频度统计法频度统计法是对目前有关法治建设的相关报告进行频度统计,选择那些使用频度较高的维度要素,这点在评估研究中比较常用,对法治制度维度的选择而言,可作为一种参照方式。,以历年法治建设总结为主要来源,并以近年专项法治规划、部分规范文本作为补充,化繁为简,缩小维度范围,提炼相应维度要素选择不同制度维度下比较重要的要素进行纵向操作化,为指标的提出奠定基础。然而,这些核心要素势必不可能完全覆盖处于其上位的法治制度维度。考虑到区域法治的整体性与不同方面之间的内在关系,通过以微知著的方式来估量地区法治现实的真实状态也是有现实价值的。当然,维度要素并非是唯一的而是是多元的,不排斥不同项目中研究者选择不同要素进行评估。。譬如,笔者通过“依法治国”提出以来,围绕着中国法治建设作出的制度规划或部署的梳理(主要是历届党代会报告的相关内容之所以把历届党代会报告作为观测标本,主要是基于党代会报告所提出的法治规划蓝图是中国特色社会主义法治建设的纲领性文件,指导着不同时期和阶段社会主义法律制度建设的步骤、重点与方式。从最近的党的十八大截止至今已经有两年多的时间,属于中国法治建设的真正的、长期的核心或重点,而非短期的替代或实验品。而且,围绕着这些法治规划或部署已经配置相应的法律制度群且投入法治实施过程,产生大量微观测量指标,足以支撑起制度性进路开启法治评估,以法律制度来度量法治的可行。),提炼合理与可用的中国法治的核心制度要素,搭建中国地方法治指标体系的制度维度框架,包括“依法行政与法治政府”“司法公平正义”“法律监督的完备与有效”“权利依法保障”“市场经济规范有序”“社会秩序和谐稳定”“法制宣传与公众法制教育”“环境保护合理得当”八项维度,这实际上也是对明确制度指向的一种构思。
(三)明确自身功能定位
法治作为抽象的理论概念是否具有量化评价的可能性?这个问题已经毋庸置疑,余杭法治指数的研究者也提出“法治很难绝对量化,但也不是说绝对不能量化”(钱弘道,2012b)的观点,这正是诸多学者怀有的期冀,期望通过评估实现对法治的精确认识,这是一种建设性的态度。然而,以量化为标志的评估不可避免地受到方法的局限,不可避免地有其无法覆盖的评估范围,关键要正确理解法治评估的功能。首先,明确法治评估的能与不能。法治评估使用的包括数据收集、统计技术在内的各种方法,从未摆脱研究者价值选择的支配。其一,法治评估发现问题而不能解决问题。法治评估的主要功能是查找法治运行中存在的普遍性问题,但并不反映这些问题背后的原因及提供科学解决方案,这点也可形象地称之为“听诊不看病”。其二,法治评估能用于勘验规划路线却不能引导道路。法治评估之于法治建设规划,是以旁观者身份审视、判断法治建设是否符合预期构想,并及时向决策者作出反馈,但法治评估本身不直接推动法治,仅是服务法治建设的辅助工具,这点也可将之称为“助推不永动”。
其次,善于以其他方式弥补法治评估的不足。法治评估方法有其功能的空白区,比如“同一套数据可有不同的解读,不能直接推算出一个法治指数”(戴耀廷,2013),这时就需要借定性手段来弥补评估方法的不足。
此外,在法治评估的空白地带,还可以考虑利用现有的其他方式,譬如在实地体验、开放型访谈、参与型与非参与型观察等一系列方式进行法治问题的查找和挖掘,毕竟,法治评估是一种重要而非唯一的法治辅助工具。特别是在地方性法治的知识生产方面,进行过程事件的分析也许比横断面上的数据衡量更有现实价值。对评估者而言,唯有清楚认识到法治评估的能力之所限,准确定位法治评估,才能保证法治评估在中国法治建设中发挥正常功能,而不被误用或滥用。
(四)建立规范的抽样与复核验证程序
在法治评估中,“变量的操作化、抽样方案的选取、样本的删除等细微差别,都可能会导致结果很大的差异”(陈云松,2012),评估的科学化和常态化更需要良好的抽样、监督与复核机制。
首先,建立科学的抽样方案。抽样方法的应用对于法治评估至关重要。世界正义工程项目组在进行调研时,从每个被调查国家中抽取三个城市并从中随机抽取1000个样本,这是一种典型的分层抽样。当然,由于地域位差、城乡分化、结构差别等方面不同,这种简单分层未必恰当,但就方法而言却是符合局部推论总体的科学标准的。这对继受世界工程法治指数方法的我国评估项目是有启发意义的。客观来看,实证研究方法提供给我们简单随机、等距、分层、多段等多种抽样方法,在进行调研之初就从中选择可行且合用的方案是非常必要的。
其次,加强样本数据的质量监控。针对法治评估的客观数据,研究者根据被调查机关提供的数据,可以通过对数正态分布检验法、奔福德定律检测等技术对异常数据进行识别,还可以随机抽取部分提供统计数据的机构,对其进行原始数据、材料的复核;而主观数据则可以通过随机抽取问卷进行回访作出复核。
第三,对法治评估活动的复核检验。研究者作为法治评估的主体,其对样本数据的分析和判断活动也应具有复核评估性,这点在国外定量研究中已广为提倡,《美国经济学评论》就明确要求作者必须提供论文相关的数据和程序代码。建立数据公开和开源机制,可以排除评估者倾向于特定模型而推导出符合自己意向结论的嫌疑,也有助于避免“数据游戏”的出现。
五、结语
事实上,法治评估具备“嵌入性”的特质(波兰尼,2007),决定了其既是评估法治的一种工具,同时又嵌生于法治的发展进程当中,是中国法治的重要组成部分。一旦评估面临的法治情景发生变化时,法治评估也必然随之做出调整或改变,否则就可能会出现不适应法治发展需求的后果,也可能会因无法兼顾时间维度差异而产生的新问题、新情况,这也是世界范围内包括世界正义工程在内的各类评估不断调整、不断改造的重要原因。所以,坚持一种以问题为导向的自省思路,立足于已有评估问题,不断解决各类问题的同时持续改造法治评估,螺旋提升评估的应用空间,不断完善法治评估的实践,最终才能使其在社会主义法治进程中作出更为优质、更为高效的贡献。
参考文献:
[1]埃米尔·迪尔凯姆,2008:《自杀论》,中译本,商务印书馆。
[2]陈云松、吴晓刚,2012:《复制性研究——社会科学定量分析新趋势》,《评价与管理》第4期。
[3]戴耀廷,2007:《香港法治指数》,《环球法律评论》第6期。
[4]戴耀廷,2013:《法治评估的理论与应用》,《光明日报》4月9日。
[5]丁贤、张明君,2008:《立法后评估理论与实践初论》,《政治与法律》第1期。
[6]方政军、李鹏翔,2013:《“法治湖北”指标体系建设论坛在武汉召开》,http://news.xinhuanet.com/local/2013-10/01/c_117579660.htm,10月1日最后访问。
[7]富勒,2005:《法律的道德性》,中译本,商务印书馆。
[8]高鸿钧,2001:《法治:理念与制度》,中国政法大学出版社。
[9]眭鸿明,1999:《法治实现论》,金陵大学出版社。
[10]侯学宾、姚建宗,2013:《中国法治指数设计的思想维度》,《法律科学》第5期。
[11]黄良进、肖松,2009:《美国政府绩效评估法治化:历程、特点与启示》,《学术界》第3期。
[12]湖北法治发展战略研究院,2013:《法治湖北建设指标体系(试行)(草案)》。
[13]季卫东,2008:《秩序与混沌的临界》,法律出版社。
[14]卡尔·波兰尼,2007: 《大转型:我们时代的政治与经济起源》,中译本,浙江人民出版社。
[15]克利福德·吉尔兹,1994:《地方性知识:事实与法律的比较透视》,中译本,载《法律的文化解释》,三联书店。
[16]李步云,2003:《法理探索》,湖南人民出版社。
[17]李朝、王华菊,2014:《中国法治评估指标体系的价值基准》,《中国社会科学院研究生院学报》第6期。
[18]刘松山,2008:《全国人大常委会开展立法后评估的几个问题》,《政治与法律》第10期。
[19]鲁楠,2014:《世界法治指数的缘起与流变》,《环球法律评论》第4期。
[20]卢汉龙,1986:《注意社会调查中的科学程序问题》,《社会》第6期。
[21]马怀德,2011:《法律实施有赖于“法治GDP”的建立》,《人民论坛》第29期。
[22]钱弘道,2013:《法治评估的实验——余杭案例》,法律出版社。
[23]钱弘道,2008:《余杭法治指数的实验》,《中国司法》第9期。
[24]钱弘道,2011:《2011年度余杭法治指数报告》,《人民司法》第11期。
[25]钱弘道、戈含锋、王朝霞、刘大伟,2012:《法治评估及其中国应用》,《中国社会科学》第4期。
[26]钱弘道、王朝霞,2015:《中国法治评估的转型》,《中国社会科学》第4期。
[27]仇延平,2008:《社会研究方法》,重庆大学出版社。
[28]冉井富,1999:《论法治指标的认知功能及其局限性》,《汕头大学学报(人文科学版)》。
[29]王周户,2011:《公众参与的理论与实践》,法律出版社。
[30]夏勇,1999:《法治是什么——渊源、规诫与价值》,《中国社会科学》第4期。
[31]亚里士多德,1965:《政治学》,中译本,商务印书馆。
[32]袁方,1997:《社会研究方法教程》,北京大学出版社。
[33]约瑟夫·拉兹,2005:《法律的权威》,中译本,法律出版社。
[34]约翰·菲尼斯,2005:《自然法与自然权利》,中国政法大学出版社。
[35]占红沣、李蕾,2010:《初论构建中国的民主、法治指数》,《法律科学》第2期。
[36]张德淼、李朝,2014:《中国法治评估之选择》,《法商研究》第4期。
[37]张文显,2007:《法理学(第三版)》,法律出版社。
[38]张禹,2008:《立法后评估主体制度刍议》,《行政法学研究》第3期。
[39]志灵,2008:《“法治指数”无法衡量所有的法治现状》,《法制资讯》第4期。
[40]朱景文,2006:《全球化条件下的法治国家》,中国人民大学出版社。
[41]朱景文,1994:《现代西方法社会学》,法律出版社。
[42]朱景文,2007:《中国法律发展报告——数据库和指标体系》,中国人民大学出版社。
[43]朱景文,2012:《中国特色社会主义法律体系:结构、特色和趋势》,《中国社会科学》第3期。
[44]Daniel,Kaufmann,1999,World Bank Policy Research Working Papers,No.2196,at http://siteresources.worldbank.org/ INTWBIGOVANTCOR/Resources/govmatrs.
[45]Deborah, M.Fournier,1995,“Establishing Evaluative Conclusions: A Distinction Between General and Working Logic”,New Directions for Evluation,No.68,pp.16.
[46]Mark, Agrast,Juan Carlos Botero,and Alejandro Ponce,2011,The World Justice Project Rule of Law Index 2011,The World Bank Publisher,pp.9,15.
[47]The World Bank,2006,Where is the Wealth of Nations? The World Bank Publisher,pp.13-14.
Self-reflection and Construction: the Criticism of the
Assessment of the Rule of Law in Modern China
Li Zhao
(Institute of Criminal Law,NorthWest University of Politics & Law;
Law Institute of Chinese Academy of Social Science)
Abstract:With the progress of the rule of law and the development of the society,the activity of assessment of the rule of law now is flourishing in China.The introduction of Western modes of assessment of the rule of law and the further development of the practice of evaluation in China have produced lots of experience and lessons .There are many problems in the practice of the assessment of the rule of law,including the lack of value criterion ,the confusion of institutional direction,the limitation of the function ,the inadequacy of the independency of the samples and the valid supervision.Therefore,in order to construct a localized system of the assessment of the rule of law in China,measures such as construction of an unified value criterion,determination of the institutional dimension of the evaluation,definition its function and location and regulation of a supervision and reexamination procedure should be taken,so as to provide suggestions for the improvement of the assessment of the rule of law.
Key Words:The Assessment of the Rule of Law; Value Criterion; Institutional Dimension; Sample Recheck
责任编辑汪晓清