〔收稿时间〕 2020-12-30
〔基金项目〕 司法部国家法治与法学理论研究项目“大数据在地方立法中的应用研究”(编号: 19SFB3006)
〔作者简介〕 吴睿佳(1991—),男,甘肃张掖人,山东大学(威海)法学院博士研究生。
① 检索时间为2020年8月11日。以上检索结果不包括被笔者人工筛除的其他70部不具有立法评估制度建设意义的规范性文件。
② 作为与“量化评估”在修辞上更为工整对应的概念表述,“质化评估”或“质性评估”在中国大陆法学领域的著述中较少被使用,而且以李连江
教授为代表的许多学者一直反对这种译法,故本文全文使用了更为常见和妥当的“定性评估”作为概念表述。
〔摘要〕 立法量化评估,因其方法上的精确性和科学性,一直以来为学界和实务界所推崇。但当前我国立法量化评估的理念与方法之间仍存在脱节的问题,这具体表现为实践中存在的一系列适用误区。比如,评估实践中既存在“去工具化”的倾向,又易混淆基本的算术法则应用场景,加之常见的数据收集错误,以及绩效评估工具的不当引入,为立法量化评估的适用带来了许多障碍。对此,立法评估人员应当正确判断立法量化评估规范适用的前提,避免立法量化评估方法的不当适用。
〔关键词〕 立法量化评估; 立法评估; 评估方法; 立法成本收益评估; 评估制度
〔中图分类号〕D901〔文献标识码〕A〔文章编号〕1008-2689(2021)03-0290-09
立法评估最早于20世纪60年代在美国兴起,上世纪末在我国广州、安徽等地开始探索实践。经过多年以来的理论研究和实践摸索,我国的立法评估制度已经开始逐步建立起来,富有中国特色的立法评估工作体系正在形成中。随着制度实践逐渐扩展和深入,立法评估的理论研究也开始进入“深水区”。据“北大法宝”提供的检索结果,目前各地方针对立法评估制度建设出台的规范性文件已有39部,其中包含地方性法规3部、地方政府规章13部、地方规范性文件23部①。在各地纷纷开展立法评估制度建设之后,以往立法评估理论研究未曾彻底厘清的一些具体问题开始涌现出来。尤其是在立法评估的具体方法上,目前立法评估的方法已经成为制约地方立法评估工作质量提升的主要瓶颈。而于此相对应的,以往大量关于立法评估的著述当中,“在立法评估的方法上,注重量化评估与定性评估的有机结合”这样原则性的介绍,已经无法回应立法评估实践对方法论的现实呼唤。“量化评估”如何破除适用误区,在立法评估中更为规范地被适用,进而与“定性评估”②实现“有机结合”,这是当下立法评估理论研究亟需回应的疑问。本文试图通过对当前量化方法在立法评估中的应用现状进行分析,厘清立法量化评估方法在当下的一系列适用误区,并概括总结立法量化评估方法规范适用的前提。
一、 立法量化评估理念与方法的脱节
立法量化评估的中心议题是量化方法在立法评估中的应用,其中包含理念和方法两个不同的层次。理念提供原则性的方向指引,而方法则事关立法评估方案的细节制定和具体执行。理念指导方法,方法落实理念,二者便如头脑与四肢的关系一般,需要紧密衔接。但就目前的理论研究和实践情况来看,立法量化评估的理念与方法之间尚存在严重脱节的问题。
自上世纪90年代起算,我国对于立法评估的系统研究已经经历了20余年的历史,成果不可谓不丰硕,理念不可谓不先进。就立法量化评估而言,早在1999年,就有學者提出,立法质量评估主要包括三个方面的指标,即“合法性、和谐性、规范性的认定,实施的社会成本和社会群体评价统计”[1],而对于社会群体评价应当在统计时对不同的社会群体赋予不同的测量权重。这应当被视为国内较早提出立法量化评估应用理念的理论著述。自此以后,20多年来关于立法评估方法的理论研究成果汗牛充栋,大量学者对立法量化评估持积极态度。汪劲、王保民、汪全胜等知名学者先后对量化方法在立法评估中的应用做了构想。后又经过10余年的接力研究,在关于立法评估的理论争议中,即使是对量化方法在立法评估中的应用前景持有极大疑虑的一些学者,也承认量化方法可以对确保立法评估的科学性起到一定程度上的辅助作用。
虽然“量化方法能够应用于立法评估”这一前提性命题已经基本形成了学术共识,但具体的应用效果却引发了学界的一系列质疑。近年来虽有学者声称“数量化方法是目前进行立法评估时最常使用的信息分析方法”[2]109,但也有学者紧随其后提出批评,认为“立法后评估依然囿于自身的文化传统和封闭的概念体系,重价值判断而轻技术测量”[3]。事实上,早在2012年,席涛教授[4]便批评“(立法评估中)评估主体主要运用的是定性分析方法,很少运用定量分析方法,导致评估报告的数据较少、陈述较多、主观性较大”。时隔6年,王保民教授等[5]仍指出“(立法评估中)主观性评估成分较多,过度重视定性分析,忽视或未能充分利用好定量分析,导致评估结果不够具体和客观,缺乏说服力”。学界以上一系列批评意见都建立在对于国务院各部门和广东、云南、福建、上海、山东等地发布的立法评估方案、立法评估报告等官方资料上,不能说是捕风捉影之论。但纵观国务院各部委和各省市公开发布的立法评估资料,又显然不能说立法评估主体对量化评估不够重视笔者自“北大法宝”等途径收集了65份我国2005年以来的立法评估方案和立法评估报告,虽然量化评估方法的使用方式和程度有所差异,但并未发现其中有完全不使用量化评估方法的。篇幅所限,此处不再详细列举。。事实上,根据时任国务院法制办公室副主任袁曙宏博士主编的《立法后评估工作指南》提供的官方数据和结论,“从我国立法后评估实践来看,一般都普遍运用了定量调查的方法”[6]92。这就形成了一种值得注意的现象:一方面学界广泛地批评立法评估实践中轻视量化评估方法的应用,另一方面不同层级的评估主体在立法评估实践中又都确实普遍使用了量化评估的方法。
这种现象的出现,在很大程度上是由于立法量化评估的方法论研究相比于理念伸倡而言过于落后所导致的,不能简单地认为主要症结在于评估主体消极敷衍乃至开展“运动式”评估——由于法定评估主体的专业性限制和立法评估对内部性的消解要求,委托第三方评估已经成为实践主流,而其中不少受委托的第三方人员本身就是从事法学研究的学者,在这种背景下,将立法量化评估的应用低效归结于法定评估主体的能力和态度存在问题,显然是有失偏颇的。总而言之,头脑可以不借助四肢而独立思考,但却无法脱离四肢独立奔跑。如果方法过于简陋,甚至大量出现误用、滥用的情况,那么学者针对立法量化评估所建构起来的理念,落实于立法评估实践中势必会出现“半身不遂”,乃至“瘫痪”的问题。因此,本文试图阐明长期以来量化方法未能顺畅应用于立法评估的“病因”,并对量化方法在立法评估中的适用必要性进行反思。
二、 立法量化评估方法的适用误区
立法量化评估方法的适用误区在以往立法评估实践中的存在由来已久。既往也有学术著述对一些立法量化评估方法适用中存在的问题进行了检讨批评,但总的来看,这些批评尚存在三个方面的不足:一是反复纠结于“正义”“公平”等价值概念能否被量化评估的问题,结果忽视了对价值概念进行量化评估的必要性问题;二是大多将量化评估在立法评估中应用效果的不尽人意,归结于“立法评估制度规范还不够健全”等过于宏观的因素,或者是评估方案制定不完善、评估数据收集不科學、评估人员态度不端正等执行层面存在的问题,而忽略量化评估方法本身的固有缺陷和数理规律;三是以个别西方国家的既有经验指导我国立法评估工作,没有考虑到制度差异对立法评估的深刻影响。上述不足,使得许多原本针对立法量化评估的批评意见,反而与实践中的错误做法一同落入了适用误区。在此,有必要对这些误区进行系统的梳理和厘清。
(一) 存在“去工具化”的倾向
近十几年来,由于受西方社会科学研究中出现的“定量霸权主义”[7]积习之影响,我国社会科学理论研究也出现了量化方法应用的“去工具化”[8]倾向,即量化方法不再作为工具服务于研究目的,使用量化方法本身却成为了研究目的之一。“盲目使用量化方法像在路灯下找钥匙,不是因为钥匙是在路灯下丢的,而是因为只有路灯下才能看得见。”[9]这一振聋发聩的批评,虽然主要是针对近十几年来我国社会科学研究领域中量化方法的应用失范问题,但同样应当引起我们对立法量化评估应用的反思:在立法评估中引入量化评估方法的目的是什么?
正如磨刀是为了切肉一样,作为工具和方法,立法量化评估的适用必然需要服从于一定的立法评估目的。而且这里的立法评估目的不能止于“完善立法”“提高立法质量”这样的笼统描述,必须具体到法律法规的“立、改、释、废”决策上来——不以影响立法决策为目的指向的立法评估极易沦为形式主义的产物。因此,正常的逻辑应当是先明确立法评估的目的是什么,然后才能确定进行立法评估的具体方法,而不是本末倒置——先预设好了立法评估的具体方法,再去思索这样的方法能够实现怎样的立法评估目的。但遗憾的是,目前各地出台的地方立法评估办法中,一般都对立法评估的方法进行了简陋的预设规定,许多学者也倡言在评估办法中对评估方法进行更为具体和严格的预设规定,导致“以定性为主、定量为辅”或“应当采用量化评估的方法”这样的规定屡见不鲜。评估办法不同于针对某一件法规的具体评估方案,属于一般性的规定,对效力范围内的所有立法评估活动有普遍约束力。但何种方法为主、何种方法为辅,乃至实际需不需要某一种评估方法,都应以立法评估目的为判断依据,并综合实际评估需求做决定,评估办法实不宜采用“一刀切”的思路,规定得过于明确、详细。
事实上,立法评估在西方国家诞生之初,即带有鲜明的实用主义特征和明确的评估目的指向。20世纪中叶,主要资本主义国家为了克服二战之后各国政府普遍面临的财政危机以及公众信任危机,不得不对法案的出台采取更为审慎的态度,于是立法评估才在这一背景下应运而生[10]6。而前贵州省高级人民法院院长孙潮教授[11]在上世纪90年代即撰文阐明:美国许多州议会规定的立法评估启动前提是“所立之法的实施将直接导致州财政支出或者收入”。因此,在纳税人主体意识逐渐觉醒的社会背景下,平息公众对于财政运行效率的质疑,是西方国家开展立法评估的主要目的,这也是西方国家立法评估方法从一开始就具有浓厚量化色彩的主要影响因素——对财政运行效率进行定性评价显然无法回应公众的质疑。相比之下,由于我国在立法领域既如黄仁宇教授所说缺乏“数目字管理”的历史传统,又不完全符合西方“国家-社会”二元对立的政治结构,公众对于立法导致的财政效率变化兴趣寥寥,关注点主要在于立法配置的具体权利义务是否公平允当等价值判断问题上。故而我国的立法评估在符合通说共识的前提下,具体的目的指向与英美等国仍存在结构性的差异。
(二) 混淆不同基本运算法则的应用场景
量化方法的应用必须建立在正确理解和使用运算法则的基础之上。而立法量化评估的方法论研究中,最为薄弱的环节就是如何通过一定的运算法则来合理解释评估指标数据和评估结论之间的客观因果关系。目前立法评估的方法论研究中,这方面的研究成果凤毛麟角,导致立法量化评估在实践摸索中不自觉地形成了很多数理层面上的错误认识和做法。混淆“布尔代数”与“线性代数”两种基本运算法则的应用场景,即是其中最为普遍的现象。
一般来说,在社会科学的研究中,有两种常用的数理法则用于合理阐释因果关系,一种是“量化相关”,另一种是“逻辑因果”。两种数理法则都在立法量化评估中有着广泛应用的空间,但在基本的运算原理上有着本质的区别。“量化相关”的阐释将因果问题转化为数量问题,遵循的是“线性代数”的运算法则;“逻辑因果”的阐释将因果问题转化为充分必要性的问题,遵循的是“布尔代数”的运算法则[12]。不同于以线性关系为研究对象的“线性代数”,“布尔代数”是逻辑思维数学化的体现,只有“1”和“0”两个赋值选项,且只有三种运算方法:“逻辑加”、“逻辑乘”和“逻辑非”。因此,在解释某种因素与特定社会现象的因果关系时,“布尔代数”只能用以分析因果关系的类型问题,也就是确定哪些因素对结果有影响、哪些因素没有,而不能用以分析因果关系的程度问题。
回到立法量化评估这一话题上来,在当前的立法量化评估指标设计上,有包括“合法性标准、合理性标准、协调性标准、实效性标准以及技术性标准”的“五指标说”[13]17-18和包括“合法性标准、适应性标准、操作性标准、绩效性标准、特色性标准以及参与性标准”的“六指标说”[14]21-22两种主流学说。虽然两种学说又有衍生出的个别学说对一些指标进行了表述概念上的替换,但大体上只有这两种学说在立法量化评估中应用较广。而通过审视这两种学说构建的指标体系,我们会发现,这些标准当中有些只能以“布尔代数”作为运算法则进行定量评估(前提是确实有这个必要),而不能以“线性代数”作为运算法则进行定量评估。比如,无论是“五指标说”还是“六指标说”,都以“合法性标准”为第一评价指标,而“合法性”本身只具有“逻辑因果”意义,也就是要么“非法”要么“合法”,不必讨论 “合法”的“程度”问题——“基本合法”、“部分合法”或者“90%合法”的评估结论缺乏量化的必要。当然,也可以说一部法规当中有一部分条款合法、一部分条款不合法,但只要有不合法的条款,整部法规就应当在合法性评价上落入否定性评价的区间当中,再认真细数其中不合法的条款占比,甚至是不合法的“字数”占比,并无实际意义。因此,对于“合法性标准”这样的评估指标,是不适宜用“线性代数”运算法则进行程度评估的。
反观目前理论和实务中出现的立法量化评估方案,一种常见的错误就是对本该运用“布尔代数”运算法则进行评估的指标,运用“线性代数”运算法则进行赋分评估甚至加总赋分评估。如俞荣根教授提出的立法前评估指标体系,被许多地区的立法评估方案所借鉴,即“立法前评估指标体系由立法必要性与可行性(25分)、合法性(25分)、影响性(30分)、效益和成本分析(20分)4个一级指标组成,涵盖18个二级指标”[15]。这其中,不仅“合法性”被赋予了“25分”的具体分值,而且还有细分的二级指标。事实上,就立法前评估而言,一旦立法草案被确定有“不合法”的内容,就应当“一票否决”,立即进行草案修订,不可能进入下一步的正式立法程序。因此,这里的“25分”赋值,是不符合“布尔代数”的运算法则的,而细分的二级指标即使可以转化为某个数值,由于缺乏数理原理的支撑,其相加之和也不可能真正表示一部法规的“合法性”,只能是一种“伪量化评估”。同样的道理,“立法必要性标准”也只有“是否必要”的问题,日常口语表达中并不合逻辑的“必要性有多大”是个“伪量化”指标,无法转译为数学语言进行量化分析,只能按照“布尔代数”的运算法则进行“0-1”的逻辑判断。有学者对此提出意见,认为“由于是缺乏裁量空间的二选一封闭模式,会导致此项得全分或者不得分的结果,评估的客观性和真实性将受到很大影响”[16]。但其实“二选一”的逻辑选项本身并不至于影响指标评价的“客观性”“真实性”,反倒是强行对此类指标按照线性代数的运算法则进行二级指标的赋分加总,既不科学,也无意义。
(三) 多见明显的数据收集错误
在数据分析领域有一个非常经典的重要原则:“垃圾进,垃圾出(Garbage in, Garbage out)。”其主要是指,在数据分析的过程中,如果前期收集的数据是不合格的,分析的结论就必然是不合格的。而在当前立法量化评估中,所需要的数据信息质量往往得不到充分的保障,进而影响评估结论的客观性和科学性。典型且广泛存在的两种数据收集错误是“数据挑选”和“泛因果化”。
“数据挑选”是指:数据收集主体受个人偏见、既得利益、收集便利等各种因素的影响,有意或无意地不执行或部分不执行严格的数据收集规范,造成所收集数据的信度(reliability)或效度(validity)低下。“泛因果化”是指:数据收集主体在缺乏必要的定性研究基础的情况下,盲目地确定要收集的数据信息种类,结果导致一些原本与评估结论没有充分因果关系的数据信息也被纳入到收集和分析过程中来,并作为分析结论的支撑论据。目前来看,这两种数据收集错误集中体现在立法评估实施主体组织的问卷调查中。
在现阶段,立法评估实施主体借助的主要量化评估工具是问卷调查和统计调查两种方式。就问卷调查而言,立法评估实施主体往往不具备规范的操作意识和调查技能,导致数据收集过于粗糙随意。举例来说,某省农业委员会关于《畜禽标识和养殖档案管理办法》的立法后评估调查问卷,在收集过程中要求下属各市(州)“指定辖区内1个县(市、区)进行填写”,且其中四个明文规定的市(州)“须指定已设立乡镇动物卫生监督分所的县(市、区)填写”。须知,随机抽样不等于随意抽样,这种上级单位“指定”的调研样本,往往更容易存在“数据挑选”和“泛因果化”的问题,进而在问卷收集的数据质量上大大折扣。
再比如,《XX省水土保持条例》立法后评估量化指标体系中将“公众是否对《条例》有较高的知晓度”作为量化评价指标之一。但实际上,一方面公众对该《条例》的知晓度很大程度上是由该《条例》的宣传力度决定的,而这与该《条例》本身的立法水平并无因果关系;另一方面,即使公众对该《条例》的知晓度高,也并不意味着公众对该《条例》的执行意愿和实际遵循率也很高。这样的指标数据信息纳入立法后评估,作为立法水平的评价依据,实际上就属于“泛因果化”的错误。
又如,某自治区在开展《基本草原保护条例》立法后评估时,制作了四种调查问卷,要求下属“各盟市政府法制办、草原监督管理机构负责组织本级及所辖旗县”填报调查问卷,但仅要求“每个问卷至少填写2份”。抛开抽样问题不谈,如此之小的样本量本身就难以保证立法评估的质量,填报的数据指标与评估结论之间建立起来的因果关系很难经受得起科学的检验。
(四) 不當引入绩效评估工具
一直以来,不少学者和立法实务工作者从绩效评估领域中获得了启发,进而试图在立法评估中引入一些绩效评估常用的量化评估工具,如平衡计分卡(Balanced Score Card) 和全面绩效计分卡(Total Performance Scorecard)等。对此,需要指出的是,虽然立法评估在量化评估方法上与绩效评估(尤其是公共部门绩效评估)存在高度的相似性,而且立法评估最开始在西方国家的发端,也与美国肯尼迪政府和约翰逊政府执政期间兴起的PPB(Planning-Programming-Budgeting)绩效评估系统有着千丝万缕的联系,但我们始终应当注意,立法评估和绩效评估在实质上的巨大差别,以及由此导致的方法论差异。
绩效评估的核心注意力集中在组织运转效率上,所有评估方法的运用最终的目的都指向“改造组织、部门及其人员并使其更有效率”,这是其与立法评估最本质的区别。20世纪70年代末期以来,在美国、英国等个别西方国家率先发起的“新公共管理运动”(New Public Management)为公共部门绩效评估提供了主要的理论支撑。新公共管理运动的核心要义是借助经济学和企业管理理论对公共部门的社会服务供给机制进行改造。20世纪晚期在英国和美国分别兴起的“雷纳评审”和“企业化政府再造”均属于“新公共管理运动”的实践产物。
立法评估的核心注意力集中在法律法规“立、改、释、废”的正当性阐释上,其兴起,与“新公共管理运动”属于同时代,因此不可避免地受到其“效益中心主义”的影响,甚至在一定程度上可以说,正是由于“新公共管理运动”对“成本-收益”这一范式的强调,才促成了立法评估最开始的落地实践。20世纪60年代,美国国会率先通过立法,规定:“行政部门提交的法律草案,须同时提出立法论证报告,且经过成本收益比较程序并由联邦预算局审核,方可提交国会通过。”[17]841974年美国福特政府签发了11821号总统行政命令《通货膨胀影响说明》(Inflation Impact Statement),经济学家们基于这一法令建构了“成本-收益”评估理论,要求立法机关对重要法规提案提供配套的“成本-收益”评估报告[18]。1976年,美国科罗拉多州通过首部“日落法”,随后立法评估活动开始逐步扩展到全球各国。
经过近半个世纪的演变,如今的立法评估和绩效评估早已是两个不同的范畴。由于以奥斯丁、哈特、凯尔森等为代表的实证分析主义法学家,旗帜鲜明地提出立法及其实施效果应通过“社会实效”来进行评估,而学者和立法评估工作者们也很快就意识到法的“社会实效”不仅通过经济效益或财政效率表现出来,比如美国国家公共行政学院院士斯蒂芬·卡尔曼教授就指出,由于道德要素在立法成本收益评估中无法体现,有可能加剧某些不道德的公共决策的出台,“迫害那些清白但沉默的异议者”[19]。因此立法评估实务开始越来越关注立法活动所导致的权利义务变动使何种主体受益、何种主体受损,以及受益或受损的影响程度与范围是否可以为社会所接受。如今,脱胎于公共部门绩效评估的立法成本收益评估,也只能算是立法评估的一个非绝对必要的组成部分,或是同“成本有效性分析方法”“风险分析方法”“敏感性分析方法”等一同成为立法评估的一种具体可选方法。如美国行政管理与预算办公室(Office of Management and Budget)也承认其所做的“成本-收益”评估,其结果至多成为公共决策机关的一种参考性因素,而非决定性因素[20]。不仅如此,许多国家也已逐渐认识到“成本-收益”评估制度存在一定的适用范围,特别是在一些特定的立法决策中,并不适用[21]。
因此,把立法评估和立法成本收益评估乃至公共部门绩效评估完全等同起来,或是认为立法评估必须包含立法成本收益评估,进而必须采用量化评估的方法来体现“成本”“收益”或是“绩效”的观点,并不符合我国立法评估的发展现状和现实需求。也正是基于这一原因,一些学者所主张引入的量化绩效评估工具,包括对法律法规实施部门及其人员的打分、排名和奖惩等,事实上不仅在具体操作上很难适用于我国的立法评估,也缺少立法评估原理的支撑。
三、 立法量化评估方法规范适用的前提
以上立法量化评估实践中一系列误区的成因,既有操作不规范的因素,也有部门不正当利益的影响。从方法论的层面上来看,要实现立法量化评估方法的规范适用,首先需要正确判断其适用前提。在评估方法的适用前提不满足的情况下,无论评估人员如何准确规范地把握评估方法的操作流程,都将不可避免地导致评估结论的误差或立法评估资源的浪费。一般来说,立法量化评估方法的规范适用必须考虑以下三个前提问题。只有在以下三个前提问题均能得到肯定性答案的情况下,立法量化评估方法的规范适用才是可能的。
(一) 立法量化评估方法的适用是否合评估目的
从统计学的角度来讲,逻辑相关不等于目的相关。无论是量化评估还是定性评估,即使从方法上讲,评估信息与评估结论之间有逻辑关系,也不代表评估结论是有用的。正如前文所述,立法评估的主要目的在于为法律法规的“立、改、释、废”决策提供参考依据。如果一次立法评估,耗费了大量的人力、财力、时间,得出的评估结论对于法律法规的“立、改、释、废”决策没有足够的帮助,那么这次立法评估纵然在方法上超前、完备、精密,也只能是一次失败的立法评估。因此,立法量化评估方法的适用,一个首要的前提就是其是否合评估目的。
首先,评估目的服从于立法目的。举例来说,许多立法前评估报告中,都设计了公众意见问卷调查以及相应的量化数据统计。但须知,立法前评估开展时,所评估之法律法规按照立法程序应当尚未被列入立法规划,自然也不可能在立法前评估时就形成立法草案。那么在立法前评估阶段,所有对公众的问卷调查都是在公众未见到立法草案主要内容的情况下进行的。在此逻辑前提下,一些立法前评估报告以公众意见问卷调查的量化统计结果来说明多大比例的公众对立法持赞成或否定态度,实际上是不合评估目的的。在公众并不充分了解立法目的和草案主要内容的情况下,其对于立法的态度极有可能是盲目、随意的,不能被理解为一个公民理性、真实的意思表示。因此,无论支持与否的公众比例有多高,都不应当作为某一法律法规正式被纳入或不被纳入立法规划的依据。对应的量化统计结果,自然也就是非必要的。
其次,立法评估的目的是使立法活动实现逻辑可比,而非量化可比。换言之,立法评估的目的,是使立法动议、立法草案、立法修正案、立法废止决定等相比于先前立法状态而言有一个“做不做”或者“好不好”的逻辑比较结论,而不是看立法动议、立法草案、立法修正案、立法废止决定等相比于其他同类立法活动能否达到一个类似于“及格线”的状态或者是对其进行“赋分排名”。举例来说,一些立法评估报告采用了许多学者主张的“百分制”形式,按照一级指标和二级指标分別赋分,最后得出一个加总的评估总分。但这样的评估总分的得出,实际上是不符合立法评估目的的。一方面,由于并没有任何一个权力机关或者权威研究机构能够对于立法评估给出一个赋分评价的“及格线”,也就无法以立法评估的总分为依据形成一套立法决策的规则,那么立法评估的总分是多少,立法决策的做出仍然是以定性判断为依据的,这个总分并无实际意义;另一方面,由于现在并没有一套公允公认的立法评估赋分标准,“不同类型的地方性立法,其立法后评估的评估指标是有所差异的”[22],各立法评估实施主体在这方面基本上是各行其是,既然尺度不同,就没有任何横向可比的意义——即使各地按照自行制定的量化评估方案得出了总分结果,山东某地的《养犬条例》立法评估得分70,江苏某地的《养犬条例》立法评估得分80,又能对各自立法评估后的立法决策提供什么样的帮助呢?
总而言之,量化评估方法的适用,需要结合立法评估的具体目的来决定。量化评估方法对公共资源的消耗是显著的,故而有限的立法资源更应当“好钢用在刀刃上”,不必刻意追求量化评估方法的适用。
(二) 在特定指标的评估上量化方法是否優于定性方法
虽然有学者断言:“法律法规的科学严谨性决定了必须强化对数量化评估方法的应用”[2]117,但“科学”“严谨”并不等于“数量化”。许多立法评估的研究者和操作者存在一种思维定势,认为量化方法在准确性上一定优于定性方法。这实际上是社会科学领域中“定量霸权主义”的一种表现。诚然,数字语言的迅猛发展,使得许多千百年来悬而未决的哲学化问题得以通过科学化的理路重塑、考察乃至解决。但数学语言对社会规律的表示,是通过近似和拟合来实现的,因此许多看上去直观、简约、可计量的数据信息,并不天然等同于准确。尤其是社会调查统计,由于学术伦理和调研条件的限制,只能采用抽样的方式替代整体的实验,说到底只是“窥斑见豹”的权宜之计。对此,应星教授指出,西方现代社会的“均质性”是西方社会科学研究以量化方法为主的根源,而中国社会是高度“反均质性”的, 因此更适于采用定性方法[23]。这一观点虽然只是一家之言,但社会性质差异所带来的指标度量区别也确实值得我们注意。
由于“实证主义缺乏对社会行动和社会价值之间根深蒂固的联系的恰当理解”[24]13,事实上,抛开社会性质上的巨大差异不谈,定量方法在西方现代社会也不是万能良药。1985年,可口可乐公司依据对将近20万消费者的盲测结果,自信地更改了99年未曾改变的配方,结果实际市场反应却与调研结果截然相反,损失惨重。1936年美国总统大选,美国权威调研杂志《文学摘要》向全国邮寄出了1 000万份调研问卷,并依据其调研结论断言共和党候选人兰登将会当选,结果民主党候选人罗斯福高票连任,《文学摘要》杂志社信誉扫地,被迫停刊。以上两个典型例子,收集数据不可不谓之“大”,投入资源不可不谓之“少”,但却成为社会调查统计的两个经典败笔。以此为鉴,实应对国内一些学者对“大数据”辅助立法的过于乐观进行慎重省思。
既然量化评估方法也在评估结论的准确性上存在缺陷和风险,自然也并不必然优于定性评估方法。事实上,当量化评估方法将样本属性转化为直观可见的数据时,并不能同时提供这些样本属性何以如此的原因或运行机制。比如,一次立法量化评估调查收集的数据表明,某市85%的受访者认为某立法条款合理配置了权利义务,而其他15%的受访者并不这样认为。“85%”和“15%”只是群体性特征,大多数人的认同并不能代表该立法条款不存在改善的空间,因为从立法评估的目的出发,这“15%”的不同意见才往往是影响立法“立、改、释、废”的重要参考信息。而要想知道这“15%”背后更深层次的因果和机制信息,要么需要针对性地设计和开展更为精密的补充量化调查,要么还是需要借助定性方法进行评估。
那么在哪些指标的评估上量化评估方法优于定性评估方法呢?一般来说,定性方法的短处是无法准确判断到底是哪些因素在影响结果以及对应的影响程度如何,同时也无法保证样本调查的随机性。因此,在立法评估主体需要准确判断影响立法出台或实施的主要因素及其影响程度时,以及需要对内部评估结论固有的“近视”问题进行补充矫正时,量化评估就有了方法上的比较优势。举例来说,对于舆论对法律法规出台或实施的反映、法律法规出台或实施对各种宏观经济指标的可能影响、法律法规出台或实施所需的财政经费支持等指标的测算,在准确性上量化评估要优于定性评估。而对于法律法规出台或实施对利害相关人的权利义务影响、潜在信访对象对法律法规内容的可能异议、部门利益和职权配置对法律法规实施的影响、所评估法律法规与法律体系的融贯衔接程度等指标的评估,在准确性上定性评估就要优于量化评估。
(三) 立法量化评估的信息获取和转译是否可行
相比于立法评估而言,教育评估、投资项目评估、人事评估等领域应用量化方法的历史要更为悠久,理论和经验也更为成熟和丰富。但即使是在这些领域当中,从事评估工作的理论专家和一线工作者也不得不承认,评估指标数据的获取和转译是评估工作的重难点,也往往是导致整个评估工作归于失败的“阿喀琉斯之踵”。为此,经济评估领域经过多年的探索,创制了一系列的量化模型和统计方法用以降低评估指标数据的获取和转译的成本以及误差。相比之下,立法评估领域,尤其是我国的立法评估领域,在评估指标数据的获取和转译上还处于方法的“开荒”阶段。在此背景之下,适用立法量化评估方法不得不充分考虑在评估基础、评估成本、评估伦理等一系列决策约束条件下,评估指标数据的获取和转译是否具有可行性。
扎实的定性基础是评估指标数据获取和转译的方法前提,但却常常得不到立法评估人员的足够重视。统计分析是否可靠,取决于量化研究是否可靠,而量化研究的基础实际上是定性研究提供的。量化方法的逻辑起点是测量对象相关属性的概念化和指标化,否则测量对象的相关属性就无法通过数学语言和逻辑语言转译为“自变量”或“因变量”,而这一工作必然要依靠扎实的定性研究基础来完成。比如,作为立法量化评估的基础,对基本评估指标的定类测量(categorical measurement)实际上是通过定性研究完成的。定类测量决定了各种指标之间所体现的逻辑关系是包含还是互斥,而如果采用层次化的指标体系,定类测量还决定了一级指标和二级指标之间的逻辑关系。须知,繁琐不等于精细。缺乏扎实定性研究基础,制定出的评估指标体系就容易出现指标间逻辑关系的不周延,评估结论的科学性和严谨性也就难以保证。而且从指标可测量性的角度考虑,一些学者提出的“可以构建正义性标准等前沿标准”[25],要在方法上得以实现,也必须建立在对“正义性”等概念的公允理解之上,而如果没有扎实的定性研究基础,这些“前沿标准”的量化也是不可想象的。
评估成本是另一个制约立法量化评估可行性的关键要素。众所周知,量化评估相比于定性评估,评估指标数据的获取和转译需要消耗大量的公共资源。回视我国,由于经济社会发展的节奏日益加快,各类不同层级的立法数量也与日俱增。仅就地方立法,2019年10月至11月就新增167部[26]。目前来看,且不论立法评估在全国的覆盖范围尚未达到许多中西部地区,即使是在江浙沪粤这些在立法评估实践方面走在全国前列的省份,各级立法评估实施主体年均评估法规、规章也基本止于一两件的数量。这个评估量,基本上只能勉强与其每年新出台地方性法规和规章的数量相匹配,再要考虑到过往的需评估法规、规章和上级要求配合评估的行政法规、部门规章,立法评估实施主体无论是在人力、财力还是在评估时间上,都不可能被允许消耗太多评估成本。以上海为例,《上海市历史文化风貌区和优秀建筑保护条例》的立法评估长达8个多月,评估小组召开了20多场座谈会,收集了883份调查问卷[27]。这样的评估成本规模,不要说大部分经济不发达地区无法承受,即使是上海市,也不可能形成惯例,每一次立法评估都参照执行。
此外,立法量化评估的可行性还需要考虑立法评估伦理。有学者提议,“利用大数据挖掘技术可以获取持续的、周期性的评估数据,以无限接近法规范文件实施后的社会真实状态。”[28]现阶段的技术条件能否实现这一效果,本文不做讨论。但要通过大数据挖掘技术破除立法量化评估指标数据的获取和转译障碍,首要的问题不是技术上是否具备可行性或者成本能否接受,而是立法评估伦理能否允许这样的方法运用。私人信息能否在未经当事人允许的情况下被用于立法评估?立法评估实施主体是否拥有通过大数据挖掘技术开展立法评估的权限?大数据挖掘技术收集的公民信息,以及得出的分析结论能否被用于立法评估以外的用途?这一系列问题牵涉大量法治伦理问题,绝不应草率行止。
四、 结 论
基于当前立法量化评估理念与方法脱节的现实问题,本文总结了当前立法量化评估方法的一系列适用误区,并对如何判断立法量化评估方法规范适用的前提提出了自己的观点,以期对现阶段立法量化评估方法的规范适用有所裨益。需要指出的是,立法评估的方法论研究,是一个复杂而艰巨的系统工程,其中包含了大量相互关涉却又未能彻底厘清的子问题。我们“将面对的是认识论、证据规则、信息科学、研究设计、精确测量、统计学及沟通交流等各种复杂领域”[29]21,而立法量化评估方法的规范适用问题只是其中沧海一粟。而这些方法论上的大量遗留问题,不应留待立法评估实务人员去自行探索和解决,而应成为立法学者的一个重要研究任务。
〔参考文献〕
[1] 黄钰. 关于建立立法质量评估体系的思考[J]. 上海人大月刊, 1999(10): 32-33, 41.
[2]孙晓东. 立法后评估的原理与应用[M]. 北京: 中国政法大学出版社, 2016.
[3]张德淼, 刘琦. 立法后评估制度的科学性及其限度——以《〈闲置土地处置办法〉实施后评估报告为例》[J]. 湖南科技大学学报(社会科学版), 2016, 19(1): 49-54.
[4]席涛. 立法评估: 评估什么和如何评估——以中国立法评估为例(上)[J]. 政法论坛, 2012, 30(5): 59-75.
[5]王保民, 王碧. 我国中央行政立法前评估指标体系的构建[J]. 西安交通大学学报(社会科学版), 2018, 38(5): 86-93.
[6]袁曙宏. 立法后评估工作指南[M]. 北京: 中国法制出版社, 2013.
[7]葛传红. 西方政治学界对于“定量霸权”的反思与批判[J]. 国际政治研究, 2019, 40(1): 117-141.
[8]王艺潼. “去工具化”的工具——以公共政策研究中量化研究方法的应用为例[J]. 行政论坛, 2020, 27(2): 85-90.
[9]马亮. 公共管理研究方法走向多元化[N]. 中国社会科学报, 2018-12-05(008).
[10]汪全胜, 等. 立法后评估研究[M]. 人民出版社, 2012.
[11]孙潮. 立法成本分析[J]. 法学, 1994(10): 38-40, 48.
[12]陈超, 李响. 逻辑因果与量化相关: 少案例比较方法的两种路径[J]. 公共管理评论, 2019(1): 3-22.
[13]俞荣根. 地方立法后评估研究[M]. 北京: 中国民主法制出版社, 2009.
[14]沈国明, 史建三, 吴天昊, 等. 在规则与现实之间——上海市地方立法后评估报告[M]. 上海: 上海人民出版社, 2009.
[15]俞荣根. 地方立法前质量评价指标体系研究[J]. 法治研究, 2013(5): 3-9.
[16]李店标, 冯向辉. 地方立法评估指标体系研究[J]. 求是学刊, 2020, 47(4): 112-119.
[17]龚祥瑞. 美国行政法(上册)[M]. 北京: 中国政法大学出版社, 1995.
[18]蔣银华. 立法成本收益评估的发展困境[J]. 法学评论, 2017, 35(5): 95-106.
[19] KELMAN S. Cost-benefit analysis: an ethical critique [J]. Regulation, 1981, 5(1): 33-40.
[20]ERIC D O. The quiet shift of power: office of management and budget supervision of environmental protection agency rulemaking under executive order 12291 [J]. Virginia Journal of Natural Resources Law, 1984(1): 1-80.
[21]汪全胜. 立法成本效益评估制度的适用范围考察[J]. 法学论坛, 2016, 31(1): 23-30.
[22]俞荣根. 不同类型地方性法规立法后评估指标体系研究[J]. 现代法学, 2013, 35(5): 171-184.
[23]应星. 质性研究的方法论再反思[J]. 广西民族大学学报(哲学社会科学版), 2016, 38(4): 59-63.
[24]弗兰克·费希尔. 公共政策评估[M]. 吴爱明, 李平, 等译. 北京: 中国人民大学出版社, 2013.
[25]谭波. 论体系化背景下地方立法质量评价机制的完善[J]. 河南财经政法大学学报, 2020, 35(1): 10-19.
[26]杜寅. 地方立法后评估面临的问题及规范化、 科学化路径[N]. 民主与法制时报, 2020-05-28(007).
[27]謝天. 完善立法后评估制度的若干建议[J]. 人大研究, 2017(3): 38-41.
[28]曹瀚予. 论新时期地方立法评估的科学化[J]. 理论导刊, 2019(2): 105-112.
[29]丹尼尔·L. 塔弗尔比姆, 克里斯·L. S. 科恩. 评估理论、 模型与应用[M]. 杨保平, 等译. 北京: 国防工业出版社, 2019.
Research on the Normative Application of Legislative Quantitative Evaluation Method
WU Rui-jia
(School of Law, Shandong University, Weihai 264209, China)
Abstract: Featured by scientific analysis and methodological precision, quantitative legislative evaluation has been widely endorsed by legal researchers and professionals at home and abroad. However, existing implementation of quantifying legislative evaluation in China suggests that various gaps exist between its conceptualization and operationalization, manifested in numerous errors in the process of legislative evaluation. For example, the tendency of “de-instrumentalization” and the confusion of basic arithmetic application scenarios, common data collection errors and improper introduction of performance assessment tools in the practice of assessment have brought many obstacles to the application of legislative quantitative assessment. In this regard, the legislative evaluators should correctly judge the premise of the application of the legislative quantitative evaluation norm and avoid the improper application of the legislative quantitative evaluation method.
Key words: quantitative legislative evaluation; legislative evaluation; evaluation methods; cost-benefit analysis; evaluation system