论政府绩效评估中主观客观指标的合理平衡

2015-02-27 15:20周志忍北京大学政府管理学院北京100871
行政论坛 2015年3期
关键词:主观公民顾客

◎周志忍(北京大学政府管理学院,北京100871)

论政府绩效评估中主观客观指标的合理平衡

◎周志忍(北京大学政府管理学院,北京100871)

政府绩效评估的历史同时也是一个客观指标和主观指标动态平衡的历史。早期客观指标居于主导,主观指标受青睐反映了政府责任机制的重大变革,具有多样化功能和价值。但主观指标存在诸多局限:公众评价能力有限;比较价值有限;不能回答权利公正问题;在中国面临的特殊局限性。因此,“万人评政府”模式应退出历史舞台。主观客观指标合理平衡的着力点包括合理确定相对权重,差异化处理,强化公民为本和结果的导向的客观指标的设计,发挥满意度调查的诊断与改进功能。

政府绩效评估;满意度;主观指标;客观指标

政府绩效评估框架与指标体系设计要处理多样化且复杂的关系:结果类指标与投入、产出、过程类指标之间的关系;主观指标和客观指标之间的关系;评价标准的统一性和因地制宜差异化之间的关系;指标数量多与少的“度”等。科学的指标体系设计应在多样化关系中保持合理平衡。本文集中讨论主观指标和客观指标之间的合理平衡。这一研究的意义表现在几个方面:第一,公民参与是政府绩效评估中的重大问题,而基于主观指标的满意度测评是当前我国公民参与的主要方式;第二,公民满意度测评的效度及其实际效用是学术界研究的热点问题之一;第三,我国地方政府绩效评估中存在“万人评政府”的实践,对这一独特模式进行理论审视并对其利弊得失进行科学评判,有助于科学绩效评估体系的构建。

本文的内容框架如下:第一部分在简要介绍相关概念的基础上,讨论公民满意度为代表的主观指标受到重视的背景及其效用。第二部分系统分析主观指标存在的局限性;第三部分是结论和建议。

一、主观指标与客观指标动态关系的历时性考察

客观指标和主观指标是组织绩效评估指标体系中的两种基本类型。客观指标(Objective measure)基于经验观察和记录的成就和效果,比如抓获罪犯的数量、犯罪率降低等;主观指标(Subjective measure)基于个人的认知、态度和主观感受,如感到安全的居民的比率、对警察工作的满意度等。①WANG XIAOHU,GIANAKIS G A.Public Officials’Attitudes toward Subjective Performance Measures[J].Public Productivity&Management Review,1999,22(4):537-553.值得指出的是,组织绩效评估中的主观指标还包括“员工满意度”,随着人本导向和发展导向管理等理念的出现,员工满意度测评日益受到重视。考虑本文目的和相关研究的通常做法,这里对主观指标的讨论不涉及员工满意度。考察学术研究和实践历程可以发现,不论是私营部门还是公共部门,组织绩效评估的历史同时是一个客观指标和主观指标动态平衡的历史。早期客观指标占据主导地位,主观指标的出现及其相对地位的演进带着时代的烙印,折射了管理理念和制度技术的变迁。本部分在梳理这一历程的基础上进行总结归纳,从而对主观指标的效用和价值做一评价。

(一)企业绩效评估中的主观指标及其演进轨迹

组织绩效评估实践源远流长,系统的科学研究则始于泰勒的科学管理运动。科学管理运动关注的焦点是激励制度和技术运作,研究的目的则是提高效率,效率至上或效率优位就成了管理实践和理论研究中的正统。管理学家邓肯(Duncan)曾指出:如果要找一个与管理联系得最为紧密的词,这个词就是效率。事实上,科学管理运动可以称之为效率管理。正是人们对效率的渴望导致了近代管理思想的诞生[1]。效率的基本含义是投入产出比,控制成本和提高产出就成为提高效率的着力点。因此,效率至上时代的绩效评估聚焦于投入、成本、产出等,可以说是一个客观指标占绝对主导地位的时代。

进入20世纪50年代以后,风靡世界的质量管理运动对效率优位提出了挑战。随着质量日益受到关注,组织绩效评估中出现了质量指标与效率指标平衡的努力。不过从主观指标与客观指标的关系来看,客观指标在质量运动初期依然占据主导地位,这与社会质量观的演进有关。人们对质量内涵的认识大致经历了三个发展阶段[2]。第一阶段是品质质量观,认为质量由产品的内在品质决定,内在品质主要看技术参数,对质量的追求主要是提高产品的技术质量。由于内在品质评价需要相当的知识和技术水平,质量只能由生产者或专家来判定。这就是说,品质质量观时代质量的评判基本上与顾客无关,它属于生产者和专家的职责,依据的是技术参数等客观指标。

质量观演进的第二阶段是服务质量观。美国学者卡多佐(Cardozo)在1965年发表的一篇论文中,首次将“顾客满意”概念引入商业领域,认为提高顾客满意度会令顾客产生再次购物的行为,不会转买其他产品[3]。不过,这一时期对顾客满意的关注侧重于服务:在品质的基础上,质量内涵扩大到产品外观、使用舒适度、服务及时和售后服务。与此相应,作为质量测评工具的满意度调研聚焦于服务过程,重点是通过询问客户确认工作人员是否按照服务规范操作,所以也被称为“服务落实度调查”。可以看出,这一阶段对顾客满意的关注把顾客介入到质量评价过程中,但重点不是顾客自身的感受,而是他们对工作人员是否合规的判断。由于评价的依据是明确的服务规范,顾客满意度调查实际上还是客观指标。

质量观演进的第三阶段是顾客满意质量观。随着对质量研究的深入,学者们发现“客观质量”与消费者“感知质量”之间存在明显差异:受个人背景和偏好的影响,生产者认定客观质量好(品质优良且服务规范)的产品或服务,消费者感受到的质量并不一定好。问题的严重性在于,正是感知质量决定着消费者的行为。于是从80年代中期开始,人们对质量内涵的认识进入了新的阶段:顾客满意成为“质量的唯一衡量尺度”,质量管理相应被界定为“顾客期望与实际的服务效果之间差距最小化的过程”[4]13。顾客满意度调查相应被称为“感知质量调查”,直接询问客户对服务的感受或满意程度。从80年代中期至今,顾客满意度的研究基本上围绕三个方向发展:一是满意度测评技术包括指数模型的不断发展与完善;二是针对不同行业和领域特点设计差异化的满意度指数模型;三是对满意度影响因素与满意度之间因果关系及其作用机理的研究。

综上所述,企业绩效评估中客观指标和主观指标的动态关系经历了三个阶段:20世纪60年代中期以前是客观指标占主导地位的阶段,最初是效率相关的客观指标,后来扩展到以内在品质和技术参数为主的客观质量指标;60年代中期到80年代中期是主观和客观指标平衡的一个过渡时期,虽然顾客满意度概念的提出带来了绩效评估中的顾客参与,但服务落实度调查的依据实际上还是客观指标;第三阶段是主观指标主导的阶段,主要形式是顾客感知质量或顾客满意度,质量与顾客满意成为管理的主题。①关于从效率优位到质量优位转变的详细讨论,参见周志忍:《质量与顾客满意——21世纪管理的主题》,《新视野》,2000年第4期。质量管理专家罗萨多(LoSardo)对此评论道:顾客导向和质量优位意味着与传统的决裂,意味着新的游戏规则,是一场管理上的革命[4]1-2。

(二)发达国家政府绩效评估中的主观指标及其演进轨迹

发达国家政府绩效评估的努力同样源远流长,同样经历了一个主观指标和客观指标动态平衡的过程。不过,与私营部门的发展历程相比,政府绩效评估中主观客观指标的平衡在阶段划分上略有不同,表现形式也有一些差异。

公共组织绩效评估的系统努力可追溯到20世纪初,其中最有影响的是“纽约市政研究局”(Bureau ofMunicipal Research),它设立于1907年,宗旨是借用工商管理技术改进政府部门的管理。该局设计的绩效评估内容包括三大部分:需求分析、结果评价、效率测定。效率测定是绩效评估的重点,具体内容包括“所完成的工作的量和质、履职方式、出勤率和准时率、行政主管的能力和决断力”等。在侧重效率的同时兼顾了结果,并为此开发一系列指标。以卫生局为例,结果指标包括“死亡率,肺结核患者增减率,盲肠炎病例数,婴儿死亡率,麻疹、猩红热、白喉发病和死亡率,牛奶的含菌量”等[5]。第二次世界大战期间,雷德和西蒙出版了《市政工作衡量:行政管理评估标准的调查》一书,提出公共部门绩效评估的五个方面的内容:需求,结果,成本,努力,绩效[6]。1973 年,根据尼克松政府颁布的“联邦政府生产率测定方案”,相关部门拟订了3000多个绩效指标,对各个部门的工作绩效进行统计分析[7],[8]。

在20世纪80年代开始的重塑政府浪潮中,在“新公共管理”模式的影响下,公共组织绩效评估受到极大的重视和青睐。由于财政危机是改革的主要动因之一,提高效率降低开支成为行政改革的首要目标,机构瘦身、强化预算管理、绩效评估、成本核算、民营化引进竞争等则是改革的主要措施。因此,这段绩效评估的重点是经济和效率,客观指标依然处于主导地位。

到80年代末期,改革在效率方面取得了显著成就,但同时也带来了公共服务质量等方面的问题,继续以牺牲质量和公共服务为代价追求经济和效率会失去选民支持。于是从90年代开始,西方行政改革发生了从经济、效率到质量和顾客满意的侧重点的转移。这一转移表现在几个方面:一是此起彼伏的质量和服务改进运动,如1991年英国的“公民宪章”(服务承诺制度)和“竞争求质量”运动,1993年美国的“顾客至上”原则和顾客服务标准运动,随后在许多国家得到仿效和发展;二是绩效评估中质量指标比重的增加以及满意度测评的规范化和研究的深入;三是质量概念的泛化,即“通过调动所有人员的潜力,以最低的成本满足确认的顾客需求”[9]。这意味着质量和公民满意成为内核,效率作为兼顾因素融于质量内涵之中。但需要指出的是,顾客至上理念并没有赋予公民满意度主观指标在绩效评估中的主导地位,这可以从发达国家政府绩效指标结构中看出来。

从主观指标和客观指标关系角度考察,上面的讨论可以得出三点结论:第一,公共组织绩效评估的系统努力始于20世纪初,主客观指标的平衡经历了两个阶段,90年代之前属于客观指标主导的阶段,之后进入了主观指标受到重视并发挥平衡作用的阶段;第二,与企业绩效评估中从客观指标主导到主观指标主导不同,发达国家政府绩效评估中的主观指标从未占据主导地位;第三,新公共管理的“顾客至上”理念意味着对顾客满意度的重视,但并没有带来主观指标的主导。在笔者看来,它更重要的创新在于通过制度设计,在公共服务中给公民提供“用脚投票”的机会即自由选择权。

(三)中国政府绩效评估中的主观指标及其演进轨迹

中国政府绩效评估的系统努力始于20世纪80年代中期,相继采取了目标责任制、效能监察、效能建设等多样化形式。从主观客观指标关系视角看,其发展历程大致可分为两个时期:从20世纪80年代中期到20世纪末属于客观指标绝对主导时期,进入21世纪后进入主观指标受到重视并发挥平衡作用的时期。

第一阶段客观指标主导时期的政府绩效评估主要在“目标责任制”旗帜下实施。目标责任制是国际流行的“目标管理”(MBO)技术在我国的变通应用,包括组织目标的确立与分解、目标进展状况监测反馈、目标完成情况考核评估、绩效奖惩等环节。这一时期目标责任制的关注焦点是经济增长,主要采取GDP增长指标自上而下设定并层层分解,自下而上层层签署“军令状”的方式,下级官员的升迁荣辱主要与GDP指标的完成情况挂钩。学界称这种制度为“一手乌纱帽,一手高指标”的“压力型体制”[10],所伴随的则是地方官员围绕经济增长展开的“晋升锦标赛”或政绩竞争[11]。这一段目标责任制一个明显特征是“内向性”,相关活动完全属于政府的内部行为,由政府发动和实施,评价结果内部消费,对社会基本封闭。公众在目标责任考核中基本扮演看客的角色,公众满意度主观指标也就没有栖身之地。客观指标主导的例证之一是,中共中央组织部1988年发布的地方党政领导考核标准中,17个“社会经济文化主要指标”全部是客观指标。具体包括:国民生产总值;工业总产值(不包括村以下的任何产值);农业总产值(不含村以下任何产值);乡镇和村办工业总产值;城镇人均收入;农村人均收入;提交的利税和利润;财政收入;国有和集体企业劳动生产率;农副产品量;零售额;完成的基础设施投资;人口自然增长率;粮食产量;地方预算收入;森林面积;九年义务教育完成率[12]。

进入21世纪后,中央提出“以人为本”理念和“服务型政府”、“和谐社会”目标,强调“把群众满意不满意作为衡量各项工作的根本标准”,公民满意度测评随之受到重视,并成为我国公民参与政府绩效评估中的主要方式。但与发达国家实践明显不同的是,主管与客观指标平衡在中国地方政府呈现出多样化发展甚至两极分化的态势:一方面,少数地方政府绩效评估延续早期的内向性和封闭性特征,忽视甚至排斥公民参与,只是在中央统一要求的情况下被动应对;另外一极就是下面将要专门讨论的主观指标绝对主导模式。多数地方政府则采取了不断摸索的策略,公民满意度(社会评价)主观指标在绩效评估中的比重从5%左右到50%不等,并经历了理性再平衡的过程,如杭州、青岛、深圳等。

主观指标绝对主导是中国特有的政府绩效评估模式,其主要形式就是“万人评政府”活动。1998年沈阳市率先启动“市民评议政府”活动,很快得到其他地方仿效;1999年珠海市推行“万人评政府”;2000年广州市实施“市民评政府形象”;2001年南京市开始推行“万人评价机关”;2002年邵阳市推进“优化经济环境综合测评”……据统计,全国至少有14个地级以上的政府实施了类似的万人评政府活动。从具体称谓、评价对象、评价实施主体、途径和手段等方面看,万人评政府呈现出多样化势头。但可以认定,如果市民主观评价成为绩效评估的唯一形式,奖惩等相关决策主要基于主观评价结果,那就是主观指标绝对主导的绩效评估模式。具体案例如沈阳和珠海的早期实践,也包括南京市的相关实践。名噪一时的绩效评估“甘肃模式”基本上也属于这一范畴(2004年实施时,企业评价占总分值的70%,评价委员会的评价占30%)。

与发达国家的实践相比,中国政府绩效评估中主观客观指标的平衡有两个特点:一是从时间段看晚10年左右;二是出现了发达国家没有的主观指标主导模式。

(四)主观指标在政府绩效评估中的价值与功能

在梳理了不同部门绩效评估中主管客观指标平衡的历程以后,这里对主观指标的意义和价值做一简要讨论。

首先,对发达国家而言,主观指标受青睐反映了公共服务供给模式和政府责任机制的重大变革。代议制民主下公共服务供给和政府责任的实现路径是:公民通过选举控制和监督政治家,政治家行使公民赋予的权力控制和监督官僚(公务员),保证他们回应公民需求并提供公民满意的服务。公务员和公民之间的责任关系具有明显的间接性特征。随着公民需求的多样化,公共服务日趋复杂化和专业化,政治家对公务员的监督控制能力受到前所未有的严峻挑战。杰克逊(Jackson)对此评论道:“民主选举对管理效能的控制作用非常有限。选举涉及的更多的是政策问题,投票箱对管理质量问题而言不是好的控制工具。”[13]于是,强化公共服务供给中的公民直接参与就成了应对挑战的重要战略,民意调查和满意度测评则是公民参与的重要形式。公众参与不仅有助于公共服务与公民需求的无缝隙衔接,而且是实现服务供给从“政府生产公众消费的传统模式”向“合作生产”(Coproduction)新模式转变的重要保障[14]。同时,公众评价和反馈能促进公务员对公民的责任机制的完善。波西-斯密(Persy-Smith)指出:与代议制模式下公民参与的传统渠道相比,公共服务中的公民参与“意味着直接民主,意味着权力从生产者到公民的转移”[15]。在英国政府看来,这是完善民主制的重大步骤,代表着政府责任机制的重大变革[16]。

其次,主观指标在政府绩效评估中承担多样化的功能。布鲁登尼和英格兰德(Brudney&England,1982)从评估系统性和多元主体比较优势的角度论证了主观指标的价值和不可替代性。他们认为,一项公共服务可以从效率、效益、回应性和公平四个维度进行评价。效率和效益主要涉及公共服务的价格和数量,可以用一些硬性指标评价且行政官员掌握的信息较充分,因而适合扮演评估角色。在回应性和公平维度消费者更有发言权,能提供更有价值的信息[14]。此外,满意度调查在绩效评估中可以发挥沟通功能。绩效评估的目标之一是通过展示成果争取公众支持和理解,推进公众对政府的监督,从而提升政府形象和政治合法性,最终形成政府与公民、国家与社会之间的良性互动关系。英国2003年对警察服务满意度的调查曾两次询问被访者的满意情况,结果发现:访谈开始时首次询问得到的满意率数据为66%,不满意率为22%;访谈结束时再次询问,相应数据分别为73%和19%。调查者的解释是,访谈过程同时是一个交流沟通的过程,促使被访者的态度更为全面和平衡,从而导致了满意率的提升。据说这种现象普遍存在[17]。还有一点,主观指标可以发挥平衡作用,防范客观指标主导带来的信息失真和博弈行为。在西方学者看来,公民满意度主观评价对防范博弈行为的意义自不待言,上级对绩效的主观评价亦能发挥同样作用——有助于确认特定行为是否具有博弈性质,进而通过体系调整减少客观指标中的噪音和扭曲风险[18]。

第三,主观指标在中国政府绩效评估中具有特殊的价值和意义。简单概括一下:政府绩效评估中公民参与的不断扩展与深入反映了价值取向从“政府为中心”到“公民为中心”的转变,评估目标从“内部控制”到“外部问责”的转变,评估主体从技术官僚向大众参与的转变。

二、绩效评估中主观指标存在的局限性

在梳理主观客观指标平衡历程并肯定主观指标的价值和功能的基础上,本部分集中对其局限性做一讨论。事实上,从主观指标跻身绩效评估体系以来,其“效度”或主客观评价的“契合性”一直是争论不休的问题[19],[20]。浏览浩如烟海的文献可以发现一个共识:除服务客观质量外,公民满意度还受到许多其他因素的影响。这些因素包括:种族、性别、年龄等群体特性;社会网络、组织隶属关系、服务类型、供需双方的直接接触程度等情境特性;更重要的是个体特性,如政体认同度、以往经历、期望值、直觉、动机差异等[21],[22],[23]。这些因素的影响意味着,主客观评价的“无缝隙契合”实际上不存在,相互之间的“缝隙”因服务类型和环境的不同呈现出较大差异。基于双方都无意完全否定主观指标价值这一事实,西方学者围绕其效度的争论实际上属于“缝隙”多大可以接受的问题,或者说如何正确处理主观指标相对地位的问题。需要指出的是,西方绝大多数研究使用实证量化分析的主流研究方法,客观上要求聚焦于特定具体服务领域、地域或对象群体,相应缺乏对主观指标局限性的系统总结和归纳。本部分旨在弥补这一缺憾。考虑中国地方政府绩效评估中存在独特的主观指标绝对主导模式,这一探讨具有重要意义。

(一)作为评价主体的公众的能力有限性

首先,能力有限性源于体验机会的有限性。公共服务有千百种,特定时间段直接体验这些服务的个体数量有限,对诸如消防、急救等特殊公共服务及机关内部管理状况,绝大多数公民没有亲身体验的机会,其评价难免出现偏差甚至随意性。当然,可以通过增加样本量和科学抽样减少这种偏差,但这意味着高昂的成本和代价。从国内外实践来看,非亲身体验者做评价的现象相当普遍,相应带来对评价效度的质疑。

1996年6月,在斯隆基金会近60万美元的资助下,美国锡拉丘斯大学马克斯威尔学院启动了一个政府绩效评估项目,三年研究的一个重要发现是:由于多数公众缺乏亲身体验消防和警察等服务的机会,满意度调查的意义大打折扣;即使对经常体验的服务如固体垃圾清理,公众对其质量作出恰当判断也存在困难。其结论是,满意度主观指标在绩效评估中具有重要作用,但这点“仅适用于对特定服务直接顾客的调查”[24]。其他相关研究则发现了一个规律:公共服务亲身体验者的满意度及其对供给者的信任比较低,非直接使用者的满意度和信任度明显较高[25]。

中国市民评议政府部门的活动中,屡屡出现党史研究会、市委或市政府办公厅名列前茅的现象,反映的是同样的问题。这些机构很少和市民直接打交道,神秘感或距离感也许是到满意度的主要因素。此外,地方政府公众评议中领导评价占据较大比重,同样由于缺乏亲历而导致偏差或不服。某市委党校的服务态度被评为年度最差,相关人士的回应是:“这是各部门一把手给评的,他们都没有来过(党校),因为我们不培训一把手,只培训到副职”,“对象不准确,结果说保守点是不科学,说重了就是不准确”[26]206。

其次,由于医疗、金融市场监管、食品安全、研究生教育等公共服务涉及复杂的专业知识和技能,公众对其质量的判断能力必然有限。英国财政部指出:对什么构成一种公共服务有准确把握的公民屈指可数;在缺乏比较参照系的情况下,确认自己如何满意对公民来说也是一个大难题[27]。美国教授彼得斯也指出:就多数服务而言,公众可能并不知道他们的期望是什么,也不知道如何去界定服务的质量。对于比较复杂的服务如医疗和教育,其服务质量的高低不是一般公民所能判定的。即使一般性的公共服务,也很难说到底怎么样才算“足够好”[28]。

需要特别指出的是,即使专家也会出现判断上的巨大差异。《金钱》(Money)杂志每年都会把一个虚构家庭的财务记录寄给30—50名专业税务申报师,询问他们“该家庭应纳多少税”,从未有两人以上有过一致意见,他们提出的应纳税额差异大得惊人:1998年最低最高应纳税额相差83%;1990年居然高达976%(最低6807美元,最高达73247美元)!安达信前任CEO贝拉尔迪诺(Berardino)在安然公司破产案的国会听证会上说:“许多人都认为会计是门科学,这里1就是1,2就是2,十分精确。……但是我们认为,会计实际上更是一门艺术。”[29]

第三,公民评价难以摆脱自身立场做到完全的公正客观。对某些公民是好的服务(如旅客希望快速通过海关检查),对全体公民却未必如此(如产生走私的漏洞),因为判定的标准不同。我们经常提到赶公交车时的心理变化,没上去时总觉得里面有空,挤一挤可以加一个人,一旦迈入马上感觉满员,希望关车门,这种变化反映了同样的问题。与此同理,即使法院的判决很公正,打输官司的人多数可能不满意。这并不完全因为人们自私缺乏公正性,而是有着深层次的心理根源,即“无意识偏颇”和做判断时的利己倾向(self-serving bias)。

心理学的研究表明,人们的愿望会影响解读信息的方式,当希望得到某个结论时,他们经常就会下这样的结论,对那些与希冀的结论相悖的事实往往会吹毛求疵继而否定它们的存在,而对于那些支持自己立场的证据会不假思索地迎头拥抱。巴布科克和勒文施泰因(Babcock and Loewenstein)于1997年发表的一篇文章曾描述了这方面的一个实验。在实验中,受试人两人一组,分别扮演一起交通事故中的原告(摩托车驾驶员)和被告(汽车驾驶员)。两组扮演者拿到协同的警方报告、医院验伤报告、证词及其他相关材料,其任务是协商解决本案,协商不成功由法官裁定赔偿额,而事故双方也被罚以重金。正式谈判前要求每个受试人都预测一下,如果协商无果法官会裁定原告得到多少赔偿。为避免偏颇倾向的干扰,角色扮演者都被告知他的谈判对手不会看到他的预测,而且他的预测也不会对法官的裁决产生丝毫影响。结果令人震惊,“原告”们预测自己可获得的赔偿额都超过“被告”们预测的金额。这是利己倾向的一个典型例子:掌握的信息完全相同,但不同人得出的结论却完全不同,每个人的结论都对自己有利。在随后的实验中,为减少受试人的偏颇倾向,研究人员告诉他们,能正确预测法官裁定的赔偿额者将得到一定的奖励。此外,受试人还要写一篇为对方辩护的文章。然而,这两种方法都未能减少他们的偏颇倾向,双方始终认为法官最终裁定的赔偿金额会于己有利。接下来,研究者对受试人进行了专门培训,进而通过测试确保他们理解“偏颇倾向”这一概念。结果发现,双方都认为谈判对手偏颇,却绝不相信自己会有所偏颇[30]。

(二)公民满意度主观指标的比较价值有限

之所以讨论比较价值,是因为比较是评价和展示绩效的主要方式,而且评估结果的运用主要基于比较信息。可以说,没有比较也就没有绩效评估,比较失当会引起一系列后续决策的失当,最终影响到绩效评估的效用,包括激励奖惩、监督问责、诊断改进、资源优化配置等。

首先,主观指标比较价值的有限性表现在横向比较上。满意度评价具有相对性,满意与否不存在完全客观的标准,主要取决于“期望质量”与“感知质量”之间的差距。A地公民长期为治安状况所困扰因而期望值不高,暴力犯罪率降低几个百分点可能导致较高的顾客满意率;而B地长期治安状况良好,暴力犯罪率上升几个百分点会导致较低的治安满意率。结果可能是,A地暴力犯罪率3%可能会有80%的满意率,B地暴力犯罪率2%可能只有75%的满意率,我们不能根据满意率得出A地治安优于B地的结论。现实中的一个例子是,根据世界经济论坛2013年的《世界竞争力报告》,警察绩效的综合评价英国排名20多位,我国台湾地区排名36位。2014年警察服务满意度数据分别是:英国61%,我国台湾地区62%。①数据来源于中新网8月6日新闻报道:《台治安满意度:民众对警察很满意对贪渎很不满》,http://news.sohu.com/20140806/n403177195.shtml。类似客观综合评价排名差距较大而满意度差异甚微甚至相反的现象比较普遍。由此可以得出一个结论,满意率差异较大可能意味着客观质量确实存在差距,差异较小则和服务质量没有相关性,而大与小之间的门槛则因事而异。

其次,主观指标比较价值的有限性还表现在纵向比较上。鉴于被评估单位的起点、基础条件、工作性质、功能定位等存在巨大差异,简单的横向比较难以充分反映相关主体的工作绩效,国内一些地方探讨用“提高(改进)幅度”之类的指标进行不同单位绩效的比较。提高或改进幅度实际上是一种纵向比较。国外有研究表明,就客观质量和公民满意度之间的动态关系而言,只在客观质量显著提升或明显下降两种较为极端的情况下,公民满意度与客观质量才呈现正相关关系,客观质量小幅持续改进或小幅波动的情况下,满意度变化与之不相关[31]。这意味着,客观质量的小幅改进可能伴随满意率下滑,客观质量的小幅下滑可能伴随满意率上升。问题在于,公共服务质量短期内显著提升或明显下降的情况比较少。现实中的一个例子是,北京市多年来一直对区县工作进行群众满意度评议,2003年评议后,有两个区的领导对评议结果非常重视,组织专家调研诊断,要求各部门按照调研结果制定系统整改方案。第二年,政府各部门服务的客观质量都有一定程度的提升,但群众对区政府的整体满意度不升反降:A区的满意度从2003年的86%下降到2004年的83.8%;B区则从88.6%下降到86.6%。这在实践中不是个别现象[26]209。

(三)顾客满意与权利公正问题

政府提供的许多产品和服务低于实际成本甚至是完全免费的,特别是那些惠及特定群体的再分配政策,如经济适用房、廉租房、救济金、最低生活保障等。类似服务会创造巨大的寻租空间,目标群体的“瞄准”问题因而至关重要。目睹穿金戴银者领取救济金,公众会产生被愚弄的感觉,进而质疑政府政策和公信力。现实中曾出现过保障房中签“六连号”、90%保障房分配给公务员、某市主管局长拥有数十套保障房等现象。近年来干部职工亲属违规吃低保和“关系保”、“人情保”等问题引起广泛关注,以致多地开展了专项整治运动。这意味着权利公正存在突出问题。在再分配政策领域,公正是政府追求的首要价值,满意度调查不能回答权利公正问题。

以保障房为例,公民满意度调查在对象选择上会面临一个困境:如果以大随机抽样方式选择,由于保障房享受者在其中只占很小的比例,调查会遇到“非亲历者”评价的现象,其局限性前面已做过讨论;如果满意度调查仅选择享受到保障房的“客户”,他们可能表示满意,起码在僧多粥少的竞争中运气不错,而且拿到数万甚至数十万的隐性补贴。这里的问题在于,更困难的家庭没有享受到保障房,而他们往往不属于顾客满意度调查的对象。权利公正问题由此产生。

(四)主观指标在中国面临的特殊局限性

在系统讨论了主观指标的一般局限性之后,不能不提及特殊国情伴随的特殊局限性。首先,我国行政管理的透明度和公开性不足,这增加了公众评价的难度,从而影响到主观评价的效度。其次,政府公信力状况及其“差序格局”会加剧公众评价的偏颇。国外许多研究证明,公民满意度的重要影响因素之一是政体认同度或政府的政治合法性和公信力[25]。我国政府公信力存在所谓“差序格局”:行政级别较高政府的信任度高于行政级别较低政府的信任度,对中央政府的信任度高于对地方政府的信任度[32]。在对地方政府缺乏信任情况下的公众评价难以做到客观公正,法院判决再公正输者不满意的现象在中国更严重。

如果说以上问题各国普遍存在区别仅在于“度”的话,那么中国满意度测评中存在一个独特现象即博弈行为及其导致的信息失真。博弈即作弊或有意弄虚作假。地方政府在民意测评中的博弈策略包括赤裸裸捏造数据、公关手段、技术控制等,相应造成严重的信息失真:畸高满意率与境外情况存在巨大反差;满意度测评结果与社会认知存在巨大反差;不同主体调查结果之间存在巨大反差;不同时间段调查结果存在巨大反差;满意度测评结果存在明显的内在矛盾[33]。这些不仅带来满意度调查的信任赤字,而且对主观指标的价值和效用形成严峻的挑战。

三、理论澄清与政策建议

在对主观指标在组织绩效评估中的演进历程、价值效用及其局限性做了系统梳理讨论之后,本部分对几个未曾涉及的问题做出理论解释,然后就主观指标在中国政府绩效评估中的相对地位和作用提出建议。

第一个需要理论解释的问题是:如何理解和认识私营部门绩效指标评估中的主观指标主导现象?考虑绩效金字塔、平衡计分卡等多种绩效模型的存在,不能机械地把主观指标主导理解为权重超过50%。可以说,主观指标主导主要是一种观念或理念,即顾客满意是质量的唯一衡量尺度。福特汽车公司老总曾经说过:福特公司长期认为,公司经营只有一个重要目标,就是为投下的资金赚取报酬。现在我们认识到,还有一件事比这个更重要,那就是服务顾客,使顾客满意。对于以赢利为目标的私营部门来说,这确实是一个观念上的革命。

那么,主观指标主导是否意味着私营部门的社会责任和公共性优于公共部门?答案是否定的。在笔者看来,这一观念变革仅体现了以更精明的方式可持续地赢利,与公共性关系不大。美国默克公司总裁乔治·默克的有关言论道出了其中的奥秘:“本公司同仁所必须遵循的原则,简要地说就是我们要牢记药品旨在治病救人。我们要始终不忘药品旨在救人,不在求利,但利润会随之而来。如果我们记住这一点,就绝对不会没有利润;我们记得越清楚,利润就越大。”获取丰厚的利润只是圆满完成使命的附带结果[34]。

第二个问题是:如何认识发达国家公私部门在主观指标相对地位上的差异?或者说,同样的“顾客至上”原则为什么在公共部门没有产生主观指标的主导?这恐怕要从政治体制中寻求答案。在现代政治体制下,公众扮演着“公民”和“顾客”等多重角色,公民角色享受并行使政治权利,顾客角色则主要行使消费者的权利。公共服务中公众“用脚投票”的权利有限,意味着顾客和消费者权利有限,所以需要强化公民的政治权利。显然,公民角色具有优先性,顾客角色处于次要地位。公民满意度测评主观指标更多反映的是顾客角色,所以没有也不应该占据主导地位。换个说法,按照西方代议制民主下政府责任的实现路径,在通过选举实现对政治家有效控制的前提下,公民在公共服务中的参与主要是应对政治家(对公务员)监控能力的严峻挑战,用直接参与来矫正传统间接责任机制的局限。直接参与聚焦于“管理质量”而非更重要的“政策问题”,作为直接参与结果之一的满意度指标相应居于附属地位。

在做了上述理论解释和澄清之后,下面就主观指标在中国政府绩效评估中的定位提出几点看法和建议。

首先,应该明确的是:以满意度主观指标为唯一评估标准的“万人评政府”模式应尽快淡出中国政府的绩效评估实践。这一独特模式的最初出现具有里程碑意义和积极价值,但随着实践发展和理论研究的深入,其非理性特征和弊端日益显现,应该淡出。有人可能会说,中国的民主制度还不完善,不像发达国家那样公众可以通过选举实现对官员的有效控制,所以“万人评政府”模式不仅有其存在的价值,而且属于特殊国情下的中国特色。在我看来,这属于“公民”角色和“顾客”角色、公民权利和消费者权利的不当混淆。政治和行政分属性质不同的两类活动,承担的功能不同,运行机制及其遵循的程序规则等也会有所不同。如果把政治领域的运行准则移植到行政领域,用行政体系内部民主化弥补政治民主化的不足,用强化顾客角色和顾客权利来弥补公民角色和公民权利的缺失,可能会导致价值错位和系统功能紊乱。

其次,需要探讨主客观指标在绩效评估中的相对权重。从发达国家政府部门年度绩效计划看,95%以上绩效目标属于客观指标,绩效报告中的目标实现状况展示相应以客观指标为主。公民满意度由第三方独立实施,结果独立公布作为参考,没有计入部门绩效总分或作为绩效档次划分的主要依据。除了万人评政府这一独特实践,中国地方政府的“社会评议”结果计入绩效总得分,在被评价单位的绩效排名或档次划分中发挥作用。因此,主客观指标的平衡需要探讨各自在绩效总分中的权重。从各地实践看,社会评议在绩效总分中的权重从5%到50%不等,且经历了一个动态调整的过程。需要对这些地方进行深入调查,在此基础上进行比较分析,从而确定主客观指标的合理权重。

第三,主客观指标的平衡需要考虑差异化设计。普通公众与公共服务的直接体验者(用户)之间有着重要区别,与民众直接打交道的部门和不直接打交道的部门(如办公厅)之间有重要区别,履行管制行为和再分配行为之间有着重大区别,……主客观指标的合理平衡需要综合考虑并区别对待,比如在满意度测评中区分“顾客”和其他群体,得出不同群体的满意度状况。如果通过大随机抽样得出部门满意度分值,可以赋予不同部门不同权重。值得一提的是,相似的管制行为由不同部门履行也会带来公众不同的评价。公安和城管都履行执法功能,公安部门动粗公众认为是针对嫌犯可以接受,而城管的执法对象多是弱势群体,公众的城管法规意识不强且同情弱势群体,执法失范就会导致反感和差评。城管部门在公众评议中垫底现象比较普遍,有地方已开始分类区别对待的尝试。

第四,需要提倡公民为本和结果的导向的客观指标的设计。淡化主观指标权重并不意味着公众在绩效评估中地位的降低,客观指标并非仅仅关注经济、成本、效率等,完全可以体现公民导向,即立足公民立场设计客观指标。举一个例子,美国某金融监管机构的战略目标之一是“保护投资者免受不必要的损失”,其中一个绩效指标是“损失追索指数”,即金融机构出状况后投资者能够追回的资金量状况。这显然是一个客观指标。类似公民为本、结果导向的客观指标要优于满意度指标。我国曾出现过违法集资、金融机构负责人卷款逃跑、证券公司违规操作等现象,给投资者造成巨额损失。在这类案件中,违法者受到应有惩罚可以提升满意度,但显然不如损失追索状况来得实惠;地方政府出资抹平可以赢得当事人满意,但这有违社会公正,同时掩盖了监管者的失职。

最后,需要关注满意度调查的诊断与改进作用。诊断与改进取向的满意度调查,就是通过科学的设计和调研,对影响公民满意度的主要因素进行系统排序和诊断,进而针对性地设计公共服务改进方案。地方政府为满意度调查付出巨大的成本和代价,但诊断和改进取向的调查尚未进入视野。这一缺失会带来一系列缺憾:“知其然不知其所以然”,知道公民对某一方面满意或不满意,但无法搞清背后的驱动因素是什么,也不知道导致不满的具体环节和方面;对导致不满的原因不甚了了,也就无法针对性设计改进方案和措施。英国2003年警察服务满意度调研中的“关键驱动因素分析”,是这方面的一个范例。调查研究中的四个自变量包括:公民接触警察的事由;公民接触警察的方式;警察接警后的具体处置;公民群体特性。因变量则是对警察服务“综合接触满意度”。研究的目的是针对不同接触事由、不同接触方式、不同公民群体,通过回归分析探讨警察处置过程中的哪些方面最易于导致满意和不满。最终形成针对性改进方案[35]。英国实践从理念、制度、技术等多个层面,对我国公民满意度调查的理论研究和实践提供了有益的启示。

[1]DUNCAN W J.Great Ideas in Management:Lessons from the Founders and Foundations of Managerial Practice[M].Oxford,UK:Jossey-Bass Publishers,1990:27.

[2]POLLITT C,BOUCKAERT G Quality Improvements in European Public Services:Concepts,Cases and Commentary[M].London,UK:Sage,1995:3.

[3]CARDOZO R N.An Experimental Study of Customer Effort,Expectation,and Satisfaction [J].Journal of Marketing Research,1965,2(3):244-249.

[4]LOSARDO M M,ROSSI N M.At the Service Quality Frontier:A Handbook for Managers,Consultants and Other Pioneers[M].Milwaukee,WI:ASQC Quality Press,1993.

[5]WILLIAMS D.Measuring Government in the Early Twentieth Century[J].Public Administration Review,2003,63(6):643-659.

[6]艾伦·希克.通向计划项目预算之路:预算改革的各个阶段[M]//阿尔伯特·海迪,等.公共预算经典——现代预算之路.苟燕楠,董静,译.上海:上海财经大学出版社,2006:72.

[7]POLLITT C.Performance Measurement in the Public Services:Some Political Implications[J].Parliamentary Affairs—A Journal of Comparative Politics,1986,39(3):315-329.

[8]POLLITT C.Performance Indicators in the Longer Term[J].Public Money and Management,1989 ,(3):51-55.

[9]周志忍.公共部门质量管理:新世纪的新趋势[J].国家行政学院学报,2000,(2):40-44.

[10]荣敬本,等.从压力型体制向民主合作型体制的转变:县乡两级政治体制改革[M].北京:中央编译局出版社,1998.

[11]周黎安.中国地方官员的晋升锦标赛模式研究[J].经济研究,2007,(7):36-50.

[12]中共中央组织部.关于实施地方党政领导干部年度工作考核制度的通知[Z].1988.

[13]JACKSON P M.Measures for Success in the Public Sector[M].London,UK:CIPFA,1995:89.

[14]BRUDNEY J L,England R E.Urban Policy Making and Subjective Service Evaluations:Are They Compatible?[J].Public Administration Review,1982,42(2):27-135.

[15]PERSY-SMITH J.Needs Assessments in Public Policy[M].Philadelphia,PA:Open University Press,1996:26-27.

[16]HM TREASURY.Public Services for the Future:Modernisation,Reform,Accountability[Z].Cm 4181,HMSO,London,1998:2.

[17]MORI Social Research Institute.Contacting the Police Customer Satisfaction Survey(final report)[R].August,2003.

[18]BAKER G.Distortion and Risk in Optimal Incentive Contracts[J].Journal of Human Resources,2002,37(4):728-751.

[19]倪星,李佳源.政府绩效的公众主观评价模式:有效,抑或无效?——关于公众主观评价效度争议的述评[J].中国人民大学学报,2010,(4):108-116.

[20]曾莉,李佳源.公共服务绩效主客观评价的契合性研究——来自H市基层警察服务的实证分析[J].公共行政评论,2013,(2):72-103.

[21]OLIVER R L.A Cognitive Model of the Antecedents and Consequences of Satisfaction Decisions[J].Journal of Marketing Research,1980,17(4):460-469.

[22]CHURCHILL G A,Suprenant C J.An Investigation into the Determinants of Customer Satisfaction[J].Journal of Marketing Research,1982,19(4):491-504.

[23]YANG Y.Adjusting for Perception Bias in Citizen’s Subjective Evaluations:A Production Function Perspective[J].Public Performance & Management Review,2010,34(1):38-55.

[24]National Center for Public Productivity,Rutgers University.Citizen-Driven Government Performance:Case Studies and Curricular Resources[PDF].(2003-08-15)[2015-01-20].www.andromeda.rutgers.edu/~ncpp.

[25]CHRISTENSEN T,et al.Trust in Government:The Relative Importance of Service Satisfaction,Political Factors,and Demography[J].PublicPerformance&Management Review,2005,28(4):487-511.

[26]邓国胜,肖明超.群众评议政府绩效:理论、方法与实践[M].北京:北京大学出版社,2007.

[27]HM TREASURY(UK).Service Transformation Agreement[Z].October 2007.

[28]B·盖伊·彼得斯.政府未来的治理模式[M].吴爱明,等,译.北京:中国人民大学出版社,2001:81.

[29]马克斯·巴泽尔曼,乔治·勒文施泰因,唐·穆尔.会计师为何变“坏”[J].书文,译.哈佛商业评论,2003,(4):93-100.

[30]BABCOCK L,LOEWENSTEIN G.Explaining Bargaining Impasse:The Role of Self-Serving Biases[J].The Journal of Economic Perspectives,1997,11(1):109-126.

[31]STIPAK B.Citizen Satisfaction With Urban Services:Potential Misuse as a Performance Indicator[J].Public Administration Review,1979,39(1):46-52.

[32]李连江.差序政府信任[J].香港:二十一世纪,2012 年6月号.

[33]徐艳晴,周志忍.公民满意度数据失真现象考察:信任赤字、博弈策略、理论意涵[J].公共行政评论,2014,(6):55-66.

[34]谢丹.医药公司的道德形象[J].南风窗,2002,(23):62.

[35]徐艳晴,周志忍.诊断与改进取向的公民满意度调查——英国警察服务满意度调查对我们的启示[J].国家行政学院学报,2014,(2):47-53.

(责任编辑:温美荣)

D630

A

1005-460X(2015)03-0037-08

2015-02-16

教育部哲学社会科学研究重大课题攻关项目“中国地方政府绩效评价体系与管理机制研究”(05JZDH0019);国家自然科学基金面上项目“整体政府视角下的中国政府跨部门协同机制研究”(71173004);北京大学“国家治理协同创新中心”成果

周志忍(1954—),男,山西万荣人,教授,博士生导师,北京大学政治发展与政府管理研究所研究员,从事比较行政学、公共政策与绩效管理研究。

猜你喜欢
主观公民顾客
我是小小公民科学家
论公民美育
“美好生活”从主观愿望到执政理念的历史性提升
加一点儿主观感受的调料
让顾客自己做菜
十二公民
主观评述构式“很+x”认知研究
以顾客为关注焦点
公民选举权的平等保护
顾客是我们的上帝品质是顾客的需求