范柏乃,韩 飞,陈韶晖,郭 芸
(浙江大学 公共管理学院,浙江 杭州 310058)
在全面实施绩效管理的背景下,中国亟需深化行政体制改革,转变政府职能。各地政府的实践经验表明,有效的绩效管理是转变政府职能的重要工具。自1979年中共中央组织部发布《关于实行干部考核制度的意见》起,中国开启了长达四十余年的绩效管理建设[1]。从局部试点到全面实施,从主要由部门推动的局部探索,转型升级为国家全面实施的全方位、全过程、全覆盖体系[2]。中国政府绩效管理制度引导地方政府实现了绩效目标、监控、自评和责任的全覆盖的同时,消耗了大量财政资源,仅2018年初,中央层面实施绩效目标管理的资金规模就已经超过了2.5万亿元[3]。政府绩效管理全面推进的过程中,执行成本高昂,消耗了大量人力、财力、物力和时间的同时,地方政府绩效管理仍然存在立法保障缺乏、绩效问责不足、评估专业化程度不高的现象,陷入了绩效不彰的尴尬局面[4-5]。加之,当前各类经济社会问题纵横交错导致政府预算压力陡增,如何分配行政资源以提升绩效管理投资回报率的讨论备受实践界关注。面对如此现状,亟需从成本收益的视角开展研究,以扭转政府绩效管理工作中重投入轻管理、重支出轻绩效的观念,积极主动地控制由政府绩效管理工作自身带来的效率损耗[6]。
元评估(Meta-evaluation)是基于专业化、科学化、规范化的标准提升绩效管理效率的必由之路[7-9]。早在1940年,佩德罗·奥拉托(Pedro Orata)就提出了元评估的思想,强调“对评估本身的评估”(evaluation evaluation)[10]405。基于该思想,Stufflebeam[11]将元评估定义为使用描述性和判断性信息诊断评估的效用性、可行性、适当性、准确性、系统性、有效性、完整性、权威性以指导评估,判断公开报告的优缺点的过程。为将该思想操作化,1995年美国评估协会(American Evaluation Association)提出了《评估者实践指南》(Guiding Principles for Evaluators)[12],但是该指南较为复杂抽象,操作性欠佳。在其指导下,Sanders[13]和Stufflebeam[14]提出了UFPA框架,从效用性(Utility)、可行性(Feasibility)、合理性(Propriety)和精确性(Accuracy)四个维度对评估活动进行了再评估。在元评估研究的影响下,美国评估研究会、美国评估协会、澳大利亚国家审计署、德国评估协会、非洲评估协会、OECD国家和世界银行相继制定了元评估原则,然而,这些提出专业化原则的评估机构因元评估内容繁杂,而未能化繁就简以达到管中窥豹的评估目的,未能提升政府绩效管理的规范化和专业化程度[10]405。因此,有必要在反思已有元评估模型的基础上,结合实—证研究结论改良元评估模型,通过模型的建构、测算和验证提出一套新的元评估思路,并回应研究问题——政府绩效管理是否有效,以推进关于政府绩效管理有效性的理论认知。
在Stufflebeam[15]看来,元评估的最终目标是考察评估活动的质量和成本收益率。目前,尚处起步阶段的政府绩效管理元评估围绕这一目标形成了两类模型:一是系统分析模型,该模型从经典的元评估框架出发,将评估活动看作投入产出系统,评估该系统在主体、方法、活动、数据等方面的偏差;二是制度分析模型,该模型从制度绩效视角对绩效管理制度的实施绩效进行评估,总结分析实施绩效的生成机制,并实现绩效改进[10]408[16]。
第一阶段的元评估研究主要围绕系统分析模型展开,沿袭UFPA框架,试图从利益相关者、评估者、实务的程序、评估信息等方面系统考察绩效管理制度的质量和效率,呈现系统全面的定性论断,有益于探究“最佳绩效评估模式”[8][16],但系统分析模型在评估假设和评估论断方面有待改进。系统分析模型的基本假设是存在可模仿的最佳绩效管理模式,然而政府绩效管理本身的复杂性、多样性决定了该假设很难成立。更需要关注的是,系统分析模型中涉及较多定性评估指标,操作性欠佳。因此,盛明科和彭国甫[17]利用克朗巴赫系数、肯德尔和谐系数等方法提升了元评估结论的精确程度。
第二阶段的元评估研究主要围绕制度绩效模型展开,此类研究往往以绩效管理效率(Performance Management Effectiveness)为因变量,构建制度绩效模型,探究一种单向因果关系,以进一步系统提升元评估结论的精确程度。大量来自美国的实证研究表明,此类单向因果关系中有两类重要影响因素—人力投入和组织投入[18-20]。有学者基于结构方程模型进一步指出政治环境也是绩效管理实施绩效的重要影响因素[21]。虽然实施绩效的重要影响因素在已有模型中逐渐明晰,但这些模型仍然存在遗漏变量问题。孟庆国等[22]基于准实验设计建立双重差分估计(DID)模型,规避了遗漏变量问题,并指出政治环境影响了目标管理类、效能监察类、外部评价类绩效管理工具的使用及其实施绩效。制度绩效模型的评估结果比系统分析模型的评估结果更清晰。更重要的是,制度绩效模型假设绩效管理制度与绩效管理效率之间存在单向因果机制。就评估假设的科学性和评估结论的稳健性而言,制度绩效模型还存在改进空间。
虽然两类模型的最终目标都是分析绩效评估的质量,指出评估活动的优缺点,但侧重点各有不同。系统分析模型倾向于开发评价标准以系统判断评估活动本身的优缺点。制度绩效模型侧重于构建计量模型,分析绩效管理制度效率及其影响因素。围绕系统分析模型展开的研究表明,UFPA框架是透视绩效管理实施绩效的可靠分析框架;围绕制度绩效模型展开的研究表明,政治环境、人力投入和组织投入都是绩效管理投入系统中的关键变量。然而,两类模型在评估假设的科学性、评估结果的精确性和稳健性方面仍存在一定的不足。
在元评估研究的演进过程中,两个阶段的元评估模型已经完成了各自的使命,从系统分析视角和制度绩效视角分别提出了元评估的基本框架和核心变量。然而,当前中国地方行政资源不足,需要更加准确、稳健的元评估模型为有效分配稀缺资源提供依据,从而提升绩效管理的成本收益率。如果聚焦元评估的最终目标—成本收益率,构建成本收益模型,那么绩效管理投入系统和产出系统间的关联程度和趋势就会得到充分考虑。成本收益模型的建构可能将制度绩效模型中的因果关系问题转化为成本系统与收益系统之间的一致性问题,元评估结论的模糊性问题也可能解决。
成本收益模型的框架建构依据为系统分析模型中的UFPA框架。结合中国的绩效管理实践,可将UFPA框架延伸为四维的绩效管理成本要素:一是效用性维度,绩效管理能产生多维度的效用,最重要的维度在于政府基于绩效管理制度提供公共服务,并满足群众需求;二是可行性维度,评估重点是衡量评估活动的资源是否充足,常用指标有经济可行程度、政治可行程度,其中较为关键的是经济可行程度,主要体现在人力投入和财力投入等方面;三是合理性维度,评估焦点是绩效评估的规范程度与合法程度,常用的指标是服务导向、正式合约和公民参与权等等,这三项指标的实现有赖于绩效办、评估中心等组织的设立与运行;四是精确性维度,主要包括评估指标的准确性和绩效信息来源的可靠性[8][23]。评估指标的准确性主要表现为政府在重点工作任务、重大项目建设、规划政策落实、机关行政效能建设方面的集中投入,是实现整体性治理的重要特征。四维度所考察的内容包含于绩效管理投入机制的“制度供给—资源整合—整体治理”三个环节之中[24],其中,第一环节是中国的政府绩效管理工作以“人民至上”的理念凝聚共识,从群众需求出发供给绩效管理的制度;第二环节是根据制度供给目标,各级政府部门持续加大人力投入、财力投入和组织投入;第三环节是各级政府部门根据群众需求和领导指示规范这一系列投入的方向和力度,对民生工作和重点工作的投入进行适度调整和优化配置,以实现整体治理目标[25]。
成本收益模型的变量选择依据为制度绩效模型。在政府绩效管理的制度供给和资源整合环节,民生考核投入、人力投入、经费投入、组织投入和重点工作投入组合成一个绩效管理投入系统。基于对广西绩效办的半结构化访谈可确定这一投入系统对应的五个测量指标,如表1所示。其中,广西绩效办的L主任认为,选取民意调查总分对民生考核投入进行测度的理由在于,针对绩效管理工作的民意调查总分可判断政府在民生考核方面的投入是否正是群众所需,民生考核的投入与群众对绩效管理的主观感受高度相关;因为重点工作测评分可较好反映人、财、物投入在多大程度上聚焦于重点工作和重大项目建设,所以可选择重点工作测评分以测量重点工作投入。在整体治理环节,中国政府绩效管理的绩效目标是推进行政体制改革和经济社会发展,主要表现为实现经济、社会目标的能力[7]。与国家层面的绩效目标保持一致的市级政府,其绩效目标至少涉及经济发展、社会发展和生态建设三方面。结合这三个方面,课题组查证了广西壮族自治区十年来14个设区市的绩效考核指标体系,通过筛选明确了表1中的四个指标。其中,用万元增加值综合能耗测度经济效率的理由在于,通过对企业能源利用效率的测量可判断政府在改善经济效率方面的成绩。
表1中的四维成本要素和二维收益要素分别是成本收益模型的起点和终点。起点对应绩效—管理投入机制的制度供给和资源整合环节;终点对应整体治理环节,起点与终点之间存在一个“连接器”——绩效管理效率(PM Effectiveness)。绩效管理效率可表征为成本收益关联度。UFPA框架下的成本要素和收益要素、成本收益关联度,三要素环环相扣,组成了成本收益模型,留待于实证检验。该模型旨在从成本收益视角评估绩效管理效率,引导政府对内做好组织运行,对外做好资源配置和公共物品供给,进而从经济目标完成率和社会目标完成率两个维度提升政府的整体治理效率[26]。
无论从时间,还是空间维度观察,中国唯一入选《公共部门绩效全球报告》最佳实践案例的广西绩效管理都具有先进性和典型性[27-28]。在时间维度上,从2008年开始,广西绩效办开启了南宁等四个市的绩效管理试点工作,初步建立起目标分解、督促检查、考核奖惩、信息公开等基础性制度。2011年国务院批准广西绩效办开展整体性政府绩效管理的创新试点工作[29],其下辖的14个地级市以此为契机全面推进绩效管理工作。2018年,各市进一步聚焦高质量发展要求,优化指标体系,加快信息化建设,切实推进绩效管理升级发展。从初创,到发展,再到升级,处于不同发展阶段的广西绩效管理无不体现着较强的先进性。在空间维度上,中国政府绩效管理从“目标责任制”过渡到“全面预算绩效管理”[6]。处于相邻空间的广西各市坚持围绕国家各项重大战略部署制定绩效管理制度,形成可量化、可执行、可考核的具体目标任务,实现责任分解横向到区直部门、纵向到市县乡村,切实推进重点领域、关键环节的改革创新,形成影响全区的“绩效管理指挥棒”,以激发各级各部门为市场服务、为社会负责的活力与热情,硕果累累[30-31]。与此同时,覆盖全区的广西绩效管理建构了协同驱动的六大体系—组织工作体系、考评指标体系、考评方法体系、察访核验体系、创新争优体系和结果运用体系[26]。这六大体系消耗了大量人力、财力、物力。具体而言,截至2019年,共设立市级以下的绩效管理组织单位221个,占用行政编制867个。
基于上述考察,课题组选定广西绩效管理为研究对象,开展了为期六年的实地调研,依托广西绩效办、广西统计局、广西生态环境厅等单位系统收集了广西14个市的文本资料和面板数据。研究样本是横向可比较、纵向可追踪的全样本数据,样本期限为八年(2010—2017年),最终有效样本为112个。研究样本的数据结构完整且质量较好,符合开展元评估的基本要求。加之,广西各市的绩效管理在人、财、物投入、制度安排、评估模式、成本收益方面存在差异,为形成差异化的元评估结果提供了保障。
成本收益模型的建构基于灰色关联度分析展开。灰色关联度分析的初衷是确定比较数列对参考数列的影响程度,作为分析结果的灰色关联度还代表两系统间的关联趋势。这种关联趋势的测算适用于两个具有非线性关系的系统。因此,该方法可用于测算绩效管理成本系统和收益系统之间的关联程度及关联趋势。
实证分析围绕成本收益模型的建构、调整和验证展开。一是建构,应用灰色关联度算法测算绩效管理工作的成本收益率,从而建构成本收益模型;二是调整,调整灰色关联度算法,确定哪些投入能够带来更多的绩效管理收益,从而明确获取绩效管理收益的最优途径;三是验证,基于初始模型测算14个地级市的灰色关联度,通过k均值聚类排名的比较分析,检验模型的准确性;运用面板回归分析,在控制城市规模、政府规模等变量后,探究成本收益关联度与政府绩效之间的因果关系,从而验证模型的稳健性。
成本收益模型建构的关键在于计算绩效管理的收益要素和成本要素间的灰色关联度,主要有三个步骤。第一步,分别定义参考数列(y)、比较数列(x)和矩阵(r),矩阵r的行代表年份,列代表城市,用于储存x和y;第二步是参考数列和比较数列的标准化,计算公式为Y1,i=[Y1,i-min(Y1)]/[max(Y1)-min(Y1)],得到标准化的参考数列和比较数列Yi、Xi;第三步为计算关联系数。首先,通过Xk=abs(Xi-Yi)得到标准化后的参考数列和标准数列差的绝对值,形成一个4×14的矩阵。然后,取分辨系数为0.5,则得到矩阵b,行m代表参考数列的指标,列n代表城市,令2010年的灰色关联度矩阵为b2010,通过公式b(m,n)=(Xkmin+0.5Xkmax)/[Xk(m,n)+0.5 Xkmax],得到矩阵b2010、b2011、b2012、b2013、b2014、b2015、b2016、b2017。最后,将八年的关系系数矩阵整合到同一个矩阵b中,形成一个32×14的矩阵,得到灰色关联矩阵r=b/4。
基于矩阵r得到参考数列的灰色关联度t1=0.71,t2=0.788,t3=0.774,t4=0.802。从关联度的大小可判断:相同的绩效管理投入,在实现生态环境目标(y4)方面最高效,其次是经济效率目标(y2),然后是居民生活目标(y3),最后是经济实力目标(y1)。四个关联度的均值为0.77。这一结果表明,成本收益关联度为77%,这意味着成本系统和收益系统之间有较强的关联程度和关联趋势,从成本收益的视角验证了广西绩效管理的有效性。
为探究绩效管理投入在哪些方面更有效,需要明确每一项投入指标与产出指标之间的关联度。因此,改造灰色关联度的数学模型—将参考数列与比较数列对换,重新定义灰色关联矩阵r为40×8的矩阵,得到比较数列的灰色关联度,g1=0.54,g2=0.49,g3=0.52,g4=0.47,g5=0.539。从而得出结论—对应同等程度的绩效管理收益,成本最低的是x1(民生考核投入),其次是x5(重点工作投入),x3(经费投入),成本最高的是x2(人力投入)和x4(组织投入)。这一数值求解的结果明确了绩效管理投入的优先顺序。
验证成本收益模型的准确性和稳健性。首先,基于灰色关联度模型对广西14个市进行元评估得到各市的成本受益关联度,应用k均值聚类算法对各市按照成本收益关联度排序。然后选取政府绩效考核指标得分和GDP增长率分别代表政府的内部绩效和外部绩效。按照k均值聚类算法对广西各市元评估结果、考核指标得分、GDP增长率做迭代求解的聚类分析,进而分别对广西14个市八年的平均成本收益关联度、考核指标得分和GDP增长率进行计算和排序,最后的元评估结果如表2所示。如果成本收益关联度排序与政府内外部绩效的k均值聚类排序存在一定关联,那么则从评估结果相似度的角度验证了模型的准确性。
表2 政府绩效的元评估结果
在表2中,成本收益模型的聚类结果与政府内、外部绩效的聚类结果完全一致的情况出现了四次,分别与政府内、外部绩效保持一致的情况出现八次。加之,没有出现三类聚类结果相差两个等级的情况。这意味着由成本收益模型得出的聚类结果与政府内、外部绩效存在一定程度的正向关联。这种显著的正向关联验证了成本收益模型的准确性。
与此同时,系统分析模型的聚类结果与政府内、外部绩效的聚类结果完全一致的情况仅出现一次,分别与政府内、外部绩效保持一致的情况仅出现五次,其相似度分别比成本收益模型低21.5%和21.4%。这意味着,成本收益模型比系统分析模型更准确。
为验证成本收益模型的稳健性,本研究基于面板回归分析明确了成本收益关联度与政府绩效之间的关系。选定GDP增速(gdpgr)为因变量—政府绩效,成本收益关联度(rd)为核心自变量。因为人口是重要的生产要素,是城市中重要的资源禀赋,所以选择各市常住人口数(po)代表城市规模。因为公共财政支出与政府政策投入有较高的关联度,所以选择公共财政预算支出(pbe)表征政府规模。在回归模型通过了豪斯曼检验(Hausman Test)之后,根据检验结果选择固定效应模型,其计算结果如表3所示。
表3 固定效应模型的回归结果
固定效应模型旨在剔除不随时间变化的变量对政府绩效的影响,进一步明确成本收益关联度与政府绩效之间的关系,以验证成本收益模型的稳健性。表3中的回归方程结果表明,核心自变量(rd)的系数为正数,而控制变量(po、pbe)的系数为负数。这意味着提升绩效管理的成本收益关联度才是改善政府绩效管理有效性的关键手段,一味扩大城市规模和政府规模,全方位加大行政资源投入未必能够提升政府绩效管理本身的有效性。
成本收益模型的测算与验证回应了两个问题。一是政府绩效管理是否有效。模型的计算结果—成本收益关联度高达77%,表明八年的广西绩效管理具备较高的效率。因为中国各省市的绩效管理制度较为相似,所以该结果可在一定程度上佐证中国政府绩效管理的有效性;二是如何在一定投入约束下,以较低的成本提升政府绩效管理的成本收益率。在模型建构过程中比较数列的灰色关联度存在显著差异,说明了绩效管理在各方面的投入将带来差异显著的绩效管理收益。这种差异表现为,从民生考核投入、重点工作投入、经费投入到人力投入和组织投入的收益递减趋势。这意味着,在进行绩效管理的行政资源分配时,可加大绩效管理工作中的民生考核投入、重点工作投入和经费投入,适度减少人力投入和组织投入,以提升绩效管理工作的成本收益率。更重要的是,在数字技术日趋成熟的今天,减少人力投入和组织投入的同时不降低绩效管理本身的效率是可能实现的。
相较于系统分析模型和制度绩效模型,成本收益模型在提升绩效管理效率方面更具优势。成本收益模型一方面能够科学、准确地呈现各市的绩效管理效率差异,为诊断并提升各市的绩效管理效率提供决策依据;另一方面,规避了制度绩效模型的内生性问题,可能更有效地解释绩效管理实践。
成本收益模型的结论与广西各市的绩效管理成效有较强一致性。在民生考核投入和重点工作投入方面,灰色关联度处于中高聚类的城市,如南宁、柳州等,特别强调考核指标的“瘦身”“健体”和“提速”,通过科学合理的考核指标设计引导全市上下聚焦群众的切身利益、中心工作和重点任务。在此过程中,这些城市引导各级政府形成密切联系群众的管理机制,跟踪涉及群众利益的重大政策和民生项目的落实,抓好对群众意见诉求的回应与整改,确保发展成果真正惠及群众。这一现象与成本收益模型的评估结果一致—重视民生考核投入和重点工作投入的城市均未出现在成本收益模型的低效聚类中。在经费投入方面,处于中、高聚类的城市特别注重运用预算经费的激励,充分调动绩效工作人员的积极性,并通过给予基层预算部门一定范围的预算自主权,强化对绩效工作人员的物质激励,同时由基层政府的绩效办或评估中心根据绩效目标的完成情况,动态调配预算资源,实现资源的优化配置。这一现象再次与成本收益模型的评估结果保持一致—重视绩效管理经费投入的城市,其成本收益模型的元评估结果都处于中、高聚类之中。
已有研究从多元协同驱动的视角分析了广西绩效管理的构成要素及其内在关系[26],本文则进一步构建成本收益模型对这种协同驱动机制的投资回报率进行了估算。成本收益模型为市级政府的绩效管理元评估提供一套较为科学的评估方法和指标体系,从而形成新的元评估视角、思路和结果,为优化行政资源配置提供经验证据,具有一定学术贡献和实践意义。
本文的学术贡献主要在于研究结论从成本收益的视角回应了重要问题—政府绩效管理是否有效,并基于成本收益模型的数值求解得出不同于已有研究的结论。已有研究指出,绩效管理可能提供虚假的安全感和成就感,因此现代化进程中的绩效管理必然带有致命弱点[32]。更有研究指出,中国关于公共财政和行政成本投入的评估不足,存在绩效管理的财政资源使用效率低下等问题[33]。国外研究也把这种导致绩效管理低效的弄虚作假行为界定为作弊、操控、包装、策略行为、创造性分类、创造性解释等[34]。本研究基于广西十年的绩效管理实践和八年的面板数据,验证了中国政府绩效管理的有效性。以实证结果回应了现有研究中的质疑,这与已有研究结论存在显著差异,可为进一步探究中国政府绩效管的有效性提供了一套新的评估思路、评估方法和指标体系。
在世界范围内的绩效管理实践中,通过持续修正、完善成本收益模型可能为跨国的元评估研究提供新路径。因为不同国家的地方政府绩效管理存在差异,不具有可比性,很难从中找到最佳绩效管理模式,所以系统分析模型的适用性不强[35]。而成本收益模型在应对这一难题时更具优势。它能够聚焦于成本收益率展开元评估,较为高效、精确、稳健地评估各国地方政府的绩效管理效率。
中国的政府绩效管理实践范围广、内容多,运用系统分析模型估算全国的政府绩效管理效率是一项成本高而收益不高的评估活动,因此,至今为止并未得到足够重视。本研究提出的成本收益模型成本更低,效率更高,且具有一定的准确性、稳健性,可能为地方政府开展大规模的专业化元评估实践提供新思路。更重要的是,这一思路与数字时代的政府绩效管理匹配度更高,有希望在准确获取并深度挖掘绩效数据的基础上大范围推广。这对于行政资源和财政资源较为匮乏数据资源充分的地方政府意义重大,有益于打造专业化、规范化的政府绩效管理,以较高的投资回报率转变政府职能。需要注意的是,虽然上述研究结论表明,成本收益模型在广西自治区内具有较高的外部效度(external validity),但是在全国范围内是否仍然具备较高的外部效度,还留待于实证检验。