●陈 莹 杨幸一
随着我国财政管理改革的持续深入,绩效财政的概念逐渐深入人心。财政支出要讲绩效,在此观念的推动下,我国进行了持续多年的绩效预算改革。 2003 年,中共中央制定了《关于完善社会主义市场经济体制若干问题的决定》,提出要“建立预算绩效评价体系”。 同年,财政部下属的部分司局积极响应中央的号召, 开始制定各行业绩效考评管理办法。与此同时,部分中央部门和地方政府陆续进行绩效预算实践, 选取试点开展预算支出绩效考评工作。 2009 年,财政部印发了《关于推进财政科学化精细化管理的指导意见》,开始强调提高财政管理的科学化精细化水平,在支出合法性、合规性的基础上,要求加强预算绩效评价,重视提高资金使用效益。 2013 年,党的十八届三中全会提出了深化财税体制改革的目标任务,将“提高效率”作为建立现代财政制度的重要内容。 2014 年6 月, 中共中央全面深化改革领导小组审议了《深化财税体制改革总体方案》。 2015 年12 月召开的全国财政工作会议指出,下一步财政工作中,要加快财税体制改革,完善全面规范、公开透明的现代预算制度, 加大预算统筹力度,实行中期财政规划管理,全面推进预算绩效管理, 继续积极盘活存量资金。 2018 年,中共中央、国务院《印发关于全面实施预算绩效管理的意见》,标志着我国预算绩效管理工作从试点探索阶段向全面实施阶段迈进。2023 年12 月11 日召开的中央经济工作会议明确了2024 财政工作重点:积极财政政策要适度加力、提质增效;要谋划新一轮财税体制改革。国家“十四五”规划纲要提出,加快建立现代财政制度。即深化预算管理制度改革,强化对预算编制的宏观指导和审查监督。加强财政资源统筹,推进财政支出标准化,强化预算约束和绩效管理。由此可见, 进一步研究深化绩效预算制度是适应当前我国财政改革发展要求的。
美国作为绩效预算概念的发源地,其绩效预算改革经过了长达60 余年的探索和发展, 理论成果和发展经验是值得我国借鉴的。 1993 年,美国国会通过了获得广泛支持的《政府绩效与结果法案》(Government Performance and Results Act,GPRA), 为其随后的绩效评估工作开展提供了法律基础。 GPRA 要求联邦内阁部门提供战略规划、绩效计划和绩效报告,并建议国会、政府问责署(Government Accountability Office,GAO) 和行政管理和预算局 (Office of Management and Budget,OMB)将对各机构报告的审议与预算的批准结合起来。 然而自法案通过以来,这种结果导向型的管理逻辑被广为诟病,因为衡量政府机构最终的目标是模棱两可的。 为了解决这个问题, 布什政府于2002 年引入了项目评级工具(Program Assessment Rating Tool, 以下简称“PART”), 希望通过一套标准化的调查问卷,衡量项目的具体实施效果,为决策程序提供可靠证据。 PART 的设计应用强化了GPRA 的贯彻落实。 PART 实际上是一种绩效信息的生产工具,因此研究PART 的具体实施方法对我国绩效预算制度的进一步发展是有一定借鉴意义的。
我国学者对于美国绩效预算的研究内容十分丰富, 其中也有不少学者关注到了PART。 多数学者在研究中都会对PART 的操作步骤进行介绍,同时对于实施这一工具的优势进行分析。何文盛、曹洁、张志栋(2009)非常详细地介绍了PART 实施的整个程序,评价了PART 具体的实施效果, 认为PART 在促进联邦机构的绩效评价信息与预算结合方面效果显著,同时指出我国学者和政府管理者应当重点研究或设计类似于PART 的评价工具,用以客观评价政府公共项目绩效。晁毓欣(2010)详细介绍了这一工具的诞生、结构及运行,并对其典型特征进行了深入分析,认为该工具具有深厚的法律基础和长期的效率传统,整个评估程序不仅规范有序而且较为透明,其结果也具有较强的客观性,不过其与预算的关系较为松散。曹慧娟(2014)介绍了运用项目评级工具的具体步骤,认为在我国借鉴PART 能推动预算体制改革,同时也指出PART 虽能提供海量的绩效信息,但信息的使用也较有限的缺点。 徐明(2015)总结了PART 在实施中的优点,一是PART 明确了政府进行绩效评估的核心目标,即将评估结果作为制定政府部门预算的重要依据;二是PART 的实施灵活性,即针对不同类型的项目,选择适合的评价内容,客观地测量项目绩效水平;三是PART 提升了政府公共项目数据信息的质量;四是PART 报告指导了财政预算资金的合理使用。
与此同时, 我国学者也在研究中提到了PART 在实施中会遇到的挑战。 李慧、 张志超(2007) 在研究中提出了PART 技术存在不确定性,因为2002 至2004 年间OMB 利用PART工具进行绩效评估时,近三分之一的项目评估结果不明。 任晓辉(2012)对PART 的使用提出四点质疑:一是PART 对有可测量的结果的项目有天然偏好;二是某些绩效测量与GPRA 相冲突;三是PART 侧重于技术而非政治活动的改革; 四是其不适应政府绩效的横向交叉管理。 范柏乃、张维维、贺建军(2013)提出将PART 运用在我国政府第二预算的管理中,但同时也指出,PART 是一项理性工具,其分值并不能成为预算决策的关键因素,只能作为一项重要依据。
除此之外,我国学者宋健敏、丁元(2010)则完全从实证分析的角度对PART 在其使用的7 年中对每个政府预算决策的作用进行了分析,发现PART 的使用虽然确实能够影响布什总统的预算请求,但是作用比较微弱,也即清晰的绩效数据并不能完全体现在经费的分配上,因为政府预算决策并不是一个纯理性的决策,更多的是基于政治上的博弈,不过,作者也提出这一结论并没有降低绩效信息对于绩效预算过程的重要性,并且PART 工具对政府绩效预算仍起到了一定的积极影响: 一方面,PART 工具提高绩效信息的产量和质量, 这有助于决策部门做出以结果为导向的预算决策;另一方面,运用类似PART 的绩效管理工具有助于政府提高战略规划、绩效评价和成本管理的能力。
关于PART 的应用国内的研究较少,上述学者中仅有徐明(2015)在研究中以美国“公共住房”项目为例介绍了PART 的应用。 但在我国具体实践中,也有一些学者探讨了我国地方政府使用PART 的具体范例。 苟燕楠(2009)介绍了某区运用PART 对某综合性项目实施评价的具体过程与结果,并根据绩效评价的结果为该项目提出了改进建议。喻楠(2012)详细介绍了上海市张江专项资金的绩效评价,并分析了PART 在该项目中的应用情况,认为张江专项绩效评价属于财政支出绩效后评价,PART在其中很好地担任了管理工具与责任工具的角色。汪洁(2012)以上海市闵行区的绩效预算运用PART 的实践经验为例, 介绍了运用PART 进行项目分类、基准设定、绩效评价、项目改进的流程,分析了阻碍绩效信息获取和绩效信息运用的因素。
国外学者对于PART 的研究非常深入,已经从多角度对其具体的实施效果进行评价和经验总结。 Mullen(2006)对截至当时PART 的实施情况进行了总结。 就成就而言, 一是PART 帮助OMB 在多类型项目问题和证据中建立和规范绩效信息的使用框架; 二是帮助OMB 使用到了更加透明易懂的绩效信息,其中还包括根据PART 结果所提出的针对机构管理实务和项目设计的明确建议;三是激励政府机构进行绩效与预算的结合和提高绩效信息的质量。 就挑战而言,一是在面对多类型的评估项目时PART 的实现需要专业判断和解析; 二是对于国会和OMB 而言要如何界定通过审核的项目标准。 Heinrich(2009)检验了政府机构提供给OMB 进行绩效评价的证据质量与PART 的评级结果及最终预算分配之间的关系,发现在一些方面提供给PART 审核的证据质量与最终分数有显著的正相关关系,但是证据质量和PART 评估分数对于项目的预算分配并没有可识别的重要性。 Gueorguieva(2009) 等人以七个具体项目在PART 和GPRA 两套评价体系中的结果为例, 分析了PART 与GPRA 出现不一致的原因,并提出下一步改进的意见。 Moynihan 和Lavertu(2012)分析了PART 与GPRA 的具体实施效果,探讨了结果导向型预算改革与绩效信息使用之间的关系, 支持了政策制定者对于PART 与GPRA 没有达到预期效果的结论,认为这类政府绩效改革在促进政府机构遵守规则、绩效信息生产及其质量提高方面非常有效果,但是在促进绩效信息使用方面的作用微弱。Stalebrink和Frisco(2015)具体分析了国会在PART 工具实施的七年期间对于其态度的变化, 发现PART 刚投入使用时,国会的态度比较消极,但是随着时间的流逝,立法者更加积极主动地参与到有关PART 的讨论中,对于PART 的消极意见也相对减少,同时,支持PART 的人的政党背景也没有刚开始那样明显。
上世纪90 年代起, 美国政府就一直试图通过衡量其项目开展情况并将绩效信息与预算资源分配过程相结合,来改进政府绩效和问责情况。美国政府在1993 年通过了《政府绩效和结果法案》(GPRA),希望政府机构不再将注意力放在投入和遵守规章制度上, 而是关注结果。GPRA 要求政府机构采用任务说明书,战略性计划和对项目产出和结果的衡量措施, 并将任务说明书和战略性计划等文件公布在机构官网上。 但是,在GPRA 通过后的十年内,政府问责署(GAO)发现GPRA 虽然持续地产生了绩效信息, 但是政策制定者和项目领导并没有产生使用这些绩效信息的强大的需求。
2001 年, 布什政府承诺要大力提升政府绩效管理, 并于同年颁布 《总统管理议程》(President's Management Agenda,PMA), 旨在促进美国联邦政府进行“以公民为中心、以市场为基础和以结果为导向”的改革。 PMA 要求周期性的部门绩效复核,较强的管理灵活性和更大的政府官员责任。 复核主要关注五个领域:人力资本、财务责任、竞争性采购、电子政务和绩效信息与预算的整合。 PMA 利用平衡记分卡的形式对每个机构进行评价,给出“红灯”“黄灯”和“绿灯”的结果。因此,通过绩效预算的进一步扩大使用,以促进结果导向型政府的形成,成为了布什政府PMA 的重要环节。布什领导美国行政管理和预算局(OMB)协助每个政府机构重制预算,从而将绩效信息囊括其中。 2003 年,布什政府通过采用一个分项目的绩效评价程序来进一步推进其绩效预算进程。OMB 在各机构和外部专家的协助下起草了评价框架体系, 命名为项目评级工具(Program Assessment Rating Tool,PART),至此,PART 成为了布什政府绩效提升工作和PMA 中的关键组成部分。
PART 实际上是一套问卷,OMB 为其设计了共四大类,合计25 到30 道左右的问题来评价机构项目的绩效情况。 每一类别的问题都根据其重要性设立了权重值。
1.项目目的和设计(20%)。 评价项目的目的和设计是否简洁且可理解。 问题通常为:项目是否解决了现存的具体问题或需求? 该项目是否唯一,也即是否与其他联邦、州政府或私人组织的工作相重合?
2.战略性规划(10%)。 评价项目机构是否设立了有效的年度和长期项目目标。 问题通常为:项目是否设立了专注结果和项目本身目的的长期绩效的衡量措施? 项目是否设立了有一定挑战性的目标和长期绩效测量的时间规划?
3.项目管理(20%)。 评价项目机构对该项目的管理,包括财务监督和项目改进措施。 问题通常为: 项目是否有强效的财务管理措施?项目是否与其他相关项目有有效的协作?
4.项目结果(50%)。 对应第二部分“战略性规划”的内容,对项目结果进行评价。 问题通常为:项目是否阐明已经做了充分的工作已完成其长期绩效目标? 每年项目是否达到其效率上或成本节约上的目标?
PART 的实施以每年发布待评估项目清单作为开端。 接下来, 项目官员将会针对PART问卷上的问题给出回答,并附上解释和相关佐证。 接下来,项目的审查员将会仔细审阅这些材料,并依据项目所提供的佐证材料,修改之前所呈交上来的PART 问卷的答案。 多数情况下,项目官员在自评时会比审查员在复核时给自己的项目更多的肯定回答。 若项目官员对审查员的评价有异议, 须按照OMB 的管理层级逐级上诉。 每年都有一些上诉的项目,其中有少数项目能够上诉成功。
项目分数按照问卷中回答“是”的比例来给出。 最后根据总分高低,来对其绩效情况做出最终的评级。 如表1 所示:
表1 PART 总分评级转换表
如果一个项目被OMB 认为测量不充分,则其评级为“结果未知”。
分数和评级不仅仅是为了展示给大众看,PART 的一个重要目标是将预算决策同结果与整体项目质量的评价相结合。 虽然OMB 也很清楚这些评价指标不是影响预算决策的唯一因素。 一个高评级的项目不一定意味着其预算能得到提高,而一个低评级的项目反而会获得预算增加,因为较差的绩效可能是由于较低的拨款造成的。
PART 的一个重要特点是比起产出衡量更多地强调结果衡量。GPRA 同样强调结果衡量,但是PART 却将结果衡量提高到了一个新的高度。 《PART 指南》中曾提到:“绩效衡量应该反映预期结果。 结果衡量的信息量更大,因为只有项目额度最终结果才是能惠及大众的。 各项目需要将注意力集中在项目的末端结果上,应尝试将现存的集中在产出的测量转变为结果测量。 ”OMB 的审查员们认为PART 确实在任何可能的情况下都坚持找到真正的结果测量方法,并促进项目的管理者去寻找创新性的方法来衡量其结果。 不过其中有一类项目例外——研发项目,因为研发项目的最终结果难以提前预测出来,OMB 也就认识到针对研发项目采用结果衡量是不合适的做法。
1.克服绩效衡量的难题。对于OMB 及需要利用PART 工具进行绩效评价的单位而言,一直以来如何对项目绩效结果进行契合的衡量都是一个难题。OMB 对绩效评价更倾向于结果衡量而不是产出衡量。 仅从实施难度上看,相比结果衡量,尽管产出衡量显然更容易,但项目单位若想得到好的衡量结果,则要求它们更努力地解决实际问题,并确实能对现实世界产生影响。 因此,进行结果衡量的意义显然更为深远。 然而,若不对产出进行衡量,绩效预算又很难进行下去。
PART 工具旨在通过设定一个统一的标准,也即通过一个统一的末端结果测量,来衡量所有的项目,然而,联邦政府内支出项目种类繁杂,目的也不同,衡量标准统一后,要想最终得到不同项目的测量结果,就只能在最终的测量手段上进行灵活处理。由于识别每个项目的末端结果并不容易,因此绩效评价的成功实施很大程度上依赖于项目管理者能否识别出衡量项目结果的合适手段, 而这也成为了PART 一个很大的缺点。 且由于OMB 认可的衡量标准较高,导致每年都有很多项目被评定为“结果未知”,也即无法给出准确的绩效评价结果。
但是,随着PART 工具运用时间的增加,可以看到的是,绩效评价的质量得到了提升。 在2002 年时,参评的项目中有30%的项目被评为“中等有效”或“有效”。 而在2008 年时,这一数字变为了51%。此外,更能说明问题的是,被评为“结果未知”的项目比例在这七年间下降了三分之二,从2002 年的50%降低到了17%。①这说明随着管理者对PART 熟悉程度的加深,他们明白了如何利用PART 来对项目成果进行处理, 使得项目结果被更好地表达, 最终证明,PART 确实能帮助生产有效的绩效信息。
(1)多方联动提高绩效信息质量。 对项目进行PART 评价的OMB 审查官在促进项目管理者采取更好的绩效评价方法上确实比较成功。 自GPRA 通过,联邦的各部门及其下属项目一直都被要求进行绩效衡量,不过一直以来绩效评价并没有得到有效执行, 直至PART 出现。 PART 通过在评价结果与预算决策之间建立联系,不断强调末端结果衡量。 此外,对于被评为“结果未知”的项目存在一定风险,这也激励了项目官员改进自身项目结果的衡量方法,使之能被OMB 所接受。
“结果未知”的项目占比较高的部门,在总统管理议程(PMA) 的计分卡中的绩效部分不能得到“绿灯”的评价。 此外,OMB 的审查员会正式通知这些部门降低“结果未知”的项目数量,否则OMB 会考虑降低该部门的行政预算。GAO 的官员认为由于 “结果未知” 的评价在PMA 计分卡上的负面影响, 一些部门可能更倾向于得到“无效率”的评价。
(2)对拥有“块状结果”的项目绩效进行衡量。 所谓块状结果,是指该结果本身具有一些或有属性,使得其难以被追踪并进行衡量。 如美国能源部的保卫资产运输项目(Secure Transportation Asset Program),其目标是“安全且有把握地运送特殊核材料、 核武器及其部件”。 针对该项目的结果可以被识别为“核弹或核燃料的偷窃数”。 虽然看起来这似乎是一个优秀的识别结果,事实上,这个结果具有误导性。 因为在美国境内从未发生过核材料的偷窃事件,因此在某些年度就算没有发生相关的偷窃, 运输过程中的安保也极有可能是不合格的。
对这个项目的绩效评价,则应该从产出衡量入手,更能反映该项目对“安全”的定义。 这些产出衡量包括:年度每联邦探员的平均加班时间、由于运送过程的优化所带来的任务耗时的缩减百分比、 安全运输机的累计使用数量、联邦探员的累积使用数量等。OMB 认可了这些产出衡量,该项目被评为“中等有效”。
(3) 对 “管制项目”(enforcement programmes)的绩效进行衡量。 管制项目在结果衡量上的问题往往是因为管制执行本身的效率与执行者试图去阻止的事件之间的动态关系。如美国国务院的边境安全项目(Border Security Program), 其目标是维护边界稳定并阻止恐怖分子进入美国。因此其相应的结果衡量指标为“阻止未被许可的人员入境的次数”。然而这一项衡量指标的问题在于, 如果该项目运行有效,国境安全得到了极好的保障,那么未被许可的人员就不会选择入境, 这一指标就会下降。而指标下降的另一个可能性是项目运行无效率,未能有效阻止非法人员入境。因此,这一结果测量指标并不能真实反映项目的绩效情况。
为了解决这一问题,该项目重新修改了项目目的,为“通过改进领事事务规程,以保证美国公民在境内外的安全以及国境的安全”。 因为其目的中涉及了“改进”这一概念,因此其绩效衡量指标变为一系列的产出衡量指标, 如:生物识别签证项目的进展情况、 领事管理评估小组 (Consular Management Assessment Team)的评估结果数量、收到公民护照申请与实际签发护照的间隔天数、 一定时间内签发护照数占护照申请数的百分比等。 OMB 认可了以上衡量指标, 并给予此项目一个“有效”的评级。
(4)对数据搜集类组织的绩效进行衡量。数据收集类组织也很难进行结果衡量, 因为此类组织的预期目标很难界定。 如美国劳动统计局(Bureau of Labor Statistics,BLS),其预期目标被界定为“为商业决策提供更好的依据”,但这一目标很难进行结果衡量。 因此,产出衡量显然更适合此类组织的绩效衡量工作。
起初,BLS 决定衡量其每年度都会开展的24 项调查的完成情况, 不过这与结果衡量相去甚远, 因此,BLS 决定将消费者满意程度也纳入衡量指标中。 这些指标包括:按时发布的报告占全部报告的百分比;消费者对BLS 的数据和其他服务的满意程度;在没有提高经费的前提下,收集和发布具体雇员福利数据的时间间隔的降低情况。OMB 认可了以上衡量指标,并给予此项目一个“有效”的评级。
美国地质调查局 (US Geological Survey,USGS)通过提供各类地球科学的数据,以帮助减少各类地质灾害所带来的生命和财产损失。因此此机构的末端结果是“更安全的国家”,但是这一结果很难被衡量。因此,USGS 将其绩效评价的重点放在数据的易用性和消费者满意度上,一定程度上也衡量了这个看似难以衡量的结果。 这些指标包括:观测到的潜在活火山数量, 城市区域地震灾害地图的完成情况,基于USGS 所提供的数据采用改进后建筑规范、用地计划、应急响应计划或其他减灾措施的国家数量。 最终OMB 给予此项目“中等有效”的评级。
(5)对是另一项目的产出的项目结果进行衡量。 有一些项目的结果衡量并不能以自身的产出衡量来代替。 比如在美国国务院海外建设局 (Overseas Buildings Operations Bureau,OBO)中,有一个资产保护项目,此项目将重建超过一百间美国驻外大使馆。 由于众多旧的美国大使馆都坐落在没有足够防御空间的城市区域,因此这一项目将向城市中心以外的地区迁移并重建大使馆。 此项目的结果是“更有保障的安全”,应该利用“各使馆受到攻击的次数”“人员伤亡情况”“设施受损情况”等指标来进行衡量。 不过此项目却选择了OBO 角度的产出衡量指标来代替项目本身的结果衡量指标,包括:在规定预算范围内完成的资产保护计划占OBO 全部资产保护计划的百分比、在规定时间内完成的资产保护计划占OBO 全部资产保护计划的百分比、被批准的新资产保护计划的百分比。
OBO 的产出衡量之所以能代替此项目的结果衡量的原因是,这些产出衡量指标能证明每一个新建的大使馆都是能满足防护需求的。因此,这些产出衡量本身就是此项目的结果导向型衡量指标。 OMB 认可了这个衡量指标,并对此美国大使馆资产保护项目给予“有效”的评级。
(6)衡量有内固性限制的项目。 几乎所有的公共项目都会受到其授权法令的限制。 有些项目必须遵守一系列的规程,而这些规程的目的就是使项目执行者不能只关注末端结果。 这些限制会成为严重的设计缺陷,因为这些限制会阻止项目完成或阻止项目有效率地完成。 然而这些缺陷的出现对于国会议员来说,不一定会引起他们的改正,因为这些有缺陷的项目可能恰好具备某些政治特性,能满足议员们的政治需要。 也就是说,对于国会的议员来说,或许并不需要每个项目都能为其最终的结果负责。然而OMB 却要求每个项目都能产生结果,就算有上述设计缺陷也不能免责。 从这个方面来说,PART 的实施反而能促进低评分的项目暴露其固有设计缺陷,并刺激国会采取一些纠正措施。
比如, 联邦政府的柏金斯贷款项目(Perkins Loan Program)就是一个典型的由于设计缺陷而获得低PART 评级的项目之一。 该项目由美国教育部管理,旨在向有需求的大学生提供贷款。 不过这个项目的缺陷在于,资金并不直接发放给学生,而是发给学校,再以学校为媒介发给学生。 所以,资助计划就会将较多的资金发给那些长期参与此项目的学校,那些学院和大学对这样的安排显然感到满意,不过这却导致此项目没有将资金发放给最需要的学生。 对此,该项目的评分为“无效”,且PART报告提出了非常严厉的批评:该项目的机构分配计划使得部分长期参与学校资助项目②的高等教育机构获利很大,所以这些学校往往有更多的申请者和更多的招生数。 因此,这些长期存在于资助计划中的学校往往没有很高比例的贫困学生,因此分配计划反而限制了项目的资源配置能力。
显然,OMB 与美国教育部都希望能削减掉柏金斯贷款项目,并将资源分配给其他受众更明确的贷款项目。 然而国会却依然支持并继续拨款给此项目。 布什政府曾请求国会对此项目作出改变,但国会均拒绝了请求。
联邦医疗保险(Medicare)是另一项由于设计缺陷而获得低PART 评级的项目。 联邦医疗保险是否存在缺陷取决于看问题的角度。 若其目标是为受益人提供高质量的医疗服务,那就是有明显缺陷的;若其目标为公平及有效地执行国会制定的法律,则没有缺陷。
但在联邦医疗保险的PART 报告中,OMB认为其仍然具有重大的设计缺陷,比如其无法像私人健康保险那样, 使得受益人免于遭受高额的现金支出。 联邦医疗保险设计缺陷的起源是,设计初衷是“社会保险”一样的应得权益计划。 在“社保”的概念中,受益人需要通过缴款才能获得相应的权益,权利与义务相对等,因此,也就不存在对于受益人的经济情况调查。 由于这一特征,联邦医疗保险为许多不需要购买保险的受益人提供健康保险。 并且由于缺乏经济情况调查, 联邦医疗保险提供非常有限的权益, 如其保险范围无法覆盖重大疾病, 这反过来限制了其达到预期结果的能力。
实际上,关于联邦医疗保险在绩效评价中所选取的指标也同样反映其内在的固有限制问题。 它选取的指标为:接受流行性感冒疫苗接种和肺炎疫苗接种的受益人占全部收益人的比例、接受两年期乳房X 光检查的女性受益者占所有女性受益者的比例、接受糖尿病眼部检查的糖尿病受益者占所有糖尿病受益者的比例。 这些指标都只片面地反映了医疗保险的开展情况,并不能从结果上,也即从全体受益人健康的角度,反映其绩效情况。 不过OMB 仍然接受了以上评价,并予以联邦医疗保险“中等有效”的评级。
美国环保局 (Environmental Protection Agency,EPA)的一些项目也同样存在设计缺陷。在理想的情况下,环保项目的末端结果为“更干净的空气或水域”,显然,让EPA 直接对末端结果负责能让其工作更有效率,比如直接测量EPA 负责治理的水域的水质提高情况。 然而,EPA 的官员却指出,大量的EPA 项目的授权法规限制了许多权力,使得他们难以完成自己的目标。 比如,EPA 在当地城市区域划分和用地决策等问题上并没有干涉的权力,尽管赋予这些权力能使得EPA 在水污染治理的问题上有所作为,不过这些是国会故意设立,且不准备改变的限制。
不过,EPA 自身在提高绩效信息质量方面也作出了努力。 在PART 工具使用的第一年,EPA 共有10 个项目参与了评价,但9 个项目被评为“结果未知”,这说明OMB 认为EPA 所选取的绩效指标并不是结果导向型指标。不过,在最后一年使用PART 工具时,EPA 共有46 个项目参评,其中仅有6 个项目被评为“结果未知”。
尽管末端结果衡量非常有效, 不过这却不是能适用于所有情况的。在以上的许多案例中,可以发现OMB 在实际评价各项目的绩效,处理其选取的绩效评价指标时,较为灵活,并不是需要百分之百的结果导向型指标来得出最终的结论。 但这部分灵活性是以牺牲“结果衡量”可见的优点而换来的。不过,使用者也需要注意,“灵活性”实际上是PART 工具的一个缺点,因为这违背了当初启用PART 工具进行绩效评价的初衷。
2.处理项目结果与项目绩效间的关系——“归因”问题。 在使用结果衡量作为绩效衡量的依据时, 由于绩效信息使用者有时无法确定项目进行前后结果的改变是否完全因为项目在实施中所采取的行动, 此时将结果衡量作为一种问责工具就不是特别恰当。 因为结果与项目间的联系没有产出与项目间那样紧密, 这一结果也有可能是项目之外的其他因素所造成的。 因此绩效信息使用者不能总是确定某一项衡量指标的变动,无论好坏,是由于项目本身还是外部因素所引起的。 以上就是绩效评价和绩效预算最为核心的“归因问题”。简单来说,归因问题就是要确定一项结果指标的变动有多大程度是由于项目本身所引起的。因此,解释项目结果有多大程度是项目本身所引起的就成为了实施绩效预算的一个重要挑战。 本部分的案例分析将选取一个完全使用结果衡量来作为其绩效衡量指标的项目, 因为这能突出地显示出结果衡量的优缺点。
美国国务院在国际关系领域的项目通常都有难以影响和衡量的目标。尽管如此,它依然尽力去评价项目结果。 美国国务院下属欧亚事务局(Bureau of European and Eurasian Affairs)的东欧民主支持项目 (Support for Eastern European Democracy,SEED)每年都会向前苏联加盟国和东欧集团发放上百笔款项, 旨在加强其经济的市场导向性和政治的民主性。 不过对这一项目进行绩效衡量是很困难的。 因为上百笔拨款中的每一笔都与其他拨款在性质种类上完全不同,也就不能用相同的基准来衡量其绩效。该局首次实施PART 评价时,得到了很低的分数。随后仔细研究了评价指标, 重新采用了直接衡量其末端结果的指标。
衡量“民主化”程度,该局采用了独立的第三方机构自由之家(Freedom House)所提供的每一国家的“自由化分数”。衡量“市场化”程度,他们也采用了类似的第三方衡量指标, 即各国经济实际的市场导向性。 采用独立的第三方数据作为衡量指标存在一定的风险, 因为上述变量都是项目机构不能完全控制的。 不过以上指标确实直接衡量了项目最终结果。
与此同时,为了能全面地衡量该项目,欧亚事务局还在其PART 报告中加上了部分产出衡量指标,如组织结构、有效协作和效率等指标。总体上看,这一系列的衡量指标,基本囊括了该局能完全控制的指标到只能概略控制的指标。
但是,这样的衡量存在“归因问题”,也即无法确定某个国家变得更加民主和市场化有多大程度是由于收到了该项目的拨款。 不过认可了以上衡量指标的OMB 审查员也完全理解其中存在的“归因问题”。 因为该局虽然可能获得不是由于自身提高而带来的绩效评价结果的提高,却也可能为不是由于自身工作的失误,而是其他外部因素带来的民主化或市场化的下降负责任。 然而,正因为“归因问题”的存在,结果导向型的绩效衡量反而成为了一个正确的激励措施。 为了尽量减少其他不确定因素对于绩效结果的影响, 欧亚事务局的官员们会尽力在其能控制的范围内做到极致, 也即确保每一笔拨款都是能确实达到预期效果, 并撤销并没有任何实际意义的拨款计划。
3.小结。 结果衡量偏好对现实产生了影响的项目,而不是偏好一切合规的项目,这一点就是其优于产出衡量, 而被OMB 所推崇的原因。在实践中, 项目官员需要尽可能地为项目找寻最合适的结果导向型衡量指标, 并且要在PART 问卷中说服OMB 审查员,现有的衡量指标是最适合评价该项目结果的指标。
不过,在某些案例中,使用产出衡量,也即直接以“中间结果”作为绩效评价指标,会优于使用结果衡量,也即“末端结果”评价。这类项目通常有两点特征: 一是其中间结果与实际目标之间有非常紧密的联系; 二是其中间结果比末端结果更能直接被项目所控制。不过,这并非要求这类项目抛弃结果衡量, 结果衡量仍然非常重要, 因为它能显示出一个项目是否在切实地解决问题。
此外, 绩效评价机构在处理项目绩效和项目结果间的关系时,要注意三点:一是要找到结果的多种诱发原因。 项目本身可能只是众多诱发因素中的一个,尽管比较困难,评价机构在最终问责时要尽可能地考虑到多方面的可能性。二是注意项目本身与实际结果间的时滞问题,如研发类项目, 达到预期目的的时间可能会相当长。三是要注意存在内在固有限制的项目,也即要使得绩效信息能真正对预算决策之外的政治决策起到一定的作用。
PART 工具在使用的这7 年内, 在推动美国政府利用绩效信息进行决策, 特别是生产绩效信息方面,收获了显著的成效。其运行有效性一直是美国学术界持续讨论的焦点。 然而不可否认的是,PART 工具也确实存在一些问题,导致奥巴马政府上台后并没有继续沿用这一工具,不过,PART 工具也为此后美国的绩效预算进程提供了一定的启发。
1.绩效衡量方面仍然有可提升的空间。 第一,仅就绩效衡量技术来说,虽然PART 在绩效信息生产方面效果卓著, 但也存在一定的提升空间。 首先,PART 对项目间的差异性考虑不够, 它假设所有项目都有可供衡量的产出和结果, 因此那些结果更易量化的项目具有天然优势, 这一点有损PART 的公允性。 其次, 解读PART 绩效评价结果的相关能力也有待提高,包括如何归因、如何问责等等。 最后,PART 在衡量方面与GPRA 存在难以调和的问题。GPRA 要求一个更全面的、 站在整个机构角度的绩效结果。 但PART 仅仅着眼于各个项目本身,双方存在一定的脱节问题。
第二, 去中心化的绩效评价模式给予机构本身更多的自主权, 不过也损害了绩效信息的可信度。而在被审查的项目机构方面,政府问责署(GAO)曾收到一些项目机构对PART 评价结果产生质疑的报告,报告中指出由于OMB 审查员的数量和分布的限制, 使得PART 的评价结果并不能准确反映该项目的绩效情况。
第三,PART 的双向工作负担较重。 对于OMB 的审查员来说,存在没有时间来进行足够的PART 评价, 和无法合理协调处理PART 工作与传统预算审查工作时间的问题。 对于项目机构官员来说, 有不少官员对于PART 实际回报持怀疑态度, 也即从PART 得到的回报结果不一定值得其在PART 问卷上所付出的努力。
2.在实际预算决策中起到的作用有限。 首先,PART 作为布什政府极力推崇使用的绩效衡量工具, 实际上并没有得到美国国会的广泛支持。OMB 要求各机构在提交给国会的预算文件中,将PART 评价结果添加到预算理由中,这是国会的成员主要接触PART 评价结果的途径。 然而,国会中仍然存在否定PART 的议员。实际上在所有国会针对PART 讨论的会议记录中, 也可以看到国会并不是完全将PART 视为一个绩效评价工具并使用结果。 众议院的议员讨论PART 实际使用效果的次数是讨论应用PART 结果的次数的两倍。 参议院的议员在这个问题上则是五五开。③也即,相比直接利用其结果, 国会议员更热衷于讨论PART 是否运行有效。 此外,尽管OMB 的官员多次强调PART并不存在党派偏见的问题, 国会却不认同这种主张, 并且以布什政府会对部分出于政治原因而不支持的项目的PART 结果弄虚作假, 而拒绝使用PART 评价结果。
其次, 国会成员仍然会根据其自身对于被评估项目的了解,而不是PART 结果,来作出预算决策。 对于那些不支持PART 工具的国会议员来说, 他们相信PART 评价与他们自身对于特定项目的知识背景是相冲突的, 并以此质疑PART 的运行有效性。
也就是说,PART 作为一个评级工具,布什政府有夸大其实际能力之嫌。 政府宣称PART所产生的绩效信息能促进项目提高, 并影响资源分配。 但设计出能同时达到这两个目标的系统是相当困难的。 尤其在PART 系统是一个被行政机构所推崇, 但并不受国会重视甚至是敌视的系统的背景下, 项目管理者很难完全对PART 负责。 而国会不支持PART 的理由,是因为若其依赖PART 评分,并听从OMB 对预算分配决议的建议, 将有可能削弱国会在预算分配上的主动权。 实际上,PART 所生产的预算信息在预算决策中能起到的作用有限。 有时尽管PART 指出了某些项目的低效率运行情况,国会也不会听从OMB 的建议, 因为预算决策并不是完全基于绩效信息的理性决策, 其中还存在一定的非理性的政治考虑,实际上,最终影响预算分配的关键因素是各利益集团间相互博弈的结果。
PART, 甚至是整个美国的绩效预算改革,都有可能只是一项处理公共关系的工具。 因为民众期望看到能为其工作绩效负责的官员上台,为了达到这一期望,当局设计种种绩效管理工具, 但是最终仅仅是让民众相信了官员在为绩效负责,实际上并没有任何改变。
但是出现了这样的偏差并不意味着PART,或者其他的绩效评价工具,以及政府目前为绩效预算所做的种种努力都是无用功。PART 在绩效信息生产方面所取得的成绩值得肯定。 问题的关键在于决策者如何认识并利用这些绩效信息,其次,未来还需要关注绩效信息的报告方式, 也即如何将绩效信息以立法机构认为有助于其预算决策的方式从行政机构报告给立法机构。若能解决以上问题,绩效预算的进程便能向前推进。
奥巴马政府早在其当初竞选时就提出要对PART 进行改革,因此,在其当选美国总统后,并没有继续采用PART 作为绩效衡量工具。 虽然奥巴马政府对PART 在绩效衡量方面的效果予以肯定,但也认为PART 尚存提升空间。④因此奥巴马政府在绩效预算方面作了许多努力,且其思路与包括布什在内的历届总统都有所不同。
1.高优先级绩效目标。 奥巴马政府要求各行政分支机构在7 月31 日前上交一份列有部门高优先级绩效目标的报告, 其中还需要包括目标选取的理由、影响结果的其他因素、实现此目标的方法和策略, 以及将项目绩效目标进行量化后的指标等。 另外,这些目标需要在12 到24 个月之内完成。
奥巴马政府还进一步加强了绩效信息的透明度,引入了Performance.gov 在线管理工具。该工具的出现不仅帮助机构监督其工作进展情况, 还为各机构回应自身工作与目标间的偏差提供了平台。
2.项目评价。 高优先级绩效目标是站在整个部门的角度进行的绩效管理,针对具体项目,奥巴马政府也有其独特的绩效评价模式。 不同于PART 对不同项目采用统一问卷的形式,奥巴马政府认为应针对不同项目进行更加复杂的评价,从而对该项目在社会、经济和环境方面的影响进行一个全面的认识。具体说来,这涉及三方面的具体改革: 一是鼓励联邦机构发表其已有的项目评价内容; 二是建立一个提升联邦机构项目评价能力的跨部门工作组; 三是留出一部分专门提高各部门项目评价能力的预算经费。
3.评价奥巴马政府的绩效预算措施。 奥巴马政府在绩效评价方面所采用的新举措, 褒贬不一。 就其优点来说,首先,奥巴马政府进一步加大了绩效信息的透明度, 此点值得肯定。 其次,奥巴马政府确实意识到了何为绩效预算。各部门设立高优先级的绩效目标并不是为了提高自身的预算拨款,相反,高优先级的绩效目标可以视为各部门完成特定绩效目标的承诺。 PART因其以相同标准衡量不同项目的标准化绩效评价模式而被广为诟病。 最后,相比之下,奥巴马政府因地制宜的绩效评价模式克服了PART 过于简单的缺点。 不过,此模式耗时过多,且由于机构与项目均采用了最适合自身的绩效评价,对于多种类的绩效评价结果也很难做出一致的回应。
从缺点上看, 奥巴马政府的绩效预算举措仍然没能解决部分PART 的遗留问题。
第一个问题是,绩效信息的使用,也即绩效信息是否能在预算决策中发挥作用。 前文中提到高优先级的绩效目标是奥巴马政府认识到绩效预算意义的体现,不过,高优先级的绩效目标能起到的作用, 可能仅仅是各部门运用绩效信息来优化管理, 而非绩效信息的有效使用以影响总统及国会关于预算资源的具体分配。 另外,高优先级绩效目标强调能在1 到2 年内实现的短期绩效目标, 这很可能会导致各部门忽视长期绩效目标的实现。 第二个问题是,绩效评价结果可信度, 也即评价结果是否客观有效。 相比PART,奥巴马政府的绩效评价模式更加依赖部门自身的信息输入, 因为绩效目标与衡量方式都由部门自己识别, 部门在绩效评价方面拥有了更多的自主性, 虽然该模式的潜在优势是更易得到各部门的支持, 然而由于信息的不对称性,部门自身却可能选择较易实现的绩效目标。第三个问题是,绩效衡量本身的有效性。 特别是在对结果的衡量方面, 有时候奥巴马政府要求进行的结果量化也并不一定能反映项目或部门本身成功与否。 另外,对结果都进行量化衡量也依然存在结果的偏见性, 也即对天然能量化结果的项目和机构比较有利。
2015 年, 我国2016 年财政预算的编制方式将进行改革,中央各部门的所有项目支出必须明确绩效目标,经过审核后,才能编入2016年支出预算,这标志着经过地方试点的财政资金预算绩效改革已经在中央层面全面启动。2018 年,《中共中央国务院关于全面实施预算绩效管理的意见》印发后,我国预算绩效管理改革全面实施。目前,从中央到地方已经基本建立全方位、 全过程、 全覆盖的预算绩效管理体系,在落实党中央、国务院过紧日子要求,解决财政资源配置和使用中的低效无效问题, 增强政府预算透明度和责任等方面取得了明显效果。在此背景下,结合我国国情,借鉴已经进行过多次的绩效预算改革的美国的实践经验,并为我国绩效预算发展出谋划策显然具有现实意义。
PART 在实施过程中最为鲜明的一个特点是始终坚持以结果衡量为主要的评价标准,虽然以结果为导向的绩效评价对于绩效预算的实施部门要求较高,实施难度较大,但是其最终评价结果确实能帮助预算单位重视战略目标并改进绩效,因此,我国在对财政支出进行绩效评价时应坚持以结果衡量为主、产出衡量为辅的评价方式,以求综合考量预算单位的绩效情况。
我国目前的预算管理偏向于“重过程轻结果”“重投入轻产出”,仍然尚未形成以结果为导向的预算机制, 关注点集中在预算管理的规范与安全,忽视了预算的效益性。 我国的预算部门关注如何争取到更多的预算资源,财政部门则关注如何分配预算,而对最后预算资金使用效率的关注较少。 部门预算改革的成功使得财政部门能够控制部门人员和公用经费的预算,但对于专项资金预算的控制力度仍然较小,PART 则关注于具体项目的绩效评价, 这一技术和相关经验大可被应用在专项资金的财政支出绩效评价上。 在具体实践中,进一步强化绩效评价结果应用,硬化责任约束,形成评价结果、反馈整改、提升绩效的良性循环。 完善预算绩效管理工作考核和结果通报制度,推动将绩效结果纳入政府绩效和干部政绩考核体系,调动领导干部履职尽责和干事创业的积极性。
PART 工具的整个实施过程, 均是在美国行政管理和预算局(OMB)的领导下,以预算审查员深入到每个项目之中进行绩效评价, 保证了绩效评价标准的统一性和绩效评价过程的客观性。 且由于整个绩效评价都是在既定的框架体系下进行,评价结果也保证了一定的连贯性,使得项目与项目之间、 部门与部门之间绩效评价结果可比, 这一优势是奥巴马政府的绩效预算举措中不曾拥有的。
我国的绩效预算改革起步较晚,2003 年以来, 均是先在各地建立财政支出绩效评价试点,探索各种绩效评价技术,尚未发展出成体系的预算绩效评价流程,因此评价结果的统一性暂且得不到有力保证。 为此,中国资产评估协会于2014 年发布了《财政支出(项目支出)绩效评价操作指引(试行)》,不过操作指引主要指导的是从事财政支出绩效评价的第三方资产评估机构,内容主要为评估机构参与绩效评价工作的基本程序,对于绩效评价结果的形式并未作统一要求,并且绩效评价是由多家评估机构进行,因此,我国的财政支出绩效评价工作呈现出零散化的特征。 直至2021 年5 月,财政部印发《第三方机构预算绩效评价业务监督管理暂行办法》, 于2021 年8 月1 日起施行, 标志着第三方机构作为独立的专业机构,已广泛参与到以绩效评价为主的预算绩效管理的多个环节和领域,成为推动全面实施预算绩效管理的重要力量,对强化预算管理、提升绩效评价的独立性和可信度、加强社会监督和扩大公众参与发挥着积极作用。 但也要看到,由于这方面工作起步不久,目前还存在对委托方选择使用第三方机构以及开展必要的管理监督缺乏统一规范、相关工作要求及行业标准不够明确、第三方机构绩效评价工作质量参差不齐、市场不够规范、部分第三方机构执业状况混乱等问题,一定程度上影响了绩效评价和绩效管理工作质量的提升,亟待加以引导和规范。为贯彻落实党中央、国务院决策部署,2021年1 月,财政部印发《关于委托第三方机构参与预算绩效管理的指导意见》(财预〔2021〕6号), 在从委托方角度对第三方机构参与预算绩效管理的相关业务活动作出引导规范的同时, 提出要加强对第三方机构的指导和监督,推动提升执业质量。
我国财政部门与预算部门间存在着信息不对称的情况,财政部门处于劣势,无法根据部门的实际需求安排预算, 也无法准确得知预算部门执行预算的具体情况。 而绩效预算需要给予预算部门更多的自主权, 因此我国在进行绩效预算改革时,需要引入相应的监督机制,从而保证绩效信息的客观性。近年来,财政部着力加强对第三方机构绩效评价执业行为和质量的监管,并将其作为财会监督的重要内容之一。主要是结合绩效评价结果的抽查复核和再评价工作, 对相关第三方机构工作质量进行了延伸监督,对存在问题的第三方机构,通过约谈批评、问题警示等方式,督促其认真整改,有效促进了第三方机构绩效评价执业质量的不断提高。
如何使得绩效信息影响预算决策一直有待解决。 可以看到的是,PART 在实施过程中并未得到美国国会的广泛支持, 尽管其产生了大量的绩效信息, 但是PART 的实施效果仍然大打折扣。因此,绩效预算的改革过程中行政机构要与立法机构相互合作, 使得绩效信息与预算决策有机结合,才能实现绩效预算的真正作用。
但是在我国,虽然《预算法》中比较完善地规定了人大预算权,实际上,我国的预算决策过程仍然依赖于行政部门。 因此,我国进一步推进绩效预算改革的前提之一,就是要落实人大的预算权力。不仅要从观念上强调人大在整个预算过程中的监督作用,还要具体落实人大在预算决策中的参与权,形成以人大为核心的预算权运转机制。 有了人大的实际参与,才能讨论如何将绩效信息运用到预算决策过程中以影响预算资源的分配,绩效预算才不会流于形式,以致无法取得更进一步的实质发展。
美国之所以能在绩效预算方面取得成绩,与其在预算方面健全的法律体系息息相关,由此可见, 代议制机构通过立法推动绩效预算改革十分必要。 我国财政部于2009 年颁布《财政支出绩效评价管理暂行办法》, 并于2016 年重新修订, 标志着我国财政支出绩效评价方面开始进行制度化建设。 2021 年5 月,财政部印发了《第三方机构预算绩效评价业务监督管理暂行办法》,于2021 年8 月1 日开始实施。 在地方层面,《青海省预算绩效管理条例》于2023 年1月1 日起实施。 这是我国省级层面出台的首部预算绩效管理地方性法规, 标志着青海省预算绩效管理工作步入法治化、规范化新阶段。虽然我国目前在绩效预算方面存在法律法规,但是,这些法律法规内容不完善,法律位阶偏低,实际上我国尚未形成完整的绩效预算法律体系。
此外,在预算执行方面,我国预算执行存在不规范的问题。预算权威性弱,在预算执行中追加、调整较多,降低了预算的约束力。因此,我国需要建立健全相关预算管理制度与法律制度,为绩效预算的顺利实施打下坚实的基础。
进行绩效预算改革是我国的现实选择。 在此过程中,借鉴先进国家的发展经验,弃其糟粕取其精华,能促进我国绩效预算发展。布什政府引入的PART 项目评级工具, 在其使用的七年间, 确实被证明促进了预算机构生产出有效的绩效信息,在具体经验方面可以借鉴的是,在进行绩效评价时, 应尽量进行对预算机构有更明显绩效提升效果的结果衡量, 在结果衡量不可行时,利用产出衡量指标同样可以达到效果。但是,不能孤立地对待绩效和项目结果的关系,要多方位考虑项目结果的影响因素, 以确定预算机构的行为与实际结果之间的关联程度。 奥巴马政府上台后所进行的替代PART 的一系列绩效预算举措, 包括高优先级绩效目标和更为细节的项目评价, 并没有完全解决PART 的遗留问题。
PART 的实施能为我国绩效预算改革提出四点启示: 一是要坚持以结果为导向的财政支出绩效评价; 二是要注重绩效评价结果的统一性与客观性; 三是要将绩效评价结果和决策过程进行有机结合; 四是要建立健全我国绩效预算的相关法律法规。
注释:
①数据来源:President’s Management Agenda 2008, Performance Improvement: What We’ve All Accomplished in the Last Six Years,November 3.http://georgewbushwhitehouse.archives.gov/results/agenda/budgetperformance.html。
②Campus-Based programs, 包括联邦补充教育机会助学金The Federal Supplemental Educational Opportunity Grant (FSEOG), 联邦工读Federal Work-Study (FWS),和柏金斯贷款项目Federal Perkins Loan programs。
③Frisco V, Stalebrink O J. Congressional use of the program assessment rating tool[J]. Public Budgeting & Finance,2008,28(2):1-19.2。
④OMB,2010. Delivering High -Performance Government. In Budget of the United States Government, Fiscal Year 2011: Analytical Perspectives. Washington, DC: U.S. Government Printing Office。