和经纬,范雨萌,苏 芮
1香港科技大学公共政策学部,香港;2约克大学商业与社会学院,英国约克,YO105DD;3中山大学政治与公共事务管理学院,广东广州,510006
政策试点是中国国家治理策略体系的重要组成部分,是极具中国特色的政策制定方式。在其他国家和地区,以试点为主的政策试验也是解决复杂政策问题的重要方式[1-4]。试点选择是政策试验机制的起点,也是试点方案有效性和可推广性的基础。公共政策试验(policy experiment)借鉴了自然科学的试验理念,但自然科学的试验要求受试对象的随机化(randomization)和试验组-对照组的队列比较,这在公共政策领域很难实现。因此,为了保证试验结果对广大非试点地区具有参考价值,试点单位的选择尤为重要。如果试点单位具有代表性且试点效果良好,可以更好地促进国家层面的经验总结和政策推广。反之,如果试点选择存在明显偏误或缺乏周密考虑,则难以为中央政府的决策提供有价值的参考。
在中国,政策试点融合了顶层设计和基层探索,试点的选择过程是中央指导控制与地方主动选择的结合。然而无论是在现实观察还是学术研究中,关于试点选择标准和影响因素的系统性知识仍相对有限。政府究竟是通过选择基础条件优越的地方以提升试验成功的可能性?还是选择多样化的地点分布以保证经验的代表性?中央政府在众多地方单位中进行选择的动机和考量是什么?在这一关键性理论问题上,学界存在较大争议。正向抽样论(the positive sampling thesis)的观点主要来源于Shaoda Wang 和David Yang的新近研究,他们收集了中国过去40年进行的政策试验的全面数据,发现80%以上的试点是中央政府根据地方经济条件正向选择出来的。换言之,中央政府明显倾向于将政策试点放在经济社会发展状况比较好的地区,以确保改革的成功[5]。试点是一种公共资源,地方政府往往会积极争取试点资格,并将此作为某种政绩。一些经济基础好、改革经验丰富的地区常形成良性循环,不断获得各种试点机会,成为所谓的“试点精英”[6]。正向抽样论强调试点的目的在于创新,而另一种观点则认为试点的目的是寻求代表性和示范效应。周望提出试验单位要有机融合地域的代表性与试验内容的典型性[7],试点的选择是否具有代表性是影响示范效应的基本因素。如果解决的问题不够典型,将使试点经验的可借鉴性大打折扣[8]。一项创新若得不到推广,就有可能造成“孤岛”现象或“烟花”现象,从而失去其治理意义[9]。朱旭峰等指出,上级政府在选择试点时通常会考虑下级政府在地域、经济发展水平、财政能力、行政级别等方面的代表性,并在分批实施的试点过程中逐步调整方案[10]。
此外,学界还有一种观点认为应同时兼顾正向选择和代表性。如黄飚提出当代中国政府的试点选择表现出“关系优先、兼顾公平”的特征,“关系优先”保证了风险可控,“兼顾公平”则是指中央政府能够将地方经验上升为全国政策[11]。王怡欢等人关于中国长期护理保险试点项目的研究发现,中央部委分别选择了东部、中部和西部地区的财政强市[12]。综上所述,相关研究结论的差异表明试点选择的逻辑在现实中并非简单的二元选择。在中国这样幅员广阔、地域差异较大的国家,中央政府在谋划推进政策试验时的考量和逻辑必然非常复杂。本文希望在医药卫生体制改革的宏大背景下,阐释我国中央政府如何在复杂的政策系统中通过多种试点选择实现试验性治理的多重目标。
医药卫生体制改革是一项复杂的系统工程,被称为世界性的治理难题。在我国,公立医院改革又是医改的重中之重。公立医院既是我国医疗卫生体制中的顶梁柱、压舱石,也是各种问题和矛盾的交汇处。广为诟病的“看病难”“看病贵”问题也主要集中在公立医院。历届政府都反复强调,医改的深水区和硬骨头就是公立医院改革[13-14]。改革开放以来,医疗卫生领域的过度市场化让政府在卫生筹资中逐步后退,公立医院慢慢成为逐利主体,侵蚀了“公立”的本质[15]。因此,近年来“政府主导、回归公益性”的呼声愈发强烈。从医疗保障体系来看,虽然社会医疗保险覆盖率较高,但其作为第三方的战略性购买和科学控费功能还远未发挥[16-17],我国医疗卫生服务距离实现价值医疗尚有很大的差距。此外,由于价格体系不健全和监督监察一度薄弱,医药领域的腐败现象较为严重,既得利益庞大,客观上助长了“看病难”“看病贵”的问题。重重难题之中,改革如何破局,无论是中央部委还是地方政府,都亟需探索新的改革路径。
2009年初,《中共中央 国务院关于深化医药卫生体制改革的意见》提出了公立医院要“遵循公益性质和社会效益”的原则,但对于庞大的公立医院系统,具体的改革方案尚不明确。改革任务繁重,面对错综复杂的问题和深层次的利益冲突,中央政府采取了边试边改的试验性策略。从2010年开始分4个批次陆续进行城市公立医院改革试点,前后涵盖多达200个城市,约占全国地级及以上城市总数的60%。本研究采用清晰集定性比较分析(crisp-set qualitative comparative analysis, csQCA)方法,根据大量公开资料和统计数据构建了包括209个地级及以上城市的数据库,其中包括103个试点城市和106个非试点城市。本研究通过文献回顾并结合部分深度访谈,提出试点选择影响因素的分析框架。研究发现,在医疗卫生政策领域,中央政府进行试点选择考虑的主要因素有3个方面,即当地的社会经济状况、医疗卫生体系基本状况以及在试点工作方面的经验和积极性。通过定性比较分析,揭示了5种不同的试点选择组态,即再接再厉型、取长补短型、一马当先型、背水一战型和以身作则型。本文还针对不同条件组合下的试点类型进行案例阐释,以便更生动地展现每种试点类型的特定目的。研究表明,中央政府进行试点选择时的行为模式不能简单地用正向抽样或者是追求代表性来解释,而是呈现出多样化的模式。试点作为试验性治理的核心,发挥着多重治理功能。
本研究的目标样本涵盖中国大陆所有直辖市、副省级城市及地级行政单位(地级市、地区、自治州、盟)。由于数据可及性低,排除了新疆和西藏的城市,获得了包含315个案例的初始样本。随后排除了88个属于11个医改试点省份的样本。由于国务院在2015年和2016年指定了两批共计11个综合医改试点省份,这些省份内的城市直接成为国家联系的试点城市,与本研究分析的条件无关,因此剔除了上述省份的样本。最后,由于缺乏关键解释条件的数据,进一步排除了18个城市。最终样本包含209个城市,其中103个为试点,106个为非试点。
研究中所有数据均来自公开资料。人均GDP、人口规模、人均医疗卫生支出和人均医疗保健消费的数据来源于官方统计年鉴。为了避免试点选择与解释变量之间的共时性影响,我们将时间变量提前1年,还原试点选择前的条件状态。因为最近一批公立医院改革国家联系试点城市名单是在2015年公布的,因此非试点城市的时间变量以该年度为准。
试点工作经验的数据来自政府官方网站、谷歌和北大法宝数据库。我们首先使用“国家级试点”“试点城市”“医疗卫生改革”等关键词检索确定符合条件的试点和相应的城市名单,然后对其余的城市逐个进行检索。试点工作经验收集的时间范围上溯至公立医院市场化改革肇始的1989年,该年份被广泛认为是我国医疗卫生体制改革的重要节点。对于本研究中的试点城市,改革经验是指从1989年至该市加入公立医院改革试点前一年间的医药卫生和医疗保障领域试点工作。对于非试点城市,试点工作经验时间跨度设定在1989-2015年。
改革积极性的数据主要收集自公开媒体报道。我们系统检索了中国知网数据库和报刊类数据库,使用“医疗卫生改革”“医疗体制改革”“公立医院”和“医疗卫生服务创新”等关键词定位相关报道,只有包含改革举措具体信息的报道被纳入甄别。对于试点城市,我们检索其被选为试点前5年内发表的报道。对于非试点城市,检索2010-2015年间的新闻报道。由于对改革积极性的判断具有一定主观性,这部分的编码工作由本文第二作者与第三作者共同进行,以尽量减少偏差。当出现分歧时,三位合作者进一步讨论甄别,直至达成一致。
此外,案例分析中政府官员的发言和各政府部门的官方表态均来自政府官方网站,以及地方性日报、21世纪经济报道等权威媒体报道。
1.2.1 定性比较分析。定性比较分析 (qualitative comparative analysis, QCA)是由查尔斯·拉金提出的一种基于案例和集合理论分析的研究方法[18]。此方法能够基于集合理论和布尔代数进行系统的案例比较,通过找出产生同一结果的多个原因条件组合来探索其因果复杂性[19]。本研究选择QCA方法的原因包括两个方面,一是QCA适用于中小规模样本的分析,符合以地级市为研究对象的样本规模限制;二是政策试点选择的影响因素组合呈现多样性,包括经济基础好、试点经验丰富以及医疗卫生问题紧迫等不同类型的选择原因。QCA假定导致某种社会现象的因果关系是复杂多元且非线性的,其运算结果也是以原因组合的形式来呈现。
1.2.2 变量选取。本研究的被解释变量是某城市是否被选为公立医院改革国家联系试点城市。结合已有研究,我们构建了3个类别来解释中央政府选择地方试点时可能考虑的因素,分别是经济社会状况、医疗卫生体系基本状况、试点工作经验和积极性。确定解释性条件数量时,QCA方法论文献指出,如果理论上可能产生的组态数量超过实际案例数量,会出现有限多样性的问题,而且过多的条件会造成不必要的逻辑余项。因为本研究共有209个案例,最多允许纳入7个解释条件。在反复测试了4至7种条件的不同组合之后,我们最终确定6个解释条件。见图1。
图1 QCA分析中的解释变量
经济社会状况包括一个城市的人均GDP和人口规模。前者反映一地的经济实力,而经济实力与卫生资源的分布呈正相关[20]。Wang等人的正向抽样论就是建立在以人均GDP为代表的经济实力上,因此我们假设这一因素会影响中央政策制定者对公立医院改革试点城市的选择。人口规模通常通过城市的常住人口数量来衡量。有研究指出,中国的卫生政策试点更有可能出现在人口较多的中心城市,以期解决改革的深层次问题并实现辐射效应[5]。但也有研究表明,医改试点往往更倾向于选择中小城市以控制改革风险[21]。因此,城市人口规模在试点选择中的角色值得进一步探究。
医疗卫生体系基本状况由政府人均医疗卫生支出和个人人均医疗保健消费两个条件构成。政府人均医疗卫生支出体现了地方政府在医疗卫生服务方面的财政投入,可以用以比较不同城市之间政府的财政能力和医疗卫生支出意愿。研究发现,在特定政策领域财政能力强的城市更容易被选为试点[12],且财政能力越强的政府采取创新政策的意愿越高[22]。如果正向抽样论成立,那么有理由推测中央政府在选择试点时更青睐在医疗卫生方面财政投入更高的城市。人均医疗保健消费可以衡量当地居民就医的经济负担。本研究采用医疗保健消费占城镇居民总生活消费支出的比重作为指标,以反映该城市居民就医的经济负担。“看病贵”一直是我国医改试图解决的核心问题,因此我们可以假设中央政府更可能将这一问题突出的城市选为试点。试点工作经验和积极性类别包含先前的试点工作经验和改革积极性。本研究将试点经验定义为该城市在被选为公立医院改革试点之前至少承担过1次国家级医疗卫生试点工作。已有的试点经历能够强化相关城市与中央部委间的信息传递,借此形成的信息优势常常影响政策试点的选择偏好[23]。改革积极性是指在开展公立医院改革试点前的5年内,该城市至少有1项医疗卫生领域的地方性改革措施。之所以选择这一条件,是因为地方政府参与自上而下的改革意愿对达成积极的试点结果至关重要[24],而近期的地方创新举措能够体现地方政府进行医改的积极性。本研究定义的地方性改革措施必须具备以下至少一项特征:为地方医疗卫生系统带来重大变化、取得显著成效、改革具有原创性和独特性。
1.2.3 变量校准。按照QCA的分析要求,研究变量需要被校准成量化的隶属度分数。由于本研究采用清晰集,因此将每个变量都转化为二分变量,即1(完全隶属)或0(完全不隶属)。对于被解释变量,试点城市被赋值为1,非试点城市被赋值为0。见表1。
表1 解释变量的来源与赋值情况
通过R 4.2.2软件中的QCA 3.18 和SetMethods 3.0 软件包对条件进行必要性和充分性分析。必要性分析能够判断结果的产生是否需要任何条件必须存在[25-27]。必要性通过3个指标来评估:一致性、覆盖度和必要性的相关度(relevance of necessity, RoN)。如果一致性得分达到0.9,则可认为该条件对于结果的发生是潜在必要的,并需进一步检验其覆盖度和RoN。覆盖度指的是产生某结果的案例在所有具有该条件的案例中的比例[28]。RoN能够衡量该条件的潜在必要性是否具有现实意义,即一致性得分大于0.9是否由样本选择偏差等其他因素导致。RoN值越高,则必要性的相关度越高[29]。如果覆盖度和RoN指标都高于0.5,则通常认为该潜在的必要条件是具有现实意义的[27]。
必要性分析的下一步是充分性分析,用来判断当结果发生时总是存在的组态。初步分析结果由“真值表”呈现,包含所有逻辑上可能存在的组合和其相应的结果。下一步则是设定一致性阈值和频数阈值来筛选进入后续分析的充分组合。按照惯例,本研究采用的一致性阈值为0.75,频数阈值为2[27]。最终分析结果包含3种类型的解:复杂解、简单解和中间解。每一种解均会产生导致同一结果的不同组态,各代表一个独特的解释条件组合。本研究采用中间解作为主要结果进行解释。每个组态通过3个指标来评估:一致性、原始覆盖度和唯一覆盖度。如果一致性得分达到0.8,则可以认为该组态对结果的产生是充分的[27, 30]。原始覆盖度代表能被该组态覆盖的案例比例,而唯一覆盖度代表仅能被该组态覆盖的案例比例。组态中同时出现在中间解和简单解的条件被视为核心条件,与结果的关系更为直接,而仅出现在中间解的条件被视为边缘条件。从整体上看,解的总体一致性和总体覆盖度代表了所有组态整体的可靠性和有效性。一般情况下,无论样本量大小,建议最小一致性值为0.8[30]。总体覆盖度没有统一的衡量标准,因为它很大程度上取决于研究设计[29]。一般而言,小样本的QCA分析总体覆盖度水平较高,而大样本研究通常较低[31]。
研究中解释变量分为经济社会状况、医疗卫生体系基本状况、试点工作经验和积极性3类,校准后的解释变量描述性分析结果见表2。
表2 解释变量的描述性分析结果
结果显示,解释条件中没有成为试点的必要条件。除了检验单一条件外,我们又进一步检验了是否存在结果产生所必需的条件组合(SUIN条件),且并未发现该组合。见表3。
表3 必要性分析结果
结果表明,公立医院改革试点选择的逻辑呈现5种独特组态。所有组态的一致性得分均高于0.8,表明每个组态对结果的产生都是充分的。解的总体一致性为0.88,体现了较强的解释力。总体覆盖度为0.54,表明这5种组态能够解释54%的试点案例。见表4。
表4 中间解的结果与典型案例
3.1.1 再接再厉型的挑战“破冰者”。第1种组态中包含高人均GDP、高人均医疗卫生支出(政府投入高)、低人均医疗保健消费(看病贵问题不突出)、中小型城市,其中前3个是核心条件。这种配置通常代表经济发展水平高和拥有良好医疗卫生资源的中小规模城市。这些城市具有成为试点的良好社会经济条件,也具备必要的基础能力,从而使得试验成功的机会更大。中央政府选择此类城市旨在鼓励通过创新来解决公立医院改革中存在的各种问题,并寻找可推广的解决方案。这些试点城市相对有能力调动现有资源,寻求公立医院改革的突破口。因此,本文称之为“破冰者”。
厦门位于我国东南沿海,是福建省最富裕的城市,但从人口规模来看却属于中小型城市。同时,当地居民就医的经济负担较低,开展公立医院改革的条件比较优越。在成为国家联系试点城市之前,厦门在医改方面已积累了不少成功经验。它是全国首批建立起覆盖城乡的居民医保制度的城市之一。它首创电子健康档案系统覆盖了全市95%的医疗机构。厦门市政府雄厚的财政能力保障了其对医疗卫生事业的高投入。正如时任市长所言:“厦门市政府肯定不会减少对公立医院的补偿和投入,反而,我们还将加大投入。”中央政府选择厦门进行试点的原因在当时卫生部副部长的讲话中得到了生动的体现。他强调,厦门已经积累了丰富的改革经验,符合党中央、国务院医改方针政策和公立医院改革思路要求。卫生部表示将继续支持厦门的试点,并适时向其他城市推广。他还强调,厦门作为中国经济改革的先行者,应该具有创新思维,迎接更大挑战。另一位副部长在视察时也指出,厦门公立医院改革在过去几年中取得了令人满意的成绩,中央政府寄予厚望,希望厦门能够在其他改革方面做出大胆尝试,为全国医改提供新经验。
3.1.2 取长补短型的短板“主攻手”。第2种组态包含高人均GDP、中小型城市、低人均医疗卫生支出(政府投入低)、有试点工作经验,上述条件均为核心条件。与组态1类似,该组态中的城市体现出足够的经济能力和适度的人口规模,两者都为医改提供了优越的条件。且中小规模城市的试点往往被认为风险较低[32]。此外,本组态中的城市均有医改试点经验,但地方政府卫生投入偏低,导致支持公立医院改革的资源不足。由于政策试点常常会有相应的财政配套资金及其他资源,可以弥补这一缺点,为该组态的试点城市加强能力建设、解决本地公立医院改革发展中瓶颈创造条件[33]。因此,将这类城市总结为“取长补短型”。
珠海是广东省经济较为发达且人口规模适中的城市,人均GDP远高于全国平均水平,但人口规模在全省位列后段。1996年,珠海被国务院选择进行医保支付改革试点。一方面,珠海是经济实力雄厚的中小型城市,拥有不错的改革基础。时任广东省卫生健康委副主任表示,珠海有良好的(公立医院改革)试点条件,这个城市经济实力在广东不是最强的(所以有一定的代表性),但社会负担也不重(因此进行试验的风险较小)。一位当地官员指出,适度的人口规模有利于试点的设计和实施,因为“船小好调头”。另一方面,当地政府在医疗卫生方面投入不足。据测算,政府财政补助仅能维持该市大型公立医院15天半的运营。成为国家联系试点城市后,珠海的改革重点集中在两个关键领域,即规范药品价格和调整医院财政投入体系,这两个问题不仅是当地突出的改革难题,在全国也具有普遍性。正如时任卫生部副部长所说,珠海被选为试点,为该市解决当地公立医院改革的众多问题提供了良好的机会。
3.1.3 一马当先型的创新“排头兵”。第3个组态是高人均GDP、大型城市、有试点工作经验、改革积极性强的结合。在这个组态中,绝大多数城市要么是中国最富裕的城市(如北京、上海、深圳),要么是省会城市(如杭州、武汉、长沙),它们都拥有庞大的人口和较强的经济实力。尽管由于改革的高风险和复杂性,这些城市在实施大规模系统性医改方面面临更大的困难,但它们大多有较强的改革积极性,并在开展各种国家级试点方面积累了不少经验。这些特点使它们有能力克服改革过程中的障碍,中央政府选择这些城市的主要目的是鼓励它们百尺竿头更进一步,激发更强的改革动能。这些城市大多是地区的经济或政治中心,具有较强的辐射带动能力,可以作为以点带面的桥头堡[34]。因此,我们将这类试点城市总结为 “一马当先型”。
上海作为我国最大的城市,经济发达、人口众多,优质医疗资源富集。它在各种医改试点中积累了丰富的经验,在成为国家联系的公立医院改革试点之前也贡献了很多地方性的创新政策。例如,著名的“申康模式”就代表了公立医院法人治理结构改革的重大突破,为其他省市提供了启发和借鉴。上述优势使上海成为探索公立医院改革新模式的理想地点。当时的卫生部领导指出,强有力的地方积极性是试点工作的关键考虑因素,积极性强的城市更有可能被选为国家试点。另一位部委领导也强调,中央政府希望上海通过这一轮公立医院改革试点,为全国提供更多新经验。
3.1.4 背水一战型的逆势“突围者”。与人均GDP较高的前3种组态不同,第4种组态包括人均GDP低于平均水平、人均医疗卫生支出低(政府投入低)、人均医疗保健消费高(“看病贵”问题突出)、有试点工作经验和改革积极性低等特征。除了政府投入低以外,其他条件都是核心要素。这表明,这一类城市的医疗卫生体系存在突出问题,但缺乏强有力的改革动力。一方面,它们经济欠发达,政府财力有限,当地居民的“看病贵”问题比较突出。此外,这些城市过往也没有明显展现出推进医改的积极性。中央政府选择它们作为试点,主要是为了施加一定的压力来激励当地政府推进改革。换言之,该组态的试点选择更像是中央政府鞭策加压的工具,并赋权地方解决医疗卫生领域的棘手问题[35]。因此,我们将这一组态称为“背水一战型”。
宝鸡地处西北腹地,是陕西省一座中小型城市。它的总体经济发展水平虽处于全省中游,但人均GDP仍远低于全国平均。当地政府在医疗卫生方面的投入较低,人民群众就医的经济负担却相当高。宝鸡市政府有限的财力极大限制了对医改的必要投入。2003年以来,当地政府对公立医院的财政补助不增反降。2007年,中央政府选定该市为城镇居民基本医疗保险试点。2010年,市政府承诺预留5000万元投入医改,但最终的实际投入只有2000万元。分管副市长坦承,西部地区城市在医改的财政投入方面存在严重困难,迫切需要中央政府的支持。事实上,宝鸡市并没有申请全国城市公立医院改革试点,而是由省政府“点将”。成为国家联系的试点城市为宝鸡市政府提供了“直面困难”的外在动力。陕西省分管科教文卫的副省长一再强调,宝鸡市政府各部门都要认识到公立医院改革的复杂性,面对困难必须迎难而上,切实解决困扰医改的深层次问题。
3.1.5 以身作则型的区域“领头羊”。第5个组态包括低人均GDP、中小型城市、人均医疗卫生支出高(政府投入高)、人均医疗保健消费高(“看病贵”问题突出)以及以往有试点工作经验。除中小型城市外,其他均为核心条件。该组态覆盖的案例数量最少,包括经济社会欠发达的云南和甘肃两个省份的4个中小城市。与组态4一样,该组态中的城市表现出经济发展水平低和“看病贵”问题显著。然而,当地政府在医疗卫生投入方面具有较强的担当,还拥有一定的试点经验--这两者都是进行公立医院改革的积极因素。中央政府选择这4个城市的目的主要在于探索经济欠发达地区公立医院改革的可能路径,并为其他西部地区的改革提供可以参考借鉴的方案。因此,我们将这一组态总结为“以身作则型”。
庆阳位于甘肃省西北部,经济发展水平远远落后于全国平均水平,当地居民就医的经济负担是全国平均水平的两倍。但值得注意的是,庆阳的政府人均医疗卫生支出略高于全国平均水平,也有医改试点的经验,是2010年首批实施国家基本药物制度的试点城市之一。总体来说,与其他欠发达西部地区相比,庆阳的试点条件相对较好。2011年,庆阳首次入选甘肃省级公立医院改革试点城市。此后又在增加政府财政投入、提高医疗保障待遇、加强基层医疗能力建设等方面做了不少工作。庆阳医改的表现得到了甘肃省政府的高度肯定,被认为“为省级改革铺平道路”,省政府希望庆阳市未来能够为全省医改提供更多可以借鉴的经验。
在大型政策试点工程中,中央政府究竟如何选择地方试点?这不但是决定试点经验可推广性的实践问题,更是政策科学研究的重大理论问题。虽然既有研究已经揭示了上级政府在试点方案设计和选择方面享有很大的自主权[36],但是试点选择的逻辑究竟为何,尚有理论争议。“代表性论”认为,政策制定者应该对试点地区的社会经济、财政能力和地域代表性给予关注,以便最大限度地发挥试点经验的示范作用。而“正向抽样论”则认为,政策制定者在多种动机的驱动下,往往选择条件好的地区进行试点,让改革成功的可能性最大化[5]。本研究通过将QCA方法与阐释性案例相结合,试图在中国大陆医改的场景下回答上述理论问题。上述两个论点在本研究中都得到了一定的印证,说明在地区间情况差异巨大且改革问题非常复杂的情境下,中央政府寻求政策解决方案时既不是拘泥于地域或者经济发展水平的绝对代表性,也不是机械性地选择条件好的地区,而是存在多样的考量。
首先,试点选择绝不是简单的线性决策,本文揭示了多种逻辑同时发挥作用。我们找到了支持正向抽样论的部分证据,样本中有 53%(103 个试点城市中的 55 个)的城市人均 GDP高于全国平均水平。在医疗卫生改革的场景下正向抽样的逻辑并不难理解,毕竟医改需要相当的财政投入才有解决体制机制沉疴的条件。因此选择这些条件较为优越的城市,更有可能在实质性改革上有所斩获。我们的QCA分析结果显示,人均GDP和卫生财政投入是5个组态中的关键条件。与此同时,我们的研究结果也为“代表性论”提供了部分支持。一些试点城市既不是经济发达的城市,也不是大城市(尤其是组态4和5),但它们同样面临的医疗卫生领域的突出问题。中央政府通过“国家级试点”这一身份可以创造一定的政治压力,激发欠发达地区的改革动能。在问题倒逼之下,如果地方政府产生危机意识,更有可能积极采取行动,寻求体制机制的突破。
本文与最近的其他研究相呼应[24, 34, 37-38],再次证明政策试点是一种多功能的治理工具,能够服务于多重治理目的。我们阐明的5种独特组态体现了医疗卫生政策场景下政策试点形式和动力的丰富性。一方面,试点可以作为一种激发创新的手段,将地方性经验吸纳为国家政策,为全国性方案提供智慧。另一方面,试点也可以作为刺激地方改革的导向性工具,为试点单位带来必要的外部期望和政治压力。我们研究展现出来的多重试点样态并不必然互斥,反倒恰恰生动地展示了大国决策者在复杂性适应系统中进行政策求解的丰富治理模式。