行动者中心制度主义：探究政策过程中的互动效应

2020-06-05 01:49:14李文钊

广西师范大学学报（哲学社会科学版） 2020年3期

李文钊

(中国人民大学公共管理学院，北京 100872)

政策研究中的行动者中心制度主义(Actor-Centered Institutionalism in Policy Research)是由德国著名学者弗里茨·沙普夫(Fritz W. Scharpf)和雷娜特·迈因茨(Renate Mayntz)率先提出，并由弗里茨·沙普夫系统阐述而发展成为政策过程中决策途径的重要理论之一。[1]1[2]1弗里茨·沙普夫通过《真实行动者博弈：政策研究中的行动者中心制度主义》一书，介绍了行动者中心制度主义这一框架的构成要素、核心内容和主要观点，他认为博弈论思想和制度分析方法对政策过程研究具有重要贡献和价值。对于行动者中心制度主义的核心主张，沙普夫概括为：“这一路径来自于这一假设，社会现实可以被解释为有目的行动者互动的结果，这些行动者包括个人、集体和公司行动者，他们之间互动在一个结构化环境中展开，并且互动结果是由他们所处的制度设置(institutional settings)所塑造。”[2]1于是，行动者、行动者集群(actor constellations)、互动模式(Modes of interaction)和制度(Institutions)成为这一框架的核心要素。由此可见，行动者中心制度主义利用博弈论理论，将行动者互动作为分析中心，试图打开政策过程的“黑箱”，为政策结果提供一个更清晰的解释。

本文首先指出行动者中心制度主义在挑战政策过程中的问题取向研究范式(Problem-oriented research)和实证研究范式，在此基础上提出了政策过程研究的互动范式和实证与规范相结合范式；其次讨论了行动者中心制度主义的理论基础，试图整合博弈论、制度理论和合法性理论等三种理论；再次阐述行动者中心制度主义框架的假设、构成要素和核心内容；随后，分别按照分析框架的要素深入探讨行动者、行动者集群、互动模式等；复次，阐述行动者中心制度主义的核心贡献；接着，评价该理论制定，讨论其在理论发展脉络中的位置；最后，分析行动者中心制度主义对推进中国政策制定和治理过程的启示与借鉴意义。

一、挑战政策过程中的问题取向研究范式和实证研究范式

弗里茨·沙普夫提出行动者中心制度主义框架主要是基于其对政治和政策现实的认识，以及政治和政策学科定位的思想，他们力争理论与实践的有机统一。沙普夫在开篇中指出：“政治是关于很多事情的解决方案。但是在现代民主政体中，最重要的事情是选择和合法化公共政策的功能，这一功能的实现需要使用集体权力来实现仅仅依赖个人自身或市场交易难以实现的目标和解决的问题。政治科学和政治社会学是关于很多事情的学科。但是，在他们最重要的关注中是或者应该是能够贡献帮助理解和提升政治产生有效和合法的方案去解决问题的学科。”[2]1公共政策对于人类福祉意义重大，政策选择的成败对于国家的繁荣与稳定至关重要。在现实中，并非所有的政治体制都能够生产良好的公共政策，我们如何才能够让高质量的公共政策得以涌现？因此，在政策研究中，政治科学和政治社会学的核心贡献应该是理解和提升(understand and improvement)政治得以产生有效和合法(effective and legitimate)的公共政策的条件。简而言之，政治能否以及如何产生有效和合法的公共政策构成了他所设想的公共政策的“根本性问题”(fundamental problems)[注]“根本性问题”是一个学科或理论关注的核心问题和关键问题，它也是一种重要的研究和思考方式。例如孔飞力在《中国现代国家的起源》一书中开宗明义便提出，他所要讨论的是关于中国现代国家形成的“constitutional question”以及相关的“constitutional agenda”。孔飞力对此的定义是：“所谓‘根本性’问题，指的是当时人们关于为公共生活带来合法性秩序的种种考虑；所谓‘议程’，指的是人们在行动中把握这些考虑的意愿。”见孔飞力：《中国现代国家的起源》，陈兼、陈之宏译，生活·读书·新知三联书店2013年版，第144页。。公共政策的有效性和合法性，以及保证有效性和合法性得以产生的公共政策过程成为沙普尔政策研究的主要议程。

在沙普夫看来，现有的政策研究范式主要是问题取向研究范式和实证研究范式，这些范式并不能够满足其对政策研究“根本性问题”的设定，于是提出以“互动范式”来替换问题取向研究范式和实证研究范式，重新将政策过程作为政策研究的核心。自拉斯韦尔倡导政策取向研究以来，问题取向研究一直是公共政策的重要研究范式，它强调通过科学方法来解决公共问题，并且逐步发展成为政策分析研究取向，以探究政策过程中的知识[3][4]。对于问题取向研究，沙普尔将其总结为：“问题取向研究关注政策问题的原因，潜在政策解决方案，对最初问题和更广泛政策环境的可能效果。”[2]11很显然，问题取向研究涉及实质性政策分析，它需要利用其他学科知识来帮助问题。很多公共政策研究的教科书都是按照问题取向研究来组织内容，问题分析与解决方案分析成为政策分析最重要的两部分内容，政策分析是一个发现问题和寻找解决方案的过程。[5]2问题取向研究最重要的假设是“仁慈独裁者视角”，强调唯一的决策者能够分析问题和提出解决方案。但是，在很多时候，良好的政策方案并不一定能够被选择，这使得沙普夫提出可以从互动范式出发来政策过程，重新将政策过程作为政策研究中心，讨论不同行动者通过什么样的互动模式实现了现有的政策结果。这意味着，沙普夫试图平衡政策过程中的知识和政策过程的知识，从而实现通过知识改善公共政策质量的历史使命。

除了挑战问题取向研究范式外，沙普夫还对实证研究范式不满，认为政策研究是实证与规范互动的产物，规范性研究在政策研究中发挥重要作用。事实上，拉斯韦尔在倡导政策科学范式时，也非常重视价值在政策科学中的重要性，提出了民主的政策科学家的构想。[6]正是因为对价值的关注，沙普夫认为政策研究也是实证研究和规范研究互动的过程，这是“互动范式”在研究领域的体现。对此，沙普夫将政策研究与法律研究连接起来，认为两者都需要考虑实证问题和规范问题。他强调：“判断一个政策的有效性不仅要求关于政策经验结果的信息，而且还要有关于什么是问题以及什么是好的解决方案的规范假设。……关注公共政策的有效性和合法性(effectiveness and legitimacy)，正如我们要收集和解释经验信息一样，我们同样需要涉及发现和解释合适的规范标准。”[2]12于是，沙普夫提出了一个有意思的问题，如果一项公共政策的经验效果非常好，但是产生这一公共政策的政策过程不符合民主规范，那么我们应该如何评价和判断该项公共政策？事实上，很多学者都认识到实证研究范式的局限，倡导将公共政策的实证研究范式和规范研究范式相结合，公共政策研究的“论证转向”是其中典型代表，费希尔直接在公共政策评估的研究中讨论了评估标准的多维度问题。[7]1[8]3[9]5

由于公共政策涉及有效性和合法性问题，这使得对于公共政策的规范性维度也涉及“好的”公共政策标准(criteria of “good” policy)和政策制定系统的合法性(legitimacy of the policymaking system)。一般而言，对于“好的”公共政策标准，通常可以存在公认的标准，即便存在科学和政治对话冲突，也可以通过哈贝马斯的理想沟通和对话来解决。但是，更为棘手的问题是对政策制定系统的合法性讨论。对于这一问题，沙普夫指出：“这一议题并不是通常我们所关注的政体合法性(regime legitimacy)，而是特定结构和程序的合法性，通过这一结构和程序，公共政策得以产生。……同样，判断标准仍然是‘共同善’(common good)。但是，这一标准评判的不是某一项实质性公共政策选择的质量，而是特定政策制定制度产生共同善的公共政策选择的一般能力(general capacity)。”[2]14-15对于政策制定系统的合法性研究，构成了沙普夫整个政策过程理论的核心，也是他后期一直致力于讨论的“根本性问题”。

二、行动者中心制度主义的基础：博弈论、制度理论和合法性理论

沙普夫的行动者中心制度主义力图将博弈论和制度理论有机结合，从博弈论中策略性互动角度来讨论公共政策选择过程，并且突出制度对于公共政策选择的影响。博弈论是理性选择理论的一个分支，它强调从决策者理性选择假设出发解释行为及互动结果。对此，沙普夫在论述其分析框架时指出：“这些研究路径的共同点是行动理论或理性选择和制度主义或结构范式的有机融合，这些路径在‘经济学’理论和‘社会学’理论相遇时通常被认为是相互排斥的。”[2]36很显然，沙普夫提出的行动者中心制度主义试图整合经济理论和社会理论，他们既不像社会学理论那么仅仅强调文化规范或社会规则作用，也不像经济学理论那样只强调行动者追求无差别的个人利益。行动者中心制度主义认为，政策研究者需要关注个人行动者在偏好和认识的约束下如何对外界的威胁、约束和机会等作出反应，其中，个人的偏好和认识受到制度影响。与此同时，对于公共政策选择除了涉及有效性标准之外，还涉及合法性标准，即获得公共政策的程序是否合法？对于公共政策合法性的讨论，构成了他后期学术研究的重点。由此可见，沙普夫提出的行动者中心制度主义的理论基础主要有三个，即博弈论、制度理论和合法性理论，其中博弈论又是他突出强调的重点，认为经验性政策研究需要有博弈论思维。

对于沙普夫而言，博弈论是政策研究的重要工具，但是被博弈论学者和政策研究者所忽略。关于博弈论与公共政策之间的内在关系，他指出：“互动过程的博弈论概念化对于模型化我们在政策过程经验研究中发现的集群(constellations)现象是合适的，这通常涉及有限的个人和法人行动者，如政府、内阁、政党、工会、行业协会、商业企业和研究机构等，他们在结果由他们分别决定的条件下从事有目的的活动。”[2]5正因为关注互动过程，沙普夫的行动者中心制度主义提供了一种不同于问题导向的互动式政策研究范式，该范式并不预设“针对自然的博弈”(game against nature)，恰恰相反它是针对人的博弈(game against actors)。

对于博弈论是否能够应用于政策过程的研究，一个经常的争论是博弈论对于人的假设过于严格，这使得其不能够与政策过程经验研究相结合。与其他理性选择理论一样，博弈论是从完全理性人假设出发，强调行动者拥有所有的信息、解决方案和计算能力。该假设很显然与现实不相符，这导致政治学中更多的政治科学家和分析性理论家使用博弈论，如使用博弈论来分析社会契约的形成。对此，沙普夫认为，经验主义政策研究者事实上只需要借用一些博弈论最基本的设想，就可以大大提升他们对于政策过程的解释性、预测力和设计力，他指出：“为了从博弈论理论视角获益，经验主义者既不需要成为数学家，也不需要假设行动者是全知全能的，也不需要假设他们拥有无限的计算能力。我们只需要在解释性假设中将相互依赖的策略性互动和均衡结果等几个基本观点引入就足够了。”[2]6-7

博弈论的核心要素有三个，即行动者、策略和报酬。行动者是参与博弈的个人或组织，他们会对可能的行动作出有意识的选择，策略是行动者所采取的行动。博弈存在的前提是结构是由双方行为共同决定的，最典型的是囚徒困境和公地悲剧。报酬是对结果的赋值，它是根据行动者偏好对结果的评价。博弈论根据是否达成协议以及协议是否具有约束力，可以区分为非合作博弈和合作博弈。此外，博弈论可以分为标准型博弈和扩展型博弈，前者以表格形式来展现博弈参与者的策略及其结果，后者以树状型来展现不同博弈参与者的策略及其结果。一般而言，标准型博弈强调同时选择，扩展型博弈强调选择具有时序性。

制度理论是行动者中心制度主义的另一个理论基础，它强调制度环境对于政策过程的影响。传统的博弈论将制度作为外生变量，讨论行动情景之下的博弈及其选择。行动者中心制度主义直接探讨制度设置(Institutional settings)对于政策过程中互动过程及其模式(modes of interaction)的作用，进而对政策选择结果产生影响。制度可以有多种维度的解释，如认知、行为与规范，沙普夫则是从规范和规则层面理解制度，强调制度是对人类行为的激励和约束，它是对禁止、强制或允许人类行为的规定。[10]对于制度的定义，沙普夫认为既不能够太过宽泛，将组织和机构纳入，又不能够过窄，只将具有惩罚性的规则作为考虑范畴，应该同时包含规则和社会规范。从这个意义上看，沙普夫直接将政策过程与制度联系在一起，建构了政策过程的制度路径。

对于制度的强调，使得他在从事政策过程研究时，需要识别制度设置，并进一步讨论制度对于政策选择的影响。对于沙普夫而言，他特别重视制度的时空性和情景性，认为抽象的制度分类对于研究意义并不大，他指出：“即便我们能够根据抽象标准对规则进行分类，关键点仍然是这些规则是高度个性化的，他们仅仅以具体形态呈现才能够产生因果效应。”[2]38为此，沙普夫不是将制度作为一个解释变量，它只是一个对解释变量有影响的核心因素的缩写。

合法性理论是行动者中心制度主义的第三个理论基础，这使得沙普夫关注政策过程的规范基础，倡导规范取向的政策过程研究。事实上，对于合法性的讨论，构成了沙普夫后期学术研究的重心，如何建构一个有效且合法的政策过程成为其核心研究问题。[11]10对于合法性，沙普夫从功能性方面给出了一个定义，他指出：社会共享的合法性信念主要是服务于创造一种规范性义务，它可以确保人们对于治理权威当局非期望规则或决策的服从。[12]对于合法性的关注，使得沙普夫一方面认为政策研究应该重视规范性标准的讨论，另一方面，它拓展了政策研究的内容，政策研究需要讨论政策过程的结构和程序的合法性，而不仅仅研究政策过程产出的有效性。

在沙普夫看来，西方国家对于合法性的讨论，主要有两种来源：一种是共和传统(Republican)，另一种是自由传统(Liberal)。共和传统起源于亚里士多德，他强调政治先于个人，政治对于个人能力发展很重要，政府权力应该被用于追求公共的善(the common good)，而关键问题是统治者可以追求私人利益而不是公共利益，这使得统治者个人的品质成为重要议题。共和传统的合法性主要通过代议民主中的公共辩论(Public deliberation)和选举责任的机制来实现。自由传统起源于霍布斯，他将个人权利置于比政体更突出和重要的位置，国家存在的目的在于其是否保护个人权利。在必须有国家权威时，最好通过一致同意或者权力制衡来实现。

三、行动者中心制度主义的分析框架

在整合理性选择理论和制度主义理论的基础之上，沙普夫试图提出一个行动者中心制度主义分析框架来研究政策选择过程。在沙普夫看来，这一框架主要是对政策过程中互动事实的刻画，他认为：“在更一般层面，我们需要一个框架来描绘政策过程，这一政策过程是由个人和法团行动者(Corporate actors)互动所驱动，这些行动者有一定的能力、特定的认知和规范倾向，并且受到一定的制度环境和外部情景影响。”[2]37由于沙普夫主张将实证取向政策过程研究和规范取向政策过程研究有机结合，他对行动者中心制度主义的使命和目标有更多期望。关于建立分析框架的主要设想，沙普夫强调：“在行动者中心制度主义框架下，互动取向政策研究的主要使命是解释过去的政策选择，生产一些对发展政治可行的政策建议有用的系统知识，或者设计有利于公共利益取向政策形成和执行的制度。”[2]43这一论述是为了回应他对政策研究两大根本性问题的关注，即生产有效公共政策和政策过程自身的合法性，前者是面向问题解决，后者是面向问题解决的制度和程序。

由于这一框架试图将博弈论和制度主义有机结合，该框架非常关注制度设置(Institutional setting)，它强调制度设置对政策过程的影响。不过，与其他制度主义研究者将制度作为解释变量相比，行动者中心制度主义的分析框架更多的是将制度作为一种影响变量，制度通过对其他变量产生影响从而对政策过程发挥作用。沙普夫对此有非常明确的阐述，他认为：“在我们的框架中，制度设置的概念并不是理论界定意义上的一系列变量，通过这些变量的系统化和可操作化来作为经验研究中的解释因素。相反，我们使用制度作为缩写(Shorthand)来描述对那些驱动解释的因素有最重要影响的事项，这些用来解释政策过程的因素包括具有倾向和能力的行动者、行动者荟萃(actor constellations)和互动模式(modes of interaction)。”[2]39从博弈论语言看，制度不仅对可能的行动策略产生影响，而且还会建构博弈中的行动者并塑造他们的观点以及评价博弈结果。由此可见，行动者中心制度主义框架最核心的要素有五个，即制度设置、行动者、行动者荟萃、互动模式和政策，其中行动者、行动者荟萃和互动模式是主要解释变量，政策是被解释变量，制度是影响变量(见图1)。[2]44

图1 行动者中心制度主义分析框架

从图1可以看出，行动者、行动者荟萃、互动模式、制度设置嵌套在问题—政策之中，实现了政策过程与政策分析的有机统一。简而言之，政策分析中的问题建构与解决方案需要在政策过程中被认可、合法化和转化为政策，正是在这个意义上行动者中心制度主义挑战了问题解决的政策分析路径，提出了互动取向的政策研究路径。行者者是政策过程中的选择主体，他们拥有特别的能力、认识(Perceptions)和偏好(Preference)。行动者中心制度主义在借鉴博弈论来描述行动者的互动过程时，提出一个创新性想法，认为博弈过程不仅仅是在“非合作博弈”(noncooperative game)情景之下展开，也可能是在“合作博弈”(cooperative game)、“投票博弈”(voting game)、“等级博弈”(hierarchy game)等情景之下进行。

于是，行动者中心制度主义将博弈过程划分为两个环节，即行动者荟萃和互动模式，前者描述政策过程的主要参与者、策略选择、策略选择的结果、参与者对于结果的偏好，后者则阐述政策过程中的互动模式，这些不同参与者博弈的情景。对于互动模式，行动者中心制度主义提出了四种类型，即单边行动(Unilateral action)、谈判协议(negotiated agreement)、多数投票(majority vote)和等级命令(hierarchical direction)。对于制度设置，行动者中心制度主义提出了四种类型的制度，即无政府情景和最小制度(anarchic fields and minimal institution)，网络、政体和联合决策系统(networks, regimes, and joint-decision systems)，协会、选区和代表会议(associations, constituencies, and representative assemblies)，等级组织和国家(hierarchical organizations and the state)。行动者中心制度主义认为，互动模式可以发生在任何一种制度设置之下，当然有些互动可能在一些制度设置之下不可能发生，如等级命令的互动不可能在无政府状态之下产生，多数投票不可能在网络和联合决策中展开，这样就可以形成制度设置和互动模式的矩阵(见表1)[2]47。因此，行动者中心制度主义的主要解释逻辑是通过对制度设置的分析，以行动者荟萃和互动模式来理解政策选择逻辑。接下来，我们将对该框架的核心构成要素行动者、行动者荟萃和互动模式分别展开论述。

表1 互动模式

四、政策过程中的行动者

由于行动者中心制度主义遵循博弈论和理性选择的传统，但又希望考虑选择中的规范性因素，这使得其对于行动者假设试图兼容理性和规范性。为此，行动者中心制度主义最基本的假设是行动者行动具有目的性(Intentional action)，目的性成为思考行动的出发点。关于有目的行动与公共政策之间的关系，沙普夫指出：“相反，公共政策是在约束条件之下有目的行动的结果。很显然，目的性是主观现象。他们依赖于个人的认知和偏好。人们不是在客观现实的基础上行动，而是在他们所认知和所设想的现实因果关系运行逻辑的基础上行动。与此同时，人们不仅在客观需求基础上行动，而且也在反映他们主观利益、评价和规范信念(normative convictions)的基础上行动，这些规范信念涉及在一定的环境之下，怎样行动是正确的、好的和适宜的。换句话说，有目的性行动不能够在没有行动者有关行动的主观意义的参照之下而获得描述和解释”。[2]52

于是，有目的性的行动假设主要受到主流经济学和社会学的影响，理性和社会建构构成了行动假设的两种机制。行动者中心制度主义正是在整合这两种机制基础之上，建立了行动者行动的有限理性(Boundary rationality)和社会建构(Socially constructed)两种基本假设，这两种假设最终都是建立在演化论基础之上。理性构成了主流经济学、政治学和社会学的一端，持此论者强调个人基于理性计算来行动，这构成了理性行动者路径(rational-actor approach)。从演化论的角度看，理性的个体通过对环境的感知而获得正确的行为，这些行为会增加他们及其后代的生存概率。主流经济学继承了这一传统，论者用个人利益来假设个人行为并对市场均衡作出解释，一些政治学家也将理性传统用于政治分析。[13]社会建构成为了社会科学的另一端，由人类学家和社会学家所倡导，他们认为环境的复杂性和不确定性，需要通过“现实的社会建构”来实现认知统一，从而帮助人类克服挑战。对于这些学者而言，人类只有通过社会规范和制度塑造行为，才能够在自然竞争中生存下来。这两种假设尽管相互对立，但是任何一个单一的假设都不可能完整解释人类行为。一方面，人类学和社会学者所倡导的社会规范与制度解释，把人类仅仅看作是一种“规则遵守”的机器，这忽略了人类行动中的主体性和能动性。另一方面，经济学者所倡导的理性选择解释，把人类想象成为万能的计算器，随时随地在算计，这忽略了人类行动中的习惯和规则遵循。事实上，每一类假设都试图包容另一种假设，将另一种假设描述的行为作为特例，马奇在对决策理论的探讨中对此作了富有洞见的评论。[14]正是因为不满于这两种对立的观点，沙普夫在提出行动者假设时兼容理性和社会建构性，将有限理性和社会建构作为行动者中心制度主义中对行动者的核心假设。

行动者中心制度主义强调从行动者出发来解释和分析政策选择，这使得寻找行动者成为政策研究的第一步。与方法论个人主义强调只有个人是行动者相比，行动者中心制度主义扩展了行动者的概念，它既包含个体行动者(Individual actors)，又包含复合行动者(Composite actors)。其中，针对复合行动者，沙普夫认为需要进行两个层面的分析(two-level characters)，“从外部看，作为复合行动者，其拥有一定的资源和或多或少调动资源的能力来采取策略性行动；从内部看，作为一种制度结构，内部行动者通过互动来产生行动，并将这些行动归因于复合行动者”[2]52。一般而言，方法论个人主义只是将行动者限定在个体层面，而行动者中心制度主义提出超越个体行动者层面的复合行动者概念主要是基于西蒙的复杂性理论。[15]对于复合行动者作为解释变量，沙普夫指出：“事实上，行动者中心制度主义作为一种经验研究项目的可行性主要依赖于现实世界互动的‘复杂性的构造’(architecture of complexity)的关键假设，这一假设可以允许我们将更大单位确认为行动者，这些行动者的行为可以在更大单位层面中的影响因素来解释。”[2]57西蒙所谓的“复杂性的构造”，主要是强调复杂系统的两个特征，一个是可分解性，另一个是层次性。可分解性认为复杂系统可以由一系列子系统构造，层次性主张这些不同子系统之间按照层次性来组织关系，这两个特征使得对于更高层次的行为解释可以依据外部环境和影响因素来分析，而可以忽略不计其内部结构。这两种特征正是沙普夫所主张的超越个人行动者的复合行动者两层次分析。

对于复合行动者，沙普夫主要将其划分为三类，即行动者集合(actor aggregates)、集体行动者(Collective actors)和法团行动者(Corporate actors)。在这三类行动者中，沙普夫认为集体行动者和法团行动者对于政策过程的影响更大一些，这也是他重点关注的两类行动者。行动者集合是对人群中具有某类特点的子群体行动的描述，如“农民群体”“医生群体”“教师群体”等。它是对群体、阶层等集合概念的指称，被用来概念化大规模人群的选择，其解释逻辑是个人层面的偏好和情景信息，通常认为这些个体之间具有相似性，相似性导致“集合”行为。行动者集合的一致行为，主要是由从众效应(bandwagon effect)、阈效应(threshold effect)、反馈效应(Feedback effect)、自我调整(Autodynamic coordination)等机制促进，这使得即便个体行动者最初可能没有共同兴趣，也可以采取集合行动。对此，沙普夫指出：“由于大数量行动者的相似行动不仅依赖于他们初始特征的一致性，而且还会受到反馈机制的强化，自我动态协调会使得行动者行动与仅仅依赖独立个体的相似性而采取的单独性行为所达到效果相比，会有更高的一致性、持续性和具有活力的集合行动。”[2]54尽管如此，行动者集合仍然诉诸个体选择，但是这些行动并非个人选择的目的，而是个人选择的结果。

集体行动者和法团行动者是行动者中心制度主义的超越个体行动者的最重要复合行动者，他们之间最关键的区别在于前者仍然依赖于个体行动者的偏好，后者则拥有较强的自主性。对于集体行动者，沙普夫提出了两个维度的分析：第一个维度是关键性行动资源要么被个人所控制和掌握，要么被集体化和被集体行动者所控制；第二个维度是集体行动者在行为选择时，主要是依据个人偏好还是集体偏好，这样就可以形成联盟(Coalition)、运动(Movement)、俱乐部(Club)和协会(Association)等四种类型的集体行动者(见表2)。[2]55联盟是一种半永久性制度安排，它强调行动者追求单独而具有一定兼容性的目的，并且通过使用各自资源来达到战略行动的目标，例如APEC就是一种联盟。运动也需要依靠成员的自愿行动，但是与联盟相比，一方面其成员特别多，这使得通过自愿协调或投票很困难，另一方面成员之间对于共同目标具有价值承诺。俱乐部与联盟具有一些共同特征，但是它拥有集体化的行动资源来实现目的，其成员都是自愿参与俱乐部行为，成员需要为俱乐部贡献会费等资源，例如OECD组织就是采取俱乐部制。协会则包括两个维度的集体性内容，关键性行动资源被集体所有，选择主要是根据集体层面的目的来评估和决策，这种协会通常被称为“自下而上”的组织。

表2 集体行动者的类型

法团行动者是典型的“自下而下”的组织，它由“所有者”控制，或者是一个等级领导体系代表“所有者”来行动。在法团行动者的组织结构中，其成员与组织之间一般是雇佣关系，组织通常不会考虑其成员的利益和偏好，成员进入或退出组织的选择主要是一种契约关系。为此，法团行动者会追求自身的标识、目的和能力，这些一方面会使得法团行动者提升效率，另一方面也会导致法团行动者在社会中建立支配地位，使得个人的自由受到限制。对于行动者集合、集体行动者和法团行动者三者之间的异同，可以从行动、目的、资源和决策等几个维度总结(见表3)。[2]57

表3 行动者集合、集体行动者和法团行动者的总结

根据前面的行动者假设，复合行动者要具备策略行动的能力，也要在认知和评价方面具有与个体行动者类似的能力。对于复合行动者的认知维度而言，它主要是通过人际间信息处理和交流来实现；对于复合行动者的评价维度而言，它主要是强调偏好的整合性，即偏好能够实现跨时间、跨人际和跨部门的协调。于是，沙普夫指出：“我们能够得出如下结论：策略行动的能力一方面依赖于预先存在的复合行动者中成员间认识和偏好的一致性或不一致性，另一方面依赖于集体行动单位中处理冲突的能力。”[2]59对于政策研究而言，一个重要的挑战就是将个人行动者的行动与复合行动者的行动联系起来，这需要将个人行动与其角色建立联系，寻找行动单位的参照系(unit of reference)。对此，在政策研究中，就需要处理行动者的多重角色，寻找与其最匹配的位置。事实上，行动者角色的建构是一个制度创造事实的过程，它通过制度化来宣称行动者角色。[16]为了理解复合行动者的行为，就需要对其认知和偏好维度进行假设，前者会受到其理论和假设影响，后者则可以划分为利益、规范、认同和互动倾向等维度。[2]63

五、政策过程中的行动者荟萃

行动者荟萃是行动者中心制度主义的关键概念，它也是实质性政策分析和互动取向政策研究的汇合点。对此，沙普夫指出：“基本观点是被实质性政策研究针对给定政策问题的解决方案必须被多元政策行动者的互动过程所产生，这些行动者会有特定的能力，针对要取得的结果会有特定的认知和偏好。”[2]69行动者、行动者荟萃和互动模式构成了政策选择的三个解释变量，行动者荟萃是连接行动者和互动模式的核心。博弈论是行动者中心制度主义的理论基础，行动者荟萃借鉴了博弈论的概念，它强调不同行动者的偏好、策略和报酬。通过引入博弈论，行动者中心制度主义实现了对政策过程中“互动模式”的精确描述和刻画，这为解释、预测和规范奠定了基础。与博弈论只是对非合作博弈的研究相比，行动者中心制度主义通过区分行动者荟萃和互动模式，拓展了博弈论的分析内容，引入更多的互动模式，这使得模型与现实联系更加紧密。

实质性政策分析关注政策问题和解决方案，而互动政策过程研究将问题与解决嵌入到博弈过程中，从而为解决方案的选择提供了解释逻辑。因此，行动者中心制度主义非常关注政策问题本身，这也是图1分析框架的起点。对于政策问题，沙普夫通过引入科尔曼的论述，强调：“在最一般意义上，任何个人感觉值得或者不值得的事项都可以称之为政策问题，前提是这些问题朝向好的方向变化在原则上是可能的，但是又不可能仅仅依靠单个人来完成，这主要是其他人要么是产生问题的原因，要么是在解决问题上拥有资源。”[2]69当然，并不是任何政策问题都可能转化为公共政策，这主要是由决策者注意力分配有限性所决定。[17]9对于政策问题的类型，沙普夫通过引入人际互动的视角，将其划分为三类：协调问题(Problems of coordination)、外部性和集体物品问题(Externalities and collective-goods problems)和再分配问题(Redistribution problems)。协调问题产生于个体行动者需要与其他交换对象交换物品获取利益，或者需要与其他主体生产兼容产品，或者需要依靠通过合作来联合产生物品，最典型例子是在道路的左边或右边行走，只有所有人员协调一致才不会产生交通事故。外部性和集体物品问题产生于个人行动会对其他人产生负面或正面影响，通常这些影响不一定会被当事者所认知，最典型例子是空气污染、公地悲剧、教育、道路等。再分配问题产生于两种情景，一种是一项政策需要以一部分人付出代价为基础，如累进个人所得税是以对高收入者征收更多税来实现收入再分配，另一种是当前的收入和财产分配结果本身成为一项公共政策问题，如收入差距等收入不平等问题。尽管这些政策问题本身也可以通过博弈论模拟，但是在行动者中心制度主义框架中，政策问题是作为一个变量嵌入互动政策过程之中。

行动者荟萃是对博弈情景的描述，是一种行动情景逻辑(Logic of the situation)，它与行动者和互动模式一道构成了政策选择的三个核心解释变量。对于行动者荟萃，沙普夫给出了一个精确解释，他指出：“‘行动者荟萃’被用来再现我们所知道的一系列行动者，这些行动者涉入特定的政策互动，主要包括他们的能力(或者可以转化为策略)，他们的认知和对可能结果(或者报酬)的评价，以及他们的报酬之间是否兼容。”[2]72从这一段定义中，行动者荟萃与博弈论的三要素(参与者、策略和报酬)具有内在一致性。[18]1对于行动者荟萃，一般而言可以区分为纯粹冲突博弈(Pure conflict)和纯粹协调博弈(pure coordination)，前者意味着双方是零和博弈，后者意味着双方是共赢博弈。沙普夫提出，在将博弈论应用于政策研究中，可以使用一些“原型博弈荟萃”(archetypal game constellations)来描述政策场景中的博弈行为，他认为有四种比较常见的博弈，它们分别是保证博弈(Assurance game)、性别战博弈(Battle of sexes)、囚徒困境博弈(Prison’s Dilemma)和胆小鬼博弈(Chicken Game)。

保证博弈是一种协调博弈，它强调双方都采取合作行为会导致双方收益最大化，但是如果有一方选择背叛，则合作方损失较大，而双方都选择背叛时则是一种最坏的结果。性别战博弈也是一种协调博弈的类型，但是在收益方面存在分歧，其核心是男女双方谁的偏好得到满足，如果女方的偏好得到满足则其收益大，相反如果各自采取独立行动则收益受损。囚徒困境则是一种最典型的零和博弈，通常也是一种“社会陷阱”，每一方的“占优策略”是背叛，最后个体理性导致了集体不理性。该博弈通常被用来形容“公地悲剧”“集体行动问题”“公共物品生产与供给问题”等“社会困境”，所有这些困境都是个人采取理性行为导致了社会的次优结果。胆小鬼博弈用来描述针锋相对的两个行人谁先作出让步，双方可以通过合作改善彼此的境遇，但是每一方都有可能背叛对方而改善自身利益，如果双方都不做出让步，则有可能导致双方同归于尽，这也是国际关系中“威胁战略”的核心内容。所有这些博弈都有两个基本特征，一个是双方都希望避免最大化的冲突，另一个是双方的偏好具有对称性。

这四种博弈原型与现实有较大差距，这就需要有一些对现实的简化机制，使得复杂的现实能够与模型契合，从而可以利用博弈模型来解释政策选择。沙普夫提出了两种机制，即拆散机制(Decoupling)和聚合机制(Aggregation)。拆散机制意味着策略性互动中很多相互依赖事项可以被忽略或者被当作某种给定环境，这不会影响研究。聚合机制意味着可以将一些行动者组合成为复合行动者或集体行动者来减少复杂性，使得复杂性具有可分解性特征。联盟理论就是一种典型的聚合机制，它将很多行动者聚合成为两种或多种联盟，随后来分析联盟之间的互动。

沙普夫认为传统博弈论只从个体行动者的偏好和效用出发来分析，它认为行动者荟萃不仅需要考虑个体利益，还需要考虑对方利益作为自身的效用函数，这是互动取向(Interaction orientations)的问题，也是社会规范的起源。对于从互动的角度考虑偏好和效用，埃莉诺·奥斯特罗姆有同样的看法和观点，她认为博弈论需要引入社会规范、信息和社会资本的概念，这些社会效用的引入会改变博弈的策略和均衡状态。[19]这样，对于任何一个博弈，就可以形成两种“矩阵”，一种是“给定矩阵”(Given matrix)，它是博弈论描述的客观状态，另一种是“有效矩阵”(Effective matrix)，它是行动者在加上自身的主观偏好和价值之后形成的新报酬体系。对此，沙普夫用一个公式来描述：Ux=aX+bY,其中Ux是个人加入主观偏好的效用，X是自身效用，Y是对方效用，a和b是参数。这样，沙普夫认为决策者根据对不同a和b的赋值，可以形成5种决策规则，即个人主义(Individualism)、团结(Solidarity)、竞争(Competition)、利他主义(Altruism)和敌意(Hostility)(见表4)。[2]85-86个人主义是基层点，也是博弈论中讨论最多的理性行动者，个人只考虑自身利益。团结则是个人在博弈中，既考虑个人利益，又考虑他人利益，将双方利益最大化作为行动基础。竞争则强调“相对利益”，不仅考虑个人收益，还考虑个人相对于对方的收益差，强调差值最大化。利他主义则是另一种极端，它完全不考虑个人利益，只将他人利益作为自身利益。敌意则是将对方的不幸作为自身的偏好，对方受损失越大，自身收益越大。

表4 引入社会规范之后的决策规则

这些决策规则的引入，会改变原有博弈的报酬结果，形成新的行动者荟萃。以性别战博弈和囚徒困境博弈为例，引入团结和竞争的决策规则，就会形成个人主义、团结、竞争等三种状态的博弈结构(见表5)。[2]88图2的性别战博弈(个体主义)构成了基准博弈，它是没有引入团结和竞争之下的博弈状态，根据这种博弈状态，其纳什均衡应该是(3，4)或者(4，3)，关键取决于谁首先选择。一旦引入竞争规则，则意味着个体偏好会按照Ux=X-Y的规则重新构造，这意味着一个人的效用不仅受到其本身的效用影响，还会受到别人效用的影响，根据新的效用规则就会形成图2中的性别战博弈(竞争)状态，此时，新的纳什均衡将会是(0，0)，这对于社会而言并非一种最优状态。同样，如果引入团结规则，则意味着个体偏好会按照Ux=X+Y的规则重新构造，此时形成的纳什均衡会是(7，7)或者(7，7)两种状态，与个体主义的基准状态相比，每一方都会考虑对方的偏好，此时不存在竞争只存在合作，这使得共识更容易达成。从图2可以看出，通过引入互动偏好或者说社会偏好的概念，原有的博弈结构可能发生改变。在性别战博弈中，如果引入竞争的决策规则，就会改变原有的博弈均衡，使得双方各自选择自己所偏好的事项，从而使得双方收益最大化；而引入团结的决策规则，则不会改变原有的博弈均衡，不过它使得双方更可能通过协商来解决协调问题。在囚徒困境博弈中，如果引入竞争的决策规则，会加速双方都选择背叛的策略，而引入团结的决策规则，则会使得双方选择合作的策略。事实上，这也与现实情景中人类面临着囚徒困境时，当人们之间具有较强的社会资本时，他们更可能通过合作的方式来解决困境，这与理论模型的预测一致。正是通过引入社会规范和规则的概念，埃莉诺·奥斯特罗姆挑战了公共池塘资源中的国家逻辑和市场逻辑，提出了自主治理逻辑。[20]

表5 性别战博弈和囚徒困境博弈的决策规则转化(个人主义、竞争和团结)

(性别战博弈：个体主义)

(性别战博弈：竞争)

(性别战博弈：团结)

(囚徒困境博弈：个人主义)

(囚徒困境博弈：竞争)

(囚徒困境博弈：团结)

沙普夫在提出行动者中心制度主义时，非常重视合法性和规范性，强调政策研究不可能完全回避价值问题。尽管他试图通过互动博弈来解释政策选择的结果，但他仍然认为应该对互动的结果进行价值评价，从而为我们选择和设计不同的互动模式提供指引。于是，他提出了对于政策选择的结果进行评价的两个标准，一个标准是福利理论的维度(Welfare-theoretic dimension)，另一个标准是再分配正义的维度(distributive justice)。对于福利理论的维度，这是经济学家考虑的主要标准，他们先后使用过效用标准、帕累托标准、卡尔多标准、社会福利函数等来评价政策选择。再分配正义的标准是政治学家和伦理学家评价公共政策的主要标准，他们先后提出过公平(equity)、平等(Equality)和需求(Needs)等来评价政策选择。

六、政策过程中的互动模式

互动模式的提出是沙普夫对博弈论的扩展，也是行动者中心制度主义最具有创新性的内容。行动者中心制度主义被称为互动取向的政策研究，其重点是对行动者互动模式的概念化，并且强调博弈论中对非合作博弈的研究只是互动模式的一种类型。对此，沙普夫提出可以从结构维度(Structural dimension)和程序维度(Procedural dimension)出发，将互动模式嵌入到制度框架中，结构维度是对制度设置的关注，程序维度是对互动过程的关注，形成了研究政策过程中互动模式的概念性框架(见表1)。在沙普夫看来，互动模式可以区分四种比较纯粹和典型的类型，它们是单边行动、谈判协议、多数投票和等级命令，这些互动模式可以在不同制度情景之下展开。

(一)无政府领域和最低限度制度之下的单边行动

单边行动构成了博弈论分析问题的起点，是非合作博弈关注的核心问题，通常也被称为互动模式的“缺省状态”(Default mode)。单边行动意味着基本上不需要结构性设置，参与博弈的行动者可以从事他们任意可能的行为。对于这种状态，沙普夫称为“无政府领域”(Anarchic field)，他指出：“从某种意义上看，‘无政府领域’描述一种非结构，或者一种没有制度的情景，个体行动者能够在彼此之间缺乏预先关系或者特定义务的前提之下进行互动。他们可以在自己的能力范围内使用各种策略，而他们所受到的唯一限制是物理限制和其他行动者的制约。”[2]98即便在无政府领域下，行动者也会通过林德布洛姆和达尔所谓的相互调适(mutual adjustment)和哈耶克所谓的自发秩序来实现生态协调(ecological coordination)[21]4[22]5[23]9。国际社会中国与国之间的关系，类似于在无政府状态之下互动，尽管如此，国与国之间仍然会就很多问题达成协议和一致行动。国内所有的行动者之间互动不可能在无政府领域之下展开，它通常会受到某种最低限度制度约束(minimal institutions)。事实上，市场经济理论在讨论市场中行动者之间互动时，通常也预设了产权保护和法律制度等最低限度制度。

沙普夫指出，在无政府领域和最低限度制度的约束下，行动者之间既可以发生市场经济中自由交换的互动，还可以发生非合作博弈(non-cooperative game)、相互调适、否定性协调(negative coordination)等其他类型的互动。他指出，对于政策研究者而言，更加关注非合作博弈、相互调适和否定性协调，这些无政府领域中的互动模式为很多政策选择提供了解释性框架。例如，相互调适可以解释政策选择中的渐进主义逻辑，它会对现有政策存在“偏见”。[24]

1.非合作博弈和纳什均衡

非合作博弈是无政府领域中最常见的互动模式，不管行动者所面临的结构和模式是什么，他们最终都可以选择单边行动。于是，沙普夫指出：“在博弈论中，有一条最根本的准则：所有的互动形式都可以简化为某种类型的非合作博弈。”[2]99非合作博弈理论假设行动者在没有可能的联合协议之下行动，他们通常会追求自身的个人利益最大化，并且也会意识到他们的行动与其他行动者的行动会存在相互依赖关系，与此同时，他们也知道其他行动者的策略和报酬。这意味着，博弈参与者对双方的策略、预期结果和报酬都有完整的信息，完全信息、全面理性和共同预期构成了非合作博弈的基本假设。在这样的情景下，会形成一种所谓的“纳什均衡”，正如沙普夫所言：“博弈理论对社会科学唯一重要的贡献是‘纳什均衡’概念，它被用来界定个人行动策略荟萃，在这样的情景之下，没有参与者可以通过改变自身策略来提升他或她的福利。”[2]100事实上，表5中的四种典型博弈，会分别形成不同的“纳什均衡”，其结果以N表示。

沙普夫认为“纳什均衡”更多的是解释了结果的稳定性，而没有提供为什么和如何达到该结果的算法。正因为缺乏对过程的描述，当同时存在两个纳什均衡时，研究者不知道哪一个纳什均衡会被选择。例如，在性别战博弈中，就存在两个纳什均衡，男性和女性同看一部电影效用最大。于是，对于“纳什均衡”形成过程的考察，使得研究者关注“解决概念”(Solution concepts)。对于“解决概念”，博弈论研究者提出了“占优”“最大最小”“贝叶斯算法”等决策规则。“占优”决策规则强调选择两种策略时，行动者应该选择无论对方选择何种策略，都有一种策略比另一种策略存在优势的策略。在囚徒困境中，无论对方选择什么，一方选择背叛都是“占优”策略，这样“占优”策略导致了纳什均衡。“最大最小”决策规则强调博弈参与者会检验每一种策略的报酬，从而选择那种能够使得最低报酬最大化的策略。这种决策规则意味着博弈参与者是一种风险厌恶人士，他会避免最坏结果产生。“最大最小”决策规则有时候可能并不一定导致纳什均衡，如在性别战博弈中，该决策规则会导致次优结果产生。“贝叶斯算法”则是强调利用概率论来应对信息不完全时的博弈，从而计算最优策略。

尽管“纳什均衡”的概念在预测力方面有一定的局限，但是它提供一个对结果稳定性的评价标准。正如沙普夫指出：“无论一种结果是通过何种方式达到，如通过生态调整、谈判、投票或者等级命令等来实现，如果这些结果满足纳什均衡的条件，则该结果会更加稳定。”[2]106简而言之，纳什均衡更容易作为一种衡量结果稳定性或脆弱性的评价标准，而不是作为一种预测结果实现的工具。

2.相互调适

在无政府领域或最低限度制度下，非合作博弈并非唯一的互动方式，人与人之间会互动。事实上，非合作博弈有关博弈参与者的假设在很多情况下不成立，他们并非拥有完全理性，参与者在有限理性之下博弈，这使得博弈呈现“序贯博弈”(sequential games)的特征。有限理性强调参与者在假定别人策略不变的情况下至少知道自己的策略选择和结果，能够评估结果，参与者可以通过不断调整策略来改进自身状态。序贯博弈则是强调博弈参与者从一个给定的现状出发，在他们观察到潜在的利益时，就可以采取单边行动，这一单边行动可以一直持续下去。如果存在纳什均衡，博弈参与者可以通过不断调整自身策略达到理想状态。当政策过程中参与者在有限理性下按照序贯博弈互动时，沙普夫将这种互动过程称为“相互调适”的过程。

“相互调适”可以作为一种模型用来解释缺乏明确协议或联合决策情况之下稳定结果的达成。该模型认为只要对人的认知有某种最低程度的假设，就可以实现非合作博弈所强调的完全理性和认知能力所实现的结果，并且任何超过最低程度理性的假设也不会改变结果。“相互调适”提供了一种理解社会互动过程的较好模型，它是哈耶克自发秩序的生成过程，也可以解释技术和制度的“锁定”效应。当然，“相互调适”需要时间，人们在讨论社会经济技术快速变迁时，该模型是否会有作用？因此，沙普夫指出：“相互调适需要时间通过持续的作用与反作用来实现均衡结果。如果外部环境持续变化，即便达到了稳定结果，这一过程也不会停止。从这一点看，在所有其他条件不变的情况之下，所有形式的‘演化’或‘自我动态调整’的社会协调，以及哈耶克的自发秩序都会变得困难，这主要是由于社会、政治、经济、技术变迁加速。”[2]110此外，“相互调适”可能更适应纯粹协调的政策问题，而当政策问题以“社会陷阱”的方式呈现时，这一模型可能不一定具有吸引力。

3.最低限度制度下的否定性协调

否定性协调与其他两种协调相比，它强调需要有一定的结构性条件。这意味着，行动者互动不是在无政府领域展开，而是在最低限度制度的约束下进行。否定性协调要求行动者在选择其行动策略时，不要对其他行动者利益造成损害，它既可以以单边行动形式呈现，又可以以谈判协议形式实现。从某种程度上看，否定性协调与帕累托原则相一致，它强调任何一种改变现状的策略需要不给其他人的利益造成损害为前提。

(二)谈判协议

谈判协议是互动模式的第二种类型，也是对单边行动的补充。通常单边行动中的福利损失可以在合作博弈(cooperative games)中得到避免，这意味着在合作博弈中行动各方不仅要受到产权制度的保护，还需要遵循彼此通过谈判达成的协议。谈判协议是科斯定理的核心内容，其核心是在交易成本为零和存在补偿的情况之下，理性行动者的谈判会实现福利最大化。[25]谈判协议在能够提升福利的同时，也面临自身的“谈判困境”(Negotiators dilemma)，协议达成中的福利创造与福利分配存在冲突，这也导致任何谈判都是高成本的。因此，谈判协议的成功实现，在很大程度上取决于是否能够解决谈判者面临的问题。

1.谈判者必须解决的问题

对于任何谈判者试图满足科斯定理的要求实现福利最大化，就需要处理两个核心问题，即协议的达成(the problem of reaching agreement)和协议的执行(the problem of faithful implementation)。任何协议如果得不到执行，都会是一纸空文，这使得执行问题成为谈判者关注的重要话题。[26]一般而言，协议的执行根据是否需要协议签订者贡献力量可以分为两类：一类是协议签订者获取利益，只需要取决于对方的贡献，这类协议称为交换型协议(exchange)；另一类是协议签订者需要自身贡献力量才能够获得利益，这类协议称为联合生产型协议(Joint production)。对于交换型协议执行而言，双方会面临着囚徒困境难题，协议一方提供另一方产品或服务之后，对方可能面临着毁约的诱惑。对于联合生产型协议而言，它们通常是自我实现的协议，但是也面临着保证博弈的困境，一方如果贡献力量而对方不贡献力量，这会使得贡献力量一方的付出被浪费。

在解决完协议的执行问题之后，协议的达成成为谈判最重要的问题。事实上，谈判者在考虑协议的执行问题之后，也会在协议的谈判中审视这一问题。很显然，协议的达成成为各方共同关注的话题，协议的达成之所以具有吸引力，其关键在于通过协议可以改善双方的福利，这正是科斯定理的精髓所在。非合作博弈所达成的结果可以看作是缺省状态的基准结果，所有谈判都是对这种结果的改善，所有符合谈判情景的区域被称为“共同吸引区域”(zone of common attraction)。对于协议的达成，协议签订者通常面临着两个维度的问题，第一个维度涉及将双方共同福利最大化，这也被称为“生产维度”问题(the production dimension)；第二个维度涉及在给定福利情况之下如何在签订协议双方间分享，这也被称为“分配维度”问题(the distributive dimension)。

协议达成中面临的生产维度和分配维度问题，产生了“谈判者困境”。对此，沙普夫指出：“为了同时解决生产问题和分配问题，谈判各方会面临着另一种囚徒困境：成功地寻找更好更全面的解决方案要求创造性、有效沟通和共同信任，与此同时，在分配斗争中获胜则需要依靠策略性甚至机会主义沟通，隐藏信息，以及对潜在错误信息的不信任。”[2]124正是在这个意义上，沙普夫认为科斯定理可能忽略分配问题，使得经验意义上的福利最大化不可能实现。

2.四种类型的谈判

对于谈判协议互动类型，沙普夫认为可以从“谈判者困境”出发，结合不同谈判在生产维度和分配维度的显现程度不同，可以区分四种类型的谈判，即点契约(Spot Contract)、分配讨价还价(distributive Bargaining)、问题解决(Problem solving)和正向协调(positive coordination)(见表6)。[2]126。点契约是交易成本经济学中讨论的一种特殊契约，它强调无论是价值的生产或分配都不显著，交换的标的物被清晰界定，分配问题通过市场价格来解决，承诺和执行问题几乎同时进行。对于交易成本经济学而言，只有非常有限的标准化经济交易才适用于点契约。

表6 四种类型的谈判过程

分配讨价还价是对一种互动模式的描述，它强调项目本身的价值不需要考虑，唯一需要讨论的是分配问题，即谁应该从谈判协议产生的收益中获得多少份额。在分配博弈中，讨价还价会发生在三种情景中：(1)强制性谈判系统中的讨价还价(Bargaining in Compulsory Negotiation Systems)，每一方都会对项目拥有否决权，这使得项目要么需要双方共同贡献，要么每一方都有能力保护自身产权，讨价还价的结果是双方利益都得到满足；(2)自愿性谈判系统中的讨价还价(Bargaining in Voluntary Negotiation Systems)，每一方都可以单独行动，这使得如何分配收益或承担损失成为分配博弈的焦点问题；(3)通过议题连接或打包交易的讨价还价(Bargaining Through Issue Linkage or Package Deals)，这使得讨价还价通过“议题连接”“打包交易”或“互投赞成票”等方式来实现对否决者的补偿或支付。在政策过程中，“议题连接”的讨价还价通常会比较困难，这主要是由于很多政策领域都比较专业化，分别由不同主体参与博弈，这使得这种形式的讨价还价发挥作用需要有某种“高层次”的场域能够讨论一系列议题，跨领域的政策议题决策才可能为讨价还价提供可能性。

正如分配博弈主要关注成本和收益的分配，问题解决则主要关注价值创造。对于参与问题解决的行动者而言，他们最关心的问题是寻找好的解决方案使得福利最大化。沙普夫指出，问题解决的力量主要取决于联合行动的力量，通过联合行动而非单独行动会扩大行动空间，寻找问题解决的机会因此而增加。为了刻画联合行动所带来的行动空间扩大，沙普夫利用数量模型进行了定量描述，他指出：“一般而言，一个由N个成员组成的团体，每一个成员有S项政策，通过联合行动可以达到SN-1个结果，而每一个成员单独行动的话仅仅只有(S-1)*N个结果。”[2]131因此，在问题解决博弈中，所有行动者不仅需要探索自身的行动选择，还需要彼此正确沟通，以及开发这些行动的互动效应。这也使得行动者层面需要通过最大限度开放、充分交流和彼此信任来获取良好的解决方案。

正向协调意味着所有的行动者需要同时处理生产问题和分配问题，他们需要同时进行分配博弈和问题解决博弈。沙普夫创造“正向协调”这一词语主要是用来指称由首相创立的跨部际项目小组来处理跨领域政策问题，或者需要通过多个部门的政策工具来联合行动解决问题。沙普夫指出：“这些详细的安排被认为可以克服否定性协调和部际讨价还价中固有的现状偏见，通常这些部门只会发展反映他们责任和能力的工具，反对任何违反他们常规仪式的新想法。”[2]133对于正向协调而言，只有认识到生产问题和分配问题的同时存在及其合法性，才可能寻找同时解决这两个问题的方法。对此，沙普夫指出：“如果同时清晰处理生产和分配问题是正向协调成功的前提条件，如果分配博弈有可能会影响行动者之间联合学习，因此，对两种类型的互动进行程序性区分从理论上看是有用的。一方面，对分配维度的清晰关注可以发现分配公正的标准，这将为未来的互动提供指引。另一方面，如果关于成本和收益分配的单独协议事实上能够实现，那它将创造一个寻找共同解决方案的框架，这将与前面的问题解决状态相接近。”[2]134-135简而言之，通过对生产问题和分配问题的分层，可以使得方案探索与讨价还价同时并存，从而促使协议达成。

3.谈判的制度情景

行动者中心制度主义除了关注互动模式之外，另外一个重点是讨论制度设置和制度情景对政策过程的影响。谈判作为一种互动模式，可以发生在各种制度设置之下，但并不是所有的制度设置都可以解决“谈判者困境”。从表1看，谈判这种互动模式可以在无政府状态、网络、协会和组织四种制度情景下发挥作用。对于无政府状态而言，谈判协议只可能在没有执行问题的情况下存在，并且无论是“交易”还是“联合行动”都会受到较大制约。为此，沙普夫重点讨论了谈判在网络(network)、政体(regime)和联合决策系统(joint-decision systems)中的作用。

网络一词是政策过程中的一个重要概念，“政策网络”就是为了描述行动者为影响主要政策行动者而形成的一种资源和相互支持的半永久性网络。对于网络类型，沙普夫指出可以区分为两种形态网络，一种是退出成本比较低的网络，另一种是人们不得不处理彼此之间关系的网络。对于谈判协议而言，网络可以起到交易成本经济学家所讨论的节省交易成本的目的。对此，沙普夫指出：“在这里起作用的是：网络关系可以通过两种机制来减少机会主义行为，一种是更长的‘在未来阴影’(shadow of the future)之下作用的机制，另一种是对其他相关行动者而言交易的高可见性。”[2]137网络关系对于谈判协议而言，既可以作为一种社会资本来促进谈判，也可以作为一种权力和机会结构来约束谈判。谈判需要彼此信任才能够解决协议的达成和执行问题，网络关系可以促进社会资本的形成，从而使得参与网络的各方取得彼此的信任。

网络关系中的信任，根据马克·格兰诺维特的分类，可以划分为弱联系和弱信任、强联系和强信任。[27]弱信任意味着个人认为关于他人的个人选择和偏好是真的而不是误导的，只要环境不发生变化，承诺是值得信任的。强信任意味着个人期待他人不会选择一些策略性行为，通常这些策略性行为会对他自己产生影响，与此同时，个人也会有信心相信对方在即使损害其利益的情况下也会提供帮助。很显然，无论是弱信任，还是强信任，都会减少“谈判困境”中的问题和困难。不过，网络中信任的建立并非没有成本，要让别人信任自己，以及自己信任别人都需要投资。这些信任投资也会带来回报，一方面成员可以通过网络获得更多社会资源，有利增加社会资本，另一方面网络间成员信息的共享可以促进高质量的信息交流。

网络除了有利于社会资本形成外，还会生产机会结构和权力结构。机会结构强调网络中并不是每个人都会被平等对待，一些成员之间的网络联结会使得这些成员之间能够有更多联系。机会结构会导致权力结构，这些权力结构根据双方资源拥有情况以及相互之间关系可以区分为单方依赖、双方依赖、双方独立依赖。单方依赖意味着A和B是一种权力关系，A对B拥有权力是指B需要依赖A的资源才能够生存。双方依赖意味着A和B相互需要依靠对方资源而生存，哪一方都不能够离开另一方而单独生存。双独立依赖是指A和B之间存在相互依赖关系，但是A和B都可以从其他渠道获取资源。

与谈判网络作为一种非正式和自组织的结构相比，谈判政体(Negotiation regimes)是一种被创立的有目的的规范性框架，该框架成为谈判发生的场域，不同行动者代表各自立场，也遵循其他行动者立场，他们按照一定的互动程序追求实质性的目标。政府间协议就是一种谈判政体，人们通过签订正式协议来对一些系列政策问题达成共识形成规范。谈判结果并不取决于政体本身，而是取决于规则基础之上的互动，共同规则的遵守显得很重要。这也使得谈判政体要发挥作用，需要对规则违反者实施惩罚和避免搭便车行为，通常而言对于避免搭便车行为更难处理，这是“社会困境”的深层次原因。

联合决策系统是对一种行动者荟萃的描述，行动者要么因为物理原因，要么因为法律原因而不能够通过单独行动实现自身目的，此时联合行动需要各方的一致同意。这一系统可能发生在物理相连的区域，如流域治理，或者因为功能性相互依赖，如科学联合协作系统。它可以称为强制性谈判系统，本身是一种一致同意或共识性下的集体决策，这也是布坎南和图洛克研究公共选择理论的基础。联合决策行为由于需要花费较高的交易成本，联合决策有时成为“联合决策陷阱”(joint-decision trap)。联合决策陷阱可以通过议程控制，放松决策规定来实现，此时就是布坎南和图洛克所讨论的决策成本和外部成本的平衡问题。[28]6

(三)多数投票

随着谈判人数的增加，谈判成本也会随之上升，此时较大数量行动者的选择就可以通过多数投票规则或者等级命令来减少协调成本。多数投票规则作为一种集体遵守的决策(collectively binding)，它要求所有的行动者能够服从，即便他们不赞同决策结果，或者决策结果会损害他们自身利益。很显然，多数投票作为行动者互动的方式，是集体决策的生产过程，这使得其合法性和决策方式成为这种互动模式关注的两个重要问题。

1.集体遵守的决策和合法性

对于单边行动而言，纳什均衡会产生具有内在自我遵守的决策。与此同时，在谈判协议中，双方互动道理的“联合生产”也会自动实施，谈判中的“交易”现象也会因为重复博弈而得以自我实施。一旦互动模式采取多数投票和等级命令，决策的集体遵守成为一个重要的问题。要解决多数投票决策的执行问题，一个重要的方式是通过第三方的强制执行来解决，第三方通过实施惩罚或者给予报酬来达到促进决策被遵守。一般而言，实施否定性惩罚会比肯定性承诺更有利一些，否定性惩罚作为一种威胁并不一定要实施，只要行动者认识到惩罚的存在就会采取遵守规则行为，肯定性承诺则需要付诸实施才能产生信度。尽管如此，实施威胁的权力也会面临风险，其中最重要的是目标群体和行动者的心理反感以及由此导致的不服从和实质性抵抗。

为了避免威胁和惩罚所带来的抵抗行为，需要威胁和惩罚本身建立在规则基础之上，这些规则被社会所认可和具有合法性。这意味着威胁和惩罚要节省交易成本，必须将其建立在规则之上，明确领域、范围和限度，与此同时，还需要形成一种社会期望，行动者拥有道义来遵循集体决策，这与赛尔讨论的制度所拥有的道义性权利具有内在一致性。对于威胁和惩罚的合法性，沙普夫指出两种合法性的分类，即输入取向的合法性(Input-oriented legitimacy)和输出取向的合法性(output-oriented legitimacy)。对此，沙普夫指出：“输入取向论断最终通过那些被要求遵循规则的行动者获得合法性，而输出取向的合法性含义则是指向善政的实质性标准，其含义是实质性政策只有满足共同善和符合分配正义标准才能够声称具有合法性。”[2]153对于集体遵守的规则而言，输入取向的合法性重视民主程序，但是对于输出取向的合法性而言，民主程序只有工具价值，只有产生公共利益的政策才符合输出取向的合法性标准。很显然，对于一致同意规则而言，输入取向的合法性标准得以满足，这使得行动者能够遵循自己的决定。不过，对于多数投票决策而言，如何获得合法性？简而言之，如果追求个人利益在政治上具有合法性，为什么由个人利益促成的多数决策需要少数人来遵循？

2.通过多数投票决策

多数投票决策既然不能从输入合法性的角度得到证明，沙普夫则试图从输出取向的合法性角度阐述和论证。他认为，理性选择制度主义对多数投票决策的讨论主要是从自利性个人组成的多数出发分析，其中不可能避免具有内在局限性，相反，还应该从追求公共利益组成的多数出发思考多数投票决策，这使得协商民主(Deliberative democracy)成为与竞争性民主相对应的一种选项。此外，沙普夫指出，要解决多数投票决策面临的合法性难题，抗辩民主(Adversarial Democracy)也是一种替代性选择。

公共选择理论对于多数投票有一个基本假设，参与多数投票的个人，他们都会追求个人利益。在个人利益的假设之下，公共选择理论发现了“中间选民定理”，认为投票者会选择符合中间选民利益的政策，这一政策也会增加社会整体福利。[29]不过，多数投票面临的最大挑战是孔多塞-阿罗悖论，孔多塞最早发现“投票循环”现象，阿罗提出“不可能定理”，该悖论认为不可能将个人偏好按照多数投票规则聚合成为一致的社会福利函数，多数投票结果不具有稳定性，它一直处于循环中。[30]15当然，多数投票规则在行动者具有单峰偏好时，不一定会导致投票循环和结果不稳定。为了避免多数投票导致结果的不稳定性，一些研究者发现在一定制度前提条件之下，多数投票会形成稳定的均衡结果，这被谢普斯称为结构诱导下的均衡(Structure-induced equilibrium)[31]。对于制度性限制，主要包括议程控制、上议院和下议院一致同意制度和两党选举制度等，它们有利于稳定多数形成。

协商民主是一种解决多数投票悖论问题的思路，它强调如果将个人的利益区分为私人利益和公共利益，并且强调公民追求公共利益，则前面讨论的很多问题就会消失。协商民主有不同称呼，如对话民主(Discursive democracy)、反思民主(Reflexive democracy)等，其核心含义不是通过民主程序将个人利益聚合成为社会福利函数，而是通过集体身份(collective identity)的建构来发现有利于公共善的集体行动。因此，集体身份成为协商民主的前提条件，它主张存在或者创造一种集体身份从而实现集体利益的生成，并以此为基础取代个人利益，本质上是一种“我们-身份”(we-identities)的建构，其哲学基础是社会本体论(Social ontology)。[32]19这种“我们-身份”的建构需要寻找一些共同品质，如共同血缘、共同地域、语言、文化、宗教、历史等。在集体身份的建构基础之上，很多公共政策的辩论将会围绕共同利益和分配正义展开，而不是关注个人利益，并且可能通过哈贝马斯的共识形成科学逻辑来实现共同利益。

抗辩民主是寻找共识的另一个过程，它通过类似审判过程来解决问题。在法院的案件审理中，法官和审判员会在各方陈述和批判之下作出自己独立的判断。抗辩民主借鉴法官和审判模式，强调政党之间的争斗并不会导致共识形成，而是通过争斗本身来促使选民作出具有远见的判断。在追求公共利益取向的指引下，抗辩民主可以作为“公投”等直接民主的一种重要模式，该模式适用于政策讨论充分、政策选择简单和竞争性联盟形成的情景。但是，一旦情景更加复杂，涉及更多的政策议题、复杂的政策选项以及差异化的关注和需求时，抗辩民主并不一定能够实现预期目标。

(四)等级命令

在现代政治系统中，政策议题很少通过选举来决定，选举最多作为一种制度安排来约束等级政府权威。这意味着，很多具有集体约束性的决策是由等级政府权威来实现，等级命令成为政策过程中的第四种互动模式。为此，现代社会的一个重要议题是如何保证等级命令的合法性，正如沙普夫所言：“对于国家权威(state authority)合法而言，最重要的是积极行动者如何在政策过程中通过互动形成决策，以及这些互动是如何与公众涉入政治互动过程产生联系。”[2]171因此，对于作为互动模式的等级命令讨论，需要围绕两个话题展开，一是等级命令自身的运行过程，二是如何让等级命令具有合法性。

1.等级命令的特征和运行

等级命令作为一种互动模式，它强调个人能够决定其他人的选择，或者个人能够对其他人的决策前提产生影响。[33]8个人之所以对其他人产生影响，或者来源于个人的奖励和惩罚权力，或者来自个人的权威，这些权威有可能来自宗教信仰、个人魅力、传统和正式法律。等级命令创造一种能力来让其他人偏好服从组织目标，这为整个群体效用最大化提供了可能性，其核心是通过等级协调来提升福利。等级协调主要是通过惩罚和威胁让命令接受者认识到不按照规定行动时其所承担的代价要大于遵守规则的成本，不过，这种非对称性互动也会使得行动者产生策略性行动，沙普夫指出：“在缺乏强烈的内在化规范倾向之下，等级命令的实施会受到目标群体退出权的限制。”[2]173这使得等级命令要实现其预期目标，必须有较强的假设，其中最典型的假设是仁慈君主假设，它强调等级命令的发现者必须将权力应用于最大化福利和分配正义而不是个人私人利益。对于等级命令的有效性，公共选择理论从动机的角度和哈耶克从信息的角度进行了挑战。

这就不能不分析等级命令面临的信息问题。如果行动者的决策前提被更高级权威所界定，则意味着低层次行动者的个人偏好会被否决，并且其信息也会被忽略，这导致了等级命令面临着本地信息处理难题。对于本地信息处理难题，制度经济学中交易成本理论比较乐观，而委托代理理论比较悲观，认为委托者因为信息不对称而不能观察代理者的行为或者对其绩效作出客观评价。整体而言，制度经济学对信息处理呈现积极倾向，认为只要设计合理的制度就可以解决信息不对称难题。[34]而哈耶克经济学则强调地方知识和信息的极端重要性，认为不可能将这种信息转化为中央决策者的决策依据，即便能够传递给中央决策者，也不可能得到有效处理。[35]对于等级协调的信息可行性，取决于两个条件：一是更低层次的决策前提被高层次等级命令所取代的可能性；二是地方性信息的可变性和多样性，以及这些特征对于最优决策的意义。很显然，哈耶克认为地方知识不可能获得，地方决策的信息基础也不可能被等级命令取代，是否能够充分利用地方信息成为衡量制度优越性的标准。对于本地信息多样性的难题，交易成本理论主要是通过“选择性控制标准”来应对信息不足或者信息负担过重，即上级只能就有限问题给予关注并且下达命令，其他事项由下层来完成。由于复杂社会符合西蒙所谓的“可分解性”理，等级组织协调可以根据分层处理来解决各自问题实现纵向协调，使得很多相互依赖的问题在同一个组织单位内解决，组织单位之间按照等级协调。尽管如此，在实际政策过程中，等级协调仍然面临很多问题，在很多情况下需要通过“对话模型”取代等级命令来寻找最优公共政策，这就需要在“横向对话”和“纵向对话”上下功夫。

除了面临信息处理难题之外，它还强调行动者是“仁慈”君主，这使得激励问题成为等级协调的另一个重要问题。激励问题是委托代理理论关注的重要话题，它强调如何让自利的代理人能够按照委托人的目标行事，这就是所谓的“激励兼容机制”设计问题。公共部门的激励问题比市场领域更复杂，它不仅涉及选民和代表之间的委托代理，还涉及国会与政府之间的关系。在公共部门中，委托人对于代理人的控制，主要是通过“警察巡逻”(police patrol)和“火警预报”(fire alarm)，前者主要是委托人直接监督代理人，后者则是通过对受决策影响人的抱怨来监督。因此，控制和限制国家权力成为后霍布斯时代的主题，这也是规范和实证公共选择理论关注的核心内容。由于找不到很好的机制来处理委托人和代理人之间的关系，公共选择理论对于所有权威都持怀疑态度。不过，沙普夫指出，公共选择理论的核心假设是个人自私，他认为：“我们所说的偏好至少有三个维度，即个人和制度的个人利益，规范，以及个人和公司身份的考虑。”[2]偏好的多样性为制度设计提供了可能性，这意味着官员和政治家的行为如果是规范取向，对其限制会阻碍解决集体问题的能力，问题的关键是如何强化官员的规范取向倾向和避免机会主义行为，从而提升他们解决公共问题的能力。事实上，各个国家在不断实验中发展了一系列既控制公共权力滥用，又让行动者能够通过实施等级权威来保障公共利益和私人利益的制度安排，主要包括：专业领域的职业自我控制机制，如独立央行设置、独立管制委员会设置、独立的法院审判等；建立完善的法治体制，让公共权力的运行在规则约束之下，如法律规则建立、基本权利保护和独立司法完善、媒体监督等。

2.政治责任

政治责任需要建立统治者向被统治者负责的制度安排，除了选举机制外，最为重要的是政治与行政之间的关系，即如何让等级性行政权威向政治机构和民众负责。沙普夫指出，对于如何将选举行为转化为政策行动者激励，存在不同的制度安排，总体而言，至少有竞争型民主和合作型民主两种类型及其混和模式。

竞争型民主通常又被称为威斯敏斯特模型，主张执政党和反对党之间竞争可以有效控制等级政府权威。通常而言，投票者的控制能力在理想的两党制威斯敏斯特模型之下能够实现最大化，这一体制强调只有两个党，每一个获胜政党能够赢得所有权力，并且每一个政党也是按照高度集权化的体制运行，尽管执政党的领导者会追求一系列目标，有些目标是特定群体的利益，有些目标是政党意识形态，还有一些目标是私人利益。与此同时，反对党会对政府行为认真监视，并且随时将相关信息向媒体公开发布，从而试图获得对政府的控制权。简而言之，政府和反对党之间是一种非对称性的零和博弈，这使得政府在“预期反映思想”(doctrine of anticipated reactions)的强化之下通过追求公共利益来保证继续拥有权力。当然，威斯敏斯特模型的前提假设是存在“摇摆选民”追求公共利益的倾向，一旦存在多样性的子群体，并且不同群体有自己独立的身份认同时，追求公共利益的假设很难实现。

合作型民主则是另一种控制等级权威的方式，它主张通过科斯定理中的谈判逻辑来建立集体遵循规则的合法性。这种合作型民主主要以瑞士、奥地利和荷兰的实践为基础，强调主要政党通过组织联合政府来执政。合作型民主中的谈判主要是在各自政党的领导之间进行，最大的问题是多边讨价还价所带来的高交易成本和不可能通过机制来实现成本分配。合作型民主需要经过两阶段博弈，第一阶段是团体内部博弈形成政策主张，第二阶段是团体之间博弈形成有利各自团体的公共政策，这一两阶段博弈使得合作型民主实现输出性、合法性达到福利最大化和分配正义目标很困难。

事实上，现实中的政治体制是竞争性民主和合作型民主的混和模式，它强调政策过程中既包含竞争，也包含独立行动者之间的谈判。谈判的形式会以各种不同方式呈现，主要包括：党内谈判(Intraparty negotiations)，它强调即便在一个政党内部，也会存在对很多实质性政策选择的分歧，需要通过谈判来形成共识；联盟内谈判(Intracoalition negotiations)，它强调联合政府内部的政党之间也会存在分歧，这使得政党之间需要在面临反对者的同时来形成一致性政策；分治的政府(Divided government)，它强调不同政府机构同时对其支持者负责，例如美国的三权分立，此时就是一种“联合决策系统”，不同政府机构之间需要通过谈判来形成共识，这种情况有可能会使得政府效率受到损失。

七、迈向谈判国家：行动者中心制度主义对政策过程理论的贡献

在分析行动者中心制度主义构成要件之后，如何集成这些要素来讨论政策过程问题，成为检验理论有效性的关键。为此，沙普夫提出了一个问题的两个方面：如何解释政策成功？如何解释政策失败？他认为，尽管政策过程中可能存在单边行动、谈判协议、多数投票、等级命令等四种互动模式，但是这些互动模式发生在国家(State)这一制度场景中，“等级阴影”(the shadow of hierarchy)成为理解政策过程的重要概念。于是，沙普夫提出：“对于等级模式而言，它意味着需要将等级权威结构和等级命令的实际使用进行区分，后者的目的是直接改变其他行动者偏好。”[2]197在等级权威结构之下，既可以使用等级命令的互动模式，也可以使用谈判和单边行为互动模式。于是，国家阴影下的政策制定(Policymaking in the Shadow of the State)和谈判型国家(Negotiating State)是沙普夫对政策互动模式描述之后得出的结论，他认为这与实际政策过程更相符合。国家阴影下的政策制定突出政策发生的制度背景是等级权威结构，由于等级权威结构中注意力分配的有限性，所有的冲突和纠纷不可能都通过部长和总理来解决，这会使政策生产过程停滞。国家阴影下的政策制定对于国家在政策制定中的作用提出了较高要求，国家既可以不参与谈判，也可以直接参与谈判，这样形成了不同的政策制定模式。

当国家不参与谈判时，政策制定过程是在“等级阴影”下通过自我协调来实现。在实际中，政策议案的产生是通过等级谈判网络来实现，在这一网络中既有来自同一部委内部的部门，又有来自其他部委的部门，还有利益集团等外部行动者。在等级谈判中，政策行动者举行了一种“纵向对话”(Vertical dialogue)来解决冲突，正如沙普夫指出：“重要的是在横向自我协调的过程中每一个参与单元都会涉及某种‘纵向对话’，在这一对话中，首相或总理办公室的政治关注会‘向下’传递，而与此同时，与技术可行性和选择方案的适用性相关的议题会‘向上’沟通。”[2]198等级谈判所引发的“纵向对话”会使得不同行动者拥有一个政策方案选择的“空间域”，每一方都有可能诉诸更高层级的领导者来化解冲突，这种选择的压力会促使各方达到彼此满意的妥协方案。国家不参与谈判，也有可能促使行动者通过“自组织”来促进政策实施。在这样的情景下，国家通过对制度设施的管制来促进不同行动者出台能够自我遵守的规则和政策。所有这些问题的解决都会具备两个基本特征：一是被政策问题影响的利益相关者高度组织化，二是存在一种在有组织的利益相关者中间达成谈判协议来解决问题的可能性。

当国家参与谈判时，政策制定过程是政府与相关协会直接谈判达成共识，其目的是政府希望通过谈判促进协会自我管制，自我管制是一种法令管制的替代物。这意味着，当自我管制不发挥作用时，国家会通过法令管制对相关方直接实施惩罚，国家相当于行使一种“威胁”权力来促进协会与政府积极合作。这意味着自我管制的有效性取决于行动者对于政府是否有能力来出台和实施法令的认知，这种认知本身也会受到政府自身的制度结构和过往管制绩效的影响。当然，嵌套的谈判系统政策产生效果既取决于等级权威结构的有效性，又取决于自我管制能力的有效性，它是等级权威结构和自我组织相互促进的产物。由此可见，在不同类型的自我组织和谈判型国家中，有效政策生产不是通过标准的等级国家权力和多数投票来实现，而是通过不同行动者在自我组织的市民社会中产生。

谈判国家不仅在一国内部成为一种政策互动模式，而且正在成为国与国之间政策互动的主要方式。究其原因这既是由于民族国家在问题处理能力方面大大减弱，又是国与国之间相互依赖的必然结果。随着全球化时代的到来，人类通过贸易改善彼此境况，与此同时也面临着更多相互依赖的问题，如国际移民问题、国际犯罪问题、国际环境问题、国际气候变化问题、国际公共卫生问题等，这些问题都对国家治理能力构成了挑战。无论是经济效率的提升，还是国际问题的产生，都离不开国际行动者，都需要处理国家权威与这些行动者之间的关系，从本质上看是国家边界控制权的动态调整。让国际行动者拥有更多权力进入和退出不同国家时，此时国家对边界的控制权就会降低，反之，则国家的控制权会增大。例如，跨国公司资本拥有者促进资本在全球流动时，资本的选择权力更大，国家对边界的控制权会降低，国家恐怖主义增多会使国家加强边界控制，对进入一个国家境内的行动者作更多的审查。不同国家通过税收、金融、管制政策来竞争国际资本和跨国公司，同时避免承担更多的国际责任，这使得国际社会呈现典型的“囚徒困境”现象。

为了避免国际社会中的“零和博弈”，不同国家都希望通过超国家治理(Supranational governance)来应对全球治理难题。为此，很多国家都希望发展国际合作、国际政体、国际和超国际组织来解决国际社会中的治理难题，以适应经济、社会、环境互动范围超越一个国家活动领域的现实。然而，在缺乏超级权力的情形下，国际社会治理只能通过单边行动或谈判协议来实现，不可能通过多数投票或等级权威来治理，这使得国际治理体制的问题解决能力大大受到限制。由此可见，国际社会治理要取得有效性，还需要回到谈判国家范式，通过谈判政体和联合决策系统来应对治理挑战。尽管欧盟、联合国机制、国际组织等取得了一定成效，与理想蓝图相比还有较大空间，仍然需要通过发展谈判政体和联合决策系统来提升治理效能。

八、行动者中心制度主义理论的评价与展望

与其政策过程理论相比，行动者中心制度主义在政策过程理论中的影响并不大，并没有成为政策过程研究中的“主流”理论。究其原因，这既有可能是由于该理论使用博弈论作为分析框架，理论的接受程度受到一定影响，也与该理论并没有明确提出具体政策研究假设有关。事实上，行动者中心制度主义真正是一种“分析框架”，它提供了一种看待政策过程的视角，要得出具体研究结论则需要研究者将分析框架与具体情景相结合。

20多年过后，行动者中心制度主义仍然会有生命力吗？一般而言，理论的生命力可以在两种情景下体现，一种是理论发展脉络中讨论理论的价值，另一种是应用场景中讨论理论的价值。对于应用场景的讨论，我们将在下一部分详细阐述，提出其对理解中国政策过程的启示与借鉴。为此，我们首先从理论发展脉络中评价行动者中心制度主义理论，思考其优势和可能的局限性。

在讨论行动者中心制度主义的理论基础中，我们指出该理论主要以博弈论、制度理论和合法性理论为基础，其中博弈论和制度理论又是其最关键的两个基础理论，它试图将行动分析和制度分析有机统一。事实上，沙普夫整合行动者和制度，与吉登斯的结构二重性有内在紧密联系。对于结构二重性理论，吉登斯指出：“结构二重性原理是结构化理念的关键，前者的逻辑在上文中已有所体现。行动者和结构的两者构成过程并不是彼此独立的两个既定现象系列，即某种二元论，而是体现一种二重性。在结构二重性的观点来看，社会系统的结构性特征对于它们反复组织起来的实践来说，既是后者的中介，又是它的结果。相对个人而言，结构并不是什么‘外在之物’：从某种特定的意义上来说，结构作为记忆痕迹，具体体现在各种社会实践中，‘内在于’人的活动，而不像涂尔干所说的是‘外在’的。不应将结构等同于制约。相反，结构总是同时具有制约性与使动性。”[36]89-90简而言之，行动者的行动既维持结构, 又改变结构。吉登斯的结构二重性理论试图调和社会学中的结构主义与方法论个人主义之间的分歧，使得结构与行动在同一个框架之下展开。这一思想与沙普夫的行动者中心制度主义具有内在契合性，不过，两者之间也存在一定的差距。在沙普夫的行动者中心制度主义框架中，他将“结构”简化为“制度”，很显然吉登斯的结构定义更广泛，除了规则和制度之外，还包括资源。与此同时，沙普夫的制度概念是作为一种“情景”，它不是自变量，制度不是用来解释政策过程的结果。与其说沙普夫找回了结构，不如说沙普夫找到了一种联系“结构”与“行动”的中间变量，他将这种“中间变量”称为“互动模式”，这是其独特贡献。

事实上，国内学者认识到连接“结构”与“行动”的重要性，并且尝试开发与之相关的分析框架，并展开了一系列讨论，比较有代表性的理论包括“结构-制度分析范式”“过程-事件分析范式”“制度与生活”“结构-过程分析范式”“新结构政治学”等。谢立中评论了“结构-制度分析范式”和“过程-事件分析范式”两种研究，他指出张静所倡导的“结构-制度分析范式”和孙立平所倡导的“过程-事件分析范式”可以说代表了结构理论和行动理论的两种极端，前者强调社会现实可以从结构和制度的视角来解读，后者主张从人们的社会行动所形成的事件与过程之中去把握现实的社会结构与社会过程，他本人则认为从多元话语分析学者的立场来看,这两种研究策略都只不过是我们可以用来建构社会现实的两种不同的话语系统而已。[37]肖瑛针对结构分析的不足，提出了“制度与生活”视角，她认为“制度”指以国家名义制定并支撑国家各个层级和部门代理人行使其职能的正式制度，“生活”指社会人的日常活动，既包括各种权宜性生产的利益、权力和权利诉求与生活策略和技术，又指涉相对例行化的民情和习惯法。[38]于是，她通过引入“生活”，使得“制度”研究动态化，通过洞察制度实践中正式制度代理人与生活主体互动的复杂机制，可以解释中国正式制度变迁的实际逻辑和方向，并且更好地理解民情变动的机理。吴晓林所倡导的“结构-过程分析范式”则是推进结构分析与过程分析的整合，他指出过程负责“适应”或“打破”，结构负责“秩序”，结构侧重对过程的抽象，过程侧重解释结构的触发机制，过程与结构互相依赖，并尝试性提出了概念框架图。[39]新结构政治学作为一种新的分析框架，则代表了整合结构与行动的新尝试，这一学说认为系统、过程、动力与行动者是这一分析框架的四个要素，并以此为基础来理解治理和政策过程。[40]

应该说，这些新分析范式的不断提出，既代表了学者的理论自觉，也说明现实对理论提出了新要求。不过，这些不同分析范式最大特点仍然是其“思想性”和“观念性”，更多是一种倡导，离发展成为精细化的理论并成为具有指导意义的分析框架还有很长的路。从这个意义上看，与其试图在全新的基础上构造新的分析框架，还不如发展已经具备一定基础的分析框架，使之更完善，形成累积性发展。正是在这个意义上说，行动者中心制度主义分析框架有必要“再发现”和“再应用”，“再发现”是指结合现有理论对话来重新发展这一理论，“再应用”是指将其应用到新的政策过程和治理过程。我们认为，这两方面都会有广阔的前景。

九、行动者中心制度主义对于中国政策和治理研究的启示及借鉴

任何分析框架的建立，最终目的都是为了描述现实、解释事实、诊断问题和提出建议。分析框架的生命力在于其应用的广度和深度，在于依据该框架形成富有生命力的理论，更在于该框架多大程度上能够改善人类自身的福祉。中国的情景对于政策过程理论而言，至少可以发挥两个方面的作用：一是检验框架和理论的有效性，这是提升框架和理论外部效度的体现；二是对框架和理论进一步发展，形成基于中国情景的新认知，这是创新框架和理论的体现。在理论创新方面，既可以修正框架本身，如增加新的要素以使得框架和理论更具有解释力，也可以提出新的理论，如提出有待检验的新假设，这是对框架和理论更具有原创性的贡献。

由于沙普夫提出行动者中心制度主义时主要是基于博弈论、制度理论和合法性理论来构造一个关于互动过程的整合行动者和制度情景的政策研究框架，其框架中所包含的一般性要素是中国场景适应性的保证。我们认为，行动者中心制度主义不仅适用于中国政策过程，也适用于中国治理过程，在某种程度上它提供了一个整合政策和治理过程研究的统一框架。在分析框架的适用方面，又可以区分框架适用和要素适用，前者是指用整个框架来分析一个具体的政策案例，后者是用框架中的要素来分析政策案例，当然两者之间并非截然分开。为此，我们可以依据框架和理论的适用范围及层次，提出一个行动者中心制度主义廓清中国政策过程和治理过程的分类逻辑(见表7)。

表7 行动者中心制度主义的中国应用

行动者中心制度主义作为一个整体框架，可以应用于分析中国政策过程和治理过程，并以该框架为基础发展能够刻画中国特色的政策过程和互动过程的概念及理论。事实上，沙普夫本人就将该理论应用于欧盟治理的分析，讨论欧盟治理的合法性、有效性、多层次治理和互动模式。[41]8在沙普夫看来，欧盟治理主要呈现三种互动模式，即超国家等级模式(supranational hierarchy mode)、联合决策模式(joint-decision mode)和政府间关系模式(inter-government mode)，这些模式可能在回应治理的有效性和合法性方面都存在缺陷，他提出可以通过更多的合作和更加开放的协调来解决欧盟的治理难题。在中国的政策和治理过程中，我们如何将各级政府之间的互动模式、国家与社会之间的互动模式概念化，这是对中国学者的挑战。在沙普夫提出的单边行动、谈判协议、多数投票、等级命令等四种类型下，我们可以思考这四种类型在中国情景中的具体体现，也可以进一步思考中国还有哪些互动模式没有被这些模式所概括，这正是理论发展的前提和土壤。要对中国情景概念化，首先需要了解事实，从现实场景中观察互动模式并理论化，这样才可能形成具有中国特色的原创理论。事实上，中国学者已经在沙普夫所讨论的四种互动模式下展开了一系列的中国化探索。沙普夫所说的“单边行动”与中国的“锦标赛”模型具有内在一致性，它强调在财政分权的制度设置下各个地方政府的单独行动及其竞争可以解释中国的增长奇迹。[42]事实上，地方政府的自主创新和实验，都可以看作是“在等级阴影”之下的单边行动。谈判协议则发生在中国上级政府和下级政府之间以及下级政府之间，中国很多政策制定和执行都是上下级政府间讨价还价的过程，很多学者用上下谈判模型来加以刻画。[43]多数投票在中国场景之下则与民主集中、协商民主等联系在一起，它是一种聚集和形成民意的过程。等级命令在中国场景之下具有更广泛的适应性，围绕着中央与地方、国家与社会之间的等级关系形成了一系列理论模型，有代表性的包括控制权模型[44]、项目制模型[45]等。由此可见，行动者中心制度主义既可以作为一种发展理论的概念性工具，还可以作为一种整合理论和进行元理论分析的概念性工具。

行动者中心制度主义中的很多要素也可以应用于分析中国政策过程和治理过程，这样会加深对要素本身的理解和认知。以行动者中心制度主义的一个重要要素“联合决策模型”为例，它在互动过程中需要多方协调彼此策略以达成共识。沙普夫的主要贡献是提出联合决策作为一种重要的互动模式，这使得他在后期投入更多的时间和精力扩展该模型。[46]联合决策模型也得到其他研究者认可，很多学者将其用于欧盟的比较政策研究，并将相关论文编辑出版，这是该模型得到认可的重要体现。[47]3“联合决策模型”在中国场景具有很强的内在契合性，这一要素就可以在实证中得到更深入分析。例如，中国在横向政府部门之间需要通过联合决策来出台政策，甚至在中国纵向政府间也存在“联合决策”现象。沙普夫提出的国家阴影下的政策制定(Policymaking in the Shadow of the State)和谈判型国家(Negotiating State)的概念，也可以应用于中国场景分析。国家阴影下的政策制定突出政策发生的制度背景是等级权威结构，由于等级权威结构中注意力分配的有限性，不可能将所有的冲突和纠纷都通过部长和总理来解决，这样会使得政策生产过程停滞。国家阴影下的政策制定对于国家在政策制定中的作用提出了较高要求，国家既可以不参与谈判，也可以直接参与谈判，这样形成了不同的政策制定模式。

由此可见，行动者中心制度主义框架不仅作为一种理论具有很强的内在价值，并且作为一个框架也具有很好的应用前景。管理学者开始重新讨论制度理论中行动者和制度之间的关系，试图将制度和行动者有机结合，这正是行动者中心制度主义理论的核心内涵，遗憾的是管理学者似乎并没有对沙普夫的开创性贡献给予足够重视。[48]9可以预期，将行动者和制度有机结合将会是制度理论的未来前沿方向。中国政策过程和治理过程将会为该理论的应用、检验和拓展提供更广阔的空间，在这一过程中我们也会形成理论发展的自觉。