宋妍 晏鹰
摘要:针对博弈论制度分析在解释制度共时结构及演化路径多样性上的局限,尝试构建基于个体认知演化的制度分析框架。制度作为个体间共同认知的自我维系系统,其均衡和变迁路径受个体认知演化的影响;个体规则遵循和目标驱动的两类局部认知状态将导致个体间共同认知朝不同方向动态调整,从而解释特定时空条件下的制度均衡和制度演化。
关键词:认知;演化;制度分析
中图分类号:F011文献标识码:A文章编号:1004-0544(2012)08-0136-05
一、引言
经济活动的实质是对自然和社会范围内稀缺资源的获取和配置。在获取和配置资源的过程中,人类构建出各种形式的制度加诸经济活动之上。形成了蔚为壮观的经济社会现象。随着新制度经济学逐渐融入主流经济学(其领军人物先后获得诺贝尔奖),制度,这一一向被视为经济活动的约束条件的外生变量也开始内部化,成为决定经济绩效、解释经济演化的重要内生变量。然而,如何认识和理解制度的本质特征。并进而理解制度的均衡和演化现象,当下占据主流的博弈论制度分析并未取得共识。更为重要的是,基于博弈论的分析范式还存在着较强的局限性。因此,能否跳出博弈论制度分析的框架,选择一个更加适当的切入点对制度进行剖析是制度理论发展的一个新方向。
从系统论的角度看,制度是一个复杂的高维系统,包含成千上万个变量和参量,它们之间相互联系、相互作用,构成了一幅非线性的图像。要对这样多的变量和参量进行分析和计算,不仅在实际上行不通,而且其计算结果也难以检验,所以一个好的经济理论或模型通常是将实际的经济社会制度投影到一个恰当的子空间上去。这个子空间具有较低的维数,但反映了所讨论的制度问题的本质特征。近年来,从个体认知这一制度现象的子空间出发来探讨制度发育及演化的文献大量涌现,诺斯(North)等学者也承继哈耶克的理论思路,从信念、学习等角度重新诠释制度内涵。展现出制度分析新的发展方向。本文的立意即在于拓展这一方向的理论进路,以个体认知调整和共同知识演化为基点,讨论制度的发育、均衡及演化问题,以对相关理论上的争论作出回应。
二、几类典型的博弈制度观
由于博弈论分析工具的引入,近30年来,以个体策略互动为核心的博弈论制度分析取得了极大的进展。大量文献运用重复博弈理论和演化博弈理论对诸如声誉机制、交易制度、自组织体系等自发扩展制度进行建模分析,取得了一大批富有洞见的研究成果。归纳相关文献的理论脉络,博弈论制度分析分别将自发扩展制度看做是博弈的参与人、博弈规则和博弈过程中参与人的均衡策略。纳尔逊(Nelson)明确将自发扩展制度等同于博弈的特定参与人,他声称诸如“行业协会、技术协会、大学、法庭、政府机构、司法等等”都是经济社会制度的组成部分。这一观点与人们日常生活中对制度的看法相似,但问题在于,将制度等同于组织忽略了二者之间的重要差异,以致无法对自发扩展制度展开真正有效的分析。诺斯早期将制度定义为正式或非正式的博弈规则,认为,制度是“人类设计的制约人们相互行为的约束条件”。赫尔维茨(Hurwicz)对这一定义做了更为技术性的处理,从博弈的三要素(参与者、策略空间、支付函数)出发对制度的博弈规则观进行细化。这一定义抓住了自发扩展制度的表象,但仍未触及制度的本质内涵。容易理解,经济博弈中正式规则的确立必须先于博弈过程,而这立刻面临两个问题:谁有激励来制定博弈规则,而谁又有激励来监督规则的实施?因此,仅仅将制度视为博弈规则是无法对经济社会系统中大量的自发秩序作出有效解释的。第三种观点是将自发扩展制度视为博弈均衡。肖特是这一观点的始作俑者,随后诸多学者从两个方向拓展了制度的博弈均衡观。萨金(Sugden)、扬(Young)和鲍尔斯(Bowles)从演化博弈论的角度讨论制度的发育和变迁,他们认为,个体的行为习惯可以自我形成,不需要第三方实施或人为设计。当惯例演化时,个体在进化选择的压力下,倾向于发现某些适应性更强的特征(如认知、偏好、技能等)。这样,习俗惯例与个体特征将共同演化。格雷夫(Greif)、米尔格罗姆(Milgrom)、诺斯和温加斯特(Weingast)则从重复博弈论的角度来讨论制度,把制度看作是重复性囚徒困境博弈下的子博弈精炼均衡。作为子博弈精炼均衡的制度为每个博弈参与人界定了一种行为策略,该策略是在所有可能的博弈状态下行动决策的完备计划,简单地说,制度为个体提供了场景条件下的行动“脚本”。
演化博弈的制度观明显赞成制度乃自组织系统。但是它没有进一步说明该自组织系统得以建立及运作的根源,而是仅仅停留在对它的描述上。重复博弈的制度观假定个体具有完备的演绎推理能力。然而个体如何能够在多重均衡的情况下联合选择相互一致的策略?重复博弈又如何解释制度演化历时结构的多样性?正如青木所指出的,“子博弈精炼均衡理论根本无法解释某种制度出现在此地而非别的地方的原因”。因此,尽管博弈论制度分析接近一般均衡理论,但正是这一看似优点之处也是它在制度分析上的软肋。
如果把自发扩展的制度视为众多参与个体通过行为互动而达成的一个能够自我实施的激励相容的博弈均衡的话,那么关键的问题就是,参与人相互之间如何形成关于博弈的共同认知,并且参与人关于博弈的共同认知与其基于这些共同认知做出选择所导致的实际后果之间的一致性究竟是怎样建立的呢?若这种一致性被打破,制度的变迁方向和演化路径又将如何?这些问题乍看起来像是一个常规的系统均衡的稳定性问题,但其实这些问题比系统均衡的稳定性更为根本,不能简单对待。回答这些问题,将对制度的内涵本质、制度的路径依赖性及突变有更深入的理解,也将对传统的制度博弈均衡观做出重大修正。而这些需要提出一个新的切入点来解剖制度的内涵及其演化机制。
三、认知制度主义
沿着奥地利学派(Austfian school)注重个体行为选择的研究传统,无论是新古典还是新制度经济学的研究。当前都开始转向通过对个体认知和学习过程的考察来揭示制度的发育与演化过程,这一研究取向可称之为“认知制度主义”。认知制度主义认为,制度的发育和演化是人类知识积累和认知过程的一部分,制度变迁应该被理解为个体认知与系统环境的互动调整过程,即内隐的认知调整和外显的制度变迁具有某种程度上的同构性。以认知调整和信念学习的视角探讨制度的发育和演化将为理解制度系统的复杂性奠定经验基础。
在自发扩展秩序理论中,哈耶克强调认知作为制度的经验基础的重要性,奠定了认知制度主义的理论基础。在讨论知识在社会中的运用时哈耶克指出,“假如某人的大脑知道所有的事实(正如我们假设所有的事实对于作为观察者的经济学家来说都是给定的那样),就会有解决问题的唯一办法。即使我们能够证明这一点。也无法解决上述问题。相反,我们必须说明,一项解决问题的办法究竟是如何通过每个只拥有部分知识的人之间的互动而得以产生的”。哈氏讨论的“解决问题的办法”指的就是调规经济社会系统运行的种种制度设置,而这种制度设置恰恰是携带局部认知的个体通过交互作用而发育出来的。在比较制度分析文献中,青木昌彦尤其关注个体交往的信念和符号系统,认为制度是行动主体之间共享信念的概要表征。近期,抛开个体完全理性还是有限理性的问题,诺斯将个体学习过程运用于制度分析,提供了关于认知、信念系统和制度互相影响及其如何影响经济绩效的理论观察。诺斯认为,个体信念的演化过程是理解经济变迁基础的关键,经济系统演化在很大程度上就是被人们对自身行动结果的信念和认知所塑造的一个精细的过程(a deliberate process)。在这一见解的基础上,诺斯构筑了“现实——信念——制度——专门政策——产出(改变了的现实)”这一解释社会变迁过程的框架。马克斯·普朗克学会(Max Planck Institute)集体物品研究小组将制度理解为共享的心智模式或者是共享的针对重复发生的社会交往问题的处理方式(shared mental models or sharedsolutions to recurrent problems of social interaction),制度“被锚固”(anchored)在人类的心智中并与特定行为相对应。此外,新兴的行为经济学、实验经济学等理论也为深入理解认知行为和制度演化的关联提供深刻的洞见。
在认知制度主义看来,制度是个体间关于策略博弈如何进行的共同认知的自我维系系统。制度的本质是对均衡策略显著和固定特征的一种浓缩性表征。该表征被所有参与人所感知。这样,制度就以一种自我实施的方式制约着参与人的策略互动,并反过来被他们在连续变化环境下的认知不断再生出来。因此,从认知的角度来阐释制度是充分解释制度形成、演化和发挥作用的关键。可以从个体认知和共同认知的形成演化过程着手,构建一个基于认知的制度分析框架。
四、基于认知的制度均衡与演化分析框架
作为一个自组织系统,制度代表了重复参与博弈的当事人之间自我维系的基本预期(共同认知均衡)。从认知角度重塑制度分析框架,关键在于刻画个体间共同认知均衡的收敛过程。由于共同认知均衡是个体间认知试错与动态调整的结果,因此,首先需清楚单个体局部认知的形成和动态调整机制,在此基础上再考察单个体局部认知向多个体共同认知均衡的收敛过程,从而建立基于认知的制度分析框架。
(一)个体局部认知的形成
考察单个体局部认知的形成过程,需要了解个体在具体决策场景下如何启动自身携带的交往知识。归纳哈耶克关于个体经历与共同知识的研究,基于朱宪辰的个体知识分层、知识积累与演化理论。本文引入个体“认知一行为”的简化分析框架,以解释个体局部认知的形成和调整过程。
首先。将个体“认知一行为”模式简化为四个相互关联的部分:认知结构、信号加工、适应性学习和外界环境。
个体的知识结构好比是个体认知系统的存储器。其中存储了哈耶克所谓的“分立的个人知识”及个体间共同知识。这两类知识的核心构成了个体的认知传统。认知传统则决定于个体自身偏好和个体以往的经历,其中,个体偏好又依赖于个体资源存量和个体控制资源的能力、范围。在这里,认知被界定为个体对于一个信号和另一个信号(或事件)的联结。例如,“红灯停绿灯行”——个体在基本损益评价和学习能力的作用下形成联结(认知):红灯亮(绿灯亮)——危险(安全),当看到红灯亮(绿灯亮)时,具有此认知的个体表现出危险(安全)意识,进而采取相应行为,而没有此认知的个体就不会有这些反应。认知结构中充斥着这样的联结,同时,认知结构也对认知联结进行动态处理,即个体根据偏好、结合自身经历和拥有资源量的大小对这些联结进行损益分析,从而区别情况新增或淘汰联结。
外界环境(自然的、经济社会的、其他个体的行为)给予个体以信号刺激,信号加工部分对这些信号刺激进行处理。个体主动或被动接受环境信号后。对信号中包含的成本、收益及相关参照系的信息进行处理。并根据处理信号的方式和技术以及学习调整部分反馈回的信息指示,做出接受或屏蔽该信号的决策。若个体做出屏蔽的决策。则停止该过程;若接受这一信号,则将导入个体的知识结构部分。
认知系统将导入知识结构的信号与知识结构中的既存联结进行比对(这种比对是依据个体偏好、个体经历和个体所拥有的资源量的大小进行损益分析),首先产生对所面临的外部条件的判断:(1)个体认知结构中存在与当前所接受的环境信号较强的相关联结,便会启动固定预期或行为模式行为。这种固定的预期或行为模式可能是原有惯例或交往方式;(2)在个体认知结构中有关联结较弱,甚至不存在时,个体便会通过收集、加工信息,重新进行理性计算形成预期并付诸行动。上述第一种情况称为规则支配行为,第二种情况称为目标驱动行为。
1.当个体认知结构中存在与所接受环境信号较强的相关联结,采取规则支配行为:行动结果与行动前计划一致,则个体将保留强化原有的行为准则:行动结果与行动前计划不符,则个体将重新进行理性计算,调整或彻底改变预期,直至两者趋于一致,个体便接受经过调整的行为规则。
2.当个体认知结构中没有与所接受环境信号较强的相关联结,个体启动目标驱动行为:经过理性计算做出的预期与行动结果一致,个体将继续维护、积极遵循该行为规则;个体进行约束条件下的最大化计算做出的预期与行动结果不符,个体将继续搜寻新的信息。重新进行理性分析,不断地试错,直到各自预期与支付结果相一致,个体的行动准则也达到稳定。
采取规则支配或目标驱动行为,每得到一个支付结果,个体将在进行一次适应性调整之后把信息反馈到信号加工部分和知识结构部分,最终都将影响个体的资源存量,并影响个体的经历,从而促使个体调整偏好及认知结构。个体局部认知构成了多个体间共同认知的基础。
(二)个体间共同认知的形成——制度发育与演化
制度作为个体间共有信念的自我维系系统,本质上是个体间共同认知形成、演化的动态过程。在经济社会系统中,个体为应对环境不确定性而组织和协调集体行动。但这一任务显然不能依靠单一个体运用其局部知识独自完成,而需要多个体间的共同知识或共享信念来协调集体行动。制度能否形成、集体行动能否发起均取决于个体间的共同认知能否普遍建立并维持稳定。因此,共同认知的本质和共同认知的形成及动态调整是制度的认知基础最核心的问题。本文将共同认知视为个体针对其他个体面对场景信号时行为反应的共同预期而建立的信号间联结,可以对共同认知进行如下的形式化表征:
个体I发出行动ai,I对ai依个人知识中的意义mii联结将发生的事件11,记为ai——mij,(11)。mij,(11)表示11对I、J分别具有奖惩意义mi、mj。J接收的是ai的信号,依J个人知识中的意义mij联结将发生的事件12,记为ai——mij(12)。若mij(11)异于mij(12),则称个体I与J就ai没有关于将发生事件的共同知识;否则,将发生事件的奖惩意义相同,J的知识(联结ai→12)就等同于I的知识(联结ai→11),则称个体I与J就ai具有关于将发生事件的共同认知。
当信号出现时,个体间基于基本效用评价和学习能力,通过试错、观察和模仿等学习方式逐渐形成对该信号行为反应的共同预期。共同认知存储于社会的集体记忆里,分散在个体的知识体系中,在共同认知的协调下,个体之间便能在相同预期的基础上交往互动。
个体在与环境的互动中,其携带的局部认知在个体群的交往互动中得到调整提炼。从而形成共同认知。我们从两个体互动与多个体互动两个方面来简化共同认知的发生过程。
1.两个体间共同认知发生简化。将交往情境简化为两个体面对面互动场景。由于社会环境变迁,譬如市场交易机制替代行政控制经济,个体在经济交往中必然做出相应调整。此时,个体A对个体B发出行为信号Sa,个体B经评价反馈对信号Sa做出行为反应Sb。若sb与个体A的联结(Sa-Sb)预期不符,则A将依一定学习规则调整发出第二次行为信号Sa,于是Sa又将与个体B联结(Sa--Sb)的预期不符,再次引发个体B的调整行为S,b,……如此类推,经过长期的面对面试错、模仿,最后形成了对于信号Sa的共同行为反应预期。
2.三个体间共同认知发生简化。两个体间的互动行为及反应,对于其他个体又是一系列新信息,其他个体在评价反馈的作用下也通过预期试错、观察模仿对信号形成联结,如果该联结结果与前两个个体一致,即形成了三个个体的共同认知。由此类推到n个个体的共同认知。这种通过较长时间个体面对面交往形成的“共同认知”通常是个体“理性不及”的,扩散过程更多地通过个体潜移默化的“隐性学习”(implicit learning)进行,由此形成较稳定的共同“默会”知识。当个体群中绝大多数个体都采纳这一共同认知或固定预期时,在该个体群中一种制度便形成了,见图1。
但共同认知一经形成并非一成不变,而是在系统不确定性和个体认知不断演化的作用下持续(缓慢或者急剧)调整,打破个体之间对博弈规则及可能结果的共同预期。个体通过在行为反应层面的交流互动,发现新的联结(或信号)。再互相调整预期并作出行为反应,直到达致新的认知收敛状态,呈现出“共同认知均衡——系统不确定性、认知冲击及认知扰动——共同认知常规性落空、认知失衡—认知搜寻、试错——新的共同认知均衡”这样一个螺旋式波动调整的过程。因此,制度变迁应该被理解为个体信念系统与环境互动调整的过程,本质上是一个认知演化的过程,而认知演化的方向是促进信念系统所型构的制度框架能在怕累托意义上提高个体应对环境不确定性的效率。根据诺斯“信念系统调整——个体行为互动——制度局部发生”的分析思路,可以建构基于认知调整的制度演化框架,见表l。
如表1所示。既有制度以共有信念系统为内核存续下来,个体分享依场景启动的相同的策略集,现存制度以共有信念系统的概要表征来约束个体在经济社会场景下的行为选择。随着环境的演化(如政府政策变化、技术进步、法制完善、基层秩序自发扩展等),原有制度所设定的决策集合不能降低环境的不确定性(如计划经济条件下配给制的垂直型物品交易方式无法在市场经济条件下水平横向的交易环境中发挥作用),因而发生制度危机。在危机中,各种相互竞争的制度规则——由新的信念系统决定——为部分个体所运用试验,进而发生个体适应性学习、模仿新决策等认知调整现象。在认知的动态调整过程中,若个体的认知结构内存在与当前所接受的环境信号较强的相关联结,便会规则支配行为,可能是原有惯例或习俗;若在个体认知结构中有关联结较弱,甚至不存在时,便会启动目标驱动行为,重新进行理性计算形成预期并付诸行动。个体的认知调整导致各种变异性策略以一定的规模进行试验和竞争;并且各种策略均在“演化选择压力”下接受演化考验,随着某些决策在演化过程中逐渐上升至主导地位,并成为个体群内的共同认知,新的制度均衡开始形成。特殊地,在环境变化——制度的形成或变革中,原有制度(固有行为模式)就可能阻碍个体对新行为模式的选择(创新),或者个体自身依赖原有制度,当此类个体数量达到一定规模时,社会的演化力量被束缚。可能出现制度“锁入”(look in)或路径依赖(parth dependence)现象。
五、结论
近年来制度经济学的一个重要进展是,认知要素逐渐被纳入制度分析框架,成为制度变迁理论的重要构件。本文以近年发展起来的认知制度主义为理论基点,对个体局部知识及个体间共同知识的发生和调整过程进行简化,以期厘清制度的内在发育及演化机制。
作为个体间共同认知的自我维系系统,制度的发育及演化均以个体认知调整为转移。个体局部认知是个体基于自身的偏好及知识结构,在识别能力、行为能力和学习能力作用下,对外界环境给予个体的信号刺激进行处理形成的。根据个体的知识传统与场景信号之间的匹配联结程度,个体启动遵循规则一模仿归纳或目标驱动一理性计算的认知规则。这两种认知规则对制度均衡、演化都将产生重要影响。在形成局部认知的基础上,个体间经过长期面对面试错、模仿形成的针对环境信号的共同行为反应预期,即共同认知。当共同认知与集体行动一致时,制度便产生了。共同认知实际上与协调个体间互动行为的制度是同构的,而内隐的认知调整与外显的制度变迁也具有某种程度上的同构性。
在方法论上,以个体认知为切入点建构制度分析框架体现了制度研究方法正朝着经验检验的方向发展。在过去几十年中,认知学领域的研究大大拓展了人类对大脑、心智与行为之间关系的理解,通过对个体认知过程的分析来理解制度的发生、演化机制已经具备了跨学科的经验研究支撑。同时,在行为实验以及计算机仿真技术的支持下,有关认知学习的数理模型迅猛发展,也为在经验分析基础上考察制度发育与演化提供了可能。因此。在这两方面研究的支撑下,以认知为基点的制度分析便能够建立在可检验的经验根基上,认知制度主义在制度分析领域的发展前景是值得期待的。
责任编辑肖利