李盼道, 李双双
(德州学院 历史与社会管理学院,山东 德州 253023)
《皇帝的新装》是丹麦著名童话作家安徒生的代表作之一。整个故事以骗子建立的规则(任何愚蠢或不称职的人都看不见新衣)为主线,讲述了一个愚蠢的国王受两个骗子的愚弄,光着身子举行大典的滑稽闹剧。不少国内外学者从多个角度对这篇经典童话进行了研究,众多研究为人们全面、深入地理解这篇童话故事提供了有益参考。然而,其不足之处在于,截至目前尚未有一篇文章以《皇帝的新装》中上自国王下至百姓,几乎人人都选择违背良心而称赞新衣漂亮这一现象为线索,对“皇帝新装”困境中博弈均衡的诱导机制进行研究。基于此,笔者力图运用博弈论的基本分析范式,通过分析参与主体之间的博弈行为及均衡结果的达成,以阐释“皇帝新装”困境中博弈均衡的诱导机制,并提出打破该“说谎的均衡”的治理对策。
博弈论是一门研究相互影响着的局中人进行策略选择的行为科学[1]。根据博弈论的基本分析范式,从博弈的约束性条件出发,可以将“皇帝新装”困境中参与主体之间的博弈划分为三种类型:完全信息静态博弈、完全信息动态博弈、不完全信息动态博弈。笔者拟在不同类型的博弈状态下,借助不同的分析方法,探讨参与主体之间博弈行为及均衡结果的达成,阐释“皇帝新装”困境中博弈均衡的诱导机制。老大臣、官员、国王和群众之间的博弈分析方法如表1所示。
表1 “皇帝新装”困境中博弈均衡诱导机制的分析方法
本部分中,笔者基于完全信息静态博弈、完全信息动态博弈与不完全信息动态博弈三种博弈类型,采用不同的分析方法,对“诚实”的老大臣与官员之间、国王与文武百官和群众之间以及群众之间的博弈行为及均衡结果的达成进行分析,以阐释“皇帝新装”困境中博弈均衡的诱导机制。
完全信息静态博弈是指参与主体同时决策,且所有参与者对博弈中各种情况下的策略及收益都完全了解。但这里要求的“同时”并不意味着参与主体要在同一时刻一起行动,即使行动有先后顺序,但只要保证每一位参与者在行动时并不知道其他参与者的行动,其效果仍等价于他们在同时行动[2]。本部分中,笔者通过建立博弈树以及采用重复剔除严格劣战略、有限次与无限次重复博弈等方法,对“诚实”的老大臣和官员之间的博弈行为及均衡结果的达成进行分析。
1. 基于博弈树的老大臣与官员间的博弈及Nash均衡的达成
在行动之前,国王先后派出两位大臣前去骗子那里了解新衣制作的情况,他们分别是“诚实”的老大臣(用字母A表示)和“诚实”的官员(用字母B表示)。游戏开始时,参与者A和B依次行动,且满足参与者B行动时并不清楚参与者A的行动,然后依据两位参与者策略选择的特定组合决定每一位参与者的博弈结果(收益或损失)。建立如图1所示的博弈树对上述博弈问题进行描述。
图1 老大臣与官员的博弈树
由图1可知,每一位参与者均有两种可供选择的战略:说真话、说假话。在一组特定的战略组合被选定后,两人的收益均由图1所示的博弈树中列举的相关字母来表示。需要说明的是,图例中参与者A的收益放在两个字母的最前面,参与者B的收益置于其后。在排除其他因素干扰的情况下,图1中a、b、c、d的大小关系决定了参与者显示何种偏好。现在分析以下几种情况:
(1) 当d>b、d>c、a>b、a>c时,若参与者A选择说假话,参与者B也选择说假话;若参与者A选择说真话,参与者B则选择说假话。此时该博弈存在唯一一个Nash均衡,即(说假话,说假话)。
(2) 当d>b、d>c、a>b、a (3) 当d>b、d>c、a (4) 当dc、a (5) 当dc、a>b、a>c时,若参与者A选择说假话,参与者B也选择说假话;若参与者A选择说真话,参与者B也选择说真话。此时该博弈存在两个Nash均衡,即(说假话,说假话)与(说真话,说真话)。 (6) 当db、a>c时,若参与者A选择说假话,参与者B也选择说假话;若参与者A选择说真话,参与者B也选择说真话。此时该博弈存在两个Nash均衡,即(说假话,说假话)与(说真话,说真话)。 (7) 当dc、ac时,若参与者A选择说假话,参与者B也选择说假话;若参与者A选择说真话,参与者B也选择说真话。此时该博弈存在两个Nash均衡,即(说假话,说假话)与(说真话,说真话)。 (8) 当db、a (9) 当dc时,若参与者A选择说假话,参与者B也选择说假话;若参与者A选择说真话,参与者B也选择说真话。此时该博弈存在两个Nash均衡,即(说假话,说假话)与(说真话,说真话)。 (10) 当d>b、d (11) 当d>b、d (12) 当d>b、d (13) 当d 由此可见,在排除其他因素干扰的情况下,a、b、c、d的大小关系(即参与者的效用)决定了博弈的结果。而在“皇帝新装”困境中,所有的参与者都是在骗子建立的规则(看见新衣意味着称职或聪明,看不见新衣意味着不称职或愚蠢)下进行博弈的,这意味着参与者选择说假话给自己带来的效用总要大于选择说真话,即a、b、c、d的大小关系满足:a>b、d>c、a>c、d>b。通过上述分析不难知道,当a>b、d>c、a>c、d>b时,该博弈存在唯一一个Nash均衡,即(说假话,说假话)。结果也就出现了“诚实”的老大臣与官员都选择说假话的现象。 2. 基于重复剔除严格劣战略的老大臣与官员间的博弈及Nash均衡的达成 基于理性人不会选择严格劣战略这一基本决策的原则,我们可以运用“重复剔除严格劣战略”的方法进一步求证(说假话,说假话)就是此博弈唯一的Nash均衡。 图2 老大臣与官员博弈的双变量矩阵 由图2可知,参与者A和B均有两种可供选择的战略:说真话、说假话。假定参与者A是理性的,他就可以把“说真话”从参与者B的战略空间中剔除,即将图2所示博弈视同图3所示博弈。 在图3中,对于参与者A来讲,“说真话”相对于“说假话”来说依然是严格劣战略。因此,假定参与者A是理性的,他是不会选择说真话的。那么,如果参与者B知道参与者A是理性的,并且参与者B知道参与者A知道参与者B是理性的,参与者B就可以把“说真话”从参与者A的战略空间中剔除,即将图3所示博弈视同图4所示博弈。 图3 老大臣与官员博弈的双变量矩阵 图4 老大臣与官员博弈的双变量矩阵 由图4可知,(说假话,说假话)就是此博弈唯一一个Nash均衡,结果也就出现了“皇帝新装”困境中“诚实”的老大臣与官员都显示虚假偏好的现象。 3. 基于有限次与无限次重复博弈的老大臣与官员间的博弈 有限重复博弈就是阶段博弈重复实施有限次[3]。先不妨令T=2,考虑如图5所示的“诚实”的老大臣与官员间的博弈。 图5 老大臣与官员博弈的双变量矩阵 通过上文分析可知,在骗子建立的规则下,a、b、c、d的大小关系满足:a>b、d>c、a>c、d>b,此时老大臣与官员的博弈存在唯一一个Nash均衡解(说假话,说假话)。假定将该博弈实施两次,两阶段重复博弈中每一位参与者的效用等价于第一阶段的效用加上δ倍的第二阶段的效用(考虑到第二阶段可能存在折扣因子δ)。借助后退归纳法,显然第二阶段博弈的唯一Nash均衡仍为(说假话,说假话),效用向量是(a,a)。因此,如果该博弈存在子博弈完美均衡解,其第二阶段博弈的结果必定是(说假话,说假话),所得效用的现实值为(aδ,aδ)。无论子博弈完美中第一阶段博弈的结果如何,该结果的效用向量加上(aδ,aδ)就是参与者的子博弈完美均衡效用。因此,可以在图5的效用矩阵的各个结局中加上(aδ,aδ),得到如图6所示的新效用矩阵。 图6 参与者的子博弈完美均衡效用 图6中的博弈也有四种结局,而每个任意结局(m,n)对应了两个阶段重复博弈的行动系列中的一个行动:{(m,n),(说假话,说假话)},相应于图6中(m,n)的效用向量就是参与者在第二阶段博弈中的所得。累次取优法表明(说假话,说假话)是唯一的Nash均衡,因此也就得到了唯一的子博弈完美Nash均衡:{(说假话,说假话),(说假话,说假话)}。 两阶段重复博弈的上述结论很容易推广到任意有限次重复博弈,其效用矩阵相当于把重复博弈的效用矩阵中各元素扩大到(a+aδ+aδ2+……+aδT)倍。而最新一次的博弈,其Nash均衡仍为(说假话,说假话)。这也就说明T阶段重复博弈有唯一的子博弈完美Nash均衡:{(说假话,说假话),……,(说假话,说假话)}。 假设将这场博弈无限次地重复,(说假话、说假话)仍然是子博弈完美均衡。因为在每一次博弈中,在给定对手已取得均衡策略的条件下,没有任何一位参与者会主动偏离均衡策略。或许人们会认为,在无限水平博弈中,前一阶段的博弈结果会影响到后面阶段的选择,而这里的子博弈完美Nash均衡的确是唯一一个具有这样性质的均衡:每一阶段的行动并不会随着以前阶段所采取行动的变化而变化。 总之,通过以上对完全信息静态博弈状态下“诚实”的老大臣与官员的博弈行为及所产生的均衡结果的分析,笔者认为在排除其他因素干扰的情况下,参与者的效用决定了其究竟显示何种偏好。换言之,“皇帝新装”困境中诱使博弈群体显示其虚假偏好的诱导机制是博弈效用中的参数。 完全信息动态博弈是指博弈中信息是完全的,但是行动有先后顺序,后行动的参与者可以观察到先行动的参与者的所有信息[4-5]。本部分中,笔者通过建立博弈树,对国王与文武百官和群众之间的博弈行为及均衡结果的达成进行分析。以国王与文武百官之间的博弈为例。 当国王带着一帮特别圈定的文武百官亲自到两个狡猾的骗子那里了解新衣的制作情况时,此时国王与文武百官之间将进行一场博弈。需要说明的是,国王与文武百官之间的行动是有先后顺序的,即国王(用1表示)首先行动,文武百官(用2表示)先观察国王的行动,然后再行动,以此类推,直至博弈结束。建立如图7所示的博弈树,对上述博弈问题进行描述。 图7 国王与文武百官之间的博弈树 由图7可知,国王有两个纯策略,S1={(说真话),(说假话)};文武百官有4个纯策略,S2={(说真话,说真话),(说真话,说假话),(说假话,说真话),(说假话,说真话)}。依据国王与文武百官的纯策略构成纯策略剖面如下: (1) {说真话,(说真话,说真话)},路径为(1,2(说真话),(b、b))。属于文武百官的信息集有“说真话”与“说假话”2个,此处分别将它们记作2(说真话)与2(说假话),节点结以收益向量表示,指出该剖面的各参与者的收益,下同。 (2) {说真话,(说真话,说假话)},路径为{1,2(说真话),(b、b)}。 (3) {说真话,(说假话、说真话)},路径为{1,2(说假话),(c,d)}。 (4) {说真话,(说假话,说假话)},路径为{1,2(说假话),(c,d)}。 (5) {说假话,(说真话,说真话)},路径为{1,2(说真话),(d,c)}。 (6) {说假话,(说真话,说假话)},路径为{1,2(说假话),(d,c)}。 (7) {说假话,(说假话,说真话)},路径为{1,2(说真话),(a,a)}。 (8) {说假话,(说假话,说假话)},路径为{1,2(说假话),(a,a)}。 从上述罗列的情况中能够发现,不同的纯策略剖面可以有相同的路径和结局,例如(1)与(2)、(5)与(7)等。上述8种情况可列成如图8所示的盈利矩阵。 图8 国王与文武百官之间的博弈 不难发现,图8相当于图7展开型博弈的策略型表示。图8蕴含着国王与文武百官在行动之前都会预先作出一个全面的应急计划之意。例如,(说假话,说假话)可能就是文武百官考虑到国王“说假话”或“说真话”时他的一个反应,再加上(说真话,说真话)、(说真话,说假话)、(说假话,说真话),则使整场博弈中每一种应该考虑的可能情况全部被列入计划。而本质上,同样的博弈表示成图7那种展开形式,文武百官在决定自己究竟选择“说假话”与“说真话”两个行动中的哪一个时,要等到信息集h2(即参与者2在选择行动前,他所了解的有关国王的行动)已获得,然后依据h2=“说真话”还是h2=“说假话”再作出相应决策。对于国王来讲,在骗子建立的规则下,考虑到a、b、c、d的大小关系满足:a>b、d>c、a>c、d 总之,通过以上对完全信息动态博弈状态下国王与文武百官之间的博弈行为及其所产生的均衡结果的分析,笔者认为,“皇帝新装”困境中诱使博弈群体显示其虚假偏好的诱导机制是博弈效用中的参数。 不完全信息动态博弈是指博弈中的每一个参与者都知道其他参与者有哪几种类型以及各种类型出现的概率,即知道“自然”参与者的不同类型与相应选择之间的关系[6-7],但参与者并不知道其他参与者具体属于哪一种类型[8-9]。本部分中,笔者借助信号博弈的方法对群众之间的博弈行为及均衡结果的达成进行分析。 信号博弈是两个参与者之间的非完全信息动态博弈[10]:信号发送者(S)和信号接收者(R)。博弈时序规定如下: 1. 自然按照概率分布p(ti)为发送者S从一个可行类型空间T={t1,t2}中选取类型ti(新衣不存在),其中p(ti)≥0对每一个i都成立,且p(t1)+p(t2)=1。 2. 发送者S观察到ti(新衣不存在)后,从一个可行信号集M={m1(国王的新衣真漂亮),m2(国王没有穿新衣)}中选取一个信号mj。 3. 接收者R观察到mj,然后从可行行动集A={a1(说真话),a2(说假话)}中选取行动ak。 4. 发送者S与接收者R的盈利函数分别为US=(ti,mj,ak)。 图9 群众之间的信号博弈 在该信号博弈中,N表示自然,T={t1,t2},M={m1,m2},A={a1,a2},[p]与[1-p]表示自然选择类型时的概率分布。在骗子建立的规则下,a、b、c、d的大小关系满足a>b、d>c、a>c、d>b,e、f、g、h的大小关系满足e>f、h>g、e>g、h>f,并且a>f、a>g、d>g,e>b、e>c、h>b、h>c。 图9中发送者S的纯策略: S(1)若自然抽取t1,则取m1(国王的新衣真漂亮);若自然抽取t2,仍取m1(国王的新衣真漂亮)。 S(2)若自然抽取t1,则取m1(国王的新衣真漂亮);若自然抽取t2,则取m2(国王没有穿新衣)。 S(3)若自然抽取t1,则取m2(国王没有穿新衣);若自然抽取t2,则取m1(国王的新衣真漂亮)。 S(4)若自然抽取t1,则取m2(国王没有穿新衣);若自然抽取t2,仍取m2(国王没有穿新衣)。 接收者R的纯策略: R(1)若S发出m1(国王的新衣真漂亮),则取a1(说真话);若S发出m2(国王没有穿新衣),仍取a1(说真话)。 R(2)若S发出m1(国王的新衣真漂亮),则取a1(说真话);若S发出m1(国王没有穿新衣),则取a2(说假话)。 R(3)若S发出m1(国王的新衣真漂亮),则取a2(说假话);若S发出m2(国王没有穿新衣),则取a2(说真话)。 R(4)若S发出m1(国王的新衣真漂亮),则取a2(说假话);若S发出m2(国王没有穿新衣),仍取a2(说假话)。 现在从发送者S的四个纯策略出发,分别分析该信号博弈完美Bayes均衡。 第一,共用m1。 第二,共用m2。 第三,分离:类型t1发出信号m1,类型t2发出信号m2。 假设发送者S的纯策略是(m1,m2),那么接受者R的两个信息集都在均衡路径上,因此两个信念均可由Bayes法则与发送者S的策略确定。例如对p而言: p=u(t1|m1)=p(t1)/p(t1)=1;同理可得: 1-q=u(t2|m2)=p(t2)/p(t2)=1,即q=0。在给定信念p=1的情况下,接受者R的最优反应是a2;而在给定信念q=0的情况下,接受者R的最优反应仍是a2。此时,属于类型t1与t2的发送者S获得的效用分别为a与g。在给定接受者R策略(a1,a2)下,发送者S的纯策略(m1,m2)是否最优?根据图9可知,属于类型t2的发送者S如果偏离这个策略,不取信号m2而取信号m1,此时由于接受者R的反应为a2,而使得类型t2的发送者S获得效用e。这要优于他取信号m2获得的效用g。因此,在给定接受者R策略(a2,a2)下,发送者S有可能会主动偏离(m1、m2)这一策略,故发送者S的纯策略(m1,m2)不可能是均衡策略。 第四,分离:类型t1发出信号m2,类型t2发出信号m1。 假设发送者S的纯策略为(m2,m1),如(3)所示,则可以确定接受者R的两个信念:p=0与q=1。在给定p=0与q=1这两个信念的情况下,接受者R的最优反应是(a2,a2),从而属于类型t1与t2的发送者S获得的效用分别为c与e。在给定接受者R策略(a2、a2)下,发送者S的纯策略(m2、m1)是否最优?根据图9可知,属于类型t1的发送者S如果偏离这个策略,不取信号m2而取信号m1,此时,由于接受者R的反应为a2,而使得类型t1的发送者S获得效用a。这要优于他取信号m2获得的效用c。因此,在给定接受者R策略(a2,a2)下,发送者S有可能会主动偏离(m2,m1)这一策略,故发送者S的纯策略(m2、m1)不可能是均衡策略。 总之,通过从发送者S的四个纯策略出发,分别对该信号博弈的完美Bayes均衡进行分析,发现在骗子建立的规则下,只有(m1,m1)和(a2,a2)是博弈的共用完美Bayes均衡。结果也就出现了“皇帝新装”困境中博弈群体在不能确定彼此所属具体类型的情况下均选择显示其虚假偏好的现象。很显然,在整个博弈过程中,决定博弈群体采取何种动作为其最优策略的诱导机制是博弈效用中的参数。 站在局中人的角度,身为行动的执行者,在裁缝建立的规则(任何愚蠢或不称职的人都看不见新衣)下,没有人会质疑裁缝是否是骗子。因此,局中人会把自己没有看到新衣归因于自己是愚蠢的,而当听到其他人对新衣赞不绝口时,局中人会得出两个结论:其他人是聪明的,所以他们真的看到了新衣;其他人和自己一样没有看到新衣,在说谎。因此,每个人虽然能确定自己没有看到新衣,但不能确定其他人是否真的看到新衣。总之,为鼓励博弈群体显示其真实偏好,从而达到所有参与主体均选择说真话的一种新的均衡状态,笔者提出以下几点治理对策,详细情况见表2。 表2 “皇帝新装”困境中博弈均衡诱导机制的治理对策 骗子之所以能够拿自己的生命与所有人下赌注,这里有一个前提,即骗子能够建立一种规则,使所有人都活在这种规则之下。在这种规则下,根本就不会有人质疑骗子说的是谎言,更谈不上揭发谎言,因为一旦有人怀疑,这个故事就会立即被终结,最初的逻辑世界被破坏,整个童话故事就会变得毫无意义。因此,在这种前提下,每个人都不敢相信自己看到的事实——“看到”和“相信”是两码事。现在我们假设p=F(“说假话的人数”/“对国王的新衣发表看法的所有人数”),F=xa(x代表说假话的人群占比,a代表“不从众系数”)。这里的F因不同的人存在异质性,我们很容易得到F(0)=0、F(1)=1。但需要注意的是,0-1中间的部分会随着a的不同而有所不同,因此只要保证a稍微大些,即使只有1%的人站出来说真话,F也会距离1较远,此时他就会非常相信自己的眼睛,从而发出真实信号。所以可以通过以下几种方法来确保“不从众系数a”尽可能大些,换句话说,就是最大限度地打破博弈群体的从众心理,诱导其显示真实偏好。首先,可以对博弈群体进行思想道德教育,使其能够相信自己的眼睛,忠于自己的本心,敢于将生死置之度外,说出自己看到的事实。其次,在排除效用等因素干扰的情况下,也可以对博弈群体进行“隔离”,即让他们依次行动,以确保每个人在行动时都不知道其他人的选择,从根源上避免从众心理起作用。最后,也可以大胆地质疑骗子,结果是博弈群体无须从众,大胆地说出新衣不存在,打破原来博弈群体都“说谎的均衡”,两个狡猾的骗子也会受到严厉的法律制裁。 博弈论研究的博弈中的参与者总是被假定为理性的和自利的,而决定参与者究竟采取何种行动的诱导机制或激励机制之一就是他自己的效用。因此,在排除其他因素干扰的情况下,只有改变博弈效用,才能诱使参与主体作出符合社会价值标准的策略选择。通过上文分析可知,a、b、c、d的大小关系一共有13种情况,相对应的博弈结果可以归纳为3种:一是参与主体都说假话,二是参与主体都说真话,三是一半人说真话,一半人说假话(假设参与主体人数N是偶数)。 在整个博弈过程中,因为后行动的参与者只知道先于他行动的参与者要么选择说真话,要么选择说假话,但不知道先于他行动的参与者究竟会在“说真话”或“说假话”中到底选择哪一个。现在,在后行动的参与者“不完美”的信息集上赋予一个概率分布(p,1-p)作为信念,绘制博弈树如图10所示。 图10 依次行动的参与者之间博弈的博弈树 一旦给定后行动的参与者在“不完美”信息集上的信念,就可以计算出他的期望效用。如果后行动的参与者取“说真话”,期望效用为: p×b+(1-p)×c=p(b-c)+c; 如果后行动的参与者取“说假话”,期望效用为: p×d+(1-p)×a=p(d-a)+a。 我们知道,在骗子建立的规则下,a、b、c、d的大小关系满足:a>b、a>c、d>b、d>c。 1. 当b-c=d-a时,后行动的参与者的最佳选择是说假话; 2. 当b-c 3. 当b-c>d-a时,后行动的参与者的最佳选择是说真话。 因此,在骗子建立的规则下,排除其他因素的干扰,只要能够保证b-c>d-a,也就保证了所有参与者都选择说真话。 在一个群体的行动中,如果公共知识改变了,群体的均衡也会发生改变。故事最初达到了一种均衡,即所有参与者出于对个人利弊的权衡而选择掩盖事实真相,纷纷称赞国王新衣漂亮。倘若我们是局中人,在给定的先决条件(任何愚蠢或不称职的人都看不见新衣)下,对于每一位参与者来讲,他们都清楚新衣不存在,但他们会认为或许是因为自己愚蠢、不称职而没有看到新衣。所以他们是不能肯定其他参与者是否真的看到新衣。这时,“新衣根本就不存在”仅仅构成参与者的私人信息,而小孩子一语道破了事实的真相。小孩子是真诚的、天真无邪的,他不会像其他参与者那样权衡利弊得失。确切地说,小孩其实属于非理性的参与者,即使他发现周围的人什么都不说或者都在称赞国王的新衣,他也会童言无忌地说出真相:国王什么也没穿。“其实国王什么也没有穿”便瞬间成为所有参与者之间的公共知识,这时大家才开始勇敢地显示自己的真实偏好。此时人们经过交流达成通识,私人信息外部转化为公共知识,否则每一位理性参与者都不会有单独改变策略的冲动。 此外,还可以通过改变国王的行为来鼓励大家勇敢地说出真话。国王身为一国之君,理应率先示范,当场拆穿谎言,并给予骗子严厉的惩罚,以捍卫一国之君的尊严。而故事中的国王之所以没能及时戳穿骗子的谎言,也与他多年来的“不务正业”有关。当他没有看到新衣时,他不敢说出来,因为他心里清楚自己不是一个称职的国王,他缺乏自信。因此,倘若国王一直都是兢兢业业,不仅国王自己对自己有足够的信心,而且大臣、百姓都会对其有足够的信心,在面对裁缝设置的骗局时大家就一定能够戮力同心、齐心协力地揭穿骗子。 总之,本部分基于对“皇帝新装”困境中博弈均衡的诱导机制进行的理论分析,通过采取相应的治理对策,包括改变博弈效用参数、加强行为互动等来鼓励博弈群体作出符合社会价值标准的策略选择,从而达到博弈群体均选择说真话的一种新的均衡状态。 基于上述分析,笔者提出以下几点治理对策:应对博弈群体进行思想道德教育或将博弈群体“隔离”以打破从众心理;改变博弈效用,保证a、b、c、d的大小关系始终满足b-c>d-a;建立健全信息交换共享平台,拓宽信息沟通渠道,以加强行为互动。 [ 1 ] 刘康兴,李海.关于博弈论在人力资源管理中的应用综述[J].时代金融,2007(4):42-44. [ 2 ] 吉本斯.博弈论基础[M].北京:中国社会科学出版社,1999:7. [ 3 ] 施锡铨.博弈论[M].上海:上海财经大学出版社,1999:97-99. [ 4 ] 王艳梅,赵希男,孙世敏.基于动态博弈的横向监督与团队激励的关系研究[J].管理工程学报,2017(2):162-168. [ 5 ] 张立凡,程楠,朱恒民.基于动态博弈的媒体参与下网络舆情机制分析[J].情报科学,2017 (1):144-147. [ 6 ] 王康,孙健,周欣. 不完全信息动态博弈视角下的食品安全责任保险问题研究——基于参与主体之间的KMRW声誉博弈[J].江西财经大学学报,2017(2):70-76. [ 7 ] 赵荧梅,郭本海,刘思峰.不完全信息下产品质量监管多方博弈模型[J].中国管理科学,2017 (2):111-120. [ 8 ] 易凯凯,朱建军,张明,等.基于不完全信息动态博弈模型的大型客机主制造商-供应商协同合作策略研究[J].中国管理科学,2017(5):125-134. [ 9 ] 郑君君,邵祥民,韩笑,等.认知层次与信念更新对博弈合作行为影响研究[J].系统工程理论与实践,2016(1):113-120. [10] 吴文静,王占中,马芳武.从众心理影响下的行人群体行为演化博弈的仿真分析——以行人过街为例[J].吉林大学学报(工学版),2017(1):92-96.(二) 基于完全信息动态博弈的国王与文武百官和群众之间的博弈
(三) 基于不完全信息动态博弈的群众间的博弈
二、 “皇帝新装”困境中博弈均衡诱导机制的治理对策
(一) 打破从众心理,诱导博弈群体显示其真实偏好
(二) 改变博弈效用,鼓励博弈群体作出符合社会价值标准的策略选择
(三) 加强行为互动,诱使私人信息外部化为公共知识