张文博
摘要:博弈论已经是大家耳熟能详的名词,无论是在人们的日常生活中,还是在许多学科的研究中,博弈无处不在。现在,博弈已经从人们的决策行为发展成为一门独立的学科,其在经济中的运用日益广泛,作用也越来越深广。除了一般意义上的博弈决策,反向应用博弈论,改变博弈条件以期得到更好的博弈结果,使博弈双方获得更高的效用,这在经济的发展中将起到更加重要的作用。
关键词:博弈论;均衡;效用;反向应用
中图分类号:F069.9文献标志码:A文章编号:1673-291X(2009)29-0240-02
“博弈论”这一名词的流行仅仅始于几十年前,但是,博弈论思想本身却有着悠久的历史,如两千多年前的“田忌赛马”就是出色利用博弈论的典型生动的例子,至今仍然为中国的许多学者、老师应用来作为博弈论的入门例子。
一、博弈论的发展进程
博弈论思想虽然有着悠久的历史,但是作为一门系统的学科来说还相当的年轻。近代以来,在学术研究的过程中许多学者逐渐认识到了博弈论的重要作用,对博弈理论进行了探索研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(W aldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Coumot)和波特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反应函数。但是作为一种理论来说,1944年,冯·诺依曼(Von Neumann)和奥·摩根斯坦(Morgenstern)合著了《博弈论与经济行为》在总结了以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提出了较系统的博弈理论,因此这被认为是博弈理论初步形成的标志。50年代初,纳什(J.Nash)的两篇非合作博弈论奠基性论文发表之后,博弈论飞速发展。作为博弈论的一部分,非合作博弈比合作博弈的发展更加迅速,在经济学等其他学科中的应用也更为广泛。提起博弈论,现在差不多总是指非合作博弈论。50年代以来,纳什(Nash)、泽尔腾(Selten)、海萨尼(Harsanyi)等人是博弈论成熟并最终进入使用。
最近三四十年,经济学经历了一场“博弈论革命”,经济学者们引入博弈论的概念和方法改造经济学的思维,推进了经济学的研究,可以说博弈论在一定程度上已经改写了微观经济学,成为推动经济学发展的一大动力。一方面,纳什均衡概念以及更多的博弈论知识的引入使寡头竞争理论得到改造,在现实中应用的普遍性更明显,严格而深入的探讨竞争现实的现代寡头理论迅速发展起来;另一方面,在经济社会中,每个人的决策都是根据他所掌握的有关信息做出的,非对称信息博弈论这种分析方法彻底改变了微观经济学的面貌,极大地促进了信息经济学的发展,信息经济学已经真正成为当今经济分析的主流。
二、博弈论的主要内容
博弈论(Game Theory)又称作对策论,是专门研究理性个体之间相互冲突和合作的学科。一个最基本的博弈结构,至少包括三个要素:局中人(player)、战略空间(strategy space)和支付结构(payoff structure)。
博弈论的基础假定是博弈的参与者即局中人是理性而明智的;在每个局中人的所有可选行动范围(战略空间)内,该局中人是独立的,不受其他局中人任何形式的胁迫;一个局中人的支付结构表示在不同情况(不同战略组合)下博弈终了时他的收益(或“得分”)。在典型的支付结构中,一个局中人所得的支付不仅与他自己选择何种战略有关,而且还是其他局中人所选战略的函数,任何一个局中人改变自己的战略都将影响所有局中人所获的支付水平。這就是说,局中人之间的利益是相互牵连和相互制约的。除上述3个要素以外,要对一个博弈进行分析,对博弈定义一个信息结构也是必不可少的。研究者必须明确每个局中人知道什么和不知道什么。在局中人追求自己的支付最大化假定下,博弈论研究这些理性个体的行为选择。一个博弈的“解”,也就是该博弈最可能出现的结果,称为“均衡”(equilibrium)。一般情况下,博弈双方的目的就是能够得到一个均衡结果。
一个完整的博弈应该包含五个方面的内容:第一,博弈的参与人,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈的行动空间,即博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策后的得失。
三、博弈论的应用和对博弈论反向应用的思考
自从将博弈论引入经济学以后,经济学改变了传统经济分析地那种以个人孤立决策,其他经济活动者的行为影响则被典型地简化为价格信号为基础的分析方法,而侧重于经济活动中多个利益主体的行为所产生的相互作用和影响的分析,从而使经济分析更能反应经济系统的本质。
博弈的过程在一定程度上更接近经济生活中的实际,具体来说,博弈论是怎样应用到实际事务上的,下面将举例说明,并且讨论探索反向应用博弈论是否可能、是否有意义。
我们以日常生活中最常见的学生与家长的博弈为例:
假设一小学生和其家长,学生每天都必须完成老师布置的家庭作业,家长可能检查也有可能不检查其完成状况。如果学生按时完成家庭作业,玩的时间减少;家长检查,学生没有完成就会得到惩罚。家长当然希望孩子按时完成作业,如果检查发现学生没有做作业,家长会感到生气,而且天天检查对家长来说是额外的负担。因此如果学生做了作业家长也检查了,那么学生得到的效用是-2,家长得到的效用是2;如果学生做了作业家长没有检查,那么学生得到的效用是-4,家长得到的效用为3;如果学生没有做作业家长检查了,学生增加了玩耍的时间却受到了惩罚,得到的效用是0,家长得到的效用是-2;如果学生没有做作业家长也没有检查那么学生得到的效用是4,家长的实际得到的效用是-1.博弈矩阵如图1:
博弈的结果是学生会选择不做作业,家长会选择不检查,实际影响是无论是对学生自己还是对家长来说,得到的都是最差的结果。
面对这样不尽如人意的博弈结果,我们应该怎么办呢?
博弈总是在一定的条件下进行的,这些条件决定了博弈的结果。那么根据现有的博弈结果,我们是否可以反向应用,找出可以改变的条件从而改变整个博弈的格局,改变博弈结果,改善博弈双方的效用水平呢?
仍然以上面的学生家长博弈为例:
假设在相同的条件下,家长改变惩罚方法,变成惩罚与奖励并行。即如果学生不按时完成作业,那么除了接受固定的惩罚外,如果该期测验考试在一定水平之下将会得到更严厉的惩罚,如果测验成绩在一定水平之上那么会得到自己期待已久的少儿百科全书。测验的成绩必然和平时是否好好学习、是否按时完成家庭作业相挂钩,那么学生在希望增加玩耍时间的同时还会考虑到不做作业和测验成绩的关联。这样,如果学生完成作业家长也检查了,学生得到的效用是2,家长得到的效用也是2;如果学生完成作业家长没有检查,学生得到的效用是4,家长得到的效用是3;如果学生没有完成作业家长检查了,那么学生得到的效用是-4,家长得到的效用是-2;如果学生没有做作业家长也没有检查,那么学生得到的效用是2,家长得到的效用是-1。博弈矩阵如图2:
根据博弈矩阵,博弈的均衡结果是:学生能够自觉地完成作业,家长也可以不检查,免除了劳累工作之后的额外工作。学生家长都达到了最佳的博弈结果。
可见,根据现有的博弈,分析出博弈结果,当博弈结果不尽如人意时,并不是必须消极接受这种博弈结果。根据现有的博弈结果反向推回博弈的条件,寻找可以改变的条件进而改变博弈结果,实现双赢。