徐 雷(渤海大学管理学院,辽宁锦州121013)
博弈论又被称为对策论(Game Theory),是现代数学的一个分支。它是一门研究冲突与合作的学问。在这种冲突与合作中,参与人之间相互影响,这些参与人可以是个人、公司、集团甚或是它们的组合。几乎所有社会科学领域中都活跃着与博弈论交叉的分支学科,为满足当代大学生对博弈论知识的需求,越来越多的高校正在不断加大博弈论课程的建设力度[1]。作为学校“管理博弈论”课程的主讲教师,笔者认为,当前高等院校中的博弈论教学除了讲授博弈论基本理论知识外,还应引导学生培养博弈思维,将博弈分析潜质开发出来。因此,应设计与讲授内容直接联系的课堂博弈活动,让学生参与其中,从而提高学生对博弈论思想的理解,增强学生运用博弈论的能力,进而将书本中的抽象知识转化为现实中解决问题的实际能力。然而,即使是课堂博弈也需要对博弈支付进行科学设定,如果按照一般的方法——以货币作为支付,则势必增加课堂教学成本。笔者通过对多年的教学经验进行总结,提出以课程成绩作为支付的方法,这不仅节省了成本,与货币支付相比,它还存在一些天然的优势,值得推广。
博弈论思想源远流长。中国古代的《孙子兵法》《三十六计》等兵书都蕴含着朴素的博弈论思想,但这些思想没有能够发展成为系统的理论。作为一门正式的理论,博弈论的发展大致经历了这样的一个过程:1838年,法国经济学家安东尼·奥古斯丁·库尔诺(又译作古诺)提出了一个双寡头产量竞争模型,即古诺模型。1883年,法国经济学家约瑟夫·伯特兰德(Joseph Bertrand)提出了价格竞争模型,即伯特兰德模型。1925年,埃奇沃思自己编辑,以皇家经济学会的名义出版了他的《经济学论文选集》之卷本,研究了两个寡头的产量与价格垄断。1934年,《市场结构和平衡》出版,作者斯塔克尔伯格,提出了著名的斯塔克尔伯格模型。1944年,《博弈论与经济行为》出版,作者冯·诺依曼和摩根斯坦。
以上这些思想奠定了现代博弈论的基础,但系统的博弈理论是在20 世纪50、60年代由纳什、泽尔腾和海萨尼等人发展起来的。代表性著作包括1950年发表的《n 人博弈的均衡点》(纳什);1951年的《非合作博弈论》(纳什);1964年泽尔腾发表了论文《n 人博弈的评价》;1965年,泽尔腾发表了他最著名的博弈论论文《一个具有需求惯性的寡头博弈模型》,定义了子博弈精炼(subgame perfectness)的概念;海萨尼在1967-1968年间分三部分发表了其论文《由“贝叶斯”参与人进行的不完全信息博弈》;1975年,泽尔腾发表了论文《扩展式博弈精炼均衡概念的重新考察》。1994年,纳什、泽尔腾、海萨尼三人获得了诺贝尔经济学奖,以表彰他们在非合作博弈论领域作出的开创性贡献。
由于博弈论聚焦于行为分析,其均衡由参与人的行动组合构成,因此,该理论迅速应用于多个领域,主要包括:(1)经济学,尤其是产业组织领域。代表性人物是泰勒尔,他1988年出版的教材《产业组织理论》,至今仍被国内外高校列为产业组织领域的必读书目[2];(2)政治学,尤其是国际政治。代表性人物是托马斯·谢林,其著作《冲突的战略》(1960)首次定义并阐明了威慑、强制性威胁与承诺、战略移动等概念,开始把关于博弈论的洞察力作为一个统一的分析框架来研究社会科学问题,并对讨价还价和冲突管理理论做了非常细致的分析[3]。(3)生物学。代表性人物约翰·梅纳德·史密斯(John Maynard Smith,1920-2004),《演化与博弈论》是演化博弈论研究领域的经典著作[4]。1982年,约翰·梅纳德·史密斯因此书的出版被称为演化博弈论之父。在《演化与博弈论》中,作者把博弈论的思想纳入到生物演化的分析中,揭示了动物群体行为变化的动力学机制。
可见,博弈论在经济学、政治学乃至生物学等学科的本科和研究生教学中占据了重要位置。然而,由于博弈论引入我国相对较晚,较为流行的教材也仅限于张维迎的《博弈论与信息经济学》和谢识予的《经济博弈论》等有限的几部。因此,普通高校在博弈论课程建设上相对滞后,不能适应博弈论近年来的迅猛发展。即使是在已经开设了博弈论课程的高校,由于实验手段、设备、经验的不足,课程教学也仅能专注于理论的讲授,在重要的学生课堂参与环节缺乏实践。本文将对这一问题进行探讨,总结和阐述以课程成绩为支付组织学生进行课堂博弈的实施方法。与以货币为支付的组织方式相比,这种形式不仅具有节约成本的优势,而且还具备理性人假设下,参与人对支付感知程度一致性的优点,具有重要的推广意义。
在博弈论课程的教学中,课堂博弈对教学效果的提升具有重要作用。目前,在国际流行的博弈论教材中,已经开始结合课程内容进度设计专门的课堂博弈环节(如Eric Rasmusen 的《Games and Information》),引领学生更加深刻地理解博弈论的精髓[5]。这种课堂博弈是一种简单的行为实验,比较适合在课堂上进行的如公共物品捐赠、消耗战、讨价还价等。当在课堂上进行这些行为实验时,学生自然成为参与人,行动集、行动顺序、信息等博弈规则均在事前约定,此时,博弈支付就成为最为重要的一个要素,对它的设置能够影响博弈结果,进而对学生能否通过课堂博弈更为深刻地理解博弈理论产生重要影响。
目前,在国内外博弈论教学实践中更多的是以货币作为博弈支付。以货币为支付是一种自然的选择,它能够直接反映人的物质需求。然而,以货币为支付在课堂博弈中应用也存在着几点不足。首先,博弈论对行为实验往往有参与人偏好一致的前提假设,因此,如果以货币为支付,那么参与人应对货币支付具有一致的偏好,即参与人的效用函数应是相同的。然而,这一假设在以学生为参与人的条件下很容易被打破。一方面,大多数学生尚未有劳动收入,对获取货币的难易程度的感知十分主观,这就导致学生的效用函数存在差异;另一方面,就是学生的效用函数具有一致性,但由于家庭条件的差异,学生间的每月生活预算也有很大不同,这会导致货币支付的边际效用在学生间存在差异。其次,以货币为支付就要求每次课堂博弈都要付出一定的成本,以我国当前的课堂教学来看,这种成本付出是不现实的,因此,这种方式并不适合大规模应用。
基于以上两点原因,以货币为支付在课堂博弈中存在重要局限,所以,有必要寻找其他更为理想的支付手段。当行为实验的参与人为学生时,很自然地,我们考虑是否可以以课程成绩作为博弈支付以及具体的实施办法。这里,我们从以下几方面进行探讨。
第一,以学生为参与人时,成绩自然是参与人的共同关注点。成绩的高低能够对参与人效用产生重要影响,这种影响甚至超过货币。当然,效用函数仍具有主观性,成绩对效用的影响在个体间仍存在差异性,但这种差异性是小于货币支付的。这主要是由于成绩具有满分这一最高值,其边际效用在个体间的差异性较货币支付更小。因此,学生对成绩的关注度具有更强的共性,与货币相比,成绩更适合在课堂博弈中作为支付。
第二,课堂博弈的成绩在总成绩中的比例。当前,我国高校教学改革的方向是更加注重过程化考核,因此,可以课堂博弈作为博弈论课程过程化考核的一个重要组成部分。然而,博弈论课程的理论学习和实践具有较大差异。在理论学习中,学生应明白个体理性和集体理性在博弈结果和均衡达成中的作用。而在实践中,往往是更加“理性”的个体能够获得更大的支付。当然,这能够诱导学生探讨如何在实践中运用激励和约束等手段对个体理性加以限制,但在课堂博弈中,如果赋予的成绩在总成绩中占比过大,是否会使学生产生个体理性比集体理性更加具有现实意义的思维倾向?如果产生这种倾向,对学生未来的成长会产生怎样的影响,还存在不确定性。因此,课堂博弈的成绩应在课程总成绩中占比不超过20%。这样的设置既能让学生充分重视课堂博弈结果,从而强化对博弈论的理解,又能让学生不易陷入到无谓的争执,从而影响其价值判断。
第三,因为是全员参与,所以要考虑适用的班型。如果把课堂博弈作为一项考核,就需要全体学生参与。可是一次行为实验所需要的参与人是有限的,如果教学班型太大,则不适合组织课堂博弈。只有在60 人以内的中小班型中开展课堂博弈,才是比较适宜的。即使一些行为实验所需的参与人很少,也可以将班级进行分组,从而同时展开。这样的教学模式便于教师的组织和记录,有利于教学效果的提升。
第四,营造课堂博弈所需要的软硬件环境。课堂博弈的进行需要一定的软硬件环境,如一些博弈要求参与人之间不能进行交流,因此需要足够大的空间。另外,可利用Z-Tree 软件在计算机教室中组织课堂博弈,极大地方便了课堂博弈的组织实施和博弈结果的记录与分析。
每个公司由5-6 名同学组成①。每年,公司都要决定是否仍继续参与市场竞争。如果继续竞争,公司会产生每年300 的固定成本,和每单位产品为2 的边际成本。公司要做的是在[0,1,2,3,4,5,6,7,8,9,10]的集合中选择一个商品售价。公司的亏损可以任意多。
市场需求在售价不大于10 时是60,且无弹性。如果售价高于10,则需求降为0。
每个公司要在一张纸条上写下它所定的售价或者是“退出”,然后将纸条折叠交给教师。所有公司交齐后,教师将最低出价进行公布,售价最低的公司平分60 的市场需求。每个公司的利润就是它的销售收入(销售量乘以售价)减去固定成本(300)和可变成本(销售量乘以2)。
博弈从新的一年开始,如果公司选择退出则是永久的退出,不能够重新进入市场。博弈一直持续,直到只剩下一家公司,此时该公司得到2000 的奖励,因为它成为了市场中的垄断者。在第10 轮博弈结束后,给仍留在市场中的公司一次谈判的机会,即它们是否选择结束博弈,如果结束则它们平分2000 的奖励;如果选择继续,则博弈继续到仅剩一家公司为止或者课堂时间结束。如果最后仅剩一家公司,则它独占2000的奖励,如果博弈进行到课堂时间结束仍有多于1 家的公司,则它们不能获得奖励。
此博弈在课堂中进行,课堂时间100 分钟。博弈进行前的规则解释和博弈结束后的总结分析用时40 分钟,博弈用时60 分钟。学生人数57人,分为6 个公司。博弈共进行10 轮。第一轮博弈最低出价为4,无公司退出;第二轮博弈最低出价为1,无公司退出;3-6 轮次中最低出价均为2。第五轮退出1 家公司,第六轮退出2 家公司。7-10 轮次中最低出价为3。剩余3 家公司在第十轮结束后达成和解,平分了2000 的奖励。
表1 博弈过程与结果表
从博弈结果看,利润最高的企业为最先退出的企业,而坚持到最后的企业即使得到了奖励,在利润总额上也是最少的。从理论分析来看,该行业显然是一个自然垄断行业,仅当行业中只有一家企业的时候才会产生正的理论。在两参与人的消耗战中,博弈均衡应为(坚持,退出)或(退出,坚持),即参与人的占优策略应是(对方选择坚持则选择退出,对方选择退出则选择坚持)。而在多参与人的消耗战中情况则更为复杂,参与人必须对其他参与人的策略进行判断才能选择更加合适的行动。从整体上看,博弈结果与理论预期是相符的。
此次课堂博弈占课程总成绩的比重为15%,即满分为15 分。参与即得到7 分,利润最高公司的同学加6 分,第二高的加5 分……利润最低的加0 分。博弈结束后每个公司需要上交一份书面总结,该总结为2 分。在课堂博弈中,学生十分重视每轮的支付情况,组内对每轮行动均能够进行有效的讨论。实践结果表明,以课程成绩作为支付发挥了应有的效果。
随着博弈论的不断发展及其对其他学科的影响不断加深,越来越多的高校已经开设了博弈论课程。然而,作为博弈论教学重要实践方式的课堂博弈却被很多教师在教学过程中忽略了。这主要是因为课堂博弈作为一种行为实验,往往以货币作为支付,这就大大提高了组织成本,从而降低了课堂博弈的可实施性。
本文探讨了以学生成绩作为课堂博弈支付的可行性,同时对课堂博弈的组织方式和所需的软硬件环境进行了分析,对当前我国博弈论教学效果的提升具有一定意义。另外,在经济学、政治学和社会学等学科中,时常需要组织行为实验来开展学术研究,而高校中的这种行为实验经常以学生为被试,因此,如果能够将课堂博弈与学术研究中的行为实验相结合,则既可以节省研究经费,又能够让学生亲身参与到课题研究中来,进而加深对博弈论的认识。这是教学促进科研、科研反哺教学的一项现实应用,值得在更广范围实施。
①公司数量与每个公司的学生数可根据授课班型的实际情况进行设置。