卜振兴
(南开大学,天津 300071)
运用无限次鹰鸽博弈模型研究国际关系
——以中日关系为例
卜振兴
(南开大学,天津300071)
[关键词]中日关系;鹰鸽博弈;无限次重复博弈
[摘要]中日关系是东北亚地区最重要的双边关系之一,中日关系的发展对东北亚地区的局势有重要影响。如何看待和解读当前的中日关系,如何构建未来的中日关系,不仅关系到中日两国的国家利益,而且影响到东亚地区的稳定。笔者运用鹰鸽博弈模型分析了中日关系,研究表明自身实力、战略眼光、利益争夺、惩罚程度和博弈机制等都是制约博弈战略的重要因素。
近年来,中日之间围绕领土争端、历史问题等展开了激烈的角逐,大有剑拔弩张,战争一触即发的形势。那么日本为什么一再采取激进的策略?大国之间相互制约的机制是什么?哪些因素决定了国家的战略选择?这就是本文尝试回答的问题。笔者将以中日战略博弈为基础,利用无限次“鹰鸽博弈”模型,分析大国之间进行外交博弈的战略选择问题。
一、 理论概述
在进行本文的分析之前,有必要对文中所运用到的理论模型进行简单的介绍。本文运用的理论模型是基于无限次重复“鹰鸽博弈”模型,下面就相关理论进行简要介绍。
(一)重复博弈
令G表示一个基本博弈, 如果在相同博弈方、相同的规则和基本相似的环境下,该博弈重复了N次“记为G(N)”,就形成了重复博弈,其中每次博弈可以视为G(N)的一个阶段[1]。按照博弈次数是否有终点可以将重复博弈划分为“有限次重复博弈”和“无限次重复博弈”。有限次重复博弈是指博弈次数有限的重复博弈(称为“狭义有限次重复博弈”)或人们认为确定有限的重复博弈(也称为“广义有限次重复博弈”)。无限次重复博弈是指博弈次数无限的博弈(称为“狭义无限次重复博弈”)或博弈方主观认定或预期次数无限的重复博弈(也称为“广义无限次重复博弈”)。例如,处于国际关系中的两个国家之间的博弈由于没有可以确定的结束时间,可以将他们之间的博弈视为无限次重复博弈。
(二)鹰鸽博弈
鹰鸽博弈并不是指老鹰和鸽子这两种动物的博弈,而是指博弈中的两种策略选择。“鹰”指的是攻击型策略,即鹰派战略,“鸽”指的是和平型战略,即鸽派战略。鹰鸽博弈模型可用来分析国际关系中广泛存在的合作与冲突、强硬和缓和、威胁和妥协的关系[2]。
令B表示双方争夺的利益,L表示争夺中失败一方的损失,B、L取值均大于0。为了简化起见,我们假设甲乙双方在博弈中实力对等,因此如果双方都采取鹰派战略,那么双方获胜和失败的概率均为0.5,各自的期望利益都是(B-L)/2;如果双方都采用鸽派战略,那么双方能够分享目标利益,各得B/2单位利益;如果鸽派策略遇到鹰派策略,那么采用鹰派策略的一方获得全部利益为B,采用鸽派策略的一方得不到任何利益,但也没有损失。因此进行一次博弈的收益矩阵如表1所示:
表1 鹰鸽博弈收益矩阵表
由纳什均衡分析可知:(鹰、鹰)战略是双方的纯策略纳什均衡战略,也就意味着在一次博弈中双方采取鹰派战略是博弈的最佳战略选择,但这种策略并不是双方的利益最大化的决策,因为如果双方能采取(鸽、鸽)战略组合,那么对于双方都是更加有益的。
(三)报复机制
报复机制也称为违约惩罚机制,是指对违反合作策略的博弈方采取的惩罚性策略,报复机制的建立增加了违约的成本,提高了合作的可能性。重复博弈不同于一次博弈,不仅仅因为博弈次数的差异,更为重要的是在重复博弈中存在报复机制。报复机制又分为“冷酷触发策略”和“胡萝卜加大棒策略”。“冷酷触发策略”是指博弈方首先试探合作,一旦发现对方采取不合作的策略,则另一方在随后的各期一直采取不合作的策略[3]。但是冷酷触发策略较为严厉,只要有一方采取不合作的战略时,接下来的报复行为就会一直持续下去,并且这种报复行为对于双方都是有害的,显然是不符合利益最大化决策的标准。于是Abreu(1986)[4]提出了一种带有谅解机制的简单报复机制,即“胡萝卜加大棒策略”,一旦发现对方在某一期采取不合作的战略时,另一方将会在下一期紧接着采取不合作战略,但是这种带有报复性的策略是在一个阶段中一次性完成的,一旦在这一期完成了这种报复性的策略,在下一期又会回到合作战略上来。
二、 博弈参数确定
通过上文关于鹰鸽博弈模型的介绍,为了将模型运用于中日关系的研究,我们需要首先确定模型中各参数变量的取值情况。下面本文将结合中日关系的现状,对中日之间的利益纷争、中日一旦发生严重对抗胜负几率以及为争夺发生的损失情况分析如下:
(一)利益冲突(B)
在讲到中日之间的利益纷争的时候,非常有必要对中日关系的历史进行简要的回顾。中日两国一衣带水、隔海相望,在政治、经济、文化等方面都有密切的联系。中日关系的历史最早可以追溯到东汉时期,据范哗《后汉书·东夷传》记载,东汉光武帝年间曾经向倭奴国(即今天的“日本”)赠送过金印,这是中日交往最早的记录。从东汉光武帝至今,中日关系历经两千多年的磨砺,可以说是几经沉浮,起伏跌宕。在中日交往的历程中既有和平相处的历史,也有刀兵相向的时代,有和平友好的“蜜月期”,也有剑拔弩张的危险期。根据中日关系发展的历程,本文将中日关系划分为以下几个阶段:
通过对于中日两国关系历史的回顾,一方面使我们对中日关系的发展和演变有了一个清晰的印象,中国历来坚持和平共处,以邻为伴,与邻为善的原则,造成目前中日关系紧张的原因在日本,改善中日关系的主动权也在日本;另一方面也使我们归纳出了中日关系冲突的焦点,中日在以下方面存在明显的利益冲突和矛盾:一是领土边界问题,包括钓鱼岛及附属岛屿的归属问题,春晓油气田的开采区和所有权争议,以及防空识别区等问题;二是历史问题,包括日本领导人参拜靖国神社、处理慰安妇、篡改历史教科书、修改和平宪法及其他历史遗留问题等;三是意识形态问题,意识形态问题是指,两个不同社会制度国家之间由于意识形态的差异存在的分歧和矛盾,资本主义社会与社会主义社会关于意识形态的矛盾自社会主义国家建立后就一直存在,并一直延续至今。意识形态问题是两类不同社会制度的国家共有的问题,中国是社会主义国家,而日本属于资本主义国家,中日之间当然也存在这种矛盾;四是安全困境问题,安全困境问题是指,由于国际关系基本处于无政府状态,各国担心受到对方的侵害,为了自保势必尽可能追求权力,而这又导致对方的不安,因此双方竞相追求和扩充实力,进一步加剧了安全担忧,使国家间的不稳定因素不断增加(封永平2006[5],吕晓莉和钟准2009[6]等)。安全困境问题则是所有国家在外交关系中都会面临的问题。但是由于日本处于太平洋上的一个岛国,西边和那边是漫无边际的太平洋,东面和北面则是强大的中国和俄罗斯,地理位置的特殊性使得中日之间的安全困境问题尤为突出。
领土争端、历史遗留问题、意识形态差异和安全困境都是双方矛盾和分歧的焦点,四种因素相互叠加,使得中日之间的关系错综复杂。为了使我们对于中日关系的分析更加一般化,我们假定中日之间利益争夺的利益为B。
(二)胜败几率(P)
两国之间一旦存在利益冲突,无非是通过以下路径来解决,一是通过政治协商,友好谈判来解决。如中蒙边境的划分,新中国成立后,由于中蒙边界一直没有完全勘察界定,因此双方存在一定的分歧,1962年,中蒙双方通过友好协商正式签署《中蒙边界条约》,中蒙边界问题顺利解决。二是一方通过武力威慑,迫使另一方主动放弃存在争议的利益。如乌克兰危机中,关于克里米亚的归属问题,美俄之间是存在严重分歧和冲突的,但是双方都没有指望通过武力解决问题,采取了克制态度。最终俄罗斯通过武力威慑,迫使乌克兰波罗申科政府接受克里米亚关于独立的公投决议。三是双方不惜使用武力解决,如英阿马岛之战,马尔维纳斯群岛又称福克兰群岛,是南大西洋上的一个岛国,历来存在领土争议,1982年,阿根廷政府对马岛实施军事占领,英国随即进行反击,英国和阿根廷为争夺马尔维纳斯群岛的主权归属的战争爆发,战争持续了两个多月,最终英国战胜阿根廷获得马尔维纳斯群岛的主权。但是无论是以上述哪种方式解决争端,利益划分的背后都是以一个国家的政治、经济、军事实力为基础的,这决定了双方在(鹰,鹰)对抗博弈和(鸽,鸽)合作博弈中获胜的概率和分享利益的比例。
表2 中日关系发展历程简介表
资料来源:根据中华人民共和国外交部网站公布资料整理而得。
具体到中日问题上,根据世界知名的军事实力排名网站“Global Firepower (世界军力GFP)*①资料来源:http://www.globalfirepower.com/”的排名,中国军力位居第三位,而日本为第九位。这份排名主要是根据每个国家常规军事实力,并参考一国的财政、资源和地理状况等因素确定的,不包括核武器等因素。另据世界权威防务期刊——英国《简氏防务周刊》*②资料来源:简氏防务周刊http://www.janes.com/公布的2014年世界军事实力排名显示,中国排名为第四,远超日本。这份排名同样综合考虑了一个国家的经济基础、军费开支、军事科技和军事自主研发等一系列的关键因素。通过这两份排名,我们可以明确的是,在综合军事实力方面,中国具有绝对优势。但是同时不可否认的是在海军实力方面,日本的海军实力长期以来位居亚洲首位,日本在海军装备、海军科技等领域均具有明显的优势。加之中日的战略同盟关系和中国与周边很多国家存在领土、领海纠纷,一旦由于钓鱼岛问题发生激烈对抗,中国能否取得绝对优势仍然存在很多变数。因此,我们设定中日之间发生冲突后,中日一方获胜的概率为P1,日方获胜的概率为P2,且满足P1+P2=1
(三)损失程度(L)
如果双方是通过友好协商或者武力威慑方式实现对于争议利益的处理,所花费的成本相对于争议利益而言是相对较小的,成本基本上可以忽略不计。如果双方是通过对抗实现对于争议利益的处置,那么双方付出的代价是很大的。以中日为例,一旦中日之间因为钓鱼岛问题而开战,或引起局部冲突,那么损失的成本除了各种人员和武器消耗外,由于战争导致的经济衰退和人民生活水平的下降也是重要的成本。由于冲突中的成本一般是无法完全精确衡量的,我们假设中日一旦发生冲突,为利益争夺而付出的成本为L。并且,我们假定成本是小于争议利益B的,否则的话,双方的争夺就是完全非理性的行为了。
三、 博弈关系分析
由于中日之间的战略博弈没有预期可以结束的时间,因此可以视为广义无限次重复博弈。下面本文将运用无限次鹰鸽博弈模型来分析中日之间的战略博弈。
(一)收益矩阵
在进行无限次重复分析之前,我们首先需要确定中日双方在一次博弈中的收益矩阵。通过上一章,我们可以设中日争夺的利益为B,发生争夺时付出的代价为L,中日之间发生冲突后,任何一方获胜的概率为Pi。如果双方均采用鹰派战略,则获胜一方获得B-L的收益,而失败一方获得-L的收益,采用(鹰,鹰)策略组合的中方期望收益为:
(1)
(2)
当一方采用鹰派战略,一方采用鸽派战略时,采用鹰派战略的一方没有为争夺利益遭受损失,同时获得的利益。而采用鸽派战略的一方没有任何收益,也没有任何损失,收益为0。中日双方一次博弈的收益矩阵见表3。
表2 中日双方鹰鸽博弈收益矩阵表
(二)博弈分析
通过对模型的分析我们知道,在一次的鹰鸽博弈模型中,(鹰,鹰)组合是中日双方唯一的纯策略纳什均衡,但是并不是双方收益最高的策略组合,显然采取(鸽,鸽)策略双方能获得更大的收益。我们知道(鸽、鸽)这种双赢的战略组合在一次博弈中是无法实现的,那么在无限次重复博弈中,有没有实现(鸽、鸽)战略组合的可能呢。本文认为是可能实现的,当双方采取鸽派策略的无限次重复收益大于采用鹰派策略的收益时,双方必然会主动维持(鸽,鸽)的策略组合。下面我们就将分析这种可能性及其政策含义。
当双方均采取鸽派策略时,每个国家无穷次重复博弈情况下收益的现值为:
(3)
1. “冷酷触发策略”
(4)
在“冷酷触发策略”下,双方维持和平战略的条件是采取和平战略的收益大于采取攻击型战略的收益,即:
(5)
2.“胡萝卜加大棒策略”
胡萝卜加大棒策略与冷酷触发策略的报复机制是不同的,胡萝卜加大棒策略中,报复行为在紧接着背离和平策略发生的那个阶段一次性完成。如果在前T-1期双方均采取和平战略,那么博弈双方在第T期,仍然采取和平战略;但是一旦发现对手在T期采取背离战略,则双方会在T+1期均采取不合作的攻击型战略,但是到了T+2期,双方又回到合作的战略上来。
(6)
因此如果在“胡萝卜加大棒策略”下博弈双方能够维持和平战略必须的条件同上,即一直采取鸽派策略的收益大于采取鹰派策略的收益,用公式表示为:
(7)
(三) 结果分析
四、 结论及建议
研究表明获胜概率、博弈机制、折现因子、争夺利益和博弈损失都是影响博弈战略的关键因素,综上得出以下结论:
(一)发展自身实力是保障正当权益的物质基础
我们的研究发现当对方在利益争夺中获胜的概率P越大,则双方实现(鸽,鸽)合作博弈的可能性就越高。而获胜概率是由一国的政治、经济、军事实力决定的。因此为了更好地保障自身正当的权益不受损害,也为了更好地对违反和平策略的一方做出威慑,最重要的就是加强自身能力建设。习近平总书记在党的十八届一次全会接见中外记者时讲到“打铁还需自身硬”,本意是要求从严治党,只有建立一个坚强的政党才能更好地担负起领导人民群众实现共产主义的重任,这句话运用到国际关系中仍然具有重要意义。只有加强自身能力建设才能在国际交往中处于主动地位,更好地维护自身权益。改革开放总设计师邓小平同志也说过“发展才是硬道理”、“发展是解决一切问题的关键”,深刻的揭示了发展自身实力的重要性。
(二)具备战略眼光是维护地区安全的关键因素
研究表明折现因子δ越大,维持和平战略的机制也就越稳定。折现因子是经济学的概念,在利息理论中表示将未来收入折算成等价现值的比率。在博弈论中,折现表示的是收益的时间价值,也即未来的利益对于参与人的重要程度(张维迎,2004)[8]。折现因子δ∈[0,1],越大说明参与人的耐心越好,越看重未来长远收益,反之耐心越差,也越短视。一个更耐心,更富于长远战略眼光的博弈方,折现因子也就越大。在中日两国关系中,如果中日双方从战略眼光审视中日关系,重视双方的长期交往和利益,那么中日之间维持和平战略的可能性也就越高。中日老一辈政治家为维护中日关系的长远和平做出过很多努力,世代友好,永不再战,是老一辈政治家为两国关系确定的基本准则。但是当前的日本领导人为了迎合日本右翼势力的支持,而一再做出有损于中国人民感情、有损于地区和平的事情,导致中日关系紧张,这实质是违背了中日和平共处的基本原则,是缺乏长远考虑、缺乏战略考量的短视做法。我们希望日本领导人能从中日两国的切身利益考虑,不要一再做出挑衅性的举动,切实为维护地区稳定做出努力。
(三)求同存异是实现地区长治久安的基础理念
研究表明双方争夺的利益B越大,则参与方违背和平战略、选择攻击型战略的可能性就越大。因此减少共同利益的争夺,是维持和平战略的有效途径。而如何减少共同利益的争夺呢?这就需要中日双方一是遵守原有的国际秩序和国际格局,不要制造新的分歧和矛盾;二是对于现存的矛盾和分歧采取和平协商的办法进行解决,本着相互谅解、平等互利的原则,坚持求同存异的外交方针,妥善处理双方的矛盾和分歧。中日目前在历史、领土等方面存在争端,因此中日之间应尊重和照顾彼此的核心关切,不激化矛盾、不制造冲突。日本在2012年坚持所谓的“钓鱼岛国有化”的举动,实质就是刻意制造矛盾和摩擦,如果日本真的是如日本领导人所宣称的重视中日关系,那么就应该少做这种激化矛盾的事情,切切实实改正错误立场,重新回到友好协商的轨道上来。
(四)提高违约成本是维持和平共处的必要条件
研究表明争夺中失败一方的损失L越大,双方维持和平战略的几率也就越大。因此为了维持和平机制的稳定性,必须增加违反和平策略的惩罚力度,让违反和平策略的一方承担更大的代价。运用在中日关系中就是,中国应该对日本购买钓鱼岛、参拜靖国神社等挑衅行为给予强有力的还击。祈求和平是换不来和平的,只有有效地反击才是维持和平的最好策略。因此,面对日本的挑衅行为,应该采取多种措施予以回击,如减少中日之间的高层交往,向国际社会说明日本的挑衅做法,加强军事震慑力,划定防空识别区和实现钓鱼岛巡航的常态化等都是加大惩罚力度的做法。通过这一系列的行动,让日本明白中国维护核心利益的决心和勇气,明白违反和平策略是要付出代价的。当然关于加大违约成本的方式有很多种,应该选择能尽量减少自身损失的方式和方法。在回击对方的同时,降低对于自身的损害和冲击。
(五)设置谅解机制是保持睦邻友好的必然选择
在我们的研究中发现,“胡萝卜加大棒策略”比“冷酷触发策略”更严厉,并且更具备可信的威胁,而惩罚越严厉,合作机制就越稳定。由于这种严厉的威胁,某些在“冷酷触发策略”中无法维持的和平战略在“胡萝卜加大棒策略”下是能够维持的。“胡萝卜加大棒策略”增加了维持和平战略的可能性。因此,在国家交往中设置谅解机制是有利于维持和平稳定策略的。另外一点,正如德国首相俾斯麦所言:“国家之间没有永恒朋友,只有永恒的利益”,从国家利益的角度而言,设置谅解机制也是非常理智的做法。只要日本愿意正视历史,真诚的向中国人民道歉,在领土边界、历史遗留等问题上做出正确的选择,中国仍应该选择与日本保持对话,那种老死不相往来的外交战略既不现实也不科学。
总之,中日之间要想实现和平共处避免冲突必须坚持以上原则,即坚持以战略眼光审视中日关系,坚持求同存异的原则解决双方的分歧和矛盾,对于违背和平战略的参与方设置惩罚机制,最后如果违背和平战略的一方能醒悟,并从错误的道路或立场中走出来,另一方应该设置谅解机制,通过和平谈判,友好协商等办法,重新为实现地区和平而努力。
〔参考文献〕
[1]Aumann R J, Maschler M, Stearns R E. Repeated Games with Incomplete Information [M]. MIT Press, 1995, 66-70.
[2]Pilisuk M, Potter P, Rapoport A, et al. War hawks and peace doves: alternate resolutions of experimental conflicts [J]. Journal of Conflict Resolution, 1965:491-508.
[3]谢识予. 经济博弈论[M] .上海: 复旦大学出版社,2002,189-225
[4]Abreu D. External equilibria of oligopolistic super games [J]. Journal of Economic Theory, 1986, 39(1):191-225.
[5]田久川. 古代中日关系史[M].大连: 大连工学院出版社,1987,1-15
[6]封永平. 中日关系困境解读[J]. 国际论坛, 2006(01):36-40.
[7]吕晓莉, 钟准. 中日关系的历史困境及出路思考[J]. 国际论坛, 2009(01):41-45.
[8]张维迎. 博弈论与信息经济学[M] .上海:上海人民出版社,1996,213-228.
(责任编辑:周建瑜)
[中图分类号]F224.32
[文献标识码]A
[文章编号]1008-5955(2016)01-0099-06
[作者简介]卜振兴(1986-),男,江苏徐州人,南开大学博士研究生。
[基金项目]国家社科一般项目”明代中国朝鲜日本三国关系与东亚国际秩序研究”(12BZS037);教育部委托项目“日本核泄露对中国经济的影响及对策研究”(12JF016)。
[收稿日期]2016-01-05