摘要:本文分析了2×2矩阵博弈中的混合策略均衡,讨论了此类博弈的严格优势策略和纯策略均衡,得到了在没有严格优势策略且存在唯一均衡的2×2矩阵博弈中,均衡必为混合策略均衡。
关键词:矩阵博弈; 严格优势策略; 均衡
博弈论是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。如今,博弈论在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
均衡是博弈论一个重要研究对象。均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。1951年纳什提出著名的纳什定理,即在矩阵博弈中一定存在均衡。这里的均衡可能是纯策略均衡,也可能是混合策略均衡。
2×2矩阵博弈是一类最基本且被广泛应用的重要博弈类型,它是指在博弈过程中只有两个参与人(参与人1和参与人2),且每个参与人只有两个可选策略。经典博弈诸如囚徒困境、性别战争、古诺双寡头垄断、贝特兰德双寡头垄断等博弈都可以归为此类博弈。
本文分析了2×2矩阵博弈中的混合策略均衡,讨论了此类博弈的严格优势策略和纯策略均衡,得到了在没有严格优势策略且存在唯一均衡的2×2矩阵博弈中,均衡必为混合策略均衡。
考虑2×2矩阵博弈。对于参与人1和参与人2,参与人1的可选策略为U和D,参与人2的可选策略为L和R。他们的收益情况如下:
(1)当参与人1选择策略且参与人2选则策略时,他们的收益分别为和;
(2)当参与人1选择策略且参与人2选则策略时,他们的收益分别为和;
(3)当参与人1选择策略且参与人2选则策略时,他们的收益分别为和;
(4)当参与人1选择策略且参与人2选则策略时,他们的收益分别为和。
我们可以用如下的矩阵表示:
其中第一列表示参与人1的可选策略,第一行表示参与人2的可选策略,收益中前者为参与人1的收益,后者为参与人2的收益。
设参与人1选取策略的概率为,参与人2选取策略的概率为。这样,参与人1选取策略的概率为,参与人2选取策略的概率为。
可见,对参与人1而言,选取策略的期望收益为,选取策略的期望收益为,于是参与人1选取策略和策略无差异当且仅当。令表示参与人1对参与人2随机化概率的反应函数。则
类似地,对参与人2而言,选取策略的期望收益为,选取策略的期望收益为,于是参与人2选取策略和策略无差异当且仅当。令表示参与人2对参与人1随机化概率的反应函数。则
在博弈中,参与人的严格优势策略是使得参与人选取该策略所获收益严格大于选取其他策略所获收益。在2×2矩阵博弈中,严格优势策略具有如下特征:
对参与人1而言,策略严格优于策略当且仅当;策略严格优于策略当且仅当。
对参与人2而言,策略严格优于策略当且仅当;策略严格优于策略当且仅当。
由于均衡是每个参与人对其对手策略选择的最优反应,则在2×2矩阵博弈中,纯策略均衡具有如下特征:
是均衡当且仅当且;是均衡当且仅当且;是均衡当且仅当且;是均衡当且仅当且。
定理 在2×2矩阵博弈中,如果不存在严格优势策略,且存在唯一的均衡,则此均衡必为混合策略均衡。
证明 (反证法)假设此博弈中唯一的均衡是纯策略组合,设为,不失一般性,取,对策略组合,和可类似地讨论。由于是均衡当且仅当且。对此分情况进行讨论。
(1)且。由于对参与人1而言,策略不严格优于策略,则,于是;对参与人2而言,策略不严格优于策略,则。于是策略组合是博弈中的一个均衡,这与是唯一的均衡矛盾。
(2)且。此时,则,于是存在使得,即,从而令参与人1选取策略的概率为,可见混合策略组合是博弈的一个均衡,其中表示参与人1以概率选取策略,以概率选取策略,表示参与人2选取策略。这与是唯一的均衡矛盾。
(3)且。此时,则,于是存在使得,即,从而令参与人2选取策略的概率为,可见混合策略组合是博弈的一个均衡,其中表示参与人1选取策略,表示参与人2以概率选取策略,以概率选取策略。这与是唯一的均衡矛盾。
(4)且。此时若策略组合不是均衡,则;若策略组合不是均衡,则。这样策略组合是博弈的一个均衡,与是唯一的均衡矛盾。
综上可知,策略组合不是此博弈的均衡,从而此2×2矩阵博弈的均衡必为混合策略组合。
参考文献:
[1]车竞,钱炜祺,和争春.基于矩阵博弈的两机攻防对抗空战仿真[J].飞行力学,2015,33(2): 173-177.
[2]马国勇,石春生.基于博弈矩阵模型的企业研发策略[J].统计与决策,2012,1: 54-55.
[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall,1994.
[4]D.Fudenberg,J.Tirole.Game Theory[M].MIT Press,1991.
[5]张维迎.博弈与社会[M].北京大学出版社,2013.
作者简介:
史艳维(1980- ), 女, 陕西西安人, 讲师, 主要从事博弈论与应用非标准分析方向的研究。