牛新宇
完全信息动态多目标博弈优化模型及应用
牛新宇
利用多目标规划思想,通过子博弈精炼纳什均衡原理构建了完全信息动态多目标博弈模型。并针对优化模型进行了实例分析,为进一步深入研究动态多目标博弈问题提供了一种有效的分析方法。
博弈就是一些个人或组织面对一定的条件,在一定规则下从各自允许选择的行为或策略中加以选择并取得相应结果的过程。因此,在现实生活中,人们每天都会面临着博弈。在博弈中,博弈方之间进行的的往往是针对多个目标的博弈,即多目标博弈问题。近年来,很多学者对博弈方同时选择策略的静态多目标博弈的研究较多,相继出现了一些研究成果。但是实际问题中的许多决策活动往往是依次选择策略,而并不是同时选择策略。由于后决策者在选择策略时已经观察到先决策者的策略,因此这种决策问题构成的博弈与静态多目标博弈有很大的区别,称它们为动态多目标博弈。由此可见,研究动态多目标博弈具有更重要的现实意义。
动态博弈指参与人不是同时,而是先后选择博弈行为,且后行动者能够观察到先行动者的选择行为。如商业活动中的讨价还价,拍卖活动中的轮流竞价。完全信息动态博弈的常用描述方式是扩展式博弈。从扩展式博弈中不仅可以看到博弈的结果而且可以看到博弈的进程。扩展式博弈的最优策略组合是一个子博弈精炼纳什均衡。 “子博弈”是原博弈的一部分,可以作为独立的博弈进行分析。子博弈精炼纳什均衡不仅是原博弈的纳什均衡而且是每一个子博弈的纳什均衡。
在此,假设动态多目标博弈分为两个阶段,在n个参与人中,M={1,2,…,m}是主动者的集合,Q={m+1,m+2,…,n}是从动者集合。
基于以上理论,建立动态多目标博弈优化模型如下:
求x∈X ,使
某城市有两个生产商生产相同的某种产品,厂商之间进行的是产量竞争.厂商1首先选择产量q1,厂商2在选择产量q2时能够观测到q1。假设生产商只关心利润和风险两个目标。两个生产商如何选择产量才能使彼此获得预期利润的同时,尽量减少风险带来的损失呢?
根据上述假设可知,两厂商的利润函数分别为:
厂商1的预期目标:利润不低于10,风险不高于4;
厂商2的预期目标:利润不低于7,风险不高于2。
如前述得动态多目标博弈优化模型:
由于考虑到在一般情况下,厂商在利润和风险两个目标上,更希望最先满足的是利润这个目标值;因此,在模型中将利润目标的优先等级设定为较高的优先等级,只有在利润这个目标满足的基础上,才能考虑风险所对应的目标。
对上述模型求解:得q1=3,q2=2,于是,取策略组合(3,2)作为该动态多目标博弈问题的最优策略。这个结果也反映了两个厂商所处的地位不对称带来的作用。因为厂商1具有“先动优势”,从而使厂商1能通过选择较大的产量得到较多的利益。
本文将多目标规划思想运用到多目标博弈中,通过子博弈精炼纳什均衡原理构建了完全信息动态多目标博弈模型。模型即考虑了博弈方选择策略行为的顺序,又兼顾了各个目标之间的主次轻重。最后,针对具体博弈实例进行分析,进一步说明了模型解的合理性和实用性。
10.3969/j.issn.1001-8972.2015.17.021