龚谊承+杨雨燕+牛晓梦
摘要随着经济的快速发展,分布式能源成为重点发展的对象.供应商也在慢慢地增多,为了优化分布式能源供应市场的结构,有必要对分布式能源供应商的合作与竞争展开理论研究.按照行为主体在合作中的主观偏好不同,将分布式能源供应商划分为互惠主义者和机会主义者两类.并据此展开了4个方面的研究.首先,在静态博弈的框架下,构建
了两种类型供应商在合作和背叛两种可选策略下的模型;然后,应用演化博弈的知识来分析机会主义行为的演化,依据复制动态方程得到了供应市场的演化均衡状态;接着,分析惩罚条件下机会主义行为的演化,从而找到消除机会主义行为的惩罚力度的范围,有利于促进市场良好状态的形成;最后,通过给予假设参数符合条件的具体数值,来模拟出时间与分布式能源机会主义供应商占总供应商比例的关系,更直观地展示了的理论分析结果,便于政策制定者参考.
关键词能源经济学;分布式能源;演化博弈;机会主义;互惠主义
中图分类号F273 文献标识码A
The Survival of Reciprocial Distributedenergy
Enterprises in the Environment of Competition
and Cooperation with Some Opportunists
GONG Yicheng ,YANG Yuyan, NIU Xiaomeng
(1. Science College, Wuhan University of Science and Technology ,Wuhan430065 , China;2 . Hubei Province Key
Laboratory of Systems Science in Metallurgical Process, Wuhan University of Science and Technology, Wuhan430065 , China)
AbstractAccording to some preferences, distributed energy suppliers were classified into two types: suppliers with reciprocity and opportunism. Based on the classification, four aspects of jobs were done. First, a static game model of the two types of suppliers was bulit with two strategies of cooperation and betrayal. Second, the evolution of opportunistic behavior and the evolution of the supply market equilibrium were analyzed by using the knowledge of the evolutionary game theory and replicator dynamic equations. Third, under the condition of punishment, the evolution of opportunistic behavior was analyzed ,which benefits to find the range of penalties that can help eliminate opportunistic behavior and then promote the formation of the market in good condition. Moreover, by giving the parameters some concrete numbers, a numerical example was simulated to visualize the relationship between the time and the proportion of opportunistic distributed energy supplier to total supplier, which can provide the reference for the decision makers.
Key wordsEnergy Economy; Distributed energy; Evolutionary game; Opportunist ;Reciprocitarian.
1引言
能源的消耗随着经济的飞速发展而快速增加.受制于能源的有限性,提高能源利用率
受到人们的重视,建立分布式能源系统作为可行的解决方案之一而备受关注.分布式能源与我国传统能源集约化发展模式存在着较大的差异,它立足于本地资源,平衡终端需求,区域性能源(电,冷,热)的产、储、配、供、控一体化服务体系[1-6].分布式能源是指分散存在的可再生能源和清洁能源,具有能效利用合理、损耗小、污染少、运行灵活,系统经济性好等特点.随着分布式能源供应商慢慢地增多,为了优化分布式能源供应市场的结构,研究分布式能源供应商的合作与竞争则越来越有必要了.不同的供应商有不同的偏好,这些偏好决定了他们会倾向于采取的策略,因此讨论各种偏好下的供应商在采取不同的策略时的收益情况有利于使分布式能源的发展形势更明朗[7,8].将分布式能源供应商归纳为有互惠主义偏好的和有机会主义偏好两种.考虑到行为人很难符合完全理性的假设,可能会缺乏选择最优策略的必要经验,所以考虑的行为人是有限理性的,会有一个对成功策略进行观察和模仿的动态过程,并且会不断地去尝试新的策略.通过分析模型,探讨了分布式能源的供应中,互惠主义供应商能否存在下去,是否会充满整个分布式能源供应市场.由于分析中发现机会主义行为对市场是不利的,所以接着寻找消除机会主义行为的措施,并尝试进行了给机会主义供应商一定的处罚的博弈分析.为了促进分布式能源供应市场的发展,旨在通过分析机会主义的演化,来找到惩罚的度,有利于满足用户的用电需求,有利于整个社会的发展,缓解环境问题.endprint
经济数学第 32卷第3期
牛晓梦等:分布式能源中互惠主义在机会主义环境下的存活
2问题描述
在电力市场中,两类供应商在与其他供应商交互时,都有两种可选的策略:合作或背叛.其中,合作是指:双方共同进行能源供给的创新,共同对价格、产量进行制定,且双方都遵守约定,共同对生产进行投资.背叛是指:不遵守达成的协议,按照自己的意愿来采取行动.因此,分布式能源系统中可能存在三种类型的交互:其一,两个互惠主义供应商交互;其二,两个机会主义供应商交互;其三,互惠主义供应商与机会主义供应商的交互.因为参与者有不同的偏好,所以在两供应商分别采取合作和背叛时,他们的支付会不同.若机会主义供应商采取合作的策略,则他会跟一个互惠主义供应商表现一样,不仅采取合作的行为而且信息共享;若机会主义供应商采取背叛策略,则他会尽量让自己的信息不公开而且会努力去获取与自己对局的供应商的信息,之后就会采取故意提高(压低)价格等一系列对自己有益的行为来获取短时间的利益,并且持续地去找新的合作供应商;若互惠主义供应商采取背叛的策略,因为供应商本身有互助互利的偏好,所以他还会对外公开自己的信息,但是在获取与自己对局的供应商的信息时以及意识到对方采取不合作策略时,他也会采取不合作的策略,这是一个学习的过程.
假设两个分布式能源供应商在交互中相互不合作也不互相公开信息,这时,他们可以分别获得R的收益;两供应商都合作时,为每个供应商带来了S的超额利润;供应商合作付出的成本为C(S>C);当获得与自己对局的供应商的信息时,可以为自己带来F1的效用;如果供应商单方面公开信息会产生F2的负效用.由此可得,两个互惠主义供应商博弈,两个机会主义供应商博弈,一个互惠主义供应商和一个机会主义供应商博弈时的支付表分别如下面的表1,表2,表3所示.
3无惩罚措施情形下的互惠
与机会主义厂商的演化博弈分析
3.1分布式能源供应商博弈模型分析
由表1,表2,表3,分析可知,三种类型的博弈都有两个纯策略纳什均衡:(合作,合作),(背叛,背叛),所以参与者就会采取混合策略.如果两个机会主义供应商进行博弈,两供应商选择合作策略的概率都是C+F2S+F2,期望收益相同,都是F1(C+F2)S+F2+R.当两个互惠主义供应商进行博弈时,两供应商选择合作策略的概率都是CS,两供应商的期望收益也相同,都是R+F1.当一个机会主义供应商和一个互惠主义供应商进行博弈时,两供应商选择合作策略的概率都是CS,机会主义供应商的期望收益是R+F1,互惠主义供应商的期望收益是C(F1+F2)S+R-F2.
3.2分布式能源供应商机会主义行为的演化
如果在分布式能源供应商这个群体中,机会主义供应商占总体的比例为r,那么,互惠主义供应商的比例为1-r.供应商之间是不能识别彼此的类型的.因此,对于一个机会主义供应商,他与另一个机会主义供应商博弈的概率为r,收益为F1(C+F2)S+F2+R,与互惠主义供应商博弈的概率为1-r,这时的收益为R+F1.机会主义供应商的期望收益为
E0=r(F1(C+F2)S+F2+R)+(1-r)(R+F1).
互惠主义供应商的期望收益为
Er=r(C(F1+F2)S+R-F2)+(1-r)(R+F1).
供应商的平均期望收益为
E=rE0+(1-r)Er. (1)
根据复制者动态方程[9],机会主义供应商占所有供应商的比例变化率如式(2)所示,
F(r)=drdt=r(E0-E).(2)
由式(2)可知,若机会主义供应商的期望收益比供应商的平均收益高,则变化率是一个大于0的数值,说明机会主义供应商的比例递增,相反,如果机会主义供应商的期望收益比供应商的平均收益低,变化率是一个小于0的数值,说明机会主义供应商的比例在递减.把E0和E代人到式(2)中,得:
F(r)=r2(1-r)F2(S-C)(F2+F1+S)S(S+F2). (3)
由前面的假设知:
S>C,所以F2(S-C)(F2+F1+S)S(S+F2)>0,所以(3)的演化稳定均衡点为:r=1.由此可得,该结果与分布式能源供应商的初始结构无关,除了刚开始都是互惠主义供应商外,整个市场将会慢慢演化成只有机会主义供应商构成.
3.3机会主义行为模型的演化图示结果
据文献中介绍的方法画F(r)=r2(1-r)[10]的图,如图1所示.
因为F2(S-C)(F2+F1+S)S(S+F2)是一个大于0的常数,所以不改变图形的走向,从图1中可以看出,会慢慢地趋近于r=1,与理论分析结果一致.
4监督惩罚下机会主义的演化
从上面的分析可看出,分布式能源供应商最终会被机会主义供应商侵入,这是一个对社会发展不利的存在状态,所以必须采取一些措施来预防这种情况的出现.比如:对机会主义供应商采取惩罚措施等.可以通过提前拟定合约,在合约中规定好违约应承担的赔偿,从而来对背叛方进行惩罚;还可以制定一些社会制度来惩罚背叛者等.在这里,假设背叛者受到L的惩罚,分别在上面介绍的3个表表示的支付中背叛者的收益减去L就可以获得在监督惩罚下不同偏好供应商两两博弈时的支付,注意,L的大小代表惩罚力度的强弱,接下来分析不同惩罚力度下机会主义的演化情况[11].
1)当惩罚力度L满足0 经过分析,表格经调整后的三种类型的博弈结果都有两个纯策略纳什均衡分别是:(合作,合作),(背叛,背叛),则参与的供应商会选择采取混合策略.在两个机会主义类型供应商对局时,两个供应商选择合作策略的概率相同,都为C+F2-LS+F2,得到的期望收益也相同,为F1(C+F2-L)S+F2+R-L.两个互惠主义供应商对局时,两供应商选择合作策略的概率相同,为C-LS,获得的期望收益都为R+F2-L.一个机会主义供应商和一个互惠主义供应商对局时,两供应商选择合作策略的概率都是C-LS,机会主义供应商的期望收益是R+F1-L,互惠主义供应商的期望收益为: (C-L)(F1+F2)S+R-F2-L.
因此,机会主义供应商最后的期望收益是
E0=r(F1(C+F2-L)S+F2+R-L)+(1-r)(R+F1-L).
互惠主义供应商最后的期望收益为
Er=r((C-L)(F1+F2)S+R-F2-L)+(1-r)(R+F2-L) 由上述公式(1)和(2)可得机会主义供应商占全部供应商比例变化率如式(4)所示.
F(r)=r2(1-r)F2(S-C+L)(F2+F1+S)S(S+F2). (4)
因为F2(S-C+L)(F2+F1+S)S(S+F2)大于零,演化稳定均衡点为:r=1.这个结果与式(3)的结果是一样的,最终的状态没有得到改善.
2)当惩罚力度L满足C 在两个机会主义供应商博弈这种类型中,有两个纯策略纳什均衡:(合作,合作),(背叛,背叛),参与博弈的供应商会选择混合策略,两供应商选择合作策略的概率相同,都为C+F2-LS+F2,期望收益也相同,为F1(C+F2-L)S+F2+R-L.两个互惠主义供应商博弈或一个机会主义供应商与一个互惠主义供应商博弈这两种类型存在惟一的纯策略纳什均衡:(合作,合作),参与博弈的供应商的收益都是R+F1+S-C.所以,机会主义供应商的期望收益是 E0=r(F1(C-F2-L)S+F2+R-L)+(1-r)(R+S+F1-C)互惠主义供应商的期望收益是R+F1+S-C.用到上面的公式(1)(2)可以算出机会主义供应商在所有供应商中的比例变化率如式(5)所示. F(r)=r2(1-r)[(F1(C+F2-L)S+F2+R-L)-(R+S+F1-C)].(5) 因为两机会主义供应商选择合作的收益大于两供应商选择混合策略的期望收益,所以 (F1(C+F2-L)S+F2+R-L)-(R+S+F1-C)<0. 演化均衡点为:r=0,所以由这个结果可以看出,演化稳定的状态跟分布式能源供应商的初始状态无关,机会主义供应商最终都会消失. 3)当惩罚力度L满足L≥C+F2时 在这种情况下,三种类型博弈中机会主义供应商和互惠主义供应商最优策略是(合作,合作),两供应商的期望收益都是R+F1+S-C,且机会主义供应商在合作时与互惠主义供应商是一样的,所以机会主义供应商占群体的比例并不会发生改变. 5数值的模拟 前面对分布式能源供应商进行随机匹配交互讨论时,在没有受到惩罚和惩罚背叛者两种情况下,做了理论上的分析.为了更直观地显示分析结果,接下来用数值模拟的方法来分析上面的模型,便于决策制定者参考.在分布式能源供应市场中,供应商的偏好是无法彼此识别的.图2表示的是无惩罚情况下的模拟图,图3,图4,图5分别表示在不同惩罚力度情况下的模拟图. 根据上面所建立的模型,假设R=5,S=4,C=3,F1=1,F2=2,其中,满足了S>C的这个限制条件. 5.1无惩罚机制的数值模拟 由上面的各假设的参数可算出系统(3)中F2(S-C)(F2+F1+S)S(S+F2)=712,所以系统(3)的数值结果图如图2所示. 时间t 其中,图2中的横坐标为时间t,纵坐标为机会主义供应商占分布式能源供应商总体的比例r,由该图可看出,在无惩罚机制的情况下,均衡点为r=1,即分布式能源供应市场最终的状态是全部由机会主义供应商构成,机会主义供应商将会泛滥于整个市场中,且最终的状态与刚开始时市场的结构是无关的,不管刚开始机会主义供应商占市场的比例多么小,都不会改变机会主义供应商稳定于供应市场的事实.除非一开始就不存在机会主义供应商,即市场中都是互惠主义供应商,这是一种理想的状态,但是这几乎是不可能的,因为初始的市场状态不可能只存在互惠主义供应商.市场最终会被机会主义供应商充满的这个结果,是不利于市场的发展的,必须通过对其实施处罚来抑制机会主义的肆意泛滥.但是惩罚的度也会影响市场的演化结果,接下来,分别来模拟不同惩罚下市场的演化过程. 5.2惩罚机制下的数值模拟 在受到惩罚时,之前假设的数值R,S,C,F1,F2都保持不变,讨论受到惩罚L的大小,分析不同L对应的数值模拟结果,得出相应的结果. 1)当惩罚力度L满足0 假设L=2,则由假设的参数可算出系统(1)中F2(S-C+L)(F2+F1+S)S(S+F2)为74,数值结果如图3所示. 由图3可看出,在这种惩罚力度的情况下,不能改变市场最终由机会主义供应商所占据的结局.它与在无惩罚条件下是类似的,由此得出结论,在0 假设L=4,则由假设的参数可算出系统(2)中(F1(C+F2-L)S+F2+R-L)-(R+S+F1-C)=-356,数值结果如图4所示. 时间t图4惩罚力度L=4时机会主义行为的演化 由图4可看出,在这种惩罚力度的情况下,可以改变市场最终由机会主义供应商所占据的结局.图中显示的均衡点是r=0,即市场最后演化稳定于都是互惠主义供应商的状态.由此得出结论,在C
3)当惩罚力度L满足L≥C+F2(L≥5)时
假设L=5,则由假设的参数可算出系统(3)中E0-E为0,数值结果如图5所示.
时间t
由图5可看出,在这种惩罚力度的情况下,不能消除机会主义供应商,机会主义供应商占分布式能源供应商总体的比例跟初始状态有关,之后也会一直保持不变.所以,最终的演化结果与初始市场状态是相同的.在L≥C+F2该范围内的惩罚下,不能遏制机会主义供应商的出现,会使机会主义供应商以初始所占的比例保持不变演化下去.每个时间的市场结构都跟初始的结构是一样的.
6结束语
综合上述研究,可以发现互惠主义在一定的外力条件下可以在机会主义环境中存活下去.比如:所讨论的分布式能源供应市场里,当分布式能源供应商无法识别与自己交互的供应商属于什么偏好时,最终博弈演化的结果是只有机会主义供应商存在.显然,这样的结果是不利于分布式能源的发展的.所以,针对这个问题,应对措施是给予机会主义供应商一定的惩罚,这样可以抑制机会主义行为的泛滥.但是,通过分析,惩罚的力度应该是适当的,并不是理所当然地越大越好.当惩罚的力度太小且低于合作的成本时,仍然不能改变机会主义供应商最终充满市场的局面.而当惩罚过大时,超过了合作的成本跟单方面公开信息时带来的负效应的和时,机会主义会以不变的比例继续存在下去.只有惩罚在一定的范围(如上所讨论的)内,机会主义供应商才会在分布式能源供应商群体中慢慢消失,这是对分布式能源的发展有益的,有利于形成一个良好的分布式能源供应市场.
参考文献
[1]金东寒.中国分布式能源发展现状及展望[J].环球市场信息导报,2014(5):58-62.
[2]晁毓山.[十二五]规划绘就新能源产业发展蓝图[J].经济视角,2011(13):6-7.
[3]黎灿兵,刘文灿,曹一家等.管制市场中激励分布式能源发电的电能虚拟存储政策[J].中国电机工程学报,2014(19):3141-3147.
[4]王睿淳,吴集光,曾鸣等.内蒙分布式能源交易模式研究[J].电子世界, 2014 (20): 487- 488.
[5]刘芬芳,谢忠镖 .多晶硅产业政策研究[J].昆明冶金高等专科学校学报.2010,26(3):64-69.
[6]肖钢,张敏吉著.分布式能源-节能低碳两相宜[M].武汉:武汉大学出版社,2012:39-108.
[7]Guttman J M. On the evolutionary stability of preferences for reciprocity[J] .European Journal of Political Economy, 2000(16):31-50.
[8]Petit M L, Tolwinski B.R&D cooperation or competition[ J] .European Economic Review, 1998(43):185-208.
[9]Cressman R. The stability concept of evolutionary game theory: a dynamic approach[ M] . Berlin Heidelberg: SpringerVerlag,1992: 14-17.
[10]Anderhub V, Engelmann D, Guth W. An experimental study of the repeated trust game with incomplete information[ J] . Journal of Economic Behavior &Organization, 2002(48):197-216.
[11]马赞用,湛冰.电子商务与传统商务发展趋势的博弈分析[J].经济数学,2013,30(3):1-5.endprint