郑万波,陈慧敏*,吴燕清,夏云霓
(1.昆明理工大学 理学院,昆明 650500;2.重庆大学 资源与安全学院,重庆 400044;3.重庆大学 计算机学院,重庆 400044)
突发事件是指突然发生,造成或者可能造成重大人员伤亡、财产损失、生态环境破坏和严重的社会危害,危及公共安全的紧急事件[1],它具有突发性、社会危害性等特性。
在如今的大数据时代,信息已渗透到生活中的每一处,信息共享必不可少。在应急救援领域,及时、全面的信息共享对应急响应与灾后重建具有重要作用,而且有助于极端环境中最大限度地减少处理信息所需的认知努力[2]。信息共享包括统筹协调资源的决策信息、应急响应信息与现场资源信息[3],可以实现管理者与系统之间的协调管理,提高事故的应急响应能力[4],还可以使云机器人技术与通信技术完美结合,促进灾难响应方面的巨大进步[5]。在其他领域,Baek等[6]使用神经影像学证明了共享行为在神经元活动中的重要价值;辛本禄等[7]证实了信息共享具有中介作用,这都体现了信息共享存在的必要性。
此外,学者们又从多个角度对信息共享进行了研究分析。王先甲等[8]在模型中加入了“信任因子”用来预测信息共享的问题;张卫华等[9]基于系统资源共享的理念设计了合理的资源调度;黄克振等[10]认为情报的共享利用可以提高防守方的响应能力;Khan 等[11]首次在持续供应链模型中引入信息共享,实现了环境、社会成本在库存模型中的量化;Solak 等[12]在信息安全系统的背景下开发了一个信息共享决策框架,并给出了预算和预期成本的最优函数;张川等[13]利用Stackelberg 博弈研究了不同平台上各潜在需求之间的信息共享策略;贾俊秀等[14]对电子零售商的信息共享进行研究,认为信息共享是电商的最佳策略;Liu 等[15]针对敏感信息易泄露的问题,研究出了一种基于双线性映射累加器的可编辑签名方案(Bilinear-Map Accumulator based Redactable Signature Scheme,RSS-BMA);葛琳等[16]针对信息共享过程中数据易受影响的问题,建立了基于拜占庭容错机制共识算法的信息共享安全框架。
信息共享能在一定程度上提高信息资源利用率,减少在信息采集、存贮和管理上的浪费,高效的信息共享对各行各业的数据供应起着重要作用。因此本文基于三方演化博弈理论,以政府参与为首要前提,以信息共享所产生的利益为评判标准,利用计算机软件模拟仿真不同约束条件下各参与主体的行为策略演化过程与结果,并探讨了相对应的最优信息共享策略。
本文从收益角度研究应急事故灾难发生时,以事故频发的高危生产企业(以下简称高危企业)为例,应急救援信息传递的各参与者之间的应急救援信息共享行为,综合考虑各参与者决策的突发事故灾难应急救援信息共享作用机制。作出以下假设:
假设1 突发事故灾难应急救援信息传递的参与者包括高危企业、应急救援队伍和政府监管部门。高危企业采取积极策略的比例为x(0 ≤x≤1),消极策略的比例为1-x;应急救援队伍采取积极策略的比例为y(0 ≤y≤1),消极策略的比例为1-y;政府监管部门采取积极策略的比例为z(0 ≤z≤1),消极策略的比例为1-z。其中采取积极策略是指该参与者选择积极共享应急救援信息(包括救援人员、救援装备、事故发生地环境状况等),使得救援任务快速有效地展开,从而获得正向收益;另外,采取消极策略是指该参与者选择消极共享或者不共享应急救援信息,这使得救援过程中关键信息缺失,救援进程缓慢,从而产生相关的负向收益。
假设2 事故发生时,高危企业采取积极策略时可获得声誉等正向收益e1,共享信息的成本与事故本身对企业造成的损失等共c1;当高危企业采取消极策略时产生负面影响与事故本身对企业造成的损失共n1。事故发生时,应急救援队伍采取积极策略时可获得社会认可度等正向收益e2,共享信息的成本与事故本身对应急救援队伍造成的损失等共c2;应急救援队伍采取消极策略时产生撤资等负面影响与应急救援队伍在事故中的损失共n2。事故发生时,政府监管部门采取积极策略时可获得社会影响力等正向收益e3,共享信息的成本与事故本身对政府监管部门造成的损失等共c3;政府监管部门采取消极策略时的负面影响与事故本身对政府监管部门造成的损失共n3。
假设3 特别地,当只有高危企业/应急救援队伍采取积极策略时,可获额外奖励σ,奖励由政府监管部门给出;当参与者都选择积极策略时,存在利益加成系数α(α>1);当参与者都选择消极策略时,政府监管部门需额外付出成本υ进行补救。
假设4 高危企业与应急救援队伍的决策具有独立性,不考虑各参与者之间的联动性和政府监管部门对这两方的影响。
结合基本假设和相关参数设定,可得信息共享参与者的支付矩阵,如表1 所示。
表1 应急救援信息共享演化博弈模型的支付矩阵Tab.1 Payoff matrix of evolutionary game model of emergency rescue information sharing
由表1 可知,积极策略比消极策略的收益更为显著,因此下文侧重于对参与者采取积极策略概率的研究。
1)设高危企业采取积极、消极策略时的适应度分别为E11和E12,则高危企业的平均适应度为:
2)设应急救援队伍采取积极、消极策略时的适应度分别为E21和E22,则应急救援队伍的平均适应度为:
3)设政府监管部门采取积极、消极策略时的适应度分别为E31和E32,则政府监管部门的平均适应度为:
根据演化博弈理论,讨论参与者三方之间的系统演化稳定性仅需考虑E1(0,0,0)、E2(0,0,1)、E3(0,1,0)、E4(1,0,0)、E5(1,1,0)、E6(1,0,1)、E7(0,1,1)和E8(1,1,1)八个纯策略点的渐近稳定性,其余的混合策略点一定不是稳定均衡点[17]。在式(4)中分别对x、y、z求偏导,可求得雅可比矩阵如式(5)所示,计算各均衡点的三个特征值λ1、λ2、λ3,结果如表2所示。
表2 纯策略均衡点的雅克比矩阵的特征值Tab.2 Eigenvalues of Jacobian matrix of pure strategy equilibrium points
由李雅普诺夫判别法可知,当均衡点所对应的雅克比矩阵的所有特征值都为负数时,该均衡点为系统的渐近稳定点;当均衡点所对应的雅克比矩阵的特征值都为正数或有正有负时,该均衡点为不稳定点。下文将分场景分析均衡点。
场景1 采取积极策略所需花费成本极大,大于采取积极策略获得的正向收益、额外奖励、采取消极策略产生的负面影响、政府监管部门的额外补救成本之和,即满足e1-c1+n1+σ<0,e2-c2+n2+σ<0,e3-c3+n3+υ<0。此时的稳定点分析如表3 所示,相位图如图1(a)所示,最终博弈结果为(0,0,0)。表3 中“-”表示结果为负,“+”表示结果为正,“?”表示结果正负无法判断,ESS(Evolutionarily Stable Strategy)表示演化策略稳定点。表3~6 相同,不重复解释。
图1 不同场景下的相位图Fig.1 Phase diagrams under different scenes
表3 收益极低时的稳定点分析Tab.3 Stability point analysis at very low revenue
场景2 采取积极策略花费成本大于采取积极策略获得的收益与采取消极策略产生的负面影响之和,且只有高危企业或应急救援队伍采取积极策略的额外奖励σ较大,即满足e1-c1+n1+σ>0,ei-ci+ni<0(i=1,2,3)。此时的稳定点分析如表4 所示,相位图如图1(b)所示,最终达成的博弈结果为(1,0,0),即高危企业愿为达成合作而选择承担相应的风险。
表4 收益低而额外奖励较高时的稳定点分析Tab.4 Stability point analysis at low revenue and high etra rewards
场景3 采取积极策略所需花费成本大于采取积极策略获得的正向收益与采取消极策略产生的负面影响之和,政府监管部门需额外付出成本υ较大,即满足ei-ci+ni<0(i=1,2,3),e3-c3+n3+υ>0。此时的稳定点分析如表5 所示,相位图如图1(c)所示,最终达成的博弈结果为(0,0,1),即政府监管部门愿为达成合作而接受相应的风险。
表5 收益低而额外成本较高时的稳定点分析Tab.5 Stability point analysis at low revenue and high extra cost
场景4 采取积极策略获得的正向收益与采取消极策略产生的负面影响之和大于采取积极策略所需花费成本,即满足ei-ci+ni>0(i=1,2,3)。此时的稳定点分析如表6 所示,相位图如图1(d)所示。最终达成的博弈结果为(1,1,1),即三方参与者此时合作成本较低,获得的收益达到甚至超过预期。
表6 收益极高时的稳定点分析Tab.6 Stability point analysis at very high revenue
由于应急救援场景下的实际数据获取存在较大难度,故本文针对具体场景对各参数进行赋值,进一步对第3 章所得结论进行仿真验证。
场景1 采取积极策略时收益极低。
为满足采取积极策略所需花费成本极大,大于采取积极策略获得的正向收益、额外奖励、采取消极策略产生的负面影响、政府监管部门的额外补救成本之和,设置参数e1=5,c1=14,n1=3,e2=3,c2=10,n2=3,e3=4,c3=12,n3=3,σ=2,α=1.2,υ=3。
初始意愿的概率皆为0.99,时间T的范围为[0,4],参与者三方博弈的数值仿真结果如图2(a)所示。其中:x为高危企业采取积极策略的概率;y为应急救援队伍采取积极策略的概率;z为政府监管部门采取积极策略的概率;T为迭代所用的时间。场景2~4 同理,不再重复说明。
图2 不同场景下的积极共享概率对比Fig.2 Active sharing probability comparison under different scenes
由图2(a)可知,在假设的场景1 环境下,最终的演化稳定点为(0,0,0),即高危企业、应急救援队伍和政府监管部门的行为策略表现为消极共享应急救援信息,演化策略集为{消极共享,消极共享,消极共享}。说明突发事件发生时,若判断出成本投入花费较大而采取积极策略的收益较低,则各部门、单位都将以较快的速度选择消极共享,极大程度地保护自己的财产安全。
场景2 积极策略收益低而额外奖惩较高。
为满足采取积极策略所需花费成本大于采取积极策略获得的正向收益与采取消极策略产生的负面影响之和,且只有高危企业/应急救援队伍采取积极策略可获的额外奖励σ较大,设置参数e1=10,c1=14,n1=3,e2=7,c2=10,n2=1,e3=6,c3=13,n3=2,σ=4,α=1.2,υ=2。初始意愿的概率皆为0.1,时间T的范围为[0,5],参与者三方博弈的数值仿真结果如图2(b)所示。
由图2(b)可知,在假设的场景2 环境下,演化稳定点趋向于(1,0,0),即最终演化的策略稳定表现为高危企业采取积极共享,应急救援队伍和政府监管部门采取消极共享。
突发事故发生时采取积极策略的收益低,但仅有自己采取积极策略可获得巨大的奖励对高危企业具有较大的吸引性。因此,高危企业趋向于选择积极共享信息。演化前期,高危企业积极共享的概率上升速度较快,达到0.9 后发生转变,上升趋势变缓。额外奖惩的提高对应急救援队伍的吸引力较小,其策略选择产生了短暂的波动,积极共享概率先上升到0.2,然后下降直到变成0。而政府监管部门需支出额外给予其他参与者的奖励,对自身收益影响较小。因此其积极共享的概率快速下降至0。
场景3 积极策略收益低而额外成本较高。
采取积极策略所需花费成本大于采取积极策略获得的正向收益与采取消极策略产生的负面影响之和,政府监管部门需额外付出成本υ较大,设置参数e1=10,c1=14,n1=3,e2=7,c2=10,n2=1,e3=8,c3=13,n3=2,σ=2,α=1.2,υ=5。初始意愿的概率皆为0.1,时间T的范围为[0,8],参与者三方博弈的数值仿真结果如图2(c)所示。
由图2(c)可知,在假设的场景3 环境下,最终的演化稳定点趋向于(0,0,1)。突发事故发生时,若判断参与者三方选择积极策略的概率较小,则政府监管部门需要支出巨额成本用来进行现场补救,为避免现场失控、持续性伤害等大量损失。因此,政府监管部门会较快地选择积极共享策略。虽然政府的额外支出对高危企业与应急救援队伍不产生直接影响,但是政府监管部门采取积极策略使得高危企业积极共享的意愿产生了波动,其积极共享的意愿升至0.2 后达到峰值,随后逐渐降低,直至完全拒绝信息共享,呈现出政府监管部门积极共享、其他两方消极共享的稳定局面。
场景4 采取积极策略时收益极高。
为满足采取积极策略获得的正向收益与采取消极策略产生的负面影响之和大于采取积极策略所需花费成本,设置参数e1=10,c1=4,n1=5,e2=8,c2=3,n2=4,e3=12,c3=4,n3=6,σ=3,α=1.2,υ=5。初始意愿的概率皆为0.1,时间T的范围为[0,2],参与者三方博弈的数值仿真结果如图2(d)所示。
由图2(d)可知,在假设的场景4 环境下,最终的演化稳定点为(1,1,1),即高危企业、应急救援队伍和政府监管部门的行为策略表现为积极共享应急救援信息,演化策略集为{积极共享,积极共享,积极共享}。
在突发事件发生时,若存在三方参与者合作成本低、获得的收益达到甚至超过预期的局面,那么各参与者都将以极快的速度选择积极共享,极大地减少了因传递不及时带来的各类损失。其中,政府监管部门出于职责与义务,最快地选择积极共享。此情景对各参与者获得的收益进行了约束,从而对相应的行为策略进行引导,最终实现了积极稳定的演化策略。
另外,由场景2~4 对比可知,增加额外奖励σ与额外成本υ对单个参与者有促进效果,若想同时对三方参与者都产生积极引导,必须从采取积极策略所获得的正向收益入手。
突发事件应急管理存在如时间、空间等各方面的限制,及时进行应急救援信息共享是突发应急事件作出合理决策至关重要的一环,为促进救援过程中应急救援信息的良性共享,分析不同条件下的最终稳定策略,本文建立了在政府参与下的应急救援信息共享三方博弈模型,通过稳定性分析得到收益极低、收益低而额外奖惩较高、收益低而额外成本较高、收益较高这四种情况下系统的演化稳定点,然后分别进行模拟仿真,观察不同情况下的具体行为策略演化,主要得到以下结论和启示:
1)采取积极策略收益极低时,参与信息传递的参与者三方都选择消极共享应急救援信息,且高危企业利益至上,最先趋向于选择消极策略。
2)采取积极策略收益较低时,通过提高额外奖惩金额可使高危企业采取积极策略,并呈现出稳定状态,而应急救援队伍与政府监管部门受到影响,选择积极共享的概率出现波动,行为策略不稳定,但总体趋向于消极策略;通过提高三方都消极时政府部门所需的额外成本可使得政府监管部门由选择消极策略向选择积极策略方向转变,最终趋于稳定状态。
3)政府提供的奖惩金额、额外成本等对后续参与者三方之间的合作起到了很好的推动与激励效果,体现了政府参与下的应急救援信息共享研究的合理性与重要性。
4)参与者最终的行为策略对正向收益的变化表现得最为敏感,对额外奖惩、额外成本变化的敏感性次之。
5)采取积极策略收益极高时,参与者三方的演化都呈现出良性发展的趋势,最终达到演化均衡,其中政府监管部门以最快的速度参与信息共享,将有效信息进行传递。
本文构建的模型可以有效地促进政府监管部门、高危企业和应急救援队伍采取积极策略,但是仍然存在以下不足:1)本文考虑了高危企业与应急救援队伍需交给政府监管部门的罚金与政府监管部门任由事态严重造成的损失及额外成本等特殊情况,忽视了高危企业与应急救援队伍的内部联系等因素对各自策略的影响,未来可对假设情况进行完善;2)本文用数值模拟仿真验证所构建模型及结论的正确性与有效性,缺乏实际案例的支撑,下一步可结合具体案例进行深入的分析研究。