云环境下的制造资源服务共享决策演化研究

2023-07-22 08:41李海虹
太原科技大学学报 2023年4期
关键词:均衡点概率决策

孙 红,李海虹,郭 宏

(太原科技大学 机械工程学院,太原 030024)

近年来,制造业正面临着资源全球化的挑战[1],资源闲置与资源短缺问题制约着制造供应链的运行效率,实现制造资源服务共享对制造业的发展至关重要。云制造(Cloud Manufacturing,CMfg)通过集成先进技术(云计算、物联网等)而成为制造业的一种面向服务的高效率、低消耗的先进制造模式[2-3],正在改变制造企业组织生产和业务活动的方式,以应对全球化竞争和产品个性化制造。作为服务管理平台,CMfg系统将分布式制造资源和制造能力封装到服务中,以满足不同用户的多项任务需求[4],鼓励制造资源服务提供方(SP)与需求方(SD)实现资源服务共享是CMfg系统持续发展的重要阶段。

关于制造资源服务共享问题[5],国内外学者已进行了广泛的研究。Tao F等[6]将云计算与物联网融入到CMfg系统中,建立了CCIOT-CMfg技术体系并实现了制造资源共享协作、按需使用。鲍世赞等[7]建立了智能生产共享模式,重点分析了共享过程中的用户体验。Liu Y等[8]基于Gale-Shapley算法,对需求方和提供者的总效用及其性能进行了理论和仿真分析。Li K等[9]、Szaller等[10]基于多Agent建立分布式制造资源共享系统,实现全局最优共享调度。为了更好地描述制造资源服务共享决策的具体过程,博弈论被引入共享模型中,如序贯博弈[11]、合作博弈[12]、非合作博弈[13]等。

以上模型将博弈方视为“完全理性”经济人,与实际供应链中博弈双方动态决策行为不完全符合,因此具备“有限理性”的演化博弈理论被引入共享决策模型[14-15],但缺乏存在主导方的博弈情况研究。本文建立以SP为主导的共享决策演化模型,由支付矩阵得出系统复制动态方程,求出均衡点并进行稳定性分析,通过数值仿真验证了模型的正确性,并分析不同因素对演化结果的影响情况,以确定云平台博弈建模的重要参数。

1 问题简述

CMfg系统包括SP、SD及云平台三个主体,云平台以虚拟云池的方式为各类用户提供服务,SD与SP可实现“一对一”“多对一”“一对多”及“多对多”服务。作为制造企业,因自身加工能力不足而选择加入云平台,将通过寻找合适的SP实现协同制造;作为制造资源供应商,因自身闲置资源过多而选择加入云平台提高资源利用率,通过寻找对应的SD增加订单量,以提高企业效益。CMfg系统鼓励众多SP“接入”云平台,以满足SD的不同制造需求,然而SP与SD可结合自身具体情况及云平台服务情况决定是否加入云平台,此过程为动态演化过程,引入演化博弈理论建立制造服务演化共享决策博弈模型,以制造服务提供者SP为云平台主导,制造服务需求者SD为参与者,分析不同要素影响下的演化均衡过程,归纳各因素具体影响情况并提出利于SD与SP实现协同制造的建议。

2 共享决策演化模型构建

2.1 模型相关变量

博弈模型中双方策略具体影响因素如表1所示:

表1 模型变量及其意义Tab.1 Model variables and significance

2.2 模型构建假设

以SP为主导的CMfg系统为研究对象,实现合作化制造是云平台持续发展的目标,考虑实际中的众多影响因素,提出以下假设以便于分析:

(1)SP与SD具有两种选择策略,SP作为CMfg系统主导方,可以选择“积极管理”策略,如尽可能共享自身制造资源与服务信息,提升自身管理技术以吸引更多SD选择加入云平台,随着制造资源会数量级种类增加,“积极管理”下的额外费用会大幅度提升,此时SP可能会综合自身利益而转为“消极管理”;SD有“参与”及“不参与”两种策略。当双方选择策略为“积极管理”、“参与”时,将达成合作协议,可实现协同制造。

(2)SD选择“参与”策略概率为x,则“不参与”概率为1-x;SP选择“积极管理”策略概率为y,则“消极管理”概率为1-y,且0≤x≤1,0≤y≤1.

(3)当SP、SD分别选择“积极管理”“参与”时,此时云平台发挥了最大的制造资源共享作用,二者均可获得超额增量ΔM1,分配系数为r,SP超额增量为(1-r)ΔM1,SD超额增量为rΔM1.

(4)假设云平台管理能力系数为α,共享制造资源种类及数量不断增加时,云平台会产生SP企业规模效益,假设一个SP加入云平台给整个SP企业群集带来的效益为β,SP的规模效益用共享概率表达为f=α2β(1-y),因此云平台规模效益由其管理能力及进驻企业数量决定。

2.3 收益分析

根据以上变量假设,可得SP与SD不同演化博弈决策下的支付矩阵如表2所示。

表2 SP-SD双方博弈支付矩阵Tab.2 SP-SD game payoff matrix

由支付矩阵可得SP选择策略集为(积极管理,消极管理),选择不同的策略对应不同的收益,SP选择“积极管理”策略时的期望收益如下:

EP1=x[M-P-Q+(1-r)ΔM1+f+π0]+

(1-x)(M-P-Q)

(1)

SP选择“消极管理”策略时的期望收益如下:

EP2=x[M-P+ΔM2]+(1-x)(M-P)

(2)

则SP混合决策下的总期望收益为:

EP=yEP1+(1-y)EP2

(3)

由表2得SD选择策略集为(参与,不参与),不同策略下的SD的收益不同,SD选择“参与”策略时的期望收益为:

(4)

同理,SD选择“不参与”策略时的期望收益为:

ED2=y(N+W)+(1-y)N

(5)

SD混合决策下的总期望收益为:

ED=xED1+(1-x)ED2

(6)

根据Malthusian方程可得,博弈策略的变化率为其适应度,因此可得:

(7)

2.4 模型均衡点及其稳定性分析

令演化复制动态方程中的x′=0,y′=0,求解得五个均衡点,为E1(0,0)、E2(0,1)、E3(1,1)、E4(1,0)、E5(x*,y*),E5为混合策略,其中

由系统稳定性判定方法可知,通过分析系统雅克比矩阵可验证上述局部稳定点在系统中的演化稳定策略(ESS),雅克比矩阵如下所示:

(8)

将式(7)代入上式得:

[y(rΔM1+ΔN1-ΔN2-W+π0)-C+ΔN2]

x(1-x)(rΔM1+ΔN1-ΔN2-W+π0)

y(1-y)[(1-r)ΔM1+α2β(1-y)+π0-ΔM2]

y(1-y)[(1-r)ΔM1+α2β(1-y)+π0-ΔM2]

(9)

(10)

(11)

(12)

(13)

E=

因x、y分别表示SP选择“积极管理”策略的概率、SD选择“参与”策略的概率,因此0≤x*≤1,0≤y*≤1,即得系统约束条件为:

(14)

由此得出五个均衡点稳定性分析结果如表3所示,由表可知系统存在两个ESS,即满足det(J)>0、tr(J)<0条件的均衡点为E1(0,0)及E3(1,1),对应演化策略为(消极管理,不参与)、(积极管理,参与),E2(0,1)与E4(1,0)为不稳定点,E5(x*,y*)为鞍点。

表3 系统均衡点稳定性分析结果Tab.3 Stability analysis results of system equilibrium point

该演化系统最后稳定策略为SP选择“积极管理”、SD选择“参与”;SP选择“消极策略”、SD选择“不参与”,鞍点E5(x*,y*)演化主要受初始概率x0、y0、超额增益分配系数r及其它因素如P、Q、C、ΔM1、ΔM2、ΔN1、ΔN2等影响,演化相位图如图1.

图1 共享决策演化博弈相位图Fig.1 Shared decision evolution game phase diagram

3 数值仿真分析

3.1 建立演化因果关系模型

系统动态演化因果关系模型如图2所示,包括四个水平变量1-x、x、1-y、y及两个复制动态变量Δx(SD决策变化率)、Δy(SP决策变化率),Δx、Δy由前面的动态复制方程(公式7)得出。

图2 SP-SD演化因果关系模型Fig.2 SP-SD evolutionary causality model

3.2 数值仿真

以某产品制造服务供应链为例,基于MATLAB进行数值仿真,分析SP与SD不同收益状态下的系统演化趋势,以验证上述系统演化结果的正确性,分析不同参数对制造资源服务共享的影响程度.

通过对某产品制造过程追踪调查获得有效参数初值为ΔM1=0.5、ΔM2=0.3、ΔN1=0.3、ΔN2=0.2、α=0.1、β=0.2、π0=0.1、C=0.1、Q=0.2、W=0.3、r=0.1.本模型在固定一部分参数的情况下,分析了初始共享概率x0、超额增量分配系数r及云平台管理系数α对系统演化结果的影响趋势。

(1)初始共享概率对系统演化结果的影响

为了分析SD初始共享概率x0对系统演化结果的影响趋势,将SP共享概率固定为y=0.6,设置x0分别为0.2、0.4、0.6、0.8,SD、SP演化结果分别如图3、图4所示。

图3 不同初始值x0下的SD决策趋势Fig.3 SD decision trends under different initial values x0

图4 不同初始值x0下的SP决策趋势Fig.4 SP decision trends under different initial values x0

分析图3、图4可得,当SP共享概率y0固定时,SD共享决策的收敛速度受x0的影响较为显著,且x0越大,收敛速度越快,呈正相关的关系,但演化均衡状态与x0的大小无关,SP共享概率的收敛速度也随着x0的增大而变快。演化博弈系统中的单个用户或企业的共享概率也可理解为整个群落中选择共享策略的比例,因此,企业在博弈过程中不断学习模仿其他参与者的选择策略,即当某行业中的大型企业或领军企业选择共享策略时,其他企业也会慢慢地向共享策略发展,从而改变行业规模效益。

(2)超额增量分配系数对系统演化结果的影响

当超额增量分配系数r=0.1时,系统演化结果如图5所示,SD与SP初始选择概率均为0.5,在此种状态下,SP投机收益小于合作收益,SD积极管理收益大于消极管理收益,系统将演化至(1,1),SP趋向于积极管理,SD趋向于参与策略,即双方达成合作共享。

图5 r=0.1时SP-SD共享演化趋势Fig.5 SP-SD shared evolution trends under r=0.1

由图6知若分配系数过大时,SP选择积极管理策略的收益逐渐下降,则随着双方动态博弈,系统将演化至(1,0),SP趋向于消极管理策略,而SD因分配系数增大而获得更多的效益,最后趋向于参与云平台。基于有限理性的动态演化,不同增益分配系数会影响博弈方决策结果,需针对不同情况下的收益情形制定合理的分配系数,以促进博弈双方达成稳定合作的目标。

图6 r=0.5时SP-SD共享演化趋势Fig.6 SP-SD shared evolution trends under r=0.5

(3)云平台管理系数对系统演化结果的影响

当SD共享概率x=0.2时,将云平台管理系数α分别设置为0.1、0.3、0.6、0.9,研究y0分别为0.2、0.8情况下的演化结果,如图7、图8所示。由图7可知,云平台管理系数α对SP决策趋势的影响较为显著,且α越大,SP收敛至平衡的速度越快,反之,则越慢。综合分析图7、8可知,当SP积极管理初始概率y0越大,α对SP决策趋势的影响越小。

图7 y0=0.2时不同α下的SP决策结果Fig.7 The decision results at y0=0.2 from different α

图8 y0=0.8时不同α下的SP决策结果Fig.8 The decision results at y0=0.8 from different α

由此可得,云平台管理系数对系统演化结果具有正向作用,当云平台较为成熟时,管理能力加强,即管理系数较大时,用户或制造商会趋于选择加入云平台实现制造资源共享,即本模型中SP选择积极管理策略、SD选择参与策略,而企业加入云平台更加促进云平台管理能力的提升。

4 结论

建立了云制造资源服务共享博弈演化模型,由支付矩阵得出系统复制动态方程后计算均衡点,后进行均衡点稳定性分析,运用MATLAB进行数值仿真,对比分析不同因素对演化结果的影响,得出以下结论:

(1)初始共享概率x0、y0对系统演化平衡状态无影响,但影响博弈方收敛速度,呈正相关的关系。由此可见在互相学习博弈的过程中,领军企业对整个行业影响较大;

(2)超额增量分配系数r影响系统演化结果,需要针对不同需求制定合理的分配系数;

(3)云平台管理系数α影响系统收敛速度,α越大,收敛至平衡的速度越快,且随着初始概率的增大,α的影响程度减小。可知当云平台管理能力较强时,企业或个人会趋向于制造资源共享。

猜你喜欢
均衡点概率决策
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
为可持续决策提供依据
概率与统计(一)
概率与统计(二)
交易成本理论在油田企业小修业务自营和外包决策中的应用分析
决策为什么失误了
三级供应链投资模型的评价管理
均衡点移动的直观图示及其例析
不确定条件下n人非合作博弈均衡点集的通有稳定性