基于微分博弈的电商平台与商家合作模式研究

2023-02-01 01:28程郁琨王辛辛田晓明陈瑾冕
运筹与管理 2023年11期
关键词:分散式主从集中式

程郁琨, 王辛辛, 田晓明, 陈瑾冕

(1.江南大学 商学院,江苏 无锡 214122; 2.苏州科技大学 商学院,江苏 苏州 215009; 3.苏州科技大学 教育学院,江苏 苏州 215009; 4.苏州科技大学 城市发展智库,江苏 苏州 215009)

0 引言

随着社会智能化的发展,网络在线购物变得越来越便利,网购交易额也逐年攀升。据报道,2022年全网“6.18”电商交易额再次刷新纪录,尽管受到疫情的影响,但总体交易规模依然呈现积极增长态势[1]。在2022年两会期间,农村电商、跨境电商等数字经济问题仍然是代表们热议的焦点,特别值得一提的是,跨境电商已连续9年被写入政府工作报告[2]。随着电商行业向好发展,越来越多的商家积极寻找商机,并与电商平台展开合作。如何妥善处理电商平台与入驻商家之间的合作协调问题,实现社会资源的最优配置,成为社会各方关注的重要问题。

目前,以电商生态系统为研究背景的文献已经颇为丰富。胡婉婷等[3]研究当一个商家同时经营实体店和电商平台网店销售同一种商品时,商家与电商平台如何通过动态定价和合作努力实现收益最大化。周文辉等[4]采用案例分析法,选取淘宝电商平台作为研究对象,研究电商平台在商家创业初期、成长期以及成熟期所发挥的作用。GUO等[5]受预测理论和消费者行为研究启发,提出一种基于迭代贝叶斯分布估计技术的新方法,开发用户生成内容价值,助力电子商务的发展。DIFRANCESCO等[6]认为电子商务的爆炸式增长给零售商的库存管理和订单履行提出挑战,通过分析全渠道零售商的网上订单流程,求解各参与方的最优履行策略。

考虑到时间上的连续性,本文运用微分博弈理论重点研究电商生态系统中电商平台与商家之间的合作模式。微分博弈来源于军事领域,最开始被用来研究导弹追击和逃避问题。ISAACS撰写的《Differential Games》标志着微分博弈的诞生[7]。微分博弈是指在时间连续的系统内,多个参与者进行的持续博弈,其目的是最优化各自独立、冲突目标,最终获得各参与者随时间演变的策略并达到均衡[8]。在电子商务领域,电商平台与众多互相竞争的商家们在追求利益的过程中会涉及到比较复杂的协调合作问题,而微分博弈理论也正为求解协调控制问题提供了崭新的思路。微分博弈把博弈理论拓展到连续时间上,能充分反映商家在电商平台上销售商品的过程中商品商誉动态变化的特性,并可以充分考虑商品商誉的动态积累过程对博弈的影响。WANG等[9]考虑产品声誉,建立Stackelberg微分博弈模型,研究电子商务平台与供应商之间的最优策略。CAO等[10]考虑顾客的回收率,建立集中式和分散式供应链的微分博弈模型,指出网络直销渠道的退货率、品牌声誉和零售渠道商誉等因素对最优广告决策的重要影响。马德青和胡劲松[11]重点研究了消费者展厅行为以及参考质量效应两个因素对实体店和电商平台的策略选择以及品牌商誉和各方利润动态变化的影响。胡劲松和纪雅杰[12]基于消费者效用理论,将消费者参考质量效应和线上渠道接受程度的影响引入电商供应链(ECSC)中,利用微分博弈理论研究了制造商或零售商拥有线上开辟权两种渠道结构下的制造商质量策略和零售商产品服务策略。施涛等[13]将保鲜努力程度、零售商的促销努力程度和品牌商誉考虑在内,构建了生鲜电商供应链的微分博弈模型,研究生鲜电商平台和供应商之间的合作问题。

本文考虑了一个由电商平台,n个商家构成的电商生态系统,其中电商平台为商家和消费者提供方便可靠的平台进行商品交易;商家为销售商品而努力,通过与电商平台合作,为消费者提供精准服务,吸引更多消费者购买商品。电商平台和商家之间通过建立良好的合作关系,优化合作模式,以期实现各自收益最大化,促进电商生态系统长久健康发展。本文的主要贡献在于:(1)相比于之前建立的微分博弈模型[14],本文讨论的模型类型更加全面,将电商平台和商家作为博弈主体,探究电商平台和商家在三种不同合作模式下的最优策略。(2)不同于马德青和胡劲松[11]、胡劲松和纪雅杰[12]所研究的模型,对于商家参与方,本文不再限制研究单一主体,而是考虑销售同类商品的多个商家互相竞争的情况。本文旨在深入探讨在电商生态系统中,电商平台与众多商家之间的合作模式,并研究不同决策模式下的最优策略和收益,因此所建立的模型更贴合实际,所得结果更有说服力。

1 模型假设和微分博弈模型

1.1 模型假设

为构建由单一电商平台和销售同类商品n个商家组成的电商生态系统微分博弈模型,本文提出如下基本假设。

假设1努力成本与努力程度密不可分。电商平台努力程度越大,其努力成本越高;商家i努力程度越大也会带来较高的努力成本。鉴于努力成本的凸性特征[15],t时刻电商平台的努力成本函数CE(t)和商家i的努力成本函数CMi(t)可表示如下:

其中,电商平台的努力程度表示为EE(t),其努力成本系数为μE;商家i的努力程度表示为EMi(t), 其努力成本系数为μMi。

假设2借鉴CHEN[16]关于企业努力会对商誉产生促进作用的研究,本文假设商品的商誉τ与电商平台和商家的努力程度呈正向关系;同时,考虑到商誉自然衰减状况,故采用NERLOVE和ARROW[17]商誉模型的变形模型,得到商品商誉随时间变化规律如下:

其中,δ表示商誉自然衰减系数[18],αE表示电商平台努力程度对商誉的影响系数,αMi表示商家的努力程度对商誉的影响系数。

假设3ERICKSON[19]和ZHANG等[20]认为价格因素和非价格因素均与市场需求有相关关系。本文假设客户需求依赖于商誉τ和零售价格pi,i=1,…,n,在状态变量和控制变量之间采用可分离的乘法方式[21],同时考虑到n(>1)个商家之间的可替代关系,因此商家i在t时刻的需求函数Qi(t)表示为:

其中,bi(>0)为商品价格对商家销售数量的影响系数;考虑到商品销售量受自身价格的影响大于其他竞争商家价格的影响[22],因此我们假设00)表示商品商誉对吸引销售数量的影响系数。

假设4本文所研究的模型中n个商家是销售同类商品、同规模的商家,因此我们假设所有商家是同质的,相关参数满足bi=b,μMi=μM以及αMi=αM,i=1,…,n。

假设5商家借助电商平台销售商品,因此电商平台会向商家收取固定的平台使用费R,并对商家的销售额进行一定比例 0

假设6电商平台、商家的收益具有相同的贴现率ρ(>0),双方的决策目标均是在无限区间内寻求最优策略,以最大化各自收益。

1.2 微分博弈模型

本文根据电商平台与商家的三种合作模型,即分散式模型(D)、集中式模型(C)和、Stackelberg主从决策模型(S),分别构建相应的微分博弈模型。

(1)分散式决策模型(D)

在分散式决策模式下,电商平台和商家们各自独立做出决策,最大化各自收益。因此,电商平台和商家i的收益表达式为(1)和(2):

(1)

(2)

(2)集中式决策模型(C)

在集中式决策模型中,电商平台与所有商家合作,最大化系统的整体收益,即电商平台与所有商家的收益之和最大化,其具体表达式如(3)所示:

(3)

(3)Stackelberg主从决策模型(S)

电商平台为鼓励商家加入平台,为商家分担一定比例的成本,对商家进行补贴。我们记补贴比例为x(t),并假设电商平台对商家的补贴比例低于平台对商家的抽成比例,即0

(4)

电商平台的子问题:根据第二阶段各商家的最优反应,即最优定价和最优努力程度,电商平台将在第一阶段确定使其收益最大化(5)的努力程度和补贴比例。

(5)

2 微分博弈均衡与比较分析

本文根据电商平台与商家的三种合作模型,即分散式模型(D)、集中式模型(C)和、Stackelberg主从决策模型(S),分别构建相应的微分博弈模型。

2.1 微分博弈均衡分析

(1)分散式决策模型(D)

(6)

(7)

根据最优控制理论[23],分别对HJB方程(6)和(7)求关于决策变量的一阶导数,并令其等于0,可得命题1。

命题1在分散式决策模型下,可得各方的微分博弈均衡策略:

(i)电商平台最优努力程度为:

(ii)商家i最优努力程度和商品定价为:

(iii)电商平台t时刻最优收益为:

(iv)商家i在t时刻最优收益为:

(2)集中式决策模型(C)

(8)

根据最优控制理论[23],分别对HJB方程(6)求关于决策变量的一阶导数,并令其等于0,可得命题2。

命题2在集中式决策模型下,可得该模型中各方的均衡策略:

(i)电商平台最优努力程度为:

(ii)商家i最优努力程度和商品定价为:

(iii)系统的最优收益为:

(3)Stackelberg主从决策模型(S)

(9)

(10)

命题3在Stackelberg主从决策模型下,可得该模型中各方的均衡策略:

(i)电商平台最优策略为:

(ii)商家i最优努力程度和商品定价为:

(iii)电商平台的最优收益为:

(iv)商家i的最优收益为:

2.2 三种博弈模型的比较分析

这里我们对一个电商平台和一个商家之间的三种博弈模型的比较分析,其中电商平台和商家在分散式决策模式下(D)相互竞争,在集中式决策模型下(C)完全合作,在Stackelberg主从博弈模型下(S)双方之间既有合作也有竞争。

命题4三种决策模型下,电商平台最优努力程度大小关系为:

(i)商家最优努力程度的大小关系为:

(ii)商家销售商品的商誉值大小关系为:

τD*(t)<τS*(t)<τC*(t)。

(iii)系统整体收益的大小关系为:

在分散式决策模型与Stackelberg主从博弈决策模型下,电商平台努力程度相同的。而在集中决策模式下,电商平台和商家将共同合作以最大化系统整体利益,电商平台为了更大的利益需要付出更多的努力,因此平台的努力程度最高。关于商家的努力程度,由于在分散式决策模型下商家与平台是完全竞争关系,而在Stackelberg主从博弈模型下双方之间既有竞争也有合作,电商平台的补贴激励商家,也使得商家的努力程度随补贴增加而增加,高于分散式模型下的努力程度。比较于前两种决策模型,集中式决策模型下的商家努力程度最高。这意味着在平台与商家的深度合作模式下,商家愿意付出更多的努力去销售商品,和平台一起追求系统整体收益的最大化。从最优商品商誉表达式可以看出,商誉值与平台和商家的最优努力程度呈正向关系。因此,集中式模型下的商品商誉最高,其次是Stackelberg主从博弈模型下的商品商誉,而分散式模型下的商品商誉最低。类似地,三种模型下的系统整体收益值也有着相同大小关系。

3 数值分析

本节将利用MATLAB2020b进行数值实验,以验证第二节中的理论分析结果。我们参考了2023年京东开放平台类目资费规则中珠宝首饰(珍珠)[25]类商品的技术服务费率8%和平台使用费1000元/月。因此,令参数k(t)=8%,即t时刻电商平台从每个商家总销售额中抽取的比例值为8%;令参数R=1000,即电商平台对入驻商家每个月收取的平台使用费为1000元。其余相关数据依据前文假设部分的设定并结合京东平台规则网站公布的部分数据稍加调整得到。

综上所述,相关参数被赋值为:k(t)=8%,R=1000,n=6,θ=0.64,φ1=10,φ2=12,φ3=14,φ4=16,φ5=18,φ6=20,uE=16,uM=20,αE=18,αM=23,x(t)=0.04,τ0=0,ρ=0.6,δ=0.4,c=0.5,b=0.9。

(1)商品商誉值的对比

由图1可知,三种决策模型下商品商誉值的大小关系为τD*(t)<τS*(t)<τC*(t)。随着时间的变化(图中横坐标的时间轴也可以表示周期,一个周期代表平台和商家的一轮销售过程),可以看出,集中式决策模型下的商品商誉值是最大的,Stackelberg主从博弈决策模型下的商誉值略高于分散式决策模型下的商誉值。

图1 三种决策模型下商品商誉值比较

(2)电商平台收益的对比

因为在分散式决策模型和Stackelberg主从博弈决策模型下电商平台和商家的目标都是追求自身利益的最大化,因此可以得到电商平台的收益表达式,而在集中式决策模型之下,决策目标是系统整体收益最大化。因此,这里只比较前两种模式下电商平台的收益情况。结合图2可以看出,相比于分散式决策,采取Stackelberg主从博弈决策模型时,电商平台的收益有所提高。这一结果促使了目前国内主流电商平台大都采取补贴商家策略,以提高商家加入平台的积极性。

图2 分散式决策模型和Stackelberg主从博弈决策模型下,电商平台收益对比

(3)商家收益之和的对比

由图3可以看出,相比于分散式决策模型,商家的总收益在Stackelberg主从博弈决策模型下更高。主要原因是电商平台为商家分担部分成本,激发商家努力的积极性,提高销售额,进而也使得所有商家收益之和高于在分散式决策模型之下的收益总和。

图3 分散式决策模型和Stackelberg主从博弈决策模型下,所有商家总收益对比

(4)系统整体收益对比

如图4所示,集中式决策模型下系统整体收益远远高于另外两种合作模式的收益;Stackelberg主从博弈决策模型下的系统整体收益次之。这一结果表明,由于在分散式决策模型下,电商平台和商家独立决策,内部竞争带来内耗很大,导致整体收益最低;虽然Stackelberg主从博弈模型下电商平台和商家仍是竞争关系,但平台的补贴激励了商家的入驻,使系统整体收益有所提高。在集中式决策模型下,当电商平台和所有商家为了共同目标做出最大努力,从而获得最大整体收益。

图4 系统总收益对比

4 结论

本文在综合考虑商品商誉和同行之间存在竞争关系的基础上,利用微分博弈模型,探究电商平台和n个商家在追求收益最大化过程中的合作模式,分别讨论了分散式集中式和Stackelberg主从博弈决策模型下,电商平台和商家的动态最优决策。

(1)由理论分析可以看出,与分散式决策模型相比,当电商平台采用Stackelberg主从博弈决策模型时,虽然其最优努力程度没有改变,但电商平台可以通过分担商家的成本来激励商家付出更多的的努力。相比于分散式决策模型,采用Stackelberg主从博弈决策和集中式决策也可以为各自以及整个系统带来更高的收益,从而更有利于电子商务生态系统的长远发展。在实际中,国内大型电商平台,如淘宝、京东等为平台上的商家提供一系列优惠活动,分担商家成本,从而吸引更多消费者。从长远来看,补贴商家这一措施有利于电商平台与商家的共赢。

(2)由数值分析可知,电商平台与商家在集中式决策模型下团结一致,最大限度提高各自销售商品的努力程度;与此同时,商品的商誉值也将达到最高,而商誉的提高将会带来更多消费者对电商平台和商家的信任,这对于电商平台和商家来说都是非常珍贵的财富。相比于分散式决策模型和Stackelberg主从博弈决策模型,在集中决策模型下系统也可以获得更大的整体收益。

因此,相比于各方独自谋利的分散式决策模型,Stackelberg主从博弈决策模型和集中式决策模型促进了电商平台与商家的合作,对电商生态系统的长远发展较为有利。因此,一个运行良好的电子商务生态系统,需要内部各方相互配合与合作。以上结论不仅为电商平台和商家未来的运作管理提供理论和实践方面的建议和指导,也为双方提供了一套有效的合作方案。

猜你喜欢
分散式主从集中式
光伏:分布式新增装机规模首次超越集中式
分散式风电破“局”
FANUC系统PROFIBUS主从功能应用
计及时延的互联电力系统分散式阻尼控制
分散式风电卷土重来
组串式、集中式逆变器的评估选定浅析
接触网隔离开关集中式控制方案研究
光伏集中式逆变器与组串式逆变器
基于主从控制的微电网平滑切换控制策略研究
基于飞行试验数据的仿真模型主从一体化检验