李春发,曹颖颖,王 聪,郝琳娜
(1.天津理工大学管理学院,天津 300384;2.聊城大学商学院,山东 聊城 252000)
随着AI、AR和大数据等技术迅速发展,直播电商打破销售渠道时空、信息等限制[1],减少产品流通环节,满足了消费者社交性[2]、互动性需求和寻求高效选品途经的需要,成为推动品牌消费增长的重要商业模式[3]和互联网经济领域新的增长点。艾瑞咨询数据指出,2019年直播电商整体成交额达4 512.9亿元,同比增长200.4%,占网购整体规模的4.5%[4]。然而,直播电商模式火爆发展同时,因其参与主体多、入住门槛低及网络交易的虚拟性与数据缺失性等[5],电商假货问题层出不穷[6],部分爆款单品缺乏基本的质量保障[7],直播平台对供应商、主播行为策略难以规制的问题尤为突出。为此,政府频频出台相关政策加强指导与监管,规范平台运行[8-9],如中国广告协会于2020年7月发布《网络直播营销行为规范》,对直播电商中的供应商、直播平台、主播的行为作全面定义规范。直播电商行业规范是保证直播电商行业持续发展的重要基础[10-13],探究直播平台规制参与主体行为策略,并提出规范供应商及主播行为的具体措施,对引导直播电商市场健康规范化发展和助力直播经济高质量发展具有重要的现实意义。
供应商的供品策略、直播平台的规制方式、主播的行为规范对直播电商三方收益产生重要影响,相关问题受到各方关注与重视[14],许多学者对网络直播电商方面的研究主要是以监管策略和治理对策为切入点,阐述直播平台规制策略的必要性[15-19]。从利益相关者的视角,李亚兵等[20]结合博弈演化探讨了多方参与下网络直播治理的内在机理,并提出相应的网络治理策略;从政府监管的视角,彭晓薇[21]提出了当前政府对网络直播的监管体系和具体措施;从直播平台的视角,薛鹏等[22]研究了主播侵权下直播平台需要承担的责任及其监管责任如何体现。直播平台与主播之间关系的研究主要关注直播负面问题、行业信用和行业竞争等,李婧祎等[23]研究了当前网络直播行业存在的问题并探究原因,最后提出相应的对策建议。郑森圭等[24]认为导致直播平台盈利能力不足的两个原因分别为签约主播比例与直播平台基础规模不匹配,以及直播平台签约策略不恰当。近年来,学者们开始运用博弈论探讨电商参与主体内在的影响机理。张丽等[25]基于博弈论将消费者投诉引入电商平台信用监管机制,构建了信息不对称下以电商平台、商家和消费者为主体的三方演化博弈模型,分析了各主体博弈策略选择与行为演化的影响因素及趋于稳定状态的条件,并进行演化仿真分析和数值模拟。杨丰梅等[26]构建C2B2C电商信用监管模式下的演化博弈模型与定价交易模型,对电商和消费者双方的长期交易策略进行了分析。徐鲲等[27]运用演化博弈理论对电商双边市场供应链融资合作机制进行分析,并结合收益分配模型计算得到收益分配系数的最优解。Aringhieri等[28]通过混合博弈和代理仿真分析电子商务中的在线信誉体系,建立模型,探究买卖双方不同的行为对电商政策的影响。
目前研究主要聚焦于直播电商行业规范必要性的理论分析,对供应商、直播平台及主播三方主体间行为策略关系鲜有量化描述,本文以供应商、直播平台和主播为研究对象,鉴于供应商供品策略、直播平台规制方式以及主播行为抉择涉及诸多利益主体,从有限理性的角度出发,抽象出供应商、直播平台以及主播之间进行策略选择的影响因素,构建演化博弈分析模型,并采用agent仿真,侧重分析不同的策略对三方收益的影响,从而提出规范供应商及约束主播行为的具体措施。
考虑由分别负责产品供应、服务和推荐的供应商、直播平台(简称平台)和主播组成的直播电商系统。在该系统中,供应商通过向主播进行商业投放、提供货源等获利;主播通过向消费者推荐产品获利,存在将仿品作为正品进行虚假宣传等违规行为;平台通过按场次及时间向供应商收取服务费、提供运营规范和业务检查等获利。作为产品和服务质量责任承担者,平台接受政府和社会监督,对供应商、主播行为采取积极规制或者消极规制。供应商、平台和主播之间存在行为策略演化博弈关系(见图1)。
图1 供应商、直播平台和主播行为策略演化关系
设供应商正、仿产品支付成本分别为C1和C2;主播销售守规,供应商选用正品、仿品的基本收益分别为R1和R2;主播违规,供应商选用正品、仿品的基本收益为R3和R4。平台积极规制对选用仿品供应商、违规主播的惩罚和约束分别为F和M(γ为惩罚系数,δ为约束系数)。平台消极规制对选用正品供应商、守规主播的支持和补贴分别为H和L(β为支持系数,α为补贴力度)。平台积极规制成本为C3,直播平台积极、消极规制的基本收益分别为U1、U2。供应商选用仿品,主播守规/违规使平台效益增加/减少W1/W2。违规收益指主播违规获得的超额收益,设主播违规获得的超额收益为ηQ1、ηQ2,Q1、Q2为供应商选用正品、仿品时主播的基本收益,η为违规收益因子。主播守规、违规的收益和损失分别为V1和V2。平台消极监管将导致平台市场产品质量混乱,消费者对平台的选择意愿降低,平台和主播利益损失分别为K1、K2。电商直播中消费者的感知服务质量和感知价值对购买意愿有正向影响[29]。主播推荐仿品时,消费者的感知服务质量和感知价值较低,从而降低购买意愿,主播收益损失为E。供应商、平台和主播博弈收益矩阵如表1所示。
表1 供应商、平台、主播三方博弈收益矩阵
从而可建立供应商、平台和主播演化博弈模型(1)。
(1)
按照Friedman提出的方法,微分方程系统的演化稳定策略(ESS)可由该系统的Jacobian矩阵局部稳定性分析得到。由式(1)知,系统Jacobian矩阵[30]为
在式(1)中,令F(x)=F(y)=F(z)=0,知E1(0,0,0),E2(0,0,1),E3(0,1,0),E4(0,1,1),E5(1,0,0),E6(1,0,1),E7(1,1,0),E8(1,1,1)为局部均衡点。Jacobian矩阵的所有特征值都为非正时的均衡点为系统的演化稳定点;所有特征值的符号确定且均为正值时,该均衡点为非稳定点。
均衡点为E1(0,0,0)时,有
类似地,将8个均衡点分别代入Jacobian矩阵,各均衡点对应Jacobian矩阵的特征值如表2所示。
表2 Jacobian矩阵的特征值
假设R1-R2+βH-C1+C2>0,V1+V2-ηQ1-δM+αL>0,U1-U2-C3-K1>0。说明主播守规,供应商选用仿品总收益较正品小,平台消极规制总收益较积极规制小;平台积极规制,主播守规总收益较违规大。由于模型中参数的复杂性,本文分3种情形对演化博弈稳定策略进行讨论。
情形1:当U1-C3+δM-γF-K1 图2 情形1的复制动态相位图 情形2:当U1-C3+δM-γF-K1>U2,R3+γF+βH-C1 图3 情形2的复制动态相位图 情形3:当R3+βH-C1>R4-C2且V1+αL+E>ηQ2-V2时,说明当平台积极规制且主播违规时,供应商选用正品总收益较仿品大,当平台消极规制时,主播守规总收益较违规大,由表3知,均衡点E8(1,1,1)对应Jacobian矩阵特征值均为负值,故E8(1,1,1)为均衡点,{正品,积极规制,守规}为演化稳定策略,演化博弈模型的相位图如图4所示。 图4 情形3的复制动态相位图 表3 局部均衡点稳定性分析 以阿里巴巴为例利用多主体建模仿真(mABM)技术,模拟直播电商不同情形下稳定性策略变动,分析验证演化均衡稳定性结论。即通过对模型参数进行取值,模拟“供应商-直播平台-主播”之间演化博弈的变动趋势,揭示各主体决策规律。在Netlogo仿真平台中,供应商、直播平台和主播分为3类Agent,分别设置初始数量300个,设定黄色、灰色曲线分别为供应商选择“正品”和“仿品”策略的概率变化曲线,红色、黑色曲线分别为直播平台选择“积极规制”和“消极规制”策略的概率变化曲线,橙色、蓝色曲线分别为主播选择“守规”和“违规”策略的概率变化曲线。 在仿真过程中,合理设置仿真模型的参数取值是有效仿真的关键。根据Liu[31],汪旭晖等[32],参数取值设置主要有两方面依据:1)文献与实际调研。参照杨丰梅等[26]的参数设置,设定选用仿品供应商惩罚分别为β=0.4,H=10,违规主播的约束分别为δ=0.3,M=4;选用正品供应商的支持分别为γ=0.3,F=10,守规主播的补贴分别为α=0.2,L=4。在对阿里巴巴进行实际调研,发现实地调研结果与《阿里巴巴国际站处罚扣分说明》、《阿里巴巴国际站虚假交易违规处罚规则》和现有相关文献参数设置基本吻合。本文根据以上数据来源对模型参数进行取值,具体如表4~6所示。2)等式平衡原则。本文对以下3种不同情形进行模拟分析。 表4 支付矩阵参数值 情形1:当U1-C3+δM-γF-K1 设置初始x=0.41,y=0.53,z=0.34和x=0.57,y=0.53,z=0.52,运行结果如图5、6所示。 图5 初始x=0.41,y=0.53,z=0.34演化博弈仿真结果 图6 初始x=0.57,y=0.53,z=0.52演化博弈仿真结果 由图5、6可知,博弈稳定策略为E1(0,0,0)和E8(1,1,1),即{仿品,消极规制,违规}和{正品,积极规制,守规}。三者最终演化结果取决于三者最初状态,当直播平台消极规制时,主播守规获得补贴αL较违规获得收益ηQ1-V2小,主播倾向选择“违规”策略;当直播平台消极规制且主播违规时,供应商选用仿品总收益较正品大,供应商选择“仿品”策略。当供应商选用正品时,平台积极规制收益U1-C3较消极规制收益U2大,直播平台倾向于选择“积极规制”策略,当供应商选用正品且平台积极规制时,主播守规获得补贴和形象增加αL+V1较违规利益加成ηQ1-δM-V2大,主播选择“守规”策略。{仿品,消极规制,违规}和{正品,积极规制,守规}为演化稳定策略,验证了情形1理论分析结论的有效性。 情形2:当U1-C3+δM-γF-K1>U2,R3+γF+βH-C1 表5 支付矩阵参数值 设置初始x=0.28,y=0.66,z=0.59和x=0.46,y=0.65,z=0.68,运行结果如图7、8所示。 图7 初始x=0.28,y=0.66,z=0.59演化博弈仿真结果 图8 初始x=0.46,y=0.65,z=0.68演化博弈仿真结果 由图7、8可知,博弈稳定策略为E3(0,1,0)和E8(1,1,1)。博弈出现两种渐进稳定策略:{仿品,积极规制,违规}和{正品,积极规制,守规}。三者最终演化结果取决于三者最初状态,当供应商选用仿品时,主播若选择“违规”策略,可满足供应商销量需求,此时供应商选用仿品、平台积极规制和主播违规属于稳定策略。当供应商试图选用仿品时,主播若选择“守规”策略,无法满足供应商销量需求,且平台选择“积极规制”策略,供应商只能转而选择“正品”策略。{仿品,积极规制,违规}和{正品,积极规制,守规}为演化稳定策略,验证了情形2理论分析结论的有效性。 情形3:当R3+βH-C1>R4-C2,且V1+αL+E>ηQ2-V2时,设支付矩阵各参数如表6所示。 表6 支付矩阵参数值 设置初始x=0.56,y=0.65,z=0.55,运行结果如图9所示。由图9可知,博弈稳定策略为E8(1,1,1)。博弈出现一种渐进稳定策略:{正品,积极规制,守规}。随着主播违规收益因子η降低,当供应商选用正品且平台积极规制时,主播违规获得额外收益不足以抵消违规造成的利益损失,主播将选择“守规”策略。{正品,积极规制,守规}为演化稳定策略,演化博弈仿真结果验证了情形3理论分析结论的有效性。 图9 初始x=0.56,y=0.65,z=0.55演化博弈仿真结果 由于直播电商系统供应商、直播平台和主播三方博弈的策略演化复杂性,利用Python软件分析参数变化对策略演化稳定性的影响,其中包括分析惩罚系数γ、约束系数δ、支持系数β、补贴系数α和违规收益因子η对直播电商系统演化过程的影响。假设初始供应商、直播平台和主播选择不同策略的概率均为0.5,取R1=7,R2=13,R3=14,R4=17,C1=4,C2=3,C3=3,V1=4,V2=5,Q1=14,Q2=12,U1=19,U2=13,W1=3,W2=3,K1=1,K2=2,E=1,L=9,H=9,F=10,M=10。γ,δ,β,α和η分别取0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0。 惩罚系数取不同值时,演化博弈仿真结果如图10所示。在不同惩罚系数下,直播电商系统三方博弈演化轨迹如图10a所示。当直播平台对供应商惩罚力度较小时,供应商选用仿品,主播考虑违规风险选择守规,直播平台选择消极规制。随着惩罚系数增加,供应商策略选择向正品方向演化,主播策略选择向违规方向演化,直播平台选择积极规制策略,并最终达到稳定状态。 供应商策略选择随时间变化的演化轨迹如图10b所示。当惩罚系数过小时,供应商考虑成本及惩罚,选用仿品策略。惩罚系数适度增加时,供应商刚开始处于观望状态,随着时间增加,供应商感知正品的益处,逐渐向正品方向演化。当惩罚系数较大时,供应商选用正品,并最终达到稳定状态。 图10 惩罚系数γ的参数分析 直播平台策略选择随时间变化的演化轨迹如图10c所示。当平台对供应商选用仿品惩罚力度较小时,直播平台向消极规制方向演化,且随着惩罚系数增大其演化速率越来越小,直到最终达到稳定状态。当惩罚系数过大时,直播平台的策略选择不稳定,无法达到稳定状态。 主播策略选择随时间变化的演化轨迹如图10d所示。当平台对供应商选用仿品惩罚力度较小时,供应商选用仿品时主播违规风险较大,考虑到违规风险,主播选择守规。当惩罚系数过大时,主播策略选择不稳定,无法达到稳定状态。 约束系数取不同值时,演化博弈仿真结果如图11所示。在不同约束系数下,直播电商系统三方博弈演化轨迹如图11a所示。当直播平台对主播约束力度过小时,主播选择违规,此时供应商考虑主播违规风险后选择提供正品,直播平台选择积极规制。随着约束系数增加,考虑到违规成本,主播向守规方向演化,供应商向仿品方向演化,且趋向稳定的速度随约束系数增加而变快,直播平台向消极规制方向演化,逐渐趋于稳定状态。 图11 约束系数δ的参数分析 供应商策略选择随时间变化的演化轨迹如图11b所示。当直播平台对主播约束力度过小时,供应商考虑选用仿品,主播违规风险较大,选择正品策略。当约束系数适度增加时,供应商刚开始处于观望状态,但主播守规无法满足供应商利益需求,供应商开始向仿品方向演化。当约束系数较大时,供应商选用仿品,并逐渐趋于稳定状态。 直播平台策略选择随时间变化的演化轨迹如图11c所示。当直播平台对主播约束力度较小时,平台向积极规制方向演化,且随着约束系数增大其演化速率越来越快,最终达到稳定。当约束系数达到合适范围后,直播平台向消极规制方向演化,演化速度随约束系数增加而加快,最终趋于稳定。 主播策略选择随时间变化的演化轨迹如图11d所示。当约束系数较小时,主播考虑违规成本较低,选择违规行为。约束系数适度增加时,主播刚开始处于观望状态,随着时间增加,主播感知到违规成本过高,向守规方向演化。当约束系数较大时,主播选择守规行为。 直播平台对供应商支持系数取不同值时,演化博弈仿真结果如图12所示。在不同支持系数下,直播电商系统三方博弈演化轨迹如图12a所示。平台为鼓励供应商选用正品,对选用正品供应商给予支持。当支持系数较小时,供应商选用仿品,主播考虑违规风险后选择守规,直播平台选择消极规制策略。当支持系数适中,供应商感知正品的益处,向正品方向演化,主播向违规方向演化,最终达到稳定。当支持系数较大时,供应商选用正品,主播和直播平台演化过程不稳定,直播电商系统三方博弈无法达到稳定状态。 供应商策略选择随时间变化的演化轨迹如图12b所示。当直播平台对供应商选用正品支持力度过小时,供应商选用正品成本较仿品大。当支持系数适中时,供应商一开始处于考察状态,随着时间变化,供应商认识到正品的益处,向正品方向演化,且演化速度与支持系数正相关,直到达到稳定。当支持系数较大时,供应商选用正品。平台高支持系数可有效激励供应商选用正品。 图12 支持系数β的参数分析 直播平台策略选择随时间变化的演化轨迹如图12c所示。当直播平台对供应商选用正品支持力度较低时,直播平台向消极规制方向演化,其支持系数越大演化速率越快,最终达到稳定。当支持系数较大时,直播平台由于支出过大,策略选择不稳定,无法达到稳定状态。 主播策略选择随时间变化的演化轨迹如图12d所示。当支持系数较小时,供应商选用仿品,主播考虑到违规风险问题,选择守规。当支持系数过大时,主播守规收益无法满足利益需求,但存在违规风险过大问题,其策略选择无法达到稳定状态。因此,只有当直播平台对供应商支持力度调控在合适范围内,才能调动主播守规的积极性。 不同补贴系数取值下,演化博弈仿真结果如图13所示。在不同补贴系数下,直播电商系统三方博弈演化轨迹如图13a所示。直播平台为吸引主播守规,遵守平台规则,对守规主播进行补贴,且平台补贴系数对主播决策影响显著。若直播平台不提供补贴,主播守规收益无法满足利益需求,则主播选择违规行为,供应商选用仿品。当补贴系数适中时,主播向守规方向演化,供应商策略选择向正品方向演化,且趋向稳定的速度随补贴系数增加而变快,直至达到最终稳定。当平台补贴系数过大时,供应商策略选择向正品方向演化,直播平台选择积极规制策略。 供应商策略选择随时间变化的演化轨迹如图13b所示。当直播平台对守规主播补贴力度过小时,主播选择违规策略,供应商为增大收益选用仿品,经过考察这种状态发生变化,供应商根据主播选择相应策略。当补贴系数较高时,供应商策略选择向正品方向演化,且演化速率随着补贴系数增大而变快,最终达到稳定状态。因此,直播平台高补贴系数可有效激励供应商选用正品。 直播平台策略选择随时间变化的演化轨迹如图13c所示。当直播平台对主播守规补贴力度较低时,直播平台向消极规制方向演化,其补贴系数越大演化速率越快,最终达到稳定。当补贴系数过大时,直播平台由于支出过大,将选择积极规制策略。因此,平台对主播补贴力度需保持在较高水平上,方可推动直播系统正常发展。 主播策略选择随时间变化的演化轨迹如图13d所示。主播策略选择将随着平台补贴系数变化而产生不同行为选择,当补贴系数过低时,主播选择违规行为增加额外收益。当补贴系数较高时,主播守规获取补贴足以满足利益需求,开始向守规方向演化,且演化速率随补贴系数增大而变快,最终达到稳定状态。因此,直播平台高补贴系数可有效激励主播遵守平台规则,选择守规行为。 图13 补贴系数α的参数分析 违规收益因子取不同值时,演化博弈的仿真结果如图14所示。在不同违规收益因子下,直播电商系统三方博弈演化轨迹如图14a所示。当供应商选用仿品时,给违规主播带来额外收益,违规收益因子对主播策略决策影响显著。当违规收益因子较小时,主播违规获取额外收益不足以吸引主播违反平台规则,主播选择守规行为,供应商选用正品,直播平台选择积极规制策略。当违规收益因子较大时,主播向违规方向演化,供应商选用仿品,平台选择消极规制策略,最终三方演化博弈系统达到稳定。 供应商策略选择随时间变化的演化轨迹如图14b所示。当违规收益因子较小时,主播由于收支不平衡选择守规行为,供应商选用正品。当违规收益因子较大时,主播试图选择违规获取额外收益,此时供应商策略选择向仿品方向演化,其演化速度随着违规收益因子的增大而变快,最终达到稳定状态。 直播平台策略选择随时间变化的演化轨迹如图14c所示。当主播违规收益因子较小时,直播平台获取收益较高,选择积极规制策略。当主播违规收益因子较大时,直播平台总收益逐渐降低,开始向消极规制方向演化,且其演化速度随着违规收益因子增大而变快,最终达到稳定状态。 主播策略选择随时间变化的演化轨迹如图14d所示。当违规收益因子较小时,主播获得违规收益较小,选择守规行为。当违规收益因子适度增加时,主播刚开始处于观望状态,随着时间增加,主播感知违规益处,向违规方向演化。当违规收益因子较大时,主播选择违规策略,且演化速率随违规收益因子增大而变快,最终达到稳定状态。 图14 违规收益因子η的参数分析 本文针对直播电商平台规制问题,从有限理性的角度出发,构建直播电商系统中供应商、直播平台和主播三方演化博弈模型,分析三方主体行为策略演化路径及其联动作用规律,得出的具体结论和建议如下: 1)考虑利益需求与风险程度,保持适当的惩罚与约束力度,有助于提高供应商和主播规范行为的积极性。当直播平台对供应商、主播的惩罚与约束力度较大时,供应商策略行为向正品方向演化,但主播无法满足利益需求,选择违规行为;当惩罚与约束力度较小时,主播主播选择违规行为,供应商考虑主播违规风险选用正品策略。因此,直播平台应积极与政府监管部门配合,加强部门、平台联动,对供应商出售仿品行为形成强大的震慑作用;同时加强对主播的道德教育,提高主播守规守纪意识,加强直播自律。 2)平台较高补贴或支持虽鼓励供应商和主播规范行为,但过高的补贴和支持将增加平台负担,使平台演化无法到达稳定。研究表明,当直播平台对供应商支持系数适中,或给予守规主播补贴力度较大时,主播选择守规策略,供应商选用正品。因此,平台要控制补贴和支持力度,加大直播风纪的宣传力度,提高主播及供应商对直播风气的认知水平,从而推动直播电商运营秩序的发展。 3)违规收益因子是影响主播和供应商策略选择的重要因素。研究表明,当违规收益因子较大时,主播选择违规策略,供应商选用仿品。反之当违规收益因子较小时,主播将选择守规行为,供应商选用正品策略,此时直播电商机制达到最优,从而推动直播电商发展。 本文的局限性在于模型分析结果是基于研究假设得出的,而假设中涉及参数是对现实的抽象,理想状态下认为主播是否选择违规完全取决于自身意愿与供应商策略选择,未过多考虑其他因素,因此存在考虑因素不充分的缺陷;另一方面,未考虑消费者心理因素对整个直播电商的演化的影响,今后研究可将消费者作为博弈方之一,构建四方博弈体系。2.2 直播电商系统演化的mABM仿真分析
3 参数分析
3.1 惩罚系数γ对三方演化博弈行为的影响
3.2 约束系数δ对三方演化博弈行为的影响
3.3 支持系数β对三方演化博弈行为的影响
3.4 补贴系数α对三方演化博弈行为的影响
3.5 违规收益因子η对三方演化博弈行为的影响
4 结论与展望