李明琨,葛艺博
(上海大学 管理学院,上海 200444)
随着互联网快速的发展,电子商务作为新型的商业运作渠道,逐渐颠覆传统商业营销模式。相较于商家占主导的传统信息传播形式,在虚拟的网络购物平台中消费者更倾向于利用以用户生成内容(user generated contents)为核心的评价系统进行信息交换与口碑传播。潜在消费者利用在线评论内容获取产品信息[1],降低购买风险和不确定性[2]。商家依靠评论内容促进产品销量[3],尤其是新上线产品的销量[4],以此提升知名度和品牌效应。第三方平台则根据用户评价内容对店铺进行流量管理。通过累积动态评分来判断商家的受欢迎度,并给予优秀商家更多的流量[5]。这种评价规则无疑导致卖家优者更优,劣者更劣。评论内容不仅关乎到消费者的购买决策,更关乎到商家在平台中的“存亡”。为了在激烈的市场竞争中不被淘汰,商家已不满足消费者自发的分享购物经验,而是通过推出“好评返现”、“好评返券”等新的好评奖励机制,试图刺激消费者的评论积极性,由此提高店铺的动态评分。
从营销的视角,商家可通过各种形式的奖励策略激励已有顾客将所购商品以口碑传播的形式推荐给潜在顾客[6]。好评奖励可为消费者带来优惠,为商家带来销量,为第三方平台带来点击量,因此,此类营销方式一经推出便被广泛使用。然而,消费者在奖励刺激下给出的评论信息可能存有不实的状况[7]。本应以“信任”为基础发展起来的电商市场逐渐充斥了为“挣好评”而出的虚假信息,部分评论成为变了味的推销。究其原因,有学者认为是消费者见小利而忘大义、助纣为虐导致的结果[8];也有学者将其归结于商家的逐利性[9],并站在“商业贿赂”的角度阐述卖家好评奖励行为对自身、消费者及市场造成的危害[10]。这些研究的一个基本假设前提是消费者及商家的完全经济理性,即逐利。然而,奖励对消费者撰写评论有着更为复杂的影响[11]。消费者亦可能出于对商品不尽满意后的损失厌恶及补偿心理给好评拿奖励,或是出于对平台“差评骚扰”的担忧而妥协[12]。另一方面,贿赂性好评的存在使得消费者重新审视在线评论的价值[13],越来越多消费者甚至忽略好评只关注差评,这又使得商家需斟酌使用其营销手段。
对好评奖励的研究可以从消费者的视角探讨口碑传播及消费者推荐意愿的影响因素。如张德鹏等[14]利用社会心理学,证明顾客参与对口碑推荐意愿有显著的调节作用。戴国良[15]研究发现,满减、特价、秒杀等不同促销方式对消费者口碑传播意愿有不同的作用。谢毅等[16]则认为消费者的口碑传播意向会受品牌信任和品牌情感的共同影响。以商家好评奖励行为为重点,可探讨卖方的非伦理行为及其产生的影响。如黄苏萍等[17]聚焦国内在线评论呈现极度正向偏移分布的偏差现象及形成机制,认为商家经济奖励是消费者正面评价的主要动机。同样,沈超等[18]通过仿真实验也论证了商家诱导行为会提高商品好评率,进而获得竞争优势。然而,王晓蓉等[19]研究发现奖励披露会降低消费者对产品的信任度。李研等[20]基于心理抗拒理论,也证明了被迫好评会消极影响消费者的整体满意度,并抑制其后续购买行为。
可见,在现实生活中,消费者的评论行为并不仅仅取决于对产品或服务本身的满意度,而是根据整个交易过程中的感知收益和感知成本来权衡的。消费者的好评动机可能是因为拥有了较满意的产品或服务,也可能是为了获得“额外奖励”所带来的喜悦感[21],或是出于有限理性下的损失厌恶心理[22]。电商好评奖励策略与消费者推荐行为之间可能存在动态博弈的过程。根据奖励形式的不同,好评奖励通常有现金奖励和优惠券奖励,好评奖励的效果在一定程度上取决于奖励的设计和奖励的形式[23]。对于商家而言,为激励消费者发表产品评论提供经济回报,需要考虑财务成本和产出效益[24]。相较于现金奖励,好评返券可以拉动回头客创造一定比例的二次消费[25]。对于消费者而言,返现是其更加偏爱的方式[26],然而引发的贿赂性虚假评论的争议亦更大,商家需考虑政府惩罚风险及争议的负面影响。而返券要求消费者必须进行二次消费,通常还有使用的时间、场所以及购买产品类别等方面的限制,激励效果有限。商家与消费者群体如何选择策略获得更大的收益,是一个群体不断探索和演化调整的结果。因此,本文区分好评返现与好评返券策略,进行博弈的推演及比较分析。
通过总结以往文献,消费者在线评论与商品本身的质量、消费者心理、回报收益均有一定的相关性。本文基于以往研究,综合考虑产品质量、消费者心理预期以及奖励报酬等参数,并增加平台监控及政府惩罚机制,研究基于现金奖励与优惠券奖励两种好评奖励方式对消费者推荐意愿不同程度的影响,构建商家与消费者群体的演化博弈模型。分析商家与消费者在好评奖励策略中的群体行为和发展趋势,并通过对参数进行分析,找出在不同情境下影响商家与消费者行为的主要因素。
本文主要考虑电子商务环境下商家实施好评奖励策略对消费者推荐意愿的决策影响,可以看作是双方主体博弈的结果。因此,假设在线评论平台上,商家为激励消费者好评推荐而采取的策略集为{好评返现,好评返券},消费者可采取的决策包括“给予推荐性评语”和“不给予推荐性评语”,其策略集简称为{推荐,不推荐}。
假设市场中存在商家群体以p单位的价格出售质量为q(q
一次成功的交易完成后,消费者可以选择是否进行推荐评价。假设消费者好评推荐策略能为商家带来的总潜在效益值为 λ(λ>0)。在商家承诺好评返现的前提下,消费者好评推荐可获得a单位的奖励金。在现实中,消费者如果进行非诚信推荐,要承担包括对低质量商品索赔的权益、推介的可信度、社会群体的受认可度等方面的信用代价,因此给予非诚信推荐者r1(r1>0)单位的信用惩罚。同时,商家疑似商业贿赂的行为将受到网络平台的监管和处罚,罚金为r2(r2≥0)。若满意度较高的消费者不给予推荐,意味着放弃a单位奖励金。而满意度较低的体验者不给予推荐,可以平衡较差的购物体验所带来的不满意度,从而获得f1(f1>0)单位的心理效益。商家因消费者不推荐行为损失f2(f2>0)单位的返现效益。
如果商家承诺好评赠送店铺优惠券,实施好评推荐行为的消费者将获得b单位的店铺优惠券。由于优惠券的效益在实施二次购买行为时才会生效,为分析问题方便又不失合理性,本文假设消费者若想获得优惠券收益,必须在首次消费的基础上进行多消费,用 β(0≤β≤1)表示消费者二次消费的比率。现实生活中会存在一定比例满意体验者放弃二次购买机会,假设这将损失 γb单位的优惠效益,γ(0≤γ≤1)表示消费者用优惠券二次购买商品的成本损失系数,同样会给予不诚信推荐者r1单位的信用惩罚。满意度较低的体验者不推荐行为可以平衡较差的购物体验所带来的不满意度,从而获得f1(f1>0)单位的心理效益。商家因消费者不给 予好评推荐需承担的返券效益损失为f3(f3>0)。
假定消费者购买该产品后表现为满意和不满意两种状态的概率分别为 θ 和1 −θ(0<θ<1)。消费者采取“推荐”策略的概率为x,采取“不推荐”策略的概率为 1 −x,其中,0≤x≤1;商家采取“好评返现”策略的概率为y,采取“好评返券”策略的概率为1 −y,其中,0≤y≤1。根据以上假设,构建商家与消费者博弈行为的收益矩阵,如图1所示。
图1 商家与消费者好评奖励博弈收益矩阵Fig.1 Payoff matrix of business and consumers on rewards for favorable reviews
图中,Πc,Πb分别代表消费者与商家的收益函数,不同策略行为中,消费者收益函数表达式分别为
如果消费者选择推荐策略,那么收益函数是Πc1和 Πc2。 式 (1)和 (2)之间的差异在于返券策略下要获得推荐收益需要在首次购买的基础上多消费。在不推荐策略下,消费者的损失收益值是Πc3和 Πc4唯一的区别。同样,在不同奖励策略下,商家收益函数表达式分别为
考虑到现实情况,商家给予现金奖励时容易被监管部门检测到商业贿赂性行为并受到相应的惩罚。因此,Πb1与 Πb2之间除了基础收益不同外,惩罚成本也是一项差异。
在电子商务平台中由于双方信息不对称,商家与消费者之间的行为决策很难实现完全理性。消费者个体行为的差异将导致在策略选择过程中存在部分消费者不选择完全理性博弈的均衡策略,而是通过不断地学习、模仿、试错等动态调整过程作出决策,最终达到一个稳定的均衡结果。商家也会根据好评奖励策略带来的总收益和总风险大小不断地调整策略,采取对自身最有利的行动,这与演化博弈思想一致。因此,基于复制动态的演化博弈分析方法,由图1可知,参与博弈的消费者选择“推荐”策略和“不推荐”策略的期望收益Uc1,Uc2,以及消费者平均期望收益Uc分别如下所示:
同理,参与博弈的商家选择“好评返现”策略和“好评返券”策略的期望收益Ub1,Ub2,以及商家的平均期望收益Ub分别如下所示:
假设种群中使用某一策略的个体在种群中所占比例的增长速度是该策略的相对适应性,适应度高的策略会在种群中发展。令F(x)表示消费者群体中选择“推荐”策略的复制子动态,即采用“推荐”策略的比例随时间的变化率。为便于公式书写,令 φ =(1+θγ)b+βp(θα1+θα2−α2),运用非对称复制动态演化方式,得到x的复制动态方程分别为
同理,用F(y)表示商家群体选择“好评返现”策略的复制子动态,运用非对称复制动态演化方式,得到y的复制动态方程分别为
式(15)和式(16)表明,仅当x=0,1或时,消费者选择“推荐”策略的概率是局部稳定的。仅当y=0,1或x∗=时,商家选择“好评返现”策略的概率是局部稳定的。因此,进一步 整 理 得 到 系 统 有E1(0,0),E2(0,1),E3(1,0),E4(1,1),E5(x∗,y∗) 5个局部均衡点。
本文在Friedman[27]提出的雅克比矩阵判断均衡点稳健性的基础上得到,复制动态方程可以用公式来表示。分别对x,y求偏导得到雅克比矩阵表达式为
各均衡解对应的雅克比矩阵J及其行列式Det和迹Tr如表1所示。
表1 各均衡解所对应的雅克比矩阵表达式及行列式和迹Tab.1 Jacoby matrix expressions and determinants and traces of each equilibrium solution
在本博弈中,A=f2−f3;B=f2−f3+b−a+(θ−1)r2−β(p−q);C=(1−θ)(r1+f1)−φ;D=(1+θ)a−φ。
以往很多研究都指出,与优惠券相比,现金奖励更能激起消费者的推荐意愿[28]。如果商家采取返现奖励策略所需承担的成本及损失低于返券奖励策略,即当参数满足条件:
这 时 系 统 中 存 在4个 均 衡 点E1(0,0),E2(0,1),E3(1,0),E4(1,1)。 并且A<0,B>0,C<0,D>0。将均衡条件代入表1中,E4(1,1)是该条件下的演化稳定策略,如图2所示。商家普遍趋向于“返现”策略,消费者则在现金的诱导下均实施“推荐”行为。
图2 A <0,B>0,C <0,D>0时均衡解的复制相位图Fig. 2 Phase diagram of the equilibrium solution when A<0 , B>0,C<0,D>0
然而对于商家来说,实施现金奖励通常比实施优惠券奖励所承担的运营风险更高[29],即当参数满足条件:
系 统 中 存 在E1(0,0),E2(0,1),E3(1,0),E4(1,1),E5(x∗,y∗)5 个均衡点。在这种条件下,B