谢 琦 邵晓峰
(上海交通大学 安泰经济与管理学院,上海 200052)
2016年11月11日,天猫平台创下了1 207亿人民币的交易纪录,数据显示,今年天猫卖家“双十一”的备货总额超过1 700亿,考虑到历年“双十一”后超过30%的退货率,预计2016年“双十一”过后,天猫卖家将承受超过800亿的库存积压。
我们认为,困扰“双十一”天猫卖家的两大问题分别是“合理确定备货水平”及“合理定价”。“双十一”以其低至五折的优惠活动促进销量,部分商品低至一折出售,但仍有大量赔本甩卖的商品在活动当天销售乏力,损害了品牌发展的同时也导致库存过度积压。同时,部分折扣力度较低的商品在当天销量供不应求。为解决上述问题,本课题通过搜集2016年“双十一”天猫的销售数据及商品在线信息,运用网络爬虫及数学建模等方法就“双十一”当天如何根据商品的历史销售数据及在线信息合理备货,合理确定当天的折扣力度等问题进行了探究,目的在于指导广大电商在购物节日中采取合理的备货及定价策略,做到既能吸引消费者下单,又能实现利润最大化。
菲利普·科特勒认为,促销可以激发并提供新的购买动因。例如,通过增加商品所能提供的利益及改变消费者的价值感知,可达到加快购买速度、加大购买量的目的。Raghubir等提出,与日常购物相比,促销活动融合了折扣、价格、氛围等多方面的影响因素,影响消费者消费决策的因素与日常购买决策有显著不同,具体表现为冲动性购买。Katona&Muller(1955)及Cobb&Hoyer(1986)认为,冲动性购买是事先未计划、突发的、立即的购买行为。Spears(2006)认为,节日氛围与促销活动提高了顾客的预期,增加了消费者购物的兴奋水平,也唤起了消费者冲动购买的意愿,这种冲动购买意愿是造成促销期间销量大增的主要原因。
后续的研究表明,知识不确定性(Knowledge Uncertainty,KU)也会显著影响消费者在促销活动中的购买行为。知识不确定性是指消费者在购买过程中需进行信息的搜集处理,如产品的质量、价格、服务、优惠情况等,这些信息都能影响消费者的决策和最终的购物行为。韩军认为,由于折扣情况、节日氛围及时间压力等因素存在,促销活动的销量与日常销量的影响因素存在显著区别,如折扣情况及时间压力会增强累计销量对某类商品购买的正向影响,同时削弱质量得分对某些商品的负向影响。商品其他的知识不确定性对促销期间销量的影响尚未得出明确结论。
1.2.1有关商品得分的变量
Judin认为,评论得分对商品销量具有显著的促进作用;盘英之认为商品在线得分对其销量无显著影响;韩军认为,促销活动会削弱质量得分对销量的促进作用。描述相符是指用户购买后对产品与网页介绍的相符程度做出的评价,评分区间为1~5分,1分表示非常不符合,5分表示非常符合。
1.2.2有关商品所在店铺得分的变量
王平等认为,店铺收藏人数在一定程度上代表店铺的人气及知名度,商品累计销量与店铺收藏人数中度正相关。高宝俊认为,店铺得分对商品销量有显著的促进作用。表示商品所在店铺得分的6个原始变量包括店铺得分的5分比例、4分比例、3分比例、2分比例、1分比例和店铺收藏人数。本文所使用的“店铺综合得分”变量由店铺得分比例乘以对应数值再相加得到,分值为1~5分。
1.2.3有关商品所在店铺服务水平得分的变量
徐嘉徽认为,店铺服务水平对高涉入度商品的销量有显著正向影响。任晓丽认为,店铺服务与商品日均销量无关。该部分变量包括物流服务和服务态度两个原始变量,消费者购物后分别对二者评分,评分为1~5分。
1.2.4有关商品当天的价格及折扣值的变量
本文所使用的商品价格是2016年11月11日当天的售价。价格行为学流派认为,顾客在进行购买决策时会对产品的感知利益和感知成本做出比较,当感知利益大于感知成本时,消费者得到感知价值。感知价值越大,产品价格的吸引力越大,消费者的购买意愿越高;反之,其购买意愿越低(Monroe,1973;Ronald et al.,2001)。学者们对促销中商品价格的共识为价格通过影响消费者对促销产品的感知价值而起作用(Manjit,1998;Lichtenstein et al.,1998;Folkes and Wheat,1995)。“双十一”是以折扣程度为卖点的促销活动,商品当天的价格与日常价格相差较大,消费者的价值感知也与平常有较大差距。因此,将当天价格和折扣力度纳入自变量是必要的。
1.2.5有关商品销量情况的变量
王平认为,累计评价对商品知名度的传播有显著的正向促进作用。该部分原始变量包括:(1)商品累计销量,即商品自上架以来至2016年11月11日零点前的累计销量;(2)日均销量,即商品近一个月的日均销量;(3)累计评价数,即商品上架以来至2016年11月11日零点前的累计评价数。
1.2.6有关商品差评情况的变量
Chevalier和Mayzlin认为,负面评论对于减少产品的销售收入比正面评论所带来的收入上升的效果要更显著。有关商品所获差评个数显示在“商品评价”后的括号内。
1.2.7有关商品使用期限的变量
目前,学术界还没有关于商品使用期限对促销销量影响因素的研究结论。我们认为,“双十一”是具有明显囤货性质的购物节,商品使用期限可能会影响当天销量。因此,应将平均使用期限作为一个重要影响因素来探究。网站数据显示,生鲜、食品及化妆品的平均使用期限分别为97天、180天及365天。根据《2017年度“3.15”手机质量关注度报告》及中国统计资料数据库的数据,我们加权计算出本文所爬取到的手机家电类的平均使用期限为3.7年。周永哲等认为,珠宝首饰是具有明显投资价值的收藏品,部分商品具有增值价值,故其使用期限可视为远大于其余四类商品。综上,本文所使用的五类商品的保质期/平均使用期限从短到长依次为生鲜、食品、化妆品、手机家电、珠宝首饰。各原始变量所属分类及其数据描述如表1所示。
表1 变量信息
1.2.8数据采集
本文使用的数据采集方案如下:分别爬取2016年10月15日0:00—4:00、11月11日20:00—24:00及12日0:00—4:00三个时间段内参与促销活动的商品数据。由于商品的在线信息均为动态数据,故选择发生购物及评价行为最少的时间段进行爬取。本文共获得初始数据29 027组,去除噪声及异常值后可用数据为17 983组,涵盖化妆品、食品、生鲜、手机家电和珠宝首饰五大类。字段数达20个,含3个基础变量:店铺名称、商品名称及URL;8个可直接应用变量:累计销量、当天价格、描述相符、服务态度、发货速度、店铺收藏人数、差评数和评价总数;其余9个间接变量用于计算以下5个变量:当天销量、当天折扣、日均销量、店铺评分和差评率。数据基本信息如表2所示。
表2 数据基本信息
本课题所使用的数据预处理方法包括相关性分析及探索性因子分析,预处理结果如下。
1.3.1描述性统计及相关性分析
以食品类为例,自变量描述性统计及多重共线性诊断的结果显示,有多个自变量的条件索引值>10且特征根无限接近0,说明自变量存在多重共线性,各字段数据反映的信息在一定程度上有所重叠。因此,我们选用主成分分析法进行分析建模。
表3 食品类商品自变量相关性分析
同样,其余四类商品均在不同程度上存在多重共线性,均应采取主成分分析法。受限于篇幅,其描述性统计结果不再一一列出。
1.3.2探索性因子分析及假设
食品类商品自变量相关性分析见表3。食品类探索性因子分析结果显示,KMO=0.794、Bartlett近似卡方值=95 005.548、df=78、p值=0.000,具备因子分析的条件,可进行因子分析。然后,本文采取主成分提取法进行最大方差正交旋转后得到了6个因子,旋转成分矩阵如表4所示。
表4 旋转成分矩阵a
结果显示, 13个原始自变量均清晰地负荷在所提取的6个因子上,累计方差解释力度达89.079%,能够较好地代表样本数据。因此,将13个自变量归入6个因子是可行的。
依据6个因子所包含的自变量载荷程度及自变量的实际意义,我们将6个因子分别命名为“质量”“知名度”“服务”“折扣值”“当天价格”和“差评率”,并分别针对各因子提出如下假设。
Chevalier及韩军认为,商品及所在店铺得分对其销量均具有显著的促进作用,且根据购买经验,越贵重的商品人们将越注重其质量。因此,提出假设H1a和H1b。
H1a:质量得分显著正向影响各类商品的促销销量。
H1b:商品均价越高,质量得分对其销量的影响越大。
韩军认为,商品累计销量与店铺收藏人数中度正相关,且累计评价数显著正向促进各商品知名度。根据购买经验,知名度对各类商品的销量均具有显著的促进作用,其促进作用的强弱与商品品类并无明显关系。因此,提出假设H2a和H2b。
H2a:知名度得分对各类商品的当天销量均具有显著正向影响。
H2b:知名度得分对商品当天销量的影响程度与商品品类无关。
以往研究关于店铺服务水平对商品销量的影响结论不一,数据显示,2016年“双十一”当天,自助下单比例超过69%,削弱了服务态度对当天销量的影响。因此,提出假设H3。
H3:店铺服务水平对“双十一”各类商品的当天销量均无显著影响。
研究表明,折扣力度的提高有利于增加消费者的价值感知。因此,提出假设H4。Ba和Pavlou认为,过高或过低的商品价格均会增加消费风险。因此,提出假设H5a和H5b。Chevalier认为,负面评论对于减少产品的销售收入比正面评论所带来的收入上升的效果更加显著,商品涉入度越高,消费者的购买行为越谨慎。因此,提出假设H6a和H6b。
H4:折扣力度显著正向影响各商品当天的销量。
H5a:价格对当天销量的影响方向与商品的均价有关。
H5b:价格对均价较低商品销量的影响方向为正,对均价较高商品销量的影响方向为负。
H6a:差评率显著负向影响各类商品的当天销量。
H6b:差评率对商品销量的影响程度与商品的均价呈正相关关系。
随后,本文又对其余4类商品进行了如上分析,其KMO值、Bartlett近似卡方值、df值和p值均满足因子分析的基本要求,聚合结果与食品类商品一致,累计方差的解释力度均在89%以上,说明分析结果具有稳健性。
本文以六大因子为自变量,当天销量为因变量,商品品类为控制变量,初步建立线性回归模型如式(1)所示。其中,βij代表第i类商品的第j个回归系数,εi为第i类商品回归方程的常数项,i为表示商品类别的序号,其对应关系如表5所示。
SalesVolumei=βi1×qualityi+βi2×popularityi+βi3×servicei+βi4×discounti++βi5×discountpricei+βi6×badreviewratei+εi
(1)
表5 i值对应商品类别
在回归分析的基础上,本文通过引入交叉项来探究影响当天销量的调节变量。王君珺认为,热销商品由于信息过载,在线信息对其销量的影响力度显著低于非热销商品。因此,引入S1=商品累计销量×当天折扣及S2=商品累计销量×当天价格两个交叉项。王建伟认为,有差评商品和无差评商品的销量影响因素有显著区别,由于差评情况有较多的表现形式,含二分变量(其值为0、1表示有无差评)、差评率(差评数/评论总数)、差评数三种。因此,引入S3、S33、S333、S4、S44、S444、S5、S55、S555共9个交叉项。交叉项表如表6所示,探究模型如式(2)所示,其中αij表示第i类商品的第j个交叉项系数:
表6 交叉项表
SalesVolumei=βi1×qualityi+βi2×popularityi+βi3×servicei+βi4×discounti+βi5×discountpricei+βi6×badreviewratei+αi1×totalsalesi×discounti+αi2×totalsalesi×discountpricei+αi3×totalsalesi×badreviewsij+αi4×qualityi×badreviewsij+αi5×discounti×badreviewsij+εi
(2)
数据归一化处理及回归适配度检验结果显示,各类商品Durbin-Waston统计量的取值均位于2附近,说明误差项相互独立,不存在自相关问题。残差分布均匀,反应变量服从正态分布,符合回归前提假设。本文先对食品类商品依据2.1中回归模型进行了回归分析,然后对其余四类商品重复分析过程,并对所有类商品的回归结果进行了对比分析。
3.1.1食品类商品的回归分析
食品类回归拟合结果如表7所示,回归方程的R2值为83.2%,模型拟合程度较高,P值为0.000,说明回归结果极其显著。
表7 食品类商品模型汇总
食品类回归结果显示,除差评率外,其余5个因素均对“双十一”当天的销量具有显著影响。假设H6a未得到统计支持。其中,知名度的标准化回归系数高达0.911,可能的解释是根据淘宝的商品排序规则,无论采取何种排序方式,商品顺序都与商品人气得分高度相关。郭永新认为,仅有1%的消费者会浏览排在第20页之后的商品。因此,知名度作为影响销量最重要的因素是合理的。
排在第二到五位的影响因素分别是折后价格、服务水平、质量得分和折扣力度。与常识相悖,折后价格的影响系数为正,折扣力度的影响系数虽然为负,但其影响力在所有因素中最为微弱,这说明“双十一”虽然是以超低的折扣吸引消费者,但与食品的绝对价格相比,消费者更注重其感知价值。因此,历史价格较高且折扣力度较大的商品在促销当天更受欢迎。同时,在促销当天,食品买家的消费行为相对理性,没有因为某些食品大力打折而疯狂购买,与折扣力度相比,食品的质量和店铺的服务质量对当天销量的影响程度更高。
差评率对当天的食品销量无显著影响,与高宝俊所得结论一致,可能的原因是差评通过调节其他自变量对当天销量构成影响,这一点将在后续交叉项分析中进行探究。
表8 食类商品回归系数a
食品类商品的回归方程如式(3)所示:
SalesVolume1=682.29×qualityi+27199.049×popularityi+693.758×servicei-605.926×discounti+823.026×discountpricei+2896.528
(3)
3.1.2对比分析
考虑到商品类别的差异可能导致回归系数及显著性不同,本文对其余四类商品分别进行了上述回归分析。由于“双十一”是以折扣力度为卖点的购物节,为探究各类商品的折扣力度对销量的边际效应,本文将折扣力度的弹性系数与回归系数一并显示在表9中。
表9 “双十一”所有商品回归系数及折扣力度弹性系数a
注:括号内为弹性系数。
结果显示,质量对于所有商品的当天销量均有显著的促进作用,其影响力与商品均价排名基本一致,假设H1a和H1b得到支持。其中,珠宝首饰类系数是化妆品类的6倍,可能的解释是购买珠宝首饰类商品的消费者需要承担的购物风险较大,故对“质量”因素尤为看重。
知名度对所有商品的销量均具有显著影响,其系数大小与商品涉入度呈反比,假设H2a得到支持,H2b未得到统计支持。商品涉入度是指商品对消费者的重要程度。高宝俊认为,高涉入度商品的消费者更倾向于参考自身及身边朋友的使用经验决定购买行为,商品在线信息对其购买决策的影响力有限。珠宝首饰及手机家电等商品对消费者的重要性要高于食品、生鲜类商品,此结论与高宝俊所得一致。
折扣力度显著负向影响当天销量,假设H4得到支持,且影响力大小与商品的均价排名完全一致,可能的解释是,折扣值相同时,高价商品比低价商品的价格变动更大,会更有力地刺激对价格变动敏感的消费者购买。
当天价格负向影响均价较高的商品,正向影响价格较低的商品,假设H5a和H5b得到支持。这说明消费者更倾向于购买适中价格的商品,与Ba和Pavlou所得结论一致。
除手机家电类之外,服务水平对其余商品的当天销量均具有显著正向影响,假设H3未得到支持。
差评率仅对珠宝首饰及手机家电类商品具有显著负向影响,假设H6a及H6b均未得到支持。
弹性系数的研究结果显示,5类商品的弹性系数均显著影响当天销量,且其绝对值基本与其平均使用期限负相关。弹性系数表示折扣力度每提升1%,当天销量所能提高的百分比。这说明,对手机家电、化妆品这类使用期限较长的商品,加大折扣力度可较大幅度地提升其当天销量,而对于生鲜、食品等保质期较短的商品,消费者购买上限较低,折扣力度每提高1%对销量增加的影响比较有限。
3.2.1食品类交叉项分析
交叉项回归结果如表10所示,仅有S2、S33、S444和S555四个交叉项对当天销量起到了显著的调节作用。
表10 食品类商品“双十一”销量调节变量对照表
3.2.2对比分析
按照上述研究方法,本文又对其余四类商品进行了调节效应的回归验证,所得结果如表11所示,“+” “-”分别代表调节方向的正负。
表11 所有类别商品交叉项验证结果
调节变量结果解释如下:
S2:当天价格是累计销量对当天销量影响的正向调节变量。可能的解释是,消费者对于热销商品的认同感较强,该类商品价格变动较小时,消费者对商品的信任程度越高,此类商品较低的折扣力度有利于引起消费者对商品的认同感,刺激销量。
S33:差评率是累计销量影响商品当天销量的正向调节变量。可能的解释是,差评率较高时,购物决策会加大对累计销量的依赖程度,只有累计销量高到一定程度,才能抵消差评率对消费者的影响;对于差评率水平较低的商品,消费者会额外关注除累计销量之外的其他因素,如服务质量、折扣力度等。
S444:差评数是质量得分对当天销量的负向调节变量。可能的解释是,商品差评数越多,消费者对商品与实物相符程度的期待值越低。商品质量得分不是购买决策最重要的决定性因素,消费者此时会更加关注服务、价格、性价比、折扣力度等其他因素;高质量得分是消费者购买差评数较少商品的重要原因,质量得分会对该类商品的销量产生较强影响。
S555:差评率是折扣力度对当天销量影响的负向调节变量。可能的解释是,折扣力度较大的商品,消费者的感知价值较高,较高的感知价值会提高消费者对于差评数量的接受程度。
图1 交叉项调节示意图
本文使用2016年天猫“双十一”的销售数据,以当天销量为因变量,以主成分分析所得的六大因素为自变量,结合分组回归及交叉项探究等方法,进行了回归分析,模型的平均解释力度为62%。所得结论总结如下:
(1)知名度是促销中影响所有商品销量最重要的因素,其影响力度随商品涉入度的提升而降低。这说明高涉入度商品的卖家促销时应着重考虑消费者可接受的折扣水平。
(2)质量及折扣力度对当天销量的影响程度随商品均价的提高而提升。这说明促销当日,出售均价较高商品的卖家应在可接受范围内加大对质量得分较高商品的折扣力度。
(3)对珠宝类商品,服务水平对销量的影响程度超过了当天价格及折扣力度。这说明在促销当日,珠宝首饰类卖家应着重提高服务的及时性和专业性。
(4)价格对珠宝首饰类、手机家电类及化妆品类商品当天销量的影响方向为负且影响力度递减,对食品类的影响方向为正。这说明促销活动中,消费者更倾向于购买价格适中的商品,与商品所属类别无关。经营高价商品的卖家应在自身可接受范围内压低价格,经营低价商品的卖家应在综合折扣力度及质量得分的基础上,在一定范围内降低折扣力度。
(5)差评率仅对珠宝首饰及手机家电类商品的当天销量有显著负向影响。这说明,经营这两类商品的卖家备货时应考虑差评率的限制。
(6)调节变量的探究结果显示:价格水平、差评率及差评数是当天销量的调节变量。这说明经营热销商品的商家应使该商品的当天价格集中在适中区间内;差评率较高商品的商家备货时应更多参考累计销量;差评数高于平均水平的商品卖家应加大折扣力度,以提升商品的感知价值。
本研究也存在一些局限:(1)网络爬虫在爬取数据的过程中由于网络环境等客观原因,出现了部分数据丢失的情况,导致原始数据的可利用率较低,可能对结论有轻微影响;(2)促销当日卖家的策略是多因素博弈的过程,本研究没有细致到针对每一种特质的商品均给出合理的策略,后续有待深入研究。