胡春华,赵 慧,童小芹,任 剑
(1.湖南工商大学大数据与互联网创新研究院,湖南 长沙 410205;2.移动商务智能湖南省重点实验室,湖南 长沙 410205;3.湖南省移动电子商务协同创新中心,湖南 长沙 410205)
电子商务与商务智能的快速发展使得消费者进入了一个物品繁多、信息过载的新时代,信息不对称、选择困难、时间成本差异等成为影响消费者消费行为的关键因素,推荐系统应运而生[1]。推荐系统是基于消费者以往浏览行为的数据,计算分析消费者的兴趣,进而预测消费者喜好和购买意愿的复杂工具[2]。因此推荐系统可以改善消费者网购体验,提高消费者黏性,从而提高下单转化率和支付转化率。
目前,国内外电子商务平台使用不同推荐系统挖掘消费者兴趣和偏好,缓解信息过载的问题。如淘宝Matrix推荐系统[3]构建了底纹推荐、首页热词、下拉推荐、搜索发现等推荐平台,京东Diviner推荐系统[4],Amazon的Instant推荐系统[5]等。由此可见,电子商务平台中推荐系统的应用十分广泛。虽然不同平台间的推荐系统有一定区别,平台也会根据不同的推荐任务和要求实时更新推荐系统,同一平台的推荐算法也不尽相同。从消费者角度来说,消费者无需了解推荐系统的运作机理就可运用其在平台上购物。推荐系统的差异性和网络购买不存在直接关系,并不直接影响消费者在平台的整体网购支出[6-7]。因此,本文暂不考虑平台推荐系统的差异性影响。
Adomavicius等[8]研究了广义的在线推荐对消费者购买意愿的影响,结果显示不论是考虑偏好的推荐,还是有误差的推荐,对消费者的购买意愿都有同样的效果。即接受推荐系统在线评级和建议属于使用了推荐系统,不再细分是否为定向推荐和非定向推荐。黄立威等[9]提出许多大型电子商务网站都应用了推荐系统。然而现有的电子商务网站中推荐系统多是面向个体,并不适用于向群体进行推荐。借鉴文献[8-9]的研究,本文研究的是广义的、实时更新的推荐系统,并不考虑群体差异的消费者个体网购支出的影响。
微软研究报告指出,Amazon网站30%的页面浏览量来自推荐[10]。Amazon关闭某一书目推荐后,将使该书目的销售额下降40%[11]。推荐系统广泛应用的同时也带来了巨大的经济效益;除消费者购买商品和服务等消费行为直接创造的经济效益外,使用推荐系统的消费者还可以贡献流量,Nazerzadeh等[12]和Davis[13]提出可以使用CPA(Cost per action)和CPL(Cost per lead)将流量转化为经济价值,丰富产品附加值;Digg使用了UserCF算法设计上线推荐系统后,该平台消费者活跃度增加了40%,评论增加了11%,好友数增加了24%,证明推荐系统应用后能使智能商务网站具有更好的活跃度和实用性。
使用推荐系统对消费者网购有哪些方面的影响,影响是否显著以及如何有效客观地评估推荐系统对消费者网购的影响成为颇具挑战的问题[14]。
从推荐系统对消费者影响因素不同的角度可以将已有研究分为以下三类:
第一类是通过社交信任影响消费者网购。Geng Bingrui等[15]和Guo Taolin等[16]认为社交互动与分享社交化链接能帮助消费者寻觅到感兴趣的商品,链接越丰富,向消费者推荐效果越好。Bach等[17]认为消费者评论为消费者交互、消费者购买提供重要了手段。Xiao和Benbasat[18]研究了有偏见的个性化产品推荐代理,结果显示93%的消费者会受推荐影响,对推荐的产品有极高的信任并购买该产品。Chen Yanhong等[19]拓展了冲动、推荐信任对消费者网购的影响。但研究背景限于微信平台,没有比较产品或服务类型。张哲宇等[20]认为消费者主动提供的消费评价可信度更高,也更具参考价值。郝玫和马建峰[21]提出消费者评论的情感可信度指标,从而筛选高可信度的典型评论向消费者进行推荐。尹进等[22]认为不同亲密度的朋友提供的推荐信息往往会对消费者有不同影响,越亲密的关系在推荐过程中起到的作用越明显。考虑消费者交互信任关系的推荐系统能提升消费者对非目标产品点击率,降低消费者网购决策时间[23]。
第二类是通过提高消费者满意度和忠诚度影响消费者网购。Baier和Stüber[24]和Lee和Kwon[25]研究表明推荐购买可以提高消费者对推荐产品的满意度、购买意向,增强消费实际购买力,增加零售商的销售额。Zhang等[26]研究表明推荐系统每降低1单位消费者筛选商品的时间成本,可提高9.4%的消费者忠诚度。有学者研究发现准确率高的推荐系统可能会导致商品服务范围过小,降低消费者对推荐系统的好感度,应当综合考虑覆盖率、召回率等指标[27-29]。综合考虑消费者社会关系及用户影响力的社会模型,对提高召回率、满意度有一定的优势[30]。Dabholkar和Sheng[31]认为推荐能降低消费者的风险担忧,消费者使用推荐会获得更高的满意度、忠诚度、更高的购买意向。
第三类是通过预测消费者偏好影响消费者网购。Liu Chienliang和Chen Yingchuan[32]提出基于隐变量模型的迭代因子分析方法为消费者提供实时动态推荐,结果表明更新速度快的推荐能够更好地预测消费者偏好,增加购买行为。Sarwar等[33]认为消费者浏览到商品的概率和该商品在网站推荐列表的排序具有反向关系,消费者使用推荐系统更有可能增加计划外消费。Zhang Qian等[34]提出了CIT(Consistent information transfer)模型,结果显示推荐系统能够预测消费者潜在消费和服务。Fleder和Hosanager[35]认为提高推荐系统多样性有助于消费者增加购买行为。Schreiner等[36]从消费者性别角度研究得出女性更喜欢基于CF算法的推荐,男性倾向于参考最畅销产品的推荐。考虑情境化消费者偏好的推荐可以更大程度的满足群体消费者的个性化需求,促进消费者网购[37]。张立功等[38]认为网络购物可能造成消费者偏好的不确定性,会使消费者承担更多的购物风险,降低其购买意愿。朱志国等[39]指出消费者的移动性会改变其兴趣点,考虑消费者社交范围的推荐会提高推荐效果。
综上所述,国内外关于推荐系统的效应研究大多围绕推荐系统对智能商务平台影响等方面,从消费者角度研究的文献较少;现有对推荐系统影响消费者网购的文献多为影响因素研究:推荐系统可以通过社交信任、预测消费者偏好、提高消费者忠诚度等来影响消费者网购,研究推荐系统对消费者影响效果评估的文献较少;推荐系统的研究多集中在如何提高推荐系统的准确性,忽视了推荐系统的新颖性、多样性、长尾效应、覆盖率等评价推荐系统的经济效益指标。现有对推荐系统影响消费者行为的研究还处于初级摸索阶段。本小组设计实现了面向社交电商环境的TDA-RBM算法,研究了基于信任和不信任关系的实值受限玻尔兹曼机推荐,构造了信任-不信任监督机制,结果显示考虑社交信任的推荐对消费网购的推荐效果更优[40]。因此本文在团队成果基础上,研究使用推荐系统对消费者网购支出的影响,评价推荐系统的经济效益。
本文在消费函数的基础上,主要从推荐系统影响消费者网购支出角度展开了研究,提出了待验证的研究假说:使用推荐系统是否影响消费者在智能商务网站的购物支出。文章使用了消费者层面的微观调查数据,借助相关理论使用倾向得分匹配法对研究假设进行实证分析,来改善消费者“自选择”是否使用推荐系统产生的内生性。并且使用多种匹配方法、工具变量法进行稳健性检验,证明了使用推荐系统的消费者比不使用推荐系统的消费者有更高的网购支出。
本研究数据来源于消费者调查问卷,借助国内较大的“问卷星”平台形成网络链接及二维码。问卷以国内经常网物的消费者作为研究对象,并分层次纳入了不同地域(台湾、澳门除外)消费者样本。样本设置了筛选原则,即消费者必须倾向于网购而不是国内实体店购买商品。
该问卷调查时间为2018年8月-2019年6月,共回收问卷4540份。其中调查方法1:在微信等社交平台发布了电子问卷的网络链接。根据该程序回收问卷数据共计1368份。调查方法2:通过问卷星的样本服务发放问卷,根据该程序回收问卷数据共计3172份。对相关数据进行预处理,将逻辑不符、恶意填写等不符要求的问卷数据作为无效问卷剔除,其中方法1剔除无效问卷325份,有效问卷为1043份;方法2剔除无效问卷1127份,有效问卷为2045份。共回收有效问卷数据3088份,回收率为68%。其中,男性占43.04%,女性占56.96%;年龄构成分布如下:23岁以下占23.51%,23-28岁占24.97%,28-33岁占23.09%,33-38岁占11.88%,38-43岁占7.55%,43岁以上占9%;受教育程度分布如下:初中及以下占2.4%,高中及专科占19.14%,大学占69.59%,研究生及以上占8.87%。
调查采用了结构化的问卷调查,问卷的核心内容包括(1)消费者概况,如年龄、性别、消费理念、所在区域、受教育程度等。(2)消费者收入概况,如主业是否具有稳定收入、月收入数值区间等。(3)消费者使用推荐系统的态度,如使用智能推荐系统的频数、对推荐系统的了解程度、对推荐系统的接受程度等。(4)推荐系统的影响,消费者是否选择使用推荐系统和使用推荐系统后消费者网购次数变化、网购总额的变化、技术影响消费的实现方式等。
本文使用SPSS25.0利用Cronbach’s Alpha值来计算信度,由表1可知,α值均大于0.6,说明问卷信度较好。
本文利用因子分析法测量结构效度。由表1可知,KMO值均大于0.6;巴特利特球型检验中显著性水平均小于0.01,说明问卷,适合做因子分析。各主成分的平均方差提取值分别为73.801%、73.933%,说明本文的问卷结构效度较好。
表1 信度和效度分析
综上,本文的信度和效度都符合数据分析的要求。
根据消费调查,本文将调查样本按照Bejarano等[41]和Maghrabi等[42]提出的自选择分类方法分为使用推荐系统和不使用推荐系统两大类。调查结果显示:在3088个消费者样本中选择推荐系统的消费者有1853个,占样本总体60%,没有选择推荐系统的消费者有1235个,占样本总体的40%。其中自选择的含义为:是否使用推荐系统应用并不是随机分配给消费者,而是消费者自己选择使用推荐系统购买或自行搜索购买。本文的自变量T为一个二元变量,表示消费者是否选择使用推荐系统。当其值为1时代表消费者选择使用推荐系统购物,值为0时则代表选择不使用推荐系统购物。本文最关注的因变量是消费者的网购消费能力,本文分析的因变量受诸多因素影响,如个人收入、所在城市(乡村)整体消费水平、消费观念、科技要素,审美变化等,因此在实证分析模型中还考虑了男女成员比例、教育程度、年龄、消费环境、消费经历等消费者个人信息特征。表2衡量了使用推荐系统网购消费者和未使用推荐系统网购的消费者的基本特征以及两者差异。可发现,使用推荐系统的消费者和未使用推荐系统的消费者收入上有一定的差异;同时使用推荐系统的消费者有更高的网购消费支出;不使用推荐系统网购的消费者有更高的平均年龄、更低的受教育程度(t检验均在1%水平显著)。
表2 消费者描述性统计分析
由图1可见,广告信息过多、虚假的评论和销售量是阻碍消费者使用推荐系统的两大原因,因此推荐系统要着重改善垃圾广告、虚假买家秀、刷单等问题。由图2可见,节约时间、便于找到性价比更高的产品是各年龄段消费者选择使用推荐系统的主要原因。综合图1和图2,18岁以下消费更加轻率,可以增加好友推荐的商品供其选择。18-43岁的消费者使用好友推荐较少,更注意隐私保护,因此推荐系统可以减少监听套取隐私,降低消费者疑虑。28岁以上的消费者更注重购买产品的性价比,43岁以上的消费者更节省时间。因此,推荐系统更应提高推荐的精准性和有效性,方便消费者在短时间内找到其喜爱的、性价比高的产品,提高其购买力。
图1 消费者不使用推荐原因
图2 消费者使用推荐原因
对消费者接受推荐后更倾向于网购的产品进行描述性统计分析。结果表明:消费者使用推荐系统主要购买的产品是休闲零食和服装鞋袜。
仅有8%的消费者倾向于使用推荐购买医药保健产品,消费者使用推荐系统购买医药保健、粮油副食类的意向与年龄成正比。33岁以下的女性消费者更倾向于使用推荐购买洗护彩妆产品。33-43岁的消费者更倾向于使用推荐购买家用电器产品。在43-48岁的消费者中,使用推荐系统购买数码产品的占46%,购买办公产品的消费者仅占4%。
一般来说,顾客忠诚度可用顾客满意度、重复购买率以及好友推荐率来衡量。如图4,大多数的消费者最关注店铺中的其他商品,而不是在店铺中重复购买同一商品和服务,因此推荐系统可多为消费者推荐同一店铺中互补商品。
图4 使用推荐系统对消费者忠诚度影响
其次,消费者关注和在乎好友推荐,并且在各年龄段影响力都比较大。28-43岁的消费者最喜欢将买过的产品向朋友推荐,推荐结果受社交影响。因此推荐技术应注重基于社交关系的推荐。
除此之外,使用推荐后,消费者会更倾向于选择重复购买、关注买过的店铺并将其作为首选店铺,并且访问的时间次数都有所增长。为了提高推荐效果,推荐系统应提高向该消费群体推荐店铺的质量和声誉。
综上所述,推荐效果受社交关系、互补产品、店铺声誉等因素影响。
本文将消费者购买力这一定性指标量化为消费者的消费函数的一部分来反映消费者网购支出关系。消费函数中主观因素和客观因素都可以影响消费者购买力,其中主观因素包括消费者的消费习惯、消费心理、社交影响等。客观因素包括收入水平、行业规范、科技创新、推荐系统发展等。因此可以看出消费者是否使用推荐系统可能会对消费者的消费心理和消费行为产生影响。
消费函数为:C=α+βy。其中C代表消费支出,y代表消费者收入。α为消费者自发消费,即消费者结合自己的刚需决定消费的部分,可以理解为消费者为了生存所需要的固定消费。β为边际消费倾向,是值在0到1之间的参数,而βy代表的是由收入变化引致的消费。
杜森贝里提出相对收入假说理论,该理论认为消费者会因为消费心理的变化改变自身消费行为。其中最具有代表性的是攀比效应和示范效应。而智能商务环境中的推荐系统的兴起与发展刚好为消费者提供了消费环境与技术支撑。消费者可能会因此更快捷有效的发掘喜欢的商品、好友推荐的商品。名人使用的具有示范效应商品,可能会触发计划外消费或者超前消费。
杜森贝里提出棘轮理论来进行佐证,该理论认为消费者的消费行为是不可逆的。这种消费行为受许多因素影响,如个人消费习惯、好友间攀比示范、网站推荐等。消费者网购支出最高时期的消费行为对消费者之后的购买行为有重大影响。因此,消费者可能在使用推荐系统后出现提高网购支出以及网购次数的情况。
本文在消费函数中考虑推荐系统的技术效应,则:C=α+βy+λT,此时λ为边际消费倾向,是值在0到1的参数,T代表一个二元变量,而λT代表的是由推荐系统引致的消费。
因此本文在上述理论基础上,提出待验证相关假设:智能商务环境中推荐系统对消费者网购支出是否具有积极正向的作用,即在相同的资源条件下,使用推荐系统的消费者是否比未使用推荐系统的消费者有更高的网购支出。
本文使用的方法为倾向得分匹配法(PSM),目的是将推荐系统独立于其他影响消费者购买力的因素情况,调查推荐系统的使用对消费者网购支出效应及其稳健性。倾向得分匹配法是由Rosenbaum和Rubin[43]首次提出的,该方法可以将消费者多维信息特征降维成一个倾向得分因子,在得分基础上将使用推荐系统的消费者和未使用推荐系统的消费者进行匹配,分析结果网购支出差异得出推荐系统对于消费者网购支出的净效应。鉴于不同匹配方法各有优劣,通常采用多种匹配法进行匹配以保证稳健性。
倾向得分匹配法优点:第一、常用的描述性统计分析的方法会高估使用推荐系统对消费者网购支出的经济效应。第二、倾向得分匹配法可以做到将多个变量降维为一维倾向得分。第三、Wooldridge[44]认为倾向得分匹配法只需要满足条件独立性假设和共同支撑两个前提假设,受限较少,匹配完成度较好,样本损失率低。第四、Glenn等[45]认为在线测试ABtest必须要求消费者从始至终只能选择一种方案并产生淘汰机制,倾向得分匹配法能够很好的保护样本。
倾向得分匹配法的主要特征是创造随机试验条件进行样本比较。但使用倾向得分匹配法的前提需要满足两个假设:
(1)条件独立分布假设检验:我们假设存在一组不受推荐系统影响的可观测的协变量X,且消费独立于推荐系统的使用。在这个假设下,消费者是否使用推荐系统不是预先设定的,而是由消费者自行选择的,结果呈随机分布。在此基础上比较相同条件禀赋的消费者在使用推荐系统和不使用推荐系统的情况下的网购消费支出差异。
(2)共同支撑假设:假设PSM的倾向得分(Propensity Score)是介于0到1的参数,即同样具有X特征的消费者会具有使用推荐系统和不使用推荐系统的正向概率。该假设排除了倾向得分的长尾效应,提高了消费者匹配的精度和准度,但是会使消费者匹配样本减少。Heckman等[46]提出非参数匹配方法必须是建立在共同支撑的条件下才是有意义且可讨论的。因此我们很难避免用一定量的样本损失来换取匹配质量的提高。
选用倾向得分匹配法原因:由于商业目标最本质的性质就是平均一个消费者能给经济社会带来的盈利。因此我们首先考虑分析同一消费者使用推荐系统前后网购支出,以探究推荐系统对经济社会所贡献的效益。这要求掌握该消费者使用推荐系统前后的数据,并且控制除消费者是否使用推荐系统外,其他可能影响消费者购买力的因素不变,而该条件控制很难保证准确实现。其次,不同的消费者在年龄、收入、消费观念等条件方面有很大不同。单独比较使用推荐系统的消费者与未使用推荐系统的消费者的网购支出是否存在差异,不能保证消费者网购支出提高与使用推荐系统有直接因果效应。所以借鉴Kahneman等[47]运用反事实的情况,即寻找与使用推荐系统的消费者个人基础信息相似不使用推荐系统的消费者,然后将两者的网购支出相比较。由于两者的个人特征相似,所以两者网购支出差异是使用推荐系统后消费者网购支出的直接技术效应。
本文借鉴了部分Caliendo和Kopeinig[48]倾向得分匹配法的步骤:在考虑变量的情况下,选择使用probit或者logit模型分析估算倾向得分;根据得出的倾向得分将消费者进行匹配,执行匹配的方法具体有最近邻匹配法(Nearest Neighbor Matching Mathod)、核匹配法(Kenel Matching Mathod)和半径匹配法(Radius Matching Mathod)等;通过比较两组消费者匹配前后的偏差变化率、Pseudo-R2值等来分析不同匹配方法质量的差异;采用“剪枝(Trimming)”理论来检查假设条件引发消费者样本的损失的情况。
倾向得分匹配法中匹配估算消费者是否使用推荐系统的决定方程:
PS(X)=Pr[T=1|X]=E[T|X]
(1)
X定义为影响消费者使用推荐系统的宏观特征因素,PS定义为使用推荐系统消费者的概率,又称为倾向得分。通常建立Probit模型,计算每一个消费者的倾向得分,然后将倾向得分作为消费者之间匹配的依据。
样本整体的平均技术效应(ATE)为:
τi=PS·[E(Y1|T=1)-E(Y0|T=1)]+(1-PS)·[E(Y1|T=0)-E(Y0|T=0)]
(2)
PS表示消费者使用推荐系统(T=1)的概率;Y1是消费者使用推荐系统效应;Y0是消费者不使用技术的效应。方程(2)表示整个样本的技术效应为消费者使用推荐系统和不使用推荐系统的加权平均效应。然而反事实情况E(Y1|T=0)和E(Y0|T=1)是不能直接得出的。在仅考虑使用推荐系统的消费者样本的情况下,研究消费者样本的平均技术效应(ATT),需要构造一个反事实E(Y0|T=1)。使用推荐系统的消费者样本平均技术效应(ATT)可以表示为:
τATT=E(τ|T=1)=E(Y1|T=1)-E(Y0|T=1)
(3)
基于上述的讨论,推荐系统对消费者的平均技术效应,即ATT的倾向得分匹配评估可以从两组消费者的网购支出水平的平均差异得到,表示如下:
(4)
采用多种匹配方法可以在一定程度上提高稳健性,因此本文分别使用最近邻匹配法、半径匹配法和核匹配法进行匹配。
最近邻匹配的规则为:
C(i|T=1)
(5)
其中i|T=1代表使用推荐系统的消费者,i|T=0代表未使用推荐系统的消费者,C(i|T=1)为与消费者i|T=1成功匹配的消费者i|T=0的集合,即倾向得分与消费者i|T=1最为近似的消费者集合。
半径搜索的规则为:
C(i|T=1)
(6)
r 定义为匹配需要的半径又被称为卡尺或者卡钳,上式为所有消费者满足倾向得分与既定的消费者i的倾向得分差异小于等于r的集合。经过初步匹配,同时参考 Becker和Ichino[49]研究中ATT的计算方法得出公式:
(7)
(8)
与最近邻匹配法、半径匹配法原理不同,核匹配法引进了非参数估计概念。为了对消费者i|T=1进行高质量匹配,需要将既定PS值附近的未使用推荐系统网购的消费者加权运算,权重与消费者i|T=1和消费者i|T=0的PS值之差相关。
核匹配方法对应的ATT估算公式为:
(9)
本文实验采用Stata14.0分析实验数据,数据包含了消费者的基本信息、支出情况、对推荐系统的态度以及消费者在推荐系统使用前后消费支出变化。本文对相关数据进行预处理,有效数据3088份。
在简单最小二乘法(OLS)回归分析中只使用treat变量(OLS1)区分使用推荐系统的消费者和不使用推荐系统的消费者的情况下影响系数是显著的。使用推荐系统的消费者比不使用推荐系统的消费者网购支出高26.6%,如表3所示。
考虑结果的可解释性,OLS回归采用对数线性模型,对因变量消费者网购支出取对数。为了提高精准性,在此基础上加入了控制变量的模型(OLS2),仍然得出相同条件下,使用推荐系统的消费者比不使用推荐系统的消费者网购支出高16.7%,如表3所示。教育程度高低对网购支出有显著作用,原因可能是教育程度越高的消费者对推荐系统更容易接受,故接受度也就比较高。
表3 两组消费者OLS分析
Probit主要分析了各变量对消费者使用推荐系统的影响。研究中参与倾向得分估算的特征变量有性别、年龄、教育程度、所在地区等。从表4中可以看出消费者年龄增与使用推荐系统的概率呈反比,消费者的所在区域越接近城市,使用推荐系统的可能性越高。女性使用推荐系统的概率明显高于男性。年轻人更易受到推荐系统的影响。
表4 不同匹配方法的Probit估算结果
通过对消费者特征变量进行倾向得分估算,可研究使用推荐系统的消费者和不使用推荐系统的消费者的得分平衡性是否满足条件,在此基础上使用合格的得分计算最终倾向得分。
ATT是指消费者使用推荐系统对消费者网购支出(对数形式)的平均效应,即使用推荐系统的消费者与不使用推荐系统的消费者在网购支出上的花费差异。从表5可以看出,不论哪一种匹配方法,结果都显示使用推荐系统的消费者与不使用推荐系统的消费者有更高的消费,即推荐系统的技术效应是正向的。
表5 基于倾向得分匹配法的ATT值
但是不同的匹配方法的ATT结果略有不同:最邻近匹配法ATT值为18.4%、卡尺0.001匹配法ATT值为14.7%、卡尺0.01匹配法ATT值为14.9%、卡尺0.1匹配法ATT值为14.7%、核匹配法ATT值为15.9%。匹配方法都满足显著性(在1%水平显著)。
表6从三个衡量匹配质量的指标来计算不同匹配方法在匹配前后的数值变化,在匹配前所有消费者的平均标准偏差值为12.7,匹配后的平均偏差均出现了较大幅度的下降,其中最近邻匹配法平均标准偏差值降为3.7,下降比例为70.9%。
表6 不同匹配方法的匹配质量
使用卡尺匹配方法后,匹配质量显著提高。刻度卡钳为0.1和0.01时,平均标准偏差值分别降2.1和2.2,下降比例分别83.5%和82.7%。所以卡尺匹配的过程能够很好地平衡使用推荐系统的消费者和未使用推荐系统的消费者的个体特征。核匹配的质量介于最近邻匹配法和卡尺匹配法之间,平均标准偏差值降为2.2,下降比例为82.7%。除此之外,Pseudo-R2匹配前值为0.019,匹配后各匹配方法下降比例均达到89.5%。核匹配法匹配后值非常小,说明匹配变量在使用推荐系统的消费者和不使用推荐系统的消费者之间没有分布没有系统差异。且匹配前t检验值为7.78,经不同方法匹配后,t检验值下降比例均达到43.4%。因此倾向得分匹配法将推荐系统从其他影响消费者的因素中独立出来,证实了使用推荐系统对消费者网购支出有正向作用这一结果更有可信度。
图5为匹配后消费者倾向得分密度分布图,横轴代表倾向得分数值,纵轴代表倾向得分概率密度分布。从图可以发现,相对于匹配前概率密度分布,匹配后,使用推荐系统的消费者和未使用推荐系统的消费者的密度分布曲线均比未匹配的密度分布更加接近,表明匹配结果较好。处理前的数据,处理组呈现出尖峰分布,对照组呈现相对平峰分布,处理组和对照组之间差异较大,而经过不同方法的倾向得分匹配处理后的数据,处理组和对照组之间的差异性得到了较为明显的调整,两个组之间的密度分布更为接近,对于后续的分析意义更为严谨。
图5 倾向得分密度分布图
平衡性假设要求匹配后各变量在使用推荐系统的消费者组和不使用推荐系统的消费者组不存在显著差异。匹配后标准偏差的绝对值越小,匹配效果越好。变量的标准化偏差(% bias)大都小于10%。偏差变化的百分比(%Reduct|bias|)反映的是PSM前后数据匹配程度的变化,表明平衡性提升的幅度。表7结果显示除性别、教育程度外的其他变量在匹配前的t值都是显著的,而匹配后均不显著。样本中特征变量经过倾向得分匹配后,标准偏差明显减小,其中,年龄、地区等变量的标准化偏差经过匹配后下降幅度都达到80%以上,并且在几乎所有禀赋
表7 倾向得分匹配法匹配前后平衡性分析
特征变量下,使用推荐系统和不使用推荐系统的差异不再显著使用推荐和不使用推荐的禀赋特征差异基本得到了消除,表明平衡假设得到验证,即使用推荐和不使用推荐之间消费支出差异的结论是可信的。
倾向得分匹配模型中分别使用了最近邻匹配法、半径匹配法和核匹配法来估算推荐系统的使用对消费者网购支出的影响。不同匹配方法的在趋势和大方向上相类似,但结果有一点差异,如表8所示。最近邻匹配法和核匹配法的损失情况较少,损失率仅为0.19%,其中最近邻匹配法的设定是无替换最近邻匹配。半径匹配法的样本损失率较高,损失率受卡钳设置的影响,卡钳数值越小范围越受限,消费者样本的损失率越高。由于共同支撑区域的差异可能会导致半径匹配法估算结果相对于其他的匹配方法出现样本代表性降低的情况。
表8 共同支撑导致的消费者样本损失统计
为了验证倾向得分匹配法的实证结果,本文选择使用工具变量法进行稳健性检验,如表9所示。由于样本中的消费者来自不同的省份和地区,考虑到不同省份城市规模、金融商业、文化底蕴等虚拟变量可能与未纳入模型的遗漏变量存在相关性。该变量能影响消费者自主选择是否使用推荐,又对消费者网购的行为有一定影响。如一、二线城市和三、四线城市会因为经济发展水平高低、文化素养差异会自选择是否使用推荐,同时导致消费者网购消费支出数值不平衡的相关情况,即内生性问题。为了消除内生性,我们用工具变量法来研究推荐系统对消费者网购支出的影响效应,引入省份虚拟变量作为城市-农村虚拟变量的工具变量。结果显示使用推荐系统的消费者比不使用推荐系统的消费者网购支出高16.5%,低于回归方程的结果26.6%、16.7%,因此能够改善高估推荐技术的效应的弊端,与倾向得分匹配法结果相近,进一步检验了匹配结果的稳健性。
表9 工具变量法分析
推荐系统对消费者的消费方式与网购支出的影响是一个值得研究的问题。本文在消费函数理论背景下,构建了推荐系统对消费者网购支出影响研究框架,提出了待验证假说,并使用倾向得分匹配法进行假说验证。
本文调查了消费者层面的数据,分析了推荐系统对消费者网购支出的影响。推荐系统对消费者网购支出的影响是复杂的,一般认为推荐系统的进步会有较好的经济价值。在消费者自行选择是否使用推荐系统的情形下,消费者使用推荐系统的行为是由一系列以个人特征和消费习惯等变量决定的,所以我们使用了倾向得分匹配法来分析评估推荐系统对消费者网购支出的效应。并且本文在推荐系统效应的评估分析上使用了不同的倾向得分匹配方法来计算推荐系统对消费者购买力的经济效应,具体匹配方法不同会产生不同的共同支撑区域,从而造成消费者样本损失与匹配质量的差异,但样本损失率均低于2.59%。其中,最近邻居法与核匹配法中消费者样本信息损失较少,匹配质量欠佳。卡尺匹配法会实现较高的匹配质量,代价是会损失较多的消费者样本信息。
研究结果表明:使用推荐系统对增加消费者的网购支出具有稳健的正向作用。调查发现,OLS1和OLS2计算出使用推荐系统的消费者比不使用推荐系统的消费者人均网购支出高26.6%和16.7%,使用倾向得分匹配法对消费者匹配后得出结果仅为14.7%,该结果能改善描述性统计分析以及最小二乘法高估推荐效应的弊端。除此之外,本文使用工具变量法对倾向得分匹配法的结果进行进一步的稳健性检验,得出使用推荐系统的消费者比不使用推荐系统的消费者月人均网购支出高16.5%,与倾向得分匹配法结果基本相同。得出使用推荐系统对增加消费者的网购支出具有稳健的正向作用。
除此之外,推荐系统对消费者网购的影响还可以体现在对消费者网购产品和网购忠诚度方面:推荐系统可以着重向33岁以下的女性消费者推荐洗护彩妆产品、向23-33以及43-48的消费者推荐数码产品、向33-43岁的消费者推荐家用电器、向33岁以上和28岁以下的消费者推荐医疗保健产品、向48岁以上的消费者推荐家居清洁产品;同时在主页面向各年龄段消费者加大关于休闲零食和服装鞋袜的推荐。
推荐技术应注重向28-43岁的消费者加大基于社交关系的推荐、向38岁以上的消费者推送重复购买商品链接和店铺信息。商品的价格上升会导致消费者的流失,因此要合理控制价格的短期涨幅,增强消费消费者黏性,除此之外推荐系统要积极改善垃圾广告、虚假买家秀、刷单、泄露隐私等问题,同时提高推荐系统的新颖性,有助于提高消费者的满意度和忠诚度。将来可进一步细化分析定向和非定向推荐机制对消费者推荐的采纳率影响,着重分析平台间推荐系统差异对消费者网购支出的具体影响。