章 璇
(嘉兴学院 商学院,浙江嘉兴314001)
当前,各种电商平台、第三方评论网站和虚拟社区都会提供评论功能,便于买卖双方以及潜在购买者交流。由于在线评论对浏览者的购买决策影响很大,商家和电商平台也非常重视在线评论的管理工作。自从1995年亚马逊最先建立在线评论网站以来,其他电子商务网站以及第三方平台纷纷效仿并不断完善评论系统的功能和管理机制。但网站产生的海量在线评论,大大增加了消费者查看评论获取有用信息的成本,[1]促使电商平台和第三方评论网站纷纷建立评论推荐和筛选功能。通过文本挖掘和大数据分析技术,快速评估和筛选对消费者感知有用的评论。为了优化这些系统,有大量学者从数据挖掘、信息系统、消费者行为等方面研究对消费者有用的在线评论,[2-8]结果发现,作为语言学特征的文本评论长度能代表评论文本的信息量,且评论中提供的信息量越大,给浏览者提供的有价值的信息就越多,进而增强了评论的有用性。因此,本文采用真实评论数据,实证检验文本评论长度对评论有用性的影响,并比较不同类型产品中这种影响的差异。
评论有用性是判断评论信息功能的主要研究变量,有用的产品评论可以为客户提供更多有价值的信息,减少用户搜索所需信息的时间。[9]Mudambi和Schuff是最早从感知价值角度对在线评论有用性进行定义的,该定义得到学者们的广泛认可:[10]在线评论有用性就是消费者在做出决策过程中对在线评论感知到的价值。从这个定义讲,在线评论有用性是浏览评论的消费者对该条评论信息的主观价值判断。虽然这个判断是主观的,却能反映该条评论在消费者心中的价值。在电子商务和消费者行为研究领域,采用的就是感知评论有用性的问卷量表来测量评论有用性的。[6,10-13]感知评论有用性是消费者在做出购物决策过程中感知到的产品评论有用程度的主观测量,而这种主观测量具有促进消费者做出购买决策的作用,所以这种测量方式与其他变量的数据格式是一致的。在信息系统、数据挖掘等研究领域内,在线评论研究的数据都是真实的评论数据,数据样本单位是每一条评论,模型中的变量测量也是采用客观评论数据的特征数值,此时评论有用性通常采用评论的投票数量或比例来计量。[4,14-15]感知评论有用性和投票数据都表达了对在线评论感知到的价值,其实都是消费者对在线评论的一种主观感知,且都是在购物决策过程中产生的,因此,两者并没有实质性差别,也就是说采用量表的主观测量与评论有用性投票数据都是对评论有用性的有效测量方式。[10]
研究评论有用性的影响因素旨在探讨各方因素对评论有用性的影响。目前的研究主要集中在评论内容、评论者特征、评论平台特征(比如类型以及推荐系统)、产品特征(比如产品类型及品牌声誉)这几个方面。[16]Yoon-Joo在总结前人研究的基础上,将其中只与评论本身有关的评论特性分为语言学特征、评论内容、其他因素三类:语言学特征包括总字数等等;评论内容包括正面评论/负面评论、主观评论/客观评论等;其他因素包括评论星级、评论时间等。[8]本文也沿用这种分类来梳理评论特性,表1中评论语言学特征用Ling代表,评论内容用Cont代表,其他因素用PeriF代表,而产品特征只列举了产品类型这一个影响因素,主要分体验型和搜索型两类。
由表1可知:一是产品以体验型和搜索型居多,其中手机最多;二是多数评论采用有用性投票方式;三是关注评论内容特征的较多,主要涉及评论长度这个特征,这说明评论文本长度对评论有用性有显著的影响。Mudambi和Schuff等采用评论文本中的字数来描述评论长度,认为当评论文本拥有更多字词数量时,所体现的“说服性论证的力量”更强。[10]大量研究也表明,评论的字数对评论有用性投票有影响。[3-6,10,16-17]表1同样说明了这一点。Wang等从信息量的角度解释了评论长度的作用,即评论字数越多可以获取的信息量也就越大,对消费者来说可能更有用。[18]因此,提出假设H1:评论文本长度对评论有用性有正向影响。
众所周知,消费者针对不同类型的产品,会有不同的阅读评论信息需求及不同的在线购买决策。[19]其中,搜索型产品的评论长度对评论有用性的影响比体验型产品更大。[10]原因在于搜索型产品的评论中更多描述的是产品的客观属性,而体验型产品的评论则带有主观色彩的个人体验,因此,搜索型产品的评论文字越多对于浏览者而言越有价值。本文则根据产品的异质性划分来探讨产品类型对评论有用性的影响。
Copeland根据消费者的购买习惯和愿意付出的努力将产品分为便利品、选购品和特殊品。[20]便利品是指的是可以方便购买到的产品;选购品是指消费者在购买时愿意“货比三家”的产品,如衣服、瓷器等;特殊品是指消费者愿意付出努力去购买的产品,如高档家具等。Murphy和Enis在此基础上又增加了偏好品——消费者涉入程度低,但品牌偏好高的产品。[21]其中,选购品可分为同质选购品和异质选购品:同质选购品是指同一类产品中特征和质量相同或相近的产品,仅仅只是品牌和价格不同,消费者在选购时更关注的是价格;而异质选购品则是指同一类产品中产品质量、外观性能等差异很大,消费者更看重的是产品的某些异质属性。冯娇和姚忠在研究消费者在线评论文本长度时发现,购买者的评论文本长度是根据购买者对该产品的喜好程度所决定的。[22]这种喜好是对产品某些异质属性的主观偏好或是对品牌的偏好。这意味着异质性大的产品购买者会给出更多字数的评论,同时,浏览者会得到更多有用的信息。因此,异质性强的产品的评论文本长度对评论有用性的影响更大。具体
表1 评论有用性和评论特性文献回顾
来说,就是异质性强的便利品、选购品和特殊品的评论有用性高于同质性的便利品和选购品。因此,本文提出假设H2:产品类型对评论文本长度在评论有用性影响方面存在调节效应。
本文采用亚马逊中国网站不同产品类型的评论数据,使用爬虫软件提取其中的评论时间、评论星级、评论标题和评论文本以及有用的投票数据作为变量的测量指标来进行实证分析。
依据文献[23],分别选取评论标题长度、评论效价、评论发表时长作为评论有用性的解释变量。标题内容能在一定程度上表现评论总体的情感极性,标题的长度能反映出评论者对评论的重视程度以及评论信息的提炼。因此,评论标题的长度对评论有用性有正向影响。而评论的数值型评价和评论文本内容中的感情效价构成了评论效价,反映了评论者对产品或服务的态度,[24]本文采用数值型评价。数值型评价中的极端评论相比于模糊不清的中性评论能为消费者提供更多有价值的信息,因此被认为更有用。[25]而大量的正面评论则会给消费者带来消极倾向,因此,负面的效价评论往往比正面的效价评价更有用,[26]即评论效价对评论有用性有负向影响。另外,评论发表的时间越长,则评论有用性越低。
根据同质性和异质性选购品的特点对家电类产品、数码影音类产品、家装类产品进行重新划分,如表2。由于亚马逊中国网站的首页中有些中级类别产品会在不同大类中重复出现,本文对此进行了删减,使其仅在相应的一个大类中出现。
表2 产品分类情况统计
表3是利用爬虫软件,将所有产品的评论数据进行统计(剔除无评论的产品和全外文的评论数据),最终得到9120条评论。其中,数码影音类产品评论5754条,家电类产品评论2625条,家装类产品评论741条。另外,还涉及了大类产品数量及评论数量的分布,构成了研究分析的样本。
表3 样本构成情况统计
整理数据发现,样本中产品的评论数据主要包含评论星级、评论标题、评论时长、购买产品型号、评论文本内容、评论有用的人数和评论者名称等方面。
1.变量设计
为验证评论文本的长度对评论有用性的影响,实证模型的被解释变量为评论有用性,以评论有用的人数进行测度。解释变量分别为评论文本长度、评论标题长度、评论时间、评论效价,其中核心解释变量为评论文本长度,以文字评论的字数进行测度。此外,将同质性家电产品和异质性更高的家装产品设为虚拟变量也纳入表4,而将异质性居中的数码影音类产品设置为参照类别。
表4 变量设计
在验证产品类别的调节效应时会将产品类别与评论文本长度的乘积项也加入模型。而上述变量的量纲大小不一,且均为正值。因此,对评论文本长度、评论标题长度、评论时间和评论效价这4个解释变量均进行了min-max归一化处理。再将归一化后的评论文本长度与家电产品和家装产品类别变量相乘得到两个乘积项,也纳入表4。
2.描述性统计及分析方法
通过对表4中被解释变量和四个主要解释变量样本数据的描述性统计,结果显示:有9210条评论数据,其中被解释变量评论有用性为计数数据,最小值为零,最大值为77。超过25 %的评论有用性为0。表明解释变量的离散型特征非常明显,不满足普通OLS回归模型的基本要求(见表5)。
表5 变量的描述性统计
在计量分析中,广泛采用泊松回归、负二项回归、零膨胀泊松回归或零膨胀负二项回归三类模型处理解释变量的离散数据。泊松回归要求样本数据的均值与方差相等,而零膨胀泊松回归或零膨胀负二项回归主要适用于样本数据存在大多数零值的情况。[27]本文数据中的评论有用性方差为2780.72(52.7325的平方),远大于均值6.04,且零值数量大于25 %,小于50 %。因此,采用负二项回归模型更为适合。同时,考虑到另外两个类别虚拟变量及其乘积项的影响,设定本文研究模型为:
HF=β0+β1LR+β2LT+β3TIME+β4VALENCE+β5CG1+β6CG2+β7LR×CG1+β8LR×CG2+ε
(1)
由表6可知,模型中各解释变量间有显著的相关性但相关系数均小于0.5。
表6 解释变量pearson相关系数矩阵
对模型中各解释变量的方差膨胀因子(VIF)计算发现,所有解释变量的方差膨胀因子(VIF)均小于5(见表7),说明模型中各解释变量之间不存在多重共线性问题。
表7 各解释变量方差膨胀因子(VIF)
根据式(1)对样本数据采用负二项回归模型分析,结果见表8。
由表8可知,4个主要解释变量中,除评论时间对评论有用性投票的影响不显著外,其他三个解释变量对评论有用性投票的影响都是显著的。其中评论效价是负向影响,而评论文本长度、评论标题长度对评论有用性的投票数都有正向影响,且在该模型中,评论文本长度的影响是最大的,是模型解释变量中最主要的影响因素。作为调节变量的产品类别对评论有用性也有直接影响,家电类产品的评论有用性要略高于数码影音类产品,家装类产品的评论有用性则略低于数码影音类产品。但是对比直接影响产品类别与评论长度乘积项对评论有用性的影响则更大,这也说明产品类别的调节效应是显著的。
表8 负二项回归模型结果
为了更好地评价负二项回归模型的拟合优度以及验证上述实证结论的稳健性,采用泊松回归模型和零膨胀负二项回归模型对相同的变量进行拟合,结果见表9、表10所示。
表9 泊松回归模型结果
由表9可知,虽然泊松回归模型伪R方要大于负二项回归模型伪R方,但是泊松回归模型的赤池信息准则(AIC)与贝叶斯信息准则(BIC)都明显大于负二项回归模型AIC与BIC,表明负二项回归模型拟合优度比泊松回归模型更高。结合负二项回归模型中离散系数alpha显著,说明负二项回归模型更适合该样本数据分析。
表10 零膨胀负二项回归模型结果
由表10可知,采用零膨胀负二项回归模型的离散系数alpha也是显著的,说明零膨胀负二项回归模型也适用于该样本分析。同时,零膨胀负二项回归模型分析的AIC和BIC比负二项回归模型小,但非常接近,说明零膨胀负二项回归模型的拟合优度要好于负二项回归模型。通过比较表10与表8中解释变量的影响效果发现,零膨胀负二项回归模型与负二项回归模型的结果基本一致,两个模型都得出了同一结论,因此假设一得到验证,评论文本长度对评论有用性有正向影响。
在调节效应的影响中,零膨胀负二项回归模型的结果也与负二项回归模型一致,说明产品类别对评论有用性有直接影响。对参照组数码影音类产品,由表8和表10可以看出,家电类产品的评论有用性略高于数码影音类产品,家装类产品的评论有用性略低于数码影音类产品。但是这种直接影响远不如产品类别和评论文本长度的乘积项的影响大,显示家电和家装类产品的评论文本长度对评论有用性的影响要显著小于数码影音类产品,表明了该结论的稳健性,因此假设二得到验证,即产品类别的调节作用确实存在。但值得注意的是,三个类别产品的对比中并不是如研究者推断的异质性最高的家装类产品的调节作用最大,而是异质性居中的数码影音类产品的调节效用最大,即数码影音类产品的评论文本长度对评论有用性的影响要强于家电和家装类产品,这可能与三类产品样本不够聚焦以及样本量不均衡有关,在后续的研究中应该尽量规避这些问题。
本文对评论文本长度对评论有用性的影响及产品类型的调节作用进行了研究:对于异质性居中的数码影音类产品,评论文本字数越多对评论阅读者越有用;对于同质性的家电类产品和异质性更大的家装类产品,这种效应虽然也存在,但没有数码影音类产品那么强烈,这说明在考虑产品评论作用以及评论文本特征时,有必要区分产品类型。同时,评论标题长度、评论效价对评论有用性的影响也在本文中得到了证实。另外,还验证了以产品异质性划分的产品类型在评论文本长度的有用性影响上的调节效应,这为商家的营销活动提供了一定的指导作用:1)努力提升产品质量和售后服务以减少负面口碑的发布;2)提供相关的评论框架链接,由商家传递给消费者,引导消费者规范描述评论标题和评论内容中有关产品质量、购买心得、建议和总体感受,以丰富评论内容;3)实行各种激励方案,鼓励消费者发表更丰富、更有决策参考价值的评论。