评论经验与评论效用之间关系的实证研究

2020-03-03 08:52:00

福建质量管理 2020年2期

(武汉大学经济与管理学院湖北武汉 430072)

一、引言

信息过载已经成为影响消费体验的一个重要因素。如何从用户生成的纷繁复杂的在线评论中筛选出高质量评论，用以帮助消费者做出更好的购买决定?基于此，众多的学者和电商平台针对评论的有效性做出了很多的研究。例如，崔楠,张建,王菊卿(2014)基于淘宝数据的研究，认为极端负面评论比极端正面评论更能影响。Salehan和Kim(2016)基于亚马逊网上数据的研究结果就表明持有中性情感倾向的评论被认为更有用。在这些关于评论文本的研究基础上，本文更关注的是评论者特征。现有的文献一般比较关注于评论者的评分、评论者的等级、评论者的信誉、评论者是否为意见领袖和评论者获得的某种“勋章”数量等因素对评论效用的影响。但是，研究者关注的大多数是这些最直观的评论者特征，而忽略了评论者的评论经验对评论效用的隐性影响。为了排除干扰，本文结合前人对评论效用的研究把文本特征：时效性、文本长度、评分的极端性和情感倾向性作为控制变量，结果表明，随着评论经验的增加，评论的效用在增加。

二、文献综述

在电商社区的发展中，关于评论的有用性一直是很多研究的关注点。研究的方向主要集中于评论文本内容和评论者本身特征上。Ngo-Ye和Sinha(2014)分析了评论者所携带的特征(比如信誉、承诺、即时活动、在线评论的有用性等)的影响；他们发现评论者的属性比评论文本本身更能加强评论的效价。

除此之外，评论的情感倾向、评分极性、文本长度和时效同样获得很多学者的重视。Baek、Lee、Oh和Ahn(2015)研究了评分极端性与评论效价之间的关系，表明评分越接近于评论对象平均评分越是有用。在此基础上，Yin、Mitra、和Zhang(2016)提供了更进一步的研究，他们觉得消费者在看到评论时倾向于认为能证实自己原本看法的评论更有用即存在证实性偏见。崔楠,张建,王菊卿(2014)将文本分为以情感和以信息为中心，认为极端负面评论比极端正面评论更能影响评论效用，而以信息为中心的文本与评论的效用呈显著正相关。

虽然无论是评论者本身特征还是评论文本都有前人研究过，但是本文更关注的是评论者属性的隐性因素即评论者的评论经验。那些购物较频繁、热衷于写评论的人是否比其他人所留下的评论更具有用性?本文把评论者的评论经验作为评论有用性重要的影响因素，结合时效、文本长度、情感倾向性、评分的差异性等直观的文本特征因素作为控制变量，探讨它们与评论有用性之间的关系。

三、提出假设

由于不同原因而导致的评论经验的差别性，是评论者属性的重要判别因素。而在前人的研究中，更多的关注于评论者的信誉度、”勋章”数量、好友数量、是否为意见领袖等，例如Ngo-Ye和Sinha(2014)认为评论者的信誉度、承诺性等比评论文本更能加强评论效用。这些属性可能在如豆瓣、知乎这样的社区性网站中，由于话题的集中性更容易形成意见领袖或者积累一些外在荣誉，从而影响评论的效用。所以，本文关注于评论者更加本质的属性即评论者的评论经验，想要研究随着评论者评论经验的增加是否会有一个自我学习、完善的过程，从而使评论经验丰富的评论者所写的评论的有用性与其他人有着显著差异。在此基础上我们可以做出如下假设：

H1：评论者的评论经验对评论的效用存在显著影响。

四、研究设计

(一)研究模型

针对假设，我们建立以下回归模型：

ratio=β0+β1numb+β2Abs_Score+β3LnTime+β4Text_length+β5Sentiment

(1)

因变量为在线评论中认为”有用”的人与所有做出”有用”、”没用”选择的人总数的比率(ratio),我们用它来衡量一条评论的效用。如果一条评论的有用比率越高，我们认为它的效用越大。模型的解释变量为评论经验(numb)，我们通过评论者发表过的评论数量来衡量他的评论经验。在控制变量方面，用当前评论的评分距商品平均评分的绝对值(Abs_Score)来表示评分的极端性。我们用评论发表的时间与我们拿到数据的时间差(Time)的来表示时效性。在前面我们提到过评论文本的长度对评论的效用有正向促进作用，所以我们通过分词手段计算出一个评论的词数作为文本长度(Text_length)的衡量标准，评论的词数越多，文本越长。情感倾向性一直是众多学者研究评论有用性的一个重要影响因素。本文把情感倾向性非为正面情感倾向和负面情感倾向，Sentiment=1表示评论具有正面情感倾向；Sentiment=-1表示评论具有负面情感倾向。

(二)数据来源

本文的数据来源于斯坦福大学复杂网络分析平台上公开的数据集，该数据集是关于Amazon上FineFood长达13年的评论信息。不像天猫商城上只能看到评论者的会员等级，亚马逊会给出给家详细的信息，不仅包括当前评论的“有用”投票数，还包括了评论者之前获得的总投票数、评论者排名等信息，这为我们的研究提供了更好的数据支撑。本文选取的数据集共有57万条评论，涵盖了25.6万用户，7.4万种商品。但是里面的数据不一定全部符合我们的研究要求，需要对其进行一些筛选、清洗等处理。

(三)数据处理

我们对评论时间差取对数变换，以此来作为测量依据。情感倾向性(Sentiment)是评论比较直观的测度，我们直接根据评论者对商品的评分(即网站上的星级评价)来进行情感倾向性的人工标记。我们认为当评论者的评分大于3时，他对购买的商品是持积极态度的；而当评论者的评分小于等于3时，我们认为他对购买的商品持消极态度。在确认文本长度方面，英文的文本相对于中文来说更易处理，我们通过简单的分词手段计算出评论文本的单词个数作为文本长度的测度。最后，我们对数据中的一些缺失值、不规整数据予以剔除。

五、实证结果分析

(一)描述性统计结果

表1 描述性统计

从表1我们可以看到，投“有用”票数的人占总投票数的比率的均值为0.78。这说明从整体上考虑消费者在看到评论时更加倾向于选择投“有用”票。评论者给予商品的评分据商品的平均分1.19。这显示了评论者之间的评分一般在商品平均评分的上下1.19分左右波动，差异性还是比较大的。我们获取数据时距评论发表的时间差的均值为20.97，这是取过对数后的结果，从标准差上看取对数后的时间的离散程度大大减小。评论的文本长度之间存在很大的差异。在前文中，我们曾经提到过文本的长度对评论的有用有着积极的影响，在其他条件不变的情况下文本长度越长评论的有用性越强。所以，文本的长度是我们必须要控制的因素。评论者的情感倾向性的平均值为0.44，这显示了大多数的评论者都倾向于留下比较正面的评论。

(二)多元回归结果

表3 多元回归结果

从表3中可以看到模型(1)的回归结果。模型的主要解释变量numb，即评论者发表评论次数的系数显著为负，这就说明评论者发表评论的次数与评论的有效性有着显著负相关。这样H1就得到了验证，说明在线评论中评论者的评论评论经验对评论的有用性有着负面影响。

对于其他控制变量，Abs_Score所表示的评分的极端性、LnTime所表示的时间差的对数、Text_length所表示的评论文本的长度的相关系数都符合我们的预期。评分的极端性越小，评论的有用性越高，这正好验证了消费者证实性偏见的存在即评论的评分越接近商品平均评分消费者认为这条评论越有用。评论的时效性的回归结果显示了评论越新，有用性越高。这可能有两种原因：第一，消费者浏览评论信息都是从前往后的，在前面的评论中消费者就已经可以从无到有获得一定的关于商品的信息量，让他们下意识的对新的评论给予较高的有用性评价，而后面的旧评论所展现的内容可能都在前面评论中出现过了，从而导致消费者对其的有用性感知下降。文本长度对评论有用性的正向作用在前人的很多研究中都有发现。这很容易理解，文本越长,能够包含的信息越多，越是能加深浏览者对商品的了解。

六、结语

本文选取亚马逊网上关于FineFood的大量评论信息作为研究数据，通过控制评论的文本因素(评论评分极端性、时效性、文本长度、情感倾向性)，采用实证分析的方式来探究评论者的评论经验与评论效用之间的关系。研究结果表明，评论经验在整体上与评论的效用成显著负相关。这可以为电商平台筛选评论，提高评论区域评论的质量，帮助浏览者做出更好的购买决策提供重要的借鉴意义。在研究评论效用方面，本文虽然做出了一些创新和拓展，但还是存在着一些局限性。可以进一步挖掘更多的文本特征比如主客观情感、主题关联度等，从而提高模型的预测准确率。