白晓萌
摘要:互联网时代,参与网购的消费者和销售商越来越多。商品的网购评论情况不仅可以帮助顾客做出产品购买决策,还可以帮助企业制定销售策略。基于亚马逊平台上的商品销量和评论信息,本文通过情感分析将评语量化为分数,并用相关性分析找到商品评星、评语和销量的关系,通过多元线性回归确定了通过评论衡量产品成功程度的度量方式。
Abstract: In the Internet era, more and more consumers and sellers participate in online shopping. Online comments of goods can not only help customers to make product purchase decisions, but also help enterprises to make sales strategies. Based on the sales and comments of products on the Amazon online market, sentiment analysis is used to transform the textual review into review score. The correlation analysis is used to find out the relationship between commodity ratings, comments and sales volume, and the method to measure the success of commodities through comments is developed based on Multiple Linear Regression.
关键词:网购评论;情感分析;相关性分析;多元线性回归
Key words: online reviews;sentiment analysis;correlation analysis;Multiple Linear Regression
中图分类号:F724.6 文献标识码:A 文章编号:1006-4311(2020)29-0013-03
0 引言
在线购物网站亚马逊的用户无论是否购买,都可以发表对产品的评论。对不同产品的评论各不相同,为市场分析提供了可获得的和丰富的数据。评论包括星级和评语,此外网站上还可以获取商品的销量和评论用户的部分个人信息。
在过去的几十年里,解释和处理用户意见信息的方法已经完成了许多工作。本文所做的不仅仅是对文字评论进行处理,而是根据所提供的所有与评论相关的数据进行全面的分析,建立衡量产品成功度的评价模型,帮助公司制定合适的销售策略。
1 评语量化
1.1 数据过滤
网购平台上可能存在无效评论,以下几种数据不做分析考虑。①评论总数少于15条的商品不进行分析。②同一个用户重复发表多条内容相同的评论,仅保留一条。③评论星级和评语情感色彩明显相反的评论(可能是误评),剔除出数据集。
1.2 量化分值的计算
文本形式的评语是一种不能直接参与计算的非数值数据,这给分析其中隐藏的信息带来了很大的困难。对出现在文本评论中的单词进行普查,可以发现除了虚词这类无意义的词之外,还有两种经常出现在复习中的词。一种是表达态度,另一种是描述产品特征。评论中出现的特征词比态度词更加多样化,这可能暗示了人们对具有特定特征的产品的偏好。在对不同类型产品的评论中态度词几乎相同,所以在处理文本时态度词比特征词更容易识别。基于数据的这一特点,可以采用情感分析对文本数据进行处理。
Vader算法[1]是一种基于词库和语法规则来进行文本情感识别的方法,其基本思想是通过人工标注为常用情感词(包括形容词、名词、副词等)进行了情感极性及强度判定。从-4到+4表示从极度负面和极度正面情感,从而构建vader词库。该算法还考慮了语法规则对情感判别的影响,如标点会加强句子的情感强度、否定词导致随后的情感次极性反转等,使用该算法处理文本后的量化值比较符合人的情感认知。
对于给定的输入文本数据,Vader情感分析算法返回一个极性分数百分比的三元组。它还提供了一个单个的评分标准,这是一个在[-1,1]范围内的实值,即评语量化后的分数,可以作为一种顾客对商品的评分。
1.3 评语和星级的相关性
通常情况下,当人们给予产品高星级时,他们倾向于给予正面评语,使用皮尔逊相关因数来找出评语和星级之间是否存在关系,此过程由SPSS软件完成。经检验,评语与星级之间的相关关系在0.01水平上显著,说明评语与星级之间存在正相关关系,且相关关系非常显著。
2 产品的声誉
2.1 评论的可信度
不同类型的客户做出的评论可信度是不同的。一些客户是亚马逊会员,这意味着他们更可靠,他们可以从亚马逊免费获得产品。有些顾客在发表评论之前并没有在亚马逊购买过该产品,这可能表明他们的评论不如那些购买过该产品的人可信。此外,亚马逊还为顾客提供了为他人评论“点赞”的机会。有些评论得到了很多点赞,但有些没有得到任何点赞。因此,在综合考虑所有评论之前,有必要使用一个参数来描述每个评论的可信度。根据上面的分析,每个评论的可信度与客户是否是亚马逊会员,是否购买过该产品,以及有多少点赞数有关。
式中wij表示第i件商品的第j条评论的可信度;v1表示每条评论获得的点赞数;v2表示评论者是否为会员;v3表示评论者是否购买过此商品;β是分配给三个因素的权重。
2.2 声誉计算
在评论可信度的基础上,引入产品市场声誉的计算方法。声誉一般指顾客对产品的满意程度,可以从评论中体现,声誉是评论所蕴含全部信息的高度概括。
实际上,顾客在做出评论时,可能会受到产品已有的评论影响。根据Park和Lee的实验结论[2],产品已有的好评数量越多,越有可能对后买的顾客产生积极影响。然而,差评的影响与差评数关系较小。一旦出现了差评,无论差评多或少,都会对客户产生较大的负面影响。据此,把商品的差评率作为单列的一项指标来评价产品声誉。
衡量产品的市场声誉时考虑3个因素和1个修正值,3个因素为:评论星级、文本评语量化得分、差评率,1个修正值为评论的可信度,前两个因素都要乘修正值才能使用。在对三个因素进行赋权时,可以采用简单的层次分析法。
3 产品成功度
销量高的产品就是成功的产品,每个月的销量数据比较容易直接从购物网站上获取。
下面将成功程度定义为销售数量的对数,认为销量的对数可以由产品评论星级和评语量化值以及差评率的线性组合表示,采用多元线性回归的方法,确定各项系数,建立由评论信息确定产品成功度的模型。以亚马逊网站上的电吹风、微波炉和婴儿奶嘴三类商品为例,用matlab软件的线性拟合工具进行拟合,可以得到拟合效果较好的一组参数,参数值如表1所示,拟合效果如图1所示。
经过回归方程的显著性检验,置信区间为95%,P=0.000028<0.0001,说明模型有效。由此,可以得到基于网络评论的产品成功度评价模型,如图2所示。
4 灵敏度分析
在计算评语可信度时,我们采用了主观赋权的方法,对可信度的三个指标β1、β2和β3进行赋权,缺乏客观性。为了使结论更加稳定,对权重进行了灵敏度分析。
根据俞立平等的研究[3],对指标权重的灵敏度分析时,权重之和必须为1,即一个指标权重的增加必然导致其他指标权重的减少。在一个评价体系的n个指标中,当某个指标vj的权重由βj增加到βj+σj时,为了保证所有指标的权重之和为1,其它(n-1)个指标平均每个指标的权重要减少σj/(n-1)。在可信度评价时共选取了3个指标,因此权值调整后的评价体系为:
在计算时,首先设置一个初始权重值,按照一定的步长逐渐增加σj,每改变一次权重都重新进行评价,直到评价后的排序不一致为止。由此可以得到使得评价排序稳定的权重波动范围。用matlab软件编写程序,分析各指标权重的灵敏度,表2是分析结果。
5 讨论与建议
5.1 发现与讨论
利用情感分析算法对文本进行处理,并将文本的情感倾向量化为一个值。研究发现,该值与星级评分有密切的关系。这很容易解释,因为人们倾向于同时给出好的评论和高星级评价,同时给出坏的评论和低星级评价。会员用户的评论更容易获得点赞。这可能是因为此类用户的评论通常比其他人长,他们写过的评论条数也比其他人多。
特定的星级评分会引发更多的评论。例如,顾客在看到一系列的低星级评价后,更有可能写一些不好的评论。同样地,顾客在看到一系列的高星级评价后,更有可能写出一些好的评论。
5.2 对商家的建议
通过高频词的提取和识别,可以发现电吹风、微波炉、婴儿奶嘴这三种产品在众多评论中其潜在的重要设计特征,以提高产品的可取性。结果显示,商家应该集中精力改进产品的以下方面:
①电吹风:功率、热度、外观、价格、使用寿命。
②微波炉:外观、空间、可维护性、发热性、使用寿命。
③奶嘴:好看、干凈、容量、容纳、可爱、洗涤。
另外,这三类产品的年销售高峰是在12月到次年2月,所以建议商家应该在冬季(圣诞节前后)推出新产品。此外,每款商品从上市起,其评论数量和销量都随时间呈现指数式增长,这可以反映市场需求量。所以当商家进入网络市场时,其生产厂家应该有充足的供应保证满足市场指数增长的需求。
参考文献:
[1]C. J. Hutto, Eric Gilbert. VADER: A Parsimonious Rule-Based Model for Sentiment Analysis of Social Media Text[J]. 2014.
[2]Park N , Lee K M . Effects of online news forum on corporate reputation[J]. Public Relations Review, 2007, 33(3):346-348.
[3]俞立平,潘云涛,武夷山.科技评价灵敏度分析研究——单个指标与组合指标[J].软科学,2009,23(008):1-4.