颜紫欣 游凡毅 齐奕萌 首都经济贸易大学管理工程学院
在当今的网络信息时代,电子商务因其开放性、全球性、低成本和高效率的特点得以发展,现今已然成为人们生活中不可或缺的成分。从消费者的反馈中提取有效信息,并根据信息调整销售模式以获得更多利益是商家发展不可缺少的一步,消费者的反馈在不同电子商务平台有着不同的表现形式,通常为评星(一共有五颗星,从最差到最好分别是一星到五星,消费者可根据使用感受决定星星的数量)和文本评论。
首先将数据进行预处理,删除重复等无用数据,建立星级、评论、帮助评论三者关系的模型,其中评论为文本型数据,需要将其量化,在考虑vine与verified_purchase对评价有用性的影响,使用层次分析法得到各部分权重,得出该评论者反映的产品综合评分,分析产品综合评分的趋势,以此反应产品声誉的上升或下降。
以亚马逊网站上的评论为研究对象,从评论(reviews)、评价星级(star ratings)、helpfulness rating的数字特征出发,建立他们之间的关系模型。本文采用经过处理的文本情感数据作为评论文本的一个parameter,将其中的情感极性量化到[-1,1]的范围内,数值越接近-1表明负面情感更强烈,数值越接近1表示积极情感更强烈。[1]亚马逊通过让消费者对产品打分(星级1-5星),1星表示极端差评,3星表示中性。[2]极端性值越接近-1表明负面情感更强烈,数值越接近1表示积极情感更强烈。由于文本评论过于复杂、不够直观,因而利用情感分析技术将文本评论数字化,利用加权平均算法式(1)计算,可有效提高通用领域情感分类的效率和准确率。
其中:
-Np:表达正面情感的词汇数目
-Nn:表达负面情感的词汇数目
-WPi:正面情感词汇权值
-WPj:负面情感词汇权值
本文利用其定性与定量相结合处理各种决策因素的特点,将层次分析法运用到评审意见的综合评定上。本文将客户评论综合评分定义为目标层,将5个指标(评论文本、星级评定、帮助性评定、vine voices、验证购买)定义为准则层,将每一个客户回顾定义为方案层,建立层次结构模型,通过前面的数据处理,以及相关关系分析,构造各准则层的判断矩阵如下(矩阵a~c)。
(a)Reviews and Ratings
(b)Other influencing factors
(c)Comprehensive Score
计算每个判断矩阵的归一化特征向量wk,最大特征值λmax和一致性比率CR,其中k为判断矩阵a~c,通过了一致性检验,再对每个准则层的特征向量进行处理,得到每一个指标的权重,可以得到每一个用户对于商品的总评分。
表1 吹风机的词频
其中:-:第j类的商品总平均分提取前百分之二十,这部分都是评价较高的商品类别。具有该种特征的商品就是不合格产品。
从表1中的词频数据可分析得到,消费者更注重吹风机的特殊专利技术 (“ionic”“turbo”“tourmaline”)、材质(“ceramic”)、功 率(“watt”)、颜色(“black”“blonde”)和便携性(“light”)。同理,也筛选出了其他两种产品的最受消费者关注的几个特征:
微波炉——功率、size、加热器、节能、转盘
奶嘴——材质、形状、口径大小、软硬度
本文首先从评论特征方面选取评论文本的情感极端性、评论的主观性、评论长度进行研究。本文采用其中的情感极性量化,用5个星级评价测量消费者的对产品的态度。其次利用其定性与定量相结合处理各种决策因素的特点,将层次分析法运用到评审意见的综合评定上。最后得到每一个用户对于商品的总评分。