薛晨杰 王召义 江楠 钱丽琼
摘 要:第三方购物平台上的商品负面评论对消费者购买意向、商家信用等级、平台交易转化都形成不良影响,需通过有效措施进行补救。以当前国产主流品牌小米手机为研究对象,通过八爪鱼采集器爬取京东商城评论内容进行情感分析,利用Jieba分词、词云图、LDA主题模型对产品负面评论进行分析。消费者对该平台上的小米手机主要的负面评论反映在六个方面,给消费者带来不好的体验,品牌方应加以重视并实施补救。
关键词:情感分析;负面评论补救;主题模型
中图分类号:F724.6;F273.2 文献标识码:A 文章编号:1671-9255(2024)01-0019-06
一、引言
电商购物环境日趋成熟,消费者更加习惯参考在线评论来指导购买决策。同时,相对于正面评论,他们更倾向于信任负面评价,潜意识里认为给出差评的人分享的是真实的购物体验,能够提供更高的参考价值。[1-4]因此,负面评论成为影响品牌形象和销售业绩的重要因素。[5-7]
商家应从根本上杜绝商品和服务出现质量问题,在负面评论形成之前进行合理控制;而对于已产生的负面评论信息,商家应给予更多的关注并实施补救,[8]并根据负面在线评论深入挖掘客户需求,制定更精准的营销策略。[9]
与此同时,关于电商评论的文本情感分析是目前的研究趋势和热点,并且有很高的理论及实践价值。李宏等(2011)认为消费者倾向于通过情感线索来收集和处理信息,对负面情感的信息更为敏感[10];史伟等(2015)通过对微博文本内容作情感分析预测电影票房[11];Dasgupta等(2016)对三星手机的评论进行情感分析,收集用户对于该品牌手机的意见[12];李涵昱等(2017)通过情感分析方法判断消费者评论的情感导向[13];郑丽娟和王洪伟(2017)认为商品评论中包含的情感强度可以衡量企业受欢迎的程度[14];庞庆华等(2022)结合BiGRU和CNN的情感分类网络,对商品评论进行分析[15]。
对在线评论进行情感分析有很多方法,其中,LDA主题模型是一种能够提取文本隐含主题的非监督学习模型[16],能够确定最优主题的个数。本文基于该方法对京东商城上的小米手机负面评论内容进行情感分析,对数据内容进行挖掘,划分出给予负面评论的消费者所关注的主题范围和信息点,并提出相关补救建议。
二、研究模型及方法
本文通过八爪鱼采集器爬取京东商城小米手机评论内容,利用Jieba分词、词云图、LDA主题模型等方法对产品负面评论进行分析,最终对负面评论进行主题分类,从而确定消费者所关注的主题范围和信息点,得出负面评论补救措施。研究模型如图1所示。
词云图是一种文本可视化技术,通常用于汇总和呈现文本数据中各个词语的重要性和出现频率,是一种用于可视化文本数据的图形表示方法,有助于从大规模文本中提取和呈现重要的词汇信息,以便更好地理解文本内容和关键主题,如图2所示。
其基本原理如下:
词频统计:对输入的文本数据进行预处理,统计每个词语在文本中的出现次数,得到各个词语的词频信息。
词语权重计算:使用某种权重计算方法确定每个词语的重要性。
可视化排列:将计算得到的词语及其权重按照一定的布局算法排列在图形中。重要的词语通常显示得更大,而不重要的词语则较小。
可视化展示:生成的词云图以视觉形式呈现,通常采用多彩的颜色和各种字体以增强词语的可视吸引力。
交互性:一些词云图可以具有交互性,使用户能够通过鼠标悬停或点击词语来获得有关该词语的更多信息。
LDA模型是一种概率图模型,通常用于主题建模和文本分析,以发现文本集合中潜在的主题结构。主题模型常用于自然语言处理(NLP)等领域,是一种在文档中挖掘抽象主题的统计模型。LDA主题模型就是三层贝叶斯概率模型,这三层结构包含文档(d)、主题(z)和特征词(w)。对文本进行建模能够挖掘文本数据中的潜在主题,从而分析文本數据聚焦的关注点和相关的特征词。LDA模型结构图如图3所示。
三、实证分析
京东商城是当前中国最知名的B2C平台之一,平台产品的评论数据丰富完整。本文选择京东商城中小米品牌近两年发布的数字系列旗舰款手机的购物评论信息作为数据来源。
电商产品评论数据可通过多种方式获取,一般可通过编写网络爬虫程序自动爬取需要的内容;或是通过采用市场上常用的成熟数据采集工具如八爪鱼、火车采集器等进行收集。其中,八爪鱼采集器应用很广泛,具备适合场景广、信息多层级智能采集等优势。综合对比,本文使用八爪鱼采集器来获取产品评论数据,部分产品评论数据如表1所示。
京东商城的负面评论广泛分布在评价星级≤3的评论中,故对于爬取到的产品评论数据按评价星级进行筛选,再将无意义评论进行删除。
在进行以上初步筛选后,该产品评论数据依然存在重复内容。如果直接引入后续的分词、情感分析等过程,会对分析结果造成较大的影响,故在使用产品负面评论数据前,对其进行简单的文本去重,也就是两两对比,遇到完全相同的评论内容就去除,最终得到部分产品负面评论数据,如表2所示。
1.基于分词的词云可视化
(1)产品负面评论分词
本文采用Python库中专门用于中文分词的开源包“jieba”分词包。经过相关测试,该分词包的分词精度高达97%以上。
而基于Python的“jieba”分词包支持三种模式,分别是全模式、精准模式和搜索引擎模式。其中,精准模式是最适合文本的模式,它將整句话精确分词,已切分出的词语不会再重叠展现,本文采用精准模式这种方法进行分词。
(2)分词优化并可视化结果
分词后的结果依然夹杂着“开始”“就是”“小米”“手机”等与本实验没有实质性关系的高频词汇,故增加无意义的停止词库stop.txt以优化分词结果。
而对于分词后出现的单个字符,大多数并无实际意义,如一些人称代词“我”“你”“他”等,这些字符与本次实验相关度较低,故需排除。
相关部分代码如下:
words = jieba.lcut(txt)
# 增加无意义的词库
excludes = []
with open("./stops.txt", 'r', encoding="utf-8") as f:
for line in f.readlines():
line = line.strip('\n')
excludes.append(line)
rword = []
for word in words:
# 去除单个字符
if len(word) == 1:
continue
if word in excludes:
continue
else:
rword.append(word)
txt_cmt = " ".join(rword)
利用Python中的wordcloud类库对分词后的高频词绘制词云图,得到如图4所示。
通过上面的词云图可以看出,在对爬取到的负面评论数据进行预处理后,分词效果较符合预期。其中,“发热”“屏幕”“充电器”“客服”“降价”“发烫”“卡顿”等词出现频率较高。因此,可以直观地判断用户较关注小米手机的这些重要属性,形成初步印象。
(1)LDA主题模型的建立
LDA模型假定每篇评论由各个主题按一定比例随机混合而成,混合比例服从多项分布,记为式:
每个主题由词汇表中的各个词语按一定比例混合而成,混合比例服从多项分布,记为式:
在评论条件下生成词的概率表示为式:
其中,表示词属于第S个主题的概率,表示S个主题在评论中的概率。
LDA主题模型是一种无监督的模式,只需要提供训练文档,就可以自动训练出各种概率,无须任何人工标注过程,节省了大量的人力及时间。它在文本聚类、主题分析和相似度计算等方面都有广泛的应用。相较于其他主题模型,其引入了狄利克雷先验知识,泛化能力较强。
(2)确定最优主题数
在自然语言处理中,一个语言概率模型可以看成是在整个句子或者文段上的概率分布,可以使用困惑度对语言概率模型进行优劣评价。而在LDA主题模型中,其中非常重要的步骤就是确定最优主题数。通过确定最优主题数可对模型的好坏进行一定的评估。本文针对在不同主题下进行困惑度计算,再将计算结果作为评判依据。计算困惑度的公式如下:
上述公式中,p(w)表示每一个词出现的概率,N表示出现的所有的词。
计算困惑度部分代码如下:
for tp_id in range(num_topics):
tp_words = ldamodel.show_topic(tp_id, size_dictionary)
dic_t = {}
for word, prob in tp_words:
dict_t[word] = prob
tp_words_list.append(dic_t)
设置不同的主题数量,作出基于主题困惑度的曲线。一般情况下,困惑度的值会随着主题数量的增大而减小,随后达到拟合的拐点,而后会出现短暂的增大,最后会再次减小。[18]通过作出的图形曲线,找到曲线未拟合的拐点,便可推断出该模型可选择的最优主题数。取步长为1进行LDA主题抽取,并作出不同主题数下的困惑度曲线。通过结果图5可明显看出,当主题数为6时,出现明显的拐点,从而判断此时曲线并未出现拟合,可推断本实验的最优主题数为6。
(3)主题模型分析结果及建议
根据最优主题数结果,设置主题数为6,使用sklearn模块对负面评论数据构建LDA主题模型,并设定每个潜在主题下的前5个词语作为词语分类,最终结果如表3所示。
通过分析发现,消费者对京东平台小米数字系列手机的主要负面评论反映在六个方面,给消费者带来不好的体验:
主题1的关注点在于产品系统层面,有卡顿、死机等与系统方面相关的现象出现;主题2的关注点在于软件使用耗电层面,有系统、打游戏、摄像头等词汇,说明产品在体验游戏和摄像等方面耗电控制的可能不是很好;主题3的关注点在于产品附件、价格、服务层面,由于厂商没有附送充电器,加上客服方面的相关服务可能没有得到消费者的认可,从而给予负面评论;主题4的关注点在于产品硬件层面,屏幕和电池是手机产品的重要属性,消费者对这两个关注度较高;主题5的关注点在于产品续航层面,消费者对此属性的负面评论也是较多的;主题6的关注点在于产品拍照层面,拍照功能是手机产品一个不可缺少的属性之一,所以改善拍照功能能极大提升消费者的体验感。
四、建议及结论
本文结合情感分析下的负面评论反映出来的顾客服务关注点,提出以下补救措施,以期丰富产品评论研究的理论及实践内涵。
1.诚恳致歉
首先,不管是有误解还是商家的確在产品或服务等方面做的不够到位,都需要向消费者致以歉意,诚挚的歉意能够消减消费者的不满,给予心理慰藉,再辅以其他补救方式,往往能够成功。
其次,消费者处于极端不满状态时,相对于物质型补偿,反而更渴求商家的精神型补偿。那么道歉最简单直接,也必不可少。
因此,商家需要对售后人员进行负面评论响应培训,对已购顾客发布的负面评论迅速做出反应,用良好的沟通技巧来安抚顾客不满的情绪,让他们重拾对店铺的信心。挽回给予差评的顾客反而比评价平平的顾客更容易培养出忠诚感。[19]
2.经济补偿
除了道歉以外,在顾客发表负面在线评论后,卖家要想顾客对结果感到满意,往往都要有经济补偿。[19]因为消费者与商家之间的利益纠葛很多时候都停留在金钱的层面上,售后的问题也经常体现在赔偿金额是否满足商家和消费者两方利益的平衡。因此,不管是商品质量未能让消费者满意、商品有差价,还是客服服务态度不够好或销售环节出现失误等,都可以通过经济的补偿来让消费者平息情绪、坦然接受。
3.商家回复解释
商家回复是指商家对平台上出现的在线评论进行解释与答复。从国内主流的购物网站来看,商家对负面评论回复的数量和质量参差不齐,很多商家并不重视对负面在线评论的管理,甚至出现负面评论过多或追加评论都是负面评论的现象,商家不予处理,对品牌的口碑造成极大威胁。对评论进行回复和解释包括两个方面:
首先,对正面评价的回复,一般为感谢、承诺,表达商家的诚意,一般商家会选择模板回复,在节省时间的同时强化宣传效果。
其次,对负面评价的解释,一般情况下,精神型回复、长篇幅回复更加有效。
(1)如果是合理差评(有误会、商家的确存在问题)的评价解释,能够将商家的解决措施展示出来,解决其他买家的后顾之忧。
(2)如果是不合理差评(职业差评师、竞争对手恶意差评、无理要求未得到满足的泄愤差评)的评价解释,能够向其他消费者展示差评的原因、差评的不客观性,得到理解及认可。商家越对极端的负面评论采取有效回复策略,反而越有利于消费者改变消极态度与情绪,同时也更利于商家检验回复效果以进一步改进或完善补救策略,进而建立良好的口碑形象。[20]
4.鼓励消费者发布高质量评价
高质量的评价包含带有图片或视频、字数较多、评论要素多样,以及有追加评论的评价,消费者的高质量评价能够中和差评带来的影响,对潜在消费者进行正面引导。
首先,采取激励手段刺激消费者发布带有图片、视频的评价。其次,鼓励消费者发布长评。长评涵盖较多的信息量,更能吸引浏览者的目光,可信度上有所提升。最后,提醒消费者发布追加评价。追加评价是很多消费者查看评价时的主要选择之一,因为能够反映实际购买者使用一段时间后更加理性、客观的情况。[21]
本文对京东平台上小米旗下的数字系列款手机的负面评论数据进行文本情感分析,挖掘产品负面评论中的潜在价值。通过词云效果展示、LDA主题模型分析,挖掘出对给予产品负面评论的消费者所关注的主题范围,通过了解该主题范围下的关键词语,分析发现影响这些消费者给予差评和不满意的因素。同时,依据这些因素对手机厂商提出建议,帮助手机厂商提高品牌影响力和行业竞争力,以满足消费者对该品牌的期望和需求。最后,针对评论中的服务因素,提出诚恳致歉、经济补偿、商家回复解释及鼓励消费者发布高质量评价等补救措施,以挽救负面评论带来的危害,为其他消费者提供参考。
本文也存在一定的局限性:在负面评论的筛选时,直接选用平台本身提供的星级评价,未能对全部评论进行负面内容筛选及识别,且在停止词库中对当前时代的流行语控制得不够完全,存在一定的缺失。同时,词语与词语之间存在着密切的语义网络,语义网络是一种社会网络分析方法[22],通过构建负面评论语义网络来完善主题模型分析结果是后续的研究重点。
参考文献:
[1]Maheswaran D,Meyers-Levy J.The influence of message framing and issue involvement[J]. Journal of Marketing Research,1990(3)361-367.
[2]Chevalier J A,Mayzlin D.The effect of word of mouth on sales: online book reviews[R]. National Bureau of Economic Research,2003.
[3]陆海霞,吴小丁,苏立勋.差评真的那么可怕吗?——负面线上评论对消费者购买行为的影响研究[J].北京社会科学,2014(5):102-109.
[4]李琪,任小静.矛盾性追加评论对感知有用性的影响效应研究[J].管理科学, 2017(4):139-150.
[5]杜学美,吴亚伟,高慧,等.负面在线评论及商家回复对顾客购买意愿的影响[J].系统管理学报,2021(5):926-936.
[6]Zhang JQ,G Craciun,D Shin.When does electronic word-of-mouth matter? A study of consumer product reviews[J]. Journal of Business Research,2010(12):1336-1341.
[7]MAHESWARAN D,MEYERS LEVY J. The influence of
message framing and issue involvement[J]. Journal of Marketing Research,1990(3):361-367.
[8]王阳,王伟军,刘智宇,等.在线负面评论信息对潜在消费者购买意见影响研究[J].情报科学,2018(10):156-163.
[9]张亚明,苏妍嫄,张圆圆.负面在线评论对消费者感知风险影响研究[J].河北经贸大学学报,2020(1):100-108.
[10]李宏,喻葵,夏景波.负面在线评论对消费者网络购买决策的影响:一个实验研究[J].情报杂志,2011(5):202-206.
[11]史伟,王洪伟,何绍义.基于微博情感分析的电影票房预测研究[J].华中师范大学学报,2015(1):66-72.
[12]Dasgupta S,Sengupta K. Analyzing consumer reviews with text mining approach:A case study on Samsung Galaxy S3[J]. Paradigm,2016(1):1-13.
[13]李涵昱,钱力,周鹏飞.面向商品评论文本的情感分析与挖掘[J].情报科学,2017(1):51-61.
[14]郑丽娟,王洪伟.基于情感本体的在线评论情感极性及强度分析:以手机为例[J].管理工程学报,2017(2):47-54.
[15]庞庆华,董显蔚,周斌,等.基于情感分析与TextRank 的负面在线评论关键词抽取[J].情报科学,2022(3):398-404.
[16] Blei D M,Ng A Y,Jordan M I. Latent Dirichlet Allocation[J].Journal of Machine Learning Research,
2003(3):93-1022.
[17]徐戈,王厚峰.自然语言处理中主题模型的发展[J].计算机学报,2011(8):1423-1436.
[18]关鹏,王曰芬.科技情报分析中LDA主题模型最优主题数确定方法研究[J].现代图书情报技术,2016(9):42-50.
[19]贾素莹,韩树荣.负面在线评论的服务补救对顾客满意影响的实证研究[J].学术探討,2015:198-201.
[20]仇立.服务失误情境下互联网顾客忠诚影响机理[J].中国流通经济,2018(5):84-96.
[21]王长征,何钐,王魁.网络口碑中追加评论的有用性感知研究[J].2015(3):102-114.
[22]李纲,叶光辉.网络视角下的应急情报体系“智慧”建设主题探讨[J].情报理论与实践,2014(8):51-55.
Research on remedial measures for negative reviews of e-commerce products based on sentiment analysis
Xue Chenjie, Wang Zhaoyi, Jiang Nan, Qian Liqiong
(School of E-commerce, Anhui Business College, Wuhu Anhui 241002)
Abstract:Negative reviews of products on third-party shopping platforms have adverse effects on consumers' purchase intentions, merchants' credit ratings, and platform transaction conversions, which need to be remedied through effective measures. Analyzing the negative comments and putting forward relevant suggestions has certain reference significance for the improvement of marketing strategies and customer relationship management of merchants. Taking the current domestic mainstream brand Xiaomi mobile phone as the research object, using the Octopus collector to crawl the comment content of Jingdong Mall for sentiment analysis, and using the Jieba word segmentation, word cloud map, and LDA topic model to analyze the negative comments of the product. The main negative comments of consumers on Xiaomi mobile phones on the platform are reflected in six aspects, which bring a bad experience to consumers, and the brand side should pay attention to it and implement remedies.
Key words: Emotional Analysis; Negative Review Remedy; Topic Model