基于电商网站商品评论的情感倾向性分析

2019-05-14 08:52张芸
锋绘 2019年2期

张芸

摘要:[目的/意义]当今社会电子商务发展迅速,为辅助消费者更好的做出购买决策,帮助经销商改进产品,在同行竞争中保持优势,挖掘商品评论数据并进行情感分析显得尤其重要。[方法/过程]本研究使用了爬虫软件一八爪鱼采集器抓取“京东商城”iPhone X、HUAWEI P20两款手机的商品评论数据,利用EXCEL、ROST软件等实现对商品评论的切割、分类,构建限定词库。并且,抽取用户关注的商品属性和用户对相应属性的评价观点,进一步对商品评价文本进行情感倾向性分析。[结果/结论]根据抓取的商品评论数据,可以定量且定性地判断产品的主要特征及消费者的情感倾向。

关键词:电商网站:商品评论:爬虫程序:情感倾向

1 商品评论的情感倾向分析

本文进行情感倾向性分析选用的工具依然是ROSTCM 6(ROST Content Mining System(Version 6.0))。它可以实现词频统计、情感倾向性分析等功能。

1.1 词须统计

商品評论数据进行准备和预处理之后,开展文本情感倾向性分析。首先,要对分词的结果进行词频统计。苹果iPhone X的相关词频统计结果如表1所示:

“手机”、“京东”、“苹果”、“流畅”这几个词出现频率很高,可以直观的认为手机产品总体反馈较为积极。“物流”、“速度”、“很快”、“方便”的频次也非常高表示京东自营物流得到大部分用户好评。“屏幕”、“拍照”、“刘海”、“面部识别”、“摄像头”用户反应频率也很高。

华为HUAWEI P20“手机”、“华为”、“京东”、“流畅”词汇出现很高,与Whone X词频结果相似,总体反馈不错。“国产”、“国货”、“苹果”高频率出现,说明部分用户具有将国产手机华为与苹果手机进行比较的倾向。“速度火”、“很快”、“物流”高频出现依然反映京东物流获得认同。“拍照”、“照相”、“相机”在评价出现比例较大,可推测HUAWEI P20多媒体功能受到用户极大关注,尤其拍照功能。

1.2 情感倾向性判断

依然利用ROST软件对评论数据进行情感分析,将情感划分为积极情绪、中性情绪和消极情绪,并针对积极情绪和消极情绪根据分值不同设定三种不同的程度,一般,中度和高度,同时,根据评价内容所反映的情感倾向结果,绘制情感倾向可视化结果,分析iPhone X积极正面情绪达85.25%,在积极情绪中达到高度程度的也有32%,说明相当大一部分用户对手机都非常满意。HUAWEI P20积极正面情绪达85.59%,在积极情绪中达到一般程度的有33%,说明,相当大一部分用户对手机一般满意。

1.3 商品属性的情感倾向分析

本文通过对商品评论文本中商品属性和对应评价情感词抽取,得到商品属性和情感词的修饰关系,确定情感词修饰商品属性时的情感倾向,进一步用来进行情感倾向性分析。从上面的分析结果中,我们选取了用户比较关注的商品属性,如拍照、屏幕、外观、电池、质量等对其进行进一步分析。

iPhone X的屏幕负面评价比较多,符合常识,当时苹果发布会的时候就有很多人表示接受不了小刘海。

同样类似的分析方法,可以获取HUAWEI P20的情感倾向分析结果。HUAWEI P20作为5.8英寸的大屏幕手机,3400毫安时的电池容量,显然在某些用户看来还是完全不够用的。

总而言之,根据词频分析结果,用户更多的关注手机的屏幕、拍照、电池、续航、与性价比等。另外,从王者、游戏、运行可以看出手机游戏运行能力也是用户比较关心的。iPhone X与HUAWEI P20积极情绪都占很大比例,达到85%以上,说明这两款手机都能得到绝大部分用户的满意。

2 总结

本研究采用八爪鱼抓取系统,对商品的网站页面进行分析,有效地实现了商品评论抓取功能。通过进行数据准备工作,采用比较删除法进行文本去重和机械压缩去重,用ROST对文本评价进行中文分词。消费者可以客观的了解商品,经销商也可以较清晰地发现自己的优缺点和消费者的关注点,具有一定的应用价值。