基于美团外卖用户在线评论的情感分析研究

2018-09-20 10:50王升盈
现代商贸工业 2018年23期
关键词:差评披萨消极情绪

王升盈

摘 要:以美团外卖为研究平台,爬取美团外卖用户数据,对数据进行预处理,利用百度AI开放平台进行情感分析得到评论数据的情绪值,在此基础上检验评论数据的情感倾向和打分评价的相关性,并进一步了解在不同等级的城市中消极情绪是否有差异,以及一些门店消极情绪高于积极情绪的原因。最后根据分析的结果对商家、消费者和美团平台提出合理性的建议。

关键词:在线评论;情感分析;关键词云图

中图分类号:F27 文献标识码:A doi:10.19311/j.cnki.1672-3198.2018.23.030

1 引言

随着信息的高速传播,社交网络的快速发展已经渗透到人们生活的各个方面,越来越多的用户倾向于在公众平台上表达自己的观点、态度和情感。互联网的各大平台为网民发表评论、交换观点提供了极大的便捷,也给人们做选择提供了参考方向。评论信息对消费者的选择和商业组织的决策都有重要的意义。一些学者开始了对这些评论数据的情感倾向进行研究,运用不同的算法和模型对文本评论进行情感分类。张膂采用逻辑斯蒂回归算法对餐饮评论数据进行情感分类,马松岳,冯莎分别对豆瓣电影评论数据进行情感分析研究,石强强、赵应丁和杨红云对基于SVM方法对酒店评论数据进行情感分析。

目前对文本情感分析的研究很多,比如对电商产品、微博热门事件、热门电影等情感倾向研究,对餐饮方面的情感分析研究比较少,并且都是对评论文本挖掘技术的讨论。基于此本文主要是对情感倾向的结果展开研究,根据得到的结论对用户、商家和美团平台提出合理建议。

2 数据获取和预处理

本文首先采用分层抽样的方法选取12个城市,然后再采用简单随机抽样的方法选取了美团外卖APP中这些城市里面的部分门店评论数据作为研究对象。其中12个城市是按照城市等级来抽取的,门店包括大品牌必胜客和若干小品牌,一共161家。本文采用Charles软件对美团外卖APP的数据接口进行用户评论抓取。由于美团对数据采取了反爬虫技术,只能抓取网页数据,并且还需要不定时的变换电脑ID,才可以获取评论数据。

由于爬取的数据可能存在一些特殊的字符、重复数据和类似广告信息这种没有价值的数据等,所以需要先对数据进行一下清洗。本文利用HashSet原理编写源代码去重,经过清洗后用于研究的数据一共87558条。由于用Charles抓取的数据量比较大,需要建立一个数据库存放数据。为了方便快速的查找需要研究的数据,本文选择建立非关系型数据库。其中抓取数据的情况如表1。

3 基于百度AI的评论数据情感倾向性分析

文本情感分析的研究方法主要有两大类:基于词典的方法和基于机器学习的方法。基于词典的方法主要是通过建立一系列的情感词库和规则,对文本进行段落分词、句法分析,计算感情值,最后通过情感值来作为文本的情感倾向依据。

本文采用基于词典的方法,使用百度自然语言处理技术即百度AI开放平台软件进行情感分析。通过调用百度的API(应用程序编程接口),就可以得到8万多条评论数据的情感分布,包括积极情绪、中立、消极情绪。通过简单的计算,可以得到积极情绪比例、中立情绪比例和消极情绪比例,最终确定每家店的情感倾向值。百度AI在进行情感分析时,无法识别带有表情的语句,只能手动进行分析。同时,对于只有星级评论的空白文本百度AI是无法进行分析的,忽略空白文本,百度AI识别出7万多条数据。最终可以得到每条评论文本的情感倾向,如表2。

根据输出的情感倾向进行统计分析,可以得到每一家店的积极、消极和中立的比例,抽取的161家门店中,157家门店的用户评论情感是积极的,2家门店的用户评论情感是消极的,2家用户评论情感是中立的。如表3所示的是抓取的北京门店评论文本的情感分析结果,从表中可以知道大部分门店的积极比例是较高的,情感倾向是积极的。只有花家怡园、南京大排档和绿茶餐厅的积极比例较低,甚至绿茶餐厅的消极比例高于积极比例。

4 情感倾向的研究分析

4.1 情感倾向和打分评价的关系

美团平台本身会根据用户评论的星星数,将评论分为好评和差评展现给用户。用户就会根据看到的好评数来判断门店的好坏。但是美团给出的好评数和差评数是否真正代表了用户的真实情感,因此我们将得到的情感倾向和美团给出的打分评价进行对比分析。

我们通过SPSS软件分别对积极情绪和好评、消极情绪和差评做相关性分析来检测他们之间是否有关联性,得到积极情绪和好评之间的相关性为0.643,消极情绪和差评之间的相关性为0.731,消极情绪和差评的相关性大于积极情绪和好评的相关性。

由于美团平台把中立的评论即3颗星星的评论给归类为好评,才会造成积极情绪和好评之间的相关性不是很高。因此用户在浏览评论信息时,不能只关心好评数,更主要的是了解差评数,差评数和情感分析方法得到的消极数是基本一致的。用户通过浏览美团平台归类出的差评评论,会更快的了解门店的信息,为下单提供指导意义。

4.2 不同城市等级的必胜客消极情绪对比分析

根据不同的城市等级,将特大城市、一线城市、二线城市和三线城市的必胜客评论文本中消极情绪进行对比分析,了解不同等级的城市消极情绪是否有差异。

首先通过百度AI将消极的评论文本进行输出,然后使用R中的jiebaR包对评论文本进行分詞且抽取文本中的关键词,对关键词进行词频统计,最后再用wordcloud2包绘制词云,根据wordcloud2函数调节关键词、词频、字号和颜色等。可以根据云图,可以看到差评中提到的最多的点。

根据图1-图4的云图,可以知道在不同等级的城市中,都提到了对披萨的评论,尤其是特大城市和二线城市的云图中“披萨”的字体最大,代表提到的次数最多,在一线城市和三线城市的云图中相对较小。披萨作为必胜客的招牌,下单量还是很大的,但是对它的味道也是存在不满的。同时这四个云图中也都提到了“难吃”、“味道”,可以得到用户对必胜客菜品是不满意的。

从图1的云图中可知,“披萨”、“发票”、“商家”、“态度”、“难吃”、“客服”的字体比较突出。从这些关键词中得到在特大城市中,用户多由于发票、菜品的味道和商家的服务态度产生消极情绪。

从图2的云图中可知,“味道”、“难吃”、“配送”、“送的慢”、“海鲜”、“披萨”、“鸡肉”的字体比较突出。从这些关键字中可以得到在一线城市中,用户多由于菜品不好吃,配送慢的问题做出差评,同时对海鲜和鸡肉的披萨也是不满意的。

从图3的云图中可知,“披萨”、“难吃”、“味道”、“态度”、“口感”、“番茄酱”、“配送”的字体比较突出。从这些关键字中可以得到在二线城市中,用户多由于披萨的味道和口感、商家和外卖小哥的态度以及配送的快慢而做出差评。

从图4的云图中可知,“骑手”、“味道”、“速度”、“包装袋”、“披萨”、“餐具”、“番茄酱”的字体比较突出。从这些关键字中可以得到在三线城市中,用户多由于骑手的送餐速度,菜品的包装和餐具的问题而做出差评。

4.3 情感倾向消极的门店原因分析

利用4.2中的关键词云图的方法,研究门店情感倾向偏消极的原因。将用户情绪是消极的两家店分别用R做关键词云图。对永和大王消极文本做关键词云图,得到“豆浆”、“油条”、“味道”、“难吃”、“太少”这些词较突出并且权重都大于等于0.9。对绿茶餐厅消极文本做关键词云图,得到“米饭”、“绿茶”、“难吃”,“太少”、“味道”这些词较突出并且权重都大于0.95。

通过对关键词的分析,可以知道菜品难吃和量少是用户做出差评的主要原因。豆浆和油条是永和大王的招牌菜,绿茶和米饭是绿茶餐厅的必点菜品,但是用户对这些主打菜品的意见是最大的。要想提高订单量,商家必须保证菜品质量和数量。

5 结论和建议

通过和建议以上研究,得到以下结论:

(1)评论文本情感倾向和美团本身的评价并不完全相同,消极情绪和差评的相关性较高,消极情绪和好评的相关性较低。

(2)不同等级城市中的必胜客造成用户消极情绪的原因既有相同点,又有不同点。

(3)用户做出差评的主要原因是菜品的质量和数量不能得到保证。

对于以上的结论,可以提出以下建议:

(1)由于用户评论情感和美团平台给出的打分评价不一致,用户在浏览评论信息时,应该多关注一下差评的内容和数量,不应该只看好评的数量,好评数会比用户所表达的实际好评评论要高。美团平台应该反映真实的用户情感,因此应该增加一项中立条数,将用户评论3颗星的视为中立情感。

(2)披萨作为必胜客的招牌菜,必须要保证其特色和口味,也要考虑到用材的新鲜。在特大城市中,必胜客要提高服务态度,用心对待每一个顾客,及时给用户开具发票。在一线城市中,美团要培训出专业的骑手,规划出最佳配送时间和路线,缩短配送时间。在二线城市中,必胜客要改善披萨的口感,骑手也要提升服务态度。在三线城市中,必胜客要提高菜品的包装质量和味道,提高骑手的配送速度。

(3)对于情感倾向不是积极的4家门店应该从根本上面解决问题,也就是必须保证菜品的质量和数量,这样才能提高顾客的满意度,从而提高销售量。

参考文献

[1]张膂.基于餐饮评论的情感倾向性分析[D].昆明:昆明理工大学,2016:1-50.

[2]马松岳,许鑫.基于评论情感分析的用户在线评价研究—以豆瓣网电影为例[J].图书情报工作.2016,60(10):95-103.

[3]冯莎.豆瓣电影评论文本的情感分析研究—基于2017年电影《乘风破浪》爬虫数据[J].中国统计,2017:30-33.

[4]石强强,赵应丁,杨红云.基于SVM的酒店客户评价情感分析[J].计算机与现代化,2017,(3):117-126.

[5]張紫琼,叶强等.互联网商品评价情感分析研究综述[J].管理科学学报,2010,(6):84-96.

[6]史伟,王洪伟等.基于微博平台的公众情感分析[J].情报学报,2011,(11):1171-1178.

[7]李明.面向微博电影评论的情感分类研究[D].昆明:云南财经大学,2014:10-40.

猜你喜欢
差评披萨消极情绪
从差评垫底到好评第一
“披萨锦标赛”
静心
测试
手工披萨
两个披萨
涉县“差评被拘”是法治中国的反面典型
帮孩子化解消极情绪的绘本
Clear Your Mental Space
我学会做披萨啦!