陆娜 吴明怡
摘要:景区的旅游消费者评价具有一定的情感倾向,其评价既可以反映消费者的感受,又能影响潜在的旅游消费者。利用八爪鱼采集器抓取携程和马蜂窝两大平台中三亚景区的旅游消费者评价6565条,运用ROST CM6 软件对上述评价进行语义关系及情感倾向分析,分析结果显示积极情绪占80.24%,消极占10.19%,为了更好地提出建议,再用图悦软件对数据进行词云图分析,剔除无效词语并划分类目,二者结合分析的结果较为全面,从而为三亚景区提出有针对性的建议。
关键词:三亚景区;旅游消费者;情感倾向;网络评价;满意
中图分类号:F724.6 文献标识码:A
文章编号:1009-3044(2022)02-0006-04
1 研究背景
三亚位于海南省的最南端,是具有宜人的热带海洋性季风气候的国际旅游城市,海南省最重要的旅游城市之一,有着丰富的旅游资源,四季如春,被称为“东方夏威夷”。三亚受到众多的旅游消费者的青睐,天涯海角、南山寺、鹿回头、大东海、蜈支洲岛及亚龙湾等旅游景点,都是休闲旅游的好去处。2020年全球经济都受到了新冠肺炎疫情的影响,旅游业受到的冲击非常之大,尽管如此,三亚的旅游总体情况还是较为乐观的。据三亚市统计局的数据显示,全年该市住宿设施接待过夜游客1714.4万人次,实现旅游总收入累计424.7亿元,而且旅游者呈現出年轻化的趋势。
随着互联网的普及以及消费者习惯的养成,越来越多的旅游消费者在互联网网站上查询景点信息,规划旅游路线,提前预订机票、火车票、酒店、门票,并且发表自己的评论,同时也在旅游网站上查看其他旅游消费者对景点的评价。较多的旅游消费者会参考他人在网络上对于景点及其周边的评价来决定自己是否选择该景点,由此可见,景点评价对消费者有较大的参考价值,会影响旅游景点口碑。网络评价能够反映出旅游消费者对于旅游景点的游玩感受,对该旅游景点是否满意,是不容忽视的用户数据。网络评价是一把“双刃剑”,一方面,旅游消费者的网络评价如果是夸赞好评的一面,可以提升旅游景点的口碑和形象。另一方面如果是消极差评的一面,将会影响旅游消费者对旅游景点的差的认知。
旅游行业的竞争比较激烈,各大旅游景点都尽可能地运用各种先进的设施和技术来提升景点的吸引力,同时各大景点也会对用户数据进行分析,根据分析的结果寻求解决方案进而提升自身的竞争力。分析三亚市网络评价的消费者情感倾向分析,可以更好地了解旅游消费者对三亚景区的旅游需求,可以了解到三亚旅游业的优势和不足之处,为三亚市乃至海南省的旅游业的发展方向提供参考,提升旅游消费者的满意度,可以促进海南旅游产业的发展。
2 相关文献综述
2.1 情感倾向分析研究现状
对于情感倾向分析,Pang等人(2002)[1]第一次使用机器学习的算法对电影评价数据进行情感分析。通过实验证明了使用机器学习进行情感分析是可行的。Taboada (2011)[2]等人在情感倾向分类的过程里使用情感字典法进行分类,考虑和总结了各类有可能会影响情感值的因素,比如考虑对情感词级性有影响的否定词,以及语气词对情感词的权重的作用等等因素。杨奎、段琼瑾(2017)[3]提出了基于情感词典的情感倾向分析方法,用来获取网络舆情里面的观点,提出了一种基于 How Net 概念词典,它是一种可以通过分析计算词汇相似度用来构建社会情感字典的方法。同时设计了情感得分的策略。根据分数来挖掘出人们对于舆论的贬损态度,从而准确分析文本的情感动向。黄奇景(2020)[4]参考了基于情感词典的方法,创建了情感向量指引神经网络获取到文本的序列信息,这一提议让情感分类模型更加可靠。同时对卷积神经网络与循环神经网络进行了交融,然后对于神经网络这一基础引进了注意力的机制。吴洁(2020)[5]基于深度神经网络技术、循环神经网络等技术方法,提出了有效的微博情感分析方法,还针对微博数据稀缺、用户情感动态变化问题等问题,提出了新方法。提出的方法名叫微博情感分类新方法。
2.2 基于网络评价的旅游消费者满意度研究现状
基于网络评价的旅游消费者满意度方面的研究有,李光应(2017)[6]使用八爪鱼爬虫技术抓取携程网站旅游消费者的评价数据,并进行预处理,然后通过可视化技术和 LDA 主题模型,对前面爬虫技术抓取到的旅游消费者评论数据进行特征分析。贾博(2018)[7]基于网络评价中的度假酒店服务体验质量中以三亚艾迪逊为例子,在网络上采集旅游消费者的评价,然后对评价进行分析,数据得出的结果是现阶段三亚艾迪逊酒店客户的期望值很高,但是还是会存在些许问题,在入住酒店的时候。通过分析和研究得出存在问题的原因,并对问题提出改善的建议。钱成(2017)[8]基于网络评价对武汉市的旅游目的地旅游消费者满意度进行分析,首先爬取旅游网站对于武汉市的旅游消费者评价数据。然后利用数据生成词云图进行可视化分析,还使用 LDA 主题模型,把这个模型作为依据建立旅游消费者满意度影响因素指标体系。
3 研究设计
利用问卷调查的形式收集被调查者对景点的评价进行情感倾向分析,既耗费时间又耗费人力,且问卷调查的问题是固定的,不一定能真正反映旅游消费者的真实感受,由此可见问卷调查形式有一定的局限性。本文通过运用八爪鱼采集器收集来自携程旅游网、马蜂窝旅游网上三亚景区的旅游消费者评价,对数据进行清洗以及文本挖掘,再分析旅游消费者对景区的情感倾向,同时用图悦软件进行基于词云图的可视化分析,使分析更充分合理。
3.1 数据选取与采集
数据的选取是工作的第一步。选取的数据需要方便获取并且具有一定的代表性,这样才能更快速地获取数据,分析出的结果才有一定的参考价值。采集的数据来自携程旅行网和马蜂窝旅游网。在众多的旅游网站中选取二者是有原因的:携程旅行网成立时间早,是目前最大的旅游网站之一,关于旅游消费者评价方面运作得比较成熟,包含了很多方面的信息,信息也比较齐全,其网络评价具有一定的代表性;马蜂窝旅游网是中国比较出名和排名靠前的旅行网站,创立于2006年,提供各种旅游服务,包括酒店的预订,信息的查询等等功能,该网站十分受年轻一代的欢迎,有中国的“旅行圣经”的称号。
使用八爪鱼采集器作为采集数据的工具,抓取上述两大网站的排名前10名的三亚景区旅游消费者评价,抓取成功后对抓取到的数据进行汇总,共计抓取了6565条旅游消费者评价。图1为部分旅游消费者评价截图。
3.2 基于ROST CM6的文本情感倾向分析
ROST CM6文本分析软件,该软件可以辅助进行人文社会科学研究,功能包括分词、字频、词频分析以及社会网络和语义网络分析、情感分析等等。将八爪鱼收集到三亚景区的6565条旅游消费者评价数据,导入ROST CM6软件进行分析。使用软件的社会网络和语义网络分析功能,得出语义关系及其频数,然后将得出的结果的文本文档转成Excel文件,得出前100个关联词及其频数,同时生成语义可视化分析图如图2。
由图2可知,“三亚”“酒店”“海鲜”“景区”“沙滩”等关联的词语较多,是这个图的关键节点。其中,三亚和景区两个词在本分析中涉及的含义过于宽泛,分析较为复杂,而与酒店、海鲜和沙滩有关的词语能够直接反映出这几方面消费者所关注的点。例如,与酒店相关的度假、适合、方便等词主表明酒店适合度假,是正面的评价;与海鲜相关的评价词新鲜、好吃、美食这些词汇都说明游客对三亚的海鲜持正面的评价,对海鲜的口味、新鲜程度都持夸赞的态度;与景色关联的词语有性好玩、有趣是比较正面的评价,表示游客对旅游景点的肯定。
运用ROST CM6对以上评论进行旅游消费者评价的情感倾向分析,旅游消费者的评价是积极的还是消极的还是中性的,得出如图 3 的结果。
由图3可知,6565条评论中,积极情绪有5268条,占总数据的 80.24%,中性情绪 628 条,占比 9.57%,消极情绪669 条,占比 10.19%。其中高度积极的情绪有2233 条,占比 34.01%。高度消极情绪仅10 条,占比0.15%。
3.3 基于图悦的词云图可视化分析
尽管以上分析能够说明旅游消费者对于三亚景区的总体情感倾向是积极的、肯定的,也能确认消费者对于酒店、美食以及景点比较关注,但是与三亚景区相关的具体的类目,不止以上三个方面。为了更好地分析旅游消费者所关注的三亚景区的具体类目,运用图悦软件进行词云图的可视化分析并进行类目划分。
3.3.1 生成词云图,导出词频表格
选用词频分析工具图悦软件进行分析,将八爪鱼采集的评价导入图悦软件,生成如词云图,同时导出 Excel 格式的词频表格,共计150个词汇。
3.3.2 关键词清理
150个词汇中出现频率较高的词语分别是:海鲜、三亚、景点、沙滩、市场、酒店、亚龙湾。由于有些词汇对研究旅游消费者情感倾向并无直接关联,因此需要去除无关联的词语才能更好地分析和研究。本文分析三亚整体景区的情感倾向,所以具体要景点的名称对于情感倾向分析并无关联,将其剔除,还有些无实义的词语去除后,得到前130个关键词,由于数据较多,图4仅展示前50个关键词。
3.3.3 词频类目划分
由于关键词较多,而且比较散,为了便于研究,参考李光应文献中通过人工判别对获得词频的词语进行分类,共分出了9类,分别是美食类、项目类、消费类、家人朋友类、交通类、天气类、服务类、环境卫生类,如图 5所示。对整合过的分类进行分析,类目词频数所占百分比进行汇总,得出如表1所示。
由上分析可知,旅游消费者比较关注的是美食类、景色类、项目类以及消费者类,它们的占比在10%以上,环境卫生类、交通类、家人朋友类、服务类及天气类,虽然占比不高,但是也说明消费者会关注到这些类目,如果能够做得更好,也可以提升旅游消费者对三亚景区评价。
4 结论与建议
4.1 研究结论
本文通过运用工具采集携程与马蜂窝两大旅游类平台的网络消费者评价,对其进行情感倾向分析,为了更有针对性地分析与提出建议,将基于ROST CM6的文本情感倾向分析和基于图悦的词云图可视化分析二者结合,分析结果显示,积极情绪占比80.24%,消费者情绪仅占 10.19%,其中高度积极情绪占比达到34.01%,表明消费者对三亚景区的总体评价是积极的、正面的。分析结果还可以反映出消费者对于美食、景色等类目持积极的评价,对项目类以及消费者类比较关心,而环境卫生类、交通类、服务类等也是消费者关注的方面。
4.2 建议
根据上述分析,尽管消费者对于三亚景区的网络评价总体是正面的,消极情绪很少,但是,为了更好地发展三亚旅游,甚至海南旅游,提升三亚景区在消费者心中的形象,为相关部门提出以下建议。
4.2.1 保持美食类尤其是海鲜方面的好评
以上结合分析显示,美食在九个类目中排在首位,而与美食评价相关的词语中海鲜最受欢迎,同时还包括新鲜、加工、味道、好吃等相关词语,总体看,在美食方面还是比较满意的。在美食方面,首先应注重当地特色,海鲜的新鲜,在味道方面可考虑消费者的需求进行个性化的烹饪,消费者对于加工方面的关注,体现出消费者希望通过自购海鲜到店烹饪,餐饮店可适当增加此项服务,尽管大排档是海南的特色,但是卫生方面也是不容忽视的。虽然本次数据未显示海鲜的价格问题,但是曾引起过消费者投诉,相关部门也应重视市场监控,控制海鲜的性价比。以保证消费者对三亚在美食方面的好评。
4.2.2 挖掘拍照打卡景點,丰富景区游玩项目
景色类和项目类紧随美食之后,由以上结合分析看出,景色类相关词语有拍照、美丽、好看、有趣、性价比等,项目类相关词语有酒店、好玩、潜水、游泳等。针对景色,消费者希望好看,适合拍照,并且性价比高,大小洞天已经成为婚纱照的著名拍摄景点,里面营造了较多的拍照场景,拍照效果非常好,吸引了大量的消费者前往打卡。在不破坏自然环境的基础上,可在其他景点增加一些人为的拍照场景,既可以吸引消费者的关注,也可以为景点带来收益。目前的项目类主要是潜水游泳之类的,还有一些刺激性的海上项目,差异化和受众面较小,建议多开发一些有趣有特色的游玩项目,针对小朋友、老人、青少年、中年人、情侣等不同人群,开发不同的游玩项目,刺激冒险与安静舒适相结合。
4.2.3 完善交通环境建设
尽管交通类在分析中占比较低,而且与其相关的词语电瓶车、观光车、游览车等未反映出负面的信息,但它也是消费者所关注的,如果做得不好,消费者的不满意会带来较强的负面影响。三亚交通方面,由于电动车较多且不遵守交通规则现象较为普遍,交管部门应加强交通方面的疏导与管理,安排交协警人员执勤。交通网络的规划以及交通设施的建设应受到重视,目前情况有待改进。
参考文献:
[1] Pang B,Lee L,Vaithyanathan S.Thumbs up?sentiment classification using machine learning techniques[C]//Proceedings of the ACL-02 conference on Empirical methods in natural language processing - EMNLP '02.Not Known.Morristown,NJ,USA:Association for Computational Linguistics,2002:79-86.
[2] Taboada M,Brooke J,Tofiloski M,et al.Lexicon-based methods for sentiment analysis[J].Computational Linguistics,2011,37(2):267-307.
[3] 杨奎,段琼瑾.基于情感词典方法的情感倾向性分析[J].计算机时代,2017(3):10-13.
[4] 黄奇景.Web评论的文本情感倾向性分析[D].哈尔滨:哈尔滨师范大学,2020.
[5] 吴洁.基于用户情感倾向理解的微博情感分析方法研究[D].重庆:重庆理工大学,2020.
[6] 李光应.基于数据挖掘的桂林市游客满意度分析[D].桂林:广西师范大学,2017.
[7] 贾博.基于网络评价中的度假酒店服務体验质量——以三亚艾迪逊为例[J].才智,2018(8):200-201.
[8] 钱成.基于网络评论的旅游目的地游客满意度分析——以武汉市为例[D].武汉:中南财经政法大学,2019.
【通联编辑:谢媛媛】