陈煜 杨明春 张曼
摘 要:随着互联网技术的发展,电子产品的普及,人们更倾向于借助网络平台来表达自己的观点,由此数据量急剧增加,在这些数据中隐藏着人们在现实世界中的行为轨迹、情感倾向等,如何挖掘隐藏在数据中的有效信息服务于现实世界是当下的研究热点。目前,人们对游客情感分析大多是从总体出发,对情感与产业规划之间的关系未进行深入的研究。本文以青岩古镇为例,深入挖掘游客旅游评论极性,通过分析数据的特点为景区规划、优化产业布局提供相关的建议。
关键词:情感分析;产业规划;青岩古镇
中图分类号:F592.7;TP391.1 文献标识码:A
随着经济的发展,人们更加注重精神方面的追求,旅游业开始迅速崛起,旅游业的发展除了会受相关产业的制约和影响之外,也会带动和影响其他产业的发展,因此,合理开发和规划旅游资源是旅游业发展的重中之重。截至2020年6月,中国有9.4亿网民,约占全球网民的1/5,其中有99.2%是使用手机上网[1]。互联网的发展突破了传统媒体时间和空间的局限性,使得网络评论信息的传播速度远胜于报纸等传统媒体,在虚拟世界中,相较于物理空间的面对面交流,更有意愿展示自己内心最真实的想法,从而加大被评价景点信息传播的广度和深度。其类似于电子商务网站上的评论对企业造成的影响,基于此,重视游客评价是景区得以良性发展的重要基础,是整个旅游产业链的生命主线[2-6]。因此,如何科学、合理地设计出景区的规划与建设方案极其重要[7]。目前,国内外学者从不同空间尺度对旅游目的地进行评价和比较.数据主要来源于权威机构公开发布以及问卷调查,而公开数据虽然较易获得,但统计口径和质量的差异使数据往往缺乏可比性,问卷调查数据又存在样本量、信度、效度等问题。在大数据时代背景下,旅游网络信息分享已成趋势,与传统的公开数据和调研数据相比,游客根据自身体验得出的感受其数据真实性可靠性较强,用于景区开发和发展研究具有一定的参考价值[8]。方梦静等利用微博数据进行研究和分析游客在杭州西溪湿地旅游时情感时空变化规律[9]。近年来,随着旅游业的发展,行业中也发生许多负面事件,这些事件经过传播发酵,容易降低公众的出行意愿,甚至引起公众对当地旅游市场的集体抵制与抗议[10]。由此可见,旅游目的地对游客情感进行分析,重视游客的情感体验,及时优化景区产业、服务和管理十分重要。
(一)数据采集与处理
考虑到数据的专业性、丰富性及广泛性,本文选取“携程网”作为数据源,采用网络爬虫技术抓取了目标网站有关青岩古镇的所有评论,共2 977条,所获取的每条数据均包括用户名、评论详情、评论时间、评分、点赞数等信息,数据结构详情如表1所示。
(二)样本处理及情感分析
由于元数据存在大量噪音,数据筛选工作必不可少,文本中出现的多余的标点符号、空格、乱码字符等会降低数据价值,噪点附加在任何词句上都会造成与其他词句的分离,进而影响到语义信息。本文主要利用Python正则表达式和NLTK库进行匹配,其可以以相同模式输入模型,而不用因数据具有差异而重复修改模型,这样数据处理工作就会简便许多。
本文采用NLP技术根据文本词意进行情感值计算,系统规定情感值大于0.5分为积极情緒,小于0.5分为消极情绪,结果如表2所示,通过可视化分析可以看出积极评论2 510条,消极评论467条,积极情感总值约是消极情感总值的4.3倍,由此可知,游客对青岩古镇的整体形象感知是正向的,说明青岩古镇总体产业规划布局是合理的,故其更不能忽视持消极情绪的游客感受,对于引发游客不满的原因需要进行深入挖掘。
(三)词频分析
笔者对467条消极评论再一次进行人工去噪留下有效评论455条,然后利用SnowNLP模块进行主题词提取。首先需要将455条评论输入系统中,将评论进行分词清洗得到新分割后的数据,然后统计各词出现的词频,在此笔者节选排名前60的高频词对其进行归类总结,用以初步展示游客对青岩古镇消极情绪出现的集中领域(表3),在此基础上制作词云图用以佐证总结分类是否合理(图1)。
(一)景观方面
游客认为青岩古镇商业化严重,缺乏古镇特色,景点单一,文化底蕴单薄,古建筑修葺痕迹明显,景区结构不合理,原始古建筑在背街方有机会看到,笔者经过多次实地考察,发现确实存在此现象,过度商业化会造成游客流失,在消极评价中,有部分游客表示不会再去第二次,甚至劝诫其他游客不要去。
(二)交通方面
游客认为停车场设置不合理,节假日车况较差,贵阳公交信息更速缓慢,公交实际停靠点与网络信息不匹配且存在乱收费现象。笔者经实地调查发现,从市区乘公交去青岩耗时约2小时,乘车疲惫感使游客的旅游体验值大打折扣。
(三)服务体验方面
门票定价不规范,性价比较低,景区客流量较大,基础设施不完善,产品同质化严重且物价较高,有些产品虽然具有当地特色,但是存在种类少、包装服务不完善的问题。饮食卫生得不到保障,美食摊位大多设在主路上,灰尘较多,游客反映食用后有呕吐、腹泻症状,除此之外景区工作人员服务态度较差。
(四)管理方面
古镇管理混乱,工作人员专业素养不够,缺乏人性化管理。信息更新不及时,笔者结合实地访谈发现,有些游客买了景区套票,结果因部分小景点在修缮,游客不得入内,有的只买了街景票却因检票人员的疏忽进入了套票包含的小景区。景区指示牌设置有待完善,笔者在实地考察时,从南门入街至定广门,古长城的入口在定广门里面贩卖机处,过于隐蔽,而门外也有小道,看着像古长城入口,实则不是,存在安全隐患。
人们需要客观地评价古镇商业化问题。从游客视角出发,其既想体验古镇的韵味,又想拥有舒适的环境;从居民视角出发,他们想保留古镇的原生态,更想拥有美好幸福的生活。如何将两者统一,需要当地政府和居民达成共识。在进行景区商业规划时,应着眼整体,适度开发,突出当地特色,深挖文化内涵。
(一)交通
从宏观方面来看,政府要加强管理,完善监督机制,加大力度打击私自设立停车场,乱收费的现象;从微观方面来看,对景区进行统一规划时,对占地面积要求较高的场所将景区边缘地区开发为停车场,在进入景区时实行人车分离,开发新路线,增加旅游专线,居民入股,按比例分红。做好人流监控和节假日景区分流工作。
(二)景区
景区在各大旅游网络平台及时更新套票所含景点信息,并在景区购票窗口醒目位置设置游客购票提醒栏。另外,对于旅游产品同质化问题,建议结合当地特色开发一些文创活动,完善服务链。要重视卫生安全问题,不定时进行检查。政府在可控范围内允许自由竞争,维护游客利益的同时也有利于景区的良性发展,提高游客满意度和重游率,间接提高居民收入。
(三)服务管理
要完善服务管理制度,定期对景区工作人员进行培训。在基础设施方面可以与信息技术相结合,增加游客的满意度。对于重要景点,指示牌设置合理化,如在定广门外可以增设长城入口的指示牌,对于当地居民生活小道设置提醒牌,防止游客走错。南门主街入口石板路两侧增设防护栏和安全警示牌,避免旅游旺季时发生安全事故。
本文通过携程网获取青岩古镇旅游评论数据,通过数据去噪、分词,提取关键词、建模、情感分析、分类等过程,挖掘游客对青岩古镇的总体感知,深入分析消极评论数据查找问题的原因,提出针对性建议,希望能够为景区产业规划、优化、可持续发展提供一定的参考。
[1] 人民网.中国网民规模达9.4亿 手机上网比例达99.2%[EB/OL].(2020-09-30)[2021-03-02].http://media. people.com.cn/n1/2020/0930/c40606-31880397.html.
[2] ANDERSON M, MAGRUDER J. Learning from the Crowd: Regression Discontinuity Estimates of the Effects of an Online Review Database[J]. Economic Journal,2012(563):957-989.
[3] 孟美任,丁晟春.虚假商品评论信息发布者行为动机分析[J].情报科学,2013(10):100-104.
[4] 杨敏.在线商品虚假评论对交易双方的影响研究[J].现代经济信息,2016(1):159.
[5] 李璐旸,秦兵,刘挺.虚假评论检测研究综述[J].计算机学报,2018(4):946-968.
[6] 龚箭,杨舒悦.基于网络评论的旅游目的地评价研究:以我国31个省市自治区为例[J].华中师范大学学报(自然科学版),2018(2):279-286.
[7] 唐明虎.旅游评论极性分析对景区服务品质影响研究[J].电脑知识与技术,2020(20):23-27.
[8] AKEHURST G.User generated content:the use of blogs for tourism organizations and tourism consumers[J].Service Business,2009(1):51-61.
[9] 方梦静,郑钰旦,夏兆煊,等.基于微博大数据的游客情感时空变化特征:以杭州西溪国家湿地公园为例[J].西南大学学报(自然科学版),2020(3):156-164.
[10] 李勇,蔣冠文,毛太田,等.基于情感挖掘和话题分析的旅游舆情危机演化特征:以“丽江女游客被打”事件为例[J].旅游学刊,2019(9):101-113.