闫慧洁,张艳波
(1. 桂林旅游学院文化与传播学院,桂林 541006; 2. 桂林旅游学院旅游数据学院,桂林 541006)
2021 年4 月26 日,习近平总书记考察桂林时指出,“老百姓的幸福感来自哪里?就来自良好的生活环境”“要坚持以人民为中心,以文塑旅、以旅彰文,提升格调品位,努力创造宜业、宜居、宜乐、宜游的良好环境,打造世界级旅游城市”。现如今,全球旅游业蓬勃发展,持续发展我国入境旅游市场是由旅游大国走向旅游强国的重要一步。各地旅游业在竞争中优胜劣汰、中国旅游在调整中由大趋强,如何抢占发展制高点、创造竞争新优势、实现旅游新跨越,是各地旅游业必须完成的历史使命。
根据文化和旅游部发布的《2019 年我国旅游市场基本情况》统计,我国已经成为全球最大的旅游市场,2019 年入境旅游收入1313 亿美元、入境游客1.45 亿人次。旅游业已成为国民经济的重要支柱产业,对于增加外汇、提升国家形象都具有重要地位[1‑2]。但据《中国旅游统计年鉴》统计分析结果显示,我国入境旅游数量增长缓慢,在2008—2018 年的11 年当中,我国入境游客增长仅为0.5%[3]。因此,如何实现入境旅游持续又快又好的发展,已然成为了旅游目的地城市亟待解决的实际问题。入境旅游的时间特征研究取得了丰富的成果,入境旅游通常在春秋两季取得高峰[4‑6]。一年当中的春、夏、秋、冬季节性变化显著,但在入境旅游的市场需求上呈现不断增长的趋势[7‑8]。与此同时,入境游客的空间行为特征、集聚扩散规律、网络结构特征研究成果也不断涌现[9‑10],入境游客集散特征呈现空间压缩、两极分化的局部集聚、整体松散特征。由我国西部地区向东部地区逐渐聚拢,客源市场呈现“胡焕庸曲线”定律[11]。在客源市场结构研究中发现,入境游客中我国港澳台地区游客占据约80%的市场份额,首次来大陆旅游的入境游客超过50%[12]。
随着互联网及Web2.0 技术的发展,旅游业与互联网不断融合发展,越来越多的研究者通过网络获取研究旅游者的行为信息,并以此作为研究的重要数据来源。旅游目的地形象感知研究逐渐丰富,游客的情感体验分析也逐步得到重视[13‑18]。情感分析一般分为积极情绪、中性情绪和消极情绪,消极评论对于潜在游客的决策影响往往大于积极评论。总体来说,情感分析技术已趋于成熟,在旅游领域也有一定的应用,但在入境游客情感分析的应用还不够广泛。对于用户在网站发布的文章、评论、游记等文本内容进行采集、处理、分析可以得出与旅游目的地相关的信息,从而获取游客对旅游目的地形象的感知,为旅游目的地城市形象完善和提升提供依据[19‑27]。
因此,本项目借鉴已成熟的研究理论和方法,充分考虑不同入境客源国游客的时空分布差异、阐述旅游城市与入境客源国匹配关系,揭示入境旅游时空演变、区域差异和影响因素。深化对入境游客目的地选择空间异质性的理解,强化对入境客源市场结构发展规律的认识,有效地促进未来入境旅游市场的开拓和健康发展。综上所述,基于文本挖掘的入境旅游客源市场结构、旅游目的地形象感知与游客时空分布特征研究具有很大的研究价值。本文的主要工作有以下几个方面:
(1)利用Python爬虫技术收集TripAdvisor网站最新的桂林景区旅游评论数据,通过Python编程进行数据挖掘深入分析客源国信息、入境游客时空分布特征。
(2)结合高频词汇特征、游客情感分析、入境游客时空分布特征分析,探索旅游目的地入境游客感知形象的提升策略、旅游路线优化等内容,推进以桂林为例的入境旅游经济高质量发展。
桂林市位于广西东北部,是世界著名旅游城市,全市下辖6区10县、代管1个县级市,全市总面积2.78 万平方公里、常住人口为493 万人。2018 年桂林入境游客接待人数在全国排名第十,桂林接待旅游总人数从2016年的5385.87万人次增长到2020 年的10241.20 万人次,年均增长17.43%;旅游总消费从2016 年的637.31 亿元增长到2020 年的1233.54 亿元,年均增长17.95%。截止2021 年,桂林共有A 级景区91家,其中5A级景区4家,4A级景区42家;星级旅游饭店47 家,其中五星级饭店5 家,各类旅游住宿设施5080家,共有床位33.54万张,星级汽车旅游营地17 家;全市共有国家全域旅游示范区2家(阳朔县、兴安县),国家级旅游度假区1家(阳朔遇龙河)等。桂林旅游资源丰富,自古享有“桂林山水甲天下”的美誉,是我国重要的旅游目的地。
TripAdvisor 网站是国际知名的综合旅游平台,旅游攻略丰富、旅游评论内容详实,多为游客的真实感受。本文利用Python 技术爬取Trip‑Advisor 网站入境游客的桂林旅游景区评论文本内容、用户信息和评论时间作为研究样本,最后建立基础数据库。此外,课题组联系桂林当地旅游公司开展桂林入境游客旅游目的地形象感知问卷调查,对于游客的感知体系进行了充分的调查,对网络平台数据进行了充分的补充。
利用Python技术爬取5000篇用户信息内容,剔除没有国家信息的用户文本数据,暂不考虑中国港澳台用户数据。经过数据处理共获得用户客源国信息1001 个,利用Python 语言编写程序对入境游客的客源国数据进行中文高频词分析,得到了高频特征词云图(见图1)和入境旅游客源国分布数据(见图2和表1)。
表1 各个国家文本数量
图1 高频特征词云图
图2 入境旅游客源国分布数据
如图2 所示,在桂林入境旅游客源国统计中,美国、英国、澳大利亚分别以220 位、198位、165 位用户占据了入境游客总数的近60%;在世界地理范围内的统计中,亚洲用户总数占据文本总数的17%、欧洲占30%、大洋洲占19%、南美洲占1%、北美洲占31%、非洲占2%。根据网络文本统计内容,入境游客涵盖了世界6 大洲的57 个国家,占世界国家总数的近30%。其中,发达国家24 个、发达国家用户累计发布的文本数据占比近85%。从客源国市场结构特征可以看出,发达国家经济实力强、居民可支配收入高,是入境旅游的主力军;亚洲周边国家受地理位置近、交通可达性、文化相近等影响也有大量入境旅游的游客;南非作为非洲最发达国家,也是入境旅游人数最多的非洲国家。部分国家受交通设施完善程度、国家人口数量限制、自身经济发展水平、旅游目的地文化差异等影响,入境桂林旅游的人数较少。
旅游目的地形象感知体系主要考虑旅游设施、旅游吸引物、旅游休闲和娱乐、旅游环境和地方氛围、旅游评价等五个方面的内容(见表2),基本涵盖了旅游形象感知的各个要素。旅游吸引物体现着一个地区的旅游核心竞争力,也是游客最关注的。从上个世纪70年代末开始,研究者开始关注情感分析研究。到20世纪初期,文本内容隐含的情感以及相应的文本计算研究不断取得研究成果。旅游网络文本的情感分析研究更多地依赖于计算机应用技术、数学和自然语言处理相结合的研究进展。TripAdvisor网站的用户点评带有评定标准,评定结果按照Excellent、Very good、Average、Poor、Terrible 五个等级划分。用户评定结果统计见表3。
表2 旅游目的地形象分析框架
表3 情感分析表
在情感分析统计中,积极情绪占比79%,中性情绪占比15%,消极情绪占比6%,大多数游客体现了重游和推荐的意愿。在旅游环境和地方氛围方面,游客给出了不错的评价。部分景区和路段在假期高峰期出现了拥堵的情况,少部分游客表示太堵了。在旅游休闲和娱乐活动方面,游客提及最多的是骑行、竹筏、漂流、徒步、游船、演出等内容。游客的游后评价总体较好,高于预期。入境游客的负面情绪主要集中在旅游吸引物、旅游基础设施、景区周边社会环境等方面,具体表现在景区演绎节目吸引力不足、卫生间卫生较差、景区游客多、太过拥挤等。随着我国国民经济的迅猛发展,各地旅游部门不断加大资金投入,各地旅游景区之间的基础设施硬件差异较小,游客负面情绪通常集中在设施的维护、标识牌的设置、环境的保持和服务意识方面。旅游吸引物作为景区的核心竞争力备受关注,与之对应的是景区的管理能力和服务水平,交通可达性、便利性。在提升景区管理水平、增强服务意识、改善基础设施和游客安全保障方面需要做出更多完善。
2.3.1 时间特征分析
桂林入境游客的时间特征呈现“两峰两谷”模式,如图3所示。一年当中的5月和10月分别取得两次峰值,在2 月和8 月降至低谷。5 月和10 月气候比较舒适,加之国内正值五一劳动节小长假和十一国庆节黄金周,景区促销活动较多、宣传较好,入境游客数量也随之增长明显。5月阴雨绵绵迷雾蒙蒙,云雾或聚或散、群山忽隐忽现,正是桂林山水旅游的好时节;10 月秋高气爽、气候宜人,也是旅游的最佳时节;2月前后通常是国内的传统佳节春节期间,入境游客外出游览实有不便,加之国外12 月有圣诞节和平安夜、1月份迎新年,通常是入境游客减少的时间;在每年的7 月和8 月份天气十分炎热,游客外出旅游经常有中暑等夏日旅游的疾病风险,呈现了第二次低谷。总体来看,入境旅游流受旅游目的地气候舒适度、温度适宜性、国内外重大节事活动等影响十分显著,这与土耳其、杭州、上海等地区入境游客时间特征的已有研究结论都有相似之处[4‑6]。
图3 时间分布
2.3.2 空间特征分析
漓江发源于桂林市兴安县猫儿山,流经兴安、灵川、桂林市区、阳朔、平乐,终点为平乐三江口。漓江全长共164公里,沿江河床为水质卵石,江水清澈见底、泥沙量少。漓江山青、水秀、洞奇、石美,闻名世界的桂林山水指的就是漓江。桂林拥有A 级景区91 家,绝大部分分布在桂林市区和阳朔县的漓江沿线,除此之外最受欢迎的是坐落在龙胜的4A 级景区龙脊梯田。部分A 级景区由于自身级别较低、名气较小,并且和知名景区距离较远,很难建立起协同发展的共享机制,到访游客相对较少。龙脊梯田春天播种场面十分壮观,在10 月金秋时节金黄色的梯田美不胜收,是吸引游客最多的时节。桂林市区酒店数量较大,市区内芦笛景区、日月双塔、两江四湖、象山景区和叠彩山等景区交通便利,很多游客抵达桂林后选择在市区游览和居住,之后向周边郊区县城扩散,最后再回到市区返程。阳朔县地处桂林市区以南,阳朔西街长期以来深受国外游客的喜爱,一度被称为“洋人街”“地球村”,街上外国餐厅、酒吧、咖啡厅数不胜数。阳朔西街、遇龙河、兴坪古镇、月亮山、银子岩、蝴蝶泉等景区都坐落在阳朔县城附近,成为了桂林市区以外旅游流最聚集的地区。市区基础设施完善、交通便利,而周边县城郊区等景区较多、酒店偏少,难以满足节假日等大量游客的住宿需求,使得游客呈现聚集−扩散−再聚集−再扩散的典型旅游流集散模式。
客源国经济发展水平、人口数量、文化差异、距离远近是入境游客数量大小最直接的影响因素;“桂林山水甲天下,阳朔山水甲桂林”,桂林山水是大部分入境游客的打卡地,体现了游客对于桂林山水特色旅游形象的基本认知,也体现了桂林丰富的旅游资源和质量优势。在情感分析方面,游客对景区认可度普遍较高,评论文本数据中正面积极情感占比较高,大部分游客表示了重游和推荐的意愿。对于旅游景区的卫生环境差、拥堵疏散不佳、性价比不高、景区吸引力不足等消极情绪文本内容占比较多,是急需改进的方面;桂林入境游客数量呈现“两峰两谷”的时间特征,随着季节、温度和大型节事活动等波动的变化显著。夏季8月天气炎热、冬季12 月到2 月较为寒冷,加之国内外节事活动圣诞节、新年、春节等都在冬季的这三个月内,因此入境游客较少。春秋两季温度适宜、舒适度高,因此春季和秋季通常是外出旅游的高峰期;在空间分布结构方面,市区内交通设施便利、住宿设施完善,通常是游客集散地。大部分游客在市区酒店居住,游览周边景区之后向阳朔、龙胜方向扩散,最后由市区集合返程最为常见。在桂林市的91个A级景区中,22 个景区文本数据较多,其余大部分被提及较少。部分景区自身级别较低,与知名景区距离较远、宣传不够、向海外市场的拓展很困难,宜加强景区自身基础设施建设、文化内涵挖掘、海外宣传报道,积极构建和优质景区的协同发展共享机制,寻求更好更快的景区高质量发展。
(1)旅游目的地形象感知评论数据直接关系到潜在游客的游前决策,消极评论往往比积极评论影响更大。数据显示,入境游客的消极情绪主要集中在旅游景区管理水平、服务意识、旅游基础设施等方面,具体有中英文标识牌设置、景区拥堵疏散机制、景区服务人员沟通能力、景区环境卫生等方面,游客消极情感最集中的地方,通常也是影响旅游发展的重要因素。因此,加强景区管理水平、提高景区服务品质、丰富景区文化内涵、提升景区核心竞争力,是旅游形象提升的重要一环。在节假日期间,需加强桂林至阳朔、桂林至龙胜、阳朔至兴坪古镇等交通重点线路的交通疏导和交通治理,确保交通安全和畅通。在重要景区附近的学校、社区等空置资源,节假日期间可适当开放为停车场。在高铁站、飞机场等重要的游客集散地,均需设置5A 级景区、4A 级景区的客车直达专线。景区需完善员工定期培训机制、对旅游设施进行定期维护和升级,对到访游客进行定期回访,重视旅行者的不满和差评,全面提升旅游形象,更好地向入境游客推介中国文化和旅游产品。
(2)桂林自古以来享有“桂林山水甲天下”的美誉,桂林山水是桂林独特的旅游资源,需协调旅游利益、加强环境治理,充分利用山水旅游资源优势、大力推动全域旅游。在入境游客关注度最高的桂林市区景区、阳朔县景区和龙脊梯田景区之间建立起便捷互通的旅游交通,开通旅游专线,设置一站式通票、一站式游玩。利用丰富的旅游资源、现有的丰富人流和景区的协同发展效应,广泛宣传灵渠景区、猫儿山景区等景区,提升其他景区的客流水平,进而带动更多景区服务水平的升级。宜把握文旅融合契机、深入挖掘自身文化内涵、提升旅游影响力。
(3)各地旅游部门宜加强自身旅游基础设施建设、做好海外旅游宣传工作,积极筹备大型国际赛事活动、文化交流活动,为我国入境旅游事业发展、由入境旅游大国向旅游强国迈进贡献自己的力量。
本研究选取了TripAdvisor 网站的入境游客评论文本数据建立基础数据库,进行桂林入境旅游目的地客源国市场结构、入境游客形象感知、游客时空分布特征的分析。未来的工作将对图片与文本数据进行综合分析,研究基于图文信息的不同客源国入境游客画像特征。