基于网络游记的旅游流网络结构及其景区关注度分析
——以贵州省为例

2022-02-07 09:20罗梦雪
智能计算机与应用 2022年12期
关键词:旅游景点关注度网络结构

罗梦雪

(贵州大学 旅游与文化产业学院,贵阳 550025)

0 引言

旅游流是一个具有空间属性的旅游经济系统的纽带,反映了旅游者在现实世界流动的真实情况[1];而景区网络关注度则是旅游者的出游意愿和决策行为在虚拟网络世界的综合体现,贯穿着旅游者旅游活动的全过程[2]。随着大数据时代的到来,网络信息技术的不断提高和移动电子设备的普及,使得旅游信息的传递、获取、交流变得更加快速、便捷。旅游社交平台的出现让越来越多的游客通过文字、图片、视频等方式分享旅游经历,并通过长时间收集用户发布数据,构建大规模旅游数据库,为旅游流[3]、景区网络关注度[4]等问题的深入研究提供了重要的基础支撑。

国内外对于旅游流的研究主要集中在2 个方面。一是探讨旅游流网络的时空分异特征[5]和旅游流网络结构特征[6];二是通过问卷调查、网络文本分析等方法提炼旅游流的影响因素[7];三是探讨旅游流的空间效应[5],分析旅游流在不同地区呈现出的扩散、带动效应。而景点的网络关注度是近年来探究潜在旅游者出游行为的重要度量指标之一,反映了游客在虚拟网络中对旅游景点关注热度[8]。目前,关于景区网络关注度主要围绕2 个方面进行研究。一是探讨景区网络关注度的时空演变特征[9],并从资源丰度、地理空间距离、网络普及率等方面来揭示网络关注度的影响因素;二是探讨景区网络关注的前兆效应[10],即探讨以网络空间关注度为代表的信息流与现实旅游接待人数为代表的旅游流之间的关系,并以此为基础对未来的客流量进行预测。

综上,已有研究侧重于从时间角度出发,探讨旅游流流量与景点网络关注度的关系,忽略了从空间视角探讨旅游流网络结构和景点网络关注度之间的关系,即网络关注度越高的地区是否在旅游流网络中的地位越重要。为此,本文聚焦贵州省旅游景点,从旅游景点视角出发,以八爪鱼采集器抓取携程旅行网站上发布的关于贵州省景区游记和景点评论数量为数据源,运用社会网络分析和GIS 空间分析方法探索贵州省旅游流网络结构及其节点网络关注度的特征,以期为推动区域旅游高质量发展提供有效参考。

1 数据来源与研究方法

1.1 研究区域概况

贵州省地处西南,于北纬24°37'~29°13',东经103°36'~109°35',北接四川和重庆,东毗湖南、南邻广西、西连云南,下辖6 个地级市,3 个自治州。贵州地貌高原山地居多,且岩溶地貌发育非常典型,喀斯特地貌面积占全省国土总面积的61.9%。基于其独特的自然地理环境和人文特色,形成了独一无二的旅游资源,近年来贵州省已发展为著名的山地旅游目的地。

1.2 研究数据来源及处理

本文是从旅游者视角出发的贵州省旅游研究,因此选取由游客自主发布的网络游记和景点评论作为研究开展的数据源。携程旅游网站是国内最早提供一站式旅游服务的网站之一,主要提供来自世界各地的旅行者的评论和建议,每年有上亿的旅游者通过该平台分享自己的旅游经历,网站内海量游客自主发布的文本信息已被多次作为研究数据。因此本文利用八爪鱼采集器在携程旅游网站上抓取以“贵州” 为关键词的所有网络游记文本共计1 567 篇,去除掉包含广告信息、单景点行程的游记,符合研究要求的游记共计921 篇,在此基础上将其转换成具有先后顺序的旅游线路、共涉及贵州省145 个旅游景点,并根据该数据构建贵州省景区旅游节点数据矩阵作为贵州省旅游流网络结构分析的原始数据。

景区评论文本的数量可以反映出游客对景区的关注程度。因此,本文利用八爪鱼采集器在携程旅游网站上抓取上述确定的145 个旅游景点的游客评论文本数量(因携程网站青岩古镇景点无评论数据,所以爬取去哪儿网站的景点评论替代),以网络节点的游客在线评论文本的数量作为景区网络关注度的评价指标,景点评论数量越多,则景区获得的网络关注度越高;反之,亦然。

1.3 研究方法

(1)社会网络分析法。这是一种社会学研究方法,通过分析网络中的关系来探讨网络的结构及属性特征[11]。本文基于游客发布的游记文本构建贵州省旅游流网络,运用社会网络分析法探索贵州省旅游流网络的结构特征,并通过Ucinet、Net Draw 等软件进行可视化展示,从而进一步明确贵州省旅游流网络的局部特征和整体结构特征。

(2)GIS 空间分析法。主要是利用GIS 中的空间分析功能从空间数据中获取有关地理对象的空间分布并进行分析[3]。本文利用Arc GIS 10.2 空间分析软件对145 个旅游景点建立数据库,以实现贵州省旅游流网络结构特征及其分布形态的可视化表达。

2 研究结果与分析

2.1 旅游流网络结构分析

2.1.1 旅游流网络构建

本文利用八爪鱼采集器在携程旅游网站上抓取以“贵州”为关键词的所有游记文本共计1 167 篇,对其进行清洗,并整理转换成具有先后顺序的旅游线路共计1 023 条,再根据该数据构建贵州省景区旅游节点数据矩阵作为贵州省旅游流网络结构分析的原始数据。此外以往研究表明,访问频次较低的节点为旅游流网络的结构较小,可将其剔除。因此,本文根据自然间断法剔除流动频次低于2 次的旅游节点,剔除完成后,借助Arc GIS10.2 构建得到了旅游流网络结构空间分布图。

接下来,对贵州省旅游流网络密度进行计算,旅游流网络中共包含145 个节点,网络规模大,但网络结构的总体密度为0.102 9,标准差接近于1,这说明贵州省旅游流网络中各旅游节点的联系不紧密,旅游流网络结构总体“大而散”。从旅游流网络结构的空间分布特征分析可知,网络节点分布在贵州省9 个地级市内,但却大多集中在贵州省中部及南部区域,可见其受空间距离的影响较为显著。

2.1.2 旅游流网络节点结构特征

借助网络节点度、出度和入度三个指标来进一步探索贵州省旅游流网络结构特征,排名前10 的景区见表1。从节点度的计算结果来看,黄果树瀑布(434)、镇远古镇(243)、西江千户苗寨(228)、青岩古镇(208)、甲秀楼(184)、荔波小七孔(167)、黔灵山公园(166)和梵净山(123)景区在整体旅游流网络结构中处于绝对中心地位,其节点度数值均大于100,说明这些景点与其他景点的联系较为紧密;从出度的计算结果来看,黄果树瀑布(414)、镇远古城(227)、黔灵山公园(145)、荔波小七孔景区(141)、青岩古镇(133)、西江千户苗寨(128)、甲秀楼(118),这些景点的出度数值大于100,在旅游流网络中处于关键节点的位置,并且承载着贵州省旅游流网络结构中的扩散功能,对其他旅游景点的控制力相对较强;从网络节点入度的计算结果来看,节点入度指数较高的景区主要集中在西江千户苗寨(188)、黄果树瀑布(183)、青岩古镇(153)、甲秀楼(140)、镇远古城(101)等资源禀赋较高、区位条件优越的景点,这说明旅游资源丰富、区位条件优越的景区会具有更强的旅游吸引力。

表1 景区网络结构指标计算结果(排名前10 位)Tab.1 Scenic network structure index calculation results(top 10 ranking)

总体而言,贵州省旅游流网络结构受资源禀赋的影响表现出较为显著的层级结构,即旅游景点在网络结构中的重要性与景点资源禀赋的质量呈正相关,这是由于优质的旅游资源能够吸引大量的旅游者,使得旅游节点在旅游流网络中具有较为重要的作用。本文借助自然间断法,根据景点在贵州省旅游流网络中的重要程度将贵州省旅游景点分为核心旅游景点、重要旅游景点、一般旅游景点和边缘旅游景点,见表2。从表2 中可以发现,在网络结构中处于越重要的位置,其所含的景点就越少。

表2 旅游景点等级划分Tab.2 Tourist attractions grade classification

为进一步验证旅游流网络结构是否具有规模-位序的特征,以贵州省旅游流网络结构节点度、出度、入度的数值为纵轴,以各节点以上指标的排名为横轴,绘制散点图,结果如图1 所示。利用对数函数对散点图进行拟合,发现曲线R值为0.915 9。由此可见,贵州省旅游流网络结构具有较强的规模-位序特征。网络结构数值较大的节点,所占比例较少;而网络结构数值较小的节点,所占比例较多,网络结构指标具有显著的“长尾特征”,网络同质性较差。

图1 旅游流网络结构指标幂指特征Fig. 1 Power index characteristics of tourism flow network structure indicators

2.1.3 网络结构节点空间分布特征

为了进一步阐释贵州省旅游流网络的空间分布特征,本文运用Arc GIS 10.2 中的空间插值法(克里金插值法)对贵州省旅游流网络结构的空间特征进行可视化展示,从空间差值的结果来看:网络节点出度和入度的空间分布均具有一定的相似性,两者的高值区域主要聚集在安顺地区黄果树瀑布附近和黔东南西江千户苗寨周边,这表明贵州省的游客游览目的地和客源地具有一定的重叠性,且这部分重叠区域的景区具有较强的集聚扩散能力。此外,在其余地区的网络节点出度和入度的数值大范围地低于高值区域,且在空间分布较为平衡,这说明贵州省旅游流的流向均出现了聚集的特征。黄果树瀑布是国家重点风景名胜区,是贵州省旅游的名片,对国内外游客具有较强的吸引力。西江千户苗寨依附着自身独特的民族旅游资源,是贵州省宝贵的旅游资源,也是贵州省极其重要的旅游目的地之一,因而在这2 个区域附近其节点出度、入度都处于极高的水平。

总体而言,贵州省旅游流网络节点出度和入度的空间分布差异较小,但景点之间所表现出的集聚扩散作用的差异性较为显著,旅游景点的两极化发展严重。通过比对发现:黄果树瀑布、西江千户苗寨处于贵州省旅游流网络的核心位置,这是由于其拥有优质的基础服务条件、优越的地理位置和得天独厚的旅游资源。需要指出的是,赤水丹霞景区、青岩古镇、织金洞等景区作为贵州省旅游核心景区,但其在旅游流网络空间中的位置并不凸显,因此,相关部门应该从游客视角进一步挖掘原因,从而提高在旅游流网络结构中的位置。

2.2 景点网络关注度分析

为了探讨旅游流网络与其节点网络关注度之间的关系,研究引入游客评论数量作为景点关注度的研究数据,利用ArcGIS10.2 分析贵州省旅游流节点网络关注度的空间分布特征。

2.2.1 网络关注度整体特征

借助八爪鱼爬虫软件在携程网站爬取上述145个网络节点的游客评论数量,将爬取结果进行统计计算,发现145 个旅游景点的网络关注度均值约为463.3,网络关注度超过平均值的景区仅有34 个,约占景区总数的23.4%。这说明贵州省不同景点的网络关注度差异显著。以贵州省景点网络关注度的数值为纵轴,以各节点以上指标的排名为横轴,绘制散点图,结果如图2 所示。利用对数函数对散点图进行拟合,发现曲线R值为0.915 9。由此可见,贵州省景点网络关注度与旅游流网络具有相似的规模-位序特征。

图2 旅游节点网络关注度的幂指特征Fig. 2 Power index characteristics of nodes network attention

为了进一步探索贵州省景点网络关注的空间分布特征,利用Arc GIS 10.2 软件的自然断裂法对其进行等级划分,并绘制空间分布图,旅游节点网络关注度具有显著空间差异。其中,关注度较高的节点呈现出“大集中,小分散”的分布态势,并主要集中在以青岩古镇为首的贵阳市片区和以黄果树瀑布为首的安顺片区,而黔东南、黔西南、铜仁、遵义等区域中高网络关注度的旅游节点多为零星分布。需要说明的是,在贵阳市和安顺市区域多个景区都获得了较高的网络关注度,究其原因是由于在这2 个区域内多个景区的旅游资源开发比较完善,旅游服务设施健全且交通便利,对游客产生较大的吸引力,因此形成明显的优质旅游资源集聚区。

2.2.2 网络关注度类型差异

从旅游资源的类型来看,自然型旅游景点、人文型旅游景点和复合型旅游景点获得的网络关注度呈现出较大的差异,其网络关注度的平均值分别为584.19、378.13、372.10,见表3。其中,自然型旅游资源获得的平均关注度数值最高,所包括的景区数量最多,是当前贵州省内受到游客最多关注的旅游资源,但此类型景点网络关注度的标准差最大,这说明该类型景区的部分景点具有较强的垄断性。人文型旅游景点和复合型旅游景点的网络关注度的均值相当,但人文型景点的数量却更多,且此类型景点的网络关注度标准差也更大。这说明相较于复合型旅游资源景点,贵州省单一型旅游资源景点在受到网络关注上更具有垄断性。

表3 不同类型景点网络关注特征Tab.3 Characteristics of network attention for different types of attractions

2.3 旅游流网络结构与网络关注度的关系分析

2.3.1 旅游流网络结构与节点网络关注度的空间分异特征

旅游流网络结构特征反映了旅游者在开展旅游活动时的真实流动情况;节点网络关注度体现了旅游者在虚拟网络中对旅游节点的关注热度,是对旅游网络结构特征研究的重要补充。已有研究指出在旅游资源网络关注度和旅游流网络之间既有关联,又有差异,两者在发展过程中具有相互促进的作用[8]。为了进一步研究贵州省旅游流网络与其节点网络关注度的空间分异特征,本文依据贵州省旅游流网络节点度数值与其节点网络关注度,利用Arc Scene 10.2 软件绘制贵州省旅游流网络与其节点网络关注度协调发展的空间分异图,如图3 所示。

图3 贵州省旅游流网络结构与其节点网络关注度的空间分异图Fig. 3 Spatial divergence of tourism flow network structure and its node network attention in Guizhou province

从图3 中可以看出,旅游流网络节点度及其节点网络关注度在空间上的分布存在一定的相似性,但两者在空间上并不完全重合。其中,旅游流网络节点度在空间上形成了较为明显的层级结构,第一级别包括以黄果树瀑布为代表的安顺地区和以青岩古镇为代表的贵阳地区,在这2 个区域内景点及其自身景点内外交通条件便利、旅游设施完善以及知名度高,使得这2 个区域内的景点承担了贵州省旅游流中极其重要的集散作用;第二级别包括了以荔波小七孔为代表的荔波区域、西江苗寨、镇远古城为代表的黔东南区域,这些景点承担了相对重要的集散作用;第三级别的区域在空间上呈现出不突出的分布态势,这表明贵州省旅游流网络结构层级结构明显,处于核心地位区域的景点发挥的集聚扩散作用较大,对其他非中心地位的旅游节点产生影响和支配效力较弱。其中,节点网络关注度在空间上共形成10 个峰值区,且各峰值之间的差距较小,在其他各个方向上呈现较均衡的分布态势。

2.3.2 旅游流网络结构与节点网络关注度的关系分析

根据贵州省旅游流网络的节点度和节点网络关注度的差异,本文利用旅游流网络节点度指标、节点网络关注度的平均值,将节点网络结构特征和节点关注度的关系划分为以下几种类型:高-高、高-低、低-高、低-低四种类型。对此拟做研究分述如下。

(1)高-高型:旅游流网络节点度、游客均超过了均值。处于该种类型的景区为黄果树瀑布、肇兴侗寨、甲秀楼、西江千户苗寨、龙宫、织金洞、天河潭、镇远古城、赤水丹霞、万峰林等19 个景区,占旅游节点总数的13.1%。处于这个区域的旅游景点在贵州省旅游流网络中处于较为有利的位置且受到游客的关注度较高,这种现象产生的原因主要是这些处于旅游流网络核心位置的景区的资源优势明显、区位条件优越、景区基础配套设施齐全致使其知名度高,从而,与其他旅游节点的互动相对频繁,处于此类景区的网络结构对景区网络关注度具有正向效应,即这些景点吸引了更多的游客,得到较多的关注。因此,这类景区在营销宣传和服务质量方面都应维持和加强原有方向,以保证景区在旅游流网络中的重要程度和受到的关注程度。

(2)高-低型:旅游流网络节点度指标超过自身均值,但此类景点获得的网络关注度处于较低的水平。属于该类型的旅游景区包括青岩古镇、梵净山、天河潭等11 个景区,占旅游节点总数的7.5%,这部分景区均在贵州省旅游流网络结构的优势地位,但其获得的网络关注度较低,旅游流网络的结构优势尚未得以充分发挥,此类型旅游节点的景区旅游资源和景区服务质量的优势是相对明显的,因而该类型景区应该提高宣传力度拓宽市场,进一步促进网络关注度的提升。

(3)低-高型:节点网络关注度超过了自身均值,但节点度指标处于较低水平。该类型的景点包括丹寨万达小镇、威宁草海、乌蒙大草原、荔波茂兰风景区等15 个景区,占旅游节点总数10.3%。这部分景区处于旅游流网络的边缘位置,在网络结构中的优势相对较弱,但获得的网络关注度极高,这部分景区受到的关注度与其在网络结构中的位置存在一定的“脱钩关系”,因而均有较强的市场潜力,但却还处于独立的发展中。此类景区应加强与其他景区的联合发展,进而提高在旅游流网络的地位。

(4)低-低型:网络节点度指标和节点网络关注度均处于较低的位置。属于该类型的景区包括织金大峡谷、云台山、隆里古镇、丙安古镇、土城古镇、苗王城、孔学堂、水城古镇等99 个景区,占旅游节点总数的68.3%,这部分旅游景区处于贵州省旅游流网络结构的边缘,且受到的网络关注度也较低。因此该类景区应当从内部着手提高核心竞争力,增加景点网络关注度,进而提高在旅游流网络中的地位。

通过前文分析可发现,以上所有类型的景区在贵州省空间上呈交错分布。低-低型与低-高型的地区占到总数的78.6%,表明大部分节点在网络中处于不利地位,尤其低-低型城市节点占到总数的68.3%,反映出中国市域旅游流网络结构不平衡现象较为严重,大部分节点在网络中的结构与其网络关注度处于不利地位。

3 结束语

本文聚焦贵州省旅游景点,从旅游节点视角出发,以八爪鱼采集器抓取携程旅行网站上发布的关于贵州省景区游记和景点评论数量为数据源,运用社会网络分析和GIS 空间分析方法探索贵州省旅游流网络结构及其节点网络关注度的特征,研究得出以下结论:

(1)贵州省旅游流网络整体规模大、密度低、结构松散,不同节点的流量分布特征差异显著,网络节点之间所表现出的集聚扩散作用的差异性较为明显,全省旅游景点的两极化发展严重。

(2)贵州省旅游流网络节点获得的网络关注度表明旅游流网络具有相似的结构特征,具有较强的位序-规模特征,即网络关注度数值越大的景点,其数量越小;而网络关注度数值越小的景点,其数量越多,贵州省景点网络关注度具有显著的“长尾特征”,景点获得网络关注度同质性较差。

(3)贵州省旅游流网络结构与节点网络关注度之间既有关联,也有差异。从空间分布特征来看,两者在空间分布上具有一定的相似性,这表明其具有一定的相关性,在发展过程中可相互促进。而按照彼此之间的差异,则可将节点景区划分为高高、高低、低高、低低四种类型,鉴于每一种类型所面临的演化阶段和发展情况各不相同,因此需要围绕自身实际情况制定差异化、个性化的发展方向。

猜你喜欢
旅游景点关注度网络结构
贫民窟也能成旅游景点?
美人鱼
雄安新区媒体关注度
全国两会媒体关注度
暴力老妈
基于时效网络的空间信息网络结构脆弱性分析方法研究
基于互信息的贝叶斯网络结构学习
复杂网络结构比对算法研究进展
“王者”泛海发布会聚焦百万关注度
高速公路高清视频监控系统网络结构设计