和家欢,周诗雅,李娟,聂蓓捷,伏学习,杨会娟,3
(1 河北农业大学 园林与旅游学院,河北 保定071000;2河北省木兰围场国有林场,河北 承德 068456;3河北省城市森林健康技术创新中心,河北 保定071000)
绿水青山就是金山银山,发展旅游业对于区域经济的发展发挥着巨大的推动作用,尤其是地处偏远的自然旅游目的地,对旅游业的依赖程度更高。旅行者是旅行活动的主体,通过对旅行者行为的刻画,能够真实反映旅行者活动过程中的行为偏好与特征,有助于优化旅游产业分布格局,提升旅游整体竞争力,促进区域经济协调发展。
旅行者行为作为旅游地理学的传统研究主题,发展至今已经积累了大量的理论成果。从数据获取来源上,早期数据的获取主要依赖于统计年鉴和问卷调查等方式,但其结果耗时长,在研究区域范围较大时,不容易获得全面、准确的数据,并且受问卷的编制与受访者影响较大,数据的质量难以保证[1]。后来随着地理信息时代的到来,时空大数据为旅行者行为研究提供了丰富、客观的数据支撑。国内外学者开始将手机信令数据、GPS数据、社交媒体数据、信用卡交易数据等大数据应用于旅行者行为研究中[2-9]。国内学者利用微博签到数据、旅游产品点评或分享网站、地理标记照片、百度指数等各类旅游大数据进行研究[10-16]。但是以上研究一般利用单一类型数据,而多源数据可以更加客观地进行多方位、多视角的探索性研究,全面了解旅行者行为规律。在研究方法上,时空分布特征多采用传统的GIS空间分析、数理模型等方法,随着多学科的综合应用,社会网络分析、聚类分析、马尔科夫链等也逐渐被采用[9,17-23]。此类方法只能从单一维度对于旅行者行为空间分布的影响机制进行分析,探测不同因素对旅行者行为空间分布影响程度的深入研究较少。更重要的是,从研究地域来看,现有研究主要集中于城市公园、古镇空间、城市街道等小尺度空间,或者以省域、市域或多个行政区集群等有明确边界的区域作为研究对象进行旅行者行为的研究,鲜有跨越行政边界的自然旅游地旅行者行为过程的全面剖析[24-31]。
本研究选择典型自然旅游地,以“两步路”中的旅行者活动标记作为数据源,进行跨区域的自然旅游地边界界定,借助GIS时空分析工具及地理探测器分析工具,总结旅行者的时空分布特征,并选取自然环境(高程、坡度、河网)、人文社会(基础设施、景点)等因素探究跨行政区域的自然旅游地的旅行者空间分布的成因,以丰富现有基于多源数据的自然旅游地旅行者行为研究,并为提升旅行者旅游活动满意度,以及整体旅游产业布局优化提供参考。
木兰围场拥有丰富的自然人文景观,保留了大量的历史文化遗产,是现代旅游景区形成的基础。随着时代变迁与旅游产业的进一步发展,历史记载的“木兰七十二围”逐渐形成了四大景区,分别是塞罕坝国家森林公园、御道口草原森林风景区、乌兰布统生态文化旅游景区、红松洼国家级保护区。旅行者到达后会跨省市游览这些景区,停留3~5 d。但作为一个京津冀区域重要的避暑自然旅游地,因横跨2个省份4个区县,到目前为止并未进行统一规划宣传,也未形成鲜明的旅游形象,不利于长远发展。因此在关键词选取时,采用了木兰围场、塞罕坝、乌兰布统、御道口、红松洼多个关键词,获取旅行者活动的空间位置信息。
截取标记点密集区作为研究区域,将其识别为一个典型的自然旅游目的地板块。研究区位于E 116.514°~117.996°, N 41.82°~42.95°,总面积约为7 740.08 km2,涉及围场县、赤峰市松山区、克什克腾旗、多伦县4个区县。研究区属于华北平原与内蒙古高原的交汇地区,寒温带大陆性气候,属于森林-草原交错地带,地貌类型多样,山地平原及丘陵纵横,海拔936~2 041 m。地理位置与悠久的历史造就了区域内禀赋优良的旅游资源,为旅游业发展提供了良好的基础条件。
表1 研究区主要景区概况
“两步路”是国内重要的户外旅游共享交流平台,拥有海量用户主动上传的照片和轨迹数据。本研究利用Python爬虫程序从“两步路”中以塞罕坝、木兰围场、乌兰布统、御道口、红松洼为搜索词抓取2015年1月至2021年10月的标记点数据,剔除未落入研究区范围的标记点后,剩余11 745条数据。每个标记点包含用户昵称、标记时间、标记点经纬度、海拔、标记序号等信息。
为进一步验证“两步路”数据的可靠性,将2015-2021 年的360大众搜索指数与“两步路”平台旅行者数据作对比,可以发现年际网络关注度变化趋势与“两步路”平台旅行者游览数量变化大体一致,并且“两步路”平台用户群体年龄以19~34岁为主,其他年龄段为辅,也与360大众搜索指数的关注群体年龄特征基本吻合。因此,所用数据可以反映研究区域的旅行者行为特征。
为探讨影响旅行者标记点空间分布的驱动因子,从OpenStreetMap网站上导出研究区范围内的道路、水系、居民点等基本数据信息。市县乡镇等行政边界来自于地理国情检测云平台。数字高程模型来源于NSAS ALOS卫星数据,空间分辨率为30 m×30 m。基于高德地图运用XOMAP互联网地图爬取工具爬取的研究区域的旅游产业的位置数据。参考《国家旅游及相关产业分类(2018)》标准,基于已有研究成果及分类,将旅游产业数据划分为旅游景点、休闲餐饮、休闲购物和酒店住宿4种产业类型。通过统一采用CGS 2000坐标系,对获取的位置数据进行坐标转换,经过数据清洗、筛选、归类整理后获得数据(表2)。
表2 POI数量及分类
1.3.1 时间统计分析 利用标记点的标记时间属性信息,分析旅行者活动时间分布特征,统计2015-2021年期间研究区域的旅行者行为活动的年际及季度变化。
1.3.2 HDBSCAN(Hierarchical Density-Based Spatial Clustering of Applications with Noise)聚类方法 HDBSCAN是层次聚类与密度聚类的结合,HDBSCAN使用可变距离将不同密度的聚类结果与稀疏噪声点相分离。通过对标记点数据设定最小聚类数,将每个空间聚类定义为一类簇,就可以实现对于旅游热点区域的提取。
1.3.3 核密度分析 核密度分析通过分析点因子或线因子在周围邻域中的密度,生成1个平滑的二维曲面图,从而分析点线因子在空间上的集聚与分散程度。本研究利用旅行者标记点的核密度,分析旅行者空间分布特征,并通过量化各个驱动因子核密度值来分析旅行者活动的驱动因素。
1.3.4 季节强度指数 季节强度指数常用于测量研究区内旅行者活动的季节性差异。以月为研究单元的季节强度指数计算公式为:
(1)
式中:R代表旅游季节强度指数;xi代表每月旅行者数量占全年的比重。R越大,说明旅行者活动季节性差异越大;R越趋近于0,则代表活动季节性差异越小。
1.3.5 地理探测器 地理探测器是由王劲峰等开发,包括因子探测、交互作用探测、风险探测和生态探测4个方面[32]。其在探测空间分异性方面发挥重要作用,并可以揭示空间分异背后驱动力,本研究借助因子探测和交互作用探测探讨研究区域旅行者活动空间分异性的影响因素。因子探测用于分析各类驱动因子对旅行者行为活动空间选择的影响程度。交互作用探测用于测度2种不同驱动因子交互作用时是否会增强或减弱驱动因子的影响力,以此探求双驱动因子对旅行者活动分布的影响程度。本研究主要使用基于Excel编制的地理探测器软件GeoDetecto实现。
2.1.1 旅行者总体分布特征 运用 ArcGIS Pro 2.5软件通过HDBSCAN算法对AOI 进行聚类探究,经过多次试验最终设置最少点数m=100。结果显示:11 745个标记点被划分为29个聚类,产生噪音点4 904个,继而对部分空间比较邻近的聚类进行合并,最终形成了27个聚类,包含6 841个标记点。将聚类前的11 745个标记点和聚类后的6 841个标记点的经纬度分别导入ArcGIS,得到研究区域地区旅行者活动热点区域分布图。旅行者活动范围广,主要集中在27个聚类周围,见图1。本研究根据每个标记点的位置信息标记其所属的4个景区单位,并计算每个景区的标记点数量及聚类数量,见表3。
(a) 聚类前
表3 各景区标记点数量与聚类数量
由图1、表3可知,旅行者活动分布存在明显的空间差异,研究区域内乌兰布统景区、塞罕坝景区在标记点数量占有绝对优势,构成了旅行者活动核心区域;红松洼保护区及其他景区景点的标记点数量和聚类数量均比较少,形成了旅行者活动的边缘区域。虽然各景区的旅游产业在不断发展,但知名度较大、基础设施较为完善的景区景点仍是旅行者出行首选。此外,塞罕坝景区的标记点数量不如乌兰布统景区,但聚类的数量高于乌兰布统景区的聚类簇数量,这可能是由于乌兰布统景区内旅行者活动相对分散,在领域半径中,形成的噪声点更多而导致的。
2.1.2 旅行者年际分布特征 对研究区域旅行者活动空间分布特征的年际变化进行分析,以揭示旅行者活动分布的年际变化规律。据图2发现,2015-2021年空间集聚性计算结果均小于1,说明在1%的显著性水平下,研究区域旅行者活动总体上都处于集聚状态,且发现旅行者活动分布的集聚性呈现"U"型趋势,在2019年最低,集聚性特征最强,空间分布最为集中。
图2 2015-2021年研究区域旅行者空间集聚性分析
如图3所示,2015年旅行者活动热区位于乌兰布统景区,在河北省内没有明显地集聚区域。2016年旅行者活动热区域转移至塞罕坝北部边界白桦林景点周围,形成单核心集聚分布。2017-2019年旅行者活动分布总体呈现“平行多核心”空间结构模式。伴随热区数量的逐年增加,旅行者也表现出了对于人文类景观的倾向性,如可汗行宫、乌兰布统影视基地等都是受到旅行者关注度较高的热点区域。2020年旅行者活动分布呈现“双核心”模式,旅行热区主要集中塞罕小镇-金莲映日-七星湖景点附近及研究区南部居民点靠近水体景观周围。2021年研究区内的旅行者活动空间呈现“单核心”模式,热区分布塞罕坝景区,次热点区域范围较上一年进一步扩大。
(a) 2015年
由图3可知,研究区旅行者年际分布变化存在明显空间差异,活动热区不稳定,长期处于竞争变化中,产生这种现象的原因是政治、公共卫生事件的影响。2015-2016年随着塞罕坝题材电影的拍摄与播出,塞罕坝景区知名度进一步提升,旅行者活动热区发生转移。2017-2019年热区由御道口景区、乌兰布统向塞罕坝景区转移。同时,金莲映日-七星湖-塞罕坝小镇对旅行者的吸引力逐渐增强,其作为核心旅游区域的地位也逐渐清晰。2020-2021年受新冠疫情影响,旅行者活动受到限制,空间热区分布再次发生变化,但是围绕金莲映日-七星湖-塞罕小镇景点仍形成了旅行者活动热区。
2.1.3 旅行者季节分布特征 根据旅行者标记点数量,得出2015-2021年旅行者季节强度指数均值为12.36,相对高于全国平均水平,并且旅行者活动的月变化曲线呈现明显的倒“U”型,旅行者出行的季节性明显(见图4)[33-34]。从整体而言,旅行者出行时间以夏秋出行为主,集中在6-10月,这与季节温度舒适情况有很大关系。
图4 旅行者标记点月度分布
由图4、图5可知,进一步探讨旅行者不同季节的空间分布特征。春季,旅行者标记点数目有1 280个,占比10.90%,旅行者活动频率较低,活动范围较大,总体呈现出“多核心”分布状态,而旅行者活动高峰分布乌兰布统景区、御道口景区人文类旅游景点周围;夏季,旅行者标记点数目为5 262个,占比44.80%,旅行者活动收缩,呈现高度的聚集分布,旅行者活动最高峰分布在塞罕坝景区,小高峰分布在乌兰布统景区、御道口景区。其中,塞罕小镇-金莲映日-七星湖景点、御道口文化广场、民俗影视基地是旅行者夏季活动的核心旅游吸引物;秋季,旅行者标记点数目有4 003个,占比34.08%,旅行者活动范围扩大,活动最高峰位于以影视作品取景点为代表的乌兰布统景区人文类旅游景点周围,次高峰则位于乌兰布统景区、塞罕坝景区水体景观周围;冬季,旅行者标记点数目有1 200个,占比10.22%,旅行者活动范围收缩,集中分布于塞罕坝景区与乌兰布统景区交界地区,次高峰分布在塞罕坝-金莲映日-七星湖景点周围。
(a) 春季
由图5可知,旅行者空间分布呈现出的季节性变化,夏秋季节集聚性特征最强,空间分布也最为集中。从旅行者活动空间位置分布看,旅行者活动分布存在显著的季节性差异。季节变化不仅会导致旅行者数量发生变化,空间上活动热区也会发生变化。塞罕坝的金莲映日-七星湖-塞罕小镇旅游景点区域由于具有一定公共服务的职能,因此该区域一年四季均具有一定活动热度;御道口景区多以自然景观为主,受到季节性影响较大,造成冬春季节旅行者活动较少;乌兰布统景区虽然同样是属于自然景观,但也兼具部分人文景观,且景区多位于北部高海拔地区,在冬季更容易形成了大面积的雪原景观,对于旅行者更具有吸引力。
2.2.1 驱动因子指标选取 研究区域旅行者呈现出显著的空间分异特征,是诸多驱动因子经过复杂的交互作用而最终形成的结果,主要包括自然环境类因子和人文社会因子。本研究基于已有的相关研究,考虑研究区域数据可获取性,筛选出能够充分反应研究区现状的9个指标作为驱动因子[35-38]。其中人文社会因子是旅行者开展旅游活动基础,需涉及食、住、行、游、购、娱多个方面,因此采用住宿设施、购物设施、餐饮设施、路网、旅游景点、居民点的密度分布表示;而自然环境因子则是旅游活动的前提条件,需要反映出研究区生理物理特征,在这里采用河网密度、海拔、坡度表示。指标选取结果见表4。
表4 旅行者行为空间分布驱动因子
2.2.2 单因子探测 基于地理探测器对研究区域旅行者空间分布的驱动因子进行量化,q值越高表示对旅行者空间分布的影响程度越大。研究区域旅行者空间分异及因子探测结果q值依次为:景点>餐饮>住宿>海拔>购物>河流>居民点>坡度>路网,见表5。
表5 单因子探测结果
由表4、表5可知,相较于自然环境因子(X1~X6),人文社会因子(X7~X9)对于旅行者空间分布的影响较强,其中景点因子(X5)对于空间分布的影响最大。景点作为旅游活动的重要空间载体,使得旅行者在景点间的流动中呈现出明显的空间异质性。同时,景区、景点的建设,各类游步道、游览道路的建设也促使景观可达性增加,对旅行者空间分布会产生积极影响。其次影响力较大的因子是餐饮因子(X3)、住宿因子(X1),这主要是为了满足旅行者出行时的基本生理需求。在自然环境因子中,海拔作为自然景观塑造与形成的客观条件,同时也限制了一部分旅行者的行为活动,也在一定程度上影响了旅行活动的空间分布。
如图6所示,通过对四季活动进一步因子探测发现,研究区旅行者四季活动主导性驱动因子仍是景点因子(X5),海拔因子(X8)依旧是影响力最大的自然环境驱动因子。但季节不同q值排序也发生变化,冬、春季节住宿因子(X1)q值(0.267、0.266)超过餐饮因子(X3)q值(0.254、0.239)成为第二主导因素。
图6 不同季节的单因子探测结果
由图6可知,景点(X5)、餐饮(X3)、住宿因子(X1)基本主导了各季节旅行者活动空间分布,但不同季节各驱动因子的作用力仍存在差异。夏、秋季节作为旅游旺季,路网(X4)、河流因子(X7)对旅行者空间分布的作用更为明显,表明景观可达性的提高会增加旅行者游览机会,进而影响夏秋旅行者活动空间。但在冬、春季节,旅行者活动受到住宿因子(X1)、居民点密度因子(X6)、海拔因子(X8)的作用更大,说明功能完备的设施会对冬春旅行者的集聚起到促进作用。
2.2.3 双因子交互作用探测 根据地理探测器双因子交互作用研究发现:(1)各项探测因子的交互配合对旅行者活动的影响要远大于单项探测因子的作用,对计算结果按作用力大小设置条件格式,颜色越暖则作用力越大。(2)双因子交互作用后影响力增强程度不同。交互作用后按照因子影响力强弱排序前3名分别是X5、X3>X5、X1>X5、X7。见表6。
表6 各驱动因子交互作用探测结果
由表6可知,各项探测因子的交互配合对旅行者活动均表现出双因子增强或非线性增强的正向作用。其中,旅游景点因子与其他探测因子两两交互作用下对旅行者活动影响较强,尤其与餐饮因子(X3)的交互作用最强(0.458),且景点(X5)与其他探测因子交互作用的q值均大于0.320。这主要是因为旅行者在进行旅游活动时,在完成景观观赏同时,往往更注重是否存在可以进行就餐、休息、活动的场所,以满足其休憩游乐的需求。这也进一步说明旅行者活动是由不同驱动因子交互作用的结果,而不是单一因子决定的。此外,河网因子(X7)影响力的增强也说明旅行者在旅游空间的选择时对自然水体景观的倾向性。
以往的研究基于社交媒体数据的主要研究对象是热门旅游城市或者位于城市内的景区,相对于城市旅游目的地,自然旅游目的地旅行者行为研究在数据的获取途径、数据规模等方面受到的限制更多[17,27,39]。因此与学者们广泛采用的Flickr、Twitte、微博等综合性社交平台不同,本研究采用户外旅游“两步路”平台的位置信息数据。与360大众搜索指数比较,“两步路”App使用特征与研究区旅行者的人群特征较为吻合,因此研究结果较为可靠[40-41]。
与传统的以行政边界划定研究区域不同,本研究根据标记点数据的集中程度识别了研究区域,从旅行者角度而非资源角度看待旅游目的地的热点范围。尽管二者会有空间的重合性,但从旅行者角度更能全面反映。这对燕山-塞罕坝国家公园建设中游憩功能区的划分具有参考意义。
旅行者活动表现出明显的空间异质性特征,形成旅行者活动热区27个。这与城市旅游地表现出不同的偏向性。2类旅游地的旅行者足迹均遍布全境,但城市旅游地主要集中于城区范围内,热点分布和数量不仅与旅游资源引力有关,而且还与商业集聚状况,重要文化设施、交通枢纽等密切相关[17,23,39]。而自然旅游地中旅行者围绕旅游景区和设施形成空间聚集。此外,城市旅游地的热点主要集中于城市环境内的自然景观,而自然旅游地旅行者在此类地区表现出对自然景观关注的同时,对于如可汗行宫、影视作品取景点等人文类景观也有相当高程度的关注[42]。
与城市旅游地或者进入稳固期的自然旅游地相对稳定的旅行者分布年际变化不同,研究区域空间集聚性年际变化较为明显,呈现明显“U型”变化,2017、2020年该区域的空间热点分布变化表明即使在稳固期,政治事件、公共卫生事件等也会对景区的知名度和旅行者行为产生明显影响,因此一些人造的节事活动或许可以吸引客流,为景区经营增加空间[42-43]。
旅行者空间分布存在显著的季节性差异,季节变化不仅导致旅行者数量发生变化,空间热点分布也会发生变化,这可能与不同季节适宜的观景休憩点有关系。受到各景点开放时间影响,餐饮、住宿等商业网点运营时间也随之变化。冬、春季旅行者出游活动区域受限,旅行活动热区也更多集中在商业活动密集或人文景观相对比较丰富的地区。夏、秋季节旅行者出行范围扩大,水体景观则受到更多关注。
地理探测器可以很好地适用这种多源数据支撑的研究方式,它能够较好地量化反映出单因子和双因子作用对旅行者活动空间分异的影响权重,对于区域协同发展,优化旅游产业布局具有重要意义。由于指标数据获取存在一定局限性,能够选取评价的指标有限,而旅行者活动空间分异是多种影响因素共同作用的结果,对研究区域的政策、知名度、植被覆盖等方面的指标未能充分参考,所以在后期的研究中需要进一步完善。
在区域一体化发展的背景下,借助ArcGIS空间分析以及地理探测器模型等方法,基于“两步路”平台旅行者活动标记点等各类空间数据,定量分析了一个自然旅游地旅行者活动的时空分布特征及其驱动因素。
首先,通过“两步路”平台数据与360搜索数据趋势对比结果,以及本研究结果的可靠性,验证了此类数据平台可以作为自然旅游地旅行者行为研究的可靠来源,这对采用大数据及地理信息系统研究自然旅游地的旅行者行为具有参考意义。
其次,旅行者活动表现空间异质性特征,形成了27个空间聚类,主要位于塞罕坝景区、乌兰布统景区内,这2个景区分别以森林、草原景观为主,形成明显的资源互补。基于此种方法可知,旅行者在该区域的核心活动区域,同时也为燕山-塞罕坝国家公园功能区确定提供客观依据。
最后,地理空间大数据能够细致的刻画自然旅游地旅行者行为时空变化、趋势及影响因素。例如,自然旅游地的旅行者活动多集中在热门景区,同时受旅游设施的影响,但通过对空间大数据的进一步挖掘可知,旅行者最近邻指数年际变化呈现“U”型曲线形式,且热点区域年际变化明显;一般而言,该区域受自然地理气候条件影响,旅行者活动季节差异明显,主要集中在夏、秋季节,但借助地理空间大数据研究发现,不同季节旅行者到访范围和热点区域均存在一定差异,仅在金莲映日-七星湖-塞罕小镇景点附近形成了具有一定稳定性的热点区域。细致的旅游者行为刻画将为旅游目的地的规划和管理提供更为科学的依据。