王 振,张志敏,李同飞,高 歌,禚保玲
(1.青岛市城市规划设计研究院,青岛 266071;2.北京工业大学 交通工程北京市重点实验室,北京 100124;3.山东科技大学 交通学院,青岛 266590)
国务院办公厅2018年印发《国务院办公厅关于促进全域旅游发展的指导意见》,提出把促进全域旅游发展作为推动经济发展的重要抓手,以旅游业为优势产业,统一规划布局、优化公共服务、加强综合管理,有利于提升旅游业的现代化、品质化、国际化,不断满足人民日益增长的美好生活需要。青岛,依山而居,与海相伴,是首批中国优秀旅游城市,红瓦绿树、碧海蓝天是城市最典型的特征。目前青岛有110处2A级及以上景区,崂山风景区为唯一的5A级景区,海滨风景区、海底世界、奥帆中心、极地海洋世界、石老人观光园等24处为4A级景区(图1)。全市旅游资源丰富,旅游业不仅是青岛经济的支柱产业,而且旅游服务体系健全,功能全面。
图1 青岛全市A级景区分布
国内外学者以旅游景区为研究对象,通过景区统计数据、手机信令数据、网络数据等多种方式获取客流数据,分析游客出行行为特征和空间分布规律。马斌斌等[1]运用社交网络大数据,运用核密度分析方法揭示旅游流的时空分布特征,揭示了旅游流轨迹和游客行为偏好,为科学规划旅游线路提供了参考;贾铁飞等[2]通过现场访谈获取访沪游客的时间和空间数据,并依此探讨旅游者的空间行为规律;MOU N等[3]以去哪儿网网站中公开的游客网络游记作为初始数据,采集每篇游记的用户ID(Identity Document)、游记ID、出发日期以及游览景点的POI(Point of Interest)序列等信息,并通过一定的规则获取游客游览轨迹;陈方等[4]基于云南省公路包车数据和交通流数据分析全省范围内的旅游OD(Origin Destination)数据,并进行了旅游客流的空间行为模式识别,但忽略了自驾游等散客,样本具有一定的局限性。以上研究均存在样本量低、代表性差、时效性不足等诸多问题。宁志中等[5]分析了2000年以来4个时间截面中国景区时空演变格局,但未考虑景区客流的影响,导致将旅游景区单体简化为空间点后分析的精度和准确性降低。陈圣威等[6]通过建立旅游模型,并与闸机客流、视频客流进行对比,肯定了手机信令数据在游客流量监控上的优势,但同样存在数据采样频率低、交通枢纽区域人流扰动大等问题。许丹丹等[7]基于南京智慧旅游监测平台数据,分析了客流的年度变化、季节变化、时刻变化等不同时间尺度下的来宁客流时间分布特征,但无法进行客流的轨迹追踪,客流分析停留在景区层面上,缺少旅游出行OD的分析。罗秋菊等[8]采用网络游记和照片作为“数字足迹”,提取游客的旅游时间和旅游节点,深度剖析了入滇自驾游客的时空特征,为新数据应用提供了参考。刘泽华等[9]选择云南省典型景区为案例,分析黄金周内客流时间分布特征,并研究了时间分布对区域空间结构的响应机制,但选择不同时长的假期进行实证比较研究,可更好地揭示旅游客流的分布规律。李旭等[10]通过《中国旅游统计年鉴》等数据,建立指标评价体系,利用回归模型分析入境游客目的地选择偏好的主要影响因素。方家等[11]基于上海市手机信令数据对顾村樱花节前后2周的客流进行了对比,并尝试对大客流进行预警和跟踪识别,但缺少个体属性数据,无法显现个体时空行为。旅游客流数据大多来自机构的统计静态数据,缺少出行个体的属性信息,难以回溯个体出行轨迹。因此,本文以2018年十一黄金周期间的手机信令数据为基础,研究游客的轨迹出行链,并以此进行客流的时间和空间分析。
手机信令数据是手机用户在发生通讯活动(通话、短信)或服务区切换(位置移动)等事件时,被运营商的通信基站捕获并记录的数据,通常包含个体ID、时间、空间位置等字段属性,信令记录发生的时间和频率极不规则,与用户的活跃程度密切相关。信令数据空间分辨率多为基站,一般为400~1000 m,时间分辨率则可精确到秒,经脱密、脱敏等处理后可用于居民行为偏好、移动轨迹分析、城镇空间布局等研究。
笔者获取了青岛市全市范围内中国移动用户2018年的手机数据,大小约为200 GB。数据字段主要包括:msid(加密处理后的设备唯一编码)、Cell_ID(基站编号)、LNG(经度)、LAT(纬度)、Timestamp(时间戳)。运用大数据处理平台Hadoop,分析2018年十一黄金周期间手机信令定位数据,得到游客时空分布指标。
手机信令数据反推出行规律的核心在于获取出行链,在算法中设置边界条件,根据一定的判定原则进行筛选,运用多条件联合判定方法提高识别的精度。在具体算法设计上,首先通过吴子啸[12]提到的时空收敛算法得到所有出行个体的出行链数据。针对旅游客流出行链的识别,首先进行数据预处理,包括无效数据、乒乓数据以及漂移数据的识别和剔除。其次针对手机用户进行边界条件的确定和筛选,即边界确认、时间确认、流动人口筛选、过境人口筛选、有效记录筛选等(图2)。
图2 数据处理技术路线
考虑到旅游景区尤其是A级景区一般都相对独立,能够通过既有边界或者道路、山川、河流等围合区域进行界定,因此,只要用户的手机在景区内发生过基站触发,就提取该用户在国庆期间所有的信令数据作为游客出行链备选数据集。同时由于景区范围的开放性和定位误差的存在,景区基站定位的手机用户可能包含周边常住人口、过境人员以及工作人员等非旅游客流,基于此,本研究采取选取特定时段如国庆黄金周,筛除常住人口,仅保留流动人口,剔除信令定位时间连续性较差、定位次数达不到相应阈值的用户等措施进行解决景区定位数据中用户属性为非游客的问题。进一步,通过将游客出行链备选数据集按照空间聚类算法处理后即可得到游客个体出行链。
在具体的数据处理过程中,需要格外注意以下2个方面。考虑到分析对象为外地游客,前期分析成果中属性为常住人口的用户需从游客出行链备选数据集中删掉,在保留的流动人口中,同样存在如商务、就医等不同的出行目的,因此需要将整个国庆期间定位次数小于一定阈值的用户作为非活跃的个体,其与游客自身流动性较大的特征不符,需要将其剔除;针对同一个用户,如果在景区内定位的相邻2条记录时间差大于12 h,则可能为过境客流、通勤客流等,同样需要将其从备选数据集中剔除。
考虑到青岛滨海景区通常为免费的自然岸线资源,分布具有集聚连绵的特点,景区之间边界不明显,游客往往一并游览多个景区,为便于统计分析,将其按照湾区属性划分为青岛湾景区、汇泉湾景区以及浮山湾景区,以下简称三湾区域(图3)。研究以2018年青岛市国庆期间的手机信令数据为基础数据,通过现状用地数据、地图查询等手段划定旅游景区空间边界,运用大数据处理算法进行访青游客的旅游行为空间特征分析。
图3 三湾区域位置分布注:青岛湾景区包含栈桥、海军博物馆、小青岛景区等;汇泉湾景区包含汇泉广场、第一海水浴场、八大关景区、中山公园等;浮山湾景区包含五四广场、奥帆基地、银海大世界等
青岛的景区资源可以分为自然景观类、人文景观类和主题类景区。自然景观类景区集中在沿海一线,如栈桥、太清宫、海水浴场、崂山、小鱼山等;人文景观类以名人故居为主,如沈从文故居,洪深故居等;主题类公园如极地海洋世界、世园会、枯桃花艺生态园等。分析发现,不同类型的景区客流呈现不同的时变特性,如图4所示。自然景观类景区按照距离市区远近可以分为两类,一类位于距离市区较远的郊区,客流分布曲线呈现单高峰形态,峰值一般出现在12:00—14:00,如崂山景区、珠山景区;另一类为位于沿海一线的市区核心位置,双高峰明显,中午由于高温、餐饮等因素,景区客流减少显著,如石老人景区、唐岛湾景区等。主题类景区分为室内和室外两种类型,其中室内主题类景区门票相对较高,吸引的客流多为首次到访,客流高峰时段集中在11:00—13:00,如极地海洋世界;与之相反,室外主题类景区门票相对较低,客流多分布在周边区域,年票、月票占比较高,客流时间分布较为均衡,呈波浪起伏形态,如枯桃花艺生态园。人文景观类景区占地面积较小,同时手机信令基站覆盖范围一般在500 m左右,不能满足对人文景观类景区客流分析的精度要求,故不作分析。
来青游客以观光旅游为主,高端休闲度假发展潜力巨大。基于2018年国庆期间手机信令数据识别的近5万人次游客统计发现,客流主要集中在海岸资源丰富、自然风光优美的三湾区域,约60%的游客会到访栈桥、海军博物馆等青岛湾标志性景区,一半左右的游客在浮山湾和汇泉湾打卡五四广场、八大关、奥帆基地、中山公园等景点,游客在欣赏美丽滨海风景的同时,缺少美好生活的体验,持续性消费和重复消费的可能性较小。以“农家乐”“民宿游”为主的度假游产品较为稀缺,难以把游客“留下来”,统计发现不足1/4的游客会选择游览“海上第一名山”崂山风景区,仅有约13%的游客会经胶州湾海底隧道到达西海岸新区游览“亚洲第一滩”金沙滩景区。
从景区客流空间结构上看,景区空间规划需依托核心景区,按照发展全域旅游的要求,部署基础设施和公共服务设施,配置旅游产品和景区,推进“景城一体化发展”。通过手机信令数据统计发现,目前,3个湾区之间互动效应明显,湾区客流出行量约占全域旅游出行总量的50%以上,其中汇泉湾与青岛湾间的客流出行量最大,约占全域旅游出行量的25%,汇泉湾与浮山湾占比15%,浮山湾与青岛湾占比为10%,如图5所示。从开发模式上看,整个区域需要统筹规划、建设、管理和营销,按照全地域覆盖、全资源整合、全领域互动的原则,深入开展全域旅游建设;但从手机数据统计来看,在3个湾区客流的强大推力下,到访其他景区诸如崂山、青岛极地海洋世界、金沙滩景区的旅游出行量占比仅为7%,6%和5.6%,因此外围景区在强化自身吸引力的同时,需更加注重景区之间的互动作用。
图5 旅游客流交换量分析
游客规模已经不是衡量景区发展的唯一标准,让游客留下来、住下来更是核心要义。目前,青岛城郊游客驻留时间较长,住宿、交通、娱乐、商业设施配套要求较高;城区游客集中在滨海岸线,受岸线保护影响,商业开发难以满足不同层次旅游群体消费需求。分析发现,游客平均访问景区数目为2.42个,在城郊景区如大珠山风景名胜区、青岛羊毛沟花海湿地的平均驻留时间达7 h;浮山湾、青岛湾、汇泉湾景区数量众多,游客多以打卡拍照为主,“上车坐一坐,下车拍一拍”的跟团游体验较差,统计手机信令数据发现,游客目前平均逗留时间约为3 h。
高附加值旅游产品和特色服务项目相对缺乏,留不住客人,消费难以带动。来青游客平均停留2.81 d,较上海市3.13 d来说相对较短[4]。因此,青岛需在大力发展全域旅游的同时,坚持规划先行,在交通设施、机制创新、人才培养和特色产品培育等方面加大投入力度,努力让游客在青“多消费、多逗留”。
基于2018年国庆黄金周期间青岛市手机信令数据,运用Hadoop处理平台得到居民出行的出行链,通过分析景区客流的时间和空间分布特征得到以下结论。
1) 不同类型的景区呈现不同的时变特征,市区优质旅游资源呈现中心化聚集态势,3个湾区之间的旅游出行约占总出行的50%,龙头带动作用显著,但对外围辐射力度不够,导致来青游客驻留时间相对较短,平均为2.81 d,景区线路难以纵深拓展,应多措并举加强景区之间的互动作用。
2) 市郊景区客流呈现单高峰形态,“农家乐”“民宿游”等旅游度假产品较为稀缺,难把游客“留下来”。
3) 与传统方法相比,以手机信令数据为基础,以机器学习等算法为工具具有客观、时效高、成本低的特点,伴随着旅游市场的不断散客化、大众化、网络化,利用旅游个体数据进行旅游时空特征分析研究对于景区管理和理论创新具有重要指导意义。但手机信令数据基站定位精度市区范围在200~500 m之间,相邻景区客流的识别尚不够精确,下一步可结合百度、腾讯等互联网企业基于GPS的位置定位数据(LBS)进一步减小游客定位的误差。