(安徽师范大学 地理与旅游学院,安徽 芜湖 241000)
大数据时代,互联网提供了海量数据,成为人们获取信息的重要途径。截至2016年12月,中国网页数量为2360亿个,年增长率为11.2%;中国网民数量为7.31亿,网民普及率达53.2%,其中手机网民数量为6.95亿,占比高达95.1%[1];中国在线旅游度假市场交易规模为962.9亿元,在整体在线旅游市场中的占比为16.3%[2]。互联网已成为人们熟悉和掌握旅游目的地信息的重要途径。因此,基于网络搜索数据的网络关注度成为旅游研究的热点问题,对推动互联网与旅游业融合发展,实现“互联网+旅游”大数据发展新模式具有重要参考价值。
国外学者基于网络搜索数据的研究成果较丰硕,主要集中在旅游者网络搜索行为特征及其影响因素[3,4]、城市旅游者的信息需求[5,6]、旅游城市酒店客房需求的预测[7]、旅游目的地游客量的预测[8-10]、网络搜索平台预测能力[11,12]等。国内学者基于百度搜索数据对网络关注度的研究主要表现在:①旅游目的地网络空间分布特征。林志慧等提出旅游景区网络关注度呈“平日高、周末低”的周内特征与“高双峰”的季节性特征[13];徐凡等表明长三角5A级景区网络关注度呈周内“日前兆”、月内“月前兆”、黄金周“井喷”现象[14];何小芊等发现温泉旅游网络关注度呈月内“U”型、周内“V”型曲线变化趋势[15];严江平等强调东、中、西部省份网络关注度差异显著,西部省份的差异最为明显[16];邹永广等表示我国旅游安全网络关注度呈现上升态势,旅游高峰期会产生“前兆效应”[17]。②网络关注度与实际游客量的相关性分析。龙茂兴等、马丽君等证实旅游网络关注度与现实游客量之间存在显著的积极相关性[18,19];黄先开等运用协整理论和格兰杰因果关系,发现含百度关键词的预测模型更为精确[20];孙烨等则提出移动端百度指数模型对客流量的预测结果比PC端更为精确[21]。③居民旅游需求的时空特征。马丽君和龙云研究发现湖南省居民对单个景区的旅游需求类型包括单峰、双峰和多峰,空间上表现为“多中心”分布[22];马丽君和郭留留在此基础上增加了“W”型和“U”型旅游需求类型,空间上呈“春旅东、夏游北、秋赏西、冬观南”的特征[23]。④网络关注度的影响因素。诸多研究表明气候舒适度[24]、负面事件[25]、网络发达程度[17]等均对旅游网络关注度产生了较强的作用。
综观国内外研究进展,尽管基于百度搜索数据的研究成果较多,但对主题公园网络关注度和不同客户端网络关注度的比较研究少,将两者相结合的研究鲜见。因此,本文以芜湖方特为例,采用日际变动指数、R指数、G指数、季节指数等方法对比分析了芜湖方特4个园区PC端和移动端网络关注度的分布特征及其与实际客流量的关系,有助于丰富主题公园与网络关注度的相关研究,并为不同主题公园的运营管理、网络市场营销及客流量预测与调控提供决策依据。
百度指数(Baidu Index)是基于网页搜索的网民行为数据分享平台,主要用于揭示某一关键词在过去某段时间中的“媒体关注度”和“用户关注度”,已成为大数据时代最为重要的统计分析平台和众多企业营销决策的重要依据。
本文以芜湖方特欢乐世界、方特梦幻王国、方特水上乐园和方特东方神画4个园区为研究对象。由于各园区开业时间存在先后差异,最新一期的芜湖方特东方神画开业时间是2015年,为保证数据的相对完整性,选取芜湖方特2016年的相关数据进行研究。在百度指数搜索页面中依次输入“芜湖方特欢乐世界”、“芜湖方特梦幻王国”、“芜湖方特水上乐园”、“芜湖方特东方神画”四个关键词,分别获取2016年1月1日至2016年12月31日PC端和移动端逐日网络搜索指数趋势数据,探究芜湖方特及其4个园区PC端与移动端网络关注度的分布特征,揭示芜湖方特PC端、移动端网络关注度与实际客流量之间的关系。
日际变动指数:日际变动指数用于测量目的地客流量的日际变动规律,是根据马耀峰等提出的月际变动指数[26]修正而来。本文用于分析芜湖方特年内逐日网络关注度的波动特征,计算公式为:
式中,Wυ为年内网络关注度的日际变动指数;xi为年内某日的网络关注度。以100%作为基准值,年内各日际变动指数值越接近于基准值,表明年内网络关注度日际差异较小;反之,网络关注度日际差异较大。
R指数:R指数是周内各日比例的标准差,本文用于反映芜湖方特网络关注度的周内波动程度。计算公式为:
G指数:G指数是周内客流分布的偏度指数,由反映客流分布的Gini系数[27]修正而来。本文用于揭示芜湖方特网络关注度周内分布的集中性。计算公式为:
式中,fi为周内第i天的网络关注度比值。G指数取值分布于[-6/7,0],表明网络关注度分布偏向周时段前期;G指数取值为0,表明网络关注度为对称分布;G指数取值分布于[0,6/7],表明网络关注度分布偏向周时段后期。
季节指数:季节指数用于分析客流量年内变化特征,包括季节强度指数和季节变动指数。本文用于表示芜湖方特以月为研究单元的网络关注度特征。
季节强度指数计算公式为:
式中,Rm为旅游季节强度指数;xk为年内第k月的网络关注度比值。Rm值越大,表明网络关注度季节性差异越显著;Rm越接近于0,表明网络关注度分布越均匀。
季节变动指数计算公式为:
式中,Sk为旅游季节变动指数;Xk为年内k月的网络关注度。Sk值越接近于基准值100%,表明网络关注度的月分布越均匀,季节性越弱;反之,网络关注度的季节性越强。
芜湖方特日时段总体特征分析:为了预测芜湖方特主题公园的日游客量,调控其合理承载量,分析其日际网络关注度波动特征显得尤为重要。根据式(1)计算芜湖方特年内总体日际变动指数,见图1。芜湖方特PC端网络关注度年内总体日际变动指数曲线的制高点为8月4日,制低点为1月17日;移动端的制高点为8月4日,制低点为1月28日,这可能与8月份处于暑假假期、1月份天气寒冷相关。在清明节、劳动节、端午节、国庆节期间,芜湖方特PC端网络关注度总体日际变动指数曲线的制高点依次为4月1日、4月29日、6月8日、9月30号,处于假期之前;移动端的制高点依次为4月2日、4月30日、6月10日、10月3日,处于假期中段,表明芜湖方特PC端网络关注度日际变动特征与李山等提出的景区网络关注度存在周内“日前兆”效应[28]相吻合,而移动端弱化了网络关注度的“日前兆”效应[16]。
图1 芜湖方特PC端与移动端网络关注度日际变动指数
芜湖方特PC端与移动端网络关注度日际变动指数曲线波动趋势相近,但在春节、国庆节、暑假期间呈现出移动端网络关注度日际变动指数显著高于PC端的特征,其他时间段基本为小幅度上下波动。这表明移动端在人们出游过程中依然扮演着重要的角色,游客在节假日出游时更倾向于使用移动端搜索旅游目的地相关信息,与移动端相对便携性的特点密切相关。同时,芜湖方特PC端与移动端网络关注度日际变动指数在假期期间呈高度集中状态,出现“井喷”现象,五一劳动节、十一国庆节和暑假假期前后的网络关注度差距较大。
芜湖方特及其4个园区的日时段波动特征分析:根据式(1)计算芜湖方特及其4个园区的年内日际变动指数,比较分析芜湖方特及其4个园区日际变动指数波动值的变化情况见表1。芜湖方特PC端网络关注度的日际波动指数最大值、最小值分别为2.61、0.37,波动值为2.24;移动端网络关注度的日际波动指数最大值、最小值分别为3.07、0.26,波动值为2.81,波动幅度明显高于PC端,表明芜湖方特移动端的网络关注度比PC端更集中。芜湖方特水上乐园的日际变动指数波动最大,PC端波动值为3.91,移动端的波动值为5.91,分别高于方特欢乐世界的2.66、2.43,方特梦幻王国的1.95、5.80和东方神画的1.85、3.00,表明不论是PC端还是移动端,方特水上乐园的网络关注度均比其他3个园区更集中,这与其仅在每年5月30—8月31日的营业时间有关。芜湖方特东方神画PC端网络关注度的日际变动指数波动值最小,方特欢乐世界移动端网络关注度的日际变动指数波动值最小,表明方特东方神画PC端与方特欢乐世界移动端的网络关注度较分散,这可能与PC端、移动端的使用率有关。2014年,我国手机使用率为83.4%,首次超过PC端,手机成为第一大上网终端[29],而方特欢乐世界、方特东方神画分别于2007年、2015年开业,表明人们搜索方特欢乐世界相关信息更多地依赖于PC端,而方特东方神画则更多地依赖于移动端。
表1 芜湖方特4个园区网络关注度日际变动指数波动值比较
芜湖方特周时段总体特征分析:为研究芜湖方特主题公园网络关注度月内、年内变化特征,观察网络关注度周内变化特征成为前提。我们将2016年芜湖方特PC端和移动端的网络关注度数据按照星期相加求均值,得到年度周内网络关注度的日均分布情况(图2)。除周二外,PC端网络关注度自周一至周五出现小幅度上升,周五达到最高,这符合人们常常在工作日使用PC端搜索信息的习惯,而且越是接近周末,人们的出游意愿越强烈,网络搜索量会随之增加,以便于周末的直接出游。周六、周日的网络关注度处于下降状态,周日最低,这是由于人们出游PC端携带的不便性以及处于游玩状态的游客对旅游目的地信息搜索频率减少引起的。移动端网络关注度自周一至周三出现小幅度下降,周三达到最低,这与人们在工作状态中较少使用移动端有关。周四至周六呈上升态势,周日由于已出游网络关注度有所下降,但仍然高于周一至周四的网络关注度。移动端周内日均网络关注度均高于PC端,表明随着互联网的普及、移动端的易携带与易使用性,人们更愿意使用移动端进行网络搜索。综上所述,PC端周内网络关注度呈“工作日高,周末低”的特征,移动端呈“工作日低,周末高”的特征,且移动端周内日均网络关注度始终高于PC端。
图2 芜湖方特PC端与移动端网络关注度周内日均值变动趋势
芜湖方特及其4个园区周时段集中性分析:根据式(2)、式(3)计算周内各日比例的标准差指数、周内分布偏度指数,进一步探析芜湖方特及其4个园区网络关注度的周内分布情况(表2)。芜湖方特PC端网络关注度的R值为0.0116,高于移动端的0.0068,表明芜湖方特移动端的网络关注度分布较均匀;芜湖方特PC端网络关注度的G值为-0.0304,移动端为0.0166,表明芜湖方特PC端的网络关注度偏向周时段前期,移动端的偏向周时段后期。芜湖方特4个园区PC端的R值分布为0.0095—0.0134,其中方特水上乐园的值最小,方特欢乐世界的值最大,表明方特水上乐园网络关注度分布较均匀、方特欢乐世界最为失衡;G值均小于0,表明芜湖方特4个园区PC端的网络关注度主要分布在周时段前期,其中方特欢乐世界最偏向周时段前期,方特东方神画周时段前期的偏向度最低,发现方特欢乐世界PC端网络关注度分布最失衡且最偏向周时段前期。芜湖方特4个园区移动端的R值分布为0.0057—0.0124,其中方特欢乐世界的值最小,方特梦幻王国的值最大,表明方特欢乐世界的网络关注度分布最均匀、方特东方神画最失衡;G值均大于0,表明芜湖方特四个园区移动端的网络关注度主要分布在周时段后期,其中方特东方神画最偏向周时段后期,方特欢乐世界周时段后期的偏向度最低,表明方特东方神画移动端网络关注度分布最失衡且最偏向周时段后期,方特欢乐世界分布最均匀且最不偏向周时段后期。
表2 芜湖方特4个园区网络关注度周内时间分布指标
芜湖方特月时段总体特征分析:为研究芜湖方特主题公园网络关注度的季节性问题,将2016年芜湖方特PC端和移动端的网络关注度数据按照月相加求均值,得到年内网络关注度的月均分布情况(图3)。芜湖方特PC端的网络关注度月均值始终低于移动端,但它们的网络关注度月均分布变化趋势相近,4月和8月均为高峰期,5月、9—11月均为低谷期,表现出网络关注度月均变动的季节性。1—4月、6—8月网络关注度月均值呈上升趋势,可能受到天气回暖、学生暑假的影响;5月天气渐热,9—11月暑期结束,人们出游需求下降,网络关注度月均值呈下降趋势;12月为年末,人们开始为新的假期出游做准备,网络关注度月均值略有增加。
图3 芜湖方特PC端与移动端网络关注度总体月均值变动趋势
芜湖方特及其4个园区的月时段季节特征分析:根据式(4)、式(5)计算旅游季节强度指数与旅游季节变动指数,明确芜湖方特及4个园区网络关注度的季节变动特征。芜湖方特PC端与移动端网络关注度的旅游季节强度指数值分别为8.2467、8.2468,表明芜湖方特PC端与移动端网络关注度的旅游季节性差异显著。以100%为基准线,根据旅游季节变动指数(图4)可见,4个园区PC端与移动端网络关注度的旅游季节变动指数变化十分显著。从PC端分析,尽管方特欢乐世界、方特梦幻王国和方特东方神画5月旅游季节变动指数略有下降,但4—9月位于基准线之上,表明这3个园区自4月份进入旅游旺季,9月结束;11月—次年1月为旅游淡季,其他月份为旅游平季。而方特水上乐园的旅游旺季为5—8月,即其营业时间。从移动端分析,方特欢乐世界除5月份外, 3—9月均位于基准线之上,表明该园区从3月进入旅游旺季,9月结束;方特梦幻世界、方特东方神画的旅游旺季依次为7—10月、4—9月;11月—次年1月为这3个园区的旅游淡季,其他月份为旅游平季。方特水上乐园的旅游旺季为6—8月。同时,芜湖方特4个园区PC端与移动端的网络关注度季节高峰为7—8月,表现出明显的淡旺季差异。
图4 芜湖方特4个园区PC端与移动端网络关注度的季节变动指数
旅游目的地网络关注度反映了旅游者或潜在旅游者对该地的关注度与出游倾向,可作为旅游目的地实际游客量的预测指标[30]。本文以网络关注度为自变量,实际客流量为因变量,探索芜湖方特PC端和移动端网络关注度与实际客流量之间的关系,为主题公园的客流量预测提供依据。
以2016年芜湖方特欢乐世界、方特梦幻王国、方特水上乐园、方特东方神画PC端的月网络关注度与芜湖方特的月客流量作为基础数据,构建4个园区的PC端月网络关注度与芜湖方特月客流量之间的回归方程。其中,x1、x2、x3、x4依次表示芜湖方特欢乐世界、方特梦幻王国、方特水上乐园、方特东方神画PC端的月网络关注度;Y1表示芜湖方特的月客流量。芜湖方特PC端的回归方程为:
Y1=-9.9971+2.0473x1+1.1185x2-0.4179x3-1.2927x4
(6)
式中,R=0.9120,R2=0.8318,表明芜湖方特月客流量与芜湖方特4个园区PC端的月网络关注度高度吻合,解释率达到91.20%。当方特欢乐世界或方特梦幻王国PC端月网络关注度每增加1个单位,芜湖方特月总体客流量会增加2.0473万人次或1.1185万人次;当方特水上乐园或方特东方神画PC端网络关注度每增加1个单位,芜湖方特月总体客流量会减少0.4179万人次或1.2927万人次。这表明方特欢乐世界、方特梦幻王国PC端月网络关注度对芜湖方特月客流量产生积极作用,方特水上乐园、方特东方神画则产生消极作用,主要与方特水上乐园和方特东方神画PC端营销力度不足、方特水上乐园5—8月的固定营业时段以及方特东方神画开业时间较短有关。同时,芜湖方特4个园区PC端月网络关注度对芜湖方特月客流量的作用强度由大到小依次为方特欢乐世界、方特梦幻王国、方特水上乐园、方特东方神画。
以2016年芜湖方特欢乐世界、方特梦幻王国、方特水上乐园、方特东方神画移动端的月网络关注度与芜湖方特的月客流量作为基础数据,构建4个园区移动端月网络关注度与芜湖方特月客流量之间的回归方程。其中,x5、x6、x7、x8依次表示芜湖方特欢乐世界、方特梦幻王国、方特水上乐园、方特东方神画PC端的月网络关注度;Y2表示芜湖方特的月客流量。芜湖方特移动端的回归方程为:
Y2=-11.7485+0.1843x5+0.6229x6+0.2358x7+0.6722x8
(7)
式中,R=0.9046,R2=0.8183,表明芜湖方特月客流量与芜湖方特4个园区移动端的月网络关注度存在显著相关关系,解释率达到90.46%。当方特欢乐世界、方特梦幻王国、方特水上乐园、方特东方神画移动端网络关注度增加1个单位,芜湖方特月总体客流量分别会增加0.1843万人次、0.6229万人次、0.2358万人次、0.6722万人次。这表明芜湖方特4个园区移动端月网络关注度对芜湖方特月客流量均产生促进作用,作用强度由大到小依次为方特东方神画、方特梦幻王国、方特水上乐园、方特欢乐世界。
以2016年芜湖方特PC端、移动端的月网络关注度与芜湖方特的月客流量作为基础数据,构建芜湖方特PC端、移动端月网络关注度与芜湖方特月客流量之间的回归方程。其中,x9、x10分别表示芜湖方特PC端、移动端的月网络关注度;Y3表示芜湖方特的月客流量。芜湖方特的回归方程为:
Y3=-12.5261+0.5913x9+0.9817x10
(8)
式中,R=0.8910,R2=0.7939,表明芜湖方特月客流量与芜湖方特PC端、移动端的月网络关注度密切相关,解释率达到89.10%。当芜湖方特PC端、移动端月网络关注度增加1个单位,芜湖方特月总体客流量分别会增加0.5913万人次、0.9817万人次。这表明芜湖方特PC端与移动端的月网络关注度均对芜湖方特月客流量产生正向作用,且移动端月网络关注度的积极影响显著高于PC端。
本文选取2016年芜湖方特PC端和移动端逐日网络搜索指数趋势数据,运用日际变动指数、R指数、G指数、季节指数等方法,从网络关注度的日际、月际和年际变化视角,分析芜湖方特不同客户端百度指数的网络关注度分布特征,并探索其与实际客流量之间的关系,得出如下结论:①芜湖方特PC端与移动端网络关注度总体日际变动指数曲线波动趋势相近,但移动端网络关注度日际变动指数在春节、国庆节、暑假期间显著高于PC端;在清明节、劳动节、端午节、国庆节期间,芜湖方特PC端网络关注度日际变化存在周内“日前兆”效应,而移动端弱化了网络关注度的“日前兆”效应。从芜湖方特4个园区的日际波动情况来看,不论是PC端还是移动端,方特水上乐园的网络关注度最集中,方特东方神画PC端与方特欢乐世界移动端的网络关注度较分散。②芜湖方特移动端总体周内日均网络关注度始终高于PC端,PC端网络关注度周内呈“工作日高、周末低”特征,移动端呈“工作日低、周末高”特征。从芜湖方特4个园区周内集中性来看,方特欢乐世界PC端网络关注度分布最失衡且最偏向周时段前期,方特东方神画移动端网络关注度分布最失衡且最偏向周时段后期,方特欢乐世界移动端网络关注度分布最均匀且最不偏向周时段后期。③芜湖方特PC端网络关注度的月均值始终低于移动端,但两客户端网络关注度总体月均分布变化趋势相近,高峰期均在4月和8月。从芜湖方特4个园区季节性特征来看,方特欢乐世界、方特梦幻王国和方特东方神画PC端网络关注度的旺季均为4—9月,方特水上乐园为5—8月;移动端网络关注度的旺季依次为3—9月、7—10月、4—9月、6—8月,且4个园区PC端与移动端的网络关注度季节高峰均为7—8月。④芜湖方特月客流量与芜湖方特4个园区PC端、移动端的月网络关注度密切相关,PC端月网络关注度对芜湖方特月客流量的作用强度由大到小依次为方特欢乐世界、方特梦幻王国、方特水上乐园、方特东方神画,移动端则为方特东方神画、方特梦幻王国、方特水上乐园、方特欢乐世界。芜湖方特月网络关注度与月客流量存在显著相关关系,且芜湖方特移动端月网络关注度对芜湖方特月客流量的积极影响显著高于PC端。
本文基于PC端和移动端百度指数探析了芜湖方特及其4个园区不同客户端网络关注度的分布特征,揭示其与实际客流量的关系,能拓展主题公园的研究视角,对主题公园制定、实施不同客户端的针对性营销,推动主题公园可持续发展具有较强的实际意义。但研究中也存在着不足,如仅以“芜湖方特欢乐世界”、“芜湖方特梦幻王国”、“芜湖方特水上乐园”、“芜湖方特东方神画”为搜索关键词,有待确定能否全面准确展现出旅游者对芜湖方特的网络关注度。此外,地区互联网发达程度、网民规模等因素也会影响网络关注度,使其与实际客流量之间存在不稳定的相关性,将在后续研究中加以完善。