马 莉
(广西大学,广西 南宁 530000)
如今,互联网已经成为人们发布、传递和获取信息的重要渠道之一。随着各地互联网络普及率的不断提高以及计算机技术的进步,人们可以通过互联网了解各类旅游信息,旅游网络信息对旅游者的出游决策和出游活动将发挥越来越重要的作用。因此,探讨旅游地网络关注度变化规律,揭示旅游地网络关注度和客流量的关系,对于指导旅游发展的实践具有重要意义。
目前研究网络关注度与旅游客流关系的文献并不多。龙茂兴等在分析四川旅游网络关注度的时空特征的基础上,得到用户关注度的变化特征与现实客流波动变化相映照。黄先开等利用以北京故宫为例,发现了百度关键词和北京故宫实际游客间存在长期均衡关系和格兰杰因果关系。马丽君等利用我国15个主要城市客流量及网络关注度数据构建了游客量与网络关注度的时空相关模型。路紫等认为周内、年内旅游网站访问人数与景区旅游者人数之间存在极高的相关性。可以看出,以上的学者从时间分布、空间分布等不同的角度分析旅游信息流和客流之间的关系,得到的结果也不尽相同,本文将在这些相关研究的基础上,拟就广西旅游网络关注度时间特征,及其与客流的关系进行研究,以揭示两者之间的对应变化规律。
百度指数是以百度网页搜索和百度新闻搜索为基础的免费海量数据分析服务。网络关注度是以网民在百度的搜索量为数据基础,输入关键词,百度指数平台会以曲线图的形式展现关键词在百度网页中搜索频次的加权和,用户可以查询不同日期的搜索数据。
本文首先通过百度指数平台,在全国范围检索能够反映网民对广西旅游关注度的关键词,其中包含“广西旅游”、“广西旅游景点”、“广西旅游攻略”、“广西旅行社”等,检索量排名前四的结果如表1所示,并得到这些关键词在2011年1月至2015年10月搜索指数的平均值。
由表1可知,按照搜索指数平均值的高低排序,“广西旅游”搜索指数的平均值最高,达到776,“广西旅游攻略”、“广西旅游景点”、“广西旅行社”排名依次降低,与它们相关的检索频率最高的词是“广西旅游景点大全”,在百度指数平台输入该关键词,得到其搜索指数的平均值为643,超过了“广西旅游攻略”,排名进入第二。因此,综合考虑搜索指数平均值及相关检索词的频率,确定本文的关键词即为:“广西旅游”、“广西旅游景点大全”、“广西旅游攻略”、“广西旅行社”。网络关注度的数据来源于百度指数平台,本文使用到的2013年1月至2014年12月的每月实际客流量的数据来源于广西统计局的客运量指标,用以反映一定时期的旅客运输量。
表1 广西旅游相关关键词检索量平均值
注:来源检索词反映用户在搜索中心词之前还有哪些搜索需求;去向关键词反映用户在搜索中心词之后还有哪些搜索需求。
将选取的四个关键词2014年1月1日至2014年12月31日的百度用户关注指数值按照星期相加求平均值,得到广西旅游周内网络空间关注度的日均分布情况。如图1,可以看到广西旅游网络关注度高峰在周二,周一和周三居其次且基本持平,自周二开始到周六呈阶梯下降趋势,可以看出多数人都是在周一到周五的工作日期间对网上的广西旅游信息进行网上搜索,而周六、周日放假出行,外出旅游。
图1 2014年广西旅游网络关注度周内日变化趋势图
为了便于对整个年度广西旅游网络搜索量和实际客流量之间的关系进行研究,并且为后续计量经济模型建立奠定基础,本文拟对四个关键词2013年1月至2014年12月的两年的月度数据进行分析,如图2。
图2 2013年-2014年四个关键词年内月变化趋势图
综合四个关键词的月变化,由上可以总结出广西旅游网络关注度的总体变化规律,广西旅游信息搜索的高峰期集中4月、7月和9月,低谷期集中在5月、8月和11月,推测是作为“五一”、暑假、“十一”的客流高峰的前兆反应,即为假期旅游出行提前做好旅游信息搜索的准备,但广西的实际客运量在4月延后的一个月5月却未出现实际客运量的高峰,在7月延后一个月的8月、9月延后的一个月10月如预期出现高峰,同时受到“春节”的影响,2月的实际客流量较高,而3月、6月、11月出现低谷。由此通过变化趋势折线图反应两者之间的关系,它们之间是否真正存在相关关系还需要进一步通过实证进行检验。
由于本文采用的数据为时间序列数据,为了避免伪回归现象的出现,在建立计量经济学模型之前要对序列的平稳性进行单位根检验。为了消除时间序列中的异方差,对序列“广西旅游”网络关注度、“广西旅游景点大全”网络关注度、“广西旅游攻略”网络关注度、“广西旅行社”网络关注度、广西实际客流量的数据做对数处理,并分别设定变量为X1、X2、X3、X4、Y,依据AIC原则以最小值确定最佳滞后阶数为3阶,进行平稳性检验,单位根检验结果如表2所示。
表2 各变量的单位根检验结果
注:c表示含常数项,t表示含趋势项,p表示滞后阶数。
由上表检验结果可知,这五个变量中,“广西旅游攻略”网络关注度(X3)的原序列是平稳序列,为0阶单整,而广西实际客运量(Y)、“广西旅游”网络关注度(X1)、“广西旅游景点大全”网络关注度(X2)、“广西旅行社”网络关注度(X4)的原序列是不平稳的,一阶差分序列是平稳的,为1阶单整,符合进行协整检验的同阶单整的前提条件。
虽然一些经济变量本身是非平稳序列,但是,它们的线性组合却有可能是平稳序列,协整检验的目的就是决定一组非平稳序列的线性组合是否具有协整关系,即长期均衡关系。由上述单位根检验表明,x1、x2、x4、y四个变量符合协整检验的条件,采用JJ检验法对这四个变量进行协整检验,得到迹统计量为76.04971,5%显著水平的临界值为47.85613,迹统计量大于临界值,且P值为0.0000小于0.05,表明变量间至少存在一个协整关系,为了检验协整关系的正确性,检验VAR(3)模型是否稳定,采用AR根图表检验,得到AR特征根的倒数绝对值小于1,位于单位园内,表明VAR(3)模型是稳定的,协整关系存在。由此可以得出结论,广西的实际客流量和“广西旅游”网络关注度、“广西旅游景点大全”网络关注度、“广西旅行社”网络关注度之间存在着动态均衡的关系,它们之间是否存在因果关系,因果关系的方向如何还需要进一步做格兰杰因果关系检验。
格兰杰因果关系检验不是检验逻辑上的因果关系,而是看变量间的先后顺序,是否存在一个变量的前期信息是否会影响另一个变量的当期,即广西旅游(X1)、广西旅游景点大全(X2)、广西旅行社(X4)三个关键词前期的百度信息搜索,是否会影响到广西实际客运量的变化,或者广西实际客运量是否会影响三个关键词的网络搜索量变化。由之前的协整检验,得到了y、x1、X2、x4之间存在协整关系,因此可以对y和x1、x2、X4进行格兰杰因果关系检验,检验结果如表3。
结合F检验和P值,从上表可以看出,当滞后期为2期、3期时,广西旅游网络信息流和广西的实际客流量两者不存在因果关系;滞后期为1期时,广西实际客流量对“广西旅游景点大全”网络关注度影响显著,P值为0.0979小于0.1,在10%的显著水平下拒绝原假设,得到结论:广西实际客流量是“广西旅游景点大全”网络关注度的格兰杰原因,两者只存在单向因果关系,表明前1期(前一个月)广西实际客流量对当期(当月)“广西旅游景点大全”的网络信息关注度是有影响的,而其他关键词的网络关注度与广西实际客流量并没有因果关系。
本文基于2013年1月至2014年12月“广西旅游”、“广西旅游景点大全”、“广西旅游攻略”、“广西旅行社”等百度关键词搜索数据,利用计量经济学中的协整理论和格兰杰因果关系理论,分析了广西旅游网络关注度的时间分布特征,以及广西实际客流量和网络关注度之间的关系,得出了以下主要结论:
第一,广西旅游网络关注度周内变化体现在高峰在周二,自周二开始到周六呈阶梯下降趋势,而周六网络信息的关注度达到最低。
表3 广西不同滞后期的旅游网络信息流和
第二,广西旅游网络关注度年内变化表现为高峰期出现在4月、7月和9月,低谷期出现在5月、8月和11月,但广西的实际客运量在4月延后的5月却未出现实际客运量的高峰,在7月延后的8月、9月延后的10月出现高峰。
第三,广西的实际客运量和“广西旅游”网络关注度、“广西旅游景点大全”网络关注度、“广西旅行社”网络关注度之间存在着长期均衡关系。
第四,广西实际客运量是“广西旅游景点大全”网络关注度的格兰杰原因,而其他关键词的网络关注度与广西实际客运量并没有因果关系。
[1] 龙茂兴,孙根年,马丽君等.区域旅游网络关注度与客流量时空动态比较分析——以四川为例[J].地域研究与开发,2011,30(3):93-97.
[2] 黄先开,张丽峰,丁于思.百度指数与旅游景区游客量的关系及预测研究——以北京故宫为例[J].旅游学刊,2013,(11):93-100.
[3] 马丽君,孙根年,黄芸玛等.城市国内客流量与游客网络关注度时空相关分析[J].经济地理,2011,31(4):680-685.
[4] 路紫,赵亚红,吴士锋等.旅游网站访问者行为的时间分布及导引分析[J].地理学报,2007,62(6):621-630.