基于VECM模型的百度指数与游客接待量关系检验

2017-09-13 10:02段艳林轶张琳艳
现代商贸工业 2017年23期
关键词:客流量格兰杰协整

段艳++林轶++张琳艳

摘要:选取关键词的百度指数和海南游客接待量 2011年3月—2016年2月5年的月度数据进行实证分析。通过对数据进行ADF单位根检验、协整检验、格兰杰因果检验得出:百度指数与游客接待量存在着长期的均衡关系;不同的关键词百度指数与游客接待量存在着不同的格兰杰因果关系。

关键词:百度指数;游客接待量;协整检验;格兰杰因果检验;VECM

中图分类号:F2文献标识码:Adoi:10.19311/j.cnki.16723198.2017.23.010

1引言

在互联网的时代,游客进行旅游决策时,会通过网上进行信息的搜寻、信息的筛选,最后进行旅游决策。许多旅游学者对网络搜索数据与旅游客流量、旅游经济发展等方面进行了相关的研究。基于百度指数的网络搜索数据,对旅游目的地的游客量进行研究,通过阅读大量文献可以发现学者研究主要分为三大类:相关性分析、时空分布特征分析、客流量预测。马丽君等(2011)对30个城市的客流量及游客网络关注度采用了时空相关模型进行了相关性分析,得出游客网络关注度与客流量之间有着密切的关系。王硕等(2013)采用OLS方法构建相关模型,对庐山、华山、八达岭长城风景名胜区的黄金周时间里客流量与网络关注度的变化特征进行了相关性分析。通过百度指数,对旅游目的地的客流量进行预测,对旅游目的地具有较大的作用。汪秋菊,刘 宇(2014)等研究得出可以将网络空间关注度作为客流量预警的先兆指标。黄先开等(2013)、任乐等(2014)等研究得出搜索数据与旅游客流量之间存在协整关系,并建立了旅游客流量预测模型。许多学者基于百度指数,对旅游目的地的时空特征进行了分析。徐凡等(2016)以长三角 5A 级景区为例,采用GIS等方法,分析得出网络关注度在时间上呈现出周内 “日前兆”,月内呈现明显的“月前兆”特征。

本文选取我国最南端的海南省為例。海南省拥有得天独厚的丰富旅游资源,2015年海南接待游客总数5335万人次,同比增长11.4%,旅游总收入达到572亿元,同比增长13%,旅游发展质量不断提升。本文的研究是基于百度指数,以海南的游客接待量和关键词的百度指数为数据,基于VECM模型对海南关键词的百度指数与游客接待量的关系进行检验。

2实证研究

2.1百度指数

百度指数是以百度海量网民行为数据为基础的数据分享平台,是当前互联网乃至整个数据时代最重要的统计分析平台之一。截至2014年,百度指数的主要功能模块非常强大,可以满足不同的需求者。基于单个词的趋势研究(包含整体趋势、PC趋势还有移动趋势)是本文应用的模块。主要运用到搜索指数,搜索指数是以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和。

2.2数据收集

2.2.1旅游数据来源

海南旅游游客接待量(单位:万人次)月度数据来源是海南省旅游发展委员,由于2011年1月和2011年2月的数据缺失,所以所选取的数据为2011年3月至2016年2月的旅游统计月度数据。关键词百度指数来源于百度指数,百度指数PC趋势积累了2006年6月至今的数据,移动趋势展现了从2011年1月至今的数据,所以本次选择了2011年为始的整体趋势指数,数据为2011年3月至2016年2月期间的整体趋势月平均值。

2.2.2关键词的选取

根据游客出游行为,先选取目标初始关键词,通过观察百度指数及站长工具的,首先选取部分关键词作为目标关键词,运用站长工具、站长帮手工具、爱站网,选取“海南旅游”“海南旅游攻略”“海南旅游景点 ”“去海南旅游要多少钱”“去海南旅游必备物品”“海南旅游地图”“海南旅游景点大全”“海南旅游报价”“海南旅游线路”“海南旅游价格”“海南旅游图片”“海南天气”作为基准关键词。再多次通过选取,最后确定“海南旅游”“海南旅游攻略”“海南旅游景点 ”“海南旅游地图”“海南天气”为目标关键词。

2.2.3数据的处理

通过收集到的海南每月旅游游客接待量与关键词的搜索指数月度值的数据整理到Excel里。如图1所示,可以看出海南旅游游客接待量(万人次)与关键词“海南旅游”的搜索指数变化趋势基本一致。游客接待量(万人次)与“海南旅游”百度指数在每年的1月和2月份呈相反趋势,游客在寒冷的1月已经到海南度假,对“海南旅游”的搜索也相应的减少。

通过图1可以看出“游客接待量”有明显的时间趋势,因而提供取对数处理消除时间趋势,把“游客接待量”“海南旅游”“海南旅游攻略”“海南旅游景点 ”“海南旅游地图”“海南天气”分别记为lnJDL、LY、GL、JD、DT、TQ。

2.3.1平稳性检验

本研究采用的数据为时间序列,为防止出现单位根,保证数据序列的平稳性,对时间序列进行平稳性检验,平稳性检验采取单位根ADF( Augmented Dickey - Fuller test)检验,检验如表1。

通过表1可以看出,序列数据进行一阶差分后6个变量在99%的置信水平下单位根皆平稳,拒绝原假设,因而原序列都是一阶单整时间序列 I( 1)。

2.3.2协整检验

原序列都是一阶单整序列,进一步可以通过协整分析检验变量间的长期协整关系,判断变量之间是否存在协整关系,以及存在的协整关系的个数。协整检验有两种,一是适用于大样本变量的E-G两步法检验;二是以VAR模型为基础的基于回归系数的Johansen极大似然法协整检验。由于是确定多变量协整关系,因而采用的是Johansen-Juselius向量误差修正模型(VECM)的分析框架来检验变量之间的协整关系,并确定出协整向量的个数。

首先,建立VAR模型确定最优滞后阶数,从表2可以看出滞后阶数是介于1和3之间,为保证模型的有效性,根据AIC准则,选取最优滞后阶数为3进行协整分析。endprint

进一步来确定通过Johansen检验确定协整个数,结果如表三所示。表3可以看出,协整方程个数为1时,迹统计量58331314和最大特征值统计量27718088均小于5%的临界值,接受存在至多一个协整关系的原假设,变量之间存在协整关系。协整方程为:

lnJDL=00013843LY+00018966GL-00112043JD+00139547DT-00005818TQ-6136019。

协整方程的各个关键词系数估计值表示关键词百度指数对游客接待量的弹性,关键词“海南旅游”、“海南旅游攻略”、“海南地图”百度指数与“游客接待量”有正向的关系,关键词“海南旅游”百度指数的百度指数每个增长1%,游客接待量增长会增长0.0013843%;关键词“海南旅游景点”、“海南天气”与“游客接待量”有反向的关系。关键词“海南旅游”、“海南旅游攻略”、“海南地图”网络搜索的增加使得游客会发现海南旅游的时期会出现拥挤等现象,进而可能使得游客改变去海南旅游的想法,对海南的游客接待量有反向影响。通过协整检验得出关键词的百度指数和游客接待量存在着协整关系。

2.4格兰杰因果检验

协整说明长期稳定关系不一定是因果关系,所以需要进一步通过格兰杰因果检验确定两者的因果关系。

先对VECM模型的稳定性进行检验,采用的是模型残差序列的单位根检验。检验发现t统计值为-3.935,小于99%的置信度水平下的临界值-3.567,所以在99%的置信度水平下是平稳的。

格兰杰因果检验在95%的置信度下可以看出关键词“海南地图”和“海南天气”是引起“游客接待量”的原因,反向并不成立;“游客接待量”是引起关键词“海南旅游”和“海南旅游景点”的原因,反向不成立;而“游客接待量”与“海南旅游攻略”并不存在因果关系。

3结论和探讨

根据实证分析的结果,可以得出以下的结论:

(1)关键词百度指数与游客接待量存在着长期的均衡关系。关键词“海南旅游”、“海南旅游攻略”、“海南地图”百度指数与“游客接待量”有正向的关系;关键词“海南旅游景点”、“海南天气”与“游客接待量”有反向的关系。关键词“海南旅游”、“海南旅游攻略”、“海南地图”网络搜索的增加使得游客会发现海南旅游的时期会出现拥挤等现象,进而可能使得游客改变去海南旅游的想法,对海南的游客接待量有反向影响。关键词存在着长期的均衡关系,并且所产生的正向反向作用不一,海南省可以对关键词进行筛选,然后选择可以促进搜索量增加的并带来游客量增加的关键词进行重点营销。同时,对具有方向作用的关键词海南省可以进一步提高海南的服务质量。

(2)关键词百度指数与游客接待量存在着格兰杰因果关系。95%的置信度下可以看出关键词“海南地图”和“海南天气”是引起“游客接待量”的原因,反向并不成立;“游客接待量”是引起关键词“海南旅游”和“海南旅游景点”的原因,反向不成立;而“游客接待量”与“海南旅游攻略”并不存在因果关系。关键词与游客接待量存在着格兰杰因果关系,海南省可以通过加强排名靠前的关键词的推广,对于最南端的海南省,客源也是来自不同的地方,因而加强关键词的营销就显得非常重要。“游客接待量”与“海南旅游攻略”不存在着因果关系,在对关键词进行营销时,需要对关键词进行筛选,对于不存在着格兰杰因果关系的,可以减少营销。

参考文献

[1]马丽君,孙根年,黄芸玛,周瑞娜. 城市国内客流量与游客网络关注度时空相关分析[J]. 经济地理,2011,(04):680685.

[2]王硕,曾克峰,童洁,刘超. 黄金周风景名胜区旅游客流量与网络关注度相关性分析——以庐山、华山、八达岭长城风景名胜区为例[J]. 经济地理,2013,(11):182186.

[3]任乐,崔东佳. 基于网络搜索数据的国内旅游客流量预测研究——以北京市国内旅游客流量为例[J]. 经济问题探索,2014,(04):6773.

[4]黄先开,张丽峰,丁于思. 百度指数与旅游景区游客量的关系及预测研究——以北京故宫为例[J]. 旅游学刊,2013,(11):93100.

[5]汪秋菊,刘宇. 基于网络关注度的旅游景区客流量预警:研究框架与实证分析——以国家游泳中心水立方为例[J]. 旅游论坛,2014,(05):915+25.

[6]徐凡,尤瑋,周年兴,胡美娟. 基于百度指数的网络空间关注时空分布研究——以长三角5A级景区为例[J]. 资源开发与市场,2016,(04):489493.endprint

猜你喜欢
客流量格兰杰协整
基于嵌入式系统的商场客流量统计算法
格兰杰因果关系在神经科学领域的发展及缺陷
基于AFC数据的城轨站间客流量分布预测
榜单
从客流量推算公交出行PA矩阵的方法
格兰杰因果关系在复杂网络中的应用*
中国居民消费与经济增长的协整关系检验
新建旅游项目客流量分析方法初探
中国资产价格与通货膨胀关系的协整分析