张斌儒,王 浩,张超锋,胡 蓉
(四川文理学院数学与财经学院,四川达州635000)
①基于网络搜索数据的旅游需求预测研究进展
张斌儒,王浩,张超锋,胡蓉
(四川文理学院数学与财经学院,四川达州635000)
摘要:准确预测旅游需求对旅游管理者和决策者分配有限的资源并制定科学的定价策略十分重要.对2009年以后基于网络搜索数据的旅游需求预测相关文献进行评述.结论显示,与基准模型相比,加入网络搜索数据的模型能显著提高预测精度,并对将来进一步研究进行展望.
关键词:网络搜索;旅游需求;预测精度
0引言
随着经济的增长,旅游需求呈现巨大的增长趋势,特别是国家法定节假日的实施使得旅游市场潜力巨大.旅游需求的周期性和不确定性也给旅游管理者提出了挑战.一方面,短期内迅速增长的旅游流不但对景区和航班等造成巨大的负担,旅游饭店的接待能力面临巨大的考验.另一方面,非假期客流骤减,这可能导致部分航班座位空缺,旅游饭店客房闲置,酒店入住率低等情况,使得资源不能得到有效的利用.因此,有必要对旅游需求进行更为精确的短期预测,以最大程度降低各种风险和不确定性事件的发生,同时有利于旅游管理者进行科学决策.
为探究旅游需求建模与预测方法的研究进展,我们在谷歌学术、ScienceDirect、知网等数据库上进行了文献搜索,搜索的时间跨度为2009年1月到2015年3月.删除重复文献滞后识别出与网络搜索数据相关的旅游需求建模与预测相关的20篇文献.2008年以前很多学者对旅游需求预测相关的文献进行了评述,包括Law 等(2007),[1]Crouch(1994),[2]Li等(2005),[3]Song和 Li(2008).[4]他们的主要工作集中在对模型和预测方法的评述上,本文主要对2009年以后利用网络搜索数据进行旅游需求预测相关的文献进行评述,从中识别出研究空白,为将来进一步研究提供必要的指导.
1研究方法与进展
1.1传统预测方法
在经典文献中学者主要采用两类方法进行旅游需求预测.第一类为时间序列或统计的方法,[5]比如线性回归,指数平滑法以及自回归模型.第二类主要包括人工智能的方法,比如人工神经网络,灰色理论,遗传算法,蒙特卡洛模拟等方法.[6-8]传统的时间序列模型以及相关模型发展很成熟并且广泛应用于旅游需求预测,其预测能力优于其他方法.计算机技术的飞速发展促进了人工智能方法在旅游需求中的应用.当预测变量与被预测变量之间的关系为非线性的时候,神经网络法非常有用.近几年也有学者利用支持向量回归、随机森林等方法预测旅游需求.[9]
尽管如此,这些预测方法有其局限性.首先,时间序列和统计分析方法依赖于一致的历史模式和稳定的经济结构.一旦发生剧烈的经济结构突变甚至大规模的一次性事件可能会降低模型的预测能力,况且历史数据的发布具有一定的滞后性.其次,人工智能方法复杂费时费力,并且需要大量的训练数据.因此,有必要引进更有预测能力的预测变量来克服其缺陷.
1.2利用网络搜索数据预测社会经济活动
截至2014年6月,我国搜索引擎用户规模达50749万人,网民使用率为80.3%,是中国网民的第二大互联网应用;同时手机搜索引擎用户规模达40583万人,手机网民使用率达到77%,是除手机即时通信以外的第二大手机应用(中国国家旅游局旅游统计).因此,随着信息技术的发展以及互联网的普及,网民会在搜索引擎上搜索相关信息,他们在互联网上的各种行为产生了丰富的数据,我们可以通过各种手段对这些数据进行追踪,从而产生了新的研究方向:基于网络搜索数据对经济活动等进行预测.
事实上,搜索引擎数据已经被应用于商业,金融,经济等预测领域.Choi 和 Varian(2009)通过实证表明谷歌查询数据对预测美国汽车销量,住房销售以及旅游趋势等方面有很大的价值.[10]由于Choi 和 Varian在2009年所做的开创性工作,Ginsberg等(2009)利用搜索引擎数据进行流行病预测,他们的预测模型能够提前两周探测到流行病爆发.[11]网络搜索数据也能用于一般的经济活动预测,比如失业率预测,[12]消费预测以及电影票房预测等.[13,14]学者们的探索有力证实了网络搜索数据在预测各种经济活动的价值.
1.3利用网络搜索数据预测旅游需求
近几年,一些学者利用网络搜索数据进行旅游需求预测,被预测变量包括景区客流、饭店接待人数、酒店入住率等.比如Choi 和 Varian (2012)应用谷歌趋势数据预测来自9个不同国家的来港游客量.通过将网络搜索数据引入到自回归(AR)模型,他们发现模型能得到好的拟合度,预测精度很高.[15]Pan等(2012)使用谷歌搜索查询数据预测美国查尔斯顿旅游需求.他们通过引入与旅游目的地相关的查询数据到带有外生变量的自回归移动平均模型(ARMAX),预测结果表明引入搜索引擎数据降低了平均绝对百分比误差(MAPE),对预测客房需求有着显著的贡献.[16]Yang等(2015)利用搜索引擎查询数据预测了中国旅游目的地海南的游客流量,比较了谷歌趋势和百度指数的预测能力.结果显示,对于中国来说,百度指数提供的网络搜索数据具有更好的预测精度.在该文中作者使用了四阶段过程进行关键词选择与过滤,并使用综合加权法进行了指数合成,遗憾的是没有说明合成指数是否最具有预测能力.[17]
预测酒店接待人数和酒店入住率十分重要,精确预测对酒店管理者分配有限的资源和制定定价策略十分重要(Weatherford and Kimes 2003).[6]Pan(2012)引入谷歌周度搜索数据预测酒店客房需求,结论认为谷歌搜索数据能提高预测精度,而谷歌搜索数据所需成本很低.[16]Yang等(2014)应用目的地营销组织的网络流量数据预测该目的地的酒店需求,结果显示与基准模型相比,基于ARMAX的模型预测精度得到了显著提高.[18]
国内学者在该领域也做了探索性的研究.黄先开等(2014)以北京故宫为例,探讨了百度指数提供的网络搜索数据与景区游客量之间的关系,并对景区游客量进行预测,结果表明加入百度指数提供的网络搜索数据能提高模型的预测精度.[19]王炼和贾建明(2014)结合黄金周期间景区的游客数据和网络搜索数据,探讨了网络搜索数据在旅游需求预测中的作用.实证结果显示两者之间存在正相关关系,相对于基准模型,基于网络搜索数据的模型能显著提高旅游需求预测的精度.[20]任乐和崔东佳(2014)以北京市国内游客流量为例,揭示了网络搜索数据与游客之间的相关关系.误差修正模型表明加入网络搜索数据有效提高了预测精度.[21]张斌儒等(2015)利用百度指数提供的关键词数据预测海南省月度旅游收入,与基准模型相比,提高了预测精度.[22]Prosper 和 Ryan (2015)基于谷歌搜索数据利用混合频率抽样回归对加勒比海地区的旅游需求进行了预测,结果显示预测精度显著提高.[24]
从以上文献我们可以看出:与传统预测方法相比,引入网络搜索数据作为预测变量能得到更为精确的预测,但基于网络搜索数据的预测仍然在探索阶段,主要体现在关键词的选择与过滤方面、指数合成方法以及模型选择等.
2结论与展望
2.1数据频率
学者主要使用周度或月度搜索数据,较少使用日度数据.事实上,大多学者使用了季度或月度数据,因为这些数据可获得性强.而更高频率的数据的优点是能为旅游需求趋势提供实时性的信息.尽管如此,大多研究中使用搜索数据预测旅游需求会产生两个问题.首先,更高频率的数据很难获得.其次,在某些情况下,我们可能面临多频率或混合频率问题( Fondeur and Karamé(2013)).[23]处理混合频率的一般方法都是将高频率数据简单转化为低频率问题,比如平均加权的方法(Choi and Varian (2012)).[15]然而,这种处理方法会导致高频数据信息的损失.在文献中,只有Prosper & Ryan (2015) 使用了宏观经济研究中常用的混合频率数据处理方法.[24]其实质是对数据进行更为一般的加权转换.
2.2关键词选择与指数合成
一般来说,不同的关键词具有不同的搜索频率,用于模型预测会得到不同的结果.所以关键词的选择与指数合成对模型的预测精度极为重要.尽管如此,如何从成千上万的关键词中进行关键词选择没有一个系统的方法.大多数研究使用人工随机选择十余个关键词作为预测变量.Choi 和 Varian (2009) 搜索关键词“假期目的地/香港”是由于“香港”被收录到谷歌趋势里面的假期目的地的子类别中.[10]Yang 等 (2015) 利用四阶段关键词选择步骤对百度指数和谷歌趋势数据进行关键词选择,最后得到合成指数的关键词.[17]但该方法得到的关键词是否最具预测能力没有说明.
2.3研究空白与展望
从上述文献中可以识别出一些研究空白.首先,目前大多使用百度指数和谷歌趋势数据进行旅游需求预测,除此之外,我们可以将数据来源扩展到博客、微博等利用大数据方法进行研究,探索这些数据对旅游需求的影响并分析游客的行为或进行旅游需求预测.大数据能够弥补调查数据对象的抽样问题的缺陷.使用大数据集能进一步提高预测精度和时效性以及模拟游客的活动,帮助旅游从业者更好的进行管理.其次,我们可以探索系统动态的关键词选择与合成方法,使得更为符合实际应用,预测能力更强.第三,目前利用支持向量回归进行旅游需求预测主要大多建立单变量的模型,在引入关键词数据之后,可以考虑利用多变量的支持向量回归模型进行旅游需求预测.第四,大多旅游需求时间序列具有周期性和季节性的特征,在预测时选择合适的方法进行季节调整会增加预测精度.最后,可以利用大数据集探索旅游周期、预警研究、拐点等主题.总之,与基准模型相比,如何建立模型进行更为精确的预测对学者来说是一种挑战.
参考文献:
[1]Law,R.,Mok,H.and Goh,C.Data Mining in Tourism Demand Analysis:A Retrospective Analysis[M].Berliu:Springer-Verlag,2007:508-515.
[2]Crouch,G.I.The study of international tourism demand:A review of practice[J].Journal of Travel Research,1994(33):41-54.
[3]Li,G.,Song,H.,& Witt,S.F.Recent developments in econometric modeling and forecasting[J].Journal of Travel Research,2005(44):82-99.
[4]Song,H.,and G.Li.Tourism Demand Modelling and Forecasting:A Review of Recent Research[J].Tourism Management,2008(2):203-209.
[5]Song H Y,Witt S.Tourism demand modeling and forecasting[M].Oxford:Pergamon Press,2000:73-74.
[6]Weatherford,L.R.,S.E.Kimes.A comparison of forecasting methods for hotel revenue management[J].International Journal of Forecasting,2003(3):401-415.
[7]Abratt,R.,Nel,D.,Nezer,C.Role of the market maven in retailing-a general marketplace influencer[J].Journal of Business and Psychology,1995(1):31-55.
[8]Andrew W P,Cranage D A,Lee C K.Forecasting hotel occupancy rates with time series models:An empirical analysis[J].Journal of Hospitality & Tourism Research,1990(2):173-182.
[9]Tsaur,R.,Chan,S.Gray support vector regression model with applications to china tourists forecasting in Taiwan[J].international journal of information and management sciences,2014,(25):121-137.
[10]Choi,H.and Varian,H.A.L.Predicting thepresent with Google Trends[J].Economic Record,2009(88):2-9.
[11]Ginsberg,Jeremy,Matthew H.Mohebbi,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009(32):1012-1014.
[12]Askitas,N.,Zimmermann,K.Google econometrics and unemployment forecasting[J].Applied Economics Quarterly,2009(2):107-120.
[13]McLaren,N.,Shanbhogue,R.Using internet search data as economic indicators[J].Bank of England Quarterly Bulletin.2011(2),134-140.
[14]Hand,C.,Judge,G.Searching for the picture:Forecasting UK cinema admissions using google trends data[J].Applied Economics Letters,2012(11),1051-1055.
[15]Choi,H.,Varian,H.Predicting present with google trends[J].Economic Record,2012(S1):2-9.
[16]Pan,B.,D.C.Wu,H.Song.Forecasting hotel room demand using search engine data[J].Journal of Hospitality and Tourism Technology,2012(3):196-210.
[17]Yang X,Pan B,James A,et al.Forecasting chinese tourist volume with search engine data[J].Tourism Management,2015(46):386-397.
[18]Yang,Y.,Pan,B.,Song,H.Predicting hotel demand using destination marketing organization’S web traffic data[J].Journal of Travel Research.2014(5):1-15.
[19]黄先开,张丽峰,丁于思.百度指数与旅游景区游客量的关系及预测研究[J].旅游学刊,2013(11):93-101.
[20]王炼,贾建明.基于网络信息搜索的旅游需求预测-来自黄金周的证据[J].系统管理学报,2014(3):345-350.
[21]任乐,崔东佳.基于网络搜索数据的国内旅游客流量预测研究-以北京市国内旅游客流量为例[J].经济问题探索,2014(4):67-73.
[22]张斌儒,黄先开,刘树林.基于网络搜索数据的旅游收入预测-以海南为例[J],经济问题探索,2015.
[23]Fondeur,Y.and F.Karamé.Can Google data help predict French youth unemployment?[J].Economic Modelling ,2013(30):117-125.
[24]Prosper F.Bangwayo-Skeete,Ryan W.Skeete.Can Google data improve the forecasting performance of tourist arrivals?Mixed-data sampling approach[J].Tourism Management,2015(46):454-464.
[责任编辑范藻]
Tourism Demand Forecasting Based on Web Search Query
ZHANG Binru,WANG Hao,ZHANG Chaofeng,HU Rong
(Mathematics and Finance-Economics School of Sichuan University of Arts and Sciences,Dazhou Sichuan 635000,China)
Abstract:The accurate prediction of the future tourism demand is critical to allocating limited resources and scientific decision-making for tourism manager and decision maker.A large number of review articles related to tourism demand modeling and forecasting have been conducted before 2008.This article mainly aims to review the published papers on tourism demand modeling and forecasting since 2009.The results showed that forecasting model with web search query data can improve forecasting accuracy compared to baseline model,and offer some prospects for further research in the future.
Key words:web search query; tourism demand; forecasting accuracy
收稿日期:①2015-07-01
基金项目:四川革命老区发展研究中心2014年度项目“红色旅游对区域经济发展的影响及策略研究—以达州市张爱萍故居为例”(SLQ2014C-17)
作者简介:张斌儒(1980—),男,四川南江人.讲师,博士研究生,主要从事旅游经济与数量经济研究.
中图分类号:F590
文献标志码:A
文章编号:1674-5248(2016)02-0041-04