(华侨大学 旅游学院,福建 泉州362021)
旅游安全信息是旅游者出游决策的重要参考,对旅游安全信息的需求也是地区居民旅游安全意识的直接反映。互联网的发展与移动终端等通讯设备的普及为旅游者提供了获取旅游信息的多种渠道,公众不再局限于传统媒体等渠道了解旅游信息。截至2016年12月,我国网民规模达到7.31亿人,互联网普及率为53.2%,手机网民占比高达95.1%[1]。旅游者可通过网络检索全面了解目的地旅游安全状况,为旅游决策提供有效参考[2]。
互联网用户通过网络检索产生的海量检索数据被记录下来,这些数据能直接客观地反映旅游者旅游需求信息[3]。用户对旅游安全的检索数据直观体现了旅游者对目的地旅游安全的关注度,侧面反映了对安全的重视程度。研究我国各省、自治区、直辖市的旅游安全网络关注度,能把握居民对旅游安全相关的网络关注行为,为旅游目的地实施差异化旅游安全管理提供理论依据。
网络关注度指数来源于互联网海量检索记录,是了解旅游者对旅游目的地关注程度的重要参考,对现实客流量和游客行为有引导预测作用,具有较大的应用价值。近年来,学术界对网络信息及用户网络关注行为的探讨逐渐深入。李山等较早关注到百度指数这一用户数据,并运用到景区现实客流量预测中[4]。此后聚焦于网络关注度与现实旅游客流关系研究的旅游学者逐渐增多。龙茂兴等以四川省为研究对象,再次验证了旅游网络用户关注度与实际旅游客流之间存在极强的正相关性[5]。随着研究的深入,一些学者尝试建立基于网络信息的旅游客流预测模型。黄先开等利用计量经济学方法分析了百度关键词与北京故宫实际游客量间的关系,建立了没有百度关键词和加入百度关键词的两种预测模型并进行了预测精度比较[6];张斌儒等引入百度指数提供的关键词数据对海南省旅游收入进行了预测[7]。此外,旅游学科对网络关注度的研究集中于探讨网络关注度的时空特征及其影响因素。林志慧等对旅游景区逐日网络空间关注度周内分布和季节性分布进行了实证分析[8];张晓梅等采用地理集中指数等方法测度了平遥古城网络关注度时空特征,在此基础上指出客源地人均GDP和两地间的距离是影响网络关注度空间分布的重要特征[9]。
以上研究多从旅游网络关注度与实际客流的关系角度切入,旅游安全网络信息作为游客网络检索信息需求的重要方面,较少有旅游学者深入研究该议题。有关旅游安全网络关注度的研究主要包括:林炜铃等分析了全国旅游安全网络关注度的区域差异特征[2];邹永广等研究了区域间的旅游安全网络关注度差异并具体分析时空差异特征,初步判断地区经济发展水平、网络发达程度、突发事件数量等差异影响各省市旅游安全网络关注度的差异[10]。前人的研究内容相对聚焦,但涉及面局限,多集中于网络关注度时空特征、与实际客流量关系研究。多数学者选择特定区域、A级景区探讨网络关注度时空分布,旅游安全网络关注度作为旅游者对旅游安全信息需求的重要反映,却缺乏旅游学者的深入研究与充分探讨;研究方法上一般采用时间序列数据或者横截面数据,极少有面板数据模型的应用。本文在上述研究成果的基础上结合计量经济学方法对我国31个省、自治区、直辖市的面板数据进行实证分析(未包括香港与澳门特别行政区、台湾地区,下同),进一步探究旅游安全网络关注度的影响因素,以期对旅游安全管理有现实指导意义。
本研究以我国31个省、自治区及直辖市为研究对象,选取2011—2015年31个省、自治区、直辖市的面板数据作为研究样本。梳理已有文献发现,旅游安全网络关注度的影响因素涉及诸多指标。综合考虑指标数据的可获取性与完整性,本研究确定选取的指标见表1。
表1 旅游安全网络关注度的影响因素及其指标
解释变量:①社会人口统计特征。主要包括分地区居民性别比、受教育程度指标。根据《中国统计年鉴》统一划分,性别比指人口中男、女性人数之比,即每100名女性人口相对应的男性人口数;将受教育程度指标分为6岁和6岁以上初中人口数、高中人口数、大专及以上人口数。前人研究指出,男女两性在网络信息的关注取向和关注程度的确存在差异[11],性别对游客安全感有显著影响[12],建立在男、女安全感存在显著差异[12]的理论基础上认为不同性别的游客对旅游安全的信息需求及关注程度不同,因此选择性别比作为解释变量,并预期性别对地区旅游安全网络关注度有显著影响,其影响方向和强度待进一步分析验证。②地区经济发展水平,选取人均GDP进行衡量。邹永广分析发现,旅游安全网络关注度与当地经济发展水平呈现显著相关性[10];张晓梅认为客源地的人均GDP是网络关注度空间分布的主要影响因素[9]。地区经济发展水平与当地信息化基础设施建设的完善程度息息相关,较为发达的地区人均GDP较高,当地居民有更多的资金用于旅游消费,出游意愿较强,因此对旅游相关信息的需求也更大,对旅游安全信息的关注度更高。在衡量地区经济发展水平的各项指标中,人均GDP是衡量一个地区经济发展状况的重要指标。本研究选择人均GDP衡量各地区经济发展水平,因此预期人均GDP与地区旅游安全网络关注度有显著正向影响。③互联网发展水平。互联网发展水平主要由互联网上网人数、互联网普及率体现。综合前人文献和概念内涵,本研究选取互联网普及率作为衡量我国各地区互联网发展水平的指标。旅游安全网络关注度是建立在用户网络检索行为上采集的海量信息,而产生网络检索行为的前提条件是互联网发展状况。邹永广[10]、李霞[13]等指出互联网发展水平是影响网络关注度的重要因素。互联网普及率高,说明该地区使用互联网的人数占总人数的比例更大,总体旅游安全网络关注度指数更高,因此预期地区互联网普及率与地区旅游安全网络关注度有显著正向影响。④地区人口规模。各地区旅游安全网络关注度指数体现的是基于地区IP地址的互联网所在地区的用户对旅游安全的关注程度,考虑到百度指数的实际计算逻辑,研究认为地区人口规模是地区旅游安全网络关注度存在差异性的重要因素之一。比较之下,人口基数大的地区旅游安全网络关注度指数更高。
被解释变量:被解释变量为我国31个省、自治区、直辖市的旅游安全网络关注度,具体数据来源于以“旅游安全”为主要关键词的各地区百度指数,选择其中的“用户关注度”指数数据旅游安全网络关注度指数。百度指数是以百度海量网民行为数据为基础,基于百度搜索引擎的海量数据为用户提供海量数据信息服务的在线数据分享平台[14]。检索条件中的“地区”选项体现的是基于IP地址的互联网所在地区的用户或居民对旅游安全问题的关注情况[10]。
样本数据:本研究数据时间为2011—2015年,数据分析软件为Eviews9.0,原始数据来源于相关年份的《中国统计年鉴》、中国统计局官方网站、百度指数平台等。由于2016年《中国统计年鉴》中2015年分地区受教育程度数据统计制度与前四年不同,统计结果口径不同,数据水平差异大,故通过插值补全法对2015年受教育程度原始数据进行归一化处理。
本研究拟根据数据类型特点,建立合适的面板数据模型(Panel Data Model),实证分析各个解释变量对我国31个省、自治区、直辖市的旅游安全网络关注度的影响。面板数据兼具横截面、时间和指标三维信息特点,是对不同时间的截面个体进行连续观测得到的多维时间序列数据[15],使用面板数据进行实证分析,能提高分析结果的精度和有效性。为了避免非平稳时间序列建立回归模型时易发生的“伪回归”问题,面板数据将时间序列数据和横截面数据进行了混合。本研究在构建面板数据模型前首先进行了单位根检验和协整检验,以检验数据序列的平稳性[16]。平稳性检验通过后,使用F检验和Hausman检验方法确定面板数据模型设定形式。主要是:①单位根检验。单位根检验过程中若发现数据序列存在单位根,则对序列进行一阶差分后继续检验;若仍然存在单位根,则需进行二阶甚至高阶差分后检验,直至序列平稳为止。目前检验方法主要有LLC检验、IPS检验、ADF检验 和 PP检验等。为了避免单一检验方法的偏差,保证结论的稳健性,本研究使用LLC、IPS、Fisher-ADF和Fisher-PP四种检验方法对数据进行单位根检验。②协整检验。面板协整检验一般包括同质面板协整和异质面板协整检验,前者一般使用Kao检验,后者一般使用Pedroni协整检验。这两种检验方法的原假设均为不存在协整关系,从面板数据中得到的残差统计量进行检验。
单位根检验:本研究选择四个统计检验量对研究中涉及的变量进行单位根检验,从而检验研究数据的平稳性。其中,LLC检验原假设为“各截面序列具有相同单位根过程”;IPS检验、Fisher-ADF检验和Fisher-PP检验原假设为“各截面序列具有不同的单位根”。检验结果见表2。序列lnX1、lnX2、lnX3、lnX4、lnX5、lnX6、lnX7、lnY四种检验方法对应的P值远小于显著性水平0.05,拒绝存在单位根的原假设,为平稳变量I(0)。
表2 变量平稳性检验结果
协整检验:变量间同阶单整情况下,采用KAO协整检验法对变量进行协整检验。从表3可见,P值小于0.05(0.0197),拒绝原假设。在置信度为95%的条件下,认为变量之间存在协整关系,可进行下一步研究。
表3 序列协整检验结果
本研究中面板数据模型形式为:
yit=αi+β1ix1it+β2ix2it+…+βkixkit+uit(i=1,2,3…,N;t=1,2,3…,T)
(1)
经Eviews9.0软件分析后的结果见表4、表5。对给定的显著性水平0.05,F检验结果中的P值<0.05,拒绝原假设,拒绝建立混合模型,采用固定效应模型;Hausman检验结果显示,P值远小于0.05时,拒绝原假设,拒绝建立个体随机效应模型。综合上述两种检验结果,本研究确定建立个体固定效应变截距模型。
表4 F检验结果
表5 Hausman 检验结果
模型估计结果:模型估计结果见表6。从表6可见,R2=0.9644,调整后的R2=0.9532,可决系数很高,F检验P值小于0.05,拒绝原假设,说明回归方程显著,即列入模型的各个解释变量联合起来对被解释变量有显著影响。但多个变量所对应的P值>0.05,且影响系数符号与理论预期相反,表明该模型可能存在严重的多重共线性问题。
表6 模型估计结果
我们将每个X变量分别作为别解释变量对其余X变量进行回归,检测回归所得可决系数和方差扩大因子的数值。表7的结果显示,除lnx1、lnx4、lnx6外,辅助回归的可决系数很高,当方差扩大因子VIFj≥10时,通常说明该解释变量与其他解释变量之间有较严重的多重共线性[16],这里除lnx2、lnx3、lnx4、lnx7的方差扩大因子远大于10,表明确实存在严重的多重共线性问题。
表7 辅助回归的值
模型修正结果:借助Eviews9.0软件,采用广义最小二乘法逐步回归对个体固定效应模型进行参数估计,lnX2、lnX3被剔除,得出结果见表8。
表8 面板模型参数估计结果
从参数估计各项结果看:①F-statistic指标P值为0,小于显著性水平0.05,拒绝原假设,说明回归方程显著,即列入模型的各个解释变量联合起来对被解释变量有显著影响。②多重可决系数衡量估计模型对观测值的拟合程度,多重可决系数数值介于0和1之间,数值越接近1,说明模型对数据的拟合程度越好。分析结果显示,R2=0.9843,修正的可决系数为0.9790,本研究中模型对样本的拟合较好,解释能力较强。③DW检验方法是检验自相关的常用方法,主要用于检验残差序列的相关性,其区间为(0,4);当DW值=2时,不相关。分析结果中DW≈2.2835,说明残差序列不相关,不存在自相关情况。进一步分析参数可知,地区人口数、互联网普及率、人均地区生产总值、受教育程度(大专及以上人口数)均对旅游安全网络关注度有显著影响(|t|>2,P<0.05),性别比对旅游安全网络关注度的影响不显著(|t|<2,P>0.05)。
性别这一变量与理论预期不符。从性别比对旅游安全网络关注度的无显著影响来看,当前网络高度化发展时代,网络已成为人们获取信息的基本渠道,这是不分性别的。基于上述推论,目前性别差异对旅游者通过网络获取旅游信息资讯并无显著的影响,移动终端的高度普及使人们获取网络信息更加便利。以往研究中曾指出,女性受职业地位与家庭内部资源分配影响,导致其信息设备购买能力低于男性,这一结论在新的时代背景下有待商榷。前人研究成果指出性别的差异造成男女对网络关注行为有所差异,且性别对网络关注行为的影响是动态且多元化的,会受到年龄、教育程度等因素的影响[11]。本研究未全面考虑其他因素的影响,有关性别对旅游安全网络关注的影响作用有待深究。
地区人口数对旅游安全网络关注度有显著的正向作用,且其影响弹性系数最大(1.4093)。前人较少探讨地区人口规模对网络关注度的影响,但本研究考虑到旅游安全网络关注度的计算逻辑,认为地区人口规模是影响其旅游安全网络关注度指数水平的重要因素,旅游安全网络关注度是基于地区居民网络搜索记录产生的指数数据,该关注度的高低与该地人口规模密不可分。本研究结果也验证了前文理论分析中人口数越大的省、自治区、直辖市的旅游安全网络关注度指数越大。
互联网发展水平对旅游安全网络关注度有显著的正向作用,为主要影响因素之一。结果显示,互联网普及率对旅游安全网络关注度的影响弹性系数为0.6991,仅低于地区人口数的影响弹性系数。一方面,互联网发展水平高的省份说明该地区能为居民使用互联网提供更为优质的硬软件环境,居民上网更为便捷,搜寻旅游安全网络信息的途径更顺畅;另一方面,互联网发展水平高的地区经济发展水平一般也较高,居民有较强的经济基础支撑旅游活动,因此正向影响旅游安全网络关注度。
人均地区生产总值对旅游安全网络关注度有积极的正向影响。其原因可从两个角度进行解释:一方面,作为体现地区经济发展水平的重要指标之一,人均地区生产总值高,说明地区的经济发展水平相对其他地区更高,各方面的基础设施投入包括互联网接入设备等投入更加完善;另一方面,居民经济状况对其出游决策有重要制约作用,人均GDP高,地区居民出游意向更高。人本主义心理学家Maslow曾提出著名的需要层次理论[17],其中阐述了人类的不同层次需要对指导其自身行为具有重要意义。在人类一系列复杂需要中,根据其优先次序可分为生理需要至自我实现的五层次的需要。对人类个体来说,只有满足基本需要才能发展更高级的需要。经济基础是推动游客出游的重要基础条件,从而在具备出游意愿的基础上产生对旅游安全相关信息的关注。一些地区居民因个人经济条件受限导致旅游意愿较弱,如青海、西藏等,因此地区经济发展水平的差异使各省份旅游安全网络关注度差异较大。
由受教育程度(大专及以上人口数)这一指标的分析结果可知,大专及以上人口数对旅游安全网络关注度有显著的正向影响,影响弹性系数为0.0031。即受教育程度高的人口数越多,则该地区的旅游安全网络关注相对更高。相比之下,大专及以上人口数的影响系数明显低于人口数、互联网普及率及人均地区生产总值的影响系数,可见受教育程度并非旅游安全网络关注度的决定性影响因素。该结果再次验证,在网络高度发展与移动设备广泛普及的信息化时代,受教育程度、性别差异对居民网络使用率的影响逐渐减弱。
居民网络关注行为受多种因素的影响,基于该统计的旅游安全网络关注度指数的影响因素也是多元而复杂的。除了本研究中提及的因素外,可能还包括地区居民闲暇时间、旅游目的地突发事件数量等[18-20]。以上各个要素中,有些促使地区旅游安全网络关注度提高,有些则降低旅游安全网络关注度,关注我国旅游安全网络关注度的动态变化能在一定程度上预测旅游目的地实际客流量,从而针对性地对不同地区采取差异化的旅游安全管理。
本文在前人研究基础上进行了进一步拓展,研究结果表明:地区人口数、互联网发展水平、地区经济发展水平、受教育程度等对旅游安全网络关注度有显著的正向影响,其中地区人口数、互联网发展水平和地区经济发展水平是重要的影响因素。考虑到本研究样本为面板数据,闲暇时间、居民出游偏好、气候舒适度等信息较难获得合适的测度数据,因此选取的指标数据受限,结果仅在一定层面验证了前人成果并进一步对影响方向和影响强度进行了探究,而有关旅游安全网络关注度的诸多因素未全面考虑到,还需做进一步的研究验证。
参考文献:
[1]中国互联网络信息中心.第39次中国互联网络发展状况统计报告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/.
[2]林炜铃,邹永广,郑向敏.旅游安全网络关注度区域差异研究——基于中国31个省市区旅游安全的百度指数[J].人文地理,2014,(6)∶154-160.
[3]蔡卫民,彭晶,覃娟娟.韶山的全国网络关注热度矩阵及推广策略研究[J].旅游科学,2016,(4)∶61-72.
[4]李山,邱荣旭,陈玲.基于百度指数的旅游景区络空间关注度:时间分布及其前兆效应[J].地理与地理信息科学,2008,(6)∶102-107.
[5]龙茂兴,孙根年,马丽君,等.区域旅游网络关注度与客流量时空动态比较分析——以四川为例[J].地域研究与开发,2011,(3)∶93-97.
[6]黄先开,张丽峰,丁于思.百度指数与旅游景区游客量的关系及预测研究——以北京故宫为例[J].旅游学刊,2013,(11)∶93-100.
[7]张斌儒,黄先开,刘树林.基于网络搜索数据的旅游收入预测——以海南省为例[J].经济问题探索,2015,(8)∶154-160.
[8]林志慧,马耀峰,刘宪锋,等.旅游景区网络关注度时空分布特征分析[J].资源科学,2012,(12)∶2427-2433.
[9]张晓梅,程绍文,刘晓蕾,等.古城旅游地网络关注度时空特征及其影响因素——以平遥古城为例[J].经济地理,2016,(7)∶196-202.
[10]邹永广,林炜铃,郑向敏.旅游安全网络关注度时空特征及其影响因素[J].旅游学刊,2015,(2)∶101-109.
[11]蒋美华,李翌萱.网络信息关注行为的性别差异分析[J].山西师范大学学报(社会科学版),2013,(5)∶141-144.
[12]Franklin C A,Franklin T W.Predicting Fear of Crime:Considering Differences Across Gender[J].Feminist Criminology,2009,4(1)∶83-106.
[13]李霞,曲洪建.邮轮旅游网络关注度的时空特征和影响因素——基于百度指数的研究[J].统计与信息论坛,2016,(4)∶101-106.
[14]百度指数.产品简介[EB/OL].https://index.baidu.com/Helper/?tpl=help&word=.
[15]黄晓燕,曹小曙,李涛.中国城市私人汽车发展的时空特征及影响因素[J].地理学报,2012,(6)∶745-757.
[16]庞皓.计量经济学(第二版)[M].北京:科学出版社,2010.
[17]许金声.动机与人格[M].北京:华夏出版社,1987.
[18]马丽君,孙根年,李玲芬,等.海口旅游气候舒适度与客流量年内变化相关分析[J].资源科学,2008,(11)∶1754-1759.
[19]曹伟宏,何元庆,李宗省,等.丽江旅游气候舒适度与年内客流量变化相关性分析[J].地理科学,2012,(12)∶1459-1464.
[20]马丽君,孙根年,黄芸玛,等.城市国内客流量与游客网络关注度时空相关分析[J].经济地理,2011,(4)∶680-685.