基于百度指数的网络关注度时空特征及其影响因素研究
——以张家界国家森林公园为例

2022-11-08 04:48毛秀玲段文军
科技创业月刊 2022年9期
关键词:国家森林公园关注度张家界

毛秀玲,傅 玉,段文军

(南宁师范大学 旅游与文化学院,广西 南宁 530100)

0 引言

森林公园作为衡量森林旅游发展水平的重要指标,发挥着重要的生态效益、经济效益和社会效益。截至2019年6月,搜索引擎用户规模达6.95亿,旅行预订用户规模达4.18亿[1],通过互联网获取旅游信息是旅游者做出旅游决策的重要手段[2]。因此网络关注度引起了学术界的广泛关注,最先应用在流行病学领域,用于监测流感的传播[3]。再扩展到经济学领域,如预测股市波动率[4]。后逐步延伸到旅游学领域,国际研究主要涉及旅游目的地选择[5]、旅游需求预测[6]、旅游客流预测等[7],国内研究集中于网络关注度与旅游客流量关系[8]以及网络关注度时空特征[9]。 网络关注度是现实旅游客流的前兆[10],而百度指数的搜索规模是网络关注度的直观体现。张家界国家森林公园作为我国第一个国家森林公园,具有较强代表性。本文以百度指数为基础研究数据,揭示张家界国家森林公园网络关注度时空特征及影响因素,旨在为景区市场选择和精准营销提供参考借鉴。

1 数据来源与研究方法

1.1 数据来源

据中国互联网络信息中心发布的《2019年中国网民搜索引擎使用情况研究报告》,百度搜索引擎的用户渗透率达到90.9%。百度指数以百度海量网民搜索行为数据为基础,向用户提供关键词的搜索规模、趋势、需求图谱等数据。本文以“张家界国家森林公园”为搜索关键词,收集2015年1月1日-2019年12月31日百度指数的搜索规模数据,作为网络关注度研究数据的直接表征指标。

1.2 研究方法

周内偏度系数可用于反映周内分布偏度状况,本文用于测算 “十一”黄金内网络关注的偏移程度。系数小于0,表明偏向分布在周内前期;系数大于0,表明偏向分布在周内后期。

(1)

式中,i为网络关注度从大到小的排列次序,Pi为第i日网络关注度与黄金周内网络关注度总和之比。

变异系数用来衡量多个样本之间相对差异。系数越大表明相对差异越明显,反之相对差异越小。

(2)

全局莫兰指数是测算要素值空间相关性的常用统计量。取值范围为[-1,1],指数小于 0,要素在空间上呈现负相关;指数大于 0,要素在空间上呈现正相关。常用局部 LISA聚集图进行可视化表达。

(3)

2 网络关注度时空特征

2.1 时间分布特征

2.1.1 年际变化特征

将百度搜索指数按年份相加得到张家界国家森林公园2015-2019年年度网络关注度。从年际变化趋势来看,整体上呈现不规则“N”字形,最大值出现在2016年,是2018年(最小值)的2.59倍。从波动情况来看,经简单计算得年际变动指数(各年度网络关注度与年平均网络关注度之比)结果,整体年际变化较大,2016年高达168.67%、2018年为65.04%,与基准数值100%相差较大,说明研究时段内张家界国家森林公园网络关注度波动明显。

2.1.2 月时段分布特征

客流量季节性分布不均是旅游行业重要特征,网络关注度作为潜在客流量的重要体现同样可能存相似特征。将各年百度指数数据按月相加得到月度网络关注度总量,绘制变化趋势见图1,整体上各年均呈现“夏季高而冬季低”月度分布特征。具体来看,2015年、2018年和2019年呈“M”型双峰状,高峰月出现在4-5月、7-8月, 6月、11月至次年2月形成低谷;2017年全年分布相对均衡;2016年呈现倒“V”型单峰分布,在4-7月网络关注度迅速上升而7-10月逐渐回落,最高峰出现在7月,这也使得2016年网络关注度远高于其他年份。究其原因,张家界大峡谷玻璃桥于2015年8月20日试运行,期间引起关注。而百度搜索引擎会依据搜索结果向用户推荐相关信息,也直接影响到张家界其它景区的搜索量。

图1 张家界国家森林公园网络关注度变化趋势

2.1.3 周时段分布特征

由于旅游活动强烈地受限于闲暇时间,且我国居民的闲暇时间多集中在节假日和双休日,为此重点关注张家界国家森林公园景区网络关注度的周时段分布特征。将各年日搜索量按星期相加再求平均得到周内日均网络关注度,结果表明周内分布相对均衡。进一步探究“十一”黄金周内网络关注度偏移程度,表1显示各年“十一”黄金周内各年周内偏度系数值均小于0,表明5年内网络关注度偏向分布于黄金周周初。该现象可解释为黄金周内外较多地游客到访,出于对目的地的不确定性而倾向提前收集出游活动相关信息,这也符合网络空间信息流是旅游客流的前兆假定[10]。

表1 张家界国家森林公园 “十一”黄金周内分布偏度系数

2.2 空间分布特征

2.2.1 空间差异

本文选用变异系数来反映网络关注度的相对差异性,分别计算省际和地区间网络关注度的变异系数,结果见表2。可见省际差异大于地区间差异。地区内差异较大,东部沿海、东北地区、北部沿海、西南地区内部差异较小,而西北地区、南部沿海、长江中游、黄河中游内部差异较大。总之,无论是省际、地区间还是地区内部,张家界国家森林公园网络关注度空间分布差异明显,地区内部差异大于省际差异大于地区间差异。

利用百度指数的人群画像功能发现,2016-2019年网络关注度空间分布并不均衡,整体上呈现“中部东部高、四周低”的空间格局,符合空间距离衰减规律。5年内关注度最高的是长江中游地区,这主要得益于空间距离最近;紧随其后的是北部沿海地区,该区域经济实力和人口规模在全国都首屈一指;关注度最低的是大西北地区,归因于经济水平相对落后且空间距离最远。

表2 张家界国家森林公园网络关注度空间分布变异系数

2.2.2 空间自相关

考察张家界国家森林公园网络关注度在空间上是否存在相关性,需要进一步利用莫兰指数测定各省份网络关注度的空间关联性。由公式(3)计算出2015-2019年全局莫兰指数值,结果见表3。Moran’s I值在0.191~0.271之间波动,均通过1%的显著性检验,表明31个省市区的网络关注度存在显著的空间正相关。进一步考察网络关注度局部空间聚类情况,结合效率与科学性,等距选取2015年、2017年、2019年3年数据,具体呈现出湖南、湖北、广东、浙江为热点区(即高高聚集区域),说明该地区网络关注度高且与邻近区域协调性强;西北、东北地区和北部沿海地区为冷点区(即低低聚集区域),说明该地区网络关注度低但与邻近区域协调性强;安徽、江西、福建、海南以及西南地区为低高聚集区,说明该地区相较于邻近地区网络关注度低且与邻近区域协调性差;北京、江苏、河南、四川为高低聚集区域,说明该地区相较于邻近地区网络关注度高但与邻近区域协调性差。2019年空间聚类格局与前述2年略有不同,主要表现在不显著的区域明显增多,包括北部沿海、黄河中游和东北地区。

表3 张家界国家森林公园网络关注度空间聚集特征

2.2.3 客源市场结构

将5年内网络关注加和统计得到排名前5位的省份分别是湖南、广东、四川、河南、江苏。参考客源市场划分依据[11]来划分张家界国家森林公园潜在客源市场(下文均是指潜在客源市场),以网络关注度占全国总量5%以上、2.5%~5%、1%~2.5%为标准分别划为一级市场、强二级市场、弱二级市场。据计算结果知:一级市场包括湖南省和广东省,值得注意的是四川、河南、江苏虽属于强二级市场但有望成为一级市场;强二级市场包括辽宁、北京、河北、山东、福建以及东部沿海、黄河中游、长江中游、西南地区,应是景区重点关注对象;弱二级市场包括黑龙江、吉林、海南、甘肃、云南等经济欠发达地区。一级市场最少而强二级市场最多,潜在客源市场结构有待优化。

3 网络关注度时空特征影响因素分析

3.1 时间特征影响因素

由于张家界国家森林公园网络关注度存在明显的季节性,同时考虑到重大事件带来的巨大关注度,本文选择“闲暇事件”和“重大事件”两个虚拟因子作为网络关注度的起因。闲暇时间(T)影响程度的量化主要参考对闲暇时间虚拟因子的设定[12],综合考虑我国的公共休假制度以及寒暑假期,7、8月闲暇时间充足赋值为1,1、4、5、6、10月节假日集中,赋值为0.5,其余月份赋值为0。重大事件(E)影响程度的量化主要参照前述张家界大峡谷玻璃桥建设历程,4、5、6月展开大量宣传活动将其赋值为0.5,7、8月准备对外营业,将其赋值为1,其余月份赋值为0。以2个虚拟因子为解释变量,以网络关注度指数(各年月平均与其总量之比)为被解释变量,利用Stata软件进行OLS回归,得到如下回归方程:

Q=2.135T+6.066E+5.587

其中,修正R2= 0.899。回归结果表明,重大事件和闲暇时间均通过0.05的显著性检验,两者均对网络关注度有显著正向影响,且边际效应系数分别为2.135、6.066,重大事件的正向解释力高于闲暇时间。

3.2 空间特征影响因素

Q=0.384X1+0.204X2+0.358X3+0.235X4-0.582

其中,修正R2= 0.915。结果表明,人均可支配收入、经济联系强度、总人口数通过0.01的显著性检验,边际效应系数分别为0.384、0.204、0.358,均为正向影响力,解释力最强的人均可支配收入,其次是总人口数,最后是经济联系强度。而互联网普及率未通过显著性检验,其对景区网络关注度的影响有待进一步讨论。需要指出的是经济联系强度指标内含空间距离的影响,由于空间距离越短则经济联系强度越强,因此空间距离对景区网络关注度有显著的负向影响,符合空间距离衰减规律。

4 结论与建议

4.1 结论

首先,在时间分布特征上,年际波动幅较大;季节分配不均,各年均呈现“夏季高而冬季低”月度分布特征;周内分布相对均衡,“十一”黄金周内偏向分布于节假日前期,存在“前兆效应”;其次,空间分布特征上,整体呈现“中部东部高、四周低”的空间格局;区域差异明显,地区内差异>省际差异>地区间差异;存在空间聚集现象,湖南、湖北、广东、浙江为热点区,西北、东北地区和北部沿海地区为冷点区;优势市场仍然湖南省和广东省,市场结构有待优化。第三,影响因素上,重大事件和闲暇时间对季节变动有显著影响;地区经济发展水平、经济联系、客源地人口规模和空间距离是影响空间分布的重要因素。

4.2 建议

(1)深度挖掘旅游大数据。借助旅游大数据预测客流量,特别关注节假日、旅游旺季客流的规划、疏导和预警。精准营销,利用旅游大数据定位目标群体,分析用户需求,精准投放广告。

(2)培育新客源市场。维护湖南和广东传统优势市场同时培育小长假市场,针对具有网络关注度高、空间距离近且往来交通便利等优势的湖北、重庆、四川等近程市场,在节假日前加大宣传刺激旅游需求,将其培育成稳定的小长假市场。优化客源市场结构,针对一级市场最少而强二级市场最多这一现状,可将四川、河南、江苏培育成新的一级市场。

(3)打造大湘西“一小时旅游圈”。张吉怀高铁已投入运营,从张家界到怀化运输时间将由3.5h缩短至1h,有望借助公交化、通勤化运营方式连接多处优质旅游景点。三市旅游部门强化协同治理,利用“一码游”服务平台,依托张吉怀高铁,联合打造大湘西“一小时旅游圈”,实现资源共享。

猜你喜欢
国家森林公园关注度张家界
张家界的幺妹儿哟,张家界的酒儿……
森林公园历险记
东台黄海国家森林公园:以绿之名,拓荒出“养心”景致
基于文本挖掘的阿尔山国家森林公园旅游形象感知研究
张家界看山(外四首)
毕业一起去旅行之张家界
雄安新区媒体关注度
全国两会媒体关注度
人间奇景张家界
暴力老妈