张 博 , 吴 柳
(1.河北地质大学 a.发展规划处,b.河北省矿产资源开发管理与资源型产业 转型升级软科学研究基地,石家庄 050031; 2.河北师范大学 国际文化交流学院,石家庄 050024)
随着素质教育理念的深入和旅游产业跨界融合发展,研学旅行作为一种体验式教育和研究性学习活动在我国中小学推广实施。截至2019年,全国共有中小学23.7万所,在校学生1.94亿人。随着研学旅行逐步纳入中小学教育教学计划[1]和学分系统[2]等政策的实施,研学旅行市场需求将得到进一步释放。目前,我国研学旅行市场发展空间巨大,多个省份已将“研学旅行”列为“十四五”期间旅游业发展的重要方向。
研学旅行是学界近年来才开始关注的方向,研究成果相对较少。以往研究大体经历了从历史回溯到市场开发、价值探讨、发展现状以及对策建议的阶段。研究早期以定性分析为主,集中于研学历史、人物思想、发展现状、产品开发等内容,大多采用文献分析、田野调查、访谈等研究方法[3]。现阶段学者们从解决现实问题出发,在产品开发策略、监督管理和评价机制等方面提出了相关建议[4-6]。也有部分学者基于问卷调查法针对目的地选择、参与意愿、需求动机等心理学层面问题开展定量研究[7-8]。但受限于研究方法本身不足和数据采集难度较大,以往研究以个案分析或少量的统计分析为主,针对地区整体尺度的研究尚待开展,研究方法也需要进一步拓展。
网络关注度是基于关键词网络搜索次数的统计记录,代表了居民对相关活动的关注程度及行动意愿。“研学旅行”网络关注度在一定程度上可视为活动次数、宣传效果、参与意愿等与研学旅行发展相关的综合信息记录。因此,本研究将网络关注度作为研学旅行发展水平的替代观测数据,通过调查不同省份搜索指数的分布,开展我国研学旅行网络关注度时空分布特征和影响因素的研究,并以此讨论研学旅行地区发展现状,为研学旅行推广提供科学参考。
网络搜索中包含了用户的行为信息,百度、360等公司已推出各自的搜索指数来记录某些关键词的搜索痕迹,这类数据具有实时、客观、样本大、易获取等特点,可直接、客观地反映社会热点及网民的兴趣和需求等,目前已在流行病预测、公共政策、城市发展、旅游管理、金融预测等研究领域获得较多应用[9]。
网络关注度的数据采集一般使用百度指数平台,但目前百度指数并未收录“研学旅行”为主题的关键词,因此,只能通过其他平台采集。360浏览器是目前国内使用最多的浏览器,采集的数据样本量较大并提供关注趋势曲线,可以显示搜索内容在所选周期内用户的关注程度和持续变化情况。因此,本研究采用360指数平台,将“研学旅行”作为搜索关键词,采集了2017年1月至2021年7月的360指数数据,其中为避免疫情对各地关注度产生的影响,研究选取2017年1月1日至2019年12月31日作为影响因素研究的时间范围。在搜索结果中采集全国34个省份的360指数年度均值作为网络关注度的地区数据,地区数据加总后得到全国总体数据。此外,还搜集了国家统计局网站公布的各省份的人口规模、平均受教育年限、人均消费水平以及研学实践教育基地数量等指标作为影响因素讨论的基础数据。
借鉴前人网络关注度时空差异的研究方法[10-13],分别采用赫芬达尔系数、变异系数、莫兰指数、季节性集中指数衡量研学旅行网络关注度分布的相对差异,并采用稳健回归方法探索网络关注度地区差异的影响因素。
1.2.1赫芬达尔系数。该系数反映网络关注度在时间上的集聚程度,其公式为:
式中:pi为i月研学旅行网络关注度占全年关注度的比值;H为赫芬达尔系数,H值越趋近1,说明网络关注度分布的时间差异越大。
1.2.2季节性集中指数。该指数是反映研究对象时间分布集中程度的一个指标,可用于比较不同年份网络关注度月度时间分布的集中程度,其公式为:
式中:xi代表i月关注度占全年的百分比;R为季节性集中指数,其值越大,说明网络关注度分布的季节性特征越显著。
1.2.3变异系数。该系数用于反映网络关注度的离散程度,其计算公式为:
1.2.4基尼系数。该系数用来考察研学旅行地区关注度分布的差异程度。其计算公式为:
式中:x1,x2,…,xn为降序排序的各地区网络关注度;n代表地区数量;G为基尼系数,G∈(0,1),值越大,说明地区差异程度越大。
1.2.5稳健回归。该方法是统计学中稳健估计的一种方法,主要通过对数据中样本赋予不同的权重来体现出离群值对回归方程的影响,通过稳健估计方法可以得到更加准确的结果,在抵御离群值方面具有较强的优越性[14],并且弥补了传统最小二乘法(OLS)在使用条件上限制较多[15]的不足。因此,目前该方法已成为传统线性回归的替代方法之一。
自2016年12月《关于推进中小学生研学旅行的意见》颁布以来,研学旅行关注度提升十分显著。2017年以来我国研学旅行网络关注度波动情况如图1所示,360指数已由0增至400的平均关注度水平。其中在疫情前阶段(2017—2019年),我国研学旅行发展较快,360指数在2017年末激增至477,并在2018年继续保持大幅增长,指数均值达到660,年度峰值接近1 500,而2019年网络关注度增长速度变缓,指数均值为636,与上一年度接近,但整体关注度波动变化更加平稳;疫情影响阶段(2020年至今),受2019年底全球新冠疫情的影响,研学旅行相关活动受到卫生安全条件的制约,其关注度出现大幅下滑,2020年度关注度指数均值仅为255,并未出现明显的波动,整体呈现出受抑制状态,2021年网络关注度有所回升,7月份年度平均指数升至375,但整体上仍处在缓慢的恢复阶段。
图1 2017年1月至 2021年7月研学旅行网络关注度360指数
为分析网络关注度的月度分布特征,按月份分别计算2018—2020年度网络关注度赫芬达尔系数和季节性集中指数,其中各年度赫芬达尔系数分别为0.096,0.087和0.086,其结果均大于0.083,研学旅行网络关注度分布存在一定时间差异;各年度季节性集中指数分别为3.31,1.90和1.54,该指数在2018年较高,而疫情发生后开始降低,但整体上研学旅行网络关注度仍然具有一定季节性分布特征。
为进一步研究网络关注度的季节性分布规律,在统计各月360指数的基础上绘制月关注度占比的堆积面积图(图2)。2018—2020年网络关注度整体呈现出淡、旺季交替的周期性分布特征,具体表现在一般每年1—3月、7—9月为淡季,关注度在2月和8月分别下降至各时段的最低水平,随后关注度开始升高;4—6月、10—12月为旺季,关注度在5月和11月分别提升至各时段的最高水平,随后关注度开始下降。以上不同时段的关注度拐点时间与学校寒暑期及授课时段高度重合,旺季一般位于历年春、秋两季学期的中段,与以往中小学组织春游、秋游等时间相似,淡季一般位于寒暑假中段,同时发现夏季关注度水平一般高于秋季。上述特征体现了中小学目前作为研学旅行相关活动实施主体的作用,研学旅行关注度明显受到相关活动组织时间的影响。
360指数网站24 h网络关注度统计显示,日关注度呈现出随工作作息时间波动的特点,一般在休息时间内关注较低,每日0:00—8:00时关注度较低,接近于0;工作时段内(8:00—18:00)关注度较高,波峰分别出现在10:00和16:00,关注度分别达到300左右,之后关注度又逐步下滑,24:00后降至0。
图2 2018—2020年研学旅行网络关注度月度分布
用户在搜索“研学旅行”的同时也经常关注的关键词包括“PPT模板”“可行性报告”“活动方案”“心得体会”“目的和意义”“管理与服务”等。其搜索范畴集中于研学旅行项目推广实施阶段的各项工作内容,从明确目的和意义到制定方案、提供管理服务、开展各项宣传活动等。由此可见,获取与工作相关的信息是搜索的主要目的。结合其工作时段关注度较高的特征,表明教育、培训及旅游业相关群体是现阶段的主要关注者。
图3 研学旅行网络关注度地区分布Fig.3 Provincial distribution of research travel network attention
4.1.1地区消费水平。研学旅行具有一定的出游属性,消费水平较高的区域具有较强的购买能力,出游意愿较高[8]。因此,假设研学旅行发展与区域消费水平有关,采用各地区年均消费总额的对数值衡量,记为x1。
4.1.2互联网设施数量。互联网是当前信息获取的主要方式,作为一种搜索平台其便捷性也会影响到用户的搜索行为。因此,假设网络关注度与区域互联网设施数量相关,用人均互联网宽带接入端口数量的对数值衡量,记为x2。
4.1.3受教育程度。研学旅行作为一种新的教育方式,其接受程度将受本地居民知识文化水平的影响。因此,假设研学旅行发展与受教育程度相关,用平均受教育年限衡量,记为x3。
4.1.4研学基地数量。研学旅行是有组织、有计划、有目的的校外实践活动,理想的空间场所可以保障活动效果和安全性,同时也能起到信息传播路径的作用。因此,研学旅行发展与研学基地数量有关,用教育部批准的研学实践教育基地、营地数量衡量,记为x4。
4.1.5旅游业发达程度。随着消费结构升级,国内居民在教育和旅游方面的消费支出增长迅速,体验式教育需求日益增加,旅游业中研学旅行相关产品的推广也将提升本地区关注度。因此,假设研学旅行发展与旅游业发达程度有关,用各地区旅游业GDP的对数衡量,记为x5。
使用Stata 15.1软件的robust命令对假设的影响因素进行稳健回归分析。
4.2.2相关性分析。依据相关性检验标准,一般认为相关性系数绝对值大于0.8为高度相关,在0.5~0.8为中度相关,在0.3~0.5为低度相关,小于0.3为微弱相关。与网络关注度具有相关性且符合中度相关条件的变量包括受教育年限(x3)和研学基地数量(x4)两个指标变量,而人均消费(x1)、人均互联网端口数量(x2)、旅游业GDP(x5)3个指标变量与网络关注度之间为微弱相关。各指标变量中x3和x4以及x2和x5为中度相关,其他指标之间为低度或微弱相关。
表1 潜在影响因素的robust回归结果
4.2.4共线性检验。计算膨胀因子(VIF)是衡量自变量之间是否具有多重共线性的最常用方法,根据共线性诊断标准,如果方差膨胀因子(VIF)超过10,则回归模型存在严重的多重共线性,方差膨胀因子小于10的范围是可以接受的,表明自变量之间没有共线性问题存在。通过Stata 15.1计算各变量(x1~x5)的VIF值分别为1.26,1.80,1.94,1.96,1.26,膨胀因子均小于10,说明变量通过共线性检验。
4.2.5内生性检验。由于可能存在遗漏变量或是解释变量和被解释变量之间存在相互作用的情况,回归的计算结果中将出现偏差从而导致内生性问题,其典型表现是解释变量和残差项存在相关关系。因此,有学者提出使用二阶最小二乘法,利用自变量误差项的回归系数的显著与否来检验内生性[21]。选取变量x3,x4为待检验变量并估计残差序列,再将其引入到对所有变量的回归估计中,其结果不显著,说明变量通过内生性检验。
对以上结果的分析表明:(1)基地数量是网络关注度的显著影响因素。研学基地具有良好的空间载体功能,在产品设计、组织实施、课程建设等方面为研学旅行提供了可靠的平台保障,在各地区研学旅行发展中具有重要的支撑作用;(2)平均受教育年限也是网络关注度的显著影响因素。不同地区居民的文化水平差异会影响到价值感知范围和关注内容[22],作为一种全新的教育方式,在其推广中也应该考虑居民自身认知能力的现实因素;(3)旅游业发达程度、居民消费水平尚不是网络关注度的影响因素,表明目前研学旅行产品并未进入消费者的关注视野,研学旅行市场化程度较低,将其作为一种潜在商品而主动关注的居民比例较小;(4)互联网设施数量不是网络关注度的显著变量,表明目前已关注群体在社会中的整体比例仍然较低,研学旅行发展中网络设施不是主要的限制因素。
疫情前我国研学旅行发展较快,其网络关注度提升迅速,疫情后出现了大幅下滑,截至目前尚未恢复。网络关注度在时间上呈现出淡、旺季交替的周期性分布特征,不同时段的关注度拐点时间与学校寒暑期及授课时段高度重合。研学旅行网络关注度存在明显的地区差距,其中华北、华中、华东地区发展较快,网络关注度较高,东北、华南、西北及西南地区发展较慢,关注度相对较低。受教育程度、研学基地数量是网络关注度地区差异的影响因素,地区消费水平、互联网设施数量、旅游业GDP影响不显著。
受新冠疫情的影响,我国研学旅行发展速度明显放缓,随着疫情进入常态化防控阶段,研学旅行未来发展将面临巨大挑战,从目前研究结论中可以推断:(1) 研学旅行主动关注意愿较低。研学旅行网络关注度呈现出在学期内季节性波动的特点,说明学校目前作为直接参与部门,主要承担了研学旅行方案设计和推广的工作,而相关搜索内容和搜索时间都与工作密切相关,说明除工作安排以外的时间公众主动搜索行为较少。(2) 研学旅行市场化程度低。旅游业发达程度、消费水平指标对区域关注度还没有显著影响,说明研学旅行类产品尚未得到市场的广泛认可,缺乏普遍的消费意愿。安全性、参与价值、服务质量与完善的监督机制是公众消费行为发生的前提。因此,应加强市场服务体系建设。(3)研学旅行发展面临巨大挑战。现阶段网络关注度恢复速度仍比较缓慢,疫情反复将对研学旅行的快速发展造成阻碍,疫情影响下研学活动组织规模和频率都会出现下滑并由此对从业者积极性产生不良影响。此外,市场化研学旅行的发展受居民消费能力的限制,疫情影响下全球经济发展可能出现放缓甚至衰退。因此,研学旅行未来发展仍将面临着巨大挑战。
本研究采用的360指数是百度指数的替代数据,搜索关键词的选取没有加入相近的关键词,研究数据的全面性有待提高;自变量选取的理论依据仍有待于进一步加强,选取自变量的类型还不够丰富,模型整体的拟合效果还有较大的提升空间;疫情稳定后各地区研学旅行关注度正开始逐步恢复,其影响因素也将发生一定程度改变,未来仍需要对研学旅行发展进行跟踪研究。