李经龙, 王海桃
安徽大学 商学院,合肥 230601
随着大数据时代的到来, 信息化、 网络化的产业经营模式已成为各大经济行业快速发展的“启动键”与“快捷键”. 截至2021年12月, 中国互联网网民规模达到10.32亿人[1], 在线访问、 在线预订、 在线购物等用户规模的扩大和网络使用率的增长, 由用户产生的内容(user-generated content, 简称UGC)的概念逐渐兴起[2], 越来越多的旅游者依托UGC平台进行前期旅游规划、 中期旅游导览、 后期旅游共享, 而这些数据的衍生成为旅游目的地和学术界关注的焦点. 国内外学者主要依托网络搜索和文本挖掘数据了解游客行为特征, 如通过网络搜索进行客流量预测[3-4]、 酒店品牌需求预测[5]等. 而国内学者的研究主要包括旅游目的地网络关注度与旅游形象感知两大方面. 网络关注度的研究内容主要集中在对不同旅游目的地的时空特征以及影响因素[6-7]的研究, 涉及体育旅游[8]、 红色旅游[9]、 户外旅游[10]等. 关于旅游形象感知的研究主要采用网络挖掘技术, 以省域旅游[11]、 城市旅游[12]、 冰雪旅游[13]等不同类型的旅游目的地作为研究对象, 探讨旅游者对不同旅游目的地的形象感知, 并通过情感分析了解游客对旅游目的地的整体关注度与满意度, 由此可见, 网络搜索引擎数据已在旅游研究中展开应用.
中国世界遗产作为我国重要的旅游资源之一[14], 对区域旅游与景区旅游的高质量发展具有重要的作用. 因此, 为了识别网络用户与现实游客对我国世界遗产景区的网络关注度特征与游客满意度的情感特征, 文章以我国50项、 76处世界遗产景区的百度指数与网络游记两类数据作为研究样本, 以年度关注数据与景区关注数据为基础, 采用年际变动指数、 层级分析、 网络文本分析等方法对中国世界遗产景区的网络关注度与满意度进行分析, 探究各景区之间的关注度差异与影响游客满意度的因素, 以期为提升我国世界遗产景区的网络关注度和满意度、 促进中国世界遗产资源的进一步保护和开发提供思路和决策依据.
现有关世界遗产的研究, 国外研究较为深入, 已形成多学科、 多层次的研究体系. 地理学、 教育学、 历史学、 考古学等不同学科高度融合, 体现了世界遗产品牌在各个领域的研究热点主要涉及世界遗产保护与旅游开发[15]、 利益相关者[16-17]、 遗产地品牌形象塑造[18]等方面. 国内对世界遗产的研究多集中在居民感知与社区参与、 遗产保护与旅游开发等两大方面. 在居民感知与社区参与方面, 由于缺乏有效的社区管理机制, 世界遗产地居民的旅游参与仍处于一种被动状态[19], 王松茂等[20]强调在世界遗产旅游发展过程中应充分考虑当地社区居民的利益, 并建立有效的利益诉求通道, 探索居民对世界遗产地旅游开发影响的感知[21]. 在遗产保护与旅游发展方面, 董文力等[22]以元上都遗址为例, 通过构建原真性保护与旅游开发的关系矩阵模型, 进一步强调了遗产保护与旅游开发的动态平衡.
综上, 网络搜索引擎数据在世界遗产领域中逐步展开, 但研究成果较少, 研究内容主要集中在网络关注度的时空特征分布上, 研究对象主要为单案例遗产地的研究, 不具有全局性, 缺乏以国家尺度为切入点的多案例遗产群的网络关注度的比较研究. 对游客满意度的影响因素进行分析时, 更鲜有将研究区域作为世界遗产地来探究游客的整体满意度. 研究方法多以传统的问卷调查法为主, 具有一定的局限性. 然而依托大数据背景了解网络用户对中国世界遗产地的网络关注度和游客对世界遗产品牌满意度的影响因素, 可以实现精准营销和优化遗产地品牌形象. 因此, 本文在现有研究的基础上, 以中国世界遗产为研究对象, 从网络用户和现实游客的角度分析中国世界遗产景区的网络关注度和满意度, 提出深入发展的对策建议, 希望为提升中国世界遗产景区网络关注度与满意度、 促进中国世界遗产资源的进一步保护与开发等提供思路和决策依据.
世界遗产是指被联合国教科文组织和世界遗产委员会确认且列入《世界遗产名录》的自然景观和历史文物古迹, 融彩塑、 壁画、 石窟、 建筑、 艺术等为一体, 具有不可复制性与不可移动性[32]. 截至2021年7月, 中国已有56项遗产被纳入《世界遗产名录》, 其中包含众多联合申报的遗产点. 本文将百度指数作为基础数据, 通过搜索发现左江花山岩画、 澳门历史城区、 澄江化石地、 泉州宋元中国的世界海洋商贸中心、 中国黄(渤)海候鸟栖息地等5项中国世界遗产未被收录. 另外也存在收录名称不相关的问题, 比如长城的关键词包括长城汽车、 长城宽带、 长城资料、 长城证券等. 因此最终选取50项中国世界遗产景区作为研究对象, 其中文化遗产31项、 自然遗产12项、 文化与自然双遗产4项、 文化景观3项, 包含部分联合申报遗产点. 为了使研究对象更明确、 更具体, 将所有涉及的76处遗产项目和遗产点进行单独研究.
2.2.1 年际变动指数
年际变动指数是用来表明网络关注度年际差异变化的一种指标[33], 计算公式为:
(1)
式中,Y为年际变动指数,Ni为第i年的景区网络关注度,n为所涉及的年份数.Y值越偏离100%, 说明网络关注度的年际变化幅度越大, 网络关注度越不稳定.
2.2.2 网络文本分析法
网络文本分析法主要依托网络资源, 对不同类型的数据文本, 如图片、 文字或其他符号, 进行挖掘、 提取、 处理、 分析的过程. 相比传统的问卷调查法, 网络文本分析法能够更客观真实地反映游客对目的地形象的总体游览印象, 高效地了解旅游者对目的地产品与服务所呈现的评价状况[34]. 因此, 选用该方法对中国世界遗产景区的网络关注度与满意度进行分析, 探索在各景区之间存在的差异, 可以更好地了解游客的真实意愿. 本文通过集搜客GooSeeker分析软件, 将爬取的中国世界遗产游记文本导入, 依据百度指数关键词进行自定义分词列表、 词频统计、 情感词识别, 为了更直观地了解情感满意度关键词之间的关联密度, 运用Gephi构建社会语义网络图, 使分析更具有可视化.
2.3.1 百度指数
百度指数以网络用户的搜索量数据为基础, 以检索关键词为统计对象, 对各关键词在百度网页中搜索频次进行加权, 能够清晰地显示网络用户对某一关键词搜索的关注程度及变化情况[35]. 搜索指数越高, 说明游客对此旅游目的地的旅游意图越明显.
2.3.2 网络游记
网络游记能够直观地反映游客旅游过程中的体验感受[36]. 那梦帆等[37]认为, 网络游记具有开放、 自由、 共享的特性, 能较充分地反映旅游者对目的地意象的感知. 因此网络游记背后折射出的旅游形象感知问题, 对旅游目的地形象的优化、 整改、 塑造具有一定的现实意义. 本文基于携程网UGC平台, 以“中国世界遗产”作为关键词, 通过八爪鱼采集器共采集游记4752篇. 为保证分析结果准确, 对数据进行筛选处理, 筛选条件如下: ① 剔除国外世界遗产相关游记; ② 剔除重复、 无效的游记数据. 最后共获得有效游记1 833篇, 因部分游记篇幅较长, 导入集搜客GooSeeker软件后进行自动分篇处理, 共得到数据3 122条.
目前网络关注度的测算方法主要有两种, 一种是直接使用百度或Google提供的用户关注度数据; 另一种是对网络游记或评论进行统计, 以游记数、 评论数或目的地词频数表征网络关注度[38]. 本研究将两种测算方法交叉使用, 即目的地搜索指数、 词频频次越高, 则该目的地的网络关注度越高.
3.1.1 年际关注度
通过百度指数搜索各景区关键词, 获取全国各地对76处中国世界遗产景区网络关注度的整体日均值, 通过加总求和计算出该年网络关注度总量(图1). 由图1可知, 2011-2021年中国世界遗产景区的网络关注度总体呈稳步上升趋势, 百度整体日均值由2011年的约6.66万人次增长至2021年的9.77万人次, 其中2017年中国世界遗产景区的关注度最高, 整体日均值达到15.50万人次的峰值. 从具体变化趋势来看, 2011-2017年处于持续增长期, 2018年出现小幅度下降. 究其原因, 2018年国家文化和旅游部组建, 文旅融合、 全域旅游等新热点、 新话题在一定程度上冲淡了大众对中国世界遗产景区的网络关注度[39]; 2020年以来由于新冠疫情的影响, 游客的出游行为受到制约, 在一定程度上削弱了民众的关注度.
图1 2011-2021年中国世界遗产景区网络关注度变化图
为进一步研究中国世界遗产景区的网络关注度年际变化特征, 本文进行了年际变化指数的测算(表1). 根据计算结果, 总体网络关注度特征呈现出“中部凸起、 先增后降”的趋势. 2011-2014年的年际变动指数值均小于100%, 说明这一阶段网络关注度的年际变化幅度较小, 网络关注度逐年增加且趋于稳定. 而2015-2019年年际变动指数值均大于100%, 说明这5年全国对世界遗产景区的网络关注度变化较大, 总体趋于不稳定状态. 2020-2021年受新冠疫情影响, 网络关注度有所下降, 但年际变动指数均接近100%, 说明整体网络关注度趋于稳定态势.
表1 2011-2021年中国世界遗产景区网络关注度年际变动指数
3.1.2 景区关注度
通过SPSS对中国世界遗产景区的百度指数与高频词词频两组数据进行相关性验证分析, 结果相关性系数为0.741, 说明百度指数与词频数存在正相关关系, 其显著性p<0.01, 表明两者相关性系数十分显著. 因此, 本文基于2011年1月1日至2021年12月31日的76处中国世界遗产景区百度指数整体日均值搜索数据排名, 结合携程网游记关键词数据, 绘制百度指数与关键词排名统计图(图2).
图2 中国世界遗产景区网络关注度排名统计图
中国世界遗产76处景区的网络关注度统计结果显示, 网络用户关注度排名前5位的景区分别为九寨沟(9155)、 黄山(6542)、 泰山(6070)、 颐和园(5042)、 鼓浪屿(4191). 现实游客关注度排名前5位的景区分别为黄山(2382)、 西湖(1891)、 平遥古城(1863)、 九寨沟(1642)、 鼓浪屿(1242). 其中九寨沟、 黄山、 鼓浪屿均排列在两组数据前5位之中, 这与景区资源禀赋、 品牌建设与推广、 旅游产品创新及营销环境等多种因素有关. 而网络用户关注度位于后5位的景区分别为浙江江郎山(78)、 土司遗址(84)、 良渚古城遗址(120)、 湖南崀山(125)、 四川大熊猫栖息地(135). 现实游客关注度位于后5位的景区分别为环江(7)、 土司遗址(9)、 浙江江郎山(11)、 贵州荔波(12)、 湖南崀山(13). 其中浙江江郎山、 土司遗址、 湖南崀山均排列在两组关注度数据后5位. 一方面由于此世界遗产地属于联合申报遗产, 知名度较低; 另一方面是由于景区地理位置偏远. 由此说明网络用户和旅游者在产生旅游动机或旅游体验的过程中, 其景区品牌传播仍然停留在浅层信息输出上, 新媒体运用不足与体验性不足等营销传播策略问题仍然突出.
为更直观地分析中国世界遗产景区的关注度, 参照孙晓蓓等[40]对A级洞穴景区的层级划分, 根据关注度数值的自然断裂法将76处中国世界遗产景区网络关注度划分为7个等级(表2).
表2 中国世界遗产景区网络关注度层级分布
由表2可以看出, 两组中国世界遗产景区的网络关注度形成了层级错位分布特征. 具体可分为3类[41]: (1) “名过其实”类, 即网络用户关注度排名处于非常高层级, 但现实游客关注度相对较少, 如泰山、 峨眉山、 都江堰等景区. (2) “名小于实”类, 即网络用户关注度排名较低, 但现实游客关注度排名相对靠前, 如西递、 哈尼梯田、 良渚古城遗址等景区. (3) “名副其实”类, 即网络用户关注度排名和现实游客关注度排名大体一致, 如鼓浪屿、 青城山、 福建土楼等景区.
总体来看, 3大类别中国世界遗产景区个数所占比例分别为92.10%、 3.95%、 3.95%, 这说明网络用户的整体关注度普遍高于现实游客关注度, 如何针对此类“名过其实”的遗产景区进行有效营销是亟待解决的问题.
网络满意度是通过自然语言处理对评论信息进行语义分析、 情感分析, 判断评论的情感极性, 对有效评论中的正面印象数和负面印象数进行计量统计分析[38], 以便更好地揭示旅游目的地网络游客满意度差异及其影响因素特征.
2.2.1 高频词分析
通过集搜客GooSeeker软件进行情感分析, 共获取积极情感数据2 980条, 占比95.46%; 中性情感92条, 占比2.94%; 负面情绪50条, 占比1.60%. 总体而言正面情感态度远高于负面情感, 说明整体满意度较高.
潘冬南[42]提出情感是游客对旅游目的地感知的重要影响因素, 正负面情感都会直接影响游客的满意度与忠诚度. Van等[43]认为旅游资源、 旅游环境构成了影响游客满意度的主要因素. 赵春艳等[44]通过搜集网络游记和点评数据, 将游客满意度影响因素从景观特色、 服务体验、 环境氛围、 区位交通4个维度为切入点展开分析. 朱晓柯等[45]以哈尔滨冰雪旅游为例, 采用模糊集计算法, 将游客满意度评价指标构建成旅游资源、 旅游食宿、 景区设施、 景区服务、 门票价格5个方面.
借鉴以上研究成果, 本文通过集搜客GooSeeker软件情感打标定位, 依据排名顺序, 精选正负面词汇各30个对相关评论进行逐句阅读, 高频词词频频次越高, 则说明游客对中国世界遗产景区满意度因素某一构成要素的认知深刻度和关注度越高, 结合旅游者游记体验数据与中国世界遗产景区的实际情况, 通过归纳整理提炼游客对中国世界遗产景区满意度的影响因素维度, 最终将中国世界遗产景区的情感特征满意度因素解构为景区氛围、 景区服务、 游憩体验、 旅游资源、 游憩时间、 旅游活动、 身心体验、 旅游环境8个具体维度(表3).
表3 中国世界遗产景区游客情感态度词汇表
统计发现, 负面词汇出现的频次整体低于正面词汇频次, 说明游客对中国世界遗产景区的总体网络满意度较高, 积极的方面主要体现在对景区氛围、 景区服务、 游憩体验、 旅游资源等方面的认知评价, 刻画的是游客闲适放松的精神诉求, 求新求异的探奇心理, 以及游后的满足感. 而负面词汇的出现, 更值得我们重视与关注, 通过对情感高频词要素分类, 得出影响旅游者满意度的因素主要表现在游憩时间、 旅游活动、 身心体验和旅游环境4个方面:
1) 游憩时间. “短暂、 耽误、 着急、 延误、 浪费时间”等词表现了游客因游憩时间与闲暇时间的短暂而产生了不满, 一方面表明了中国世界遗产景区的独特魅力与吸引力; 另一方面表明了景区相关设施和管理方面的不完善. 相关评论有“时间紧凑、 延误行程、 司机待客延误时间、 错过景区预约时间、 错过游览其他景区的时间”等. “迷路”一词, 反映出景区标识系统不完善、 导引标识不明确等问题. 因此, 在景区管理方面应适当延长景区营业时间、 完善景区标识系统、 优化景区导览系统、 设立景区节点地标.
2) 旅游活动. 旅游活动的体验满意度直接决定了旅游者的重游意愿和旅游形象的积极感知. “可惜、 遗憾、 放弃、 失望、 浪费、 困难、 无聊”等词反映了游客期望落空后的遗憾以及对景区无序现象的不满. “失望、 后悔”表明游客在游览过程中因排队时间较长、 客流量较大而感到失望, 但因景区丰富的旅游资源特色以及可观的游憩价值错过而感到可惜与后悔. “忽悠”一词突显了景区名过其实以及过度的商业化气息. “无聊”则表明景区内容单一, 缺乏娱乐性的活动. 这为景区打造融合娱乐性、 知识性、 游憩性、 故事性等特征的游玩与体验项目提供了一定的参考价值.
3) 身心体验. “排队、 拥挤、 人多”等词表明景区的客流量和内外部交通的拥挤现状. “疲惫、 艰辛、 疲劳”等词体现了旅游者在体验过程中出现的身体疲倦状态, 便不会产生良好的体验感. 相关评论有“人多、 排队时间较长、 攀爬景区体力消耗大”等. 因此在淡旺季不同时段, 加大利益相关者的引入, 调控客流、 维持秩序、 安抚游客情绪、 提供优质服务、 降低旅游疲倦感是提升景区形象与游客满意度的有效途径.
4) 旅游环境. 大多数中国世界遗产景区, 交通的可达性是诱发旅游者产生旅游动机和影响旅游满意度的重要环节. “破坏、 毁坏”主要体现在遗产型景区的高强度旅游开发方面, 因此如何处理遗产保护与旅游开发之间的关系, 是景区面临的首要问题. 其次, “污染、 垃圾”等词主要表现在个别景区的环境状况, 树立景区环保意识、 加强景区治理、 削弱不可抗力因素带来的消极体验感是确保游客满意度的关键所在.
2.2.2 共词矩阵分析
高频词在一定程度上是游客满意度的具体表现, 但不能反映词频之间的关系强度与共现次数. 为了理清高频词之间的关系强度, 选取集搜客共词匹配功能, 构建共现矩阵词表, 使用Gephi进行可视化分析. 关系强度是两个特征词共同出现的频次, 频次越大表明两者之间的关系越紧密; 特征词相互间的数值越大, 则节点颜色越深、 字体越大.
如图3所示, 在中国世界遗产景区正面词汇语义网络图中, 可以发现“特色、 著名”之间联系数量最多, 是游客产生积极满意度的核心支撑因素, 也从侧面说明游客对中国世界遗产景区旅游资源、 旅游品牌特色的普遍认知度较高. “独特、 自由、 美丽、 吸引”等是中心词汇的拓展与延伸, 表明旅游资源的丰富性、 文化自然的观赏性以及世界遗产的独特性是旅游者提到次数最多的积极体验评价. “特色—著名、 特色—独特、 特色—自由、 特色—方便”等词保持高连接度, 凸显了中国世界遗产景区独具特色的历史文化底蕴及自然游憩环境价值.
图3 中国世界遗产景区正面词汇语义网络图
如图4所示, 中国世界遗产景区负面词汇语义网络图以“离开、 可惜、 排队、 遗憾”等词为中心分散展开, 线条连接度较为密集, 是游客对此类景区旅游形象满意度的直接体现和总体游后印象, 也是值得关注的重要组成板块. “离开—遗憾、 排队—离开、 可惜—离开、 人多—排队”等多组词汇之间的关系强度表明部分中国世界遗产景区仍存在旅游过度开发、 人满为患、 管理措施不足等相关问题, 这对未来中国世界遗产旅游目的地品牌塑造和游客满意度提升方面具有一定理论借鉴作用.
文章基于网络用户与现实游客的关注度进行相关性分析, 结果表明百度指数与网络游记的对应关键词两类数据存在显著正相关关系. 通过描述性统计法和层级分析法了解中国世界遗产景区的网络关注度差异. 并通过网络文本分析识别影响游客情感满意度的特征词, 依据正负面情感影响因素建立其分析类目, 提出切实可行的发展对策. 结果表明: ① 网络用户的景区关注度在2011-2017年呈现出逐渐上升的发展态势, 2018年略有回落, 2020-2021年受新冠疫情影响有明显的下降趋势. ② 网络用户关注度与游客关注度存在显著性正相关关系, 但网络用户关注度与游客关注度之间差异较大, 呈现出“名过其实”“名小于实”“名副其实”的3大类关注态势. ③ 游客满意度主要以积极情绪为主, 丰富的旅游资源、 浓厚的景区氛围、 较高的服务质量等是旅游者产生积极情绪的显著性表现, 而影响游客满意度的因素主要体现在游憩时间、 旅游环境、 旅游交通、 身心状况等体验感知方面.
中国世界遗产景区在网络关注度上存在较大差异. 虽然目的地具备了世界级的荣誉, 但缺少有效的宣传与推广, 导致关注度高景区与低景区之间的差异性较大. 因此, 要提高中国世界遗产景区的整体关注度和游客满意度, 促进中国世界遗产的进一步保护和开发, 仅依靠世界遗产地的声望显然是不够的, 文章提出以下发展建议:
4.2.1 削弱新冠疫情影响, 促进旅游营销升级
中国世界遗产景区网络关注度呈现出明显的阶段性增长特征, 从2020年开始, 新冠疫情对中国世界遗产旅游景区的网络关注度造成了巨大的冲击, 但线上购物、 线上教育、 线上医疗、 线上共享等为旅游业的重塑带来了难得的机遇. 如做好突发事件信息与本地政府信息的协调统一, 打造属于自身官方的旅游网站, 加强与其他线上旅游企业(OTA)、 互联网企业以及政府、 线下企业、 院校的合作, 共同推出集成性、 创新性的线上特色遗产旅游产品, 同时借助新媒体手段, 如“三微”、 旅游官方网站、 微信公众号等旅游UGC平台, 定期推出优惠旅游产品、 定制特色旅游路线, 规划前期预览、 中期导引、 后期共享的多功能供应链、 产业链、 资讯链, 将遗产名录、 遗产教育、 遗产资源等信息进行多样化、 差异化的宣传, 拉近网络用户、 现实游客与世界遗产的距离, 提高中国世界遗产景区的知名度和关注度.
4.2.2 重视景区品牌建设, 深入挖掘景区特色
网络用户与现实游客之间形成了层级错位分布的关注态势, 因此在注重中国世界遗产景区之间差异化、 个性化营销的同时, 还应提高景区自身的旅游服务质量. 首先针对“名过于实”类的景区应从景区自身内部出发打造功能区、 知识区、 观赏区、 游憩区、 休闲区等一体化与个性化的功能板块; 其次对“名小于实”类景区, 应深入挖掘属于景区自身的特点, 以此为营销点, 扩大宣传, 提升知名度, 打造世界遗产品牌形象; 最后对“名副其实”类的景区应根据市场规律与游客需求特征, 如家庭旅游者想让孩子了解历史文化、 开拓视野等, 加深游客需求与景区资源的有机融合, 增加体验性、 娱乐性、 教育性突出的旅游项目, 拓宽“线上+线下+融合”的营销战略路径, 提升景区知名度和游客满意度、 忠诚度.
4.2.3 整合区域旅游资源, 提升整体满意水平
游客满意度是旅游目的地经营商与管理者优化旅游目的地形象的最佳推动力量, 而影响游客满意度的因素主要体现在游憩时间、 旅游活动、 身心体验、 旅游环境等形象感知方面, 因此需要从以下几个方面予以改善. 首先, 应挖掘虚拟体验、 文化科普、 艺术互鉴、 体育探险、 餐饮购物等旅游产品, 丰富全时业态, 带动二次消费, 以增强游客对中国世界遗产景区的感受与体验; 其次, 要把环保教育纳入景区教育计划之中, 通过媒体宣传、 实际体验, 将理论与实践有机结合, 如通过开展季节性露营活动、 组织志愿团队, 将环保知识和理念广泛、 深入地融入旅游的实践之中; 再次, 应按照季节性变化规律, 推出春季研学踏青游、 夏季避暑休闲游、 秋季户外体验游、 冬季冰雪观光游, 融合民俗节庆活动与观光体验活动; 第四, 应充分发挥景区客流数据监控作用, 形成线上客流预测、 网上预约参观, 线下加强客流疏导, 缓解景区拥挤状况、 承载压力以及游客体验状况.
由于目前中国世界遗产网络关注度方面的研究成果较少, 在参考现有学者研究成果的基础上, 文章基于百度指数与携程网对中国世界遗产景区国内网络关注度与满意度进行了探索性研究, 但网络用户与现实游客在搜索与记录游览数据时仅仅只依托此两大平台, 而其他搜索引擎(如谷歌、 360)及其他旅游网站(如去哪儿、 同程)等平台的数据收集较为欠缺. 同时, 中国世界遗产具有世界级的荣誉称号, 是国内外重要的旅游目的地, 数据来源的单一性忽略了国际旅游者对中国世界遗产旅游目的地的关注度与满意度特征, 在未来研究中应通过多渠道、 多样化的手段扩充数据的收集, 以此进一步提升研究的科学性.