伏学习,马识途,李娟,聂蓓捷,和家欢,杨会娟,4
(1河北农业大学 园林与旅游学院,河北 保定071000;2南开大学 商学院,天津 300071;3河北省木兰围场国有林场,河北 承德 068456;4河北省城市森林健康技术创新中心,河北 保定071000)
旅游目的地形象是吸引旅游者的关键因素,代表了旅游者对目的地的观点与印象,良好的旅游形象可以提高游客满意度,有利于旅游目的地长期发展[1-2]。Baloglu提出目的地形象感知由认知形象、情感形象和整体形象3个部分组成[3]。其中,认知形象是指对目的地各种旅游属性的认知与感受;情感形象是指旅游者对旅游目的地各种旅游属性的情感态度[4];整体形象感知是对旅游目的地整体环境的感知,受旅游认知形象和情感形象共同影响。
传统旅游目的地形象感知一般采用问卷、访谈等方法对旅游者进行调查,存在样本量小、主观性强等不足[5-7]。随着互联网的发展,更多的用户将原创内容上传至社交网络,“由用户产生的内容(UGC)”概念兴起。这类数据可以分为两大类,一类是网络文本,如游记、评论等;一类是网络照片,其中网络照片主要包含2个重要信息:照片元数据(附带的地理位置、时间等信息)与照片本身的视觉内容[8]。大多数基于UGC数据的目的地形象感知研究侧重于对网络文本与照片元数据的分析[7,9-12]。与文本数据相比,照片是旅游者关于旅游地感知的视觉化表达,更能反映旅游者本身的认知与情感,是了解旅游者对旅游地感知的重要途径[13-14]。因此,通过照片可以获取游客关于旅游地的认知形象和情感形象。
深度学习是对数据进行表征学习的方法[15]。基于深度学习的计算机视觉技术的快速发展,使大规模图像视觉内容的识别成为可能,为UGC图片分析提供了新的研究技术。张坤等使用深度学习模型,对北京入境游客的旅游照片识别出103种场景类别,分析了入境游客对旅游地的整体感知特征[16];邓宁等基于深度学习模型对Flick图片进行分析,比较了不同来源地旅游者对旅游地形象感知的差异[17];范梦余等基于DeepSentiBank 模型对地理标记照片进行解析,分析了内蒙古地区的认知与情感倾向[18]。利用深度学习处理UGC图片成为旅游地形象感知研究的热点,但研究尺度上以国家、省域、城市为主,因数据获取难度较大,将深度学习运用于森林旅游地形象感知的研究较少。
旅游目的地情感形象研究多采用ROST情感分析软件对网络文本进行分析,产生情感偏差的原因方面多由旅游服务设施等方面引起,一定程度上忽略了景观本身,如景观要素空间分布和组合特征对情感的影响[19-20]。在景观美学评价中,部分学者对视觉景观偏好与景观格局指标之间的关系进行研究,Schirpke等人研究指出,斑块形状复杂性、景观多样性和景观结构的丰富度与视觉质量呈正相关关系,Dramstad等研究表明,景观类型数量、斑块数量及多样性与视觉景观偏好呈显著相关性[21-22]。因此,景观的情感也与景观的构成和空间格局具有一定的关系。景观指数是衡量景观格局结构的定量指标,利用景观格局指数研究照片中景观要素在空间中的分布特征,可以阐述不同照片产生不同情感的具体原因[23]。
对于森林旅游地而言,自然景观是各种旅游属性的核心,是人们旅游的主要动力来源。因此,以游客上传至网络的塞罕坝自然景观照片作为研究对象,利用深度学习对照片所反映的景观内容进行解析,同时,将照片所反映的景观进行分类研究,结合景观生态学指标探讨不同类型景观产生不同情感原因,可为森林旅游地的景观提升与形象优化提供科学依据。
塞罕坝国家森林公园(E 116°32′~118°14′,N 41°35′~42°40′)位于河北省承德市围场满族蒙古族自治县境内,地处内蒙古高原与河北北部山地的交界处。区域平均海拔1 500 m,寒温带大陆性季风气候。主要乔木包括白桦(Betulaplatyphylla)、华北落叶松(Larixprincipis-rupprechtii)、云杉(Piceaasperata)、樟子松(Pinussylvestrisvar.mongolica)等,生态系统复杂多样,生物多样性丰富。塞罕坝作为森林旅游地,拥有森林、草原、湿地、沙漠等自然景观,已开发七星湖、塞罕塔等旅游景区。
“六只脚”“两步路”与Flickr网站分别是国内与国外最大的旅游照片记录与分享的平台之一,本研究以“塞罕坝”为关键词,使用“八爪鱼”软件对“六只脚”“两步路”以及Flickr网站进行照片的爬取,见表1。
表1 照片数据来源
由表1可知,共爬取3 253张照片,删除图像模糊、拍摄对象不明确以及非景观照片,筛选出以风景为主的照片,最终获取有效照片共计1 656张,照片拍摄时间集中在2014年—2021年。
1.3.1 景观要素提取 图像语义分割是指为图像中的每个像素点分配一个预先设定好的表示其语义类别的标签,可识别出图片不同要素并计算出各要素占比[24]。本研究采用Yao等提出的基于全卷积神经网络(FCN)的图像语义分割软件进行语义分割,运用FCN网络在ADE-20K数据集进行训练,可识别出150种物体,在训练集的识别精度为81.44%,测试集的识别精度为66.83%,表现出良好的性能[25]。对选取的1 656张照片进行图像语义分割,可输出16位的分割PNG图像数据及各景观要素占比,其要素为照片内容的解析,体现了景观的认知形象。图像语义分割示意,见图1。
1.3.2 情感形象分析 DeepSentiBank是由哥伦比亚大学Chen等研究者开发的基于图片深度学习的分析工具,可将图片信息转化为文本,生成由231个形容词和424个名词组成的2 089个ANP(“形容词-名词”组)[26]。根据ANP与图片内容的相关性进行排序,排序靠前的ANP数值越大,表示其与图片内容越相关。基于DeepSentiBank解析图片流程如图2。
图2 基于Deepsentibank解析图片流程
运用DeepSentiBank对景观照片进行解析,并计算景观照片的每1项ANP出现的次数。本研究仅统计每张照片的前10项ANP,以突出重点认知形象与情感形象。其名词部分表示为游客对塞罕坝景观的认知形象,形容词部分表现情感形象。
HowNet情感词典由91 016个中文词语和85 295个英文词语组成,并为每个词和词组标注了基于义原的定义以及词性、情感倾向等信息,可将词语进行正向、负向的情感分类[27]。经ANP词组的形容词与HowNet词典比对发现,部分词汇与HowNet不重合,由园林专业教师及研究生对此类形容词进行正、负向的情感分类。
则该张照片的情感值计算方法为:
Vi=Pi-Ni
(1)
式中:Vi为某张照片情感值;Pi为照片正向词数量;Ni为负向词数量。情感值Vi的取值范围为-10~10,当-10≤Vi<-3时,照片情感倾向为负面情感;当-3≤Vi≤3时,照片情感倾向为中性情感;当3 1.3.3 照片景观格局分析 景观格局指数对景观类型斑块的数量、分布的定量描述具有重要意义,为探索不同照片产生情感偏差原因,本研究引入描述景观格局的相关指标[28]。将图像语义分割的图片导入Arcgis进行可视化,将数据导出为TIFF格式,利用Fragstats进行指标计算,对照片的各景观组成成分的空间分布和组成特征进行分析。景观格局指数包含斑块水平、类型水平、景观水平3个层次,其中,景观水平的指标针对整体的景观特征进行分析处理,因此本研究基于景观层次指标进行选取,结合前人对景观美学与景观生态学指标的研究,最终选取:斑块数量(NP)、斑块丰富度(PR)、斑块密度(PD)、景观形状指数(LSI)、最大斑块指数(LPI)、香农多样性指数(SHDI)、香农均匀度指数(SHEI)7个指标[21-22]。各指标含义及计算,见表2。 表2 景观指数选取 2.1.1 景观要素提取 对筛选出的1 656张照片进行图像语义分割并计算各要素占比,见图3。 图3 景观要素构成 由图3可知,在150个要素类别中,占比超过0.10%的要素有29类,可反映86.82%的要素信息。其中占比最多的5类要素为天空(sky)、树(tree)、场地(field)、地面(ground),草(grass),分别占比36.51%、11.68%、7.30%、5.96%、4.89%,占比全部要素的66.34%。由于150类景观要素过于碎片化,根据视觉感知的相似性,将29类景观要素重新归纳为9大类景观要素,分别为天空、植物、地物、水体、山石、建筑、人物、车辆、动物。景观要素分类,见表3。 表3 景观要素分类 由表3可知,天空是塞罕坝游客拍摄照片的核心构图元素,其占比高达36.51%,是塞罕坝最具吸引力的景观要素,关注度远高于其他要素;植物、地物占比分别达到了17.69%、17.34%。天空、植物和地物3个景观要素构成了大多数照片的主要部分。而水体、山石、建筑等要素是游客照片所反映的次要元素,其占比均高于1.00%;人物、车辆、动物等要素占比则较低,其占比均小于1.00%。 2.1.2 景观要素聚类 具有相似元素的照片结合起来会形成一种风格或范式来强调景观的独特点,运用K-Mean聚类分析对景观要素进行聚类,参照岑先梅对景观类型分类结果,结合研究目的,最终将照片确定为4类[29]。统计各类别景观要素占比,见图4。 图4 各类别景观要素占比 由图4可知,第一类别中,植物要素占比最高,为57.86%,定义第一类别为植物景观;第二类别中,天空要素占比最高,为63.47%,定义第二类别为天气天象景观;第三类别中,天空占比28.55%,水体占比25.32%,水体要素占比也较高,定义第三类别为水域景观;第四类别中,地物占比41.64%,将其定义为地物景观。 2.1.3 照片景观格局分析 为探究景观指数在不同景观类型间的差异,对景观类型间的景观指数进行方差分析。景观格局指数方差分析,见表4。 表4 景观格局指数分析 由表4可知,斑块数量(NP)、斑块密度(PD)常用来描述景观的异质性与破碎化程度,其中,水域景观的NP与PD最大,分别为787.34、2 714.65,显著高于其他景观类型,表明其景观的破碎化程度较高;而天气天象景观的值最小,分别为410.84、1 385.82,景观破碎度最低。在斑块丰富度(PR)方面,水域景观和地物景观的斑块丰富度较大(14.29、13.41),景观组成的类型数量较多,显著高于植物景观和天气天象景观(11.01、11.46)。最大斑块指数(LPI)是指某一景观类型最大斑块的占比,可反映出景观的优势度,方差分析可知,各景观类型间均呈显著性差异,其中天气天象景观值最高(56.34),其次为植物景观、地物景观(44.09、39.19),水域景观的LPI最小(37.21),表明其优势景观要素不明显。景观形状指数(LSI)代表斑块形状的不规则程度,在一定程度上反映景观受人为干扰的程度,水域景观与地物景观的LSI显著高于其他景观类型(7.59、6.08),表明其受到人为干扰程度较大。多样性指数与均匀度指数代表了景观的多样性和均匀程度,水域景观的多样性指数与均匀度指数较高(1.63、0.63),表明景观类型在景观空间中呈均衡化分布。 2.2.1 情感高频词对比 各类型景观形容词高频词统计,见表5。 表5 各类型景观形容词高频词统计(前10项) 由表5可知,游客对塞罕坝各类型景观情感具有一定差异。植物景观集中表现为晴朗、多雾、自然等,情感以正向为主;天气天象景观多为干净、荒凉、伟大等;水域景观则表现出平静、清静等;地物景观表现出自然、荒凉、野生等,情感形象以负向为主。 值得注意的是,"干燥的"在植物景观、天气天象景观、地物景观中均为最高情感词。这可能与塞罕坝地区的气候相关。塞罕坝地区属温带半湿润季风气候区,冬季漫长,低温寒冷;春季错后,干燥多风;夏季不明显,光照强烈;昼夜温差大;降水量偏少;蒸发潜量大于降水量;大风、沙暴、干旱、霜冻等灾害性天气比较多。 2.2.2 情感倾向 各景观类型情感倾向占比,见表6。 表6 各景观类型情感倾向占比 由表6可知,对塞罕坝景观具有正向情感比例为26.57%,中性情感比例为33.27%,负向情感比例为40.16%,负向情感高于正向情感。从不同景观类型来看,植物景观呈现“正向>负向”形态,天气天象景观、水域景观和地物景观则负面情感高于正面情感。其中,地物景观的正向情感与负向情感比例差距最大,差值为24.37%,最小的为水域景观,为0.57%。植物景观、天气天象景观分别是正向情感比例最高和负向情感最低的景观,分别为34.98%、28.40%;地物景观是正向情感比例最低、负向情感比例最高的景观,分别为16.86%、41.23%。 2.2.3 情感值与照片景观格局指数相关性分析 为探究情感值与景观格局指数之间的关系,采用Spearman相关性分析。照片情感值与照片景观格局相关性分析,见表7。 表7 情感值与照片景观格局相关性分析 由表7可知,照片的情感值与斑块数量、斑块密度、景观形状指数呈现极显著负相关(P<0.01),与最大斑块指数呈现显著正相关(P<0.05),与其他指标无显著相关关系。这表明,随着景观的异质性、破碎度以及人为干扰程度的增加,其景观的情感值呈现下降趋势,而具有明显优势景观要素的出现提高了照片的情感值。 塞罕坝相关图片景观感知统计,见表8。 表8 塞罕坝相关图片整体景观感知统计表(前10项) 由表8可知,蓬松的云、风景道路、美丽的云彩等景观出现的频率较高,是游客对塞罕坝地区的整体感知。湖、云、风景、道路等名词出现频次均较高,这表明图像语义分割与DeepSentiBank在认知内容上具有较高的一致性,判断较准。根据塞罕坝相关图片形容词高频词统计,总体而言,游客拍摄照片所蕴含的情感多为干旱、荒凉等负面情感词语,同时自然、干净等正面情感词语占比也较高。 丰富的网络照片数据为旅游目的形象研究提供了新的视角,游客上传网络的照片不仅是旅游者对旅游地形象的特殊表达形式,更是旅游者对旅游地形象的整体认知,在一定程度上反映了其对旅游地相关资源和特征的认知偏好[30-31]。以往利用图片大数据研究旅游地形象感知多集中于国家、省市域等尺度较大的区域,针对景区尺度,由于数据获取难、数据量少等原因研究较少。森林旅游地主要依托森林、湖泊、湿地等景观,这些景观是各种旅游属性的核心,因此,对塞罕坝自然景观进行研究,可为森林旅游地独特景观资源的高水平保护和精准化提升提供科学依据。 当前,深度学习应用于旅游地认知形象研究主要体现在图像标签识别上,少有研究对景观照片的组成要素进行解析,本研究利用图像语义分割对照片内容解析,能够快速掌握照片中的关键信息。在认知形象方面,天空是旅游者拍摄的核心景观要素,占比36.51%,表明大面积的天空占比及开阔的视线是吸引游客的主要因素。地物、植物、水体等要素则具有较高的提升潜力。通过聚类分析将塞罕坝景观分为植物景观、天气天象景观、水域景观、地物景观,符合塞罕坝“水的源头(水域景观)、云的故乡(天气天象景观)、花的世界(地物景观)、林的海洋(植物景观)”的旅游地宣传形象,机构投射形象与旅游者感知形象保持了一致。其中云彩、道路、森林等是游客对塞罕坝景观整体感知形象,可成为塞罕坝地区旅游营销的重点,在旅游形象宣传资料中作为主景照片。 利用深度学习进行照片情感研究尚处于探索阶段[32]。本研究基于DeepSentiBank情感分析模型,对照片所反映的内容进行情感分析,同时,尝试结合景观生态学指标解释产生情感偏差具体原因。地物景观正向情感最低(占比16.86%)而负向情感最高(占比41.23%),是塞罕坝地区情感形象薄弱环节,为旅游形象优化的重点对象。地物景观由于受到人为活动干扰较大,景观破碎化严重,从而导致多样性指数较高,景观要素相对丰富,复杂程度较高,且景观过于均质化,优势度不明显,造成游客情感呈现负面倾向,这与公众对过于破碎化的景观觉得缺乏美感的研究结论一致[33-34]。而植物景观由于受人为干扰程度较小,存在优势景观要素,导致图片呈现正面情感倾向占比较大。水域景观的破碎化程度与人为干扰程度也较高,但由于天空和水体要素占比较大,导致游客正面情感倾向占比较高,这与前人研究结果类似,天空、水景是最具吸引力的景观元素[35-37]。天气天象景观的负面情感占比最低(占比28.40%),主要是由于受人为干扰程度最小,景观破碎化程度最低,优势度最明显,所以大多表现出正向与中性情感。 选取游客上传网络的塞罕坝景观照片,利用深度学习研究基于景观尺度的森林旅游地认知情感形象,引入景观格局指数解释照片所反映的情感偏差原因,可以得出以下结论。 (1)天空是塞罕坝游客拍摄照片的核心构图元素,即最具吸引力的景观要素,地物、植物、水体等要素则具有较高的提升潜力。通过形象聚类,可将塞罕坝地区景观分为植物景观、天气天象景观、水域景观、地物景观。 (2)塞罕坝游客在照片中的情感表达总体上表现为正向及中性情感。就不同类型景观而言,植物景观正向情感比例最高;地物景观正向情感最低而负向情感最高。 (3)基于照片景观格局分析可知,在不同景观类型上,水域景观的斑块数量、斑块丰富度、景观形状指数最高,天气天象景观的最大斑块指数最高。照片景观空间格局指数与情感值相关性分析结果发现,情感值与景观的破碎化程度、人为干扰程度呈现极显著负相关关系,与景观类型的优势度呈现显著正相关关系。2 结果与分析
2.1 认知形象分析
2.2 情感形象分析
2.3 塞罕坝景观整体形象分析
3 讨论
4 结论