基于大数据分析的城市露营行为特征和绿地需求研究

2024-01-24 02:03周婷婷陈芷祺李丽
广东园林 2023年6期
关键词:词频绿地词汇

周婷婷 陈芷祺 李丽

随着人们对户外活动的日益重视,对亲近自然的愈发渴望,城市露营行为得到迅速发展。露营活动的增加对城市绿地功能提出了更多的要求,不局限于绿化生态功能和美化功能,还要满足多元化体验和社交互动的需求。为了推动露营健康有序发展,中华人民共和国文化和旅游部等十四部门于2022年11月联合印发《关于推动露营旅游休闲健康有序发展的指导意见》,明确提出科学布局营地建设的要求。现有绿地在初始规划和建设时通常侧重于提供生态效益[1],较少考虑到露营行为的需求。因此,从使用者角度出发,针对露营行为进行绿地需求研究是当前亟需解决的问题,能为今后绿地的改造建设提供参考。

随着大数据技术在各行各业的日趋广泛应用,风景园林领域迎来了前所未有的机遇和挑战[2]。传统的需求研究常采用问卷调查、对象访谈、市场调研、观察追踪等方法,这些方法的数据收集周期长,且可能存在信息滞后的问题。大数据本身所具有的多源、动态性、客观性、规模大等特点很好地规避了传统数据的缺陷[3],其数据类型包括实时采集数据(空间位置、行为轨迹)以及非实时活动数据(社交网络数据)。目前,大数据应用于城市绿地的研究包括3个尺度:在宏观尺度主要集中于生态环境质量、绿地系统规划领域,在中观尺度主要关注人群时空行为特征、城市绿地的空间活力,在微观尺度主要集中在绿地空间的满意度和评价、游憩情绪、景观设计评估以及服务管理价值等方面。但对于城市绿地偏好和需求的大数据分析研究较少。绿地需求主要包括心理需求和行为需求两方面[4~6],近年来研究者关注到了与使用者日常生活关系更为紧密的小尺度城市空间,需求类型也拓展到使用者的情感需求,且开始从使用者的视角出发进行相关研究[7~8]。

本文聚焦于微观尺度,尝试应用大数据文本分析方法,从使用者的角度探讨城市大众的露营情绪、偏好和需求。研究通过提取新浪微博注册用户发布的有关广州露营的文本,进行情绪分析、新词提取和主题建模、露营行为特征总结,挖掘露营行为的绿地需求,并根据不同需求提出相应策略,以期为我国露营绿地建设提供参考。

1 数据来源与分析方法

1.1 数据来源

新浪微博是互联网时代下的重要社交媒体平台之一,根据新浪2022年第四季度财报,其月活跃用户为5.86亿,日活跃用户高达2.52亿。因此,新浪微博用户言论可为需求相关研究提供良好的数据支持。本文使用支持动态抓取的Chrome浏览器爬虫插件——Web Scraper作为文本数据获取工具,以“广州露营”为搜索关键词,爬取于2019年1月1日—2023年3月27日发布的用户原创微博,获取了6 153条文本数据,并将其作为本研究的数据样本库。

1.2 分析方法

分析露营行为文本数据的步骤如下:1)使用大数据语义智能分析平台NLPIR-Parser(以下简称NLPIR)的情感分析系统进行露营行为情绪分析。该系统利用机器学习算法,自动识别文本中的情绪倾向,并将其分为积极、中性和消极三类[9~10]。2)利用NLPIR新词发现系统对微博用户在露营话题中使用的词汇进行统计,分析露营行为热点,以及用户对此的关注情况、偏好和需求等信息。3)采用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型[11]分析社交媒体文本数据,帮助找到文本数据中存在的主题和变化趋势[12],进而发现露营者的偏好和需求(图1)。

图1 技术路线图

2 结果与分析

2.1 相关微博数量

将获取的数据经过删除重复项、清除广告性质数据以及去除特殊字符等处理,最终得到5 640条有效数据,约142万字。其中,2019年至2023年(截至3月)每年的相关微博数量分别为118条、518条、1 269条、2 951条和784条。微博数量可以间接反映露营行为在社会中的受关注度和参与度。广州露营行为从2019年8月开始受到关注,且关注程度呈现逐年递增趋势(图2)。每年5月和10月前后,相关微博数量呈波动变化,发布数量达到近期峰值;相比之下,2月和11月发布数量较少。2022年5月,广州露营热度首次达到高峰,当月发布的微博数量多达445条。由此推测,假期和季节是影响露营行为发生的2个重要因素。

图2 广州露营相关微博数量变化趋势

为了验证猜想,本文进一步对广州市2019—2023年法定节假日期间与露营相关的微博进行数量统计。结果显示(表1),在五一劳动节和十一国庆节期间,广州露营相关微博的数量明显增多,尤其在2022年的2个假期的微博数量突出。具体而言,在法定节假日期间的露营相关微博数量共计602条,占总微博数量的10.67%;在劳动节和国庆节期间的相关微博数量共计346条,占总微博数量的6%。

表1 2019—2023年法定节假日露营相关微博数量 单位:条

2.2 露营行为情绪变化特征

逐月统计3种情绪倾向的微博数量占比(以下按“情绪+占比”形式简称),结果显示(图3):露营活动对大多数游憩者来说是积极的体验,积极占比稳定超过50%,平均积极占比基本呈现出逐年递增的趋势。广州露营活动在5年间的情绪波动幅度较大,尤其是2020年,在4月和8月积极占比增加明显,在8月达到最高点92.1%,但在9月消极占比达到最高点38.9%。2022年的相关微博发布数量最多,情绪整体稳定,平均积极占比较高,为75.6%。2023年城市露营发展快速,整体情绪积极性偏高,平均积极占比高达83.7%。

图3 2019-2023年广州露营情绪逐月变化

对广州露营情绪的季节变化进行分析,结果显示(图4):冬季(12月—次年2月)的积极占比最高,其次为夏季(6—8月)、过渡季(3—5月、9—11月),三季的平均积极占比分别为76.2%、75.2%、73.4%。具体来说,2019年与2021年冬季平均积极占比均大于其他两季节,2020年中夏季的平均积极占比最高,这可能是由于城市露营活动的兴起,人们露营情绪高涨。总体而言,在过去几年中人们在冬季的露营积极性一直较高,夏季则在某些年份成为积极情绪的高峰期。

图4 不同季节露营积极占比

通过深入查询微博文本内容,挖掘关于露营行为的情绪影响因素。基于NLPIR的新词发现功能,将研究文本数据库拆分成序列,并按照3种情绪类别分别提取关键词及其词频。在积极微博文本高频词中,露营本身作为一种亲近自然的活动,能够给游憩者带来轻松的生活体验,如“旅行”“消费”“生活”“打卡”“体验”等高频词。从游憩者在微博中常提到的“大自然”“生态”“美景”“风光”“星空”等与场地景观相关词汇,“拍照”“烧烤”“钓鱼”“派对”“团建”等与活动相关词汇,以及“体验”“享受”“治愈”“浪漫”“开心”等与心理感受相关词汇,可以看出露营行为的积极情绪受到场地的景观特征、活动类型以及社交体验等方面的影响。

选取与场地相关的微博高频词进行分析,发现负面评论频繁出现的词汇是“出行”“计划”“小时”“选择”“价格”“人群”“主题”“味道”“垃圾”“喧嚣”等,推断游憩者的情绪受当日交通情况、可达性等因素的影响较大,而消费因素对游憩者的情绪产生了一定程度的干扰,包括与“价格”相关的问题。此外,场地的清洁状况和安静度等环境条件,都直接影响到游憩者的露营体验,进而影响整体的露营情绪。

综上,城市露营带来了多维度的体验,景观美感、社交互动等因素在塑造露营行为的情绪维度中起到重要作用。在满足露营行为的自然环境与活动空间需求的基础上,美景、良好的可达性和场地所提供的优质服务也成为游憩者的追求。

2.3 露营行为关键词与权重

为提高文本处理效率和准确性,利用NLPIR 的新词发现系统,筛选并去除无效和不相关的词语(如“唯一”“还有”“是不是”等无意义词汇),对文本进行分词处理。根据分词所得到的新词与关键词词频(表2),综合权重与频率可得,提及次数多且权重高的3个词汇分别是大学城(权重9.30,频率147)、精致露营(权重8.43,频率99)、海鸥岛(权重7.99,频率130)。

表2 新词与关键词权重前10词汇

针对2019—2023年微博发言所提取的新词与关键词,从综合排名前100中筛选出30个与露营地点、景观、活动相关的词汇,形成各年度主要词汇网络关系图(图5)。由此可得,随着时间的推移,城市露营的地点和活动类型数量明显增加,这反映出城市露营受到的关注度日益提升,正逐渐成为人们热衷的户外活动之一。从各年份主要词汇的频率分析露营行为的发展变化:2019 年,露营活动主要集中在生态自然的地区。2020 年,人们逐渐以野餐的形式进入城市绿地。2021 年,人们更多地在城市绿地上搭建帐篷,进行多样的户外活动。这种趋势进一步推动了“精致露营”概念的流行,其体现了人们对休闲活动品质更高的追求。2022年被称为“露营元年”,“露营”一词提及频率达2 900次,可见人们对城市露营的关注度大幅提升。由上可知,城市露营是在野餐活动的基础上逐渐发展起来的。随着许多城市公园和景区的开放,露营地的范围也扩展至城市公园草坪、各类特殊公园绿地等城市公共场所。2023 年,露营活动在某种程度上发生了显著变化,其中下午茶和咖啡品饮等原本室内常见的活动,已延伸至在城市绿地中进行,为露营体验增添了新的元素。

图5 2019—2023年主要词汇网络关系图

对2019—2023 年微博文本中频繁提及的露营地进行区域统计,发现人们更倾向于选择位于越秀区(二沙岛、东山口、郊野公园)、天河区(华南植物园、珠江新城、珠江公园、海洋公园)、白云区(帽峰山)、番禺区(大夫山、海鸥岛、大学城、梁明城雕塑园)、花都区(北迹露营、芙蓉嶂)、增城区(白水寨)、从化区(通天蜡烛山、莲麻小镇、国医小镇、湿地公园)7个区域内的露营地。根据主要词汇网络关系,并结合微博文本所体现的露营具体空间特征,进一步探究露营行为选择和偏好关系。人们优先选择滨水型营地,包括二沙岛(词频140次)、海鸥岛(词频128次)、湿地公园(词频98次)、大学城(词频96次)等,活动类型涵盖野餐、放风筝、钓鱼、看日出等。其次,人们偏好选择城市绿地中的草地型营地,包括北迹露营(词频91次)、珠江新城(词频51次)、珠江公园(词频42次)、东山口(词频24次)等,这类营地主要用于以休闲为主的下午茶、喝咖啡等活动。同样,可以观星的山地型营地,如帽峰山(词频37次)、通天蜡烛山(词频4次)等也受到较高的关注。

综上可得,游憩者更倾向于选择近城市市区且景色优美的绿地进行露营,以展开多样化的户外活动。此外,他们对于安全和舒适的露营环境也提出了更高的要求。这一现象表明城市露营需求的多样性,涵盖了对自然美景和休闲活动等多个方面的追求。

2.4 露营行为主题聚类特征

本文采用困惑度和一致性作为LDA模型的评价指标,对露营主题进行识别,得到困惑度和一致性最佳主题取值范围分别为5~8和3~7,通过多次可视化调试,最终确定主题数为5。使用pyLDAvis工具在二维空间中绘制主题与词汇之间的关联性,其中λ=0.93。在主题视觉聚类效果图中(图6),每个气泡代表一个主题,气泡的大小反映了该主题在语料库中出现的频率。主题聚类的结果由每个主题类别中出现频数最高的前30个词汇组成,主题1 和5 在坐标系中相距较远,表明两者之间的差异性大。各主题气泡之间没有重叠的排列,说明主题数量此时达到理想状态。

图6 主题视觉聚类效果图

在主题特征词中(图7),除“露营”“广州”以外,出现频数最高的3 个关键词为“旅游”“户外”和“消费”,可以看出在疫情期间人们更渴望接近自然的活动空间,城市露营带来独特的体验感促进了其快速发展;在节假日和周末,户外活动需求达到高峰。针对露营活动,对主题内容进行凝练和文本聚类分类(表3),得出露营行为具有多元化、多角度、时尚性等特点,其中文本的主题总结为三大类别:1)追求满足精神世界的生活方式(词频占比61.4%);2)探讨城市旅游经济和城市生态的发展(词频占比26.7%);3)科技带来更加精致的露营(词频占比11.9%)。

表3 话题特征词汇分类

图7 主题特征词词频

微博发言中出现的如“压力”“放松”“疲劳”等词汇,表明现代人希望通过露营来逃离城市压力,寻求放松和快乐。通过分析“二沙岛”“星空”“紫色风铃”“交通”“距离”“生态”“装备”等词汇,可知人们在讨论露营地的美景时,也关注其可达性、服务设施和生态科技等方面。另外,以“小时”“公里”为关键词对文本内容进行搜索,发现露营通行时长为0.5~5 h,集中于1~3 h,通行距离多数在28 km 以上。联系“跨境”“地铁”“大道”等词可以看出,人们对于露营的路程时间可接受度较高。

3 露营行为的绿地需求挖掘

综上所述,露营行为的普遍化趋势表明,人们对于绿地的需求从心理需求过渡到基础设施的需求。通过对露营行为情绪、关键词和主题的分析,可以将人们对绿地的需求分为4个方面:自然和景观需求、户外活动和社交互动需求、空间可达性需求以及服务设施和生态科技需求。

3.1 自然和景观需求

露营是在自然环境中进行的活动,绿地质量对于露营体验的好坏至关重要。在现代城市化的环境下,人们产生对自然环境的向往和依赖,将亲近自然视为释放工作与生活压力、缓解焦虑情绪以及调节自身情绪的途径。此外,人们对露营地的期待不止是提供自然空间,还包括对美景的需求,以提升露营体验。人们通过在景观优美的地点露营来满足自身需求,与大自然建立亲密联系,将多元的生活方式融入露营的休闲体验中。因此,环境美观且生态健康是规划和建设绿地时考虑的基本条件。

3.2 户外活动和互动社交需求

文本中较多提及拍照、玩飞盘、烧烤、放风筝、“剧本杀”、观影、下午茶等多种活动,说明了现代人对于户外活动的需求越来越高,不再满足于简单的散步、野餐等,而追求更个性化的活动体验。高频词“活动”“生活”“朋友”“空间”“团建”“分享”等显示了现代人在生活和工作两方面都有社交需求。自然环境是理想的社交场所,为人们提供了相聚和交流的机会,这种社交活动被称为“自然社交”。自然社交可以有效增进人际关系,有助于人与人之间建立更深厚的情感关系[13]。

3.3 空间可达性需求

随着时间推移,露营地点的选择由城市生态区域向城市中心转移,并往城市各类公园进行扩散。高频词“小时”“出行”“自驾游”“交通”“距离”“导航”“大道”等表明,绿地需要具备便利的交通条件,以及为游憩者提供安全舒适的露营空间,满足人们对于露营地点的可达性和便捷条件需求。但与公园的可达性需求不同,人们通常愿意花费1~3h前往露营地,有的甚至达5h。

3.4 服务设施和生态科技需求

从高频词“服务”“消费”“体验”“产品”等可以看出,随着露营经济的发展,人们对于露营的需求发生了显著变化。初始的露营需求主要是享受自然和简单生活方式,如今人们开始追求更为舒适且便利的露营体验,例如配备天幕帐篷、烧烤炉、小型发电机等设备。为了提供更现代化的露营服务,许多露营地开始提供水电、厕所等基础设施,甚至应用科技和新能源来提高自身环境保护水平。例如,广州科学城广场采用了具有太阳能感应器的智能垃圾桶进行分类。

4 结论与建议

本文使用大数据文本分析方法,基于新浪微博用户发布的有关露营的文本,研究广州市城市露营行为的特征和对绿地的需求。结果表明,广州露营话题热度自2019年8月以来呈现逐年递增的趋势,随着露营活动的普及,人们对户外活动的需求在假日期间显著增加,特别是在五一劳动节和国庆节2个主要假期。露营活动对大多数游憩者来说是积极的体验,景观美感、社交互动等因素在塑造露营行为的情绪维度中起到重要作用。同时,人们对城市露营的需求不断变化,城市露营活动与话题的类型数量逐年增加。露营行为话题具有多元化、多角度和时尚性等特点,可以总结为追求满足精神世界的生活方式、探讨城市旅游经济和城市生态发展,以及科技带来更加精致的露营三大类别。由此,人们对于露营绿地的需求也具有多样性,主要涵盖自然与景观、户外活动与互动社交、空间可达性、服务设施与生态科技4个方面。

综上,为了让游憩者真正享受自然,提高其露营活动体验质量,保护自然生态环境并推动露营全面可持续发展,笔者对露营绿地的规划建设提出以下建议:1)建立健康营地,创造优美环境。通过城市绿化建设或开放共享区域,满足人们亲近自然的需求;注重美景需求,创造独特且优美的主题露营环境。2)组织交流活动,创造休闲条件。通过定期举办户外活动,建立社交平台,提供休憩区域和公共休闲设施等,提高游憩者的参与度、满意度和幸福感,满足其户外活动和互动社交的需求。3)保障出行便利。在规划建设露营地时应充分考虑交通和停车等因素,保证游憩者能够方便快捷地到达。4)保障服务安全,提升生活品质。在城市露营地服务和管理中,兼顾游憩者需求、环境保护和安全管理3个方面,为露营者提供多元化和个性化服务;科学规划草坪开放,倡导文明低碳乐享草坪,营造良好的露营氛围。

注:图片均为作者自绘

猜你喜欢
词频绿地词汇
基于词频分析法的社区公园归属感营建要素研究
可进入式绿地的养护与管理的研究
本刊可直接用缩写的常用词汇
一些常用词汇可直接用缩写
老城区绿地更新策略——以北京西城区绿地提升为例
本刊可直接用缩写的常用词汇
杭州市区春季绿地对PM2.5消减作用的研究
走进绿地
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索