毛志睿 高钰桔 陈笑葵
1 昆明理工大学建筑与城市规划学院 昆明 650500 2 广州市城市更新规划设计研究院有限公司 广州 510030
公园作为服务群众日常生活的公共服务产品和城市绿地系统的核心组成部分,承载着美化环境、休闲游憩、传承文化等重要功能。十九大报告指出:“中国特色社会主义进入新时代,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。”在此背景下,营造大众喜爱的城市公园景观环境对于增强人民幸福感、实现城市高质量发展具有重要意义。因此,有必要对城市公园进行客观合理的景观评价,从而为公园的管理维护及其规划建设提供科学依据。
景观评价研究兴起于20世纪60年代,在对“基于专业/设计”“基于公众感知”等问题的讨论过程中,逐渐分化出专家学派、心理物理学派、认知学派和经验学派[1-4]。心理物理学派主要通过数理统计手段构建美景度与各景观要素关联的数学模型,定量描述特定景观环境的群体评价结果,因其良好的科学性、广泛性、敏感性、精确性和实用性被认为是更加可靠的研究模式[5]。目前主流评价方法包括且不限于美景度评价法(SBE)、语义差异法(SD)、审美评判测量法(BIB-LCJ)、层次分析法(AHP)等,其开展研究的基础数据主要依靠抽样问卷调查或专家打分的方式获得[6-10]。随着“通信与信息技术”和物联网技术的发展,景观评价过程中形成了有别于传统抽样调研和静态统计数据的新数据环境(New Data Environment)[11-13],越来越多的学者开始尝试借助新数据和新技术(如机器学习等)展开范围更广、基数更大的景观评价研究[13-16],其中网络用户生成内容(User Generated Content,UGC)指互联网用户在各类网络平台上面共享自己的原创内容所产生的数据,具体包括网络文本、网络图片和网络音视频等[17]。当前使用UGC数据进行景观评价尚处于起步阶段,如聂婷等[18]利用新浪微博和大众点评数据,通过词频分析挖掘了珠江景观意象和需求评价;李颖[19]基于携程网和去哪儿网评价数据,借助语义差异法、因子分析法和GIS分析法对丽水市景区进行评价分析,在归纳丽水市景区景观优劣势的基础上提出相应优化策略。
上述研究提出采用UGC数据进行大范围景观评价是一种可行思路,在一定程度上表明UGC数据可以作为传统抽样数据的有效补充,但仍缺乏对UGC数据运用于中微观尺度景观评价的进一步探讨。基于此,本文尝试使用UGC数据作为景观评价的基础数据,结合现场问卷调研,对昆明市主城区5个典型公园的景观视觉质量进行评价,旨在与时俱进地提出结合新数据和新技术的公园景观评价思路,丰富公园景观视觉质量评价的技术手段,为大规模公园景观评价和人性化公园景观环境营造提供支撑。
根据《城市绿地分类标准(CJJ/T 85-2017)选取昆明市主城区的大观公园、翠湖公园、黑龙潭公园、金殿公园、海埂公园5个市级公园为研究对象,公园筛选条件如下:1)考虑公园的尺度及实际使用情况,将面积在1 hm2以内的社区公园和游园排除在外;2)考虑到研究基础数据来源为网络用户生成内容,为保证数据客观性及公园服务对象的多样性,将专类公园排除在外;3)由于“用户生成内容”有价值密度低的局限性,为保证UGC数据的精确性,比对研究时间内各公园的用户生成内容数据,对数据质量较差的公园予以排除。
首先,借助Python3.7爬取并清洗公园的网络评论文本数据,确定评价指标,再实地发放问卷获得线下评论打分数据;其次,借助自然语言处理中的情感分析技术量化UGC数据,根据选取的评价指标筛选数据并以七段法的方式进行标准化处理,而后分别用网络评论文本数据与线下打分数据借助SD法对5个公园景观质量差异进行刻画;最后,使用因子分析法提炼公共因子并计算综合景观视觉质量。
1.2.1 UGC数据收集与清洗
美团网和携程网拥有规模庞大的网络用户群体,其商品、景点评价信息需要购买后才能发布,数据精度和可信度较高,因此选取美团和携程的评论文本作为本次景观视觉质量评价的基础数据。评论文本内容于2021年10月18日通过Python 3.7爬取获得,筛除乱码和无意义内容后最终获得15079条评论文本,其中大观公园3531条、翠湖公园2626条、黑龙潭公园2761条、金殿公园4449条、海埂公园1712条。对筛选后的文本内容进行分词、标注词性,去除方位词、代词等停用词后提取词频,选取与公园景观环境体验有关且出现频次大于25的形容词、名词、动词和习用语等。
1.2.2 评价指标选取
语义差异法(Semantic Differential,SD)又称感受记录法,能够将使用者对特定事物的心理感受进行量化并可视化[20]。本研究借鉴景观空间、环境感知、情感分析等理论,理解大数据的特点和优势,在可获取的UGC数据中,在充分考虑大众视角对景观评价的影响下,综合考虑各个公园的旅游资源和使用者的环境感知,从不同维度界定指标的范围,从而构建景观视觉质量评价指标。在语义差异法步骤中,需要尽可能收集和研究对象相关的形容词对,本文首先寻找以往文献[21-23]中出现的常用形容词对,然后依据章俊华[20]提出的筛选条件(一是剔除难以形成完全相对的形容词组,保证评价内容的正负两面性,避免形成片面的评价;二是剔除在中心点两侧形成不对称的形容词组,避免绘图出现差异;三是剔除不常用的形容词组,保证UGC社区用户能涵盖所选形容词组的范围),在统计出现频次大于25的形容词组的基础上,对UGC数据中使用者的评价进行归纳筛选,最终从景观内涵、景观空间、景观氛围和景观管理4个维度选取14项评价指标(表1),对相关形容词组进行归类,以统一游客同种含义不同表达的网络评价内容。
1.2.3 问卷调查与数据统计分析
现场问卷调研于2022年4—5月完成,分别对5个城市公园内游人随机发放问卷。问卷内容包括游人的基本信息及由UGC数据处理后筛选的景观视觉质量评价指标拓展得到的正反义词,将每个形容词按照“很好(3分)、好(1分)、一般(0分)、较差(-1分)、差(-3分)”5个等级进行划分,并对每项维度和指标进行量化计算,最后得到景观视觉质量评价得分。
自然语言处理(Natural Language Processing,NLP)是将人类语言习惯转化为机器所能理解的语言后对各类文本数据进行处理分析[24]。本研究对于UGC数据的处理是基于自然语言处理平台,借助朴素贝叶斯方法对人工标注的550条积极评价语料和550条消极评价语料进行机器学习训练,得到精度达到94.25%的情感分析模型。使用该模型对包含各形容词组内容的评论进行情感分析打分,根据七段法的原则将得分进行标准化处理,得到区间在[-3,3]的标准化网络评价数据(表2),标准化处理公式如下:
表2 网络评价数据标准化示意
式(1)中,Value为标准化后数据,senti为情感分析打分结果。
1.2.4 城市公园视觉景观综合质量分析
利用SPSS 25.0对获得的线上UGC数据和线下问卷打分数据进行主成分分析,在此基础上使用因子分析法提炼公共因子,采用最大方差法对初始因子载荷矩阵进行旋转以方便公共因子命名,最后以累积方差贡献率作为公共因子权重系数,加权求和获得公园景观视觉质量综合得分,计算公式如下:
式(2)中,E为公园景观视觉质量综合得分,Wi为第i个公共因子的权重值,Pi为第i个公共因子的得分。
本研究获取清洗整理后的网络用户评论文本共15079条。由表3可知:在用户信息公开的9032条评论文本中,网络用户年龄集中在16~54岁(90.8%),其中16~34岁的青年人占54.7%,35~54岁的中年人占36.1%;0~15岁的儿童占2.5%,55~80岁的老年人占6.7%。在问卷样本中,55~80岁的老年人占有效问卷数量的63%,35~54岁的中年人占24.7%,16~34岁的青年人占12.3%。根据上述年龄结构特征,两种方法互为补充,可以进行交叉验证。
表3 公园使用人群年龄结构特征
根据UGC评价数据标准化结果,绘制语义差异得分表(表4)。结果表明,公园景观视觉质量的影响因子中较为重要的有景观内涵维度的美感(2.57),景观空间维度的荫蔽度(2.69)和形体感(2.18),景观氛围维度的舒适度(2.77)、愉 悦 度(2.52)和 氛 围 感(2.41),景观管理维度的便捷度(2.18)和性价比(2.12)。
表4 基于UGC数据的语义差异得分情况
本研究共计发放调研问卷1000份,有效问卷900份。结果(表5)显示,公园景观视觉质量评分中较为重要的影响因子是景观氛围维度的舒适度(2.61)与氛围感(2.19),景观管理维度的便捷度(2.58)、整洁度(2.57)和管理水平(2.28)。
表5 基于问卷数据的语义差异得分情况
由于样本量小于变量个数,因此进行因子分析计算相关系数矩阵检验变量间相关性[25]。从两类数据中提炼得到特征值大于1的公共因子有4个,累积解释方差达100%,由于碎石图曲线在第5个因子以后放缓,因此选择4个公共因子足够解释原有变量(表6)。
表6 总方差解释情况
融合UGC数据和问卷数据的评价分值,采用方差最大法对初始因子载荷矩阵进行旋转。结果(表7)显示,进行旋转后的初始因子载荷矩阵在6次迭代后收敛,且各因子轴中因子负载≥0.5,故4个公共因子的命名分别为景观环境(历史感、荫蔽度、整洁度、性价比、形体感、趣味性),景观认知(特色度、美感、方向感、管理水平),景观氛围(氛围感、便捷度)和景观体验(舒适度、愉悦度)。
表7 因子负荷量
依项计算公园各项公共因子得分,进而得到城市公园景观视觉质量总体得分,结果如表8所示:对公众而言,景观环境对公园景观视觉质量影响力最大;其次为公园景观的认知感与氛围感;景观的体验感对公园景观视觉质量综合得分的影响力最小。
表8 景观视觉质量总体得分
经过自然语言处理技术量化后的UGC数据结合传统SD法、因子分析法能够较好地反映公众视野下的公园景观视觉质量差异。UGC数据获取的便利性意味着该思路可为大规模公园景观质量评价提供切实有效的支撑,但由于当前互联网使用群体的年龄段主要集中在16~54岁,研究结果存在一定局限性;而现场调研问卷数据采集灵活方便,信息获取简单,但在样本采集精力、采集数量等方面存在一定局限性。将UGC数据与现场调研问卷数据进行交叉比对验证,研究结果更为科学,置信度更高。
相对于以往研究者自主选择指标而言,采用UGC数据的优势在于此数据反映的是游客游览公园印象最深刻的内容,避免了研究者在指标选取阶段的主观臆断,但这一特质也限制了有特殊指标如声音、嗅觉等方面的景观质量评价研究。目前而言,UGC数据更适合作为景观视觉质量评价的依据,对公园等贴近居民生活的景观进行调查[26]。
从两类数据出发,以各自数据统计得到的公园得分平均值为基准与公园内部各指标得分情况进行对比,发现不同年龄段的居民对于城市公园景观视觉质量的关注点不尽相同。16~34岁的青年人一般在非工作时间使用公园以获得身心放松,他们对公园的特色、美感有较高的需求,更加关注公园的景观内涵;35~54岁的中年人对公园的景观管理水平有较高的要求,他们是社会责任的主要承担者,更整洁、管理有序的公园环境对这个年龄段的人群具有更强的吸引力;55岁以上的老年人侧重享受公园的景观氛围感,这个年龄段的人群有更高的健康意识和社交需求,更加关注公园景观的舒适度与愉悦度。
本文通过使用UGC数据和现场问卷调研相结合,对昆明市主城区5个典型公园的景观视觉质量进行评价,景观综合得分表明:翠湖公园景观视觉综合质量最佳,其次为大观公园、黑龙潭公园、金殿公园和海埂公园;公园的“景观环境”显著影响景观视觉质量得分,该因子主要涵盖历史感、荫蔽度、整洁度、性价比、形体感和趣味性6个方面,因此在各个公园后续规划建设中可有针对性地加强上述6方面的环境营造。
当前各公园景观视觉质量水平存在较大差异,提升方向感、趣味性等景观视觉质量因子是当前5个公园使用者共同的迫切需求。金殿公园、大观公园和黑龙潭公园景观视觉质量因子影响力相对一致,3个公园均需要提升其方向感的质量,翠湖公园需要提升园区的环境卫生水平,海埂公园需要加强景观内涵维度的质量。