我国绿色基础设施研究热点的可视化分析

2021-12-21 07:04翟慧敏胡郁祥周志远柴境浩程启先
关键词:词频风景园林热点

翟慧敏,肖 曼,胡郁祥,周志远,柴境浩,程启先

(1.信阳师范学院 地理科学学院/河南省淮河流域遥感大数据与智能分析工程研究中心,河南 信阳 464000;2.郑州轻工业大学 国际教育学院,郑州 450011)

现代城市中的传统市政基础设施以灰色基础设施为主,其具有功能单一、成本高昂等特点,且在城市雨水集蓄、污水排放和中水回用方面具有局限性,也未能从根源上缓解“城市病”.绿色基础设施遵循自然规律,利用自然生态过程中的循环模式,助力优美和谐的城市人居环境,对于城市可持续发展、城市土地精明保护等具有重要意义[1-2].在当前国内的相关研究中,一方面,绿色基础设施理念仍未达成普遍共识,而多以欧美等国的通行定义进行直接借鉴或间接参考[3-4];另一方面,未能较好结合国内节能减排、生态文明建设等工作的实际情况,致使相关研究常出现冗余、无序、甚至混乱等问题[5-6].

可视化分析是文献热点研究的有力工具[7].一些学者就生态城市[8]、海绵城市[9]、绿色基础设施[10]等内容进行研究热点的现状问题讨论、回顾与评述,但对于热点词间的拓扑与相关关系未能深入讨论.朱伟珠等[11]运用BICOMB 与SPSS 软件对我国生态城市领域的研究热点进行了可视化分析.该研究成果能够为本文的技术路径提供理论基础.本文拟运用BICOMB、UCINET 和SPSS软件对绿色基础设施的研究热点进行文献分析,以期明确我国绿色基础设施理念的基本内容,并为后续研究提供借鉴.

1 数据来源与方法

1.1 数据来源

本文的数据来源为:中国知网中导出“主题=*绿色基础设施*”“时间=*不限~2019 年*”的核心期刊文献,此处选取的核心期刊包括北京大学《中文核心期刊要目总览》来源期刊(北大中文核心)、中文社会科学引文索引(CSSCI)、中国科学引文数据库(CSCD)和工程索引(EI)共计4 类;剔除其中无作者、作者为“课题组”或“编辑部”的文献以及外文文献,导出281 篇“Note-First”格式的文献引文.BICOMB 软件是文本挖掘的基础工具软件,本文运用BICOMB 2.0 对引文进行文献梳理,合并如“GI”与“绿色基础设施”、“MSPA”与“形态学空间格局分析”等同义或近义关键词;运用“统计”和“矩阵”模块分别生成关键词的共现矩阵和词篇矩阵,并保存为相应的txt 或xls 格式文件备用.UCINET 软件是社会网络集成的基础分析软件,本文运用UCINET 6.0 的“Net-Draw”模块生成共现矩阵图[12].SPSS 软件是社会科学统计的基础分析软件,本文运用SPSS 23.0 的“系统聚类分析”模块生成词篇矩阵图[13].Excel 软件是微软开发的基础办公软件,本文运用Excel 软件中的“皮尔逊相关性系数”与“色阶”模块直接生成相关性系数图[14].

1.2 研究方法

“普赖斯定律”是文献计量研究的常用公式[15],即:

其中,N是所筛选内容的最低阈值;nmax是所筛选内容的最大强度值.强度值最大的关键词为“绿色基础设施”(137,括号内为频次值,下同),即:nmax=137,N≈8.77.存在8 个符合最低阈值的关键词,显然数量稀少,不利于后续研究,因此,本文参考“二八定律”进行筛选,公式为

其中,M是所筛选内容的最低阈值;a是所筛选内容中累计百分比达到前20%的频次值;b是所筛选内容中位次达到前20%的频次值.累计百分比、位次达到前20%的关键词分别为“城市绿色基础设施”(13)、“绿色雨水设施”(1),即a=13,b=1,M≈3.61.存在30 个符合最低阈值的关键词,显然数量更为合适,以便进行后续研究.

“皮尔逊相关系数”是科学统计研究的常用公式,具体原理不再赘述.在Excel 中进行皮尔逊相关系数计算的函数为

其中,R(i,j)是i与j行(或列)的(皮尔逊)乘积矩相关系数r值,其中r∈[−1.00,1.00];Pearson是Excel 中皮尔逊相关系数的函数公式;i,j是具体数据的行或列.

运用“首位度指标”计算各热点词的首位度,公式为

其中,O2,O4和O11分别是2,4 和11 首位度;F1~F11是热点次序的词频值,且∑F11的取值范围为2~11.

2 研究热点可视化分析

2.1 词频分析

热点词频表示该热点的强度,频次越大时该热点的强度也越大.依据“二八定律”中公式(2)所筛选的30 个热点及其频次见图1.

图1 绿色基础设施热点词频

由图1 可知,频次平均值和中位值分别为13.23 和5.50,频次变化基本符合以“自然底数”(e≈2.718 3)为底的指数函数规律;前8 位热点即为“普赖斯定律”所筛选的内容,分别为:“绿色基础设施”(137)、“风景园林”(57)、“低影响开发”(20)、“海绵城市”(19)、“生态系统服务”(15)、“绿色雨水基础设施”(14)、“城市绿色基础设施”(13)和“生态基础设施”(11),其余热点词频在4~8 之间.

“首位度指标”由城市地理学家杰斐逊(M.Jefferson)提出,最初概念为“双城市指数”,能够以简洁明了的数据模型来表示城市群或城市体系中大城市的集中程度,部分学者据此提出改进后的“首位度指标”——“四城市指数”和“十一城市指数”.结合韩玉亭[16]的观点,将“首位度指标”的概念引入文献计量分析中,即可用以计算各热点词的首位度,具体的首位度指标结果见表1.

表1 热点词首位度

由表1 可知,首位度数值普遍较大,且双首位度、四首位度和十一首位度的百分误差呈现增长趋势,即:从热点词频来看呈现出显著的“部分集中”特点,且运用“普莱斯定律”筛选出的8 个核心关键词能够代表该领域热点词的大致情况.

2.2 共现矩阵分析

经由UCINET 6.0 绘制的共现矩阵见图2.

图2 绿色基础设施热点共现矩阵

由图2 可知,热点的频次越多、强度越大,表明热点间的共现频次越多,联系越紧;热点间联系越频繁,其节点就越大.依据热点间的拓扑关系将其划分为不同颜色,主要有“风景园林-海绵城市”(红色)、“生态基础设施-城市绿色基础设施”(蓝色)、“形态学空间格局分析-绿地系统规划”(灰色)、“绿色城市-基础设施”(黑色)和“绿色发展-绿色金融”(紫色)共计5 个类型,其中热点词目较多且联系较为紧密的是“风景园林-海绵城市”、“生态基础设施-城市绿色基础设施”和“形态学空间格局分析-绿地系统规划”类型,分别有12,5和4 个词目,这表明绿色基础设施在风景园林学、城乡规划学和景观生态学方面的交叉、融合与创新发展.

2.3 词篇矩阵分析

经由SPSS 23.0 绘制的词篇矩阵见图3.

由图3 可知,热点被分为3 个聚类:1)“绿色基础设施-低影响开发”聚类.该聚类中共有11 个热点,相较于传统的“灰色基础设施”,以“低影响开发”为代表的“海绵城市”能够贯彻“城市规划”与“生态规划”中“生物多样性”等相关理念,经由“绿色(雨水)基础设施”进行“城市雨水/洪管理”.2)“城市绿色基础设施-基础设施”聚类.该聚类中共有10 个热点,广义的“城市绿色基础设施”是在城市规划建设中各项“绿色/可持续发展”的“基础设施”总和,如:“绿色城市”中的“绿色物流”、“生态基础设施”中的“绿色通道”与“景观规划”等.3)“风景园林-形态学空间格局分析”聚类.该聚类中共有9 个热点.“风景园林”中强调在“气候变化”背景下进行“生态系统服务”的“生态设计”;“形态学空间格局分析”中强调在“绿色金融”理念下进行“景观连通性”与“绿地系统规划”的“基础设施建设”.

图3 绿色基础设施热点词篇矩阵

2.4 相关性系数分析

经由Excel 绘制的相关性系数见图4.

图4 绿色基础设施热点相关性系数

由图4 可知,相较于共现矩阵图与词篇矩阵图,相关性系数图的可视化结果能够较为直观、便捷地展示变量间的相关性,且在敏感性和灵敏度方面表现尤为优秀,更适合捕捉热点间存在的细微差异.热点间的相关性越大,其色阶色块的颜色越深;相关性越小,其色阶色块颜色越浅.相关性最高值为各热点与自身的值(Rmax≡1.000 0);最低值为热点“绿色雨水基础设施”与热点“可持续发展”的值(Rmin≈−0.150 1);平均值Rave≈0.082 5;中位值Rmid≈−0.016 6.

将标准化处理后的频次(以最大值137 次为1.000 0)作为该热点词的频次系数x,各热点词相关性系数的均值作为相关系数y,则其独立样本T检验(经95%置信区间检验)结果为:x=0.100 0±0.070 0;y=0.082 5±0.027 5.所采用的关键词数据不具有时间演化属性,显然不存在非平稳序列等情况,因此不考虑进行单位根检验;一般的社会计量分析中要求拟合优度R2>50%,但在文献与档案统计分析中不常存在多重共线性等问题,因此拟合优度R2>30%即表示可以接受.采用线性、多项式和对数回归的具体回归分析结果见表2.由表2 可知,拟合优度R2在0.305 5~0.383 3,表明频次系数与相关系数具有一定的回归关系.

表2 频次和相关系数回归分析

3 结语

绿色基础设施理念于1999 年由美国可持续发展委员会提出,并经美国保护基金会和农业部森林管理局等进一步丰富和完善,相较于传统的灰色基础设施,绿色基础设施本质上是以生态化绿色环境网络设施为基础的自然生命支持系统,囊括一系列天然、恢复再造的生态元素与风景要素[17].当前我国绿色基础设施研究初步形成了以低影响开发、形态学空间格局分析等为切入点,以风景园林、海绵城市等为着力点的理论框架,并在居住区[18]、雨水花园[19]与湿地广场[20]等规划建设中进行了初步尝试.

本文以中国知网中的281 篇核心期刊文献为数据源,借助BICOMB、UCINET 和SPSS 等可视化分析工具,开展我国绿色基础设施研究热点的研究.研究结果表明:1)词频分析中经由“二八定律”和“普赖斯定律”分别筛选30 个和8 个热点,并发现热点呈现出显著的“部分集中”特点;2)共现矩阵分析中主要有“风景园林-海绵城市”、“生态基础设施-城市绿色基础设施”、“形态学空间格局分析-绿地系统规划”、“绿色城市-基础设施”和“绿色发展-绿色金融”共计5 个类型,且表明绿色基础设施在风景园林学、城乡规划学和景观生态学方面的交叉、融合与创新发展;3)词篇矩阵分析中主要有“绿色基础设施-低影响开发”聚类、“城市绿色基础设施-基础设施”聚类和“风景园林-形态学空间格局分析”聚类;4)相关性系数分析结果表明频次系数与相关系数具有一定回归关系.

本文尝试拓展了文献计量与可视化分析的应用范围,并丰富了绿色基础设施的主要内容,明确了可视化分析在绿色基础设施中的技术路径.但本文仅讨论了高频热点间的关系,对于热点中时序变化和学科差异的探讨不够深入,此外也未进行作者与机构等内容的讨论,这些内容有待后续研究进一步丰富与完善.

猜你喜欢
词频风景园林热点
风景园林设计中植物配置与规划研究
热点
乡土植物在工业风景园林中的应用研究
地域文化元素在风景园林设计中的应用
基于地域特征的风景园林设计
基于词频比的改进Jaccard系数文本相似度计算
热点
词汇习得中的词频效应研究
结合热点做演讲
词频,一部隐秘的历史