基于多源数据的城市活力区域识别及驱动因素评估
——以上海市为例

2022-02-25 04:27邱兰清余萍马慧鑫
科学技术与工程 2022年3期
关键词:信息熵服务水平热力

邱兰清, 余萍, 马慧鑫

(天津农学院水利工程学院, 天津 300392)

城市活力是对于城市人口活动强度的概括和描述,是动态的、以人和活动为关注对象的主观概念。量化的城市活力是评价城市空间品质的重要指标,同时提升城市活力也是城市物质空间环境营造的目标之一。城市活力反映在空间上就是城市中的活力区域,活力较高的区域往往是各种社会性活动发生最为频繁、强度最大的空间,同时活力区域不仅自身需要具有较高的活力,而且对于周边区域应有带动和辐射作用,体现在空间上就是活力的高值集聚区。对城市活力区域的识别评估及其驱动因素的评估,无论是对于城市规划实践、政策制定还是城市空间问题研究都有着重要意义[1]。

对于城市活力的研究早在20世纪60年代就引起了学者的关注,如简·雅各布斯将“活力”作为评价城市空间形态质量的首要指标[2]。同时,许多研究提出了城市活力的衡量要素,主要分为两类:一类是针对客观物质空间特性提出的,如简·雅各布斯提出的街道长短、人流密度、功能混合,特兰西克提出的界面连续性等;另一类是从人的活动出发等主观判断提出的,例如,人们在空间中是否感到友好、安全等[3-6]。由于时代背景限制,研究方法和技术有限,这个时期的研究存在着一些局限性。第一类研究没有直接关注人的活动,而是从物质空间、设施供给的角度侧面、间接反映活力,其潜台词默认良好的物质空间环境品质和实际活力具有高度相关性,但事实是物质空间的供给和实际的活力往往存在失位,不一定能反映实际的活力;第二类研究从人的实际空间感受出发,不直接与空间特性相联系,同时对于较大尺度的城市活力和定量研究关注不足。

近年来也有一些学者开始做一些定量的研究,从较为传统的实地调研、问卷调查、专家评分,到比较先进的通过POIs(point of interests)、模糊物元模型、GPS(global positioning system)、空间句法等技术手段对空间活力进行测度,对其影响因素的相关性进行探究,逐渐将传统的调研方法和先进的技术手段结合起来[7-9]。

但是,已有研究虽然应用了大量技术方法,研究方法上却主要在进行了空间数据可视化后就通过肉眼判断主观解释因果,缺乏了应用统计方法来做更进一步分析的步骤,或是应用常规数理统计方法忽视了城市活力的空间特性,缺乏空间统计方法的应用;在研究基本空间单元的选择上,对于研究区域的选择多采用网格化,对政策的引导价值和意义有所欠缺。

因此,以上海为例,对城市活力的时空分布做初步识别与分析;进一步进行全局、局部空间自相关分析以探测活动热力的空间依赖性和活力高值集聚区[10-11]。其次测度功能混合度,综合POIs与宜出行热力两种异构数据,使用信息熵模型,构建用于定量化评价城市功能混合度的空间熵与时空熵;并分别进行全局空间自相关,测度空间依赖性和局部空间自相关,探测混合度高值集聚区;再通过相关性分析与回归分析验证两种熵结合使用进行功能混合度评价的合理性[12]。然后将人口活动热力与其他各驱动因素进行相关性分析,探究驱动因素和人口活动热力的相关关系[13]。最后将各驱动因素作为解释变量进行地理加权回归,以期深层剖析人口热力与选取驱动因素之间的量化关系,并试探知其因果关系,为未来规划、政策提出建议。

1 方法与数据

1.1 研究数据

本文中使用的数据包括POIs数据、宜出行热力数据、公交和地铁线路数据、人口数据、道路网数据和交通态势数据。POIs数据通过使用百度地图平台提供的API(application programming interface)接口获取截至2020年11月24日的上海市POIs开源大数据,共551 250个,可以反映设施的静态供给空间分布情况。宜出行数据来源于腾讯位置大数据服务窗口,空间分辨率为25 m,获取时间为2020年11月24日。公交和地铁数据通过网页抓取技术获取公交、地铁站点及线路数据。人口数据为街道/乡镇级别的常住人口数据。道路网数据为通过在线电子地图下载软件获取到的2020年上海市各级道路网数据。交通态势数据通过使用高德地图平台提供的API获取的2020年11月24日的各时段交通态势数据。

1.2 计算方法

1.2.1 基于宜出行热力数据的人口活动热力计算方法

热力数据为以25 m为间距的采样点,统计各时间段各采样点的热力值取平均值,再加总各基本空间单元中的各采样点热力值,作为该基本空间单元的活动强度。

1.2.2 基于POIs数据的空间信息熵计算方法

信息熵原是一个物理学的概念,用来测度系统的复杂性和均衡性。城市同样可以看作为一个系统整体,其中城市功能是这个系统在空间上的映射。

根据信息熵模型的基本原理,构建基于精细化不同种类POIs数据的信息熵模型:假定POIs数据总个数为A,根据这些POIs数据的具体名称,将其分为不同类型,如商业、公共服务、行政机构、停车场、旅游景点、工业、餐饮、娱乐、中小学、文化设施、商务办公、高速服务设施等N个类型(N=14),若各类型的个数分别为A1,A2, …,An, 则A=A1+A2+…+An=∑Ai(i=1,2,…,N),定义概率为

(1)

显然有∑Pi=1,于是得城市功能的信息熵公式为

(2)

式(2)中:H为信息熵。可以看出,H≥0。信息熵的高低可以反映城市功能的混合程度,熵值越高,表明功能类型越多,各功能类型的数量相差越小。

1.2.3 基于宜出行热力数据的时空信息熵计算方法

用人口热力的时空熵来刻画不同区域功能混合度的基本原理为:以人口热力的时间分布均匀性来评价这个区域功能的混合情况。原因是一般认为一个区域功能越多越混合,其一天中每个时段都会有相应需求的人群在此地活动,因此无论是住宅区还是办公、商业区只要其功能单一化,其人口热力的时空熵都会较低。

根据前文空间信息熵的计算模型,构建时空熵的计算模型:假定基本空间单元人口热力活动强度总个数为A,以3 h为一个时间段,将其分为8个时间分段,进而根据计算公式可以得出每个基本空间单元内一天内不同时间段人口。由此可以得到基于人口热力大数据的时空熵模型,其时空分布在一定程度上可以表征人们不同的行为特征及规律,由此认为某个区域人口热力强度越高且在不同时间段分布越均匀,其功能类型越复杂,混合度越高,这也是对基于POIs数据计算的空间熵的一个很好的补充。

1.2.4 基于交通态势数据的汽车交通可达性计算方法

可达性是一种反映交通出行方便程度的指标。比较典型的可达性测度模型有5类:空间阻隔模型、累计机会模型、空间相互作用模型、效用模型和时空树模型。此次以基于空间阻隔模型提出的“最小阻抗可达性分析方法”作为可达性分析的方法。

首先,以交通态势数据的道路车速数据求得每条道路网络的时间成本作为阻抗。

其次,在交通路网中,求解每个节点的交通可达性Hi:假如网络中共有n个节点,节点交通可达性等于该节点到其他每一个节点的最短路径之和n-1,即

(3)

最后,求解整个路网的交通可达性H,为每个节点交通可达性的平均值,路网交通可达性等于每个节点交通可达性之和n,即

(4)

式中:n代表网络中节点数;dij代表节点i和节点j之间的最短路径距离。

2 研究结果

2.1 空间权重矩阵

在空间权重矩阵设定上,由于选取的基本空间单元街道/乡镇为行政区,其本身就具有明确意义,因此选取基于邻接关系构建空间权重矩阵,以Queen相邻(只要存在顶点相接,就认为两地区为相邻关系)定义邻接关系,阶数为1。同时考虑到人口活动特性,在相关计算上对空间权重矩阵进行标准化。此外为了避免空间权重矩阵定义对结果的影响,还尝试了以Rook(两个相邻区域有共同的边)相邻定义邻接关系、基于距离关系构建空间权重矩阵(距离阈值4 000 m,距离衰减为反距离1次方)等,结果表明影响不大[14]。

2.2 上海市人口活动热力分析

2.2.1 人口活动热力可视化

为更好地进行下一步的统计分析,将热力数值以街道/乡镇边界为基本空间单元进行聚合(图1)。

图1 人口热力图

2.2.2 人口活动热力全局空间自相关

通过对人口活动热力的空间依赖性进行测度,结果表明活力值整体呈空间正相关关系,Moran’s I高达0.860,z得分为20.13,p=0,在a=0.01水平下,结果具有显著性,分布上聚类分布的可能性超过99%(图2)。

图2 人口热力全局自相关图

分析结果表明上海市城市活力呈集聚的空间分布模式,具有高度的空间依赖性,另一方面也说明了后续的双变量相关性等分析中常规的数理统计方法的结果将很大程度上不准确,因此应当应用空间统计方法。

2.2.3 人口活动热力局部空间自相关

进一步对活力值的局部自相关进行分析,以探测活力分布的空间异质性,在局部上发现高活力地区集聚区和低活力地区集聚区[15]。

结果表明,上海城市活力的空间分布在局部上基本全部呈正相关关系,但中心城为高值集聚,而在外围乡镇/街道则是低值的集聚,中间地区则为局部随机分布。虽然外围嘉定新城、松江新城、宝山新城以及核心区边缘已有若干小具规模的活力区域,但这种聚集还并不显著,带动力和影响力不足,相邻区域的活力并不高,不能称之为真正意义上的高活力城市地区,有待于制定进一步的行动计划,提高外围地区的活力和影响力(如图3~图5)。

图4 人口热力LISA聚类底图

图5 人口热力空间自相关散点图

2.3 上海市功能混合度分析

2.3.1 空间信息熵空间分布特征

根据前述方法,计算上海市各街道/乡镇的空间信息熵。从可视化结果来看(自然间断点)上海市空间信息熵的空间分布具有较明显的类似同心圆扩散的特征,功能混合度由市中心内而外逐渐降低,在外围广袤的低熵值区域内有局部较高熵值的集聚点,如外围嘉定新城、松江新城、宝山新城等功能混合度较高。

对上海市空间信息熵可视化结果进行全局自相关统计,结果表明上海市空间信息熵的空间分布呈现聚类的分布模式,Moran’s I高达0.826,空间信息熵具有高度的空间依赖性;z得分为19.25,p=0,在a=0.01水平下,结果具有显著性,聚类分布的可能性超过99%(图6、图7、表1)。

表1 各影响因素空间统计分析结果表

图6 空间信息熵可视化图

图7 空间信息熵LISA聚类图

进一步使用局部Moran’s I对其进行局部自相关统计,以测度空间聚类。结果表明,上海空间信息熵高值区聚类主要分布在中心城附近,外围大部分地区则为局部随机分布和低值区聚类。值得注意的是可视化结果中外围突出的高值点的空间聚类测度结果并不显著,集聚尚未形成一定规模;此外惠南镇的空间信息熵空间聚类结果为局部负相关,其自身具有较高的空间信息熵,而周边则是低值的集聚区。原因可能是惠南镇是原南汇区区府所在地,历来就是浦东南部(原南汇区)的中心,有较好的基础设施建设积淀。目前商业配套成熟,有人气旺盛的老城区,也有新兴的东城区,值得一提的是惠南镇的教育资源在整个浦东新区名列前茅,具有相对外围地区较好的基础设施条件。

2.3.2 时空信息熵空间分布特征

运用和空间信息熵计算相同的方法,计算上海市各街道/乡镇的时空信息熵。上海市空间信息熵的空间分布呈现出于空间信息熵相似的分布趋势(自然间断点),功能混合度由市中心内而外逐渐降低,但是中间值的数量相对空间信息熵来说更少(图8)。

图8 时空信息熵可视化结果图

对上海市空间信息熵可视化结果进行全局自相关统计,结果表明上海市空间信息熵的空间分布呈现聚类的分布模式,Moran’s I为0.771,时空信息熵具有高度的空间依赖性;z得分为17.99,p=0,在a=0.01水平下,结果具有显著性,聚类分布的可能性超过99%。

进一步使用局部Moran’s I对其进行局部自相关统计,以测度空间聚类。结果表明,上海时空信息熵高值区聚类主要分布在中心城附近,与空间信息熵的分析结果大致相同,但高值集聚区域数量更少,低值集聚区域数量更多(图9、表1)。

图9 时空信息熵LISA聚类图

2.3.3 POIs空间熵和人口热力时空熵相关分析

为了证明了两种熵结合使用进行功能混合度评价的合理性、检验空间信息熵和时空信息熵描述功能混合度的准确度,对POIs空间信息熵和人口热力时空信息熵的分析结果进行双变量局部自相关统计,结果显示Moran’s I为0.772,具有高度相关性,同时对其进行显著性检验,z得分为19.450,p=0,a=0.01水平下,结果具有显著性(如图10~图12)。

图10 空间熵和时空熵双变量LISA聚类图

图11 双变量相关性分析散点图

在整体正相关下,也有局部地区存在着HL局部负相关的地区,分别是惠南镇、周浦镇、颛桥镇、盈浦街道。这些区域具有较高的POIs空间信息熵,但人口热力时空信息熵较低。即这些区域具有相对其他的城市外围地区较完善的设施供给,但现状实际的利用情况却不相匹配。周浦镇镇区对外交通十分便利,已通车的轨道交通16号线,设有周浦东站,同时还有较发达的内河水运,现有上海市周浦都市工业园、万达广场等产业。盈浦街道地处青浦中心城区,辖区以原青浦镇老城区为主,是青浦新城的核心组成部分。另一方面还存在一个局部负相关的地区,漕河泾新兴技术开发区,由于其开发区的特点,设施多样性有所不足,同时靠近中心城区,周边具有较高的人口活动强度,导致了其与周边地区的负相关。

2.4 其他各驱动因素分析

2.4.1 常住人口因素

对上海市各街道/乡镇常住人口进行分析,对其进行全局空间自相关分析,结果显示其Moran’s I为0.516,具有高度的空间依赖性,同时对其进行显著性检验,z得分为12.57,p=0,在a=0.01水平下,结果具有显著性。进一步对其进行局部空间自相关分析,得出上海市人口分布的高值集聚区和低值集聚区(图13、表1)。

2.4.2 汽车交通因素

根据前文所述方法对汽车交通可达性进行分析,得出各街道/乡镇的汽车交通可达性,并对其进行全局空间自相关统计,结果显示其Moran’s I为0.818,具有高度的空间依赖性,同时对其进行显著性检验,z得分为19.26,p=0,在a=0.01水平下,结果具有显著性(表1)。

2.4.3 公交服务水平因素

根据公交站点和线路条数的数据计算公交服务水平,并对公交服务水平分析结果其进行全局空间自相关统计,结果显示其Moran’s I为0.887,具有高度的空间依赖性,同时对其进行显著性检验,z得分为20.67,p=0,在a=0.01水平下,结果具有显著性。

进一步进行局部空间自相关统计,结果显示外围青浦新城、嘉定新城、松江新城的集聚还不够显著,而公交服务水平的高值集聚区主要分布在中心城(图13、表1)。

2.4.4 地铁服务水平因素

根据地铁站点和线路条数的数据计算地铁服务水平,对地铁服务水平分析结果其进行全局空间自相关统计,结果显示其Moran’s I为0.897,具有高度的空间依赖性,同时对其进行显著性检验,z得分为21.01,p=0,在a=0.01水平下,结果具有显著性。

地铁服务水平的局部空间自相关结果表明,地铁服务水平高值主要集聚在中心城周围,但这种集聚相对于公交服务水平来说更小(图13、表1)。

2.5 活力与驱动因素相关性分析

2.5.1 活力与功能混合度因素相关性分析

对活力与功能混合度进行双变量局部空间自相关进行分析,统计结果显示Moran’s I为0.775,活力与功能混合度具有高度的相关性。并进行9 999次随机化显著性检验,z得分为19.34,p=0,在a=0.01水平下,结果具有显著性(如图14、表2)。

表2 各影响因素与活力相关性统计分析结果表

2.5.2 活力与常住人口因素相关性分析

对活力与常住人口进行双变量局部空间自相关进行分析,结果显示Moran’s I为0.632,活力与常住人口分布具有高度的相关性。并进行显著性检验,z得分为16.34,p=0,在a=0.01水平下,结果具有显著性(图14、表2)。

2.5.3 活力与交通可达性因素相关性分析

对活力与交通可达性进行双变量局部空间自相关进行分析,结果显示Moran’s I为0.794,活力与交通可达性具有高度的相关性。并进行显著性检验,z得分为16.34,p=0,在a=0.01水平下,结果具有显著性(图14、表2)。

2.5.4 活力与公交服务水平因素相关性分析

对活力与公交服务水平进行双变量局部空间自相关进行分析,结果显示Moran’s I为0.850,活力与公交服务水平具有高度相关性。并进行显著性检验,z得分为20.48,p=0,在a=0.01水平下具有显著性(图14、表2)。

2.5.5 活力与地铁服务水平因素相关性分析

对活力与地铁服务水平进行双变量局部空间自相关进行分析,结果显示Moran’s I为0.838,活力与地铁服务水平具有高度相关性。并进行显著性检验,z得分为20.33,p=0,在a=0.01水平下,结果具有显著性(图14、表2)。

图14 活力与驱动因素相关性分析图

2.6 地理加权回归分析

地理加权回归(geographically weighted regression,GWR)模型在线性回归模型基础上进行扩展,使回归方程适应局部空间要素,其回归系数β不再是全局性的统一值,而具有空间差异性,可以更好地反映自变量对因变量的影响随空间位置而变化[16],计算公式为

(5)

式(5)中:yi为第i点的因变量;xik为第k个自变量在第i点上的值;εi为残差;(ui,vi) 为第i个样本点的空间坐标;βi(ui,vi)为连续函数βi(u,v)在i点的值。

2.6.1 计算结果

研究假定活力与功能混合度、常住人口分布、汽车交通可达性、公交服务水平、地铁服务水平、POI密度有关。将活力作为因变量,将其他驱动因素作为解释变量进行地理加权回归。

对GWR模型输出的标准残差进行全局空间自相关统计,结果显示,残差Moran’s I为0.066,z得分为1.14,残差在空间分布上为随机分布(图15)。因此GWR模型整体上是合理的。

图15 残差全局空间自相关图

GWR模型输出的R2=0.945,表明模型和观测数据具有较高的拟合度。最大条件数为24.619,不大于30,这提高了结果的可靠性。

2.6.2 结果解读

结果显示有5个标准残差中大于2.5倍标准差的空间单元,分别为南京东路街道、天目西路街道、大宁路街道、北新泾街道、漕河泾新兴技术开发区;有4个标准残差中小于-2.5倍标准差的空间单元,分别为豫园街道、江宁路街道、湖南路街道、天平路街道(图16)。说明以上所列因素还不足以解释这些空间单元的活力。可以发现首先这些区域都分布在非常中心的位置,因此区位因素可能是需要考虑的因素之一;其次如南京东路、豫园街道,是著名的商业步行街、旅游景点,因此及景点数量和热度、步行适宜性、商业多样性等因素可以也是需要考虑的因素之一;最后是漕河泾新兴技术开发区,作为产业园区,其活力与产业或有密不可分的关系,因此产业相关因素应该也是城市活力需要考虑的因素之一。

图16 标准残差分布图

3 结论与讨论

3.1 影响因素分析结论

城市活力是一个受到各方面复杂因素影响的评价指标,因为城市活力本身就是城市建设和人类活动互相作用的共同体现,而城市巨系统和人类行为的复杂性远远超出了一般数理统计、定量分析所能完全概括的范围,但通过一定方法,还是能发现其与各项城市物质环境品质指标之间的大致相关关系,从而推断因果,为城市政策、规划提供指导性意见。通过前文的分析,认为功能混合度、常住人口分布、汽车交通可达性、公交服务水平、地铁服务水平、POI密度对城市活力有着重要影响,同时区位条件、步行适宜性、景点数量及热度、商业多样性与活力、产业相关因素也是影响城市活力的有力驱动因素,因此为了提升城市活力,在城市政策制定、规划方案编制中应当重点注意以上因素的要素布局和资源分配。

3.2 提升上海市郊区城市活力的粗浅建议

在前文的分析和空间统计过程中,不仅对城市活力区域进行了识别,还发现了若干城市物质空间环境品质提升的薄弱环节。中心区的城市建设完善程度已经非常高,而外围的新城自身虽然现状已有一定水平的活力和品质,但对周边辐射不足。为了落实国家区域协同发展战略,将发展成果惠及更广大区域范围内的人民,推动长三角一体化建设,新城在广袤的相对低发展水平的郊区中应起到带头作用,充当提升城市空间环境品质提升的增长极,将自身优势扩散到相邻区域,形成高值的集聚区。

(1)注重功能的多样复合。避免形成“卧城”“睡城”,提升新城留住人的能力,同时还能减少长距离通勤。

(2)提升外围新城的公交服务水平。通过增设公交班次、智能调度系统优化排班、提升智能电子站牌、优化公交线网等方法提升公交服务水平。

(3)提升外围新城的地铁服务水平。加大新城轨道交通投资建设,提升外围新城居民使用地铁的便利性。

(4)加大各类设施建设力度。提高外围新城生活服务品质。

(5)营造人性尺度的街区。从人性化的尺度、以人为本的尺度出发设计街区,尺度宜小、节奏宜慢、杂而不乱、喧而不闹、动静相宜,营造场所感

(6)提升旅游IP建设。营造“网红”景点,吸引游客提升片区活力。

猜你喜欢
信息熵服务水平热力
基于信息熵可信度的测试点选择方法研究
热力工程造价控制的影响因素及解决
热力站设备评测分析
遂宁市:提升社保服务水平 夯实保障民生基础
聚焦内审转型升级 提升增值服务水平
加强图书馆管理 提高服务水平
提升粮食流通社会化服务水平的举措构思
周六福520爱跑节1000人登陆西安城墙 热力开跑
一种基于信息熵的雷达动态自适应选择跟踪方法
基于信息熵的循环谱分析方法及其在滚动轴承故障诊断中的应用