李毅军,罗紫宇,周 涛,3,张振豪
(1.重庆市交通规划研究院,重庆 401147;2.西南交通大学希望学院 轨道交通学院,四川 成都 610400;3.山地城市交通系统与安全重庆市重点实验室,重庆 400074)
轨道站点客流吸引能力与周边用地开发、功能聚集、人口聚集有紧密联系,掌握轨道站点客流与周边建成环境之间的关联关系尤为关键,建成环境[1]概念最早于2002 年由CERVERO 等提出,定义为城市景观的物理特征,即与自然特征相对应的部分,并概括为密度、多样性、设计组成的“3D”维度,已有文献在建成环境对轨道站点客流的影响方面有深入研究,主要包含2 个方面。①基于建成环境变量的轨道站点客流模型方面。金昱[2]选取社会经济、土地利用、交通特征、站点自身特征共4 类解释变量构建轨道客流的多项Logit 回归模型;丛雅蓉等[3]选取用地属性、网络拓扑结构、公交接驳等解释变量,构建地理加权回归模型(GWR)分析用地属性对轨道站点客流的时空影响;马晓磊等[4]选取11 类解释变量构建GWR 模型分析高峰客流量与用地密度之间的关系;孔祥夫等[5]选取4 类解释变量建立非线性回归函数,分析不同类型用地客流生成率与轨道站点可达性之间的衰减规律;甘佐贤等[6]比较空间滞后模型、空间误差模型、GWR模型和混合地理加权回归模型的拟合结果,分析建成环境属性对轨道站点客流的作用机理。②在轨道站点的步行可达范围识别方面。国内外学者通常采用圆形缓冲区经验值,一般取值为500 m和800 m[7]。武倩楠等[8]建立基于广义出行费用的城市轨道交通车站接驳范围计算模型;张宁等[9]运用多项Logit模型建立了居民出行方式选择模型确定城市轨道交通步行接驳范围;刘海洲等[10]基于步行网络数据通过ArcGIS 最短路径搜索算法获取轨道站点与周边地块的步行时间和步行可达范围。
综上,既有文献多采用全局回归模型、局部回归模型和非线性模型等进行分析,但解释变量间的多重共线性问题对实验结果有较大影响[11]。步行可达范围识别方面,既有文献多基于经验值、模型和道路网识别,缺少结合实际地形条件的研究分析。基于此,提出一种基于百度API的网络数据提取技术方法,考虑轨道站点周边地形条件,结合真实数据给出更准确的步行可达范围,并基于主成分分析的地理加权回归模型(Principal Component-based Geographic Weighted Regression,PCA-GWR)研究分析轨道站点客流的影响因素。
结合文献研究和相关分析工具,提出了一种基于百度API的网络数据提取技术识别轨道站点步行可达范围的方法,轨道站点步行可达范围识别示意图如图1 所示,该方法具有抓取速度快、批量化处理等优势,具体步骤如下:①以轨道站点为中心建立步行缓冲区域,每间隔一定距离布置点阵;②通过编程调用百度API抓取布置点阵中的路线规划出行时间,得到步行可达点阵;③采用不规则三角网插值、提取等高线等方法,得到以轨道站点为中心的步行可达范围。
图 1 轨道站点步行可达范围识别示意图Fig.1 Identification of walking reachable range of rail station
研究数据包括轨道站点客流数据和建成环境属性数据。基于5Ds准则对建成环境特征按照建筑面积、线网可达性、交通条件、职住数量等类别进行定量化描述,其中建筑面积数据、交通条件数据、职住数量数据来源于重庆市综合交通信息平台。轨道站点客流数据来自轨道交通刷卡数据,包括进站客流和出站客流,线网可达性数据根据重庆市轨道交通运营线网图计算得到。建成环境变量与轨道站点客流特征量化描述如表1 所示,其中不同建筑类型的人均用地面积参考《城市用地分类与规划建设用地标准》的规划指标[12],轨道站点步行可达范围时间参考《城市居住区规划设计标准》选取步行10 min最适宜[13]。
表1 建成环境变量与轨道站点客流特征量化描述Tab.1 Quantitative description of built environment and passenger flow characteristics of rail stations
(1)各类建筑面积。主要包括居住建筑面积、办公建筑面积、商业建筑面积和绿地用地面积,计算公式如下。
式中:ca为建筑面积,m2;la为用地面积,m2;far为用地容积率。
(2)线网可达性。线网可达性是指轨道站点到线网中其他轨道站点便捷程度的指标,计算公式如下。
式中:cod为轨道站点至线网的可达性;ci→j为从车站i出发至线网中某一条线路经过最少站点数量;L为轨道线网中线路的条数。
(3)交通设施密度。属于交通条件,主要指停车位、道路网、公交站的丰富程度,计算公式如下。
式中:ρpark为停车位密度,个/km2;Npark为停车位数量,个;S10min为轨道站点10 min步行可达范围,km2。
式中:ρroad为道路网密度,km/km2,Nroad为道路长度,km。
式中:ρbus为公交站密度,个/km2;Nbus为公交站点数量,个。
(4)路网车速。属于交通条件,主要指轨道站点周边路网的运行情况,计算公式如下。
式中:Vk为k时间段内路网的平均行程车速,km/h;lj为路段的长度,km;Vkj为路段的平均行程速度,km/h;n为路网中路段的数量,条。
(5)职住数量。主要指岗位数量和居住人口的情况,计算公式如下。
式中:τwork为岗位数量,个;cawork为办公建筑面积,m2;wwork为办公建筑的人均面积指标,m2/人。
式中:τpop为人口数量,人次;capop为居住建筑面积,m2;wpop为居住建筑的人均面积指标,m2/人。
(6)站点客流。主要指轨道站点的进站、出站客流量,计算公式如下。
式中:ωout为轨道站点的高峰小时出站客流人数,人次;θouti为每15 min出站客流人数。
式中:ωin为轨道站点的高峰小时进站客流人数,人次;θini为每15 min进站客流人数。
(1)数据标准化。将所有数据进行标准化处理,计算公式如下。
式中:为第j个变量的第i个数据标准化后的结果;Xij为第j个变量的第i个数据。
(2)主成分分析。假设用于描述每个轨道站点的建成环境指标有q个,求出标准化后数据的相关系数矩阵及对应的特征值和特征向量,特征值从小到大排列λ1,λ2,…,λq,对应的特征向量C1,C2,…,Cq,都是q个指标的线性组合并且互不相关。
式中:C1,C2,…,Cq为特征向量;X1,X2,…,Xq为标准化自变量;aqq为观测值参数。
(3)贡献率。一般累积贡献率满足80%以上认为提取成分有效,假设提取k个主成分,则前k个主成分的贡献率的计算公式如下。
式中:μ为贡献率;λi为第i个主成分特征值;λk为第k个主成分特征值。
(4)主成分得分。根据所提取成分得分系数矩阵和旋转成分矩阵,计算得到各主成分得分。
式中:Ck为第k个主成分得分;n为该主成分由n个指标计算得来;aj为第j个变量的得分;Xj为第j个变量对应的数据。
(5)GWR模型。将提取的k个主成分得分作为新的主成分解释变量进行地理加权回归分析,数学模型如下[14]。
式中:(ui,vi) 为第i个轨道站点的地理坐标;β0(ui,vi)为第i个轨道站点回归常数;p为总共有p个主成分;βk(ui,vi)为第i个轨道站点第k个成分的回归系数;xik为第i个轨道站点第k个主成分得分;εi为第i个轨道站点的随机误差。
(1)全局莫兰指数。
在GWR 模型分析之前应该对解释变量空间自相关检验,通常采用Moran’sI方法来对变量进行空间自相关分析[15]。Moran’sI较大说明样本在空间中呈现空间聚合,负值说明样本在空间中呈现空间离散,而接近零则说明样本在空间中呈现随机分布。
式中:ωij为样本i和j两者的空间权重值;yi为样本i和j确定的属性数值;yˉ为所有样本值的平均值。
研究的轨道站点抽象后属于孤立点,使用k-近邻权重的邻接矩阵,其适用离散点空间单元,公式如下。
式中:wij为距离为d的两个对象i和j之间的交互权重;dij是两个对象i和j之间距离;k为指定的k个相邻空间单元作为目标空间单元的邻居。
采用Z-scores 检验Moran’sI的显著性,若Z绝对值大于1.96,P值小于0.05 表明拒绝零假设,且通过假设检验。Z-scores得分统计量公式如下。
式中:E(I)为Moran’sI的期望值;Var(I)为Moran’sI的方差。
(2)Akaike信息量准则。
在进行GWR模型分析时需要确定合适的带宽,确定带宽的方式是基于Akaike信息量准则(Akaike Information Criterion,AIC)。
式中:n为轨道站点的数量;tr(S)为GWR的帽子矩阵S的迹;̂为随机误差项的极大似然估计值。
在同一样本数据做地理加权回归分析时,当AICc达到最小的时候,此时的带宽就达到了最优的结果。
选取重庆市28 个轨道站点作为研究对象,在步行可达范围识别过程中的参数设置如下,采用每间隔30 m 布置点阵,步行缓冲区域半径为900 m(步行速度1.5 m/s),每个轨道站点布置点阵数量约7 900 个,28 个轨道站点总共抓取数据约22 万条,经过数据清洗、筛选后有效数据约20 万条,抓取速度150条/min。步行10 min可达范围示意图如图2所示,步行10 min可达范围是根据轨道站点周边的建成环境、地理地形条件生成的不规则图形,其覆盖面积的平均值与半径500 米覆盖面积的比值是74.2%,这表明实际轨道站点的覆盖面积和服务范围比传统经验值更小。
图2 步行10 min可达范围示意图Fig.2 Schematic diagram of reachable range of a 10-minute walk
(1)主成分提取。
对轨道站点建成环境数据进行主成分分析,总共提取了5 个主成分,这5 个主成分包含了原来解释变量87.37%的信息量,结果通过了巴利特球形检验,表明提取主成分有效,根据构成各主成分的解释变量所属类型,定义了提取的每个主成分所代表含义,莫兰指数检验如表2所示。
表2 莫兰指数检验Tab.2 Moran’s index test
①主成分C1中居住建筑载荷为0.98,居住人数载荷为0.96,这两者的数值较大,代表的是轨道站点周边的居住丰富性。②主成分C2中停车位载荷为0.816,公交站密度载荷为0.901,道路网密度载荷为0.804,这三者的数值较大,代表的是轨道站点周边的出行便利性。③主成分C3的商业建筑载荷为0.895,工作岗位载荷为0.693,这两者的数值较大,代表的是轨道站点周边商业活跃性。④主成分C4仅绿地用地的载荷较大为0.882,代表的是轨道站点周边绿化效果。⑤主成分C5线网可达性载荷较大,代表轨道站点在轨道线网中到其他线路的便利程度。
(2)全局空间自相关。
对主成分解释变量进行空间自相关性分析,其中居住丰富性C1,出行便利性C2,绿化效果C4,线网可达性C5通过了空间自相关性检验,商业活跃性C3未通过空间自相关性检验,建成环境主成分解释变量莫兰指数散点图如图3所示,需将商业活跃性剔除后再进行地理加权回归分析。居住丰富性、出行便利性、线网可达性的莫兰指数均为正,表明在空间存在聚集分布特征;绿化效果的莫兰指数为负,表明在空间存在离散分布的特征。出站客流通过了空间自相关性检验,进站客流未通过空间自相关性检验,表明进站客流是随机分布模式。
图3 建成环境主成分解释变量莫兰指数散点图Fig.3 Scatter plot of Moran’s index for explanatory variables of built environment
分别建立GWR模型和PCA-GWR模型,GWR模型以建成环境解释变量为自变量,PCA-GWR模型以主成分解释变量为自变量,都以轨道站点出站客流为因变量,最后对模型拟合结果的参数做横向的分析比较,模型拟合结果比较如表3 所示。PCA-GWR模型的拟合优度为0.756,较GWR模型的拟合优度0.637有一定提高,PCA-GWR模型比GWR模型的赤池信息准则值更低,表明PCA-GWR模型比GWR模型拟合效果更好,适用性更强。
表3 模型拟合结果比较Table 3 Comparison of model fitting results
PCA-GWR模型主成分解释变量回归系数分布如图4 所示,分别为4 个主成分解释变量对轨道站点客流的影响程度,代表影响轨道站点客流的4 个不同方面,每张图划分了4 种影响程度,分别用红、黄、青、蓝4 种颜色表示在空间分布和回归系数上的差异。
图4 PCA-GWR模型主成分解释变量回归系数分布Fig.4 Distribution of regression coefficients of principal component variables in PCA-GWR model
(1)居住丰富性。居住丰富性回归系数取值均为负,表明其对轨道出站客流有抑制作用,轨道站点周边的居住丰富性系数越小,轨道出站客流越高,这是由于早高峰时段轨道出站客流的出行目的多是以通学和上班为主,因而在居住为主要功能的区域不会吸引客流;从空间分布来看,居住丰富性系数东部最大,中部其次,西部最小,居住丰富性对西部的轨道出站客流的抑制作用表现得更明显,对位于轨道线网东部的轨道出站客流抑制作用相对更弱。这是由于东部轨道站点的商业功能更突出,例如观音桥轨道站点,周边居住建筑面积和居住人口数量的提升对商业功能的影响较小,对轨道出站客流的抑制作用也最小,而西部的轨道站点居住功能更突出,例如大石坝轨道站点,周边居住建筑面积较大,居住人口数量较多,若进一步提升居住建筑面积和居住人口数量,则对轨道出站客流的抑制作用更强。
(2)出行便利性。出行便利性回归系数取值均为正,表明其对轨道出站客流有推动作用,说明轨道站点周围建成环境的出行便利性越高,对轨道出站客流的吸引力越大;从空间格局来看,出行便利性最高的是东部,北部其次,西南部最小,线网东部的轨道站点对出行便利性的敏感度更高,例如小什字、较场口等轨道站点的出行便捷性对轨道站点客流的提升非常显著,这是由于东部轨道站点位于老城区,多为小地块、窄马路的建成环境格局,出行便利性的提升会覆盖更多的产业人口从而带动客流增长。线网西南部的轨道站点对出行便利性的敏感度较低,例如沙坪坝、石桥铺等轨道站点的出行便捷性对轨道站点出站客流的提升作用较小,这是由于西南部轨道站点位于新城新区,多为大地块、宽马路的建成环境格局,出行便利性的提升不会覆盖更多的产业人口,因而轨道出站客流的增长不显著。
(3)绿化效果。从回归结果来看,绿化效果回归系数取值有正有负,绿化效果对轨道出站客流的影响既有带动作用也有抑制作用,从空间格局来看,正值主要分布在轨道线网的东部,负值主要分布轨道线网的西部,西部轨道站点具有最高的绿化效果回归系数,西部的绿化效果提升会带动轨道站点出站客流的增长,东部的绿化效果提升反而会使轨道出站客流减少,意味着绿化效果对于线网西部的轨道站点贡献较大。
(4)线网可达性。线网可达性回归系数均为正,表明线网可达性对轨道站点出站客流的影响作用为正,轨道站点在轨道线网中的可达性越高对轨道出站客流的吸引力越大;从空间分布来看,轨道线网西南方向轨道站点的线网可达性回归系数较大,说明提升轨道线网西南方向轨道站点的线网可达性对轨道出站客流的提升作用更明显,轨道线网东北方向的轨道站点的线网可达性回归系数较小,说明这部分轨道站点对线网可达性的敏感度较低,主要是这部分站点在线网中出行可达性已较高,因此进一步提升并不会显著带动轨道出站客流的增长,而西南方向的轨道站点在线网中可达性较低,站点可达性有微小变动都会较大地带动轨道出站客流。
利用重庆真实数据探索建成环境对轨道站点客流的影响,对把握重庆市轨道站点客流规律具有一定的价值,主要有以下结论。一是山地城市的步行可达范围。重庆轨道站点的步行10 min可达范围面积比半径500 m 缓冲区面积小,约为74.2%,因此轨道站点周边建成环境调整布局应采用高密度、集中式的思路统筹安排,同时增设交通设施以改善现状步行条件。二是PCA-GWR模型的应用。将解释变量进行主成分分析后再将提取的主成分解释变量进行加权回归分析,克服了解释变量间的多重共线性问题,模型的拟合优度为由0.637 提高至0.756,PCA-GWR模型的适用性和拟合效果较好,关联性较强因素宜采用PCA-GWR模型,有利于探寻影响因素的聚集效应对轨道站点客流的影响作用。三是因地制宜地提出改善轨道站点客流的措施。居住丰富性、出行便利性、线网可达性在空间存在聚集分布特征,绿化效果在空间存在离散分布的特征,存在空间异质性。因此,根据轨道站点在线网的空间区位,采取差异化措施调整建成环境布局,线网西部的轨道站点应在周边布设绿色基础设施,改善街道空间品质,线网东南部的轨道站点应增设公共交通设施,提升出行便捷性,线网南部轨道站点应提高线网可达性,满足基本出行需求。