丛雅蓉 王永岗 余丽洁 李国栋
(长安大学运输工程学院,710064,西安∥第一作者,硕士研究生)
在影响城市轨道交通车站客流分布规律和分布特征的众多因素中,土地利用类型这一因素尤为重要。不同的土地利用类型吸引相应出行目的的乘客,使得车站客流呈现出不同的规律和分布特征。
车站客流的时间分布特征表现为时间上的波动性,工作日早晚高峰的客流特征最为突出。文献[1]的研究发现,进站客流高峰出现在早高峰时段,呈现单峰分布特征;出站客流则呈现出早晚高峰时段的双峰特征。文献[2]的研究表明,车站周边建筑环境对车站客流的变化情况有显著影响。
关于车站客流空间分布特征,研究发现,土地利用类型对其影响主要包括土地使用模式或建筑环境[3]、可达性、社会经济特征[4]、人口[5]等因素。研究者们还通过建立基于普通最小二乘法(OLS)、偏最小二乘法的直接估计模型来反映土地利用类型中的这些因素对车站客流量的影响,但这些多元回归方法假设全局参数一致,即认为各影响因素与空间位置无关,未考虑其空间位置差异性。
为了解释车站客流量的空间异质性,即客流随空间变化而呈现出的分布形式。文献[6]使用地理加权回归模型(GWR)预测马德里地铁站的进站量,并比较了OLS 和GWR 在模拟客流及其影响因素方面的性能,结果表明GWR 在预测车站客流方面显示出比OLS 更好的拟合优度。文献[7]使用GWR模型研究各类用地的空间分布对客流的影响。文献[8]在考虑车站空间相关性的基础上,采用GWR 模型构建回归方程,探究各类兴趣点密度对早高峰进出站客流的影响。
大多数已有研究将车站客流的空间关系和时间分布特征独立开来,较少关注用地因素对客流的时空影响作用。本研究在西安地铁乘客出行调查数据的基础上,确定适宜西安市的地铁车站合理吸引范围,使用GWR 定量分析土地利用因素对车站客流量的时空影响。
图1 步行距离概率密度分布拟合曲线
城市轨道交通和土地利用的互动发生在一定的区域范围内,对于该范围的划定,大部分研究基于站点的步行可达范围,通过实地调查或计算步行到达车站的广义成本确定吸引范围,取值范围从400 ~800 m 不等[9]。本文以乘客步行到达车站的距离作为车站合理吸引范围,对西安地铁4 号线全线共28座车站的乘客出行特征进行调查。
西安地铁4 号线是一条南北走向的交通疏导型骨干线路,串联文化旅游区、中心商业区和对外交通枢纽;沿线用地情况以商贸金融、教育科研、行政、旅游度假及居住用地为主,南北两端途经少量工业用地,车站周边的用地具有代表性。因此选择地铁4 号线作为调查对象。调查内容包括乘客性别、年龄、出行目的、交通接驳方式等。共采集到2 578 条数据,其中有效数据为2 304 条,采用步行、非机动车、道路公交、其他方式(小汽车、出租车等)到地铁站的数据分别为1 102 条、295 条、865 条和42 条。
成年人步行的平均速度按5 km/h[10]计算,将步行时间转化为步行距离,绘制步行距离概率密度函数,并拟合参数。如图1 所示,步行距离概率密度分布与正态分布基本吻合。拟合得到的概率密度p的分布函数为:
拟合均方根误差(RMSE)为0.036 26、可决系数(Adjusted R2)为0.815 6,表明拟合效果良好。取其85%位累计概率处的距离[10]690 m 作为车站合理吸引范围。
2.1.1 客流数据
本文客流数据由西安市地铁运营公司提供,其中包含2019 年3 月1 日—15 日西安地铁1、2、3、4号线共计88 座车站的客流数据。为探究各类用地影响下车站客流的时空分布变化情况,本文选择客流时变性较强的工作日早晚高峰进出站客流作为研究对象。考虑到高峰出站时间较进站时间晚,早高峰进、出站统计时段分别为7:30—8:30 和8:00—9:00,晚高峰进、出站统计时段分别为18:00—19:00 和18:30—19:30。
2.1.2 步行吸引范围内用地属性
引入气象学中的泰森多边形,确定车站690 m半径内的为车站合理吸引范围。将西安市土地利用现状图导入Arcgis 环境中,使用Toolbox 工具箱测量出车站吸引范围内各类用地的面积;结合百度地图,获得建筑的楼层数;取《西安市城乡规划管理技术规定》中各类建筑容积率的最大值,计算出各类用地的建筑面积。
出发地和到达地之间不同的土地利用性质是吸引人们出行的根本原因,不同土地性质对应着不同的出行目的。虽然中小学和大学都属于教育科研用地,但由于二者出行时间和特点完全不同,因此将两种用地分开统计。
2.1.3 网络拓扑结构因素
车站直接估计模型认为,车站客流受到其他车站及该站在轨道交通网络位置的影响[11]。因此使用图论中的中介中心性和接近中心性来表征车站在网络中的位置特点。中介中心性大的站点对客流的中转起重要作用,体现了站点与其它车站联系中的桥接作用。接近中心性反映网络中某一节点与其他节点之间的接近程度,数值越大,说明该站点越接近网络中心。此外,车站所处区位对本站客流有较大影响,一般认为城市中心车站的客流高于城市郊区车站的客流,故使用车站到市中心(钟楼)的直线距离作为衡量车站区位因素的指标值。中介中心性Bi与接近中心性Ci由式(2)和式(3)计算得到。
式中:
εst——从车站s 到车站t 的最短路径数;
εsit——从车站s 到车站t 并经过车站i 的最短路径数;
N——车站总数;
dij——从车站i 到车站j 的最短路径数。
乘客出行特征调查显示,到站后,采用步行和道路公交作为离站交通方式的占总交通方式的85%以上,其他交通方式占比均不足13%。因此选取道路公交线路数量作为衡量车站公交接驳特征的因素。
综上,本文模型中使用的解释变量如表1 所示。
在建立GWR 模型之前,需要对候选解释变量及因变量进行莫兰指数(MoranⅠ)检验,以确定各变量是否存在空间自相关性,检验结果如表2 所示。因变量中工作日晚高峰出站的P 值大于0.05,表明其空间效应不显著,因此未对该变量进行空间建模。除此之外,所有解释变量的P 值均小于0.05,MoranⅠ指数在-1 和1 之间,表明解释变量空间自相关性显著,适合建立GWR 模型。
表1 解释变量汇总及说明
表2 MoranⅠ检验结果
以早高峰出站为例,对变量进行共线性检验,结果如表3 所示,发现条件指数大于10,并且接近中心性与中心距离的方差比例大于0.5,说明这两个变量之间存在共线性,因此在回归分析时删除接近中心性这一变量。
表3 共线性检验结果
GWR 模型在普通最小二乘法的基础上,引入衡量空间位置的局部参数,将数据的空间特性加入模型中,用以表现出研究区域内的局部空间特征和空间分布的不平稳性。这是一种局部空间分析的方法[12],可表示为:
式中:
yi——因变量;
xik——自变量,表示第i 个车站的第k 个解释变量;
(ui,vi)——第i 个观察点的坐标;
β0——坐标为(ui,vi)点的回归常数;
βk(ui,vi)——第i 个观察点上的第k 个回归参数,是空间位置的函数;
εi——正态分布的误差项;
n——解释变量的数量。
本文中i=88,n=11。
省略空间位置因子项为:
公式(4)可用矩阵表示为:
利用加权最小二乘法,计算各i 处的估计回归参数,则i 点的回归系数的向量表示为:
式中:
wij——车站i 相对于车站j 之间描述空间距离的单调递减函数。
本文使用Gauss 函数描述空间权重:
式中:
dij——车站i 与j 之间的距离;
b——内核带宽参数。
使用上述方法进行逐点回归,得到包含样本点的回归参数估计矩阵β:
因此,因变量的值可以按式(11)估算:
为了在同一度量下解释变量的回归系数,通过Z-Score 方法将所有变量进行标准化。各时段客流量的拟合结果如表4 所示。早高峰出站客流与晚高峰进站客流的Adjusted R2值大于0.7,模型可解释性较好,表明周边用地和区位因素对其有较强的影响作用;相比之下,早高峰进站客流的Adjusted R2值较小,表明用地和区位因素对其解释性较弱,这与文献[13]的结论一致。
上述结果可以解释为:对于早高峰进站客流来说,大多数出行乘客的起点为车站周边的家的位置,终点在地铁站;对于出站客流而言,大多数出行乘客的起点为地铁站,终点在工作单位、中小学等。在我国,由于城市住宅的分布比工作场所更为分散[14],出站客流与进站客流相比,受到的约束作用更强,倾向于集中趋势;而晚高峰进站客流通常呈现出与进站客流相反的模式。因此,用地性质对早高峰出站客流、晚高峰进站客流有较强的解释性。由于晚高峰出站客流的目的地没有明显的规律,因此并未呈现出较强的空间自相关性。
表4 模型方差分析及拟合结果对比
同时建立普通多元回归(OLS)进行全局估计。以早高峰出站客流的拟合结果为例(如表4 所示),和全局OLS 模型相比,GWR 模型的Adjusted R2值升高,AICc(赤池信息准则)值减小且二者之差均大于8,残差平方和(Residual Squares)、均方误差(Mean Square)减小,说明高峰客流有较强的空间不平稳性,GWR 模型较OLS 模型更加适用[8]。
模型回归系数如表5 所示。总体来看,通勤用地(办公用地、中小学用地)对工作日早晚高峰客流的影响较大。但对于不同的乘车行为,解释变量的均值和显著性因出行目的和用地分布而异,表现出时空异质性。在各种用地性质中,办公用地、商业用地和休闲用地对早高峰出站客流的吸引作用较强,而对晚高峰进站客流来说,影响程度大的因素分别是商业用地、办公用地和居住用地。晚高峰时段由于居住用地进站的乘客出行目的不明确,他们的目的地可能是服务密集型的地区(如餐馆、商场等),他们或者是上夜班的工作者。对于早高峰进站客流,影响作用显著的只有居住用地,并且系数均值为正值,说明居住用地与该时段客流呈正相关关系。通勤者在下班后有更多的自由支配时间,会有更加丰富的出行活动,而道路公交与地铁相比可达的目的地更多,乘客在晚高峰搭乘道路公交的可能性更大,因此道路公交在晚高峰进站客流中显著。
虽然办公用地对两者的影响作用都是显著的,但是早高峰系数远大于晚高峰系数,说明它对早高峰出站客流的影响高于对晚高峰进站客流的影响,办公用地会吸引更多的早高峰出站客流。大学用地和中小学用地同为教育科研用地,但由于大学生和中小学生出行规律不同,因此两者对客流呈现出不同的影响:中小学用地对早晚高峰客流有显著的影响作用,并且系数较大,说明其对高峰客流的吸引作用较强,而大学用地并不显著。
表5 回归系数的局部参数
在同一时段内,不同用地因素影响系数存在较大差异,这与城市的空间格局有关。西安市主城区中心的明城墙区以行政、商业、旅游用地为主;西南部是以高新区为中心的高新产业区,办公就业用地密集;东南部是以曲江新区为中心的旅游度假区居住、旅游用地较多;南部是以雁塔区为中心的科研文教区,科研院所分布较多。如图2 所示,以晚高峰进站客流为例,办公用地系数较大的车站聚集在主城区的西南部,表明高新产业区的办公用地会吸引更多的高峰客流。商业用地系数在中南部的明城墙区和曲江新区最大,说明此处的商业用地对晚高峰进站客流有较强的吸引力。居住用地系数较大的车站大多分布在北郊、中南部,说明晚高峰时段,由居住用地进站的乘客大多集中在此处。从系数的空间分布来看,居住用地系数与办公用地系数分布有较大差异,体现了居住与办公的分离情况。
图2 晚高峰进站用地属性系数的空间分布
本文在确定西安市轨道交通车站吸引范围的基础上,建立地理加权回归模型来探究早晚高峰客流与周边用地之间的时空关系。模型结果表明:①土地利用的性质会对早高峰出站客流、晚高峰进站客流产生重要影响,相比之下,早高峰进站客流与用地之间的联系较弱。②用地性质对客流的影响具有时空异质性,随时间和空间的不同产生显著变化。时间维度的变化与居民出行模式(如居民的通勤行为)有关;空间维度的变化与城市布局有关。③与OLS模型相比,GWR 模型考虑了变量之间的空间关系,可了解变量随空间变化的趋势,因而有更好的拟合效果。同时可以确定各车站拟合的局部参数,根据局部参数的分析得出更具体的结论。
本文研究成果反映了土地利用对车站客流的影响,可为确定TOD(交通引导发展)模式下土地利用的政策、地铁线路规划提供依据,也可为具体车站的客流组织管理提供参考。以西安市为例,早晚高峰时期,高新区应在办公写字楼密集区域,曲江新区和明城墙区应在商业、居住区用地密集处的重点车站,需提前做好高峰客流疏导预案,合理组织进出站客流,如科技路站、五路口站、曲江池西站等。本文分析了土地利用对客流的时空影响,下一步可将社会经济因素、环境因素、交通接驳条件等纳入模型自变量,探究车站建成环境内多种因素与客流的时空关系。