孙超,陆建*
(东南大学,a.江苏省城市智能交通重点实验室;b.现代城市交通技术协同创新中心;c.交通学院,南京 211189)
近年来,共享单车已经成为一种受欢迎的绿色交通工具,特别是在北京、纽约等大城市。共享单车出行是无污染的,除了生产车辆的过程外,几乎不消耗自然资源;同时,共享单车有高度的灵活性,可以有效地解决出行“最后一公里”问题。共享单车的出现为居民出行提供了便利,但其在发展过程中也面临着许多困难。如何有效挖掘出行特征以及土地利用与共享单车出行需求之间的关系,是共享单车规划和管理中的难点。
目前,学者大多采用聚类[1]、回归分析[2]、地理探测器[3]等在不同区位和天气条件下挖掘出行模式,重点研究了与公共交通接驳的需求特征。例如,刘冰等[4]采用细粒度分析,建立了共享单车时空特征表达体系。另一方面,国内外许多学者试图挖掘共享单车出行的决定因素。例如,曾尤美[5]从交通行为的角度出发,利用偏好模型探索共享单车与城市要素的关联性;A.Faghih-Imani 等[6]使用多级统计建模方法,研究气象数据、时间特征、自行车基础设施、土地利用等对共享单车流量的影响;此外,街道连通性[7]、交通可达性[8]和工作岗位数[9]等因素都会对共享单车的出行产生影响。总的来看,现有研究主要采用可视化的方法描述共享单车出行空间分布特征,更多关注共享单车使用时间和距离的异质性[10]以及影响因素的异质性[11],缺少定量且标准化的范式刻画共享单车出行需求量自身的空间异质性,特别是,共享单车出行需求的异质性空间阈值还不明确;其次,往往止步于时空特征和相关性分析,缺少在不同方向上、不同范围内全面分析需求异质性特征的驱动因素及其驱动力大小;很少对内源性需求和外源性需求进行区分和量化,尤其是,复杂且难以定量描述的建成环境对共享单车出行需求异质性的影响及其区域差异尚不完全清楚。本文旨在应对上述挑战,应用半变异函数和残差分析模型,解决以下研究问题:如何用数学语言刻画共享单车出行的空间异质性特征?什么因素驱动了共享单车出行空间异质性特征的形成?
通过回答以上问题,本文对现有方法和知识的贡献主要包括:利用热点探测模型进行空间采样,将共享单车出行需求相对较大的区域作为主要研究区域,可以避免零堆积现象对回归模型的干扰,获取更具代表性的特征规律;给出了描述空间异质性的最佳范式,确定空间异质性的阈值是后续共享单车空间建模过程中确定空间权重的关键,具有重要的应用价值;区分了内源性因素和外源性因素。除减少空间回归的误差外,模型可以帮助后续进一步定义和挖掘由于建成环境影响而导致共享单车出行需求被削弱的瓶颈区域。
热点探测模型为区域分割和数据采样提供了良好的理论基础。热点通常被定义为大量发生一些类似事件的区域,并在地图上给予地理参考。密度分析是基于空间关系将数据点散布到地球表面,形成密度场。本文采用核密度分析,该算法将研究区域栅格化,计算栅格中的密度,并构建平滑表面。从离散对象转换到连续场之后,目标周围的密度将被可视化。
利用核密度分析获得连续的密度场以后,引入现有文献中所述的热点探测模型,精确识别出行需求相对显著的空间位置[12]。将共享单车出行热点设置为采样点,热力值作为共享单车出行发生量(Trip-generation of Bike-sharing,TGB)的表征。进一步,将采样点导入地理数据库,并在其周围进行缓冲,建立采样分析区。参考常规公共交通站点覆盖率的评价方法,本文将具有公共交通属性的共享单车所对应的采样分析区半径r设定为500 m,如图1所示。
图1 采样分析区的建立步骤Fig.1 Steps for setting up sample analysis area
半变异函数能够刻画TGB 的结构性变化,也能描述其随机性变化。本质上可以理解为,模拟TGB变异值与数据点间距离的关系函数,即
式中:γ(h)为半变异函数;h为步长;N(h)为间隔为h的共享单车出行热点的个数;Z(xi)、Z(xi+h)分别为TGB在xi、xi+h处的观测值。
半变异函数通常用变异曲线来表征,如图2所示,它有3 个主要参数:块金值(C0),基台值(C0+C),变程(A)。C0+C表示TGB 总的空间变异;C反映TGB 由空间结构特征(土地利用+邻域效应)引起的变异程度;C0反映TGB的随机性变化部分,主要是其他不易观测的环境随机性引起的变异;A是TGB的空间自相关尺度,提供了研究共享单车出行需求相似范围的一种测度。
图2 变异曲线Fig.2 Variation curve
为了挖掘空间异质性特征产生的原因,首先区分“土地利用+邻域效应”(广义内因,结构性因素)和其他建成环境(外因,随机性因素)。土地利用是指各种能够直接产生出行需求的兴趣点(小区、学校等),而其他建成环境是指不能直接产生但影响出行需求的要素,主要包括,交通建成环境(如自行车道长度,以及路网密度、交通可达性水平、拥堵水平等),自然地理环境(天气、地形等)和社会环境(收入等)。具体的驱动力评估方法如下。
(1)趋势分析法
TGB 的变化趋势使用其空间序列的斜率来表示,即
式中:STGB为TGB与空间位置变量拟合的一元线性回归方程的斜率;TGBi为第i个分析区内的共享单车出行发生量;i为空间位置变量,即从1~n的采样分析区序号;n为分析区域的总数。当STGB>0,TGB 会随着空间的变化而增加,斜率越大,TGB增加越明显;相反,当STGB<0 时,随着空间的变化,TGB趋向减小。
(2)残差分析法
鉴于环境的影响机理过于复杂,本文引入残差分析法,利用实际值和预测值的残差测度其驱动力大小。通过建立土地利用与TGB 的空间回归模型,预测由土地利用决定的共享单车出行发生量。因此,本研究不需要获取直接的建成环境相关数据,而是用残差值表示建成环境对TGB的影响,即
式中:TGBHA为共享单车出行发生量的残差;TGBobs为发生量的实际值;TGBCC为发生量的预测值。如果残差大于0,则其他建成环境能够增加TGB;否则,TGB 会由于其他建成环境的影响而下降。
通常,变量考虑不足和自相关性是空间统计建模中的难点。前者主要源于不易观测的环境随机性差异,本文通过残差值进行描述。因此,引入并改进空间滞后(Spatial-Lag,SL)方法,建立SL-Tobit模型,强调邻域效应的重要性,同时更加符合实际情况。另外,作为可行且简单的方法,使用地理兴趣点(Point of Interest,POI)表示土地利用是合理的。在TGB 空间回归模型中,兴趣点被划分为12类,用于表示不同的土地利用。
式中:TGBCC(i)为第i个采样分析区内,由广义内生因素所决定的TGB;为由邻域效应(Neighborhood Effect,NE)所决定的TGB(TGBNE);ρ为用来决定yi和之间空间自相关关系强度的系数;为由土地利用(Land Use,LU)所决定的TGB(TGBLU);yi为空间回归结果,亦即未受约束时的TGB预测值;Wij为n×n阶空间权重矩阵的第(i,j)个元素;Q为兴趣点的种类数,取12;Xiq为空间自变量,其中变量的序号,依次取1~12;X1~X12依次为餐饮设施、景观、公共设施、公司企业、教育设施、金融保险设施、宾馆酒店、生活设施、体育设施、医疗设施、政府部门、住宅设施;βq为每个空间自变量对应的回归系数;ε为常数项。式(4)的残差计算结果为其他建成环境(Built Environment,BE)决定的TGB(TGBBE)。进一步,引入Xu等[13]提出的相对效应模型,识别土地利用、其他建成环境、邻域效应各自在共享单车出行空间异质性特征形成过程中的相对驱动力,如图3所示。
图3 相对效应分析的建模思路Fig.3 Modeling ideas of relative effect analysis
本文使用TGB 预测值描述土地利用变化和邻域效应变化产生的影响,使用TGB 残差描述其他建成环境变化所造成的影响。进而,将TGB 预测值和残差值的趋势与TGB 实际值的趋势相结合,根据不同情景构建不同方法,以评价不同因素的差异在TGB变化中的相对贡献,如表1所示。
表1 相对效应计算模型Table 1 Relative effect calculation model
本文以北京市为例,进行共享单车出行空间异质性特征评估。以开放数据源①https://www.biendata.xyz/competition/mobike/data/提供的北京市城区内1 周(2017年5月10~16日)共享单车轨迹作为研究数据。数据形式为csv 格式的文件,大小约为100 M,单日数据量约为250000条。数据的主要内容包括用户ID、时间、位置坐标等,如表2所示。数据经过预处理,使用ArcGIS分割等工具,获得研究区内共享单车OD数据。
表2 共享单车数据描述Table 2 Description of shared bike data
其次,利用爬虫工具获取研究区域内所有POI数据表征土地利用类型,并将其分成12 类,如表3所示。POI 数据仍然为csv 格式文件,单个POI 类型对应的文件大小为1~10 M不等,主要内容包括,名称、类型、地址和位置坐标等,具体说明如表3所示。
表3 POI数据说明Table 3 Explanation about POI data
利用1.1 节所述的热点探测模型,经过窗口分析、代数做差、重分类、栅格转面、要素转点等步骤,获取北京市共享单车出行的热点,并以热力值表征TGB。为了解释空间异质性特征,首先利用所有采样点的热力值计算全局空间自相关Moran指数I,并计算其检验的标准化统计量Z。其中,I=0.406954,Z=535.810289,显著性P1=0,置信度为99%;在正态分布假设条件下,Moran指数I检验结果显著。表明不同区域内TGB 存在中等的、正的空间自相关。图4 可视化了不同概率水平条件下共享单车出行的空间异质性特征:①根据图4(a)、(b)发现,城市中心区域TGB 的聚集特征最为显著,而边缘地区的聚集特征显著性水平相对较低,中间区域无显著的聚集特征;②根据图4(c)、(d)发现,“高出行量-高出行量”的相关现象主要发生在市中心,“低出行量-低出行量”的相关现象主要发生在边缘地区;除去相关性不显著的点外,其他正相关以及负相关(高出行量-低出行量)的点占比较少,数量仅为213和32。
图4 空间异质性特征的可视化Fig.4 Spatial aggregation feature
由于半变异函数的特殊性质,为了提高模型拟合准确度,本文将所有热力值在SPSS中进行转换,使其符合正态分布。进而,根据式(2)模拟TGB 的实际空间异质性特征。借助Matlab 和GS+进行拟合,结果如表4所示。指数模型拥有最好的拟合优度,决定系数达到0.678。
表4 显示,TGB 的块金值与基台值之比为0.38,在25%~75%之间,说明北京市共享单车出行具有中等的、正的空间自相关性,这与前述的莫兰指数分析结果相一致。TGB 的空间变异属于中等程度的变异,其既受到结构性因素的影响又受到随机性因素的影响。进一步,TGB的空间自相关尺度为1860 m,这意味着在0~1860 m 范围内,北京市TGB 的半方差函数值随着采样点间隔距离的增大而增大(即TGB空间变异愈来愈大),TGB空间自相关性逐渐减小,如图5所示,但增加至1860 m时,半方差函数值基本趋于稳定且不再增加,TGB空间自相关性消失。换句话说,某区域的TGB 受邻域效应的影响程度随着距离的增大而减小,到1860 m(衰减半径)时达到最弱,而大于此距离的其他区域基本对其无影响。
图5 各向同性下变异曲线Fig.5 Variation curve under isotropy
表4 半变异函数拟合结果Table 4 Results of semi-variogram fitting
北京市共享单车出行发生量的半变异函数模拟方程为
该模型能够通过F检验,在足够的显著性水平下描述了共享单车出行的空间异质性特征。
为分析TGB的各向异性,本文在4个方向上分别模拟半变异函数,如图6所示。显然,变异曲线在不同方向上具有相对不同的变化趋势,北京市TGB 的空间分布呈现一定的带状异向性,说明TGB 的分布在不同方向上具有不同的空间结构特征。这说明,在不同的方向上,由于土地、环境条件不同,慢行交通的发展速度快慢以及共享单车出行的吸引力存在一定差异。
图6 各向异性下变异曲线Fig.6 Variation curve under anisotropy
进一步,以热点为中心构建分析区(原理如图1所示)。同时,根据到市中心(国家会议中心:纬度39.99855833,经度116.39100556)的距离,将所有的分析区排序,从而获得从内到外的空间序列。经过正态分布转换后的分析区内TGB 设为因变量,分析区内各类POI的数量作为自变量,进行式(5)和式(6)的拟合。首先,基于距离构造空间权重矩阵,将中心距离小于等于1860 m的两个采样分析区定义为邻接;其次,所有的VIF(方差膨胀系数)均小于10,满足非共线性的研究要求,可以忽略;再者,对模型的整体有效性进行分析,此处模型检验的原假设为,无论是否放入解释变量,模型质量均相同。这里,整体显著性p <0.01,因而拒绝原假设,即说明放入的解释变量有效,TGB预测模型的构建有意义。表5为SL-Tobit最终的拟合结果。
表5 SL-Tobit模型拟合结果Table 5 Fitting results of SL-TOBIT model
根据表5可以判断:TGB会对自身产生显著的正向影响,回归系数达到0.738;X1,X4,X5,X7,X10,X12会对TGB 产生显著的正向影响,X6,X8对TGB 产生显著的负向影响,其他变量并不会对TGB 产生显著的影响。其中,对TGB 产生最大正向影响的POI类型是医疗设施,即该类型设施数量的增多将有助于提高区域内共享单车出行的吸引力,其次是宾馆酒店、餐饮设施等。在制定调度方案时,共享单车场站应该靠近这些设施,并且在其附近适当增加调度量。相反,由于产生了较大的负向影响,金融保险设施和生活设施的数量越多,反而越不利于提升区域内共享单车出行的吸引力,应当将它们视为规划管理策略中的消极因素。
进一步,根据距离市中心的空间距离将所有采样区分成5 个区间(由市中心到外围依次是第1~第5 区间),利用式(3)分别计算在各个区间内TGB序列的空间变化趋势,从而判断共享单车出行空间异质性特征的驱动因素。例如,在第1 区间,预测值TGBNE和TGBLU的斜率(Slope)分别为-0.011899和-0.075907,这表明,在靠近市中心的区域、由内向外扩展的过程中,土地利用极大程度地导致TGB减少;然而,残差值,即TGBBE的斜率(Slope)也达到了-0.23967,进一步表明,建成环境差异也是前述空间异质性特征产生的重要原因,而且影响力更大。利用表1 中所述模型,计算所有区间内3 种要素各自对于TGB 变化的相对驱动力,结果如表6所示。首先,由中心到边缘地区,土地开发强度的改变只是诱发共享单车出行吸引力下降的原因之一,其相对驱动力仅仅只在第1区间和第3区间超过了20%,平均值仅有15%;其次,邻域效应对于TGB变化的驱动力处于中间水平,其中,在第3和第4区间内邻域效应的相对驱动力超过40%,而在其他区间内的相对驱动力接近0,这可能与空间自相关性的变化有关;最后,建成环境是更值得关注的要素,因为其在多数区间内的相对驱动力均超过了50%,整个研究区域内的平均水平也达到65%。既然建成环境是驱动共享单车出行发生量由内到外减少、空间异质性特征形成的最重要因素,那么在同样的POI组合下,非机动车道与自行车专用道的建设不足、绿化水平低、公交可达性不足等所有不利于建成环境的因素都会使得共享单车出行的吸引力大幅度下降,而这种削弱能力甚至超过了共享单车出行内因的影响力。这警示规划管理者,在建设和优化共享出行系统的过程中,要给予内因和外因相同程度的重视。
表6 不同空间范围的相对驱动力Table 6 Driving forces at different spatial scales
(1)北京市TGB 存在中等的、正的空间自相关性,“高出行量-高出行量”与“低出行量-低出行量”的自相关现象比例较高;指数模型对于空间异质性特征的拟合最优,并且空间自相关的衰减半径为1860 m,大于此距离时邻域效应消失;TGB 的分布呈现一定的带状异向性,不同方向上具有不同的空间结构特征,慢行交通的发展速度快慢以及共享单车出行的吸引力在不同方向上存在一定差异。
(2)空间变化过程中,土地利用、邻域效应和建成环境都在驱动共享单车出行空间异质性特征的形成。其中,建成环境的相对驱动力最大,在所有区间内的平均值超过60%;邻域效应的相对驱动力处于中间水平;土地利用的相对驱动力最小,平均值仅为15%。在同样的POI 组合下,增加专用道、提高绿化面积等优化骑行环境的措施能够提升共享单车出行的吸引力。
(3)增加医疗、宾馆酒店、餐饮等设施的数量有利于提升区域内共享单车出行的吸引力,共享单车场站应该靠近这些设施,并且在其附近适当增加共享单车投放量;金融保险、生活设施则相反,它们应该被视为共享单车管理策略中的不利因素。