考虑土地利用的城市公共自行车需求预测

2022-04-29 03:27朱才华李岩孙晓黎徐金华付泽坤
关键词:路网高峰时段

朱才华 李岩 孙晓黎 徐金华 付泽坤

(长安大学 运输工程学院,陕西 西安 710064)

准确预测公共自行车站点未来需求是建设及运营管理公共自行车系统的基础[1]。在新建公共自行车站点时,若无法预测该站点未来的使用需求,会导致新建站点规模过剩或者不足等问题。因此,亟需建立可准确预测新建公共自行车站点需求的算法,以避免浪费公共资源和保证居民出行需求。

由于新建公共自行车站点缺乏历史使用数据,已有研究主要是根据已知站点流量预测未建成站点的交通需求[2- 3],需直接建立公共自行车需求与变量间的关系模型。在预测中还应考虑需求生成与站点可达性的关系,然而已有方法很难在考虑可达性的基础上定量描述复合变量和公共自行车需求的关系。现有公共自行车需求预测方法按照所输入数据的集计特性可分为宏观预测和微观预测。宏观预测主要为四阶段法,常用于大范围的公共自行车需求预测[4]。由于该模型的可解释性和普适性,在整体预测中被广泛使用[5]。但此类预测在模型的精确性[6]和敏感性[7]等方面还存在若干局限。微观预测方法主要包括移动平均自回归模型[8]、BP神经网络[9]、支持向量机[10]、马尔可夫模型[11]等方法。此类预测可有效针对各类型站点进行短时预测,但其输入数据为历史数据,是依据历史情况预测未来,无法应对新建站点的情况。站点可达性对需求生成率有重要影响,即随着步行距离的增加,居民使用公共自行车出行的概率降低[12]。在考虑站点可达性建模中,现有模型通常以欧氏距离作为约束[13],忽略了居民出行是以步行距离作为衡量标准,导致模型预测结果产生一定误差。

土地利用作为城市规划的长期不变属性,以土地利用为媒介获取的公共自行车需求与土地利用间的关系可长期服务于站点规划[14]。单位用地的需求生成率与周边居民使用公共自行车的出行意愿直接相关[15],可用于确定更切合实际的站点规模。公共自行车使用需求受站点地理位置的影响[16],地理加权回归模型可在保证空间异质性的前提下,从空间区位角度建立因变量与解释变量的关系模型[17]。在建模中以路网距离作为约束条件更符合居民使用公共自行车出行的衡量标准[18],可提升模型的预测精度。预测的时间间隔可选择为1 h,既可保证数据的短时时变特性,也可避免忽略不同时段的需求规律特征。

已有研究主要是针对已建成站点的未来需求进行短时预测或描述因素与需求关系。从土地利用角度,根据已知站点流量预测未建成站点流量的研究还不充分,需求生成随站点距离增大表现的具体衰减形式还不清晰。基于上述实情和认知,本文以西安市公共自行车系统为例,以路网作为约束对象,以小时为时间间隔,建立公共自行车使用需求与周边土地利用性质之间的关系模型,以获取不同时间节点用地需求生成率及不同用地需求生成率与站点可达性间的关系。其中需求生成率为单位时间内单位用地面积平均每天产生的公共自行车出行次数;站点可达性为用地中心到最近公共自行车站点的难易程度,以路网距离作为衡量指标。本研究的主要目标为:

(1)以路网为约束,建立公共自行车使用需求与土地利用性质的关系模型,获得各类用地的需求生成率。

(2)分时段建立需求生成率与站点可达性的关系模型,获得不同时段需求生成率随用地与站点距离增大所表现出的衰减趋势。

1 研究方法

研究的核心思想是从土地利用的角度出发,分时段获得各用地的需求生成率及其与站点可达性间的关系,从而为待建公共自行车站点提供未来各时段的使用需求。

在待建公共自行车需求预测中,主要需解决三个问题:(1)在站点影响范围内,由于站点数量较多,易引起区域重叠,因此采用泰森多边形重新划分站点的影响范围;(2)在空间建模中,解释变量高度相关和因变量的空间非平稳性容易导致模型最终回归结果产生偏差,为保证模型精度和空间模型的适应性,对解释变量和因变量分别进行多重共线性和空间自相关检验;(3)站点可达性代表公共自行车骑行的便利性,可达性的好坏直接决定需求的大小,简单的定性描述无法带来实际参考价值。以路网距离为约束建立用地与公共自行车需求的地理加权回归模型,定量获取用地与需求之间的关系。对于站点与用地的可达性关系,在站点影响范围内,同一用地与站点的距离不同,其需求生成率也有很大差别,因此需在此基础上统计各用地与站点间的路网距离,并分析用地需求生成率随路网距离增大而表现的衰减关系。综上所述确定论文的整体研究框架如图1所示。

1.1 确定站点步行吸引范围

站点步行吸引范围是以某一公共自行车站点为中心,以某一距离为半径的缓冲区[19]。吸引范围半径选择合理可有效提高模型的预测精度和可靠性[20]。在分析中,若吸引范围超出实际影响区域,出行生成率将会低于实际,反之将偏高。根据已有研究[4,21- 22],本文中选用300 m作为公共自行车站点步行吸引范围。

在确定影响范围分析中,欧氏距离因其便利性被广泛使用,但由于城市规划路径还应考虑出行中的建筑物规避,所以常采用路网距离作为判断标准。对比以欧氏距离和路网距离为约束建立的需求生成模型结果,基于路网距离的分析结果更优[23]。公共自行车站点空间分布密集,在划分吸引范围时,会产生重叠区域。研究假设使用者会选择距离自己最近的公共自行车站点作为出行起源点和目的点,泰森多边形[24]可保证区域内的点到相应站点的距离最近,且其边上的点到两边站点的距离相等,因此采用泰森多边形对重叠区域进行重新划分。图2为分别选用三种方法划分吸引范围的表现形式,其中图2(a)为欧氏距离,图2(b)为路网距离,图2(c)为基于泰森多边形重新划分重叠区域后的路网距离。文章选用泰森多边形方法确定公共自行车站点的影响区域。

图1 整体研究框架

图2 公共自行车站点吸引范围确定方法的对比

1.2 筛选输入变量

在解释变量的挑选过程中,可能存在因解释变量高度相关导致多重共线性的情况[25]。解释变量的多重共线性会导致估计量的标准误差变大,回归系数的符号产生错误,甚至难以评估各解释变量对可决系数的贡献,导致模型失真。因此在建立公共自行车需求与用地间的关系模型时,需检验用地类型之间的多重共线性。采用方差膨胀因子v检验用地解释变量的共线性,以弱化由于用地因素间高度共线对回归分析结果的影响[26]。计算公式为

(1)

式中,r2为单一解释变量与其余解释变量回归模型中的可决系数,是反映回归方程说明因变量变化可靠程度的统计指标,其计算公式为

(2)

v的取值越大,则解释变量间可能存在多重共线性的机率越大。若v取值在0~10之间,则可认为解释变量间不存在高度共线性,所检验的变量因子可直接用于回归分析,否则需重新筛选解释变量。

选择空间模型分析公共自行需求与用地间的关系。因此在建模前需要判定公共自行车需求是否与空间位置有关,若有关则使用空间模型可提高模型精度,反之则不需要使用空间模型。空间自相关指某一空间区域要素观测值与临近空间区域要素观测值间的相关性[27],其主要目的是发现研究对象在空间中是否存在空间异质性或空间聚集性,进而说明此次研究空间模型是否适用。Moran’s I(莫兰指数)可描述某现象的整体分布情况,是衡量空间自相关的常用指标,通常判断观测数据之间潜在的相互依赖性。采用Moran’s I检验公共自行车使用量分布的空间自相关性,其输入样本为公共自行车使用数据,计算公式如下。

(3)

(4)

式中,E(I)和V(I)分别是Moran’s I统计量的期望和标准偏差,取置信度为95%,Z(I)判定标准为|Z(I)|>1.96。

1.3 考虑用地的模型构建

最小二乘法回归是对全局回归变量的标定,适用于不受位置变化的二维分布。对于空间回归,由于受到空间异质性的影响,仅仅依靠传统的全局回归,很难把握变量间因空间位置变化产生的回归误差。地理加权回归模型[28]模拟了局部回归因变量与解释变量间的关系,容许部分不平稳数据被模拟。区域回归参数根据相邻区域观测值估计局部回归值,则变量参数随着空间位置而变化,此时模型表示为

(5)

(i=1,2,…,n)

式中:yi为第i个样本点的因变量;β0(ui,vi)是第i个样本点的常数项;(ui,vi)是i的区位地理坐标;βk(ui,vi)是第k个解释变量在第i个样本点的回归系数,随着区位的改变而变化;xik是第i个样本点的第k个解释变量;εi为随机误差。任意一个局部回归项的系数βk都被用来估计该局部回归项相邻的空间参数观测值。

给定一个对角加权矩阵W(ui,vi),wj(ui,vi)(1

εTW(ui,vi)ε=yTW(ui,vi)y-2βT(ui,vi)·

XTW(ui,vi)y+βT(ui,vi)XTW(ui,vi)Xβ(ui,vi)

(6)

式中,β为变量回归系数。对式(6)求β(ui,vi)的偏导,并令其等于0,可得:

[XTW(ui,vi)X]-1XTW(ui,vi)Xβ(ui,vi)=

[XTW(ui,vi)X]-1XTW(ui,vi)y

(7)

因此, 第i个位置的模型参数估计β(ui,vi)为

β(ui,vi)=(XTW(ui,vi)X)-1XTW(ui,vi)Y

(8)

式中,X是参数矩阵,

(9)

Y为每组样本数据对应的因变量,即Y=(y1,y2,…,yn)T。W(ui,vi)是对角加权矩阵,

(10)

式中,wj(ui,vi)是空间距离衰减函数,其计算公式如下:

(11)

式中:dj(ui,vi)是小区与影响因子间的空间路网距离,此距离为所有路径中的最短距离;b是带宽,带宽的大小直接影响了地理加权回归模型的空间变化形式。b的取值为低于研究区域最大覆盖半径的随机数,最佳带宽可通过试值法确定。模型的最佳带宽应在拟合优度与自由度间取得平衡。带宽对应的b值在校正后赤池信息准则AICc取最小值时最优[29]。

各地块土地利用的开发强度和周边建筑环境不同,其产生的需求生成也有较大差异。为保证站点需求的精确预测,在模型中增加用地混合度和建筑强度两个解释变量以改善模型精度。用地混合度可采用混合度熵方法获取。熵值范围在0~1之间,熵越接近于1表示用地的混合度越大。定义熵混合度为M,

(12)

式中:Pi为站点300 m范围内第i种建筑用地所占的比例;k为用地种类;k为用地的种类数,取k=6。站点建筑强度是指站点周边300 m范围内的建筑物容积率。

2 数据

2.1 研究区域及基础数据

截止2018年1月底,西安市共设置公共自行车服务站点1 800个,投放自行车5.2万辆,已形成覆盖规模[30]。研究区域涵盖西安市碑林、新城、莲湖、雁塔、未央、灞桥6个主城区,站点位置分布及空间密度如图3所示,单位为个/km2。

图3 研究区域道路网及公共自行车站点分布

研究基础数据主要包括:2018年的西安市开源地图(Open Street Map)路网数据;研究区域内1 465个公共自行车站点的数据,包括站点ID、名称、位置(经纬度)、总桩数和车辆实时借出还入量;西安市用地数据,主要包括用地属性、建筑用途和用地面积等信息,其中建筑用途分为居住、商业、办公、文娱、旅游、工业等12种用途,具体如图4所示。为方便观察与统计,将12种建筑用途合并为6类,分别为居住、商业金融、行政办公、旅游文化、工业和其他用地。

图4 研究区域用地性质分布情况

2.2 变量选择

公共自行车需求受多种因素影响。常见因素包括周边土地性质、换乘设施分布、区域人口和经济条件、天气、节假日等。公共自行车站点周边的土地利用情况容易获得,且短期内不会发生显著变化,对公共自行车出行需求起最关键的作用[31],因此在选取单一分析影响因素时,宜选用站点周边用地性质分析,既保证需求生成的主要来源,又避免了统计困难,同时可长期服务于需求预测。

公共自行车使用强度可分别从借出量、还入量和总使用量(借出量与还入量之和)等3个角度描述。其中,借出量和还入量体现了需求的潮汐特性和调度输送特性,总使用量则体现了站点总体使用规模。考虑到模型计算量和确定新建站点规模的计算需求,选取公共自行车总使用量为模型的因变量,用地属性、用地混合度和建筑强度作为模型的解释变量。模型中各个变量属性如表1所示。

表1 变量描述

3 结果分析

为降低天气等因素对公共自行车使用量的影响,选择2018年6月4日至6月10日一周的公共自行车使用数据进行分析,所选一周西安的天气均为晴天或多云状态。根据分析结果可知,2018年6月份公共自行车已经处于共享单车影响过后新的稳定状态,因此可只采用公共自行车使用数据进行分析。以1 h为时间间隔,各时段西安公共自行车系统的总使用量变化均值如图5所示。

图5 公共自行车总使用量小时变化特性

从图5可知,西安市公共自行车使用存在明显的早晚高峰。早高峰集中在(7:00~8:00),而晚高峰集中在(18:00~19:00)。此特性与西安市其他公共交通方式一日内乘车强度时间分布一致[32]。与休息日使用时间相比,公共自行车在工作日的早晚高峰效应更明显,使用变化幅度更为剧烈。因此后续的模型分析中主要针对工作日的公共自行车需求进行分析,并选取6:00~23:00作为分析时段。

3.1 用地需求生成率时间特性

运行模型前需检验变量的多重共线性和空间自相关性,所得的解释变量间方差膨胀因子如表2所示。模型方差膨胀因子取值均在0~10之间,可认为用地解释变量间不存在高度共线性,所检验影响因子可直接用于回归分析。

表2 共线性指标

分别进行各时段公共自行车需求全局自相关分析,结果如表3所示。

表3 全局自相关Moran’s I统计表

由表3可知,全局Moran’s I统计值在0.429~0.732之间,表明数据聚合。P值为观测数据随机生成的概率,其值越小模型性能越好。模型所得P值在0.000~0.011之间,同时Z得分大于1.96,表明西安市公共自行车需求在空间上具有很强的空间自相关性,离散点间的远近对取值影响较大,变量的地理属性对变量值的影响较大,是地理加权回归模型建模的客观基础。以各小时站点总使用量作为因变量,建立需求与用地单位建筑面积的地理加权回归模型如式(13)所示,模型参数如表4所示。

(13)

表4 模型拟合系数

表4中拟合系数的正负分别表示对公共自行车需求的促进和抑制。建筑容积率对公共自行车的使用起促进作用,而用地混合度则在不同时段表现为各异的作用状态。用地拟合系数为所属时段各用地需求生成率均值,各用地最大需求生成时段分别为19:00、20:00、9:00、19:00、8:00和12:00。可决系数r2处于0.725~0.851之间,满足拟合要求。以19:00时段的居住用地为例,参数估计值为67.092×10-5,表示每1 m2建筑面积的居住用地平均每天产生67.092×10-5次出行,换算成100 m2,则每天约产生0.067次出行。

以9:00时段和20:00时段为例,对比各类用地。9:00时段站点的需求生成率由大到小依次为:行政办公>商业金融>居住>其他>旅游文化>工业;20:00时段站点的需求生成率由大到小依次为:商业金融>居住>旅游文化>工业>其他>行政办公。说明在不同时段,用地性质对需求生成的影响也不断变化。在制定相关服务设施和应急措施时,宜根据时段进行管理。西安市不同用地需求生成率的时间序列如图6所示。

从图6可知,不同用地的需求生成率在以天为周期的小循环内具有各异的变化趋势。

居住用地存在着明显的早晚高峰现象,且早晚高峰需求生成率相近,有轻微的午高峰,早高峰在7:00~8:00间,晚高峰在18:00~19:00间,说明白天时段服务于此类用地站点的车辆流动性并不大。

商业金融用地具有明显的早晚高峰特性,且晚高峰的需求生成率高于早高峰,不存在午高峰现象。早高峰在7:00~9:00间,晚高峰在18:00~21:00间。相比较于居住用地,此类用地的高峰时段持续时间更长,且晚高峰时段会相应推迟约1个小时。

行政办公用地具有明显的早晚高峰现象,且早高峰的需求生成率高于晚高峰,不存在午高峰现象。相比居住用地,此类用地的早高峰会推迟,晚高峰会提前,早高峰在8:00~9:00间,晚高峰在15:00~17:00间。

旅游文化用地具有明显的晚高峰,而早高峰不显著。此类用地的高峰持续时间较长,15:00~20:00均可认为是晚高峰,不可控制因素较多。此类用地的站点建议增加实时监控,防止“无桩可还、无车可借”的情况出现。

(a)居住用地

(b)商业金融用地

(c)行政办公用地

(d)旅游文化用地

(e)工业用地

(f)其他用地

工业用地具有明显的早晚高峰,且午高峰对比于其他用地较为显著。其早高峰在7:00~8:00间,晚高峰在18:00~19:00间,此类用地多为工作上班需要,时间较为统一,车辆便于管理。

其他用地多处于波动的状态,主要与用地分类有关,未发现较为合适的变化规律。此类用地的分布较为分散,夹杂在其他用地之间。

3.2 用地需求生成率空间特性

由于模型具有局部回归特性,所以除获得整体用地需求生成率,还可获取每个站点影响范围内各类用地的需求生成率,从而分析各类用地到公共自行车站点距离对需求生成率的影响。统计各类用地中心到公共自行车站点的路网距离,并和各时段需求生成率对应,建立二者的关系模型。各类用地需求生成率都具有早晚高峰的特点,因此文章分析站点可达性与生成率之间的关系选择早晚高峰对应的7:00~8:00和18:00~19:00两个时间段进行具体分析,统计结果如图7所示。

根据图7所示结果可以看出,7:00~8:00和18:00~19:00时间段分别服从线性衰减模型和指数衰减模型,其模型构造如式(14)和式(15)所示:

(14)

(15)

式中:SLDijn表示站点i步行吸引范围内第n类用地中第j块用地的面积;dijn表示该用地到公共自行车站点的路网距离;an、bn是线性衰减模型参数;An、Bn与λn是指数衰减模型参数;Ri是土地利用产生的需求量。

在7:00~8:00时间段,随着站点可达性降低,需求生成率呈线性衰减模型,其拟合优度为0.787,拟合效果较好。各类用地需求生成率受站点可达性影响程度由大到小依次为:行政办公用地>商业金融用地>居住用地>其他用地>旅游文化用地>工业用地。根据衰减趋势变化,可将6类用地分为3类进行描述:(1)行政办公和商业金融用地具有最大的需求生成率,但其下降速率也是最快,说明这两类用地在此时段对站点可达性非常敏感,当距离较远时,居民选择公共自行车出行的需求显著降低;(2)旅游文化和工业用地使用公共自行车出行需求随着可达性的变弱,其衰减并不是很显著,工业用地由于可选择的出行方式有限,因此距离衰减缓慢,旅游文化用地由于可选交通方式的限制,因此距离衰减同样缓慢;(3)居住用地和其他用地衰减幅度在前两类之间,但在距离超过0.5 km后,其需求生成率拟合值为0。在早高峰时段,居住用地的出行多为上班或上学等通勤出行,对时间要求高,此时可达性的权重极高。

(a)7:00~8:00

(b)18:00~19:00

在18:00~19:00时间段,随着站点可达性降低,需求生成率呈指数衰减模型,其拟合度为0.815,拟合效果较好。各类用地需求生成率受站点可达性影响程度由大到小依次为:商业金融用地>行政办公用地>居住用地>旅游文化用地>其他用地>工业用地。此时段的影响层次与早高峰时段存在显著差异,且除行政办公用地和工业用地外,其余用地需求生成率普遍高于早高峰时段。当用地与公共自行车站点间的距离在0~0.3 km范围内时,需求量衰减最快,当距离超过0.3 km时,需求生成率接近于0。在18:00~19:00时段并未出现距离超过0.6 km后用地需求生成率为0的现象,此情况主要与居民的通勤行为有关。

其余时间段各类用地需求生成率与站点可达性的关系如表5所示,其中αn、βn为系数,衰减图只代表趋势,不代表量级。

用地需求生成率随公共自行车站点与用地之间距离增大的衰减关系模型共呈现出线性衰减、指数衰减和立方衰减三种形式。其中,指数衰减以300 m为划分节点,在0~300 m间,用地需求生成率急剧下降,而超过300 m后,下降变得平缓,同时需求生成率也接近于0;线性衰减下降速率保持一致,不存在拐点,但当距离接近600 m时,其衰减更易产生需求生成率为0的情况;立方衰减表现为急剧下降、平缓、急剧下降转变形式,两个拐点分别在200 m和400 m附近,此类衰减所占比例较前两种衰减相比较低。

各时段公共自行车需求随着距离的衰减呈现出不同的表示形式,且不同用地的衰减模式也有差异。根据各用地的需求生成率及随距离的衰减规律可对新建公共自行车站点的需求进行预测,并根据预测结果判定站点位置和规模是否合适。

应用所建立模型预测西安市公共自行车使用需求,并与实际使用需求对比,以评估模型的预测精度。西安市公共自行车系统某工作日全天使用需求在不同时段的实际值与预测值如图8所示。

由图8可知,所提出模型较好地预测了西安市公共自行车在各时段的实际使用需求。选用平均绝对百分比误差MAPE和可决系数(r2)度量模型预测效果的结果如表6所示。

越小的MAPE值和越大的r2值表明模型的预测精度越高。文中提出模型的MAPE接近于0,且r2接近于1,说明模型具有较高的预测精度,可满足实际应用中对新建的公共自行车站点需求预测的要求。

表5 分时段不同用地站点可达性性质

图8 预测结果

表6 预测精度评价指标

4 结论

(1)在以路网距离为约束条件的情况下建立了地理加权回归模型,并考虑用地区位信息对模型进行改进,定量获取各类用地在不同时段的需求生成率。

(2)在以天为周期的时间特征中,居住、商业金融、行政办公、旅游文化、工业和其他用地分别在19:00、20:00、9:00、19:00、8:00和12:00具有最大的需求生成率。居住、商业金融、行政办公和工业用地具有明显的早晚高峰,其中,行政办公用地早晚高峰时间点更为集中,而旅游文化用地晚高峰更为显著。

(3)随着用地与公共自行车站点间的路网距离逐渐增大,需求生成率在不同时段表现为指数、线性或者立方衰减趋势。证明了分时段分析的必要性。在对公共自行车需求预测时,根据不同的衰减规律可有效提高预测精度。

(4)公共自行车需求受天气影响较大,不同天气的使用需求也有所差异,进而与土地利用间的关系也不尽相同。文章仅选择6月份温度适中天气进行分析,而其他天气的需求特征有待深入探讨。共享单车作为城市公共自行车的主要竞争对手,它的出现同样会改变公共自行车需求量,未来可将共享单车和公共自行车对比分析,描述二者在时空中的竞争关系。

猜你喜欢
路网高峰时段
云南智慧高速路网综合运营管控平台建设实践
全球迎来“双胞胎高峰”
石庆云
第70届黄金时段艾美奖主要奖项提名
秋 江
西藏文物 迎来大修时段
“我将不断进取,向艺术的高峰挺进”