大数据下考虑区间不确定阻抗的公交客流分配模型

2021-09-12 05:01谭倩李远东李旺
铁道科学与工程学报 2021年8期
关键词:客流路段公交

谭倩,李远东,李旺

(1. 中南大学 交通运输工程学院,湖南 长沙410075;2. 长沙海信智能系统研究院有限公司,湖南 长沙410208;3. 长沙理工大学 交通运输工程学院,湖南 长沙410004)

公交客流分配,是交通系统规划、设计与运营管理中至关重要的一环,主要任务是分析公交乘客在出行中的路径选择行为,而出行时间、费用、舒适性等是影响公交乘客选择路径的关键因素。随着公交系统的智能化以及公交信息化技术的普遍应用[1−5]。公交GPS 数据、公交站IC 卡刷卡数据可更好的记录公交乘客出行信息,为城市公交阻抗分析提供了一种更可行和科学的途径[6−9]。城市公交网络复杂且数据繁多,传统的方法获取公交阻抗尤为不易,目前已有学者通过大数据推算公交阻抗。LIU 等[10]使用常规公交车GPS数据以及公交发车时刻表等数据,提出了基于GPS 数据的公交车辆路段行程时间的推算模型;李晓丹等[11]建立了公交车辆在两个紧邻公交站点之间的行驶时间的回归表达式,并对公交车辆行程时间进行短时预测;胡郁葱等[12]采用数据挖掘技术,结合IC 卡获取的信息,推算了公交出行的OD 矩阵;IDRIS 等[13]以多伦多市的公交数据为基础,建立了基于卡尔曼滤波算法的公交车辆行程时间的推导模型;汤月华[14]依据常规的地图匹配算法,提出了一种新的投影匹配算法,将其够用于公交行程时间的计算;在区间阻抗不确定研究方面,KHOS‐RAVI 等[15]在公交到站时间预测的研究中考虑了公交运行时间的不确定性,使用区间数的方法表示公交到站时间,结果表明考虑不确定性的预测模型具有更高的稳定性;MAZLOUMI 等[16]提出了一种基于ANN 模型的公交车辆行程时间的不确定性估计方法,并使用墨尔本的实际公交网络进行验证;周和平等[17]等采用区间不确定性的路网阻抗值,并利用鲁棒优化模型、情景分析,构建了区间不确定性阻抗下的鲁棒最短路确定方法。在公交客流分配方面,ZHAO 等[18]分析了地铁与地铁,地铁与公交这2种出行换乘方式下的公交客流出行路径推导方法,POON 等[19]构建了一种新的基于时间的交通网络平衡分配问题的模型,并设计了算法,SHEFFI 等[20]提出了基于枚举OD 对的一种改进的概率客流分配模型,曾鹦等[21]针对公交网络换乘特性,建立了一种非平衡公交客流分配模型,设计了该模型的求解方法;基于随机用户均衡理论,狄迪等[22]在考虑多个变量的情况下,构建了的城市公交走廊动态客流分配模型。TOQUE等[23]利用长−短期记忆(LSTM)递归神经网络预测地铁网络动态OD 矩阵。LI 等[24]提出了一种基于聚类和非线性模拟的基于亲合传播的支持向量回归(AP-SVR)预测模型,利用支持向量回归(SVR)方法对每个聚类的客流进行预测,并利用粒子群优化(PSO)算法得到优化参数。总体来看,传统的公交客流分配模型向着随机、动态等方向发展,而以Probit模型和Log‐it模型为主的随机概率分配模型大多缺乏交通网络中不确定性因素的考虑,本文考虑公交阻抗不确性对乘客路径选择的影响。近年来对交通网络中配流中不确定因素的度量基本上是基于概率论的统计分析方法和区间数法[25],本文在历史研究基础上,采用区间数的不确定性度量,利用交通大数据推导公交阻抗并对Logit模型进行改进,建立区间阻抗不确定的公交客流分配模型,以期为获得更实际的公交网络提供一种思路,并为改善现有的公交网络打下基础。

1 城市公交区间阻抗

1.1 城市公交阻抗的界定

公交阻抗,即乘客在选择公交线路时,需要考虑的各种不同路径下的因素。这些因素包括行程时间、价格、换乘的方便性以及舒适性等综合指标。对于多数乘客而言,他们会倾向于选择行程时间最短的公交线路。因此,可以用行程时间来表示公交的路段阻抗。公交运行时间是组成公交阻抗的关键部分之一,受交通拥堵、其他车辆的干扰、交叉口信号控制的影响或者其他突发事件的影响,造成车辆的运行时间随时空波动。这导致同一公交线路上运行的不同公交车辆,以及同一公交车辆在不同时间的公交车辆运行时间都是变化的,这导致公交阻抗的许多参数是随机的、自适应的、时变的。

乘客在某一次的出行总时间,可由几个方面的时间构成,包括公交车辆在途行驶时间、乘客在公交站点候车时间、乘客换乘的惩罚时间。

运用有向图G(V,L)来表示公交网络,其中V={vi|1,2,…,n}为G的节点集,V中的元素vi(i=1,2,…,n)是有向图的节点,即公交网络中的公交站点;L={lij|i,j= 1,2,…,n,i≠j}为路段的集合,lij表示从站点i到站点j的一个路段。

1) 公交车辆运行时间

公交车辆运行时间,是乘客在车时间,为公交车在公交网络上的运行时间(行驶时间)以及车辆在公交站点的停靠时间之和,用式(1)表示:

式中:为公交车辆从站点r到站点s的运行时间;trun,ij为公交车辆东站点i行驶至站点j的行驶时间;tstop,i为公交车辆在站点i的停靠时间。

2) 站点候车时间

候车时间,是指乘客从达到公交站点到登上目的公交车辆中间等待的时间。有研究表明,公交乘客在站点的候车时间,服从均匀分布[26],乘客整体的平均候车时间可以取值为公交车发车间隔的1/2,即:

式中:为乘客在公交站点的等候时间;d为公交车辆的发车间隔时间;Nrs为乘客从站点到站点的出行链中的总的换乘次数。

3) 换乘惩罚时间

乘客选择公交线路时倾向于直达线路,对于需要换乘的线路会降低乘客乘车体验,故选择该路径的概率会降低,因此通过增加换乘惩罚时间来描述乘客这一心理行为。

式中:α和β为换乘惩罚参数。

则乘客从站点r到站点s的公交路段阻抗为:

1.2 区间不确定阻抗

公交阻抗受交通流量、天气情况、或其他不确定因素的影响,即公交阻抗也具有不确定性,在客流分配时忽略公交阻抗的不确定性可能使分配结果与实际结果有较大差异。为减少公交阻抗不确定性的影响,定量准确的表述行程时间的不确定性的方法是关键,现有的描述方法较多,如情景分析法、统计分析法、区间数法等。

1) 情景分析法

情景分析法认为未来充满不确定性,并可以将这种不确定性描述成几种可能的未来情形,然后由此制定出相应的决策方法,情景分析法着重于描述事物发展的某种规律,分析其发展的变化特性,考虑其全面性与系统性,但是容易出现过高或过低的估计未来的变化及其影响。

2) 统计分析法

统计分析法是建立在概率论或随机过程基础上的一种方法,常用的方法为蒙特卡洛法。该方法通过建立一个随机过程模型,或概率模型,并通过对模型的抽样观察,计算所求参数的统计特征,最后得到所求解的估计值。该方法通常需要较多的计算步数,计算较为繁琐。

3) 区间数法

区间数法,即利用区间变量而不是一个确定的点变量进行分析的数学方法,利用区间描述数值的实际波动范围,不需要额外信息,不需要额外获得假设,是对多组数据进行数值分析的有效方法。本文使用区间数法描述公交阻抗不确定性,使模型更真实更符合实际。

对 任 意 的a-,a+∈R,a-≤a+, 则[]=[a-,a+],a-为标准的区间数,其中,a+即为区间数的上限值;a-为区间数的下限值。

2 大数据下的城市公交区间阻抗获取方法

2.1 公交车辆GPS数据与站点GIS静态数据

公交大数据主要是指通过公交数据大平台获取的公交乘客与车辆相关海量信息,主要包括公交智能卡刷卡数据、公交车辆行驶的定位数据以及公交站点的静态定位数据等。

获取公交阻抗其关键是计算公交车在2个站点之间的行驶时间,即确定公交车在站点的启动时刻以及达到下一站点的时刻,对公交车GPS 数据及站点GIS数据进行处理可获取公交车到站及离站的时刻信息。

2.2 大数据下的公交区间阻抗获取

2.2.1 数据预处理

公交车辆GPS 在接受信号的时可能会受到干扰,导致获取的速度与位置数据不稳定,从而与真实数据产生偏差,为减少GPS 数据偏差产生的影响,可将公交车辆运行的GPS 数据中车辆行驶过程中拍卡数据(经纬度)与公交站点的所在位置的经纬度进行配对,从而获取公交车辆到达各个站点的时间等信息,其具体步骤如下。

Step 1:确定需匹配的路段,标记经纬度范围。使用路段的4 个顶点(认为直线路段为矩形)的经纬度值即可确定路段范围;若路段弯曲,则需将其近似分解为多个小矩形标记多个点的经纬度值以此确定路段范围。

Step 2:对车辆GPS 数据检索,若经纬度坐标Ai(Xi,Yi)满足

则初步认定该数据属于所选路段。

Step 3:公交车辆运行方向的判定。按照时间顺序,对GPS 数据进行排序,根据经纬度标定的位置,形成车辆运行轨迹,并可判定车辆运行方向。

Step 4:在step 2 初步选定的数据中,依次匹配GPS数据:

式中:为GIS 中该路段的经度坐标集合;为该路段的纬度坐标集合;Δ为进行匹配后的匹配度。

若GPS 数据满足该匹配公式,则认为匹配成功;否则,认为匹配失败,摒弃该数据。

2.2.2 获取公交区间阻抗

公交车站点之间的行驶时间可表述如式(7):

式中;tAj是车辆抵达下一个站点j的时刻,tBi是车辆离开上一个站点i的时刻。

公交车GPS数据匹配到GIS数据之后,通过锁定固定的公交车编号,对公交车行驶路径进行推测,对比分析公交车瞬时速度为0的GPS数据和公交站点GIS信息,可获得公交车到达站点和离开站点的时刻,流程图如图。

获得公交车站点间行驶时间后,可进一步得出站点r至站点s的公交阻抗,使用区间不确定理论来度量公交阻抗不确定性,用四分位数区间表示公交阻抗,其具体步骤如下。

Step 1:对于从站点r到站点s的公交阻抗集合Trs={t1,t2,…,tn},将其按照从小到大重新排序,得到T′rs={t′1,t′2,…t′n}。

Step 2:四 分 位 数Qi的 位 置 为i(n+ 1)/4,i= 1,2,3,n为集合中数据个数。

Step 3:将数据排序获取该数据的四分位数据(包括上四分位和下四分位)。若(n+ 1)/4 非整数,可采用位置最靠近四分位数的数并取整。

Step 4:得到公交阻抗的四分位数区间[Q1,Q3]。

3 区间阻抗下的公交出行多路径概率分配方法

3.1 鲁棒成本定义

鲁棒优化是为了使得到的最优解在任何可能会发生的情形下,均可符合各约束条件,同时需要保证在最不利的情形下该解仍然是最优的。鲁棒优化的关键是在于通过近似转化的方法,将原问题经过一系列的转化,使之成为计算多项式复杂度的凸优化问题。其核心在于构建与之对应的鲁棒对等模型,依据优化基本理论将原问题转化为鲁棒对等问题并进行求解,通过计算得到鲁棒最优解。鲁棒成本的概念是学者在研究区间阻抗下的网络优化问题提出的[27]。

图1 GPS数据及GIS数据处理流程图Fig.1 GPS data and GIS data processing flow chart

鲁棒成本即最大后悔值,即在最不利情形下的后悔成本。考虑在某种情形下,所选择的路段阻抗取最大值,即区间上界值,而未选择的路段阻抗取最小值,即区间下界值,在最不利的情形下存在最优路径未被选择,此时得到最大后悔值。

以简单小型网络说明鲁棒成本的定义,该网络有6 个节点,7 条路段组成,各路段阻抗的上界值与下界值均已给出。从节点1 至节点6 共有3 条路径,各路径的鲁棒成本如表1所示。

表1 节点1至节点6鲁棒成本Table 1 Robust cost of node 1 to node 6

图2 小型网络示意图Fig.2 A small network diagram

3.2 区间阻抗下鲁棒性有效路径

传统的出行路径确定方法,是基于最短路的原理。在区间不确定性阻抗下,考虑到最短路的不可加性以及其区间阻抗的有效性的比较判定缺少可靠依据,因此本文采用路径的鲁棒成本代替区间阻抗下的有效路径[27−29]。

阻抗为区间值时,当所有的路段阻抗取下界值时所得的最短路称为下界最短路,所有的路段阻抗取上界值时所得的最短路称为上界最短路。已知路段(i,j)的区间不确定性阻抗从站点r到站点s共有n条出行路径,Krs表示r−s间所有路径的集合,其中k∈Krs,第k条出行路径的各路段区间阻抗的上界值为,得从r到s的下界最短路,则路径k的鲁本成本为:

从站点r至站点s经过站点m,当路段r m满足以下3 个条件时,路段r m为区间阻抗下的有效路径:

式中:Lrm和Lms分别为路段rm和ms的阻抗下界值;Mrm,Mms和Mrs分别为路段rm,ms和rs的阻抗上界值;Rrm为路段rm的鲁棒成本。

式中:为r s的最短路的鲁棒成本下界值,为rs的最短路的鲁棒成本上界值,α为系数,取值为α∈[0,1]。

3.3 区间阻抗下交通分配模型

模型假设:

1)研究区域内公交站点间的OD矩阵已获得。

2) 公交乘客可通过多次的公交换乘,最终抵达目的地。

3) 忽略节假日、重大事件的干扰,行车间隔大于发车间隔。

4)公交OD 已经获取且OD 值为确定值(OD 不考虑为区间值的情况)。

多路径Logit 模型假定乘客在选择各条选择的时候是彼此独立的,即路径选择是不相互影响的;此外,其各个路径选择的概率,采用各个路径之间的效用来表述。而Logit 认为路径的选择概率只由路径之间的阻抗绝对差来决定,获取的是不合理的交通网络客流的分配结果[23]。

本文在此基础上,对多路径Logit 模型进行修改,改进后的Logit 模型的各个路径选择概率采用路段阻抗的相对值来描述。

假设乘客从起点r到终点s共有n条路径可以选择,rs间交通需求为qrs,rs间路径k的交通流量为,则这n条路径的区间阻抗鲁棒成本分别为:则乘客选择第k条路径的概率可表述为:

式中:θ为参数。

且满足:

3.4 误差分析

为验证所构建的改进Logit 模型分配结果的有效性,可分别计算各线路分配误差ω,整体平均分配误差及最大误差ωmax,通过分析比较验证模型的优劣。

式中:q(lc)为公交线路lc模型分配客流量;Q(lc)为公交线路lc历史平均分配客流量。

4 算例

以深圳市石岩街道区域做模型应用区域进行实例验算,选取该区域9条公交线路为客流分配对象,通过对2019 年7 月11 日~27 日的公交车辆GPS 数据(某线路车辆的部分GPS 数据见表2)、站点GIS 数据(某线路部分站点的GIS 数据见表3)的相匹配,可获得每条线路上每个站点间的区间不确定阻抗值。

表2 332路车辆部分GPS数据Table 2 Part set of GPS data of 332 bus vehicles

表3 332线路站点部分GIS数据Table 3 Part set of GIS data of 332 line stops

选取分配时段是无特殊情形平峰时段中的3个小时,采用2个不同的多路径改进Logit模型对这9条公交线路进行客流分配,其中模型A 为将区间阻抗视为确定值的分配模型,即不考虑公交阻抗的不确定性;模型B 考虑了公交阻抗的不确定性,使用四分位数区间表示各站点阻抗的区间值,采取平均公交阻抗进行计算。

取公交车发车间隔d=10 min,每个站点平均停车时间tstop=1 min,换乘惩罚参数α=2,β=2,Logit 模型中参数θ=3.3,将2 个模型的客流分配结果与同月份开展的实地调查所得平均分配客流量进行误差对比,结果如图3所示。

图3 各线路分配误差对比Fig.3 Comparison of the errors in the distribution of each line

并 计 算 整 体 平 均 误 差ωˉA,ωˉB和 最 大 误 差ωmax,A,ωmax,B,结果如表4所示。

通过图3 和表4 的误差分析结果可发现,公交客流分配不考虑公交阻抗与实际结果差异较大,该模型主要忽略了实际交通和路网环境下公交阻抗普遍是不确定和变化的,同时公交乘客实际选择行为也会随着公交阻抗变化而发生改变,导致了客流也存在不确定性,在一天中存在上下区间浮动的情况。

表4 各线路整体平均误差与最大误差对比Table 4 Comparison of overall average error and maximum error of each line

而考虑了公交阻抗不确定性的客流分配结果误差表现较好,较之前有较大改善,9 条线路的平均分配误差由17.7%降低至6.9%。9 条线路的平均最大误差也从24.3%降至9.0%,说明本文模型对客流分配结果基于公交阻抗不确定进行了调整,一定程度上克服了传统客流分配模型未表述阻抗为不确定区间值的问题,故所建模型更加符合实际,且实用性更强。

5 结论

1) 使用行程时间代表公交阻抗,并将乘客公交行程时间分为公交车辆运行时间、站点候车时间和换乘惩罚时间,结合区间不确定理论,使用四分位数区间表示阻抗的不确定性。

2) 对公交车辆运行GPS 数据,站点GIS 数据处理后得到公交行程时间,进而导出了公交在站点间的阻抗值。

3)建立阻抗不确定下的客流分配Logit 模型并求解,将其与阻抗确定下客流分配结果和实际调查的分配结果进行对比,结果表明考虑阻抗不确定下的客流分配误差,更符合实际。故实际路网区间阻抗不确定性显著影响公交客流分配结果而应在模型中充分考虑。

4) 本文简化了交通需求的不确定性经过区间运算而直接得到区间阻抗值,在该过程的处理上有待完善,下一步重点工作要将本文所建模型结合交通需求不确定情形下乘客的实际选择行为,亦可和交通信息诱导下出行路径选择对比,提高客流分配精度和准确性。

猜你喜欢
客流路段公交
客流增多
一元公交开进太行深处
城市轨道交通节假日期间大客流行车组织思考与实践
基于系统动力学的城市轨道交通车站客流控制仿真与优化
常虎高速公路路段拥堵治理对策探析
基于XGBOOST算法的拥堵路段短时交通流量预测
高速公路重要路段事件检测技术探讨
等公交
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真