张力楠, 马成元, 杨晓光
(同济大学交通运输工程学院, 上海 201804)
随着出行需求的增长,公共交通成为解决交通运力不足问题的良方. 据悉,中国每天约4.6亿人次的出行中约2亿人次选择公共交通,而供需的不匹配使得传统公交系统在高峰时期面临巨大的服务压力. 随着互联网技术的发展与普及,其高整合度的平台、大量的用户规模、海量的大数据分析及高效的线上线下转化率,使得交通规划管理者得以获取详细准确的出行者需求,从而有针对性地提出解决交通问题的方法. 目前在“互联网+交通”的多种移动出行新模式蓬勃发展的背景下,“互联网巴士”应运而生. 2014年以来,小猪巴士、嗒嗒巴士、嘟嘟巴士等企业相继进入市场,在广东、上海、北京、南京等多座国内城市提供以互联网作为信息平台的需求响应型公交服务,多家公司获得千万级的融资用于扩大服务、占领市场. 互联网巴士通过大件网络平台获取出行者的出行需求,根据汇总的乘客出行需求来定制运行线路及方案,以实现“按需规划”,与传统公交相比提高了服务水平.
“互联网+巴士”模式下,合理地定制公交运行方案是公交运力资源均衡配置的关键,也是其核心竞争力所在. 就此问题,国内外都进行了广泛而深入的研究. 如Patanik等[1]提出用遗传算法确定路径结构和相关发车频率 M Nikolic和D Teodorovic[2]以乘客满意度最大、换乘次数和旅程时间最小为目标,利用蜂群算法设计公交线网;Rhaul Nair和Elise Miller-Hooks[3]构建平衡网络模型来决定定制公交系统最优配置;程立勤[4]建立了基于节点重要度的节点甄选模型和线路综合费用最小的线路优化模型,提出了基于点线面相结合的定制公交线网布局方法;张敏捷等[5]提出了以线网覆盖率最大、上座率最高、运营投入最少为目标的定制公交线路规划模型;张强[9]在定制公交路径优化算法中提出基于交通网络分时段速度模型ISM求解时间最短路径.
定制公交运行方案的制定与常规公交一样需要考虑乘客、运营方的利益,需要协调站点布设、发车频率、运行时刻等,是一个多层次的复杂问题,而已有研究多是基于单一目标函数进行线路规划,难以全面反映公交实际运行情况. 针对此问题,有学者尝试设立多层次目标函数进行线网优化:如任华玲等[7]提出了上层为标准网络设计模型、下层为动态用户最优配流模型的双层次模型来解决公交网络设计问题;邸振等[8]利用上层为以公交企业利润最优、下层以公交客流换乘次数最低为目标的双层规划模型来描述车辆配置与客流间的相互作用,从而优化公交线网的运力配置等.
互联网需求响应型公交在线路设计中的关键问题在于如何在收集准确OD数据的基础上,根据现有的路网、节点及公交站等基础设施,设计合理的线路,使得对乘客提供的服务和企业的利润达到最优. OD数据包括乘客出行起讫点的经纬度,出行时间等信息;基础设施情况包括道路拓扑、现有的公交站位置、现有公交线等信息,可以通过电子地图工具获得.
需求响应型公交的服务体系中,出行者的效益主要体现在服务率、出行时间、步行时间、准点率等.
服务率指满足乘客需求的比例,定义如下:
K=QS/Q总
式中,K为需求响应型公交服务率;QS为成功乘坐需求响应型公交出行的乘客数量;Q总为提出出行需求的出行者总数;对于需求响应型公交企业,服务率是提高服务质量的重要指标. 而设计线路的服务率与其沿线的OD分布,其运行时刻表是否与出行者的出行时间吻合,其停靠站点与出行者起讫点间距离等有关.
出行时间指出行者在乘坐需求响应型公交过程中的行程时间T总,该指标决定了出行者是否选择需求响应型公交而非其他竞争交通方式. 步行时间T步指出行者从起点到上车站点以及从下车站点走到终点的时间和,也是需求响应型公交服务水平的重要指标.
准点率一方面指需求响应型公交运行过程中与其时刻表相符的程度,这与常规公交的准点率相同,在线路设计中可以通过规避拥堵路段来提高准点率. 另一方面需求响应型公交是根据出行者出行时间来确定其运行时刻表,所以其运行时刻与乘客目标出行时间相符的程度也是其服务水平的重要方面. 由于需求响应型公交一般只在高峰时间有少量几个班次,如果其到达某站A的时刻与站A中的乘客的出行时间相差较大,则乘客需要调整自己的行程安排,可能会导致客流的流失.
对于公交企业而言,其效益的提高需从降低成本和提高收入两方面进行. 降低成本在线路设计中体现在线路长度、停站数量、车辆班次等方面,提高收入则体现在优化服务质量、提高服务率,吸引更多乘客. 提高企业效益即以较少的资源投入服务更多的乘客.
故可将线路设计看作一个多目标的多层优化问题. 多层优化模型一般采用分层次的结构,在每层的决策中都有相对独立的优化条件,上层的决策结果往往决定了下层的决策空间,下层在优化过程中可能对上层决策有所反馈,如此循环以得到多方面效益平衡的决策结果.
在本问题中,线路设计包括了线路区位选择、途径站点选择、线路方案决策、运行方案设计多个层次. 在每个层次中都有不同的优化目标,所以使用多层优化模型,对需求OD数据进行时空聚类,分层次进行优化决策,最终设计出上客率最高、服务效益最优的线路方案和运行方案.
经过上文的分析,可将整体的线路方案设计分为3个层次:选择线路经过区域、停靠站点及线路设计、运行方案设计,每层的优化过程都依据上层的决策,同时也对上层决策有所反馈.
在第1层选择线路经过区域过程中需要对OD数据进行时空聚类,为了方便量化计算,可以引入“交通小区”的概念,每个小区的出行者统一进行“取舍”,为了提高企业效率,在起讫点分布较密集的小区在线路设计中优先选择经过,而出行者分布较稀少处可能会放弃载运这部分乘客.
在第2层站点线路设计中,由于需求响应型公交一般都利用常规公交的站点,所以可在第1层选择经过的小区内的公交站点集合中选择最优的站点,之后将选择的站点基于道路拓扑数据连接为线路方案.
第3层运行方案是根据线路方案得到站点间行程时间,进而选择合适的起始站发车时间,使得出行者的目标出行时间与车辆到达其对应站点的时间匹配最优,即乘客需要提前(滞后)前往站点乘车的时间成本最小. 如果指标达不到一定要求则需要返回上层重新设计.
总之,主要的技术路线可概括为:小区划分—选择经过小区—站点选择—线路规划—运行方案设计. 模型中需假设:不考虑其他交通方式竞争,OD数据准确稳定,定制公交公司的巴士数量足够,小区间的客流吸引可忽略.
技术路线图如图1所示.
图1 技术路线图
线路经过区域选择在本模型中包括2部分,小区的划分和选择.
根据模型的思路,划分后的每个小区之间互相独立,一个小区的出行需求统一进行“取舍”,所以小区的大小和范围需要充分考虑定制公交站点的辐射范围、出行OD点的分布情况以及出行者到达公交站点的情况等,同时类似交通规划中“交通小区”的概念,划分小区时需要考虑交通屏障等交通因素. 由于小区的划分对于之后的优化模型非常重要,可以先对OD数据的空间位置信息进行聚类分析,根据聚类结果进行小区的划分.
对于OD数据而言,一个重要的问题在于其在空间上的表现形式为两个点构成的点对,不能简单地聚类分析,而且该问题贯穿于多个层面. 对于此问题,采用将O、D综合分析的方式,首先将起终点统一视为一类数据点,然后进行聚类分析选择经过区域和站点方案;根据原OD数据绘制期望线得到主要的出行方向,规划线路,然后检验方案对出行OD对的适应性,即服务率K. 通过一定的反馈,最终获得满足OD需求的线路方案.
而对于临近小区之间的影响,即小区A的乘客可到小区B的站点乘车的情况,在模型中没有充分考虑,小区之间基本相互独立. 这就要根据初步聚类的结果合理地划分交通小区,使得这类影响最小.
对于小区的选择则可以简单的根据小区内的出行OD的密集程度ρ,选择小区取舍的阈值,保留出行者较多的小区列入集合Zc{z1,z2,…,zn}进行下一步的优化.
本层次继承上层的决策结果,在经过的小区zk(zk∈Zc)中,选择zk内最优的公交站点pi,使得出行者步行至站点pi(或从pi步行到达目的地)总距离Dk最小.
假设小区zk内的公交站点集合为Pk{p1,p2,…,pm},小区zk内的OD点位置集合为ODk{od1,od2,…odh},最优站点pi满足:
式中,dis(pi,odj)为站点pi与odj间步行距离;m可以通过电子地图工具获得.
每个Zc中的小区内都找寻到最优的站点p,最终得到选择的站点集合P{p1,p2,…pn}.
得到站点后需要将部分站点串联成线路,由于之前未考虑OD对的方向性,而需求响应型公交往往都是针对通勤出行,潮汐方向性很明显,所以在此需要根据OD数据先绘制出行期望线,据此得到设计线路li的大致运行方向和包含的站点集合Pli{p1,p2,…ps}.
在线路li的站点集合Pli中,利用Floyd算法得到能串联Pli内全部站点的最短线路,Floyd算法是一种常用的最短路算法,其利用“势能”的概念通过遍历得到系统的最短路径,由于一条线路涉及的站点有限,所以这种算法满足实际应用的条件,其中两站点之间的路径及长度同样可以通过电子地图手段获得.
线路设计完成后需要进行站距、线路长度、线路路径的道路条件、服务率K等多方面的校验. 其中,需求响应型公交线路的几何线性指标要求并不严格,服务率的校验则是考察线路与OD对的匹配程度. 线路li经过的小区内的OD集合为ODli{od1,od2,…odh}(起点或终点在经过区域的都计入),共h人,ODli中O、D点在线路li中皆有对应站点且起点站点pO在终点站点pD之前的OD对有k组,则在此线路校核中的服务率K=k/h,服务率K越高代表在空间上线路与OD对匹配程度越高.
对于乘客而言,车辆到站的时间可能与其期望的出发时间有所差异,则可定义“提前(推迟)出行成本”C(Δt)为该值为提前(推迟)出行的时间Δt的函数,|Δt|越大,该成本越高,而且同样的Δt,推迟出行与提前出行的成本也有差异. 为了简化模型,只将该成本视为与|Δt|正相关,即:
C=σ|Δt|
故该层模型为单变量的优化问题,即线路最优的发车时间t0满足:
minC=∑σ|Δt| Δt=tOD+t步-tx
得到线路的发车时间后,再依据之前的站点间运行时距Tli,就可以得到需求响应型公交的运行时刻表. 最后考虑修保场位置、车辆调度站等因素作出一定调整.
根据小猪巴士互联网调查得到的众筹OD数据(5 375条)进行模型应用,OD数据包括出行起终点的经纬度、时间、人数. 数据的预处理包括:对数据进行清洗、对缺失值进行处理、对经纬度数据进行校正以及去除区域(深圳市)外的数据,最后有效数据5 036条. 简要分析数据的时空分布情况如图2所示.
图2 出行需求时间分布
可以明显看到,出行需求集中于早晚高峰,尤其在早高峰. 出行需求在时间上的集中性大大提高了需求响应型公交运行效率,对于早晚高峰可以采用不同的线路和运行方案,分析计算的思路完全一致,本章以早高峰时段(06:00—09:00)为例进行分析和模型应用.
图3 出行需求起讫点空间分布
可以看到,终点分布较起点更为集中. 另外收集公交车辆数据、通过百度地图API获取电子地图的相应数据,包括道路拓扑网络和步行拓扑网络等,利用GIS对数据进行分析整理.
首先对数据进行总体的空间聚类分析,通过Arcgis的核密度分析工具,可以直观地获得出行需求的空间集聚情况,并可作为划分小区的依据.
图4 出行需求空间分布热力图
根据聚类结果以及2.2中提到的相关因素划分小区,最后确定小区的大小平均为4~9 km2,实际中以交通规划中的小区划分为基础并根据数据情况进行调整,划分小区结果如图5.
将OD数据的空间分布以交通小区的形式表达,结果如图6、图7所示.
最终确定阈值2.8(人/km2),如图8中黑线所示,保留小区24个,乘客保留率33%. 可以看到大部分的乘客OD都在保留区域外,只根据数据分析的结果保留了效率最高的部分,对于密度较低的区域采取舍弃. 阈值的选取与互联网巴士企业的投入相关.
图5 交通小区划分情况
图6 早高峰起点分布
图7 早高峰终点分布
图8 小区需求阈值与保留率关系
首先通过百度地图API爬取深圳的公交站经纬度数据. 根据2.3的思路确定步行路径和最小的站点得到站点集合P{p1,p2,…,pn}. 线路设计之前需要绘制OD数据的期望线,由于交通小区过多,期望线难以辨别,可通过划分大区得到主要的出行方向. 通过最短路的计算得到线路,其中由于互联网巴士运行成本原因,尽量规避通过高速路,得到两条线路情况如图9所示.
图9 线路及站点示意图
对于选择站点的微观交通情况需要人工进行校核,不适宜进行停靠的公交站需要剔除重新选择站点.
根据2.4的思路,首先通过百度API获得站点间通行时间. 之后通过调整发车时间,得到提前(滞后)出行成本最小的方案. 由于是单变量的单目标的优化问题,可以将成本C在数值上直接取|Δt|,即系数σ取1. 最终得线路1的最优发车时间为06:47,取整06:50,线路2的最优发车时间为07:13,取整07:15.
最后得到早高峰线路的运行方案如表1.
表1 线路运行方案表
线路中到站时间是基于两站之间的行驶时间与停站时间计算的,由于没有乘客投币等,每个站点停站时间统一记1 min. 最终的线路方案仍放弃了很多的出行需求,但这没有考虑跨小区乘坐车辆,而且为了保证形势速度站距也较大,在有更多投入的情况下可以辐射更广区域,采用多条短线来满足更多的出行需求.
本文基于互联网需求响应型公交收集得到的OD数据以及道路等基础设施情况,通过多层优化模型,提出了完整的线路方案设计流程,以得到高效的线路方案,以有限的资源尽量多地载运出行乘客. 互联网巴士企业可根据变化的实时OD情况,快速生成公交运行方案,也可对已有的线路进行优化.
互联网以及通讯技术为交通的发展带来了更多的可能性,合理利用甚至会颠覆传统的交通模式. 对于互联网巴士的线路设计而言,目前的算法模型仍有很多不足之处,如未考虑其他交通方式的竞争和接驳、线路施行后对需求的反作用以及对于不同城市的适应性等都需要进一步的研究.