鲁鸣鸣,郑 林
中南大学 信息科学与工程学院,长沙 410083
随着城市交通系统的蓬勃发展和多样化升级,城市居民的日常出行越来越方便。与此同时,城市范围内的路径决策成为一个热门的研究问题。出租车和私家车是人们最为熟悉的交通设备,城市道路上的路径决策问题已经较为成熟,现有的地图服务都能够给出最快路径,最短距离路径甚至可以手动定义途经点等不同的路径决策方案。但是随着私家车的增多,道路的扩建跟不上车辆数的扩张,城市道路变得越来越拥挤,高峰期时段的拥堵越为明显,出租车的快捷性大打折扣。Wang等[1]利用乘客出行需求和城市道路网络信息分析了每条道路在不同时段的拥堵情况,并在理论上验证了在特定时间段对道路进行限速或增加道路容量能够有效降低道路拥堵情况,同时减少车辆行驶时间。另外,由于出租车的价格较高,乘客出于经济的考虑经常会放弃乘坐出租车出行。公交车是一种最为传统的交通工具,价格低廉,范围广阔使其成为人们常用的出行方式,但是同样受到道路拥堵的困扰。此外公交车的运行线路和站点固定,难以完全符合乘客的出行线路。同时其时刻表的实际运行情况往往波动较大,经常给乘客带来较长的等车或乘车时间,造成延误。
随着城市地铁的发展,越来越多的人选择地铁作为自己的主要出行方式。地铁方便迅速,运行时间也较为稳定,但是不能够覆盖城市范围内的各个角落,不适合在乘客起点或终点离车站较远时的情况下使用。以上海为例,在上海南部有超过1 500 km2范围没有覆盖地铁网络,这个区域占上海总面积的1/4左右。出租车能够覆盖广泛的城市范围,但是价格高,容易遇上拥堵,特别是在上下班高峰期时段。如果同时结合两者,不仅仅达到了广泛的覆盖范围,也能够减少用户的出行时间和出行费用。虽然现有的线路规划系统也提供地铁和公交车混合的路径决策服务,但是由于公交车线路的局限性导致乘客往往需要经过多次换乘或是步行一定的距离才能到达最终目的地。另外由于缺乏对数据的详细分析,现有的方案只是给出一个笼统的与计划出行时间无关的路径规划方案。实际上,公交车的到站时间难以预估,道路上的行驶时间也容易受到突发事件的影响,往往会与预计的时间有较大的偏差,造成乘客旅行的延误和较差的出行体验。
为此,本文提出了一个结合出租车和地铁的出行方案,旨在提供更加精确的线路查询服务,并根据出行时刻的不同提供差异化的服务。基于相对稳定的地铁列车调度方案和出租车的分布规律,地铁和出租车的混合方案能够为乘客提高更为快速、精准和经济的服务,在为乘客节省出行费用的同时降低城市总体交通资源的消耗。
在出租车的线路规划方面现有的工具往往只能够给出一个与计划出行时间无关的预计行驶时间或价格,而实际上由于城市居民的在一天不同时段有着不同活动规律,某些路段在高峰时段很容易拥堵,造成行驶时间的大幅度增长。Balan等[2]利用出租车历史数据给出了不同时刻下的出租车价格和时间的计算方法,并对该方法进行了优化,建立了一个能够在现实生活中使用的实时出租车服务系统。Wang等人[3]提出了一种在稀疏的车辆轨迹数据中提取不同道路在不同时间槽下所需的行驶时间的方法,能够较为准确和有效地预估乘客的出行时间。此外,文献[4-5]也提出了一种利用历史移动轨迹建立语法生成树的方式可以产生大量新的移动轨迹,增加数据集的密度。Thiagarajan[6]提出可以利用乘客手机估计实时的道路行驶时间。虽然出租车行驶时间能够较为准确地估计,但实际上乘客出行还应该包含一个等车时间,即乘客等待一辆可用出租车的时间,但是由于城市范围内出租车的分布不均匀,不同区域的出租车数量有较大的不平衡,导致冷门区域的乘客较长的等车时间[7]。现有的方法往往是从出租车司机的角度出发,帮助其快速地找到下一个乘客,或是单纯地指导乘客如何寻找出租车[8-9],并没有一种结合乘客等车阶段和出租车行车阶段的出行规划方案。
现有的城市范围内的线路规划服务往往是针对单一的交通工具,在多元交通工具的线路规划方面现有的线路查询服务往往只提供地铁和公交车混合的方式。公交车的负载情况和乘客的出行时间受到公交车线路和地铁线路的直接影响[10],一个设计优良的城市地铁系统和公交车系统不仅能够提高乘客的出行体验也能够提升社会经济效益。崔愿等[11]将乘客换乘距离和公交车排队时间作为优化因素建立了地铁和公交车接驳的线路优化模型,能够提高公共交通服务水平和车辆的运行效率。熊杰[12]以及季运文[13]则从公交车线路的规划方面优化乘客的出行时间。虽然地铁与公交车接驳的出行方式能够达到和地铁与出租车接驳的出行方式类似的特点,但是由于公交车线路的限制导致其灵活性较低,难以完全符合的出行线路,可能需要乘客经过较长的步行距离才能搭乘公交车或到达最终目的地,给乘客出行带来较大的不便。另外公交车的发车频率相对较低,到站时间难以估计导致乘客较长的等车时间或乘车时间,最终造成旅途的延误,不适用于时间要求较为严格的出行情况。虽然Zhou[14]提出利用城市居民的手机感知技术可以较为精准地预测公交车的等车时间,但是需要较大规模量的志愿者参与,目前难以在现实中运用。
本文使用的出租车数据是上海2015年4月的出租车GPS数据,每天有超过13 000辆出租车参与统计,产生的数据文件约为10 GB。每辆车每隔10 s产生一条数据,主要包括车牌号、GPS坐标、时间、是否载客、速度和方向等信息。其中,GPS按时间构成的序列数据构成了出租车的出行轨迹。
地铁数据集是上海居民2015年4月份的城市一卡通的所有刷卡数据和地铁站信息,乘客每次进站或出站均产生一条记录,每条记录包括卡ID,打卡时间,打卡地点等信息。上海地铁总共有289个车站,将每天同一张卡的刷卡记录按时间排序,并将前后两条刷卡记录合并得到一个出行OD,同时去除误差数据和异常数据(独立的单条记录和OD时间明显过长或过短的记录),最终得到每个工作日的地铁出行OD总数如图1所示。可以看出上海地铁网络在工作日中每天的人流量较为稳定,维持在450万左右,人流量在每周五有小幅度的增长。
图1 地铁OD量
3.2.1 出租车乘客上下车点分析
图2和图3分别描绘了出租车乘客上车点和下车点的分布,可以看到两者的分布非常相似,主要集中在城市中心区域,同时在城市外围区域也有广泛的分布。但是这些分布并不是随机的,而是与地铁车站的分布有着密切的关联。
图2 乘客上车点热力图
图3 乘客下车点热力图
图4 反映出出租车乘客的上车点或下车点随着最近地铁站的距离的累积分布概率,可以看到有接近1/3的乘客选择在地铁站附近500 m的范围内上车或下车,也就是说,许多乘客的上车点或下车点分布在地铁站附近,而几乎没有乘客同时在地铁站附近上车和下车。上述现象还说明了地铁站附近的可用车辆比较多,考虑到还有经过地铁站的车辆并没有被统计在其中,这表明乘客在地铁站附近搭乘上出租车的概率其实比较大,等车的时间也会比较短。
图4 乘客上下车点随最近地铁站距离变化的累积概率
3.2.2 出行时间可变性分析
(1)地铁出行时间
地铁出行时间主要由起始站点和目的站点的距离决定,但同时也受当前时刻的影响。图5和图6分别描绘了从莘庄到上海南站和从南浦大桥到人民广场的乘坐地铁所需出行时间在一天不同时间段的变化情况。由于高峰时段列车发车频率的增加造成两者的出行时间在高峰期都有所降低,但中午时段和高峰时段的出行时间差距均不到3 min。实际上,由于地铁列车的高发车频率和稳定的行驶时间,超过70%的站点之间的地铁平均出行时间波动在8 min以下。
图5 平均出行时间(莘庄-上海南站)
图6 平均出行时间(南浦大桥-人民广场)
(2)出租车行驶时间
图7描绘了一天中城市出租出轨迹的热力分布图,从图中可以看出上海的出租车分布成辐射状,城市中心区域车辆非常多,区域车流量随着离中心点的距离增大而减少,边缘区域的车辆相对较少,车流量主要分布在城市环线等主干道路。如果出租车的线路需要通过中心区域等人流量较大的道路,很容易造成堵车现象,特别是在上下班高峰期。而城市边缘区域的道路通畅,一般不会造成堵车现象。
图7 出租车分布热力图
图8 出租车行驶时间的变化
图9 行车线路图
图8 说明了宝山区山产路到普陀区中山北路闵行区建设村之间的出租车行驶时间在一天中不同时间段的变化曲线,图9是通过百度地图查询的推荐行车路线。从图中可以看出每个小时内的出租车平均旅途时间是随时间变化的。由于需要经过一段车流量较为密集的区域,这条行车路径在上下班高峰期时段很容易遇到堵车现象,造成行驶时间的上升,早上8点和下午5点分别对应早晚高峰的最高值,行驶时间超过了40 min;而在其他时间段道路较为通畅,行驶时间也较小,中午12点下降到全天的最低值,只有20 min。该行车路径甚至并未经过城市最中心的区域,行驶时间在高峰期的数值就达到了最低时间的2倍,可见出行时段对出租车行驶时间有重要的影响。
(3)出租车等车时间
等车时间是指乘客在某个区域等待可用出租车所需的时间,可以通过单位时间内可用出租车数量的倒数来表示。从图7可以看出,城市不同区域的出租车密度不一样,乘客的当前位置决定了其等车时间。将地图分成大小相同的区域,并统计了每个区域内部每小时的可用出租车的数量,发现绝大多数区域的出租车数量也有随时间变化的性质。图10和图11分别是城市中心区域的人民广场地铁站和城市边缘区域的凌空路地铁站附近的出租车数量随时间变化的曲线图,人民广场地铁站位于车流量最为密集的区域,在高峰时段容易造成严重的拥堵,一些出租车在这些时段不愿前往该区域附近,造成高峰时期的出租车数量有一定的降低。而凌空路地铁站附近较为通畅,高峰期的车流量相对较高,中午时刻和晚高峰过后车流量较低。在数值上,人民广场的车流量明显要高于凌空路。总体来说,区域内部的车流量不仅受到区域地理位置的影响,还和出行时段有着紧密的联系。
图10 人民广场车流量变化
图11 凌空路车流量变化
地铁出行时间,出租车行驶时间和出租车等车时间随时间变化的特点意味着针对乘客相同的请求,系统在不同时段给出的出行方案应该有所区别。
乘客出行的主要衡量指标是出行价格和出行时间。地铁和出租车接驳的出行方案本身就是分段式的,其出行价格包括出租车价格和地铁价格。出租车价格主要由行驶距离和低速等候时间决定,例如,上海出租车白天的价格P随行驶距离x和低速等候时间t的计算方式如下所示:
上海出租车在白天的起步价为14元,起步里程为3 km,超过3 km但小于15 km的价格为2.5元/km,15 km以上3.8元/km,同时根据低速等候时间折算成对应的里程数。地铁价格由起始站点和终点站点的距离决定,分为2~9元的不同等级。从出租车和地铁的价格计算方式可以看出前者的出行价格远高于后者,而出租车价格又主要由出租车行驶距离决定,为了简化问题,本文将出租车的行驶距离作为衡量线路价格的主要指标。
乘客出行时间主要包括以下3个方面的时间消耗:(1)出租车线路时间;(2)地铁线路时间;(3)步行时间。出租车线路时间又可以分为等车时间和行驶时间,前者表示乘客等待出租车到来所需的时间,后者表示从乘客搭乘上出租车到乘客到达目的地所需的时间。地铁线路时间是乘客利用地铁列车出行所需的时间。由于难以从地铁数据中分离出和出租车类似的等车时间和列车行驶时间,另外由于地铁列车的发车频率较高导致地铁出行时间相对较为稳定,用乘客进站刷卡到乘客出站刷卡所需的时间表示地铁线路时间。步行时间是指由于地理位置的限制乘客换乘交通工具所需的时间,本文假设正比于距离。将在4.4节给出出行时间和出租车行驶距离详细的计算方法。
本文设计的出行线路规划系统如图12所示,主要包括三个组成部分,分别为乘客、云服务器和出租车。乘客是请求的发起者,通过选定起点和目的地作为一条线路规划请求发往服务器端,服务器端对请求进行对应的线路计算并将结果返回。如果线路涉及到搭乘出租车,乘客可事先或到达相应的区域后发起打车请求,服务器端给该区域附近的出租车发送订单,并指派一位合适的出租车前去接送乘客,之后乘客和对应的司机可以直接联系无需通过服务器干预。该系统既能够给乘客的出行方式和出行线路进行指导,也能够帮助出租车司机寻找合适的乘客。相对于乘客单独打车,通过服务器转达的方式不仅给了乘客相对稳定和可靠的等车时间,同时也增加了出租车司机的收益。
图12 系统设计
考虑到换乘带来的不便性,本文对换乘次数做出限制。对于一个查询请求,地铁和出租车的混合出行方案只可能产生以下4种结果:
(1)只搭乘出租车的方案。
(2)只搭乘地铁的方案。
(3)乘客先搭乘地铁到达某个地铁站,再换乘出租车到达目的地。
(4)乘客先搭乘出租车到达某个地铁站,再换乘地铁达到目的地。
各个方案的示意图如图13所示。用户每提交一个查询请求,包括起始时间、起始地点、目的地点,系统同时为用户产生上述4种方案的结果集合,每个结果包括预计出行时间,预计出租车行驶距离(对应价格)和出行线路等属性,并由乘客选择最佳的出行方案,上述请求方式保证了系统最终给出的出行线路最多只需换乘1次。由于出行线路结果包含出行时间和出租车行驶距离两个评价指标,乘客既可以选择最小化出行时间也可以选择最小化出行行驶距离作为查询条件。
图13 线路方案示意图
4.4.1 提取道路行驶时间
城市道路网络构成了一个有向图,图中的节点是各个道路交叉口,图中的边是每一段道路,道路的权重可以是该条道路的长度或是行驶时间。出租车的出行通常会经过不同的道路,即一次出行由一组道路序列构成,出租车行驶时间是通过各条道路的时间之和,出租车行驶距离时通过各条道路的距离之和。由于道路网络节点个数较多,不是任意的两个节点之间都能从出租车行车轨迹中直接提取行驶时间和行驶距离,但是有超过80%的相邻节点对之间都有出租车历史通行数据。如果能够获取各条道路的行驶时间和行驶距离,对于一些历史数据中不能直接提取行驶时间的节点对,利用Dijkstra最短路径方法可以得到该节点对之间的最短路径,同时利用其最短路径包含的各条子道路的行驶时间进行累加可以得到该路径最终的行驶时间,各条子道路长度之和为该路径最终的行驶距离。所以,首先需要提取出租车在不同道路的行驶时间。
出租车的旅程分为载有乘客和未载有乘客两种情况,如果是前者,出租车司机一般都会选择最优路径;如果是后者,大部分出租车也是带有一定的目的性去往某地而不刻意绕路。为了获取足够多的行驶时间信息,对两种路径都做提取工作。
Shapefile文件是描述空间数据的几何和属性特征的非拓扑实体矢量数据结构的一种格式,经常在地理信息系统中被用于描述地图道路信息,获取了上海的Shape地图文件,并利用一种快速地图匹配算法[15]将每个出租车的GPS位置点匹配到城市道路中。对于一段旅程,只对其中起点和终点都是道路交叉口的子道路提取行驶时间,如图14所示,由于起点A和终点E不是道路交叉口,旅程AE可以提取的子道路只有BC、CD。
图14 道路行驶时间提取
通过上述方式,能够从出租车GPS数据中提取大量的道路行驶时间信息,每条信息包括起点、终点、开始时刻、结束时刻。这些信息将用于生成城市任意两点间的出租车行驶时间。
4.4.2 时间分区
如3.2.2小节所述,出租车行驶时间,等车时间以及地铁出行时间都有着随时间变化的特性,需要将一天划分成不同的时间区间并分别计算路径。一个越小的时间区间越能够反映当前时段的信息,但是由于需要一定的历史数据支撑,每个区间又不能够过小,否则无法反映统计规律。将一天按每个小时划分出多个时间区间,并根据上一节所述从历史数据中提取不同道路在不同时间区间下的平均行驶时间,同时统计不同地铁站对在不同时间区间下的平均出行时间。
4.4.3 空间分区
地铁出行时间和出租车出行时间主要受乘客的起点和终点决定,并且不同时间或不同地点的出租车等待时间有所差别。乘客在某个区域的等车时间可以直接利用该区域可用出租车的到达速率进行估计。通常来说,出租车行驶是相互独立的事件,某个区域在一定时间内的车辆数服从泊松分布,而等待下一辆车的时间服从指数分布。而泊松分布用于描述单位时间内随机事件发生的次数,例如,如果某个区域1 h内有10辆不同的可用出租车,则平均等车时间为6 min。首先将上海地区按照1 000 m×1 000 m的大小划分出不同的区域,计算各个区域在不同时间区间下的等车时间,如图15所示。由于区域的面积较小,假设出租车在区域内部行驶至乘客位置所需的时间为固定值2 min,并统计区域内部不同时间区间下的历史平均车辆数。实际上,一个区域周围的车辆也可以通过一定的行驶距离到达该区域,以每个区域最靠近中心点的道路交叉口位置作为区域的起点或终点,计算每个邻近区域之间的行驶时间并假设该时间固定不变。对每个区域而言,统计以其为中心加上周围8个区域的单位时间内的不同车辆数的倒数作为该区域最终的平均等车时间。例如,如图15所示,假设区域A和区域B在1 h内经过的出租车分别有6辆和10辆,16辆车互不相同,区域B行驶至区域A的时间为5 min,则在区域A中等待一辆来自A区域出租车并行驶至乘客位置所需的平均时间为(60/6+2),为12 min,在区域A中等待一辆来自B区域出租车并行驶至乘客位置所需的平均时间为(60/10+5),为11 min,那么在区域A中等待一辆来自A区域或B区域出租车的平均时间为60/(60/12+60/11),约为6 min。类似的,通过附加周围8个区域的车辆数,能够获得每个区域最终的平均等车时间。
图15 地图分区示意图
4.4.4 各方案下线路计算方法
有了上述不同区域在不同时间区间下的平均等车时间,地铁车站对在不同时间区间下的出行时间,以及各条子道路在不同时间区间下的行驶时间,可以给出各方案下乘客出行线路的计算方法。
方案1如图13所示,方案1的路径规划不包含地铁,可直接将乘客的起点和终点分别匹配到最近的道路交叉口,用作出租车路径规划的起点和终点。如果线路计算的原则是最小化出行时间,道路节点之间的权重即道路网络图中边的权重被设定为各条道路的行驶时间;如果线路计算的原则是最小化出租车行驶距离,则道路网络图中边的权重被设定为各条道路的长度。通过最短路径搜索算法可以得到最优的出行线路,并将最优出行路径所途径的各条子道路的行驶距离进行累积可以得到其总的出租车预计行驶距离;将各条子道路的行驶时间进行累加并加上在起始区域的等车时间可以得到其总的预计出行时间。注意到由于出租车行驶时间存在随时间变化的特性,子道路的行驶时间必须在搜索和叠加的过程中根据到达该道路的时间区间进行相应的更新。
方案2如图13所示,方案2的路径规划不包含出租车,所以可直接将乘客的起点和终点分别匹配到最近的地铁站,用作起点和终点并计算两段路程的步行时间,同时加上历史数据中当前时间区间的地铁平均出行时间作为最终的预计出行时间。由于此方案并不涉及搭乘出租车,此时的出租车预计行驶距离为0。
方案3如图13所示,该方案实际上是方案1和方案2的组合,主要问题在于如何选择一个地铁目的车站使得出行时间最小。首先将乘客起点匹配到最近的地铁车站,作为起点,乘客终点匹配到最近的道路交叉口,作为目的地。对于一个地铁目的车站,可以根据方案1和方案2的计算方式分别计算前后两段线路的出行时间和行驶距离之和作为总的出行时间和出行行驶距离,通过遍历地铁站点集合作为目的车站并依次比较可以得到最优的换乘线路。由于时间的可变性,如果乘客到达地铁目的车站的旅途中跨过了一个时间区间,对应下一段出租车线路的等车时间,出租车行驶时间都必须更新为新区间的值。上海地铁的车站数量较少,截止到2015年4月份的数据总共有289个车站,此方案下的遍历复杂度不会较高,能够运用在实时系统中。
方案4如图13所示,该方案主要问题在于如何选择一个地铁起始车站使得出行时间最小。该方案的线路计算方式和方案3类似,遍历整个车站集合即可得到最优解。在线路计算的同时也要考虑时间的可变性。
地铁的运行时间较为稳定,价格低廉,但是其行驶线路固定,常常导致较长的出行时间,同时也不能够覆盖广阔的区域;出租车的可达区域非常广泛,方便快捷,但是其价格较高,在高峰时段容易遇上堵车造成行车时间的上升。地铁和出租车的接驳的出行方式实际上是单独乘坐地铁或出租车的折中方案,兼顾两者的部分优点。相对于只选择出租车出行的方式,通过接驳地铁和出租车的出行方式能够减少乘客的出租车行驶距离,这不仅仅帮乘客减少了一定的出行价格,在节省社会资源上也有很大的帮助。同时对于某些拥堵路段,接驳地铁和出租车的出行方式能够在减少乘客的出行价格的同时降低乘客的出行时间。另一方面相对于只选择地铁出行的方式,也使得某些地铁线路不可达的地铁出行方案变为可能。本文将从现有工具的分析对比,减少的出行时间以及减少出租车行驶距离等方面分析地铁和出租车混合的出行方案带来的效益。
为了说明地铁和出租车混合出行方案的优势,首先和国内使用较为广泛的地图导航软件“百度地图”和“高德地图”进行了对比。在多元交通工具的线路规划方面两者目前只提供地铁和公交车混合的方式,同时暂未看到其他地图导航软件有地铁和出租车混合线路的查询功能。实际上公交车的灵活性相对出租车较低,难以覆盖较为广阔的区域,同时其等车时间经常无法估计,给乘客出行带来延误。而提出的基于大规模交通数据出行线路规划能够给出一个较为准确的等车时间和预计出行时间,同时覆盖较大的出行范围,为乘客出行带更多的选择。
另外在时间可变性方面,百度地图和高德地图目前在机动车的预计行驶时间上是通过采集当前路况信息计算并给出一个预计值,虽然此方法下能够准确地预估当前的行驶时间,但其对采集的路况信息的精确度要求较高,同时用户不能够事先查询将来某个时刻下的预计出行时间。虽然在公交线路的查询上能够让乘客选定不同的出发时间,但其主要功能在于判断公交线路是否超出其运营时间,在预计出行时间上并没有根据不同时段有所区分。实际上根据3.2.2小节所述,当前时段对出行时间的影响是比较大的,特别在当线路经过拥堵路段的时候。选取了如图9所示的旅程作为说明,通过百度地图查询该旅程线路在通畅的路况条件下所需的时间约为38 min,同时在不同时段下通过本文采用的每条道路在不同时间区间下的行驶时间进行拼接得到的总行驶时间和总的标准差,最后和历史记录中直接提取的该旅程线路在不同时段下的平均行驶时间和标准差进行对比,最终的行驶时间和标准差如图16,图17所示。为了作图方便,图中的标准差线被设置为原始长度的0.2倍。从图中可以看到虽然在此条线路上百度地图提供的查询服务能够给出一个较为保障的行驶时间,但是在非高峰时段即道路通畅情况下该值和实际的行驶时间的差异比较明显,给乘客出行造成了一定的误导;基于大规模历史数据中提取出的每条道路在不同时间段的行驶时间,拼接出总的差异化行驶时间能够较为准确地符合实际行驶时间的变化规律。相对于简单的历史平均时间,根据道路进行拼接的总行驶时间的偏差较小,能够指导乘客一个较为稳定的出行时间。
图16 拼接的出行时间和标准差
图17 历史平均出行时间和标准差
根据3.2.2小节分析可知上海车辆分布不均匀,在城市中心区域的车流量较高,容易造成堵车现象,从而造成经过这些区域的出租车乘客出行时间增长。为了说明接驳地铁和出租车出行的方式能够减少乘客的出行时间,选取了图18所示的线路作为说明,该线路的起点是石龙路地铁站,终点为虹口区广粤路。选取中山北路地铁站作为中转车站,对比只搭乘出租车的方案和先搭乘地铁再在中山北路换乘出租车的方案的出行时间和出租车行驶距离。两者的出行时间在一天不同时刻的变化曲线如图19所示,前者所需的出租车行驶距离约为22 km,后者只需4 km。由于该线路需要经过车流量最为密集的区域,导致前者的出行时间在高峰期时段有较为明显的增长,而后者的时间较为稳定,在高峰期时段相对前者能够减少10 min左右的出行时间。
图18 石龙路-广粤路
图19 总出行时间对比
通过出租车历史数据提取乘客的出行需求,为乘客重新选择出行方案,计算乘客在不同方案下所需的出行时间和出租车行驶距离。筛选出白天中所有出行时间大于30 min的乘客出行请求,在最小化出行时间条件下,分别计算四种方案所需的出行时间和出租车行驶距离,最终得到四种方案在每个小时的时间区间内的平均出行时间和出租车平均行驶距离分别如图20和图21所示。
图20 平均出行时间对比
图21 出租车平均行驶距离对比
由图4可知,虽然许多乘客的上车点或下车点分布在地铁站附近,但是几乎没有乘客同时在地铁站附近上车和下车。也就是说,如果将乘客的日常出行都通过方案2重新分配路线,虽然此时的出租车行驶距离为0,即出行价格最低,但是大部分乘客需要经过一段较长的步行距离,导致平均出行时间较为明显地增长。如图20所示,方案2的平均出行时间在一天的不同时段均超过了方案1的1.5倍。而如果将乘客出行需求通过方案3和方案4重新分配出行路线,在增加少部分出行时间的前提下能够较为明显地减低出租车平均行驶距离。例如,在邻近晚高峰时期的16:00到17:00的时段内,如果通过方案3进行出行只增加了将近5 min的平均出行时间,但是却能够平均减少7 km的出租车行驶距离,接驳地铁和出租车的出行方案确实能够较为明显地降低社会资源消耗。
本文提出了一种接驳出租车和地铁的出行方案,兼顾两者的部分优点,能够在保证较低的出行时间条件下较为明显地降低乘客的出行价格,降低了社会资源消耗。同时基于上海出租车数据和地铁数据的详细分析,新的出行方案能够根据不同时段提供差异化服务,指导乘客一个较为准确的出行时间。在将来的工作中,将对接驳出租车和地铁的出行方案做以下两个方面进行改进:(1)本文的线路计算方法目前只基于历史数据,将寻求和上海有关部门合作获取实时的交通数据,如信号灯和实时路况信息等,从而能够结合历史数据给出更加准确的出租车行驶时间。(2)采取一种更加有效的车流量预测方法,如Zhang[16]提出的利用深度神经网络的流量预测方法,能够通过时空数据实时并准确地预测流量,从而更加准确地估计等车时间。