邬群勇,万云鹏
(1.福州大学,a.空间数据挖掘与信息共享教育部重点实验室,b.卫星空间信息技术综合应用国家地方联合工程研究中心,福州350108;2.数字中国研究院(福建),福州350003)
公交调度对于缓解道路拥堵,改善环境问题,改进市民出行状态等具有重要意义。公交调度是一个多目标决策过程,其基本调度形式为全程车,根据客流量情况确定此条线路各时段的发车次数及发车间隔,制定发车时刻表用以指挥公交车辆运营。但由于公交线路中不同站点的客流集散量存在差异,对于客流集散量大的站点,采用传统方式难以有效地疏散乘客,需要有针对性地对客流进行快速疏散。而大站快车调度形式更具有针对性,能够有效疏散重要站点聚集的乘客。
大站快车站点选择主要有两种研究思路。一是以站点的客流分布特征为导向,挖掘大站快车站点组合。如Schwaree[1]、Mei 等[2]根据客流需求、公交车优先载客量,提出大站快车的基本设计原则,给出大站快车分配过程;Tetreault 等[3]基于自动车辆定位(AVL)和自动乘客计数(APC)数据,挖掘出行客流特征并选择站点,在此基础上估计大站快车经过新站点所运行的时间;另外,胡宝雨[4]等基于断面最大客流量的发车频率得到最优停车站点。另一种是以目标为导向,基于启发式算法求解最佳站点组合。Ye[5]等基于遗传算法建立不同情景下的模型,计算大站快车最佳停车点;Zhang[6]等在客流分配时考虑干线与支线的不同需求,以系统总成本为目标用遗传算法推算最佳停车站点;Chen[7]等考虑车辆通行能力和随机行程时间两个因素,提出一种混合统计模拟方法与人工蜂群算法的大站快车停车策略;Zhang[8]等考虑乘客需求不平衡度、跳站及公交运力因素,提出基于遗传算法的大站快车停车方案;Ren[9]等基于VRPPD(Vehicle Routing Problem with Pickups and Deliveries)求解算法的EBS(Express Bus Services)路线规划方法,确定大站快车停车站点;魏明[10]等提出配合大站快车的多目标单线组合调度模型,确定大站快车途经点。
现有研究多以客流集散量、站点不均衡系数或收益最大化为目标选择大站快车站点。一方面,这些方法未考虑公交站点对整个公交网络的重要性,可能导致部分客流较低但通达性更高的站点被忽略。这不仅会导致城市公交网络的鲁棒性下降,还会降低公交线路对换乘客流的吸引力。城市公交网络站点数量多且线路复杂,是一种典型的复杂网络,借助复杂网络理论及方法能够量化站点的枢纽作用。另一方面,基于单源数据进行大站快车站点推荐时,无法量化开通大站快车对公交客流产生的影响。因此,为探究公交网络中节点的重要性,克服基于单源数据研究的不足,本文引入复杂网络理论及方法,融合公交车和出租车客流数据,研究一种综合考虑站点客流、潜在客流及交通枢纽作用的多指标协同公交大站快车站点推荐方法,实现公交大站快车站点的合理推荐,以期为有关部门设计大站快车线路提供决策依据。
数据来源于厦门卫星定位应用股份有限公司,包括2015年6月13日-26日厦门市公交车辆、线网、IC 卡、GPS 轨迹和出租车GPS 轨迹数据。公交车辆数据包含车牌照、设备编号等信息。公交GPS轨迹数据包括经度、纬度、定位时间、到离站标识等字段。公交线网数据记录了厦门市近300 条常规公交线路的线路名称、经过站点位置等信息。出租车GPS 轨迹数据包括车辆ID、定位时间、经度、纬度、车速、载客状态。
本文基于MapReduce 的海量公交乘客OD(起讫点)并行推算方法推算公交乘客OD。基于出租车GPS 轨迹数据中的车辆载客状态变化提取出租车乘客OD,当载客状态由空载变为载客时,该载客的轨迹点为上车点;由载客变为空载时,该空载轨迹点为下车点。
研究流程如图1所示。通过数据预处理得到公交车、出租车乘客客流数据。为得到公交站点在整个公交网络中发挥的枢纽作用,在公交线网数据的支撑下,引入复杂网络理论,基于公交车客流数据构建有向加权的城市公交复杂网络,提取站点重要度。分别基于公交车和出租车客流数据计算公交线路站点客流集散量和潜在客流集散量。在此基础上,利用层次分析法为指标权重赋值,计算站点综合评分。最后,根据站点综合评分,结合选择大站快车站点的基本原则,得到推荐的大站快车站点组合。
1.2.1 基于复杂网络的公交站点重要度计算方法
(1)有向加权的城市公交网络构建
城市公交系统主要由公交线网、站点、车辆构成,本文以公交站点为节点,站点之间的连通关系为边构建城市公交网络拓扑结构。考虑公交线路上、下行特征通常不一致,构建有向加权的城市公交网络,模型为
式中:G为有向加权的城市公交网络;V为公交站点集合;E为公交站点间线路集合;W为站点与站点间线路权重,用客流量表示。
图1 研究方法流程Fig.1 Research methodology process
设城市中有N个公交站点,基于城市公交复杂网络生成公交客流矩阵M为
式中:S(i,j)表示站点i到站点j的客流量。
(2)公交站点重要度计算
基于公交客流矩阵M计算站点重要度,具体步骤如下:
Step 1 基于公交客流矩阵M计算概率转移矩阵T,即公交客流矩阵M的每个元素除以该元素所在行的所有非零元素之和。
Step 2 将无客流流出的站点设为悬虚站点,将矩阵T中悬虚站点所对应行的所有元素赋值为,得到新矩阵T′。
Step 3 赋予每个公交站点si初始重要度Vi(0),并满足,迭代计算每个公交站点si的重要度Vi,计算公式为
停止迭代的条件一般为
式中:Vi(k)为第k次迭代第i个公交站点的重要度;c为阻尼系数,一般取0.85;i表示公交站点的序号,j表示除i以外的公交站点序号,站点j为站点i的链入站点,即乘客乘坐公交从站点j到站点i;Tj′,i为T′矩阵中第j行第i列的值。
迭代结束即可得到公交站点的重要度。
1.2.2 公交线路站点客流/潜在客流集散量计算方法
(1)站点客流集散量计算
计算方法如图2所示,基于公交线网数据分别提取上/下行的公交线路站点集{s1,s2,…,sn} ,结合公交线路客流OD,计算每条客流OD的方向(上/下行),从而筛选出上/下行的客流OD,在此基础上,计算站点si在上/下行的上车和下车人次之和,即上/下行各公交站点的客流集散量。
(2)基于出租客流数据的站点潜在客流集散量计算
①基于上/下行的公交线路站点集{s1,s2,…,sn} ,遍历所有出租车客流OD 对,若OD 对的上车点位于公交线路上/下行站点集中任意站点sk的一定范围内,将该OD 对的上车点标记为sk的公交站名称,删除其余未标记的OD对。
②遍历步骤①提取的出租车客流OD 对,若OD 对的下车点位于公交线路上/下行站点集中任意站点sk的一定范围内,将OD 对下车点标记为sk的公交站名称,删除其余未标记的OD对。
③将第②步得到的出租车OD对中与上车、下车所对应的公交站点相邻OD对删除。
④按照上/下行的公交线路站点顺序,结合出租车客流OD对的出行方向,判断每对出租车客流OD 对的归属(上/下行),归属于公交线路上(下)行的OD对为第k路公交上(下)行的潜在客流。
⑤基于第④步所得上/下行的潜在客流,对上/下行每个公交站点sk的潜在上车客流、下车客流求和得到上/下行每个公交站点sk的潜在客流集散量。
图2 公交线路站点客流集散量计算流程Fig.2 Calculation process of passenger volume at bus stops
1.2.3 大站快车站点组合推荐方法
(1)基于多指标协同的公交线路站点综合评分
对公交线路站点重要度、客流集散量、潜在客流集散量分别进行离差标准化,基于层次分析法计算3 个指标的权重,将标准化后的3 个指标加权求和得到公交线路站点综合评分。站点综合评分计算公式为
式中:X为单个指标值;Xn为标准化后的指标值;Xmin和Xmax分别为单个指标中的最小值和最大值;gi为i个公交站点的综合评分;wa为第a个指标的权重;qa(i)为第i个公交站点的第a个标准化后的指标值。
(2)站点组合推荐方法
①初始化大站快车站点组合Rk(d)={}加入第k条公交线路的首末站。其中,k表示线路编号;d为上下行方向,0、1分别表示上、下行。
②计算第k条公交线路上/下行方向需要推荐的大站快车站点个数(除首末站),公式为
式中:Nk(d)要向上取整,表示第k条公交线路上/下行方向需要推荐的大站快车站点个数;Lk(d)为第k条公交线路上/下行方向的线路长度(km)。
③将第i条公交线路上/下行方向所有公交站点(除首末站)按照站点综合评分排序,取排名前Nk(d)个公交站点加入Rk(d)。当前的Rk(d)为第k条公交线路上/下行方向的推荐大站快车站点组合。
开设大站快车对原有线路有一定要求,原有线路站点的客流集散量差异越大,开设大站快车的必要性和优势越大。经筛选发现118 路上行(红星美凯龙总站到轮渡公交场站方向)对开设大站快车的需求较大。厦门市118 路公交上行的客流集散量如图3所示。
从图3可以看出,近60%的站点未达到均值,太湖新城、仙岳花园等站点的客流集散量远超平均值,而部分站点的客流集散量远低于平均值,站点客流集散量在线路上分布非常不均匀。若在118路上行开通大站快车将有效疏散关键站点乘客,可以降低大多数乘客的乘车时间。实验以118 路上行为例进行大站快车站点推荐并对大站快车站点推荐方法进行对比论证。
计算118路上行站点重要度、客流集散量、潜在客流集散量。由于人们一般出行到达私家车的距离为100 m,该距离通过较短的步行即可到达,大站快车对该距离范围内的潜在乘客吸引力较高,故计算潜在客流集散量时将范围距离阈值设为100 m。118路上行站点的各指标值如图4所示。
从图4可以看出,相同站点的指标间高度不相关。如太湖新城的客流集散量较高,该站点其他两个指标均较低;轮渡公交场站的客流集散量不高,但另外两个指标均较高。因此若仅用单一指标进行大站快车站点推荐,会导致推荐结果不准确。
提取重要度排名前50 的公交站点,厦门岛的公交站点重要度空间分布如图5所示。可以看出,重要度高的公交站点客流量大且客流呈放射型的空间分布特征,这类站点一般为客流集散中心。当一条公交线路中存在多个客流量相近的公交站点时,需要基于多指标的站点选择方法来界定这些公交站点的重要性。
118路上行站点潜在客流如图6所示。可以看出,在厦门岛的西南-东北向存在一些出行需求与118 路上行行驶路线相似的出租车客流,并且不同公交站点对其潜在客流量存在较大差异。大站快车乘车明显比普通公交节省耗时,基于最优时间、价格成本,此部分客流大概率会乘坐大站快车,故在选择大站快车站点时需要考虑公交线路的潜在客流。
图3 厦门市118路公交上行方向站点客流集散量Fig.3 Passenger volume of bus No.118 uplink in Xiamen
图4 118路上行方向站点标准化后的3种指标值Fig.4 Three standardized indicators values of bus No.118 uplink stops
图5 厦门岛区域的公交客流网络Fig.5 Bus passenger flow network of Xiamen Island
图6 118路上行方向站点潜在客流Fig.6 Potential passenger flow of bus No.118 uplink stops
表1为基于层次分析法构建的成对比较矩阵。
表1 成对比较矩阵Table 1 Pairwise comparison matrix
经检验,该矩阵通过一致性检验。计算得到公交站点客流集散量、重要度、潜在客流集散量的权重值分别为0.58、0.31、0.11。基于站点综合评分计算方法得到各站点的综合评分及评分中各指标的贡献分值如图7所示。
从图7可以看出,思北路口、开禾路口站、海滨大厦站、轮渡公交场站因除公交客流集散量外的指标贡献较多使得综合评分上升明显。其中,思北路口和开禾路口站的得分主要来自于重要度,说明站点为乘客换乘较多的枢纽站点。海滨大厦站、轮渡公交场站重要度和潜在客流集散量贡献均较大,公交因耗时长、车内拥挤等原因无法满足部分乘客的出行需求,开通大站快车后可能吸引一部分这类乘客乘坐公交车,故在选择大站快车站点时应该考虑这类站点。
图7 118路上行方向站点综合评分Fig.7 Comprehensive score of bus No.118 uplink stops
为论证基于多指标协同的公交大站快车站点推荐方法比基于单源数据的传统单指标推荐方法具有优势,以及选择各指标的必要性,本文将传统推荐方法中常用的客流集散量指标与潜在客流集散量、重要度两种指标进行组合,共得到基于单源数据、多源数据的4 种大站快车站点推荐方法,分别为:基于站点客流集散量的单指标推荐方法(A),基于站点客流集散量和潜在客流集散量协同的推荐方法(B),基于站点客流集散量和重要度协同的推荐方法(C),基于站点客流集散量、潜在客流集散量和重要度3种指标协同的推荐方法(D)。
通过计算得到118 路上行需要推荐的大站快车站点个数为10 个(不包括首末站),基于上述4 种方法分别计算118 路上行的大站快车推荐站点如表2所示。
表2 基于4种方法的公交站点推荐优先度排名Table 2 Ranking of bus stops based on four methods
大站快车站点推荐方法对比论证如下:
(1)对比方法A 和B 的结果发现,基于站点客流集散量的单指标推荐方法与基于多源数据所得的推荐结果存在明显差异,基于多源数据推荐优先度前10的站点中松柏被替换为海滨大厦站。该变化的主要原因为海滨大厦站上行潜在客流集散量远高于松柏,此外,海滨大厦是厦门市较知名的高层写字楼,可能有较多乘客乘坐出租车上班,开通大站快车对这类乘客有一定的吸引力,故基于多源数据的推荐结果更合理。
(2)方法D在C的基础上融合了多源数据,推荐结果中,湖光路站被替换为海滨大厦站。湖光路站不属于交通枢纽,且该站周围潜在客流极少;而海滨大厦站拥有较高的通达性和潜在客流量,大站快车在海滨大厦站停靠更有必要。因此,基于多源数据的推荐方法在合理性方面具有较大优势。
(3)方法C 与A 均基于单源数据,比较方法A和C的结果可以发现,在基于站点客流集散量单指标推荐方法的基础上进一步考虑站点枢纽作用后,推荐优先度排名发生了较大变化,尤其是思北路口和开禾路口站。经过这两个公交站点的岛内公交和出岛公交线路均较多,且思北路口附近有天虹商场,开禾路口站周围有海鲜市场、广场、医院等人口流动性较大的场所。这类站点更容易出现乘客疏散困难的情况,说明考虑站点枢纽作用对站点排名产生的变化较合理。
(4)方法B中剔除的松柏与方法D中剔除的湖光路站相比,前者的站点枢纽作用和潜在客流均远高于后者,仅站点客流略低于后者,综合比较,大站快车更应该在松柏停靠。综上所述,方法D优于传统方法和其余两种基于双指标的方法。
基于复杂网络,融合公交车和出租车数据,提出一种考虑城市公交站点枢纽作用及潜在客流的多指标协同公交大站快车站点推荐方法,实现公交大站快车站点精准推荐。通过深度挖掘公交站点的重要度、客流集散量、潜在客流集散量之间的关系,发现三者在同一公交站点表现出高度不相关性。对比多种大站快车站点推荐方法的结果发现,在传统方法基础上融入公交站点重要度及潜在客流集散量两个新指标后,得到的公交大站快车推荐站点优于传统方法。