刘 倩,孙玉娥,黄 河,杜 扬
1(苏州大学 轨道交通学院,江苏 苏州 215131) 2(苏州大学 计算机科学与技术学院,江苏 苏州 215006)
随着城市化的发展以及基础设施的建设,公共交通已经成为了城市居民出行的主要方式.在大城市中,公共交通的主要组成部分是轨道交通与地面公交.值得注意的是,轨道交通因为其准时、快速的特点可以有效缓解交通拥塞,成为了人们出行的首选.但是,由于轨道交通建设成本高、建设周期长的特点,其在大多数城市仅能覆盖较小的范围,使得居民出行时往往需要结合轨道交通与公交选择合适的出行方案.然而,当前的轨道交通与传统地面公交并没有呈现出良好的协同发展趋势,缺乏高效的接驳策略.这是因为轨道交通与地面公交隶属于不同的部门,客观上衔接配合能力不通畅,难以最大化发挥整个公共交通系统的运力.上海市人民政府在印发《上海市综合交通“十三五”规划》中曾指出,当前城市公共交通系统存在的突出问题其一就包含轨道交通与地面公交换乘效率低.因此,强化公交线网与轨道交通网络的融合,提高两者间的衔接换乘效率是提升城市公共交通整体服务水平的关键.
随着交通大数据在城市交通规划与分析中的作用日益增加,近年来研究者们针对上述问题从换乘数据分析[1-3]、换乘服务评价体系[4-6]、城市公共交通网络化[7-9]以及接驳公交线路设计[10-12]等角度研究了轨道交通网络与地面公交线网的融合衔接问题.将轨道交通与常规地面公交结合作为一体化城市公共交通网络规划进行研究,Chien等[13]开发了一种模型用于联合优化城市走廊中的轨道交通线以及其连接的相关公交支线,优化的变量包括集成网络中的线路长度、站点选址、车头选址等地理位置特征,从而使得集成的公交与铁路网络的总成本降至最低.该类研究对构建完善的轨道交通与公交换乘体系具有重要指导意义,但城市公共交通系统建设阶段中轨道交通与公交分属于不同的机构管理运营,因而难以进行一体化调整.
针对衔接轨道交通站点的公交线路,Kuan等[14]提出采用启发式的遗传算法和蚁群优化方法解决接运公交的网络规划设计问题,Lin等[15]设计了与轨道交通发车频率相适应的接驳巴士路线规划模型;陈源等[16]以协调乘客与公交公司的需求为优化目标,采用启发式算法和深度优先搜索算法联合求解接驳轨道交通的社区公交线路.然而,上述方法更多侧重于公交线路的调整以及站点的设置,以满足地铁与公交之间点到点的接驳需求.目前,国内大城市已基本实现公交站点全覆盖,线路运能较充足,开设新的公交线路或调整原有的公交路线,仅能解决部分未被覆盖区域的接驳需要,且会提高公交公司的运营成本,无法解决部分站点在平峰期间运力充足,而在高峰期间运力不足的问题.
据调研发现,大部分城市的公交系统仍采用固定时间间隔发车的策略,部分路线会将全天分为平峰期和高峰期,分别按不同的发车间隔进行发车.然而,这种公交调度方式过于原始,未实现公共交通资源的最大化利用.针对现有公交调度策略未能与轨道交通换乘需求实现良好协调的问题,本文研究如何在现有公交线路网基础上,通过分析历史换乘客流的特征实时预测每个站点的换乘客流需求,然后依此建立考虑轨道交通换乘需求的公交发车时刻优化模型,依据公交线路途经站点的换乘客流需求动态调整公交线路的发车时间,以最大化提高公交系统的服务质量并降低其运营成本.为实现上述目标,本文结合了上海市2015年4月的一卡通乘客刷卡数据、地铁公交基础数据以及天气数据等进行分析,在此基础上首先根据乘客两次连续出行的刷卡时间差判断是否存在换乘行为,提取分析乘客换乘特征,接着利用多层感知器神经网络良好的非线性映射、自适应特性预测不同情况下的换乘需求,然后在传统发车频率计算方法的基础上,同时考虑换乘乘客的换乘等待时间和常规乘客候车时间,构造了考虑轨道交通换乘需求的公交发车间隔优化模型,并使用遗传算法计算最优发车间隔.最后,文章以上海市公交线路为例,应用该模型对其沿途轨道交通站点进行发车间隔的优化,验证所设计方法的有效性.
F=α×(tP+θ×tQ)+β×W
(1)
对于实际公交线路,影响公交发车间隔的因素复杂,在模型建立前做出如下假设:1)线路运行公交车辆型号一致,运行速度相同,车队规模一定;2)每班次公交车的运行成本为定值,即某公交线路车辆营运成本只与发车频率有关;3)公交到站后,该站候车乘客均能登上该班次公交车,不存在乘客滞留的情况.
图1 模型建立示意图Fig.1 Schematic diagram of bus line model
表1 模型主要符号Table 1 Main symbols in the model
公式(1)中,考虑轨道交通换乘需求的公交发车时刻优化模型的目标函数F包含换乘乘客的换乘时间tQ,常规乘客的候车时间tP及公交公司成本W,具体计算过程如下.
(2)
(3)
(4)
(5)
(6)
最后根据研究时段内发车总班次计算得到公交公司成本W为:
W=n×w
(7)
其中n为线路发车总班次,w为每次发车公交公司营运成本,包含公交车辆的运行油耗、司机薪资等费用.
(8)
在求解考虑换乘需求的公交发车时刻前,需要先分析历史数据中不同情况下换乘客流的特点,以实时预测换乘站点的换乘需求,这是动态调整待优化公交线路发车时刻的重要准备工作.依据历史刷卡数据统计历史出站客流与出站后换乘公交客流,发现日地铁出站量分布大体在250万至500万人次之间,出站后换乘公交的客流量分布大体在35万至65万人次之间,换乘客流的影响因素十分复杂,乘客出行方式的选择存在多种可量化因素和不可量化因素,这些复杂的影响因素与换乘客流量之间呈现非线性相关关系,但各影响因素之间又存在着某种或多种联系.这些特点符合神经网络[17]的性能,因此选取神经网络对地铁换乘客流进行预测.
多层感知器(Multi-Layer Perceptron,MLP)[18]是常见的人工神经网络(Artificial Neural Network,ANN)算法,它由输入输出层及其中的多个隐藏层组成,每个隐藏层包含多个隐藏单元.神经网络算法就是让机器模拟人脑中的神经系统,在每个输入节点和隐藏单元或隐藏单元和输出节点之间都有一个权值相连,神经网络的学习[19]是一个通过训练数据来调整神经元之间连接权值参数的过程.最简单的MLP(图2)中间只包含一个隐藏层,输入n个神经元分别为x1,x2,…,xn,隐藏层的m个神经元对应输出为h1,h2,…,hm,输出层的输出用y表示.各层的输入输出关系如公式(9)-(10)所示.
(9)
(10)
其中wij表示隐藏层第j个神经元与输入层第i个神经元的连接权值,bj表示隐藏层第j个神经元的偏置,hj表示隐藏层第j个神经元的输出,uj表示输出层神经元与隐藏层第j个神经元的连接权值,b表示输出层神经元的偏置,f(·)为激励函数.
图2 多层感知器原理图Fig.2 Schematic diagram of MLP
设置不同的隐藏层数量、隐藏层包含节点数以及合适的激励函数可以调节模型的复杂程度.为了对预测模型进行有效的监督训练,需要选取合适的输入输出,这里选取影响换乘客流的可量化因素作为网络输入变量,神经网络的输出即为换乘客流量.依据对历史换乘信息的分析选取以下5个影响因素:特征日期(数字0代表工作日、1代表周末和国家法定节假日)、高平峰(7:00-10:00和16:00-20:00为高峰时段用数字1表示,其余时段为平峰时段用数字0表示)、时间段(6:30-23:45以15分钟为间隔划分为69个时间间隔,分别用数字6.5-23.5表示)、天气特征(晴天、雨天以及多云天气分别用数字1、0和0.5表示)和地铁刷卡出站人数(每个时段内出站人数和换乘人数也存在某种联系).以上海8号线沈杜公路站数据样本中80%的数据样本作为训练集,20%作为测试集,MLP模型中隐藏层数量选择3层、每个隐藏层包含50个神经元、激励函数选择relu函数.用训练好的模型对测试集进行预测,预测结果对比如图3所示,并且使用MAE、MSE、MAPE、R2、explained_va-riance_score几个指标对回归预测结果进行评估,预测精度见表2.MLP对换乘客流预测稳定性较好,可用于后续分析中预测换乘站点的换乘客流需求.
图3 预测结果对比Fig.3 Comparison of forecast results
第2节建立了换乘乘客换乘时间和常规乘客等待时间以及公交公司发车成本综合最小的目标函数,该函数的解是一组不等间隔的发车时刻集合,不等间隔的发车时刻组合使得模型的解空间极其庞大,对于这类NP完全[20]问题,多采用遗传算法[21]、贪心算法[22]、蚁群算法[23]等进行求解.
表2 预测精度Table 2 Prediction accuracy
贪心算法将求解问题的全局最优转化为求解问题的局部最优,即贪心的选择每一个子问题的最优解,对于发车时刻选择问题,贪心算法的每一步选择会对下一个发车时刻的选择以及问题结果产生影响,而且贪心算法的选择不能回退,无法单纯的使用贪心算法进行发车时刻的分步选择,发车时刻的选择是一个全局优化问题.
遗传算法是基于达尔文的自然选择学说,模拟自然界的优胜劣汰来进行一种自适应的全局搜索算法.遗传算法将问题的每组可能解看成一个解向量,称其为染色体,其中的每个元素称为基因.对于待处理的问题首先确定一个合适的适应度函数作为目标函数来评判解的优劣程度,接着计算初始种群中每个个体的适应度,通过对当前种群施加选择、交叉、变异等一系列遗传操作后,产生新一代的种群,重复上述操作逐步进化种群从而获得包含或接近问题最优解的种群.遗传算法在各个领域中都有许多的成功应用[24],但也存在着局部早熟现象(即很快收敛到局部最优解而不是全局最优解)和在快要接近最优解时在最优解附近左右摆动,收敛较慢的问题,因此本文引入贪心思想进行遗传过程中的选择、交叉和变异操作,提高了算法的求解效率.对于遗传算法的关键步骤加入贪心思想设计如下:
1)编码
2)生成初始种群
3)适应度函数
适应度指的是种群中个体“适应环境的能力”,适应度越大的个体在种群中被选择的概率越高,适应度函数[25]的设计直接影响模型解的搜索方向和最终解的质量好坏.遗传算法一般解决最大化问题,本文建立的模型目标函数是最小化问题,由此可构造适应度函数:Ffit=E/F,其中E为设定固定值.
4)遗传操作
遗传操作最重要的3个步骤即选择、交叉、变异,在此引入贪心算法的思想,以确保每次迭代都能选择到最优良的个体进入新一代种群.对当前种群的最优个体、平均适应度等进行记录,进行以下操作.
变异:变异操作会通过改变父代个体中部分染色体的值形成新的子代个体,从而提高种群多样性寻找更优良的解.对于染色体元素为整数的个体进行差分变异操作,在父代个体随机选择3个不同的染色体向量结合生成新的染色体,其中λ为缩放因子,一般取(0,1]之间的实数,可以控制父代个体与子代个体之间的进化率.
vi=xr0+λ×(xr1-xr2)
(11)
交叉:交叉操作依据交叉概率通过重新组合种群染色体
矩阵中包含的遗传信息产生新的个体.在父代群体中随机选择两个个体作为父代个体V1和V2,交叉染色体片段后产生新的子代个体V1′和V2′.
图4 遗传操作的关键步骤Fig.4 Major operations of genetic algorithm
选择:在选择阶段引入贪心思想,在进行交叉变异后的试验种群和原种群之间进行比较,逐一比较两个种群中位于相同位置的个体适应度,选出适应度高的个体舍弃适应度低的个体,依次比较贪心选择更优良的个体进入新种群,完成一次遗传操作.
本文选取的一卡通乘客数据来自上海市2015年4月的30天刷卡数据,每日的数据文件为一天中上海市内持有一卡通的乘客刷卡数据,包含约千万条刷卡记录,如表3所示,每条原始刷卡记录包含卡号、交易日期、交易时间、位置信息、乘车工具、交易金额、交易性质这7类信息.需要注意的是,上海市的交通一卡通可使用的范围不仅限于上海市内所有的公交与轨道交通,还可用于出租车、轮渡和P+R停车场,因此在进行换乘数据提取之前需删除与公交上车和轨道交通进出站无关的刷卡记录,保留有效信息字段.
表3 上海市一卡通乘客刷卡数据信息Table 3 Public transportation card records
利用同一卡号乘客的地铁出站刷卡记录的交易时间与公交上车刷卡记录的交易时间的时间差T,判断两条数据记录之间是否存在地铁换乘公交的关系.以5min为间隔对相邻刷卡记录进行分析发现,大部分换乘行为花费时间为15min以内,其中超过50%的换乘行为发生在10min以内,超过20min的换乘仅占总量的5%左右.
为了保留换乘样本的完整性,根据换乘时间阈值研究,并且结合上海市公交站点与轨道交通站点实际情况,考虑乘客在换乘过程中可能发生的休息、步行和候车时间,选择25min作为地铁换乘公交的换乘时间阈值TMB.换乘时间阈值与确定换乘关系之间的联系如图5所示,当乘客连续两次出行的间隔时间小于换乘时间阈值时被认为存在换乘关系.
图5 换乘时间阈值与换乘关系Fig.5 Judgement of transfer behavior using transfer time threshold
依据换乘时间阈值可以从一卡通乘客刷卡数据中提取乘客由地铁出站后换乘公交的换乘记录信息.首先清洗原始数据获得包含有效信息字段的乘客刷卡记录数据后,将包含公交与轨道交通的刷卡记录以卡号字段进行分组后按照交易时间升序排序,提取同一卡号乘客的出行链.接着检索乘客出行链,选取一日出行链中同时包含公交与轨道交通两种乘车工具的出行链为可能包含换乘关系的出行链信息.计算该出行链中轨道交通的出站时间与公交上车时间之差T,若T 表4 换乘信息示例Table 4 Example of transfer information 选取上海市770路公交线路作为研究对象,对该线路天钥桥路辛耕路(徐家汇)——长华路华泾路方向的发车时刻进行优化,该线路共包含19个公交站点,主要与徐家汇地铁站、上海体育场地铁站、上海体育馆地铁站和龙漕路地铁站4个地铁站接驳. 将770路公交车线路天钥桥路辛耕路(徐家汇)——长华路华泾路方向的19个站点分别编号为1-19,据统计由徐家汇地铁站出站换乘的乘客于公交站B1换乘,由上海体育馆地铁站和上海体育馆场地铁站出站换乘的乘客于公交站B3换乘,由龙漕路地铁站出站换乘的乘客于公交站B6换乘.根据历史公交行驶数据,站间运行时长标注与具体站点信息见表5. 表5 770路站点信息及站间运行时长Table 5 Bus route of 770 in Shanghai 选取研究时段为2015年4月30日早高峰7:00-8:00,对历史刷卡数据进行统计后得到高峰一小时内地铁出站后换乘770路公交的乘客数量以及常规等候770路公交的乘客数量,以15分钟为间隔统计人数见表6.常规公交乘客的刷卡数据仅有上车时间不包含其上车站点,假设乘客按照泊松分布于沿路公交站候车.公交线路主要信息及算法参数设置见表7. 表6 换乘及常规公交乘客人数Table 6 Number of transfer and bus passengers 表7 模型及算法参数设置Table 7 Parameters of model and algorithm 该算例中,遗传算法初始种群数量500,染色体长度即为研究时段内发车总班次取7,最大迭代次数为500,按照3.2小节的遗传算法编写代码计算最优发车时刻,迭代过程见图6,可以看出前100代内目标函数迅速减小,100代以后目标函数的变化程度逐渐减小,500代左右算法趋于收敛,最优的目标函数值为5643.73. 图6 遗传算法迭代效果图Fig.6 Result of genetic algorithm iteration 优化后的发车时刻如表8所示.优化后换乘乘客总候车时间为4.1935×104s,常规乘客总候车时间为1.1167×106s.按照原发车间隔,770路公交车以固定间隔10分钟均匀发车,此时换乘乘客总候车时间为4.815×104s,常规乘客总候车时间为1.1238×106s.经优化后的公交发车时刻与原发车时刻相比,使高峰一小时内换乘乘客的总候车时间减少了6215s,人均换乘时间减少42.3s,且并未增加原常规乘客的候车时间,在现有的发车能力下保障了常规公交乘客出行的同时又有效衔接了地铁换乘客流. 表8 最优发车时刻Table 8 Optimized bus departure time 本文对考虑轨道交通换乘需求的公交发车时刻优化进行研究.首先基于乘客一卡通刷卡数据、车辆行驶数据及相关地理信息数据等交通大数据,分析了上海市轨道交通与公交的接驳换乘现状,然后提取历史换乘数据结合神经网络完成对不同情况下换乘站点的换乘需求预测.之后基于现有公交线路网资源,建立了考虑轨道交通换乘需求的公交发车时刻优化模型,同时考虑换乘乘客的换乘等待时间和常规乘客的候车时间,对接驳轨道交通站点的公交线路进行发车时刻优化,使现有的公交线路资源能实现与轨道交通站点的良好衔接.选取接驳3个轨道交通站点的上海市770路公交线路进行验证,设计遗传算法求解得到优化后的发车时刻,与该线路原等间隔的发车时刻进行对比,优化后的发车时刻有效降低了换乘乘客的换乘等待时间,且并未影响原常规乘客候车时间.发车时刻优化模型可以实现根据乘客的出行方式偏好动态优化现有公共交通资源的配置,使其能与轨道交通有效接驳,为乘客提供更加良好的出行体验,进而提高公共交通对于城市客流的吸引力.4.2 实例选取
5 总 结