刘 骜,钟绍鹏,2,李茜瑶,姜 宇,王 仲
(1.大连理工大学 交通运输学院,辽宁 大连 116024;2.杭州国际城市学研究中心浙江省城市治理研究中心,浙江 杭州 311121;3.交通运输部公路科学研究院 国家智能交通系统工程技术研究中心,北京 100088;4.兰卡斯特大学管理学院,英国 兰卡斯特LA1 4YX;5.丹麦技术大学管理学院,丹麦 灵比2800 Kgs.)
在过去的几十年中,人口的快速增长和城市化进程的推进导致全球大城市的出行需求不断增加,给城市交通系统带来了巨大挑战。公共交通作为一种绿色、经济、高效的出行方式,对满足未来的出行需求和实现城市的可持续发展至关重要[1-2]。与其他交通方式相比,公共交通在节约出行成本与引导城市规划等方面也有诸多优势。但部分地区存在公交线网规划不合理、公交时刻表不协调等问题,使乘客步行距离和候车时间过长、公交换乘不方便[3]。虽然交通管理部门和公交企业投入了大量人力物力优化公交系统,但效果不理想,部分城市还出现了公交服务水平和公交利用率之间相互制约的问题,使得公交系统运行效率降低[1]。而造成这种现象的主要原因是缺少可以有效识别、分析和优化现状公交问题的方法。更重要的是,现有方法通常依据公交客流调查数据[4-5],“被动”服务现有乘客,会造成潜在公交乘客(目前的小汽车用户)的流失。由此导致公交系统现状问题无法得到有效解决,进而使现有公交用户流失,最终形成公交上座率低、企业运营成本高、公交服务水平下降的局面。所以,许多学者认为,若能有针对性地提高公交服务水平,会促使相当一部分小汽车用户(重新)选择公交出行[6-7]。
大数据对交通规划的影响在迅速增大,推进大数据技术在城市公交领域的应用既能满足区域发展需要,也可有效应对上述问题[8]。为此,许多城市逐步开展大数据分析平台的建设和应用研究。例如,北京交通发展研究中心构建了交通运行智能化分析平台,其数据主要来源于路网摄像头/传感器、地面公交、轨道交通、出租车等。借助多源异构交通大数据资源分析诊断公交系统现存问题,并优化公交系统服务水平和运行效率,从而“主动”吸引潜在客流转化为公交客流,已成为学界的研究热点[9-11]。需要说明的是,本文所探讨的公共交通主要包括常规公交、定制公交和地铁三大类别。多源异构是指数据来源的多样性和数据结构的差异性;公交问题诊断指利用多源异构数据,从可达性、出行时间、换乘次数等角度分析判断公交线网和时刻表存在的问题;公交问题主动优化指通过优化现有公交系统,主动吸引更多的潜在用户(小汽车用户)转化为公交用户[12]。
从既有研究可以看出,目前在公交问题诊断与优化方面仍存在许多难点[13-15],且对该问题尚缺乏有针对性的综合分析。鉴于此,本文将对与公交问题诊断与优化相关的交通大数据研究成果进行综述,系统总结和归纳相关研究的研究方法与主要贡献,指出已有研究中存在的问题,展望该领域的未来发展方向,以期为进一步深入挖掘现有公交系统存在的问题并提出有效的解决方案提供思路,为政府部门与公共交通运营商提供决策支持,推动城市公共交通系统的良性发展。
本文全面检索了与公交问题诊断、公交系统优化相关的交通大数据研究文献,通过总结归纳,将以往研究的相关问题和研究重点概述为以下4类。
1)第1类研究问题:公共交通从起点到讫点的交通量。这是公交问题诊断的基础,也是所有优化研究的起点。通过对出发地和目的地的大数据分析,可以获取公交用户集中的热点区域和交通流量等信息,从而对公交线路进行精准规划,提升公交服务水平。
2)第2类研究问题:公共交通用户的出发时间与路径选择。这是在起讫点交通量的基础上进一步深化的研究,它关注的是公共交通用户的出行时间和行进路线。通过深入分析用户的出发时间和路径选择,可以预测交通高峰时段和高频线路,对线路配置进行动态调整,从而提高公交系统的效率。
3)第3类研究问题:公共交通用户出行花费的时间。这是公交系统优化研究的重要一环,旨在通过减少乘客的等待和行程时间,提高公交服务的满意度。该问题的研究不仅有助于公交系统更高效的运营,也可增强公众对公共交通的信赖和使用意愿。
4)第4 类研究问题:公交系统存在哪些问题,应该如何进行改善或优化。这是最终的目标,也是所有问题分析的终点。通过对前3 类问题的深入研究,可以发现公交系统的不足和改进空间,然后采取有效的优化措施,如改进线路布局与时刻表,优化车辆调度方案,提高服务质量等。
通过上述4 类问题的逐步深入,可以形成一个全方位、多层次的公交问题诊断与优化理论框架,有助于更好地挖掘公交系统潜力,提升其服务质量,吸引市民选择公共交通出行,助力城市的可持续发展。图1 总结了公交问题诊断与优化的4类研究问题及其之间的递进关系。
图1 公交问题诊断与优化研究的分类及其递进关系
接下来,本文将围绕上述4 类研究重点对基于交通大数据的公交问题诊断与优化相关研究进行总结分析。表1 汇总了相关研究中通常采用的城市交通大数据资源。表2 总结了相关典型研究采用的模型、方法和主要贡献。
表1 城市交通大数据类型及数据描述
本章将详细探讨第1 类研究问题,着重于公交OD 矩阵推断的相关文献梳理与总结。既有研究通常使用公交IC卡数据推断公交出行OD矩阵;在下车不刷卡的情况下,需先进行下车站点推断。
高质量的OD 矩阵是进行交通系统分析的先决条件。然而,由于调查成本高且难以实现,OD矩阵并不容易得到。特别是交通拥堵严重的大城市,其交通分区和调查时段的区分更为详细,对调查样本量和调查方法都有更高的要求。使用公交IC卡数据获得OD矩阵与采用传统OD调查方法有本质的区别。传统的OD 调查法受调查费用限制,仅能随机选择很小的样本进行调查(5%左右),并且调查数据生命周期短,不能充分、及时地反映出行分布的时空效应[5,47-48]。同时,小样本调查数据只能揭示特定群体对于不同公共交通选择(如定制公交)的倾向性,无法全面反映所有群体的交通需求和偏好[49-50]。与之相比,基于公交IC 卡数据的方法具有调查费用低、调查样本率高,且OD 矩阵离散化水平可以根据用户的意愿任意调整(可以表达为车站至车站或小区至小区间的OD)等优点[4]。因此,利用公交IC 卡数据推断公交OD 矩阵的研究由来已久[16-17,51-52]。值得一提的是,一些学者已经尝试将大数据挖掘与小样本调查相结合,以期更精确地探析公共交通出行需求,从而更好地适应和满足不同用户群体的多样化需求[18]。
部分常规公交仅需上车刷卡,下车不刷卡。为推断公交OD 矩阵,首先需判断公交IC 卡用户的下车站点。学者们开发了基于出行链的方法来估计下车站点,并推断公交OD 矩阵。该类方法通常假设一张卡对应一个用户,通过挖掘出行链信息,结合该张卡下一次上车的位置和时间信息,识别出用户的下车位置[5,19,53-54]。不同学者使用当地的数据对比该方法得到的OD矩阵与手工调查得到的OD矩阵,证实了使用公交IC卡数据与GPS数据确定公交乘客OD矩阵的有效性和实用性[4-5,16,52]。
本章将进一步探讨关于公交乘客出行行为的研究,即第2 和第3 类研究问题。以往公交OD 矩阵推断研究是从宏观角度提取公交乘客出行信息,没有分析公交乘客个体出行行为。近年来,学者们开始从微观个体的角度挖掘公交乘客的出行时间[20]、出行类别[21-24]、出行目的[25-26]和出行路径[27-31]等,具体如下。
1)关于出行时间,龙瀛等[20]利用公交IC 卡数据分析了北京市通勤出行的时间和距离,并识别出主要交通流方向。
2)关于出行类别,Ma 等[21]使用基于密度的空间聚类方法分析公交乘客的历史出行链信息,以识别公交乘客的出行模式,并进一步使用K-Means++聚类分析算法与粗糙集理论对乘客不同出行模式进行了分类;Lei等[22]提出了一种基于时态模式的公交乘客出行模式识别方法;Guo等[23]基于公交IC卡数据,使用出行链生成、OD识别和出行模式比较的方法,分析了定制公交乘客出行行为的时空特性与出行模式;陈君等[24]结合互相关距离算法与带噪声基于密度的空间聚类算法,提出了基于时空行为规律挖掘的公交乘客分类方法。
3)关于出行目的,考虑到传统公交IC 卡数据无法判断乘客的出行目的,Han 等[25]使用连续隐马尔可夫模型,将公交IC 卡数据与土地使用特征数据相结合,来判断用户的出行目的。Zhao等[26]提出了一种基于潜在狄利克雷分配的概率主题模型,以无监督的方式从个体水平的时空数据中挖掘具有代表性的活动分类。
4)关于出行路径,使用流量条件图法,Tao等[27]基于公交IC 卡数据识别出公交乘客的主要出行路径及其时变特征;Qi 等[28]采用多层中观分析法对公交OD 对的移动模式进行了有效的提取和可视化;Ren 等[29]、Li 等[30]与Ma 等[31]基于公交IC卡数据,使用基于密度的聚类算法提取了定制公交的运行路径。
本章将对公交系统改善或优化的相关研究文献进行全面总结。现有研究主要结合单层或双层规划模型,从线路设计与时刻表制定(含车辆间隔设置)两个方面对公交系统进行优化[55]。需要指出的是,为简化问题,学者们通常将公交线网设计和时刻表制定分开研究。图2 展示了既有研究采用的公交线网与时刻表优化模型框架。
图2 既有研究中的公交线网与时刻表优化模型框架
公交线网直接决定了公交系统的运行效率与服务水平[56-58]。学者们分别从环境友好[32]、运行时间可靠度[33]、公交网络鲁棒性[34]、公交乘客量[35-36]、公交总运行时间[37-39]等不同角度提出了相应的数学优化模型,以达到降低尾气排放、提高公交系统的可靠度以及降低乘客和公交企业的成本等目标。需强调的是,由于缺少详细的乘客需求数据,现有的大多数关于公交线网设计的研究主要基于理想的公交系统,无法考虑公交乘客需求的时空动态性。
对于时刻表制定而言,由于缺少详细的乘客需求的时空变化数据,运营商往往使用高峰和平峰两种时刻表应对乘客的时变需求。这种方法在公交供给充分时有效,但当公交供给有限时,效果则不甚理想,导致高峰期有些乘客需要等待很多辆车才能最终上车。公交IC 卡系统推出后,可以方便地收集公交需求的动态特征,为制定需求响应的时刻表提供了基础。如,Sun 等[40]基于刷卡数据提出了需求响应式公交时刻表优化模型;郑亚晶等[59]提出了基于IC 卡数据的地铁开行方案的精细化编制方法;Wu等[41]提出了一种将出行前和出行中的路径选择相结合的随机公交调度协调模型。
不同公交线路间以及不同出行方式间的时刻表不协调所导致的公交换乘不方便,大幅降低了公交的吸引力[60-62]。为减少乘客的换乘等待时间,Wu等[42]提出了一个公交时刻表协同优化模型,使所有换乘站点的换乘等待时长相同。基于乘客需求的时变性并考虑车辆容量和车队规模限制,Xiong 等[43]提出了常规公交与地铁时刻表优化模型,以解决社区班车与地铁服务衔接问题;Chen等[44]从时空网络视角建立了定制公交站点选择、线路设计与时刻表编制的集成优化模型;Ma 等[45]通过构建混合整数线性规划模型,研究了车辆路线设计、时刻表制定和乘客分配的协同优化问题;Yang等[46]研究了末班车时刻表协同优化问题。
为吸引更多的潜在客流转化为公交客流,提高公交系统服务水平和运行效率,许多学者利用交通大数据资源对公交问题诊断与优化进行了广泛的研究,但是已有研究受各方面限制,在关注视角、研究方法、优化方向、模型和算法等方面仍存在不足之处,未来需要进一步改进。图3 总结了研究现状与未来研究趋势。本文对公交问题诊断与优化研究的展望如下。
图3 研究现状与未来研究趋势对比图
1)研究视角
近年来,交通大数据研究逐渐成为热点,国内外学者开展了大量有建设性的研究工作。但是现有的研究主要关注前3 类问题,均侧重对某一出行方式下居民个体出行行为的刻画。此类研究无法分析现有道路或公交系统存在的问题。因此,为推动公交系统的持续发展并提高其效率,建议未来研究将重心从个体行为刻画向系统分析和优化转变,更加聚焦于如何利用多源异构数据深度诊断现有公交系统的问题,并形成针对性的优化策略[63]。这包括开发更为先进的数据处理和分析方法,如数据融合技术、机器学习和深度学习算法,从海量的数据中提炼出有价值的信息,从中发现并诊断现有公交系统存在的问题;构建适用于公交系统的优化模型和策略,针对性地解决公交系统存在的问题,如调度问题等;关注新技术(如人工智能、物联网等)在公交系统中的应用,这些新技术有可能进一步提升公交系统的运行效率,使乘客获得更好的出行体验。
2)研究方法
虽然一些学者已经开始尝试使用公交IC 卡数据和GPS 数据评价公交线路运行状态[64],并取得了一些进展,但是这类研究有一定局限性。由于仅使用单一的公交IC 卡和GPS 数据,缺少其他运输方式信息,现有方法很难全面、准确揭示现状公交系统存在的问题,也无法分析公共交通和其他出行方式间的联系。因此,有必要在未来的研究中利用多源异构交通大数据资源,如公交IC 卡数据、GPS 数据、手机信令数据以及无线射频识别数据等,对公交乘客和私家车用户的出行OD、出行路径以及时空特征进行深入分析,并借助多源异构数据关联与融合分析技术研究OD 对间公交车和小汽车交通需求量的相对关系,从而更准确地确定公交系统存在的问题和改进的方向。例如,如果某OD 对间公交客流量小而小汽车流量大,那么可能意味着该区域的公交服务存在缺陷,如服务频率低、线路设计不合理等,需优化改进;如果某OD 对间公交客流量小且小汽车流量也小,那么可能是该区域人口密度低、需求量小等因素造成的,此类情况则不作为重点考察对象。通过这种方法可以更精准地识别公交服务存在的问题,并据此进行有针对性的优化。
3)优化方向
现有公交线网和时刻表优化研究的依据是公交客流调查数据。公交客流调查数据面向的对象是现有公交乘客,由此得到的公交线网和时刻表优化方案侧重服务现有公交乘客。对于现状采用其他方式出行,将来有可能采用公交出行的潜在的公交乘客而言,现有的公交系统往往展现出步行距离和等车时间过长、换乘不便等弊端,因此他们对现有公交系统“敬而远之”。鉴于此,未来研究有必要通过交通调查,获取公交与小汽车用户的社会经济特征、空间特征和行程特征,并利用交通调查数据分析小汽车用户向公交系统转移的阻力、动力及其作用机理。在此基础上,可以进一步探讨如何通过优化公交服务的各要素,如可达性、出行时间、换乘次数等,将更多的潜在客流(小汽车用户)转化为公交客流,提升公交出行比例[65]。
4)模型和算法
现有研究往往将公交线网设计和时刻表制定分开讨论。同时,在实践中,受实时客流数据获取困难、道路交通运行状况动态变化等因素的影响,公交线路和时刻表也常被单独分析。尽管如此,考虑到两者之间的相互依赖性和重要的交互作用,以及单独的优化模型无法找到全局最优解[35,66],未来的研究应从理论和实践的角度探索如何开展更加合理、有效的公交线路设计和时刻表制定,并将二者进行组合优化。具体而言,在理论层面,可以综合运用运筹学和交通网络分析方法,构建公交线网和时刻表协同优化模型,并在优化模型中考虑更多的实际约束,如道路运行情况、公交客流等。在实践层面,也需要进一步探索如何将理论研究成果有效地应用于公交系统的实际优化,包括:①探索如何将时刻表数据与公交线网设计的各方面(如线路布局、站点设置等)相结合,以评估网络设计的合理性并提高公交服务的质量;②开发新的评估方法和优化策略,以加强公交线路的规划,包括识别线路的功能和重要性、根据客流和网络特性优化线路、评估线路调整对客流的影响,使得线路的优化能在满足功能需求的前提下,最大化客流效益。
此外,随着公交网络规模的不断增大,受求解速度和解的质量的影响,一般的精确解算法和启发式算法无法解决公交线网和时刻表组合优化问题[67]。因此,基于元启发式算法、深度学习算法、强化学习算法等开发适用于大规模实际公交网络的求解算法,以提高求解效率和解的质量,也是亟须解决的问题[67]。
发展高效的公交系统是减少交通拥堵的基础,也是解决城市交通问题的首选对策[68]。在此背景下,许多学者开始利用多源异构交通大数据资源,对公交系统问题的诊断与优化展开深入研究。本文从出行需求估计、出行路径选择、出行时间测算与公交问题优化4 个角度出发,对当前公交问题诊断与优化的研究现状进行了深入的剖析和总结。由于以往研究在研究视角、研究方法、优化方向与模型算法方面存在缺陷与不足,建议未来从用户出行规律分析、多源数据融合、用户转移机理解析与协同优化模型开发等多个方面发掘新的研究方法和方向,以更全面地解决公交系统的问题,推动公交系统的优化和发展。