翁剑成 涂 强 林鹏飞 徐 硕
(北京工业大学交通工程北京市重点实验室1) 北京 100124) (北京市运输管理技术支持中心2) 北京 100073)
票价调整对公交出行者出行选择的影响分析*
翁剑成1)涂 强1)林鹏飞1)徐 硕2)
(北京工业大学交通工程北京市重点实验室1)北京 100124) (北京市运输管理技术支持中心2)北京 100073)
分析了公共交通调价前后客运量的宏观时空变化特征,开展面向公交出行者的出行选择调查.结果表明,公交票价调整对公共交通通勤出行者和非通勤出行者的影响程度和出行方式转移特征具有显著差异.以公交出行者刷卡时空特征向量为基础,提出了基于机器学习的通勤出行者判别方法,并利用北京市每日约1 300万的多模式公共交通刷卡数据,较精确地实现了通勤出行者和非通勤出行者的类型划分,分类准确度达到94.24%.利用不同时期的个体出行数据,定量分析了公共交通票制票价调整对通勤和非通勤出行者的出行频次、公交出行方式选择的短期和长期影响差异.短期影响看,通勤出行者中地铁出行和地面公交出行次数明显下降的人数比例分别为14.90%和25.47%,3.73%的通勤出行者存在轨道交通向地面公交的转移;而非通勤出行者中,轨道交通和地面公交出行次数明显下降的人数比例分别为21.32%和26.96%,非通勤出行者轨道出行的下降比例显著高于通勤出行者.长期影响看,仅有4.15%的轨道交通通勤出行者出行次数依然有明显下降,而依然有35%左右的出行者地面公交出行次数较调价前显著下降,表明调价对地面公交出行者的影响更具有持续性.
公共交通;票价调整;通勤出行者;机器学习;出行选择
国内在公共交通票价调整对居民出行影响方面的研究主要集中于宏观客流特征的变化分析.周志华等[1]针对2008年底广州公交票价调整对轨道客流的影响分析较为典型.其主要的方法是根据调价前后的轨道客流统计数据展开对比分析,以探究调价对轨道客流的不同特征的影响.此方法可以从宏观层面对调价的影响进行整体把握,却难以体现调价对不同出行类型人群的影响的差异性.贺崇明等[2]则主要通过票价敏感性分析,建立模型对比不同票价调整方案对广州轨道客运量的影响,并强调了票价对于调节公共交通出行量的作用.
随着公交IC卡的广泛应用,研究人员开始着眼于海量公交刷卡数据的特征分析和数据挖掘相关的研究.Agard等[3-4]指出智能公交卡数据分析有助于更好地理解公交出行者的行为.Jang[5]对于乘客公共交通出行时间及换乘特征进行了数据分析并且绘制了行程时间-空间分布图.该研究利用公交IC卡数据分析了换乘时间、换乘需求等因素的空间分布,对于公共交通线网服务水平的提升有所帮助.Seaborn等[6]基于伦敦市的公共交通智能卡数据对公交与公交、公交与地铁,以及地铁与公交这三种换乘关系之间出行阶段连接的时间阈值进行了研究,形成了完整的出行链连接.基于此,对每日公共交通的出行链总数、每人的日均出行链数、每条出行链所包含的出行阶段数、公交与地铁的混合出行数等进行了详细的统计分析.
对公共交通出行特征的研究主要聚焦于公交刷卡信息的处理与分析.尹长勇等[7]提出基于聚类分析方法的公交上车站点的客流匹配方法,考虑到乘坐同一车次的乘客的刷卡数据在时间上具有一定的集中性,由此出发设定合理阈值,将公交IC卡数据按照刷卡时间进行聚类,再与公交运营时刻表加以匹配,从而获得较为准确的上车站点信息.董晓晶等[8]研发出基于GIS的公交IC卡数据处理及分析系统.该系统可以通过连续两条刷卡纪录的交易时间判断其是否在指定范围内,之后再基于GIS判断这两条纪录所乘交通工具是否为换乘,从而实现基于公共交通IC卡数据判断不同公共交通工具间的换乘关系.龙瀛等[9]利用连续1周公交IC卡刷卡数据(不含轨道交通AFC刷卡数据及单次刷卡的公交刷卡数据),建立了表示持卡人一次乘车过程的、用于识别通勤出行的出行模型以及表示持卡人在某一地点的开始和持续时间的、用于识别出行者职住地的PTD(position time duration)模型.
总体而言,以往基于海量刷卡信息的研究采用单一模式的公交刷卡数据,研究数据的覆盖人群和规模偏小,而且样本选择中对于通勤和非通勤出行者的特征差异考虑不足,未能细化研究不同类型出行人群的出行规律及影响特征.
文中在对调价前后公共交通客运量变化展开宏观特征分析的基础上,结合现场问卷调查结果,基于海量公交刷卡数据,引入机器学习方法实现基于个体刷卡数据特征的公共交通通勤与非通勤出行人群科学划分.从短期、中期和长期多个视角,分别针对通勤和非通勤出行者的整体出行特征、出行方式选择行为和出行频次进行全样本的数据分析,系统评估公共交通票价调整对公共交通出行者出行特征的影响.
选取调价前、调价1周后、调价3个月后、调价10个月后的四个阶段,即2014年11月27日—12月22日,2015年1月8日—2月2日,2015年3月5—30日及2015年10月8日—11月2日的公共交通客运量统计数据对比分析公共交通客运量的宏观时空变化.为消除月份变化对于公交客运量的影响,利用2013和2014年度2年的公共交通日客运总量计算公交客运量月变系数(年平均日客运量与某一月的月平均日客运量之比).结合变化规律稳定的公交客运量月变系数在一定程度上消除月变因素对客运量的影响.
宏观的客运量数据分析表明(见表1),北京公交票价调整对居民的出行影响较为明显,对地面公交出行的影响比轨道更长远,对轨道交通休息日的出行影响大于工作日.
表1 公共交通客运量变化率(与2014年底调价前的数据相比) %
为了掌握个体出行选择行为的微观差异,研究开展了公共交通出行选择行为的出行调查.为兼顾不同出行距离、出行目的的公共交通出行者,实地调查地点包括北京市居住、商务和混合用地等不同类型区域的站点附近.回收总体有效样本440份,通勤与非通勤出行者的比例约为1.5∶1.结果显示,公共交通通勤与非通勤出行者在出行时耗、出行时刻、出行距离等方面差异明显.Pearson Chi-Square检验表明,调价后两者出行方式变化也具有显著差异(Sig.<0.05).相对于非通勤出行者,通勤出行者由轨道转向地面公交出行的比例更大,调价对于通勤出行者轨道出行的影响明显小于非通勤出行者.
初步分析表明,北京公交调价对居民出行影响较大,且对通勤和非通勤出行者的影响存在明显差异,需分别探究调价对不同人群出行方式选择的影响.
公共交通的数据基础主要可以分为两大类:一类是动态数据,包含公交IC刷卡数据、地铁AFC刷卡数据等,全市每天约有1 300万人次的刷卡数据;另一类为静态数据,包含公交线路、轨道站点等基础数据.王月玥[10]在基于多源数据提取个体出行过程的研究中,完成了公共交通多源数据的预处理、公交出行过程的匹配以及公共交通出行链的提取,为研究提供了高质量的数据基础.
原始刷卡数据经过处理整合后的数据见表2.
在表2中,对公共交通多源数据进行了整合,其出行模式中的R代表地铁出行,B代表地面公交出行.不同刷卡次数出行人数频率分布见图1.
表2 公共交通个体出行阶段整合表
图1 不同日均刷卡次数出行人数频率分布图
文中定义上下班或上下学主要使用公共交通的出行人为公共交通通勤出行者,反之则为公共交通非通勤出行者,通过调查征集了978位已知公共交通出行类别(通勤或非通勤)的出行人的一卡通卡号,利用一卡通编号字段实现调查数据与刷卡数据的关联匹配.
以海量公交刷卡数据为基础,结合问卷调查中采集到的已知出行类别和公交卡号的出行者的出行信息建立SVM分类器,该分类器可针对有限的样本情况,其目标是得到现有信息下的全局最优解[11-12].由于从问卷调查中获得的用于进行训练的样本数有限,与SVM分类器尤其适用于有限样本的特点相匹配,因此选用SVM分类器作为进行通勤出行者判别的核心方法.
3.1 特征值的选取
为了将通勤与非通勤出行者的刷卡数据进行鉴别与分类,从刷卡记录的众多数据项中选取特征值,用以判断该用户是否为通勤出行者.
公共交通的通勤出行主要有以下特点:①通勤出行往返性;②出行时间规律性;③模式选择固定性;④线路选择多样性.前期现场调查的结果显示,公共交通通勤与非通勤出行人群在出行时间方面差异显著;且通勤出行者的出行在空间特征方面相对稳定,非通勤出行者的出行起讫点相对变化较大.因此,可以将上、下车刷卡时间、上、下车线路、站点均可作为通勤出行人群鉴别的特征值.
对原始公交刷卡数据进行数据特征提取,将每位出行者一天内可能刷卡的时段定为早上5:00至晚上23:00(该时段内包含绝大部分公交车和地铁的运营时段).为使不同样本有统一的格式和元素对应关系,因此将每天公交运营的18 h,以0.5 h为间隔划分,每个单元分别记录持卡人的刷卡信息(起始线路、起始站点、终止线路和终止站点),若单元内没有刷卡记录,则各向量值全部置为0.
经过数据核对,30 min的最小时间段划分可满足出行者的刷卡数据记录需求,少部分出行者(约3%)在0.5 h内有多次刷卡,此处保证同一条出行链的起始和终止站点数据不会丢失,中间数据则可能有部分缺失.此类数据的丢失对数据结构规律的影响较小,基本不影响对于通勤出行者的鉴别判断.
刷卡时段的划分可以用于确定刷卡时间,因此将上、下车刷卡时间从6个基本的特征值中剔除,以进一步降低数据维度,提升分类器效率.最终确定的特征值为:上车线路、上车站点、下车线路、下车站点.
3.2 训练集和测试集的建立
在数据库中筛选出与已知出行类别的出行者公交卡卡号相匹配的出行人连续5个工作日的所有刷卡信息,经过数据特征提取,建立训练集和测试集.该集合共包括978位已知是否为公共交通通勤出行者的出行人在连续5个工作日的刷卡信息特征值.其中,正样本(即通勤者样本)数量为481;负样本(非通勤者样本)数量为497.将所有公交和地铁线路进行统一编号,全部进行数据值化.则该集合可表示为
T={(x1,y1),…,(x978,y978)},xi∈R720
式中:xi∈R720,是由每位出行者在某一周内5个工作日刷卡所产生的全部特征值;y为该出行者是否为公共交通通勤出行者,1为是,0为否.
3.3 训练方法及结果
训练方法包含数据准备,数据标准化和模型选用三个环节.
1) 将全部978个样本按照7∶3的比例随机选取分为训练集和测试集,即训练集样本数为683,测试集样本数为295.其中,训练集和测试集的正样本与负样本的比例约为1∶1.
2) 选取Z-score标准化方法,步骤为:①求出训练集样本每个属性的平均值,然后所有样本的属性减去对应属性的平均值;②求出训练集样本每个属性的标准差,然后所有样本的属性除以对应属性的标准差.最后对样本刷卡数据进行矩阵化和参数标准化处理.
3) 利用样本数据对适用性较好的几种核函数进行了训练与测试,包括线性核函数、多项式核函数、径向基核函数、傅里叶核函数和Sigmoid核函数,并参考相关文献利用libsvm工具箱中的gridregression.py搜索参数C(惩罚因子)的最优值[13].通过多组的样本数据训练与测试,线性核函数对于公共交通刷卡数据适用性最好,因此,以线性核函数为核函数,参数C为1.0,优化方法采用SMO,建立了SVM分类模型,分类效果见表3.
表3 不同核函数分类结果
使用线性SVM分类模型对测试集进行分类的正确率(94.24%)最高且稳定.分类结果分布见图2.
结果表明,分类结果为正样本分布均匀,并且正负样本集中区有一定的间隔距离.该分类器对于公共交通通勤及非通勤出行人群的分类具有较高的精度.利用该分类器对所有出行者样本进行分类表明,在工作日通勤出行者占比约为60%,与以往相关研究结论吻合.
4.1 公共交通不同类型出行者出行特征差异分析
利用分类结果,分析不同出行人群出行特征差异.采用独立样本t检验对通勤与非通勤出行人群的出行距离、时耗的差异进行显著性分析.结果表明,通勤与非通勤出行人群在出行距离方面整体差异不明显(Sig值大于0.05),其中通勤出行距离在10~20 km区间较为集中,均值约为19.1 km.两者出行距离差异主要体现在局部,非通勤出行人群短程(<5 km)出行人数比例明显大于通勤出行人群(见图3).另一方面,两者的出行时耗整体差异显著(Sig值小于0.05),均值分别约为39.84 min(通勤)和34.64 min(非通勤),见图4.在出行距离相近的情况下,可推测其显著差异主要由于出行效率的差别.
图3 公共交通通勤、非通勤出行者出行距离分布
图4 公共交通非通勤、非通勤出行者出行时耗分布
在公交刷卡人数的时间分布方面,研究分析了公共交通通勤出行者及非通勤出行者出行时刻分布特征,见图5.由图5可知,对通勤出行人群而言,每日早07:00-09:00、晚17:00-19:00时段为明显的客流高峰时段,同时,早高峰压力高于晚高峰.通勤出行人群的高峰时段刷卡人次数占全天所有出行人刷卡人次总数的38.34%.与之相比,非通勤出行人群的出行时刻呈现出巨大的差异性,从早05:00起,非通勤出行人数逐渐增加,至早09:00到达较高水平并保持平稳态势至晚19:00,之后非通勤出行人次逐渐减少.以上出行时刻的分布特征与出行者问卷调查的结果基本吻合.
图5 公共交通通勤、非通勤出行者刷卡人次时间分布特征
4.2 公交调价对不同类型出行者整体出行特征影响分析
提取对比2014年12月1—27日(调价前),2015年1月5—31日(调价一周后,评估调价的短期影响特征),2015年12月7日—2016年1月6日(调价一年后,评估调价的长期影响特征)公共交通通勤、非通勤出行者的轨道及公交刷卡次数,每天全市的公共交通刷卡人数约为530万人,经SVM分类器分类后,通勤与非通勤出行人占比分别约为60%和40%.通过分析不同刷卡次数变化幅度的人数分布,与调价前一个月相比,将调价后一个月内出行人的轨道或公交刷卡次数变化比例大于40%作为判断其出行方式发生显著变化的阈值.
1) 通勤出行者 调价的短期影响看,分别有14.90%和25.47%的公共交通通勤出行者,轨道交通和地面公交出行次数显著下降,调价对通勤出行者的公交出行影响更为明显.进一步的个体出行数据分析表明,轨道交通出行次数显著减少的通勤出行者中,约有25.07%的出行人转移到了公交出行.调价的长期影响看,约有34.87%的通勤出行者的地面公交出行次数出现显著下降,而仅有4.15%的通勤出行者轨道交通出行次数出现显著下降,地面公交与轨道的差异性进一步显著.可见,调价对地面公交出行的影响更长远,伴随着轨道交通系统的不断完善,轨道交通出行受调价的影响随时间的推移而逐渐减弱.
2) 非通勤出行者 调价的短期影响看,相对于公共交通通勤出行者,非通勤出行者中轨道交通出行减少的人数比例(21.32%)明显更高,而两者公交出行显著减少的人数比例(通勤25.47%,非通勤26.96%)无明显差别.调价的长期影响看,非通勤出行者中轨道交通出行次数显著下降的人数比例约为9.57%,有所回升但仍明显大于通勤出行者(4.15%),可见尽管调价对轨道交通的影响随时间变化存在减小的趋势,其对于非通勤出行者的影响仍较为明显;非通勤出行者中公交出行次数显著下降人数比例约为37.52%,与通勤出行者的影响基本相当.这一结论与前期调查和客运量的宏观特征分析的结论基本一致.
4.3 公交调价对不同出行距离人群的影响特征
前期分析表明,不同出行距离的公共交通出行者对票价的敏感程度不同,公交出行变化特征也有明显差别,图6为轨道交通不同出行距离刷卡频次下降人数比例分布.
图6 轨道交通不同出行距离刷卡频次下降人数比例分布
调价的短期影响见图6a),在轨道出行中,两类人群均在小于10 km的出行中受调价影响较大,但非通勤出行者刷卡次数下降人数比例(大于30%)明显高于通勤出行者(约20%).同时,出行距离大于40 km时,通勤出行者受调价影响也相对较大;非通勤出行者出行规律性不明显,其受调价影响随出行距离变化的波动性较强.长期影响见图6b),轨道交通出行受调价影响程度明显下降,通勤出行者刷卡次数下降人数比例约下降至4%,且短距离出行者所受影响程度基本与其他距离范围出行者持平;非通勤出行者刷卡次数下降人数也大幅降低,但下降人数比例仍明显高于通勤出行者且短距离出行受调价影响较大.图7为地面公交不同出行距离刷卡频次下降人数比例分布.
图7 地面公交不同出行距离刷卡频次下降人数比例分布
调价的短期影响见图7a),出行距离5 km以内的地面公交通勤出行者公交出行次数下降人数占比较高,5 km以上的公交通勤出行者基本保持较为稳定的下降幅度,其下降人数比例与出行距离之间并没有呈现单调的特征.非通勤出行者的刷卡明显下降人数比例则随出行距离的增加而逐渐降低,从5 km以内出行者的近40%下降到40 km以上出行者的近20%,可见出行距离越短,非通勤出行者受调价影响而改变出行选择的概率越大.出行距离小于20 km时,非通勤出行人群公交出行受调价影响更大;出行距离大于25 km时,结果与之相反.长期影响见图7b),地面公交出行者刷卡下降人数比例维持在高位,且不同出行距离范围、不同出行人群的下降比例相近.
1) 工作日内通勤出行者占比约为60%(分类正确率为94.24%),且通勤出行者在短距离出行占比、出行时耗和刷卡人数时间分布特征等方面均存在较大差别.
2) 短期影响看(调价一周后),通勤出行者中,轨道交通出行次数明显下降的人数比例(14.90%)显著小于地面公交(25.47%),3.73%的通勤出行者存在由轨道交通转向地面公交的明显趋势;而在非通勤出行者中,轨道交通和地面公交出行次数明显下降的人数比例差距不大,分别为21.32%和26.96%,且轨道交通的下降比例显著高于通勤出行者,地面公交的出行次数下降基本持平.调价一年后,其对于地面公交出行的影响明显大于轨道交通.
3) 结合出行距离进行深入分析发现,针对轨道交通,调价的短期影响对两类人群均在出行距离小于10 km时更为明显,且非通勤出行者受影响程度显著高于通勤出行者;但调价一年后,通勤出行者中的短距离出行所受影响与其他出行距离范围基本持平,非通勤出行者中的短距离出行受调价影响仍高于其他出行范围的出行者.
文中进一步明确了公共交通通勤与非通勤出行者受调价影响的差异性,在对现有公共交通线网进行优化时,可通过结合两类出行人群的空间分布特征,合理应用价格手段提供差别化的公共交通服务,并实现公共交通线网布局和多模式衔接的更加科学的优化设计.
[1]周志华,张艳春.广州市公交票价调整对轨道客流的影响[J].城市公共交通,2009(5):31-33.
[2]贺崇明,马小毅.广州市票务政策对轨道交通客运量的影响[J].城市轨道交通研究,2008(8):5-8.
[3]AGARD B. Mining public transport user behaviour from smart card data[C]. Information Control Problems in Manufacturing,2006(2):399-404.
[4]BAGCHI M, WHITE P R. The potential of public transport smart card data[J]. Transport Policy,2005,12(5):464-474.
[5]JANG W. Travel time and transfer analysis using transit smart card data[J]. Transportation Research Record: Journal of the Transportation Research Board,2010(1):142-149.
[6]SEABORN C, ATTANUCCI J, WILSON N H M. Analyzing multimodal public transport journeys in london with smart card fare payment data[J]. Transportation Research Record Journal of the Transportation Research Board,2009(1):55-62.
[7]尹长勇,陈艳艳,陈绍辉.基于聚类分析方法的公交站点客流匹配方法研究[J].交通信息与安全,2010,28(3):21-24.
[8]董晓晶,余志伟,伏伟伟,等.基于GIS的公交IC卡数据处理及分析系统[J].地理空间信息,2009,10(7):124-126.
[9]龙瀛,张宇,崔承印.利用公交刷卡数据分析北京职住关系和通勤出行[J].地理学报,2012,67(10):1339-1352.
[10]王月玥.基于多源数据的公共交通通勤出行特征提取方法研究[D].北京:北京工业大学,2014.
[11]梁燕.SVM分类器的扩展及其应用研究[D].长沙:湖南大学,2008.
[12]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000(1):36-46.
[13]叶志刚.SVM在文本分类中的应用[D].哈尔滨:哈尔滨工程大学,2006.
Impact Analysis of Public Transport Price Adjustment on Travel Choice for Travelers
WENG Jiancheng1)TU Qiang1)LIN Pengfei1)XU Shuo2)
(Beijing Key Laboratory of Traffic Engineering, Beijing University of Technology, Beijing 100124, China)1)(Beijing Transport Management Technical Support Center, Beijing 100073, China)2)
The macro temporal and spatial variation characteristics of public transport passenger flow before and after the price adjustment are analyzed in the study, and a travel choice questionnaire survey for public transport travelers is conducted. The results show that there is a large difference in the influence level and the characteristics of travel mode transfer between the commuters and non-commuters after the fare adjustment. Based on the temporal and spatial feature vectors of smart card data for public transport travelers, a machine learning based classification method is proposed for commuters. Using massive multi-mode public transit smart card data of about 13 million every day in Beijing, accurate classification of commuters and non-commuters is achieved with an accuracy of 94.24%. Using individual travel data in different periods, both the short-term and long-term effects of public transport price adjustment on the travel frequency, public transport travel mode choice of commuters or non-commuters are quantitatively analyzed. For short-term effect, the travel frequencies of public transport commuters who travel by rail and bus significantly decrease by 14.90% and 25.47%, respectively; while 3.73% of commuters transfer from rail to bus. The travel frequencies of non-commuters who travel by rail and bus significantly decrease by 21.32% and 26.96%, respectively. The decreasing rate of rail travel frequency for non-commuters is found to be larger than that of the commuters, while the decreasing rates of bus travel frequency for both commuters and non-commuters are basically equal. For the long term effect, there are only 4.15% of rail transit travelers whose travel frequency by rail still decreases significantly, and there are about 35% of the ground bus travelers whose travel frequency by bus significantly decreases, indicating that the impact of the price adjustment for bus trip is more persistent.
public transport; price adjustment; commuters; machine learning; travel choice
2017-03-03
*国家自然科学基金面上项目(51578028)、交通运输部科技计划项目(2015318221020)资助
U239.5
10.3963/j.issn.2095-3844.2017.03.012
翁剑成(1981—):男,博士,副教授,主要研究领域为智能交通、交通信息