郭瑞军,李天琦,唐博林
(1.大连交通大学 交通运输工程学院,辽宁 大连 116028; 2.北京工业大学 城市交通学院,北京 100124)
近年来,我国城市轨道交通发展迅猛,越来越多的城市居民选择乘坐公共交通出行,交通拥堵问题得到有效缓解.根据中国城市轨道交通协会发布的《2020年中国内地城轨交通线路概况》,截至2020年底,中国内地累计有45个城市开通城轨交通运营线路7 978.19 km;按照系统制式来看,地铁运营里程达到6 302.79 km,占比79%.城市轨道交通的发展让人们的出行更加便利,同时也减少了环境污染.
地铁乘客的出行次数、出行时间、出行距离、换乘情况等特征指标,是掌握居民地铁出行需求、评价地铁服务水平的重要依据[1-2].由于地铁IC卡数据的信息比较全面,相比于人工调查具有明显优势,通过IC卡数据可有效分析城市地铁的客流特性.国内外学者关于地铁IC卡数据分析有较多的研究,于紫娟[3]研究了深圳地铁客流特征,重点提取地铁客流时空分布特征以及用户出行特征,研究客流变化规律;刘剑锋等[5]研究轨道交通网络化客流特征,得到了交通网络化运营规律;杨万波等[6]利用公交IC卡数据,研究居民公交出行规律,进而推算出公交出行交通小区OD矩阵,通过佛山市中心城区验证了该算法,得出了公交出行OD矩阵精度较高的结论;郭娟等[10]对城市轨道交通需求预测方法进行了研究;赵婉娟[11]等使用从深圳地铁系统收集的大量数据来验证其概率模型;Martin Trepanier[12]等对交通智能卡自动收费系统中的个人出行目的地进行估计;Catherine Morency[13]等对连续旅行期间收集的数据进行处理,讨论了使用面向对象方法组织数据的方法以及分析旅客出行行为.
本文采用杭州市地铁2019年1月2日到2019年1月25日共24天的地铁刷卡数据,数据字段包括进出站时间,线路ID,站点ID,进出站状态和支付类型等.研究内容包括各车站OD表,分时段分站点上下车人数,上午和下午的高峰小时断面客流量,各条线路的客流量,换乘人数和换乘比例等.
对客流的动态调查与分析,一般都需要积累比较长期的资料来进行分析[7],通过对城市地铁IC卡数据进行整合,分析各线路站点及刷卡时间等,由数据间关系统计得出断面客流量、客运量、高峰小时客流量、OD交通量、关键OD点对和换乘系数等.这些客流特性指标的概念如下:
(1)断面客流量:在单位时间内,沿同一方向通过轨道交通线路某断面的乘客数量;
(2)客运量:在一定时间内,轨道交通实际运送的乘客数量;
(3)高峰小时客流量:一天中列车在单位时间(h)内某方向运送的最大客流量;
(4)地铁OD交通量:单位时间内起终点间的交通出行量;
(5)关键OD点对:整个地铁网络站点OD矩阵中交通量较大、交通影响显著的OD对,在整个地铁网络中起主导作用;
(6)换乘系数:乘坐地铁出行总人次加总换乘人次与乘坐地铁出行总人次的比值;
(7)换乘率:换乘的乘客人数占乘客总人数的比值.
目前客流调查方法主要包括问询法、观测法、填表法、凭证法和计票法等[2].客流量是随着时间变动在各个方向和各个断面上不断变化的,通过对杭州地铁的客流量进行调查分析,为地铁运行控制方案的确定提供理论依据.
杭州地铁首条线路于2012年11月底正式开通,是浙江省首个开通地铁的城市.截至2019年初,杭州地铁共运营3条线路,1 号线、2号线和4号线,共80个站点,5个换乘站,运营线路总里程118 km,日客运量逾120万人次.杭州地铁枢纽站主要集中在火车站以及商圈附近,如客运中心、火车东站、近江、钱江路等,地铁线路图如图1呈现出由中心向外延伸的形状.
图1 杭州地铁线路图
杭州地铁IC卡数据字段包括进出站时间、线路ID、各站点ID、刷卡设备号ID、用户ID、进出站状态和支付类型等[8].杭州城市轨道交通自动售检票(Automatic Fare Collection,简称AFC)数据结构表如表1所示,进出站状态中数字1代表乘客进站,0代表乘客出站;支付类型中数字1代表长期IC卡支付,数字2代表临时IC卡支付,数字3代表APP支付.原始信息来源于地铁AFC售检票系统,可以准确采集到乘客的进站和出站信息[4].
表1 杭州AFC数据表结构
对数据库系统利用SQL查询语句得到各个站点的客流量,将每条线路的各个车站的客流量求和得到各条线路的客流量表,如表2所示.
表2 各线路车站客流量 人/天
将其各条线客流量画成折线图,如图2所示,可以很清楚地看到各条线路的客流情况,并得出以下结论:
(1)1号线平均日客流最多,达到637 905人次,2号线日客流其次,平均日客流为367 360人次,4号线日客流最少,平均日客流为126 367人次.由于1号线经过枢纽站和换乘站,而且地铁站数量较多,其承担了地铁日客流量的一半以上,相对2、4号线较为拥挤.
(2)三条线路的工作日的客流量无明显波动,基本维持在相对固定的区间内;周末的客流量相对于工作日有较明显减少,这是由于上班族大多数选择在家休息,出行需求减少,所以出行量相对减少;而工作日的最后一天(星期五),客流量有一个明显的增长趋势,人们的出行需求增加,比如外出休闲、社交、购物等等.
(3)根据不同线路间的客流量不同,以及在工作日和非工作日的客流变化规律,地铁公司可采取不同的列车运行方案,比如调整列车运行间隔时间、加开列车、安排站务计划、遇到突发情况能否快速启动紧急预案疏散客流等等.
图2 月线路客流量折线图
对于第i站到第i+1站的高峰小时断面客流量Pi,i+1的计算公式如下:
Pi,i+1=Pi+PSi,i+1-PXi,i+1
(1)
其中:Pi-1,i为从第i-1站到第i站的高峰小时断面客流量;PSi,i+1是第i站上车客流;PXi,i+1为第i站的下客流量.
将前一站的断面客流量减去本站下车的客流量再加上本站上车客流量,就得到了断面客流量.
通过SQL server语句对各个车站之间的断面客流量进行统计分析,语句如下:
select count(*)
from record20190104 a join record20190104 b
on a.userID=b.userID
where
a.status=′1′ and b.status=′0′and b.time>a.time and DATEDIFF(minute,a.time,b.time)<100
and a.stationID=′1′ and b.stationID=′2′ and a.time
between ′2019-01-04 17∶00∶00′ and ′2019-01-04 18∶59∶59′
在本次调查中,对于每一天的地铁数据记录都在同一个表格中,例如record20190104,即为2019年1月4日的地铁数据记录.在进行多表查询时,需要表与表自身进行连接,由于表名相同,为加以区分对两个表赋予不同的关系表名,例如record20190104a,record20190104b,即为2019年1月4日的地铁数据表的关系表名分别为a、b.在后续语句中使用不同表的同名属性时使用“关系表名.属性名”的形式加以区分,例如,a.userID=b.userID,即为令赋予关系表名后的,表a与表b的乘客ID号码相同.
使用excel进行数据计算,如表3列出了1月2日1号线上、下午部分断面客流量数据.
表3 1号线上、下午高峰小时断面客流量表 人/小时
以工作日2019年1月2日的数据为例进行分析,得到以下结论:
(1)1号线高峰小时断面客流量明显大于2号线和4号线,有11个站点间断面客流量达到10 000人次,1号线上午高峰时刻婺江路客流量最大,达到13 779人次;1号线下午高峰时刻西湖文化广场站的断面客流量最大,达到25 677人次.
(2)上午的下行平均断面客流量大于上行平均断面客流量,而下午则上行平均断面客流量大于下行平均断面客流量,客流的流向有着明显的潮汐特性,反映了杭州地铁1号线的出行人主要为工作人群.
综上可知,火车站,客车站等长途车站或商业工区前后站之间的断面客流量最大.始发站,换乘站和终点站通常上车人数或下车人数最多,一些特殊站也会造成客流量的突然变化,比如大学,医院等等.因此需要在断面客流量多时及上下车人数多的站,需要工作人员指导行人,且配备行车计划.
地铁换乘是指一个或多个铁路车站,供乘客在不同路线之间,在不离开车站付费区及不另行购买车票的情况下,进行跨线乘坐列车的行为.
由以上定义可知乘客在乘坐地铁发生换乘行为时,上车和下车的车站所属的线路就会发生变化,所以添加lineID不相同的控制条件,将同一位乘客的换乘行为条件筛选出来.由于筛选出的数据没有时间约束,为保证数据符合乘客先上车后下车的时间顺序,根据记录中卡机刷卡进出站状态(status),增加乘客进出车站卡机刷卡状态不同控制条件.同时根据记录中刷卡时间(time),将每一次的换乘数据进行时间排序.由于乘客可能在一天短时间内,发生多次不同或者相同的换乘,所以根据杭州地铁的实际地铁里程以及运行速度,增加控制条件,将完成每一次换乘行为的时间控制在100 min内,最终计算所有符合条件数据总和得出换乘量.
通过SQL server语句对一天之内各个时段的换乘人数进行统计分析,语句如下:
select count(*)
from record20190103 a join record20190103 b
on a.userID=b.userID
where a.lineID<>b.lineID and a.status<>b.status and b.time>a.time and DATEDIFF(minute,a.time,b.time)<100 and a.time between ′2019-01-02 05∶00∶00′ and ′2019-01-02 05∶59∶59′
语句中应用SQL多表查询原理,统计乘客换乘数据的前提是要找出每位乘客一天之内所有的乘坐记录.在每一条乘坐记录中包含乘客的卡号(UserID),它是区别不同乘客的唯一凭证.所以令UserID相同作为多表查询的条件,以此根据UserID将每位乘客的乘坐数据进行分组.在每一条乘坐记录中包含乘客上下车车站所属线路 (lineID).表4为2019年1月2日换乘统计数据.
表4 换乘客流数据 人/小时
经过统计,2019年1月2日的乘客总的乘坐次数为1 146 735,根据公式得出换乘率为35.66%.对换乘数据总体分析发现,无论是工作日还是休息日,换乘量较大时间主要集中在上午的7∶00-9∶00以及下午的5∶00-7∶00这些时间段.
从表5数据中可以看出1月的5、6、12、13日总换乘次数明显少于其他日期,这主要是因为这四天为周末非工作日,乘客的总出行量减少.据此本文可以预测出杭州地铁工作日的日总换乘量为42万,而休息日则减少至35万,在进行列车调度,以及行程安排时对于工作日和休息日可制定两种不同的方案,来适应客流的变化.
表5 总换乘次数数据 人次/天
如图3所示,在地铁运营的一天里,换乘高峰出现在早8∶00-9∶00和晚5∶00-6∶00,这两个时间段是上班和下班高峰期,该图呈现了换乘量的日变化趋势.
图3 分时段换乘量柱状图
通过SQL语句查询出线路与线路之间的换乘量进行统计分析,语句如下:
select count(*)
from record20190103 a join record20190103 b
on a.userID=b.userID
where a.status='1' and b.status='0'and b.time>a.time and DATEDIFF(minute,a.time,b.time)<100
and a.lineID='A' and b.lineID='B'
union all
语句中应用SQL多表查询原理,统计不同线路间的换乘量.令UserID相同作为多表查询的条件,以此根据UserID将每位乘客的乘坐数据进行分组.为保证数据符合乘客先上车后下车的时间顺序,根据记录中卡机刷卡进出站状态(status),增加乘客进出车站卡机刷卡状态不同控制条件.同时根据记录中刷卡时间(time),将每一次的换乘数据进行时间排序;增加控制条件,将完成每一次换乘行为的时间控制在100 min内.因为要查询固定两辆线路间的换乘量,所以对乘客上下车车站所属的线路作固定要求,令线路号为固定值,即给定lineID,最终计算所有符合条件数据总和得出各个线路之间的换乘总量.以上语句为2019年1月3日一天的换乘量,通过修改表名,对每一天的换乘数据进行统计,得出如下各线路间换乘的平均比例.
通过对比分析表6,发现1、2号线换乘比例占到总换乘比例50%以上,换乘量主要集中在1号线和2号线交叉处,也就是在杭州地铁的凤起路站.凤起路站位于杭州市下城区延安路与凤起路交叉口,其中1号线凤起路站位于延安路与凤起路交叉口南侧,延安路机动车道下.2号线凤起路站位于延安路与凤起路交叉口西侧.凤起路站作为1-2号线路的主要换乘站,乘客换乘量巨大,每逢节日假期,客流拥挤、乘客滞留的情况经常发生.凤起路站一直被认为是杭州地铁最为拥挤的地铁站,其主要原因在于杭州著名景点“西湖”所带来的巨大客流.
表6 1月8日总换乘次数数据 人次/天
综上所述,可发现2号线车站比1号线车站规模要小得多,建议对2号线凤起路车站规模进行适当扩建,以配合1号线.并在凤起路延安路口增加两个出入口G、H,同时为1号线在凤起商业街内增加一个出入口C7,这样可以让在此站上下车的乘客快速进出站,减少与换乘客流冲突.同时在客流高峰期增加1号线2号线车次,减少换乘乘客的滞留.
通过SQL sever语句对一个月的各个站点间的客流量进行统计分析,语句如下:
select count(*)
from record20190106 a join record20190106 b
on a.userID=b.userID
where
a.status='1' and b.status='0'and b.time>a.time and DATEDIFF(minute,a.time,b.time)<100
and a.stationID='1' and b.stationID='2'
通过语句查询得到每一天各个站点间的客流量,该语句原理与高峰小时断面客流量语句类似,令UserID相同作为多表查询的条件,保证进出站的状态不同(1代表进站,0代表出站)查询出某一站至其余各站的客流量.因此,以每一个车站作为OD点,即可得到杭州市三条线路80个车站的客流量分布表,如表7所示,篇幅关系,仅列出部分数据.
表7 杭州地铁车站的OD表 人/天
通过对地铁车站OD表的统计分析,可以得到统计期内每日各个车站的总发生量和总吸引量,2019年1月2日杭州地铁总的发生量或吸引量超过3万人次的有四个车站,分别为4江陵站、7城站、9龙翔桥和15火车东站等,且其发生量和吸引量均超过3万人次.其中,火车东站的总发生量为106 042人次,总吸引量为86 221人次,其余车站的指标值均在5万人次以内.
因此,可重点考虑发生吸引量较多地铁车站的交通方式衔接及其优化,包括公交枢纽的设计、共享单车存放地点的划定等,特别是火车东站综合交通枢纽的设计,从而满足不同站点的换乘需求.
将一个月的客流量相加求和找到一个月中客流量最大的十对OD对,称之为关键OD对.关键OD对决定路网交通运行状况起很大作用,是城市公共交通管理协调的主要对象.就城市轨道交通来言,关键OD对是指某个起点的主要流向,在整个地铁网络OD矩阵中交通流量最大、交通需求最大、交通影响最显著的OD对,由表8可获得整个地铁网络的关键OD对.
表8 关键OD点对表
整个地铁网络级关键OD对为火车东站到龙翔桥,达到了83 324人次,前十组流量最大的关键OD对有九组的交通起始点都是火车东站,迅猛发展的城市轨道交通给城市发展带来活力的同时,也因为客运量的激增,为站前人群疏散带来压力.人群以火车东站为中心点,呈放射状分散到杭州市区各地.
通过对典型的工作日和非工作日的居民出行量进行分析,发现客流的出高峰行规律,早高峰集中在早8点至9点,晚高峰集中在17点至18点,闸弄口、火车东站、彭埠、客运中心、临平、丰潭路6个车站的上下车人数在80个车站中人数最多,所以需要在地铁站务计划中考虑增加值班人员,防止人员踩踏事故的发生,让乘客体验更加方便快捷的出行.
通过对地铁客流量,换乘客流和关键OD点对的分析,统计得出相应数据,研究发现:
(1)2019年1月杭州地铁线网日均出行量约120万人次,其中1号线客流量最大,客流量占比能达到50%以上;
(2)地铁换乘站凤起路站、火车东站、彭埠站、客运中心站、近江站、钱江路站等车站作为交通枢纽是杭州地铁线路中乘客最密集、人流量最大的站点,换乘比例达到了36%,1、2号线之间的换乘次数最大,平均每日可达到20万人次;建议地铁运营部门通过调整发车频次,增加运力等手段避免造成客流量大量积压导致交通瘫痪,起到疏散诱导作用;
(3)城市中客流规模较大的地铁车站无论在工作日和非工作日都具有很高的客流水平,比如火车东站、客运中心、临平等,高峰小时客流量可达到4 000人次以上,相关运营管理部门应考虑早晚高峰时段提高运力,加开列车,以缩短列车运行时间间隔.同时加强对这些车站的管理和监控,制定相关紧急预案,防止事故发生;
(4)整个地铁网络级关键OD对为火车东站到龙翔桥,达到了83 324人次,前十组流量最大的关键OD对有九组的交通起始点都是火车东站,人群以火车东站为中心点,呈放射状分散到杭州市区各地;
(5)在换乘量较多的时间段,在地铁的运营组织与管理方面:车站内应该在换乘站设置换乘诱导标志,可以让乘客快速找到相应换乘位置实现换乘.同时对车站内客流进行分流,将上下车客流与换乘客流分流,避免客流交叉.相互可换乘的两条线路的列车,应该做到在规定的时间差内到达换乘站,避免造成拥挤.