范海雁,姚 佼
(上海理工大学 管理学院 上海 200093)
城市公共交通是城市重要的基础设施,是城市交通结构中的重要组成部分,城市公交在城市客运交通运输中起着重要的作用,各种不同的公交线路构成庞大的公交网络,承担着重要的运输任务。因此一条公交线路运输能力的正常发挥起着至关重要的作用。既要考虑乘客的运输需求,又要考虑企业的运输能力和效益,因此要协调客流和企业之间的关系,确定合理的行车间隔时间。本文定位于行车间隔时间的统计时段研究,从公交客流的实际需求出发,统计客流在不同时段的需求信息,以确定具有特别类似特征的时间段。
目前,公交客流调查[1-2]在数据处理上存在很多问题。传统的方法是按照整点的小时段来统计客流量的,由于一辆公交车辆从始发站到终点站的运行往往要跨越两个不同的小时段,无论按站点统计还是按线路整点小时段的统计都存在着人为硬划分客流的不合理现象;同样,不同路牌的公交车辆可能在同一个站点存在着同时段的客流数据,这在数据处理上存在着人为划分的误差,因此在发车间隔时间上存在着不同时段间的平滑过渡问题需要研究[3]。目前的文献研究均是按整点划分时段的,事实上这并不具有严格意义,如高峰时刻的到来未必从整点时段开始,发车间隔的变化也未必一定从整点开始出现变动。
目前,利用人工作公交客流调查基本采用跟车调查方法,在数据处理时通常按整点时间段划分统计客流数量及断面流量分布情况,公交发车间隔时间优化是不同时段的定间隔控制作业计划方法。是根据客流量数据等相关信息把一天划分为若干个整点时段,不同的整点时段采用不同的发车间隔时间。传统的客流统计方法,是根据整点人工划分时段,线路上不同站点的客流有时要划分到不同的时段内,具有很大的主观性。论文将聚类方法用于公交客流统计时段的自动划分,克服了人工整点划分时段的不合理性,为公交发车间隔优化制定提供新的思路[4-5]。
用于公交发车间隔时间的客流统计信息主要包括:总客流、站点客流、线路客流、断面客流、时段客流、区间客流及客流时空分布变化[6]。国内在公交客流规律研究及发车间隔的确定中,主要以客流峰值为限制,并结合时段区间作为需求数据。公共交通客流基础数据是公交行车计划编制的基础,是确定公交发车间隔时间的基础数据,只有掌握线路上公交客流的出行规律和出行特征,才能对公交线路的运营计划和运营决策科学合理。
实际应用中,基于目标函数的模糊聚类方法受到欢迎,它是把聚类归结为带有约束的非线性规划问题,通过优化求解获得数据集合的模糊划分和聚类。基于目标函数的聚类算法中模糊c均值类型的算法理论最为完善[7-9]。
给定调查客流的数据集X为n个模式的一组有限观测样本集,则xk=(xk1,xk2,…,xks)T是观测客流样本的xk的特征矢量,对应特征空间中的一个点,xkj为特征矢量xk的第j维上的赋值。
用隶属函数μik=μx(xk)表示样本xk与子集Xi(1≤i≤c)的隶属关系,则有μik∈{0,1}。X的c个子集的特征函数值构成矩阵U=[μik]c×n。于是有X的C划分空间:
(1)
利用隶属度函数可以把二值扩展到[0,1]区间,从而X的模糊划分空间为:
(2)
对每个样本与每类原型间的距离用其隶属度平方加权,则类内加权误差平方和目标函数:
。
(3)
上式中,样本xk与第i类的聚类原型P之间的距离为:
(dik)2=‖xk-pi‖A。
(4)
第一步,初始化,给定聚类类别数C,2≤c≤n,n为数据个数,设ε为迭代停止阈值,初始化聚类原型P(0),设置迭代计数器b=0。
(5)
第三步,计算原型模式矩阵P(b+1):
(6)
第四步:判断‖p(b)-p(b+1)‖的值是否小于ε,若小于则算法停止并输出划分矩阵和聚类原型P,否则令b=b+1,执行第二步骤[10]。
本论文数据来源为上海市公交875路公交线,针对本线路早时段的24辆连续发出的公交车辆进行跟车调查,数据采集信息包括线路长度、各站点之间的距离,各站的到站时刻及发出时刻,各站点的上下客流量等。考虑高峰时公交车辆的发车间隔时间,本文以5 min作为数据计数周期,首先定义一个n×p的模糊集x,n为样点数量,p为客流统计中的属性变量,聚类结果见表1和表2。
表1 客流时段划分的聚类结果
表2 聚类成员
从表1中可以看出,在早晨时段,公交客流与小汽车交通流有明显的不同,其突显高峰时段仅呈现在6∶30~7∶00时段,而从7∶00~8∶20呈现持续长时间大客流状态,8∶20~9∶20处于平稳状态,6∶00~6∶20的客流状态要高于一般平稳期的客流。表2中的第2列是时间起点,第3列是聚类编号,按相同的编号可以准确看出时间段的相似区间,由此,可以看出,早上公交客流几个基本状态的划分最好以30 min为段来计算发车间隔时间最为适宜,在8∶20~9∶20的平衡客流状态用通常的1 h段划分较适宜。
本论文提出了一种对公交线路发车间隔时间处理时的时间间隔统计阶段划分方法,并运用该方法对上海市875路公交车的早晨时段的客流量进行了聚类分析。结果表明,论文能够精准确定早高峰的具体时段为6∶30~7∶00和7∶00~8∶20时间段,这为时段的划分给出了较为精确的依据,并可以计算时段内的发车频率和发车间隔时间,比传统的整点小时段划分方法结果更确切,可以为实时调度中的发车间隔时间的计算奠定基础。
【参 考 文 献】
[1]范海雁,李秀君.基于公交客流统计信息的公交调度决策方法[J].统计与决策,2007(24):179-180.
[2]魏领军,张 利,魏领红,等.城市公交客流调查数据修正方法研究[J].汽车科技,2009(1):37-39.
[3]Avishai Ceder著.关 伟译.公共交通规划与运营[M].北京:清华大学出版社.2010.
[4]管丽萍,尹湘源,杨亚萍.模糊C均值聚类在交通流高峰期确定中的应用[J].浙江万里学院学报,2008,21(2):6-9.
[5]王春娥.基于C均值聚类算法的交通时段划分方法研究[J].盐城工学院学报,2009,22(4):73-76.
[6]肖华刚.基于客流数据挖掘的公交时刻表编制研究[D].北京:北京交通大学,2010.
[7]叶厚元.统计学原理与分析[M].武汉:武汉理工大学出版社,2012.
[8]王正明.实用统计学[M].成都:电子科技大学出版社,2013.
[9]高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2004.
[10]武 森.高学东,巴斯蒂安.高维稀疏聚类知识发现[M].北京:冶金工业出版社,2003.