郭文 肖为周 秦菲菲
摘要:为了更精确地预测短期站点客流量,动态调整城市轨道交通的日常客流方案,采用支持向量机模型对预测地铁客流量。首先,通过对AFC数据分析,利用上周同期进站量、前一天同期进站量、当日前两个时段进站量以及高峰和非高峰时段参数作为模型的输入变量;然后,构造支持向量机预测模型并运用粒子群算法优化模型(PSO-SVM模型),实现地铁站点客流量预测,并进行不同模型预测误差的比较分析;最后,以苏州地铁数据为例,预测汾湖路地铁站的进站客流量。结果表明,优化模型能够有效改善预测误差,预测结果更为准确,证明PSO-SVM方法能有效用于地铁进站客流量的预测研究,为地铁进站客流量预测提供了新的方法。
关键词:交通运输工程;城市轨道交通;客流预测;支持向量机;进站客流量
中图分类号:U2395文献标志码:Adoi: 10.7535/hbgykj.2019yx01006
GUO Wen, XIAO Weizhou, QIN Feifei. Prediction of subway entry flow based on support vector machine model[J].Hebei Journal of Industrial Science and Technology,2019,36(1):31-35.Prediction of subway entry flow based on support
vector machine model
GUO Wen, XIAO Weizhou, QIN Feifei
(School of Rail Transportation, Soochow University, Suzhou, Jiangsu 215131,China)
Abstract:In order to predict the short-term station passenger flow more accurately and apply it to the daily passenger flow organization of urban rail transit in time, the support vector regression model is used to predict the subway passenger flow. The input variables are the same stopping volume of last week, the same stopping volume of the previous day, the two stopping volume of this day, and the parameters of peak and non-peak periods from the analysis of AFC data. Then the support vector machine prediction model is constructed and the particle swarm optimization model is used to improve the parameters(PSO-SVM model) to predict the subway passenger flow, and the prediction errors of different models are compared. Finally, taking the Suzhou Metro data as an example and the passenger flow of FenHu Road station is predicted. The passenger flow forecast of the subway station is realized. The prediction results show that this method can effectively improve the prediction error and the prediction results are more accurate, proving the PSO-SVM method can be effectively applied to the study of subway passenger flow prediction as a new method for the prediction of subway passenger entry flow.
Keywords:transport engineering; urban rail transit; passenger flow prediction; support vector machine; passenger entry flow
城市軌道交通在缓解城市道路拥堵方面发挥着重要作用,随着城市轨道交通线网规模的扩大,根据客流量变化动态调整运输组织方案,保障地铁安全有效运营尤为重要。进站客流量是客流量预测的重要组成,影响进站设施布置和进站流线组织[1],能够帮助轨道交通运营部门编制车站日常运营组织。
现有预测的方法有很多种,基于数学与统计理论的预测方法主要有时间序列模型、回归预测模型、卡尔曼滤波模型、神经网络模型、非参数回归预测方法、支持向量机模型预测等方法。王莹等[2]利用SARIMA模型对北京地铁进站客流量进行时间序列建模,但没有考虑时间以外的其他信息,而轨道交通是复杂的非线性系统,会受到多种因素的影响。孟品超等[3]运用历史客流相似性特点,通过滑动平均法来预测地铁站点各个时间段的客流量,该方法对历史客流要求较高。客流预测方法通常集中于神经网络模型[4]、非参数回归预测方法[5]、支持向量机模型预测方法[6]。非参数回归预测方法不需要先验知识,但需要足够的历史数据;神经网络模型对初始权值非常敏感,算法稳定性差。而支持向量机模型预测方法能够较好地解决“局部极小点”、“非线性和维数灾难”、“小样本”等问题,但大多应用在故障检测以及道路交通方面。王惟等[7]利用小生境粒子群算法优化支持向量机模型来预测道路交通流。邓浒楠等[8]根据短期公交客流具有非线性、随机性和复杂性的特点,以及支持向量机单核核函数存在自适应能力较弱的问题,提出了一种基于多核最小二乘支持向量机的公交客流预测方法,兼顾交通状态的规律性和时变性特征。刘润莉[9]运用蚁群算法改善支持向量机模型预测地铁进站日客流量,但预测效果不佳。赵钰棠等[10]通过构造支持向量机模型预测地铁进站小时客流量,但预测因子的选择比较单一。
第1期郭文,等:基于支持向量机模型的地铁进站客流量预测 河北工业科技第36卷笔者在自动售检票系统提供的乘客刷卡数据的基础上,采用支持向量机模型,考虑到地铁客流的特性,结合支持向量机模型工具箱对客流数据进行学习训练,运用粒子群优化算法进行参数寻优确定预测模型,并通过预测数据与原始数据对比来验证预测的有效性。
1预测模型原理
1.1支持向量机算法
支持向量机(SVM)是建立在VC维和结构化经验风险最小化原理的基础上的一个凸二次优化问题,可以在模型的复杂性和学习能力之间寻求最佳折中,可以较好地解决“小样本”、“非线性和维数灾难”等问题,具有良好的推广性[11]。
对于给定的样本集{(xi,yi)|i=1,2,…,k},(其中xi为输入值,yi为输出值),假设其服从于未知函数y=f(x)。首先用函数g(x)=(w·x)+b对样本数据集拟合,并使得函数f和函数g之间的距离最小,即损失函数R(f,g)=∫L(f,g)dx。根据结构风险最小化原则,非线性支持向量可以求解为
min[12‖w‖2+C∑ki=1(ξi+ξ*i)],yi-(w·x)-b≤ε+ξi,(w·x)+b-yi≤ε+ξ*i,ξi,ξ*i≥0,(1)
其中:ε>0,为拟合精度;ξi为目标之上超出ε部分所设;ξ*i为目标之下超出ε部分所设;常数C>0代表惩罚系数;w,b为特征空间的分类器;利用Lagrange优化方法将上述问题转化为对偶问题:
max[-12∑ki,j=1(ai-a*i)(aj-a*j)(xi·xj)-ε∑ki=1(ai+a*i)+∑ki=1yi(a*i-ai)],∑ki=1(ai-a*i)=0,ai,a*i∈[0,C],(2)
其中ai与a*i为Lagrange因子。
通过核函数K(xi,xj)将其转换为高维空间,此时求解得到回归函数:
f(x)=(w·x)+b=
∑ki=1(a*i-ai)K(xi·xj)+b*。(3)
核函数K(xi,xj)的选取在支持向量机运用计算中十分重要。常用的核函数有多项式核函数,径向基核函数以及Sigmoid核函数。采用Gauss径向基函数,式(4)作为核函数:
K(x,x′)=exp(-‖x-x′‖2/σ2)。(4)
在运用支持向量机模型建模中,参数的选取对模型精度和推广能力有着直接影响,进而影响模型的预测性能。总希望能够找到最佳的参数组合。现有的参数选取确定方式有交叉确定法、经验法等传统方法以及粒子群算法、遗传算法等智能算法。交叉确定法是将样本数据划分为K组,任意抽取K-1组样本作为训练集并将训练结果用于剩余样本的验证,经过多次训练和验证,直到所有样本皆作为验证样本,计算成本偏高,樣本需求大,在实际操作中存在困难。而经验法则需要根据参数与样本间的先验公式来确定,需反复实验。经典的遗传算法进行参数寻优时易得到局部最优解,而粒子群算法通过不断调整自身最优和种群最优的关系能够很好地避免陷入局部最优解问题,寻得参数最佳组合,因而本文选取粒子群算法来进行参数寻优[12]。
1.2粒子群算法
粒子群算法(PSO)[13]是通过模拟鸟群的觅食行为从而求解优化问题。首先,在解空间内随机初始化鸟群,鸟群内的每一只鸟称为“粒子”,这些“粒子”在全部解空间内以某种规律移动,经过若干次迭代后找到最优解。在每一次迭代中、粒子通过跟踪2个“极值”来更新自己。
在目标搜索空间中,有一个n个粒子组成的粒子群,每个粒子包含了2个D维的向量,位置向量xi=(xi1,xi2,…,xiD)以及速度向量vi=(vi1,vi2,…, viD)。粒子群中存在适应度函数以衡量粒子在整个解空间的好坏。因此在整个粒子群进行解空间搜索时会有2个最优极值,一个是粒子本身的最优解pi=(pi1,pi2,…, piD),另一个极值是整个微粒子群目前找到的最优解pg=(pg1,pg2,…,pgD),找到这2个极值后,不断比较粒子的适应值与自身最优解与种群最优解之间的关系,从而每个粒子依据式(5)和式(6)不断更新自己的飞行速度和位置。
vt+1id=vtid+c1r1(ptid-xtid)+
c2r2(ptgd-xtid),(5)
xt+1id=xtid+vt+1id,(6)
其中:d=1,2,…,D;i=1,2,…,n;n为种群规模;t为当前进化代数;c1与c2代表加速常数;r1与r2代表分布于[0,1]的随机数。
1.3算法改进
笔者运用PSO算法对SVM模型进行参数寻优,即该改进的支持向量机模型(PSO-SVM模型)更贴切真实的样本数据,从而进行站点短期客流量预测[14-15]。算法流程如图1所示,具体步骤如下。
Step1:确定样本数据的输入及样本数据输出。
Step2:对样本数据进行预处理,选择合适的核函数,构造支持向量机模型。
Step3:运用PSO算法参数寻优,以样本精度为适应度值,不断更新粒子条件直至满足终止条件,结束寻优。
Step4:参数调优后确定回归模型,完成预测并对结果进行分析。
2实例验证
2.1输入特征选取
选择不同的数据输入特征,能够影响支持向量机模型的精度和效率。运用同一模型对不同数据集合进行训练并得到相关拟合参数,然后对实际客流进行拟合和预测的结果通常会有较大区别,因此数据输入特征的选取至关重要[16]。
轨道交通客流具有周期性,客流波动具有一定规律性,因而对客流数据分析,将上周同一时期客流作为数据输入,随着历史客流量距离预测日越近,历史客流对预测日的客流量影响程度也越大,采取前一天同一时期客流量作为数据输入,考虑预测时段前n个时刻客流量数据,同时数据输入亦要考虑客流的外在影响因素,如节假日,突发活动等,所以采取预测时段上周同期历史数据、前一天同期数据、前两个时段数据以及高峰与非高峰时段参数作为数据输入。
2.2数据预处理
笔者以苏州地铁汾湖路站2017年5月8日—5月21日,每天6:00—24:00以1 h为单位的进站客流作为客流数据。
对样本数据进行归一化处理,如式(7)所示。
y=x-xminxmax-xmin,(7)
其中,x,y∈Rn,归一化后的效果是原始数据整合到[0,1]范围内,笔者使用Matlab中的Mapmaxmin函數进行归一化处理。将样本数据进行归一化后使用模型进行训练和预测,在利用反归一化得到预测值。
2.3模型构造
根据站点客流特点区分工作日与非工作日,以5月8日—5月17日工作日客流数据为训练样本,5月18日站点进站数据为测试样本。
将样本输入作为训练集中的x变量,模型中有5个变量。站点客流量作为因变量,即y变量。在粒子群算法中c1取1.5,c2取1.7,初始种群数取20。通过随机产生种群与速度,寻找极值与极值点后计算平均适应度,不断迭代更新速度和种群,得到最终结果。c取13.11,σ取1.09,均方误差MSE取0.006,将得到的参数结果运用到支持向量机模型来预测地铁进站客流量。
2.4预测结果对比分析
采用平均相对误差(RME)对算法误差进行评价,平均相对误差计算公式如下。
RME=1n∑ni=1|yi-y*i|yi×100%,(8)
其中:yi为客流实际值;y*i为客流预测值;n为采样数据量。
使用模型对汾湖路地铁站5月18日进站客流量进行预测,结果如表1所示。
通过PSO-SVM模型预测汾湖路地铁站进站客流量,最小误差为0.16%,最大误差为22.65%,平均相对误差为11.69%,考虑到轨道交通客流会受到诸多因素影响,预测结果在一定程度上是可以接受的。
为了更好地体现PSO-SVM模型的性能,笔者使用传统支持向量机模型(SVM模型)以及利用遗传算法改进支持向量机模型(GA-SVM)预测汾湖路地铁站5月18号进站客流量,从而与PSO-SVM模型预测结果进行比较分析。3种方法数据处理相同,训练集和测试集样本划分一致,然而对支持向量机参数寻优的方法不同。GA-SVM利用遗传算法、SVM使用交叉验证的方法。表2是3种方法预测结果误差,图2表示3种方法在不同时间段的预测客流相对误差值。图2中横坐标表示5月18日6:00—24:00的18个时间段,纵坐标表示相对误差。
对比可知,使用SVM模型预测结果平均相对误差为18.21%,主要为序号17和18,即22:00—24:00时段的预测误差较大,在22:00—24:00时段客流进站量较其他时段少,SVM模型对该时段预测拟合较差。使用GA-SVM模型主要为序号14和16,即在19:00—22:00时段的预测误差较大,最大误差为4415%,是因为在参数寻优时GA算法易发生收敛早熟,从而影响了整体的预测效果。
笔者提出改进支持向量机模型预测方法,即PSO-SVM模型方法能有效地改善地铁进站客流量预测误差,预测精度更高,将该方法预测地铁进站客流量是可行的。
3结论
考虑到地铁的客流特性,运用支持向量机模型,结合SVM工具箱对客流数据进行学习训练,运用粒子群优化算法进行参数寻优从而改进支持向量机模型,并通过预测数据与原始数据对比验证了预测的有效性。结果表明,该模型(PSO-SVM)较传统的SVM模型、GA-SVM模型的客流量预测结果具有更好的预测效果,可用于地铁进站客流量的预测研究。本文的训练数据仅为两周的日常进站数据,随着支持向量机理论的不断发展,今后也可从模型组合方面对本课题进行更为深入的研究。若采集更为丰富的进站客流数据,还可进一步改善模型预测误差,提高预测精度。
参考文献/References:
[1]邵星杰,张宁,邱华瑞.城市轨道交通客流时空演变规律建模研究[J].都市快轨交通,2015,28(2):65-69.
SHAO Xingjie, ZHAN Ning, QIU Huarui. Modeling research on spatial and temporal evolution of passenger flows of urban rail transit[J].Urban Rapid Rail Transit,2015,28(2):65-69.
[2]王莹,韩宝明,张琦,等.基于SARIMA模型的北京地铁进站客流量预测[J].交通运输系统工程与信息,2015,15(6): 205-211.
WANG Ying,HAN Baoming,ZHANG Qi,et al. Forecasting of entering passenger flow volume in Beijing subway based on SARIMA model [J].Journal of Transportation Systems Engineering and Information Technology, 2015,15(6):205-211.
[3]孟品超,李学源,贾洪飞,等.基于滑动平均法的轨道交通短时客流实时预测[J].吉林大学学报(工学版),2018,48(2): 448-453.
MENG Pinchao,LI Xueyuan,JIA Hongfei,et al. Short-time rail transit passenger flow real-time prediction based on moving average[J].Journal of Jilin University(Engineering and Technology Edition),2018,48(2):448-453.
[4]李春晓,李海鹰,蒋熙,等.基于广义动态模糊神经网络的短时车站进站客流量预测[J].都市快轨交通,2015,28(4):57-61.
LI Chunxiao, LI Haiying, JIANG Xi, et al. Short-term entrance passenger flow forecast at urban rail transit station based on generalized dynamic fuzzy neural networks[J]. Urban Rapid Rail Transit, 2015, 28(4):57-61.
[5]樊娜,趙祥模,戴明,等.短时交通流预测模型[J].交通运输工程学报,2012,12(4):114-119.
FAN Na, ZHAO Xiangmo, DAI Ming, et al. Short-time traffic flow prediction model[J].Journal of Traffic and Transportation Engineering,2012,12(4):114-119.
[6]姚智胜,邵春福,熊志华.基于小波包和最小二乘支持向量机的短时交通流组合预测方法研究[J].中国管理科学, 2007,15(1):64-68.
YAO Zhisheng,SHAO Chunfu,XIONG Zhihua. Research on short-term traffic flow combined forecasting based on wavelet package and least square support vector machines [J]. Chinese Journal of Management Science, 2007,15(1): 64-68.
[7]王惟,李志鹏.粒子群优化支持向量机的交通量预测方法[J].山西大同大学学报(自然科学版), 2015,31(2):25-28.
WANG Wei,LI Zhipeng. Traffic prediction method based on particle swarm optimized support vector machine[J]. Journal of Shanxi Datong University (Natural Science), 2015,31(2):25-28.
[8]邓浒楠,朱信山,张琼,等.基于多核最小二乘支持向量机的短期公交客流预测[J].交通运输工程与信息学报,2012,10(2):84-131.
DENG Hunan,ZHU Xinshan,ZHANG Qiong,et al. Prediction of short-term pubic transportation flow based on multiple-kernel least square support vector machine[J]. Journal of Transportation Engineering and Information, 2012,10(2):84-88.
[9]刘润莉.地铁运营客流量计算模型研究[D].成都:电子科技大学,2012.
LIU Runli. Research on Calculation Model of Passenger Flow in Subway Operation [D].Chengdu: University of Electronic Science and Technology of China,2012.
[10]赵钰棠,杨信丰,杨柯.基于支持向量机的地铁客流量预测[J].都市快轨交通, 2014,27(3):35-38.
ZHAO Yutang,YANG Xinfeng,YANG Ke.Subway traffic prediction based on support vector machine [J].Urban Rapid Rail Transit,2014,27(3):35-38.
[11]顾嘉运,刘晋飞,陈明.基于SVM的大样本数据回归预测改进算法[J].计算机工程,2014,40(1):161-166.
GU Jiayun, LIU Jinfei, CHEN Ming. A modified regression prediction algorithm of large sample data based on SVM[J].Computer Engineering,2014,40(1):161-166.
[12]王夏秋.城市轨道交通线路短期客流预测研究[D].南京:东南大学,2017.
WANG Xiaqiu. Research on Short-time Passenger Flow Forecast of Urban Rail Transit Line[D].Nanjing: Southeast University,2017.
[13]张丽平.粒子群优化算法的理论与实践[D].杭州:浙江大学,2005.
ZHANG Liping.The Theorem and Practice Upon the Particle Swarm Optimization Algorithm[D].Hangzhou: Zhejiang University,2005.
[14]张庆,刘丙杰.基于PSO和分组训练的SVM参数快速优化方法[J].科学技术与工程,2008,8(16):4613-4616.
ZHANG Qing, LIU Bingjie. Fast optimization method for parameter of SVM based on PSO and divided training[J]. Science Technology and Engineering, 2008, 8(16):4613-4616.
[15]李得伟,颜艺星,曾险峰.城市轨道交通进站客流量短时组合预测模型[J].都市快轨交通,2017,30(1):54-59.
LI Dewei,YAN Yixing,ZENG Xianfeng. Combined short-term prediction model of station entry flow in urban rail transit[J].Urban Rapid Rail Transit,2017,30(1):54-59.
[16]张晚笛,陈峰,王子甲,等.基于多时间粒度的地铁出行规律相似性度量[J].铁道学报,2018,40(4):9-17.
ZHANG Wandi, CHEN Feng, WANG Zijia,et al.Similarity measurement of metro travel rules based on multi-time granularties[J].Journal of The China Railway Society, 2018, 40(4):9-17.第36卷第1期河北工业科技Vol.36,No.1