陶若冰,金珈辉,谭金练,张家豪,刘佳妮
(西南交通大学 电气工程学院,四川 成都 610031)
客流需求进行预测,以提高预测精度[7]。我国目前已经成为世界上高速铁路里程最长的国家,动车组在铁路旅客运输中发挥着越来越重要的作用。但是,由于地域经济发展不平衡和人口密度差异性,高速铁路在不同线路不同席别客流需求存在较大差异性。例如,兰新高速铁路(兰州西—乌鲁木齐)客流量少,上座率难以保证,单位运量成本较大[1-2];而京沪高速铁路(北京南—上海虹桥)、京津城际铁路(北京南—天津)等发达区域的高速铁路,客流需求快速增长,上座率高,存在运能与运量不适应的矛盾,不同席别客流分配灵活性问题突出。对短期客流做出准确预测,可以提高不同席别客流与动车组编组之间的匹配程度,尽可能做到按需按流配车,最大限度地满足运输市场需求,降低高速列车线路使用费用,减少单位运营成本,实现经济和社会效益最大化[3]。
目前高速铁路客流预测,针对不同席别的客流短期预测研究较少。高速铁路客流预测模型主要有时间序列模型、神经网络模型、回归分析模型等。李丽辉等[4]提出利用随机森林回归算法构建客流预测模型。吕晓艳等[5]提出基于历史与预售的时间序列预测方法对铁路中客流总量进行预测分析,但回归分析法和时间序列模型都是基于数理统计学原理进行预测的,预测精度有待提高。Fabio[6]以米兰7号轻轨为研究对象,采用人工神经网络模型对其客流进行预测,人工神经网络模型预测精度较高,但属于黑箱模型,难以分析影响客流的主要因素,而且还没有针对高速铁路对不同席别的客流进行分类分析及预测。为此,通过分析不同高速铁路线路,将影响客流数据的因素按类型分为基础因素和随机因素,利用基础因素和随机因素的基本数据,采用熵值法和变异系数法计算出影响系数,再将BP神经网络预测结果与影响系数结合,对不同席别客流数据进行分类,对短期不同席别
由于动车组所在线路的不同,影响可变编组动车组客流的因素很多,可以分为基础因素和随机因素,可变编组动车组短期客流影响因素如图1所示[4]。其中,基础因素对短期预测影响波动相对较小,如经济因素、人口特征等,是客流预测必不可少的影响因素;随机因素对短期预测影响波动相对较大,如天气因素、行车安排、主观因素等,这类影响因素对客流预测十分重要。
图1 可变编组动车组短期客流影响因素Fig.1 Factors affecting short-term passenger flow in variable combination EMUs
1.1.1 熵值法
熵值法[8]是根据各项数据值的熵变程度来确定指标权重的,这是一种客观赋权法,避免了主观因素带来的偏差,因此采用熵值法作为影响系数阶跃计算模型。在高速铁路短期客流预测中,根据各项数据值所提供的信息大小来确定指标熵权,一级指标下的二级指标数为a,二级指标的具体取值数为b。
(1)归一化处理。为平衡各个输入指标数据的影响,需将原始数据进行归一化处理,去除量纲影响。
式中:Mkl为第l项二级指标的第k项具体数据;为Mkl归一化处理后的无量纲数值;l取值范围为(1,a);k取值范围为(1,b)。
(2)确定影响系数模型。针对二级指标下归一处理后的数据向量= ()1×b,指标值的差距越大,则该指标在综合评价中所起的作用越大。在计算不同指标权重系数过程中,对二级到一级的指标权重的选取采用熵值法,步骤如下。
计算第l项二级指标第k个数值的阶跃比重Pkl为
计算第l项二级指标第k个数值的熵值ek为
计算第l项二级指标第k个数值的熵权hk为
1.1.2 变异系数法
为了消除各项一级指标的差异影响,需要用各项指标的变异系数来衡量各项指标取值的差异程度。故对于一级到目标级指标,应采用变异系数法,使影响系数结果更加科学合理。第l项二级指标的变异系数Gl为
计算第x项一级指标的具体量化数值Vx为
式中:σl为第l项二级指标的标准差;为第l项二级指标的平均数。
各项二级指标的权重Sl为
由此可计算出高速铁路客流影响系数具体量化数值F为
第x项一级指标的权重Lx为
最终生成熵值法和变异系数法相结合的可变编组动车组客流的影响系数模型。
分析高速铁路历史客流数据,发现在不同时期客流变化不同。除了客流变化的不同,不同席别客流变化具有明显的非线性[9]。为了得到科学合理的预测结果,建立的不同席别客流预测模型需要有较强的针对性和较高的精确度[10]。因此,将不同席别的客流数据进行分组,并依据不同时期的客流规律进行再分组。选用BP神经网络模型作为不同席别短期客流主预测模型, BP网络结构如图2所示。
图2 BP网络结构Fig.2 BP network structure
由于需要预测的客流数据对于数据结果要求较为泛化,因而仅选取一层中间隐含层[11]。BP神经网络学习训练过程基本步骤如下。
步骤1:信息的正向传输。正向传播时,传播方向为输入层—中间层—输出层,每层神经元的状态只影响下一层神经元。
步骤2:修正的反向传播。如果在输出层得不到期望的输出,则转向误差信号的反向传播流程。
步骤3:循环记忆训练。通过步骤1和2的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到合理范围内,从而完成信息提取和记忆过程。
步骤4:学习结果判别。由中断条件判断训练是否结束,若没有结束,则返回步骤 2。
通过熵值法、变异系数法得到影响系数,再将影响系数与BP神经网络预测结果结合得到最终的预测结果。可变编组动车组不同席别客流预测流程如图3所示。
图3 可变编组动车组不同席别客流预测流程Fig.3 Flow chart of different passenger flow prediction for variable combination EMUs
铁路客流预测是基于某一时间段的运输客流量,根据预测周期长度可以将其分为中长期预测和短期预测。一般将1 ~ 3年的时间跨度称为中长期预测,而1年以下的时间跨度称为短期预测。传统意义上的铁路客流预测,一般选取沿线铁路横断面客流量,在时间跨度上较大。针对目前铁路运输客运量短期预测方法的不足,采用BP神经网络与熵值法和变异系数法相结合的方法,对铁路客流量进行短期预测。
首先根据熵值法求出一级指标具体量化数值,由于影响系数需要以天为单位进行计算,因而时间点的选取以6 h为一个周期。根据公式(2)可以计算出二级指标的阶跃比重Pkl,随后根据公式(3)计算出二级指标的熵值ek,最后根据公式(4)计算出二级指标的最终熵权hk,根据公式(5)得到熵值法对于一级指标的具体量化数值Vx。由已知数据利用公式(6)可计算出二级指标的变异系数Gl,随之根据公式(7)计算出二级指标的权重Sl,由此通过公式(8)计算出一级指标的权重Lx。部分计算结果如表1所示。
表1 2017年11月3日部分计算结果Tab.1 Partial calculation results on November 3, 2017
最后根据公式(9)可以计算出2017年10—12月高速铁路不同席别客流影响系数如图4所示。
普通动车组一般由商务编组、餐车编组,以及一等座和二等座软座编组组成,部分特殊编组添加卧铺编组,极少部分具有高级卧铺编组。一般以餐车为分界线,餐车的两端分别是商务编组和软座编组。选取京沪高速铁路某16辆编组车次(商务编组和软座编组) 2015—2017年3年共3 288组不同席别客流数据为实验对象,取2015年、2016年、2017年前9月共3 012组客流数据作为样本数据,取2017年后3个月不同席别客流数据为验证数据。
图4 2017年10—12月高速铁路不同席别客流影响系数Fig.4 In fluencing factors of short-term passenger flow at different seats from October to December 2017
首先对3 012组数据依据编组分为商务座、一等座和二等座各1 004组数据,再依据特殊节假日、周末和工作日进行日期分类建立样本,接着利用MATLAB软件对分类后的日期样本数据带入BP神经网络进行训练,并降低其训练误差 。由计算输出和实际客流的误差情况可知,BP神经网络在允许误差范围内,实现了对高速铁路不同席别客流的准确预测。2017年1—9月不同席别客流BP神经网络计算误差如图5所示。
图5 2017年1—9月不同席别客流BP神经网络计算误差Fig.5 Calculating errors of BP neural network for passenger flows at different seats from January to September 2017
利用2017年10—12月共276组数据带入已完成训练的BP神经网络进行测试,计算出不同席别原始客流数值。考虑到经济、高速铁路行车安排等影响,再对不同席别原始客流数值进行预测系数计算,得到2017年10—12月不同席别预测客流与实际客流结果如图6所示。
图6 2017年10—12月不同席别预测客流与实际客流结果Fig.6 Predicted passenger flow and actual passenger flow at different seats from October to December 2017
从图6可知,训练后的BP神经网络与预测系数的组合预测能力较高,利用BP神经网络判断不同席别客流变化的误差较小,网络泛化能力较好,因而该模型能在一定程度上实现对不同席别客流变化的判断。
建立基于BP神经网络且结合熵值法和变异系数法模型,对可变编组动车组短期客流影响因素进行分析,并建立了依据时期和席别的分组预测模型。从理论层面看,BP神经网络模型能够较为精准地预测不同席别客流,熵值法和变异系数法组合模型能够综合考虑影响高速铁路短期客流各方面的因素。运用的预测模型针对性较强,能够有效地预测可变编组动车组不同席别客流量,为可变编组动车组需求分析提供数据支撑,同时为确定编组数和不同席别配比提供科学依据,实现按需按流配车。