基于改进马尔科夫模型的铁路客运量预测研究

2023-11-29 07:06张云娇范丁元
高速铁路技术 2023年5期
关键词:感知器客运量马尔科夫

杨 飞 张云娇 范丁元

(中铁工程设计咨询集团有限公司,北京 100055)

随着我国工业化和城镇化的快速发展,铁路因其大运量、便捷、快速、舒适等特性,在保障城镇人口大量流动,促进经济联系,带动相关产业结构优化升级方面起到了重要作用。铁路客运量预测是制定铁路客运宏观发展战略和编制客运计划的重要依据,其准确性与可靠性对制定铁路线网规划、设计列车开行方案、优化客运产品结构、提升旅客运输服务水平等具有重要意义[1]。

铁路客运量预测方法可分为线性预测和非线性预测模型两类。其中,线性预测模型中应用较广的是线性回归预测,而神经网络预测模型凭借其高度的非线性、强大的学习性等特点成为非线性预测方法的代表。无论采用哪一种预测方法,预测结果与实际客运量均存在一定的误差。因此,许多学者会先对研究对象进行运量预测,再借助马尔科夫模型对预测结果进行修正,以提高模型预测结果的精度。吕鹏飞[2]应用马尔科夫模型对船舶交通量的多层感知器神经网络预测结果进行修正;裴同松[3]应用马尔科夫模型对公路客运量的多层感知器神经网络预测结果进行改进;尚庆松[4]结合马尔科夫模型与灰色预测模型对售票窗口的客运量进行预测;周子东[5]利用马尔科夫模型对最小二乘回归模型的预测结果进行修正;马彩雯[6]利用马尔科夫模型对灰色预测模型的预测结果进行改进。马尔科夫模型在预测过程中,通常采用统计估算法对预测结果所属的状态区间进行划分,常用的有均等划分、均值-方差法和黄金分割法等。这类方法划分状态区间时,状态区间划分的数量和取值具有一定的主观性和随机性,使得马尔科夫模型对预测值的改进效果具有一定的不确定性,可能导致马尔科夫修正值的精度更差,影响整体预测精度。潘丽[7]将预测误差状态区间划分为长度相等的区间并进行马尔科夫修正,即区间均等划分,其第5 组马尔科夫预测修正值的误差较修正前大1.87%;何启[8]通过均值-方差法将预测结果划分为5 个不同的状态,其第4 组马尔科夫预测修正值的误差较修正前大0.336%。

为了解决马尔科夫模型在预测过程中的不确定性问题,并提高其预测精度,本文在预测精度更优条件下,研究马尔科夫模型中状态区间划分的取值方法。通过多层感知器神经网络预测2004—2019年的北京市铁路客运量,运用改进的马尔科夫模型对多层感知器神经网络预测结果进行修正,并与均等划分、均值-方差法划分状态区间的马尔科夫模型的预测修正结果进行对比,以验证改进马尔科夫模型的预测效果。

1 马尔科夫预测模型

马尔科夫理论多用于研究时间序列数据的状态和转移规律,其认为一个序列可划分为若干种状态,时刻ti的状态仅由时刻ti-1的状态决定,而与ti-1之前的状态无关,即马尔科夫性质。假设铁路客运量预测误差的状态变化具有马尔科夫性质,一组铁路客运量的预测误差序列S(t)可划分为m 种状态,通过研究序列S(t)中各状态的初始概率向量和状态转移规律,来预测该序列下一时刻最有可能所处的状态,进一步对预测结果进行修正。运用马尔科夫模型对铁路客运量进行预测修正过程可分为以下5 步:

(1)铁路客运量预测

选择一种合适的方法先对研究区域往年及预测年度的铁路客运量进行预测并计算其误差。

(2)划分状态区间

(3)计算状态转移概率矩阵

根据状态划分区间将往年客运量的预测误差归属于相应的状态,并计算状态Ei经过一步转移到状态Ej的概率[9]:

则一步状态转移矩阵为:

根据C-K 方程,状态Ei经过k 步转移到状态Ej的概率矩阵为:

(4)计算初始状态的概率向量

假设往年铁路客运量预测误差序列S(t)中最后一组样本的状态为Ei,则其初始状态概率向量P(0)是第j 列概率为1 且其余列概率为0 的行向量:

(5)修正铁路客运量预测值

初始状态概率向量经过k 步转移到预测年度的状态概率向量P(k)为:

根据状态向量P(k)可以判断预测年度所处的误差状态Ei,原预测值的马尔科夫修正值计算公式为:

式中:S预测——铁路客运量预测值;

S修正——铁路客运量预测值的马尔科夫修正值;

ai、bi——状态Ei的区间取值。

2 马尔科夫模型改进

2.1 改进方法

为提高预测年度马尔科夫预测修正值的精度,马尔科夫预测修正值与原预测值、实际值具有以下关系:

式中:S实际——实际铁路客运量。

将式(6)带入式(7)可得:

整理可得状态划分区间取值范围为:

同理,求解可得状态划分区间的取值范围:

式(11)、式(13)为划分的状态区间取值与铁路客运量预测值和实际值的关系,当满足其一时,可进一步提高马尔科夫预测修正值的精度。

2.2 预测过程

根据划分状态区间的取值范围约束,对马尔科夫预测过程进行优化,如图1所示。

图1 马尔科夫预测优化过程图

该方法是根据式(11)或式(13)先计算往年的客运量预测误差序列S(t)中每一组数据对应的ai+bi的取值范围[αi,βi],将每组数据取中值,即(αi+βi)/2,再取其平均值带入式(6)对预测年度的预测值进行修正。此法打破传统马尔科夫预测的流程和模式,无需计算k 步状态转移概率矩阵,解决了状态划分方法优化难度大、状态转移概率矩阵计算量大等问题,其误差精度的优劣是本文论证研究的重点。

3 实例验证

3.1 多层感知器神经网络的铁路客运量预测

影响铁路客运量预测的因素[10]可分为宏观因素和微观因素两类。宏观因素包括经济实力、人口规模、社会发展水平、交通建设情况、旅游业发展水平、国家政策等;微观因素包括铁路运输设施设备属性和旅客属性两类,主要有运输时间、费用、服务质量、出行目的、出行距离、出行偏好等。考虑北京市铁路客运量的特点及指标数据获取的可操作性,本文主要考虑地区生产总值、地区常住人口、人均消费水平、旅游人数对铁路客运量预测的影响。通过北京市2020年统计年鉴获取相关数据,借助SPSS 软件构造其多层感知器神经网络预测模型,如图2所示。其中,隐藏层数设为1 层,隐藏单元为1 个,隐藏层激活函数为双曲正切函数。

图2 北京市铁路客运量多层感知器神经网络预测模型图

借助SPSS 软件预测北京市2004—2019年铁路客运量,预测残差如图3所示,预测结果如表1所示。

表1 北京市铁路客运量预测结果表

图3 北京市铁路客运量多层感知器神经网络预测残差图

由图3 可知,部分多层感知器神经网络预测值与真实值存在一定的差异,可结合马尔科夫模型对预测值进行进一步修正,以提高预测精度。

3.2 马尔科夫修正

为了对比常用的均等划分、均值-方差法划分误差状态区间的马尔科夫预测精度以及本文提出的优化马尔科夫预测过程法的预测精度,将2004—2016年北京市铁路客运量实际值和多层感知器神经网络预测值视为研究对象,研究其状态区间划分及状态转移规律,并视2017—2019年为预测年度,对其铁路客运量多层感知器神经网络的预测值进行修正计算。

(1)均等划分法

由表1 可知,2004—2016年北京市铁路客运量预测误差范围为-3.881%~3.006%,将误差序列平均划分为E1、E2、E3、E4、E5共5 个状态,则每个状态区间长度均为1.377%。因此,各状态区间取值为:E1∈[-3.881%,-2.504%)、E2∈[-2.504%,-1.126%)、E3∈[-1.126%,0.251%)、E4∈[0.251%,1.629%)和E5∈[1.629%,3.006%]。

将2004—2016年多层感知器神经网络预测的误差按照状态区间划分结果进行分类,根据马尔科夫过程,状态Ei经过一步转移到状态Ej的频数,如表2所示。

表2 均等划分法的状态转移频数表

由表2 和式(1)~式(3)计算得2016年铁路客运量预测误差状态的一步、两步和三步状态转移概率矩阵分别为:

2016年北京市铁路客运量预测误差所处状态为E3,故其初始状态的概率向量为P(0)=(0 0 1 0 0),根据式(5)计算可得2017—2019年状态转移概率向量分别为:

可知2017—2019年预测误差最有可能所处的状态分别为E4、E3、E3,概率分别为0.4、0.573、0.48。根据式(6)计算得其预测修正值,如表3所示。

表3 均等划分法的马尔科夫预测修正结果表

由表3 可知,采用均等划分法对误差状态区间进行划分时,2019年的马尔科夫预测修正值的误差比多层感知器神经网络预测更小,这表明马尔科夫模型在一定程度上能够提高预测精度。然而,2017年、2018年的马尔科夫预测修正值的误差绝对值更大,这是因为状态区间划分时未考虑误差精度的影响,确定的误差状态数和区间取值具有一定的主观性和随机性,影响马尔科夫预测修正值的整体精度。

(2)均值-方差法

均值-方差法将预测误差分为5 组,其变化区间计算公式为:

s——预测误差方差。

表4 均值-方差法的马尔科夫预测修正结果表

由表4 可知,均值-方差法的状态区间划分时也未考虑误差精度的影响,其2017年、2018年的马尔科夫预测修正值的误差绝对值更大,影响马尔科夫预测修正的整体精度。

(3)优化马尔科夫预测过程法

根据式(13)计算得2004—2016年北京市铁路客运量预测误差状态区间的ai+bi取值范围,如表5所示。

表5 ai + bi 取值范围表

由表1、表5 可知,当实际值大于预测值时,相应年份ai+bi取值范围中值的平均值为-0.03;实际值小于预测值时,相应年份ai+bi取值范围中值的平均值为0.013。计算可知2017年与2018年的ai+bi取0.013,2019年的ai+bi取-0.03 时预测精度最好,由式(6)计算可得2017—2019年铁路客运量预测修正值如表6所示。

表6 优化马尔科夫预测过程法的预测修正结果表

由表6 可知,本文提出的优化马尔科夫预测过程法进行预测值修正时,其预测修正值的误差绝对值均小于多层感知器神经网络预测值的误差,优化模型的精度较好。

综上所述,各预测方法预测误差绝对值的均值如图4所示。

图4 各预测方法误差对比图(%)

由图4 可知:

①均等划分和均值-方差法划分的状态区间取值受到划分方法和划分状态数量的影响,具有一定的主观性和随机性,无法保证每一组预测修正值的误差精度较原预测结果有所提升,导致马尔科夫预测修正值的平均误差较多层感知器神经网络的预测误差更大。

②本文考虑误差精度而改进的马尔科夫预测过程法的精度更佳,其误差比均等划分和均值-方差的马尔科夫预测方法分别降低了0.601%、0.683%,比多层感知器神经网络预测误差降低了0.541%,且无需计算k 步状态概率转移矩阵,降低了预测过程的复杂性。

4 结论

马尔科夫预测模型一定程度上能提高铁路客运量预测的精度,但其状态划分方法及状态数量的选择具有一定的主观性和随机性,导致模型的预测精度存在不确定性。为解决这一问题,本文在考虑误差精度的条件下,对划分状态区间的取值范围进行了研究,得到的主要结论如下:

(1)考虑误差精度更优条件下确定马尔科夫模型划分状态区间取值范围对解决马尔科夫预测精度的不确定性问题具有重要意义,能有效保证马尔科夫对预测值进行改进的效果。

(2)改进的马尔科夫模型无需计算k 步状态转移概率矩阵,降低了预测过程的复杂性。

(3)相比于多层感知器神经网络、均等划分的马尔科夫模型、均值-方差的马尔科夫模型,改进的马尔科夫模型具有更高的预测精度。

未来的研究仍需重点关注考虑误差精度后状态区间划分方法的优化,以进一步提高马尔科夫模型的预测精度。

猜你喜欢
感知器客运量马尔科夫
交通运输部:3 月城市轨道交通客运量环比增长16.6%
基于叠加马尔科夫链的边坡位移预测研究
火箭贮箱喷涂机器人直接示教运动感知器设计与分析
2018年北京市城市公共交通运行特征分析
基于改进的灰色-马尔科夫模型在风机沉降中的应用
2018年北京市轨道交通运行特征分析
感知器在矿井突水水源识别中的应用
AI超市
尿湿感知器
马尔科夫链在教学评价中的应用