韦凌翔 董建军 陈志龙 赵峰
摘要:针对传统的货运生成模型处理非线性影响因素能力差的问题,运用BP神经网络建立城市货运生成多变量非线性预测模型。在对城市货运生成量影响因素进行分析的基础上,选取就业人数、地区GDP和消费品零售总额3个指标作为输入变量,以城市公路货运量和城市货运总量为输出变量,构建BP神经网络预测模型。该模型能揭示货运量与相关变量之间的非线性映射关系,在实证研究中取得了较理想的结果。通过实际货运量与BP神经网络预测结果的对比,验证了该模型在货运量预测方面的可行性。
关键词: 城市货运交通; 货运生成; BP神经网络
Abstract: Aiming at the problem of the poor ability of the traditional freight generation model to deal with the nonlinear influencing factors, the BP neural network is used to establish the multivariable nonlinear prediction model of the urban freight generation. Based on the analysis of the influencing factors of the urban freight generation volume, three indexes of the quantity of employment,the regional GDP and the total retail sales of consumer goods are selected as input variables, and the BP neural network prediction model is constructed with the output variables of the urban road freight volume and the urban total freight volume. By this model, the nonlinear mapping relationship between freight volume and related variables can be revealed, and ideal results are obtained in empirical research. By comparing the actual freight volume with the BP neural network prediction results, the feasibility of the model in the freight volume prediction is verified.
Key words: urban freight traffic; freight generation; BP neural network
0 引 言
在日益显著的全球化、信息化影响下,现代货运物流在美国、日本以及欧洲等发达国家发展迅速,在中国也成为政府、社会及专家学者们所关注的热点问题。现在许多国家和地区已经将现代货运物流当作其主要的产业甚至是支柱型产业[1-2]。高效的货运系统对推动国民经济增长、优化商品和服务的广义成本、实现产业全球化具有重要作用。随着人口增加、消费和生产水平提高、产品和服务定制升级以及贸易壁垒下降,货运流量持续增长。然而,缺乏城市货运需求模型可能导致非系统和低效的政策决策,从而对区域经济产生负面影响,并加剧交通拥堵,危害道路交通安全[3]。城市货运生成量是构建城市货运需求模型的基础数据,准确预测城市货运生成量不仅对货运专用设施(即专用货运走廊、专用车道、装卸车间)的发展至关重要,而且对交通管理和城市物流战略的实施至关重要。
货运需求模型按照货运维度可以划分为货运生成和货运出行生成两大类模型。与货运出行生成模型相比,货运生成模型关注的是质量,可以避免依赖装运尺寸以及物流决策的延迟[4]。货运生成模型能反映生产和消费的强度,能更好地代表区域、城市和国家的经济活动,因此本文将城市货运生成模型作为研究对象。然而,与货运出行生成模型的研究数量相比,货运生成模型的研究有限。货运生成模型可以使用区域的整体数据或者分类数据构建,虽然考虑区域的整体经济特征可以预测货运量,但是这会掩盖与基本出行单元(即设施)特征相关的因果关系和差异。HAD等[5]建议使用分解类数据对货运生成进行建模(因为这样可以有效避免聚合偏差),并提出了用于城市层面的区域货运模型。这些预测模型的构建需要基于货运数据,这些数据是通过对一个地区的关键货运生产设施(如仓库、批发和零售中心以及制造设施)的调查获得的。货运生成模型主要分为定性预测和定量预测两大类:定性预测常采用物流货运市场调查法、德尔菲法等;定量预测采用线性模型和非线性模型等。线性模型主要运用时间序列法、回归分析法和灰色预测模型等,非线性模型主要运用人工神经网络、最小二乘支持向量机、马尔科夫模型等。以往的货运生成模型基本上采用固定出行率法、投入产出法、增长率法、多重分类分析、回归以及广义线性模型等多种建模方法进行建模。许多研究认为出行率是恒定的,尽管其计算简单且需要的数据少,但这一技术在概念上很薄弱,并有可能导致显著的估计误差;一些研究采用投入产出法,尽管它在概念上是可靠的,但并不适用于数据有限的较小区域的交通规划;大多数研究利用普通最小二乘回归法进行货运生成建模,因为它能够解释货运活动与因果变量之间的关系,但是实际预测精度并不理想。
综上所述,由于貨运量预测受到非线性因素作用,传统的货运生成模型处理非线性影响因素的能力较差,已经不能满足实践中越来越髙的预测精度和实时性要求。神经网络是一个高度非线性动力系统,具有强大的自适应、自学习功能,它通过训练预先整理好的大量相互对应的输入和输出数据,学习分析两者之间潜在的规律,最终依据这些规律,用新的输入数据推算输出结果。BP神经网络是目前各领域研究最成熟、应用最广泛的神经网络模型之一。相比于传统的统计分析模型,BP神经网络因具有强大的非线性映射能力而成为处理这类复杂非线性问题的一种有效手段。因此,本文运用BP神经网络建立城市货运生成多变量非线性预测模型,以提高城市货运生成量预测精度,为构建城市货运需求模型提供有效的数据支撑和理论方法。
1 城市货运生成量影响因素分析
在Web of Science数据库搜索关于城市货运生成方法的相关英文关键词,汇总货运生成量影响因素,具体见表1。
具体分析如下:
(1)在所有影响因素中,就业人数总被认为是货运生成模型中最优的因果变量。AGNIVESH等[3]通过对印度喀拉拉邦的7个城市进行企业货运调查,建立了一套基于回归分析的货运生成模型,这些模型对城市内部货运规划中区域货运生成量估算具有实际意义。因此,就业人数对货运量的生成有很好的解释作用。
(2)区域贸易流通活跃程度对货运生成量预测有较大影响。BASTIDA等[8]的研究表明,商品类型、行业分类和就业人数是货运生成量预测的强有力的影响因素[8]。例如:社会消费零售总额包含了国民经济各行业(零售业、制造业等)对城乡居民和社会集团的消费品零售总额,一定程度上反映了贸易流通与区域物流需求之间的关系。
(3)城市总体经济指标与城市货运总量存在着较大的相关性。OLIVEIRA-NETO等[10]强调需要考虑地区GDP以及其他因素以提高货运需求模型的预测精度,其中地区GDP指标反映了经济规模对物流需求规模的影响。
综上所述,本文汇总了以往货运生成模型研究中所选取的影响因素,最后确定就业人数、地区GDP、消费品零售总额等3个指标作为城市货运生成量预测的影响因素,即为城市货运生成模型的輸入变量。
2 基于BP神经网络的城市货运生成模型构建
2.1 BP神经网络概述
BP神经网络模型由BP网络和数据处理器构成,其中BP网络一般由输入层、隐含层和输出层3部分组成,数据处理器用来对数据进行处理构成输入和输出样本。BP神经网络的主要特征是信号前向传播和误差逆向传播,其基本思想是:在BP神经网络的整个学习过程中,周而复始地进行着信号的前向传播和误差的逆向传播,不断更新其连接权值和节点阈值,直到网络输出误差逐渐减少到可接受的程度或者达到设定的学习次数为止,最后得出输出结果。
BP神经网络实质上反映了由输入到输出的高度非线性映射关系,当输入层节点数为n、输出层节点数为m时,它就表达了一个从n个变量到m个变量的函数映射关系,即f:Rn→Rm。根据Kolmogorov定理,一个三层BP神经网络可以实现对任意非线性函数的逼近,并在期望精度内反映输入与输出的映射关系,因此本文采用三层BP神经网络,其结构见图1。
利用BP神经网络构建预测模型,主要包括训练样本的准备和归一化、神经网络的训练以及利用训练好的神经网络进行预测三大步骤,其中样本数据归一化处理能有效减少网络训练过程中由于某数据值过大或量纲不同而导致的误差影响,BP神经网络在预测前要经过训练使其具有联想记忆和预测的能力。
2.2 BP神经网络预测模型的构建
设定BP神经网络神经元的输入信号为Xt=(x1,x2,…,xn),t=1,2,…,p,式中p为训练样本个数。w1,w2,…,wn表示各输入的权值,它表示各信号源神经元与该神经元的连接强度。输出向量为Yk=(y1,y2,…,ym)。基于BP神经网络的城市货运生成模型构建过程如下:
步骤1 网络初始化。根据输入序列(x,y)确定网络输入层节点数n、隐含层节点数l、输出层节点数m、输入层到隐含层的权重wij和隐含层到输出层的权重wjk。输入层到隐含层的阈值为βj,隐含层到输出层的阈值为γk。BP神经网络通常采用Sigmoid可微函数和线性函数作为网络的激励函数,本文选择双极S型函数tansig作为神经元的激励函数,并给定学习速率η。
步骤2 隐含层各节点的输出计算。
3 实例验证与分析
3.1 数据归一化及网络参数确定
以南京市为例进行基于BP神经网络的城市货运生成模型的验证与分析,基础数据来源于《南京市统计年鉴(2000—2018年)》。在BP神经网络训练前将输入样本归一化到[-1,1]区间:基础数据及训练样本(选取1999—2016年的数据作为训练样本)归一化后的数据见表2。表2中:x1、x2、x3分别表示就业人数、地区GDP和消费品零售总额;y1、y2分别表示城市公路货运量和城市货运总量。
本文BP神经网络输入层节点数为3,输出层节点数为2。隐含层节点数大多由经验确定。国外有研究提出了用于计算最佳隐含层节点数的公式l=n+m+α,其中n为输入层节点数,m为输出层节点数,α为[1,10]内的常数。在这里取α=5,经计算得l=7。因此,本文BP神经网络结构为 3∶7∶2。
网络训练参数(包括学习速率、训练次数和期望误差值)的确定遵循一定的原则。学习速率决定每次循环训练所产生的权值变化量。一般来说,高的学习速率可能导致系统不稳定,而低的学习速率导致训练时间较长,收敛可能很慢,但能保证网络误差值跳出误差表面的低谷而最终趋于最小误差值。一般情况下,倾向于选取较低的学习速率以保证系统稳定性,其参考值为0.01~0.80,这里学习速率取0.05。理想情况下,神经网络的训练终止条件是达到误差足够小,因而训练次数的确定可以通过尝试不同的值,然后选择在验证集上误差最小的合适值。训练次数越多,训练误差就越小,但容易过拟合,造成测试误差过大,这里训练次数取100次。在网络训练过程中,期望误差值也应当通过对比训练选取一个合适的值,这里期望误差值取0.65×10-3。
设定完参数后开始训练网络,当学习次数达到上限值,或者网络的误差平方和小于期望误差值时,网络就会停止训练。
3.2 预测结果分析
先输入1999—2016年的数据作为网络训练样本,以检验所构建网络的预测精度,并利用MATLAB编程实现该网络模型的学习、训练、拟合和预测;再输入2017年和2018年的3项指标数据,通过设定好的网络模型预测所对应年份的城市公路货运量y1和城市货运总量y2,并将预测值与实际值进行对比,预测曲线见图2。
从图2可以看出:运用BP神经网络预测的效果较为理想,训练后的网络能很好地逼近给定的目标函数;1999—2016年城市公路货运量和城市货运总量的实际增加都比较平稳,增幅也比较有规律。
BP神经网络训练完后,得出均方误差随训练次数的变化曲线如图3所示,网络训练41次后均方误差达到0.000 645 19,说明网络最后训练的误差比较接近所设定的期望误差。由回归结果(见图4)可以看出,目标值与输出值基本在同一条直线上,说明训练结果比较好,此预测网络是有效的。
将网络输出结果通过反归一化还原成原始的数据,从而得到有效的预测值,见表2最后2列数据。从表2可以看出,2018年城市公路货运量和城市货运总量的实际值与预测值差别较大,而2017年城市公路货运量和城市货运总量的实际值与预测值较为接近。
4 结 论
(1)基于BP神经网络信号前向传播和误差逆向传播的原理,综述相关研究中选取的影响城市货运生成量的各种经济因素,提取最具影响力的就业人数、地区GDP和消费品零售总额作为神经网络模型的输入变量,分析BP神经网络的结构层次、计算流程和计算原理,确定模型的输入层和输出层维度,建立基于BP神经网络的城市货运生成模型。
(2)以南京市为例,整理相关货运量数据,对其进行实证研究。在建模过程中,对历史数据进行预处理;应用MATLAB编程分别预测目标年度的城市公路货运量和城市货运总量,通过与目标年度的实际值进行比较,验证预测模型的准确性。结果表明,在期望误差精度范围内,运用BP神经网络可有效地預测城市货运量。
(3)由于城市货运生成量受众多且复杂因素的影响,本文所选取的3个影响因素仅仅是其中的一部分,还有其他因素,如城市的产业结构、各类产业的产品产量、城市居民可支配收入及生活水平、货物运输线路长度以及国家对物流行业的发展政策等。下一步研究将考虑其他因素,以期提高对城市货运生成量的预测精度。
参考文献:
[1]秦芬芬. 我国公路货物运输结构特征研究[J]. 交通世界, 2018(32): 5-7. DOI: 10.16248/j.cnki.11-3723/u.2018.32.002.
[2]杨涛, 胡跃平, 王忠强, 等. 城市货运与城市健康发展: 中国城市交通发展论坛2018年第4次研讨会[J]. 城市交通, 2019, 17(1): 109-120. DOI: 10.13813/j.cn11-5141/u.2019.0116.
[3]AGNIVESH P, SAHU P K, PATIL G R, et al. Modelling urban freight generation: a case study of seven cities in Kerala, India[J]. Transport Policy, 2018, 69: 49-64. DOI: 10.1016/j.tranpol.2018.05.013.
[4]HOLGUN-VERAS J, JALLER M, SNCHEZ-DAZ I, et al. 3 - Freight generation and freight trip generation models[J]. Modeling Freight Trasport, 2014, 2097: 43-63. DOI: 10.1016/B978-0-12-410400-6.00003-3.
[5]HAD H,COMBES F.Building a model of freight generation with a commodity flow survey[M]. Springer: Commercial Transport, 2016: 23-37.
[6]HOLGUN-VERAS J, JALLER M, DESTRO L, et al. Freight generation, freight trip generation, and perils of using constant trip rates[J]. Transportation Research Record, 2011, 2224(1): 68-81. DOI: 10.3141/2224-09.
[7]SNCHEZ-DAZ I.Modeling urban freight generation: a study of commercial establishments freight needs[J]. Transportation Research Part A:Policy and Practice, 2017, 102: 3-17. DOI: 10.1016/j.tra.2016.06.035.
[8]BASTIDA C, HOLGUIN-VERAS J. Freight generation models: comparative analysis of regression models and multiple classification analysis[J].Transportation Research Record, 2009, 2097(1): 51-61. DOI: 10.3141%2F2097-07.
[9]GIULIANO G, GORDON P, PAN Qisheng, et al. Estimating freight flows for metropolitan area highway networks using secondary data sources[J]. Networks and Spatial Economics, 2010, 10: 73-91. DOI: 10.1007/s11067-007-9024-9.
[10]OLIVEIRA-NETO F M, CHIN S M, HWANG H. Aggregate freight generation modeling: assessing temporal effect of economic activity on freight volumes with two-period cross-sectional data[J].Transportation Research Record, 2012, 2285(4): 145-154. DOI: 10.3141/2285-17.
(编辑 赵勉)