金 淳,曹 迪,王 聪,李文立
(大连理工大学 系统工程研究所,辽宁 大连 116024)
汽车零部件第三方仓储物流企业在运营中面临的一个重要问题是:在经营环境存在众多不确定性影响因素、汽车零部件的需求变得越来越多样化的条件下,如何分配合理的仓储存储能力来提高服务质量、降低运营成本[1]。为此,建立准确有效的存储需求量预测模型具有重要的现实意义。
汽车零部件第三方仓储需求量预测问题属于需求量预测模型的范畴,该类模型的构建方法可分为定性预测和定量预测两大类。定性预测主要包括市场调查、菲尔德法、头脑风暴法、类推法和意见汇总法等[2];定量预测是最常用的方法,如指数平滑法、ARIMA 模 型、马 尔 科 夫 法、SVM 和RBF 等[2-5]。定量预测方法中,除BRF外的方法均是基于需求量历史数据本身趋势的预测。实践表明,对于处于显著动态变化环境的汽车零部件需求预测而言,只用历史数据来预测经常会失败,因为这种预测假设过去的需求模式会发生在将来,而这种假设有时并不成立[6]。为此,需要获取更多的信息才能从动态变化的环境中找到与需求量相关的影响因素及其影响模式,从而提高预测精度[7]。
RBF神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。当需求受到众多因素影响且影响程度难以确定时,可以采用其进行预测。神经元个数的多少直接影响RBF神经网络的预测效果,神经元个数过少时的预测效果会很差,而过多时则会造成过度拟合的情况。选择神经元个数的研究大多依赖样本数据的选择和数据数量,需通过不断地尝试和确定[8]。汽车零部件的历史数据有限,同时汽车零部件的种类可多达几千件,甚至上万件,众多影响因素的变化对这些零件需求的影响程度很可能是不同的。通过确定每一种零部件最优的神经元个数,从而建立神经网络进行预测是不现实的。
近年来,研究表明,组合预测模型正在成为预测模型的发展趋势,它通过对不同的定量模型、定性模型或对定量模型、定性模型进行综合集成来提高预测的精度[9]。汪寿阳等[10]基于TEI@I方法论的汇率预测模型采用经济计量模型、人工神经网络和文本挖掘进行预测,最后利用支持向量回归技术对上述各部分进行非线性集成;沈国江等[11]提出利用模糊逻辑方法综合卡尔曼滤波模型和人工神经网络模型的智能组合模型来预测短时交通流量;徐兰等[12]基于神经网络集成的质量预测模型。
综上所述,对于具有众多不确定动态外部环境的汽车零部件第三方仓储需求预测而言,构建基于组合模型的预测模型对于其提高预测精度十分必要,但目前的相关研究还很少。因此,本文利用RBF神经网络优异的非线性特性,并结合其他预测方法构建汽车零部件第三方仓储物流需求量预测的集成化预测模型。此模型并不过分追求神经网络的神经元选择的最优性,而是通过与其他预测模型的组合来弥补可能造成的预测精度的降低,从而提高模型的综合预测精度、运行效率和行业适用性。
汽车零部件第三方仓储企业一般面向汽车整车或零部件生产企业提供产前物料供应服务,或面向区域零部件服务中心及4S店进行成品汽车的零部件备品供应服务。不论何种情况,仓储需求量预测问题都十分复杂,主要是由于外部环境、供应方和生产方的各种不确定,以及时滞性的变化影响了零部件的需求量变化,由此造成需求量的短、中、长期预测变得十分困难,故在构造集成化预测模型之前,有必要首先了解需求量的影响因素。
调研表明,汽车零部件需求量具有一定的季节性周期性变化趋势[13],但受到各种内、外部因素的影响。其中,内部影响因素主要有供货提前期、库存周期、存储和装卸成本、物流需求量、缺货量和产品价值[14-17];外部影响因素主要有季节因素、距离因素、政治因素、经济因素、区域竞争和行业因素,可将其具体分为汽车销售淡/旺季、仓库与供货商的距离、国家宏观政策、车辆限行政策、经济危机、油价的涨跌、第三方物流企业的增加、仓储作业技术革新、仓储成本降低、汽车生产技术革新和汽车制造企业增加11种因素。
在内部影响因素中,供货提前期、存储和装卸成本以及产品价值对不同零部件的需求量具有决定性作用,但是这些影响因素在长时间内是保持不变的,所以就单一零部件而言,从其需求量波动变化的角度,库存周期、缺货量和物流需求量对仓储需求量的影响较大。但需求量与这些内部影响因素之间的关系比较复杂,很难用线性函数来定量分析。
同时,外部影响因素对需求量的影响具有较强的不确定性。有时外部因素的突然变化甚至会使需求量产生非常大的波动,但外部影响因素的特点是往往很难进行量化,故难以进行定量分析。因此,将定量预测和定性预测相结合可以更好地解决汽车零部件第三方仓储需求量预测问题。
RBF神经网络模型可以考虑不确定因素的影响方式和程度,建立其复杂的非线性因果关系,以此预测由于内部影响因素引起的非线性波动趋势[5]。
一个具有n个输入、m个输出的RBF神经网络结构如图1所示。其中,输入X n=[x1,x2,…,x n]为n维矩阵,x i为X n中第i行,表示第i个影响因素;输出Y为一维矩阵;N r为隐含层神经元数量;ωi(i=1,2,…,Nr)为连接权值。
图1 含有n个输入的RBF神经网络
本文选取4个内部影响因素作为RBF 神经网络的输入参数,即输入X4=(x1,x2,x3,x4),各参数分别为:物流需求量、库存周期、缺货量和在库量的历史数据。则RBF 神经网络模型可实现如下映射:
式中:ω0为偏置量;Ci(1≤i≤N r)为RBF的中心,可以采用随机选取、基于监督学习的方法和最近聚类算法等确定;Φ(X4-Ci)为基函数,本模型使用高斯函数,如下式所示:
Horink[18]证明了仅有一个隐含层的前馈神经网络具有一定精度的无穷逼近能力,即RBF神经网络可以进行良好的非线性预测。RBF 神经网络的精度是建立在神经元的选择之上的。本文采用一种零件汽车零件——左前置支架作为预测对象进行试验,以2010年每周的历史数据建立神经元从1~52的RBF神经网络,并利用这52个神经网络预测其2011年的仓储需求量。并且,采用平均相对误差MAPE和均方根相对误差RMSE 两个误差指标进行比较,MAPE和RMSE的计算公式为:
式中:X t为预测结果;M t为实际数据;N3为预测数据个数。
上述52个神经网络的MAPE、RMSE 误差指标的变化趋势如图2所示。由图2可以看出,对于左前置支架需求量的预测,随着神经元个数的增加,其预测精度变高。当N r=52时,即神经元个数等于输入数据个数,误差几乎趋近于0。但在实际的预测过程中,不会把预测数据个数作为神经元的个数,这样会造成过度拟合的情况;同时,这也是牺牲预测效率带来的结果,在实际应用中是不适用的。当N r>20时,其预测效果就已经很好。因此,为了满足企业的实际需求,本文在建模时,将N r设定为一个固定值。
图2 RBF预测误差随神经元的变化图
在此条件下,为保证整体预测模型的额精度,本文选择另一种定量预测方法与RBF结合,来提高在基于历史数据进行定量预测时的精度。ARIMA 模型是线性预测模型,可较好地预测变量的季节性趋势,将ARIMA 模型和RBF 神经网相结合,既可以考虑汽车生产季节性周期性的特点,又可以考虑定量因素对库存需求量造成的波动。
但是,对于外部不能量化的因素则需要采取定性方法进行分析。专家打分法是一种常见的定性分析方法,可以对非量化的影响因素进行定性分析,同时,根据相关领域专家的经验预测未来的趋势变化。
图3 SIF模型的基本结构
因此,本文提出了综合集成预测模型——SIF预测模型。SIF 模型可以利用ARIMA、RBF 神经网络及专家打分法3个模型的各自优势进行预测,同时,通过其动态集成效果来弥补各模型的不足。SIF模型的思路及基本结构如图3所示。首先,SIF模型利用历史需求量数据,通过ARIMA 模型预测其季节性变动趋势;在此基础上,通过RBF 神经网络模型建立内部影响因素与需求量的非线性关系,来预测影响因素的变化造成的需求量的趋势波动变化;然后,再通过专家对外部影响因素的打分,得到定性因素造成的趋势变化,从而对定量预测结果进行修正;最后,将三部分预测结果进行动态集成,得到综合集成预测结果。
ARIMA 模型可根据数据重复出现的周期性季节变动指数,将非平稳时间序列转化为平稳时间序列;然后,利用因变量对其滞后值和随机误差项的现值进行回归建立预测模型,可以更好地预测需求量的季节性变动趋势。
设已知需求量历史数据为Zt(t=1,2,…,N),其中t为时间间隔(周、月等),将Zt分为两部分:
以Z1t作为ARIMA 模型的输入数据,Z2t为校正数据及RBF神经网络的输入数据。如果Z1t为非平稳时间序列,对Z1t进行差分,经d次差分后得到平稳序列Δd Z1t,则Δd Z1t可表示为如下形式[19]:
式中:φp(B)为自回归参数;θq(B)为移动平均参数;p、q为整数;d为差分次数;εt是零均值、方差σ2的白噪声序列;B为后移算子。然后,利用BIC 准则确定最佳的p、q值,根据p、q值确定其他参数φp、θq、σ2。最后,确定需求量所满足的季节性趋势模型ARIMA(p,d,q)。
假设集成预测需要根据已知的N(N=N1+N2)个历史数据预测Zt未来N3个时间间隔的需求量,则需要利用ARIMA模型根据历史数据前N1个数据Z1t预测后的N2+N3个数据,预测结果用Ft(t=1,2,…,M)表示。ARIMA 预测结果分为两部分,Ft={F2t,Fst},其中,F2t(t=1,2,…,N2)作为RBF神经网络的输入数据,Fst(t=1,2,…,N3)作为为集成预测的输入数据。
在本集成预测模型中,以ARIMA 预测结果中的F2t与实际数据Z2t的误差序列e t(t=1,2,…,N2)作为输出目标来建立RBF神经网络,即
则RBF神经网络模型可实现如下映射:
利用最近邻聚类学习算法选取RBF 的中心Ci,确定ωi、ω0,建立RBF 神经网络模型。利用已建立的RBF神经网络预测未来N3个时间间隔的修正误差,用est(t=1,2,…,N3)表示。
定性预测模型采用专家打分法进行。专家打分法即可简单快速地进行定性分析,又可减少单个专家的偏见影响[20]。在此按菲尔德法和意见汇总法进行实施。用前文提取的f1~f11这11种因素进行问卷设计,根据不同的预测周期长度,通过专家对这些影响因素进行打分,打分时考虑:这11种因素的影响权重及其发生的概率以及专家对该领域的熟悉程度,通过计算该影响因素对序列的平均影响程度。最后,将各个影响因素的平均影响程度综合。同时,利用效度系数法确认这11种因素构成的指标体系的有效性[21],即当专家组对同一因素打分得出的数据差异较大时剔除该因素。
本文构建的基于专家打分的影响程度计算方法如下式所示:
式中:T为预测区间长度,可按半年或1年为一个区间进行打分;E为预测区间的个数;Ne为专家人数;Nf为所考虑的定性因素的个数,本文中Nf=11;Pijr为第i个专家认为第j个事件在第r个预测区间发生时对需求量影响程度的判断结果,Pijr的取值范围为(-1,1)。当Pijr=0时无影响,当Pijr>0时,事件j发生,使需求量呈正向增长趋势,反之呈负向下降趋势。W ijr为第i个专家认为第j个事件在第r个预测区间发生的概率,取值范围为[0,1];Rij为第i个专家对第j个事件所处的知识领域的熟悉程度,取值范围为[0,1]。为方便起见,本文取Rij={0,0.25,0.5,0.75,1.0},分别表示很不熟悉、不太熟悉、一般了解、比较熟悉、很熟悉。
式(8)的计算结果V r是一个修正系数,其范围为(-1,1)。对于不同预测区间,本文利用专家分别根据外部影响因素的发展趋势进行打分,得到对应不同区间的V r,这样会提高针对不同区间的预测的准确性。同时,本文认为,专家打分法对于预测对象从近期到远期的修正作用是逐渐加强的。为描述这种渐进性,本文用一个线性递增公式表示V r的渐进变化。最后,获得N3个修正系数,用V st(t=1,2,…,N3)表示,即
如果Vst是负数,表示这11种因素的变化会造成相应的预测区间内需求量的降低,需对定量预测结果向下方修正;反之,需对定量预测结果向上方修正。这样,实现了在不同预测周期对于定量预测结果的动态调整。
本文建立的综合集成预测模型SIF的结构及流程如图4所示。
图4 SIF模型的流程
SIF模型中,需求量集成预测值St(t=1,2,…,N3)的表达式为
式中,p为预测权重,进行短期预测时,定量预测在集成中所占权重较大,即p≥0.5;进行长期预测时,需求量的趋势因受到外界因素变化所造成的波动,影响增大,定性预测在集成中所占权重增大,即p≤0.5。这使得模型更加符合短期、中期和长期零部件第三方仓储需求量预测的实际特点。
式(11)所示的SIF 模型的集成原理如图5所示。各模型的集成过程:
(1)以第I部分的历史数据Z1t为输入量,用ARIMA 模型预测需求量可基于量化因素的线性变化趋势Fst;
(2)利用ARIMA 预测结果F2t及第II部分的历史数据Z2t的误差e t作为输出目标建立RBF神经网络,预测其基于量化因素影响造成的非线性变化趋势est;
图5 SIF模型的集成预测示意图
(3)通过专家打分的定性分析结果V st考虑相应的预测区间内不可量化因素对历史数据变化趋势的影响,获得定性预测结果;
(4)通过式(11)对定量预测和定性预测的结果进行动态集成,得到综合考虑内、外部因素影响的集成预测结果St,St的变动趋势如图5中第III部分所示。
本实例为某3PL仓储服务企业,为汽车发动机生产厂提供产前零部件供货服务,涵盖各类零部件上千种。本预测任务是基于零部件的历史需求量及其他相关数据,预测其未来的存储需求量。本文分别采用需求趋势有明显变化的曲轴总成(data1)和需求趋势基本保持不变的气门弹簧(data2)两种零部件进行预测,它们的历史需求数据如图6 所示。其中以曲轴总成为例做详细的试验说明。
图6 历史需求量数据
首先以2010-01~2011-12 共104 周的曲轴总成实际在库量数据及相关定量因素的历史数据进行预测。以2010-01~2010-12的数据作为历史数据,建立SIF 模型进行需求预测;然后以2011-01~2011-12的数据作为检验数据,对SIF 模型的预测效果进行检验和评价。
3.2.1 ARIMA(p,d,q)模型的建立 首先以2010年1~26周的数据作为输入数据建立ARIMA(p,d,q)模型,数据的ACF图和PACF图如图7、8所示。
图7 ARIMA 模型的ACF图
图8 ARIMA 模型的PACF图
图9 曲轴总成需求预测结果
由图7、8观察ARIMA(p,d,q)模型的参数p、q小于4,利用BIC准则确定其为ARIMA(2,1,1),其参数值如表1所示。
利用ARIMA(2,1,1)模型预测2010年27~52周及2011年1~52周的数据,预测结果如图9(b)所示。
表1 ARIMA(2,1,1)的参数估计值
3.2.2 RBF 神 经 网 络 模 型 的 建 立 以2010 年27~52周需求量、库存周期、缺货量和在库量的历史数据作为RBF 神经网络的输入、以ARIMA(2,1,1)模型预测的2010年27~52周的需求量与实际需求量的误差作为输出建立训练集,建立神经网络,其中神经元个数N r=20。利用所建立的RBF NN模型预测2011年52周的误差数据,修正ARIMA的预测结果,修正后的数据如图9(c)所示。
3.2.3 定性预测模型的建立 专家打分部分的修正系数分为4 个区间,对应的修正系数分别为:V1=-0.30,V2=-0.50,V3=-0.50,V4=-0.20,再利用式(10)获得每周的修正系数。
3.2.4 模型的集成 最后,利用式(11)求得SIF模型的集成预测结果,其中,对于前26周的预测,p=0.75;对于后26周的预测,p=0.5。图9(d)为SIF模型的预测结果及其与实际数据以及各个步骤预测结果的比较。
由图9可以看出,由于ARIMA 模型根据2010年历史数据进行预测,其预测的需求量的趋势较实际数据有较大偏差,这是由于2011年需求量的变化趋势较2010年发生了明显的变化,而ARIMA 模型仅根据历史数据进行预测,故误差较大。通过RBF神经网络的修正,预测效果有所提高,证明本文所选择的影响因素对需求量预测的修正作用。经过定性分析的修正,预测结果在需求量突然变化的时间点较RBF模型的预测有所改善。由图9可以初步看出,SIF模型能够有效预测需求量的变化,具体的单一模型及SIF模型的误差比较将在下面详述。
对于气门弹簧的预测过程如图10所示。由图10可以看出,SIF 模型的预测效果优于ARIMA 模型、及ARIMA 模型与RBF 神经网络组合预测的效果。
图10 气门弹簧需求预测结果
本文比较了4种模型,即各单一定量预测模型、ARIMA 模型与RBF 神经网络组合模型以及本文提出的SIF模型,所预测的曲轴总成和气门弹簧需求量的效果如表2 所示,分别为上述模型在短期(1~13周)、中期(1~26周)和长期(1~52周)范围的预测误差MAPE、RMSE。由表2 可以看出:①进行短期预测时,4种模型方法的预测效果都比较好,但SIF集成模型的预测误差最小;②进行中期预测时,ARIMA 与RBF组合模型、SIF集成模型的预测效果比较好,其中,SIF集成模型的预测误差最小;③进行长期预测时,SIF 集成模型预测效果最好,尤其对于需求趋势有明显变化的曲轴总成的预测要明显优于其他模型。这说明了在需求量预测中SIF 模型优于各个单一预测模型以及ARIMA与RBF组合预测模型。
表2 单一模型与组合模型的误差
本文的SIF集成预测模型同样可应用于具有类似特点的需求量预测问题,此时应注意:
(1)对于不确定内部因素引起的非线性因果关系部分,以对应实际问题的非线性要素个数作为RFB网络的输入参数个数n。
(2)对于具有周期性波动部分,采用ARIMA模型。历史数据的个数N1、N2以及预测数据个数N3根据问题的实际要求决定。
(3)对于外部影响因素部分,利用专家打分法求出影响程度作为对上述预测结果进行修正、调整。所考虑的因素个数Nf依据实际问题而定。
为解决动态多变环境下的汽车零部件第三方物流仓储需求量预测问题,本文在考虑各种内、外部影响因素的基础上,建立了由RBF神经网络、ARIMA及定性方法相结合的综合集成预测模型SIF。研究结论如下:
(1)SIF模型可以提高RBF神经网络当数据过少或对预测效率要求较高而无法确定最优的神经元个数时的预测精度,其预测效果优于传统的ARIMA、RBF 神经网络单独使用或ARIMA 与RBF神经网络组合使用时的预测精度;
(2)SIF 模型通过3 种模型的组合,可以发挥各自模型的优势,克服各自的缺点,使之适合于汽车零部件第三方仓储物流需求量的短、中、长期预测。
(3)SIF模型对于汽车零部件仓储需求量发生突然的趋势变化时的预测准确性更高。
本文为解决构建考虑众多复杂影响因素的汽车零部件需求预测模型问题提出了新途径。今后的研究将进一步探索合理确定各影响因素的影响程度的方法并提高模型的智能化水平。