詹 桢 吴建平 谭志飞 陈建浩
(湖南科技学院 理学院,湖南 永州 425199)
本文研究的问题来源于2019 年第十二届华中地区数学建模邀请赛B 题:根据收集到的货物销量数据,建立销量预测的数学模型和算法,比较精确地预测未来5 d 各类货物的销量情况,并为其制定一个合理的补单策略。部分重要参考数据如表1(具体数据见:第十二届华中地区数学建模邀请赛B 题附件一、二)
表1 货物销量数据表
ARIMA 模型全称为整合移动平均自回归模型(Autoregressive Integrated Moving Average Model,简记ARIMA):由美国乔治·博克思与格威林·詹金斯于20 世纪70 年代提出,是一种著名的时间序列预测方法。一般地,ARIMA 模型[1]的建模流程如图1 所示:
图1 ARIMA 模型建模流程图
在模型识别中主要是看货物销售量具体更加符合ARIMA 模型中哪一类模型:AR 模型、MA 模型、ARMA 模型、ARIMA 模型、SARIMA 模型。
BP 神经网络是20 世纪80 年代由Rumelhart 和McClelland 为首的科学家提出,是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络[2]。BP 神经网络的计算过程由正向计算过程和反向计算过程组成。正向传播过程,输入模式从输入层经隐单元层逐层处理,并转向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各神经元的权值,使得误差信号最小。BP神经网络算法结构图如图2 所示。
图2 多层BP 神经网络算法结构图
将其算法引用到在本题数据中,具体操作步骤如下:
①使用ARIMA 预测模型计算已知的30 d 商品销量数据,作为BP 神经网络的输入层;
②将原始的30 d 销量数据作为期望值;
③设置允许的误差大小为0.05,反复迭代优化权值和阈值,直至满足误差要求,即训练完毕;
④将ARIMA模型预测未来5 d的商品销量输入BP 神经网络模型[3],得到二次优化后的商品销量预测。
将数据进行预处理后,根据数据特征和问题要求,选择ARIMA 模型中的第四种ARIM(p,d0,q)模型,其中,p 代表预测模型中采用的时序数据本身的滞后数;d0代表时序数据需要进行几阶差分化,才是稳定的;q 代表预测模型中采用的预测误差的滞后数。经过反复检验,设定p=1,d0=3,q=1,建立了ARIM(1,3,1)模型,对已知数据进行拟合,确定各参数的范围,最后对数据进行扩充,得到未来5 d 的预测值。
以货号SS72817 为例,其预测图像如图3,其中Observed 表示销售观察值即原始销售数据,Fit表示通过ARIMA 模型对其销售的预测值。从图像的直观性看,预测值与原始销售值的曲线相一致,可认为其拟合效果良好。
图3 货号SS72817 销售预测图像
使用AMIR 模型对过去30 d 的销量进行验证,将其作为BP 神经网络的输入值,将过去30 d 的实际已知销量作为BP 神经网络的期望值[5],通过反复的迭代,修改神经网络的隐藏层参数和阈值,使预测值不断接近期望值,当其满足误差范围足够小后,将ARIM 模型所得未来5 d 销量的预测值输入BP神经网络中,得到经过二次优化后的销量预测值。利用MATLAB 软件编程求解求得部分结果如表2。
表2 软件编程求解求得部分结果 单位:件
以货号SS72817 为例,其未来5 d 的销售量分别依次为1 件、2 件、2 件、2 件、0 件。
其中符号所表示含义如表3:
表3 符号含义表
对于货物上新日前的补单数量预测方面,不同商品的销售情况是考虑商品补单量的一个重要因素。本文依据销量/首单的比值Bj大小分为0≤Bj<1,Bj=1,1
对于某种新商品的上新补单预测,按照以往同类商品的销售经验,新商品的库存量,除去其中延期的那一部分,剩下的应当不低于预估的上新日销量。而预估的上新日销量则通过商家向供货商下达的订单量和同类商品以往的销量/首单的乘积可以大概确定其范围即:
对销量/首单的比值大小按照梯度进行分类,目的是更加细致的刻画出每种商品的热销程度。在梯度分类上,分为4 种梯度,并对每种梯度求出其比值的置信区间。对于下次上新的货物来说,只要找出同类货物所属的梯度,就能确定其销量/首单的比值范围,进而结合该商家给出的首次订单量,就能确定此商品在上新日的销量。
本文用SPSS19.0 对预热加购总数与商品上新日销量做了相关性分析,所得相关系数为0.939。说明两者之间存在较强的正相关性,其相关系数的检验P 值近似为零,小于显著性水平0.01,说明两者存在相关性[6]。
从供货商方面的目标函数出发,要使得所有的货物成本总和最小。在预测了货物的上新日销量的具体范围后,对于不同种类的货物而言,其库存成本也是不同的。将库存成本视为每种货物的权值,即目标函数就是使得所有货物的加权平均值最小。
综上所述,补单步骤应该要结合历史的活动销量和预热加购情况,预测好未来一个月的销售情况,并在此基础上统计现有库存,使所有货物的加权平均值最小即可。具体步骤如下:
第一,分析货物的上新量和延期比的分布情况。先为货物的上新量选取合适且合理的数值,再探究上新量与延期比之间的内在联系,并作出其分布图像。
第二,处理分布范围及置信区间。各类货物的上新量与延期比应当是相互独立且服从同一分布,并具有有限的方差与均值,由此得出上新量与延期比服从正态分布,并将置信水平设置为95%,计算其分布范围与置信区间。
第三,划分季度进一步分析各个季度货物的上新量和延期比的分布情况。实则是考虑货物由于季节变化、活动促销等因素,对货物销售所造成的影响程度。
第四,结合货物的未来5 d 的销量预测情况,在综合考虑库存成本,延期比,利润损失等方面确定补单策略。
本文主要探讨了电商平台的供货商和商家的补单策略,从提高利润,减少库存的角度,对已知333 种货物的销售情况进行统计分析,建立货物销量的预测模型,科学地预测未来5 d 的货物销量情况,进而提出补单策略,对实际生活具有一定的指导作用。