黄 凯,王 健
(福州大学 经济与管理学院,福建 福州 350108)
我国拥有丰富的农业资源,对生鲜农产品的生产、消费和贸易具有诸多优势。在消费升级和消费需求激增的背景下,消费者更多地追求生鲜农产品的高品质和实效性。据统计,我国生鲜农产品产量中肉类、水产品、水果、奶类及蛋禽类总产量由2007年的34 065.9万t增加到2018年的47 075.8万t,蔬菜产量由2007年的15 615千hm2增加到2018年的20 439千hm2。根据中物联冷链委统计数据,2017年中国冷链物流市场规模达到2 386亿元,2018年中国冷链物流市场规模达到2 987亿元,同比增长25.19%。目前,我国冷链物流市场规模将近3 000亿元,生鲜农产品的市场呈现日益扩大的趋势,势必会对农产品冷链物流的发展提出新的更高的要求,发展生鲜农产品冷链物流存在较大空间。
为有效把握事物的发展方向和增长趋势,选取合理有效的预测模型显得尤为关键。现有研究主要运用偏最小二乘回归[1]、ARIMA模型[2]、灰色预测模型[3]等预测模型,根据单一时间序列数据进行预测。此外,考虑到影响需求变化的因素较多,已有研究运用BP神经网络[4]、RBF神经网络[5]、支持向量回归[6-7]、机器学习[8-9]、最优组合预测模型[10-11]等方法预测不同领域的事物发展变化规律,并呈现出较好的预测结果。预测不仅能呈现预测数值的增减趋势,还能实现信息共享[12],同时也有助于提出相关产业或行业进一步优化发展的措施和策略[13]。在物流需求预测方面,物流需求的变化是由多方面影响因素共同作用的结果。鲁渤等[14]基于引力模型对区域物流需求进行有效预测,并指出科学预测物流需求量对物流园区的建设规划具有重要意义。李瑞等[15]分别运用RBF神经网络方法、GM(1,1)预测模型和BP神经网络方法,对物流业能源需求进行预测,发现相较于其他两种方法,RBF神经网络方法预测精度更高。韩慧健等[16]提出一种基于模糊认知图的社会物流需求预测方法,研究表明该模型预测精度较高,具备对社会物流总额的短期预测能力。YAN等[17]分析青岛市物流需求的影响因素,并利用优化后的支持向量机模型对物流需求进行预测。蔡婉贞等[18]采用BP神经网络和RBF神经网络预测港口物流需求量,并根据两个单一预测模型预测结果设置不同权重,构建组合预测模型。在生鲜农产品冷链物流方面,有的研究从理论层面出发,探讨生鲜农产品冷链物流发展模式、发展对策[19],还有研究从技术层面出发,对生鲜农产品冷链物流网络节点和配送路径的优化[20]等展开探讨,但鲜有研究涉及生鲜农产品冷链物流需求预测方面。
因此,笔者提出基于GM(1,1)模型、BP神经网络和RBF神经网络的生鲜农产品冷链物流需求组合预测模型,并选取2007—2017年我国生鲜农产品冷链物流需求量及影响因素数据,对我国生鲜农产品冷链物流需求量进行预测分析。本研究的创新点在于:①不同于现有研究对生鲜农产品物流预测采取单一预测模型的研究方法,笔者采取组合预测模型对生鲜农产品冷链物流需求进行预测,以寻求高精度的预测模型;②不同于已有研究单纯预测生鲜农产品物流的需求量,笔者在综合考虑多方面影响因素的基础上,对生鲜农产品冷链物流需求预测进行研究。
GM(1,1)预测模型是先将原始序列进行累加,然后构建一阶线性微分方程,得到拟合函数后再对系统进行预测。
(1)
式中:k为时间;a为发展灰数;b为内生控制灰数;x(0)(1)为原始序列;x(1)(k)为原始序列数据的一次累加值。
BP神经网络模型是一种监督性网络类型,由输入层、隐含层和输出层组成。输入信号先向前传播到隐含层,经过作用函数后将隐含层的输出信息传播到输出层,最后给出输出结果。此方法可以弥补传统预测方法的缺陷,能够真实地映射各个影响因素之间的非线性关系。
构建BP神经网络模型的步骤:首先,确定各层节点的个数,将各个权值和阈值赋予[-1,1]之间的随机值,接着输入样本数据和相应的期望输出,对每一个样本进行学习,根据输入样本计算出实际的输出及隐含层节点的输出;其次,计算实际输出与期望输出之间的差值,然后计算输出层与隐含层的误差,根据这一误差来更新输入层-隐含层节点之间、隐含层-输出层节点之间的连接权值;最后,求得输出节点误差E,判断E是否收敛到给定的学习精度内,若满足,则停止学习,否则继续学习,重复上述步骤。
(2)
式中:zl为隐含层节点输出;xi为输入节点;wli为输入节点与隐含层节点间的网络权值;θl为隐含层的阈值;f1为隐含层的激活函数。
(3)
式中:yj为输出层节点输出;zl为隐含层节点;vjl为隐含层节点与输出节点间的网络权值;θj为输出层的阈值;f2为输出层的激活函数。
(4)
式中:tj为输出节点的期望值;E为输出节点误差。
RBF神经网络具有较强的学习速度和自适应能力,不仅能处理输入的样本数据,还能处理与输入样本数据相似的数据。因此,通过学习历史数据,可以找到生鲜农产品冷链物流发展各影响因素与冷链物流需求之间的非线性映射关系。
RBF神经网络的学习过程主要包括监督学习阶段和非监督学习阶段。非监督学习阶段采用K-means聚类法对训练样本的输入量进行聚类找到Cl,然后进行监督学习,监督学习阶段采用最小二乘法求解输出权重w。隐含层由一组径向基函数构成,其可将低维度的输入变量映射到高维空间,实现线性可分;输出层则对隐含层的输出进行线性加权求和得到网络的最终输出。
(6)
式中:y′为最终实际输出;X∈RN为输入变量,l为隐含层节点数;w为权系数;Cl为基函数中心;‖X-Cl‖为欧氏距离;σ为方差。
考虑到单独一个子模型在预测过程中结果并不稳定,笔者将分别计算出3种子模型的均方误差,然后求出组合模型的权系数,运用预测误差平方和达到最小的加权平均组合预测模型。具体预测运算过程如下:
假设m个子预测模型预测同一个序列,那么由m个子预测模型构成的最优组合预测模型为:
(7)
笔者选取蔬菜、水果、肉类、禽蛋产品、乳制品、水产品作为生鲜农产品的主要研究对象,将这6类农产品的全国居民人均主要食品消费量作为生鲜农产品冷链物流需求量的输出数据。
以往研究大多考虑单一指标进行预测,笔者从多角度影响因素出发,且基于数据的可得性,从生鲜农产品供给、社会经济发展、冷链物流发展、可持续发展条件、交通信息技术条件选取主要影响指标,具体为:社会消费品零售总额X1,人均GDPX2,生鲜农产品产量X3,蔬菜播种面积X4,互联网宽带接入端口X5,食品制造业资产总额X6,农林牧渔固定资产投资X7,交通运输、仓储和邮政业固定资产投资X8,信息传输、软件和信息技术服务业固定资产投资X9,全国总人口数X10,冷库容量X11,冷藏车保有量X12,城镇居民消费水平X13,公路总里程X14,普通本专科毕业生人数X15,并将这15个主要影响因素的数据作为输入数据。以上数据均从2008—2018年《中国物流年鉴》《中国冷链物流报告》《中国统计年鉴》中获取,其中生鲜农产品产量是由《中国统计年鉴》中每年水果产量、肉类产量、奶类产量、禽蛋产量和水产品产量进行加总求和得到,又由于蔬菜播种面积的单位是千hm2,未能统一单位,故单独列出。
首先,对数据进行标准化处理,将数据转化到[0,1]之间。其次,对影响因素与因变量的相关性进行分析,结果显示城镇居民消费水平X13、公路总里程X14、普通本专科毕业生人数X15这3个因素与因变量的相关系数均低于0.80,故舍去;其他12个因素与因变量的相关系数均大于0.85,各因素的关联度排序为:X3>X10>X2>X8>X1>X4>X11>X9>X12>X7>X5>X6,说明选取的影响因素均具有较强的解释能力和代表性,能够用于生鲜农产品物流需求预测。最后,选取12个影响因素与因变量进行预测分析,原始数据如表1所示。
表1 2007—2017年生鲜农产品冷链物流需求量及其影响因素原始数据
3.2.1 GM(1,1)模型构建及仿真分析
构建GM(1,1)模型并利用Matlab工具对数据进行计算,可得参数a=-0.001 9,b=189.221 5。GM(1,1)模型的仿真结果如图1所示,可看出GM(1,1)模型的预测值和实际值的拟合效果并不理想,预测值与真实值的误差较大,有70%的时间节点的预测值高于实际值,且数值波动较大。2014年真实值与预测值之间的误差最大,相对误差值达到4.5%,2016年相对误差值逐渐降低到0.5%左右。
图1 GM(1,1)模型的仿真结果
3.2.2 BP神经网络模型构建及仿真分析
基于初始样本归一化后的数据,将2007—2014年数据作为BP神经网络的训练样本,将2015—2017年的数据作为检验样本,用于检验和证明模型应用于本研究的可行性。通过对训练结果进行比较,当网络隐含层的神经元为10个时,网络的训练结果最优,平均绝对百分误差最小。由于BP神经网络存在较大的波动性,故需要进行多次训练才能达到理想的预测结果。BP神经网络模型的仿真结果如图2所示,可看出BP神经网络模型的预测值与真实值的增减趋势较为一致,其中2011—2014年的预测值与真实值之间存在较大偏差,2012年真实值与预测值之间的误差最大,相对误差值达到3.57%。其余年份的预测值与真实值的相对误差均在1%上下浮动。
图2 BP神经网络模型的仿真结果
3.2.3 RBF神经网络模型构建及仿真分析
构建一个多输入、单输出的RBF神经网络农产品物流需求预测模型,选取12个影响因素作为输入变量,将生鲜农产品物流需求作为输出变量,创建神经网络并选取2007—2017年样本数据进行模拟仿真。RBF神经网络模型的仿真结果如图3所示,可看出RBF神经网络模型的预测值与真实值整体拟合程度较好,2011—2013年预测值存在较大波动,2011年相对误差为2.99%,2012年相对误差为3.45%,2013年相对误差为2.42%,其余年份的预测值与真实值的相对误差均低于2%。
图3 RBF神经网络模型的仿真结果
3.2.4 组合预测模型构建及仿真分析
根据上述3种单一预测模型的预测结果,按照式(7)建立方程组,计算出GM(1,1)模型、BP神经网络模型和RBF网络模型的加权系数分别为0.243 3、0.374 9、0.381 8。按照以上加权系数构建组合模型,仿真结果如图4所示,可看出相较于3种单一预测模型的预测结果,组合预测模型的预测结果更加接近真实值,数据增长趋势保持较高的一致性,拟合程度最佳,预测值与实际值的相对误差均低于3%。
图4 组合预测模型的仿真结果
3.2.5 模型精度分析
对3种单一预测模型和最优组合模型关于农产品生鲜冷链物流需求预测结果的残差平均值(MAE)、相对误差平均值(MAPE)和误差均方根(RMSE)进行对比分析,结果如表2所示。由表2可知,在3种单一预测模型中,RBF神经网络模型的预测精度相对最高,残差平均值为2.689,相对误差平均值为1.08%,误差均方根为2.991;BP神经网络模型的预测精度稍微弱于RBF神经网络模型,二者总体差别并不突出;由于GM(1,1)模型只具有短期的预测精度,故其预测精度最小,残差平均值为4.905,相对误差平均值为1.49%,误差均方根为5.500;最优组合预测模型的残差平均值、相对误差平均值和误差均方根均小于RBF神经网络预测模型,证明该组合预测模型能够达到最优预测精度,能够有效预测我国生鲜农产品冷链物流需求。
3.2.6 未来5年冷链物流需求预测分析
运用组合预测模型对2018—2022年未来5年我国生鲜农产品冷链物流需求量进行预测,结果如图5所示,可看出我国2018—2022年的生鲜农产品冷链物流需求量将逐年递增,每年保持1%的增幅,到2022年将达到人均229.962 kg。
笔者分别借助GM(1,1)模型、BP神经网络模型、RBF神经网络模型和最优组合预测模型,对生鲜农产品冷链物流需求展开预测和分析,得到如下主要结论:①对于单一预测模型而言,BP神经网络模型和RBF神经网络模型的预测结果相似,RBF神经网络模型预测精度相对较高。②基于GM(1,1)模型、BP神经网络模型和RBF神经网络模型构建最优组合预测模型,预测的平均误差均小于以上3个单一预测模型,说明该组合模型可有效预测我国生鲜农产品冷链物流需求,为生鲜农产品冷链物流需求预测提供一种新的途径和方法,丰富了生鲜农产品冷链物流需求预测方法。
虽然笔者借助最优组合模型对我国生鲜农产品冷链物流需求进行了有效预测,但仍存在一定的不足之处。首先,我国冷链物流发展相关指标统计不够完善,今后在指标体系构建方面有待进一步改善。其次,最优组合模型如何在长期时间序列中更好地保持预测精度这一问题也有待进一步改进。
近年来,我国生鲜农产品行业规模增长稳健,生鲜交易规模从2011年的1.12万亿元增长至2018年的1.91万亿元,并保持每年6%以上的增长趋势,未来市场空间将持续上升。由影响因素关联度分析结果可以看出,交通运输、仓储和邮政业固定资产投资,信息传输、软件和信息技术服务业固定资产投资,食品制造业资产总额等因素都与冷链物流需求量的发展存在密切关系,结合我国生鲜农产品冷链物流需求量预测趋势,提出如下建议:
(1)加强城乡冷链物流设施建设。2019年7月末,中央政治局召开会议,明确城乡冷链物流设施建设是三大补短板工程之一。从物流需求的角度出发,政府需要探索产业内需潜力,扩大最终需求,有效启动农村市场,促进鲜活农产品发展。
(2)激励企业创新,创建出新的冷链物流运营体系,开展多元化经营和“产销双向合作”。开辟第三方平台,监视冷链物流的全过程,加强全程温湿度监控,降低“断链”风险,确保鲜活农产品质量和消费安全。