王晓平 彭文凯 卢怀宇
摘要:农产品冷链物流需求系统具有非线性、历史数据少、影响因素众多等复杂特征,而支持向量机在解决小样本、非线性和高维模式识别问题等方面具有突出优势。引入支持向量机模型,以北京城镇为例,从农产品供给、社会经济、冷链发展、人文、物流需求规模五个角度构建其指标体系,对其2000-2014年的农产品冷链物流需求进行建模,进而对2015-2020年城镇农产品冷链物流需求量进行预测。结果表明,建立的模型对冷链物流需求与其影响因素的非线性关系方面有较高的精度和应用价值,能够为农产品冷链物流规划者及政府提供定量的决策依据。
关键词:农产品;冷链物流需求;支持向量机;灰色关联分析;预测模型
中图分类号:TP311.521;F252 文献标识码:A
文章编号:0439-8114(2018)15-0088-07
DOI:10.14088/j.cnki.issn0439-8114.2018.15.023 开放科学(资源服务)标识码(OSID):
Forecast of Cold Chain Logistics Demand for Agricultural Products in Beijing
Based on Support Vector Machine Model
WANG Xiao-ping,PENG Wen-kai,LU Huai-yu,YAN Fei
(School of Logistic,Beijing Wuzi University,Beijing 101149,China)
Abstract: The cold chain logistics demand system of urban agricultural products in Beijing has many complex characteristics, such as non-linearity, few historical data, and many influencing factors, while support vector machine has outstanding advantages in solving the problems of small samples, non-linearity and high-dimensional pattern recognition. Therefore, the support vector machine model was introduced to train the data of the cold chain logistics demand of agricultural products in Beijing from 2000 to 2014, and then the cold chain logistics demand of agricultural products in Beijing from 2015 to 2020 was forecasted. The results showed that the support vector machine model can effectively fit the complex trend of agricultural products cold chain logistics demand system in Beijing, which could provide quantitative decision for agricultural products cold chain logistics planners and the government.
Key words: agricultural products; cold chain logistics needs; support vector machine; grey correlation analysis; prediction model
近年来,以国内外市场需求为背景,从中央到地方都非常重视冷链物流体系建设,并提出一系列保障冷链物流健康、持续发展的政策。2010年,国家发展和改革委员会颁布《农产品冷链物流发展规划》,指出2010-2015年中国农产品冷链物流发展的主要任务和重点工程。2015年,国家物流标准化技术委员会编制的《物流企业冷链服务要求与能力评估指标》、《水产品冷链物流服务规范》、《低温仓储作业规范》为农产品供应链的冷链物流提供了标准规范,对规范物流企业冷链服务水平具有重要的指导作用。2016年,李克强总理指出要突破冷链运输滞后的“硬瓶颈”,建设农产品流通全程冷链系统,再次引起市场对冷链农产品的关注。除此之外,各省市也针对自身特点,提出相关解决冷链物流问题的措施。因此,在食品质量安全及冷链物流等问题不断突出和倡导绿色经济的背景下,对农产品冷链物流进行需求预测,既对冷链物流行业乃至提高冷链效率、保证食品安全有重要意义,又能为农产品冷链物流合理规划及政策制定提供依据。
1 文献综述
需要使用冷链的农产品一般是一些初级农产品,本研究指定冷链农产品的范围包括:水果、蔬菜、水产品、肉、蛋、奶。国外关于冷链物流的研究内容主要包括五个方面:安全监测研究、绩效评价研究、信息化建设研究、供应链管理研究、影响因素研究[1-3]。但是他们很少涉及农产品冷链物流需求,只有个别学者研究了农產品冷链物流的稳定性和运输成本与需求的关系。国内的冷链物流业起步晚,相关研究主要集中在冷链物流产业的经济效益、基础设施建设以及冷链产业规划上。到目前只有个别学者研究农产品冷链物流需求的预测方法,本研究基于前辈学者对冷链物流的研究,并借鉴其他行业的需求预测方法,从冷链物流的内涵、预测方法以及现有的农产品冷链物流预测三个方面进行了一些研究。
针对农产品冷链物流需求的内涵,王之泰[4]认为,农产品冷链物流需求是指消费者对生鲜农产品的需求而产生的对具有冷藏环境的前端生产制造环节、后端消费运用环节和中间商流环节的需求。兰洪杰等[5]认为,冷链物流需求是人民对冷冻冷藏食品需求而产生的对冷冻冷藏食品运输、仓储、装卸搬运、流通加工、配送以及相关信息处理等物流活动的需要。朱坤萍等[6]认为,农产品冷链物流需求是消费者对水果、蔬菜、水产品、肉、禽、蛋等生鲜农产品的需求,从而产生对生鲜农产品在低温控制下的从产地到贮藏、运输、分销、加工等环节的需求。
在需求预测研究中,Yu等[7]运用多维灰色模型进行道路运输体系预测。Yahia等[8]利用人工神经网络模型对物流需求进行预测。国内进行需求预测以定量方法为主,主要包括马尔可夫链[9]、支持向量机[10]、人工神经网络[11]、线性回归[12]、GM(1,1)模型[13]等单一预测模型及其相关的组合预测模型。
在农产品冷链物流需求预测方法的研究中,Bogataj等[14]研究了易腐产品在冷链物流中的稳定性,为以后更好地研究生鲜农产品物流需求奠定了基础。Yahia等[8]为了解决冷链食品运输成本和需求关系问题,建立了一个确定最佳数量和最优价格的决策模型。国内对农产品冷链物流需求预测的模型主要包括BP人工神经网络[5]、灰色预测[15]、系统动力模型[16]等。
农产品冷链物流需求系统是一个非线性系统,它的各种影响因素相互渗透,增加了农产品冷链物流需求预测的复杂性,除此之外,北京市城镇农产品冷链物流需求系统可用的历史数据少,导致部分模型预测精度不够;采用神经网络模型预测会由于样本得不到充分训练而导致预测性能不稳定;而灰色模型预测仅適合具有指数递增特性的数据,否则预测效果不好。因此预测北京城镇农产品冷链物流需求要引入新的模型方法。总体而言,讨论北京城镇农产品冷链物流需求变动趋势、预测北京城镇未来农产品冷链物流需求的文献还很少。因此可以选取支持向量机模型进行预测,它有统计学习理论基础和较高的学习性能,专门研究有限样本情况下非参数估计问题,在解决小样本、非线性及高维模式识别问题方面与传统方法相比优势突出,并已成功应用于多维函数预测等领域。基于此,本研究在分析影响北京市城镇农产品冷链物流需求主要影响因素的基础上,针对其农产品冷链物流需求系统具有非线性、历史数据少以及影响因素众多等复杂特征,引入支持向量机模型,预测北京2015-2020年农产品冷链物流需求变化趋势,以其为相关部门的决策提供依据。
2 数据来源与研究方法
2.1 数据来源
对北京城镇居民农产品冷链物流需求做预测时,首要工作是数据收集和整理。本研究涉及到的数据是根据2000-2016年的《北京统计年鉴》《北京市冷链物流报告》《中国冷链物流发展报告》《中国统计年鉴》及相关网站中的相关数据直接引用或者间接计算得出,由于篇幅有限,数据处理过程略,因而保证了数据的可靠性和口径的一致。同时由于冷链的相关数据统计工作开始较晚,部分数据不可获得,因此本研究根据数据的可获得性、已有文献的总结以及实践中所有可能影响北京农产品冷链物流的影响因素来整理查找影响指标,并统计相关数据。
尽管中国各类统计报表中没有农产品冷链物流需求量指标,但是生鲜农产品的需求量就是很好的农产品物流需求参照数据。考虑到使用农产品冷链物流的需求者一般为城镇顾客,故本研究使用北京城镇常住人口数量和城镇人均生鲜农产品消费量的积作为北京农产品冷链物流的需求量,并以此作为预测京津冀农产品冷链物流需求量的因变量,选取冷链农产品需求量作为农产品冷链物流需求量,用与农产品冷链物流需求高度相关的18个影响因素作为自变量(表1),建立农产品冷链物流需求预测模型。
2.2 研究方法
2.2.1 灰色关联分析
灰色关联分析可以根据系统因素的变化态势,计算出各因素间的关联度,计算步骤为[17]:
设若干年前的农产品冷链物流需求总额为原始数据,经处理后生成一个参考数列,记为公式(1):
X0=[X0(1),X0(2),…,X0(n)] (1)
各影响因素指标数据生成的比较数列集,记为公式(2):
Xi=[Xi(1),Xi(2),…,Xi(n)] (i=1,2,…,m)(2)
则实数:
ξ(K)=
■(3)
称为Xi对于X0在点K的关联系数,其中ρ∈[0,1]。
各影响因素与需求间的关联公式为:
γi=■∑■■ξi(K) (4)
式中γi的值越大,表示比较数列和参考数列之间的关联度越大。
2.2.2 预测农产品冷链物流需求系统的支持向量机模型
1)支持向量机学习算法基本原理。支持向量机(SVM)是一种基于统计学习理论的方法,基于结构风险最小化原则[18],对未来样本有较好的推广性。
2)支持向量机回归算法设计。支持向量机模型预测的基本思想是将输入的各种农产品冷链物流需求影响因素x1,x2,…,xd映射到一个高维特征空间[ψ(x1),ψ(x2),…,ψ(xd)],即可将原非线性模型转化为特征空间的线性回归模型:
f(xj)=wTψ(xj)+b (5)
式中,w、b是需要进行辨识的参数。对式(5)中需要辨识的参数进行处理:
Remp(f)=∑■■C(ei)+λ||w||2 (6)
式中,Remp(f)为经验风险;||w||2为置信风险; C(ei)为损失函数。求解式(6)等价于求解式(7)中的优化问题ψ(Xi):
min L=■wTw+C∑■■C(?着i′)+?着i
s.t. y-(w,ψ(Xi))-b≤?着i+?着i′(w,ψ(Xi))+b-y≤?着i+?着i′?着i′,?着i≥0 (7)
通常把式(7)转化为对偶问题,得函数f(x):
f(x)=∑■■(ai-ai′)K(Xi,X)+b (8)
式中,ai和ai′是支持向量机参数;K(Xt,X)是内积函数。本研究选择径向基核函数(RBF):
K(Xt,X)=exp{-■} (9)
将式(9)代入式(8),等价变换得:
f(x)=∑■■ajexp{-■}+b (10)
其中,aj是支持向量的对应参数值;xj是训练年份的输入数据向量;xv是预测年份的输入数据向量;f(x)为输出向量集。通过式(10)得到农产品冷链物流需求预测参数aj和b,并估计出农产品冷链物流需求预测模型。本研究计算通过Matlab軟件编程来实现。
3 实证与分析
3.1 影响因素分析与选取
农产品冷链物流需求系统是一个非线性的复杂系统,需综合考虑相关的经济、社会、人文、物流等多种影响因素,并充分考虑这些因素之间存在的联系和制约关系。结合农产品冷链物流消费及需求领域的已有研究成果,在分析2000-2016年实际数据的基础上,按照综合性、可比性及可获得性原则,对北京农产品冷链物流需求的主要影响因素进行归纳和筛选,包括以下5个方面。
3.1.1 农产品供给 农产品的有效供给能够保障供应商有足够的商品来满足消费者的需求,同时保证农产品的价格在合理的层面,达到供需平衡,刺激消费,从而影响农产品冷链物流需求量。本研究在相关文献的基础上查找能够影响农产品供给的影响指标,根据数据的可获得性和对需求影响的相关程度,选取的农产品供给影响指标有北京市冷链食品的批发市场成交量、北京市农产品生产价格指数、北京市生鲜农产品年产量。
3.1.2 社会经济指标 由于经济发展制约着冷链发展,因此社会经济增长将会影响消费者对冷链产品的消费。而冷链农产品的消费量,直接受制于社会经济的发展水平。本研究使用的社会经济指标有北京市社会商品零售额、北京市社会固定资产投资、北京市地区生产总值、北京市第三产业占比、北京市第一产业增加值。通过这5项指标可以较为准确全面地反映北京市的社会经济发展。根据表1可知,随着社会经济的发展,北京市的社会商品零售总额、社会固定资产投资、地区生产总值、第三产业占比、第一产业增加值都是逐年增加,年均增长率分别为14.19%、12.74%、14.22%、1.33%、4.00%。同时,2000-2016年间北京市农产品冷链物流需求量从314.27万t增长到574.32万t。农产品冷链物流需求量随着其经济增加而增加,说明二者间存在正向影响关系。
3.1.3 冷链水平 由于冷链相关的统计工作开展较晚,根据数据的可获得性和指标选取的科学性,本研究选取北京市农产品冷链物流损失率、北京市冷库容量、北京市冷链物流综合流通率来衡量冷链物流的发展水平。由表1可知,近年来,北京市冷链发展迅速,农产品冷链物流损失率逐年递减,由2000年冷链损失率为57.22%下降到2016年的23.80%,且至2016年,冷库容量已增至125.18万t,冷链物流流通率达到10.97%。冷链损失率的降低,冷库容量和冷链流通率的上升,在拉动冷链物流业发展的同时,还刺激着农产品冷链物流需求的快速增长。
3.1.4 人文发展 随着人民消费水平的提高,消费者对食品质量和安全性要求更高,冷链需求量也会随之提升,人文的发展直接影响消费者对农产品冷链物流的需求。从已有的研究需求方面的文献来看,几乎所有的文献都将人文资源作为影响需求预测的一个重要的影响因素。结合已有的研究结果,同样选取人文发展作为影响农产品冷链物流需求的因素之一。本研究选取3个人文发展的影响指标,分别是北京市的城镇居民人均消费支出、城镇人口数量、第三产业从业人员。
3.1.5 物流需求规模 物流的发展水平决定了农产品冷链物流的发展水平,物流需求规模同样能够反映物流发展水平以及消费者的需求能力。物流的发展水平反映了物流基础设施、物流技术水平、供应量管理水平等物流发展的综合能力。因此本研究选择物流需求规模作为影响农产品冷链物流需求的影响因素之一。本研究选取4个物流需求规模的影响指标,包括北京市的货物运输量、社会物流总费用、货运周转量、公路营运汽车拥有量。
当然,除上述5个方面的18个主要影响因素外,还有其他影响因素,如国家宏观政策、冷藏设备和技术、冷链从业人员等,由于以下原因未将这些影响因素考虑在内:①难以将国家的宏观政策对农产品冷链物流的影响进行量化,导致没有相关的统计数据;②没有相关机构对北京市的冷藏车数量及相关指标进行准确的统计,故没有相关数据;③冷链从业人数会随着冷链技术的提高而减少,又会随着冷链产业规模的扩大而增加,因而并不能真正反映农产品冷链物流需求市场的供求关系。
3.2 研究结果分析
3.2.1 影响因素间关联度分析 对表1中数据进行无量纲化处理(X=Xi/X1),并将北京生鲜农产品年需求量与18个影响因素进行灰色关联度分析,分析结果如表2所示。结果显示这18个影响因素与生鲜农产品年需求量的关联度排序为X13>X8>X7>X2>X18>X11>X3>X15>X14>X17>X9>X10>X12>X1>X5>X4>X6>X16。在这18个指标中,有17个指标的关联值均大于0.750,说明本研究中归纳和筛选的17个指标与北京市农产品冷链物流需求量之间都有较强的关联度,适用于农产品冷链物流需求预测。其中社会物流总费用和生鲜农产品年需求量的关联度为0.600,关联值偏小,说明其对生鲜农产品年需求量影响较小,故将其舍去。
3.2.2 影响因子预测 应用SPSS 22.0软件中的曲线估计功能构建17个主要驱动因子值与时序的最优拟合方程(表3),使用最优方程对主要驱动因子值预测。
3.2.3 支持向量机运算 首先,将北京城镇农产品冷链物流需求影响因素作为支持向量机模型的输入,农产品冷链物流需求量作为输出,对2000-2014年的历史数据(训练样本)进行模拟与仿真(图1)。
在样本训练和预测时,需要确定支持向量机正规化参数C和RBF核函数参数?滓2。将最终预测结果产生的误差作为评价标准,通过反复试验,最后确定当C=5 000,?滓2=90时,预测结果较为精确,其中,通过训练可获得SVM模型参数的aj值,当aj不为0时对应的输入样本是支持向量,b值为1.284。将得的参数aj和b代入式(10)中,估计出农产品冷链物流需求预测模型,并计算出2015-2020年北京城镇农产品冷链物流需求量。
3.2.4 3种模型预测结果对比分析 由表4和表5可知,采用支持向量机模型预测北京2015-2020年农产品冷链物流需求量,预测误差都在2.5%以内,平均预测误差0.49%,实际值与预测值的相关系数达到0.999,预测结果比较接近农产品冷链物流需求量的真实值,即支持向量机模型对北京城镇农产品冷链物流需求的预测效果优异,预测能力突出,可以作为预测北京未来城镇农产品冷链物流需求变化的有效方法。
除此之外,为了进一步验证支持向量机模型在北京市城镇农产品冷链物流需求预测方面的突出优势,本研究同样引入常用预测模型GM(1,1)和BP神经网络,对2000-2014年的北京城镇农产品冷链物流需求量进行预测,预测误差如表4和表5所示。
比较结果显示,GM(1,1)模型的预测误差和BP神经网络的预测误差都高于支持向量机模型,其平均绝对百分误差分别为1.05%和1.55%,高于1%。因此,整体上看,可以认为支持向量机在北京城镇农产品冷链物流需求预测方面的性能优于其他两种常见预测方法。所以,可以采用支持向量机模型对北京市未来城镇农产品冷链物流需求变化进行预测,为有关部门检测农产品冷链物流需求量的变化形势,制定农产品冷链物流发展规划等提供科学依据。
4 小结与讨论
本研究以北京市农产品冷链物流需求量为研究对象,以关联度分析、支持向量机、GM(1,1)、BP神经网络以及预测精度评价模型为研究方法,得到了以下结论。
将18个影响北京市农产品冷链物流需求的主要因素与北京市农产品冷链物流需求进行关联度分析,结果表明,其中17个因素与北京市农产品冷链物流需求都有较高的关联度,适用于北京市农产品冷链物流需求预测,其中北京市城镇人口数量、第一产业增加值、第三产业占GDP比重与北京城镇居民农产品冷链物流需求的关联度最强,关联度分别为0.987、0.982、0.965。
运用支持向量机建立北京市农产品冷链物流需求预测模型,选取2000-2016年北京市农产品冷链物流需求相关数据进行分析,并和经典的两种预测模型GM(1,1)、BP神经网络预测结果进行对比分析,研究结果表明,支持向量机模型根据已有数据的特征,通过反复修正参数,比GM(1,1)、BP神经网络预测模型得到较好的预测效果。
支持向量机模型最终预测出在2017-2020年的北京市农产品冷链物流需求量分别为582.28万、615.32万、636.02万、656.49万t。
支持向量机预测模型是在技术方法层面上对农产品冷链物流需求预测的一种新的尝试。然而由于北京市冷链相关数据的统计不够完整,使该模型的预测效果不尽如人意,还需要在此基础上对支持向量机模型进一步优化;同时这仅是以北京市特定时空范围内为例进行的分析,研究结果是否具有普遍性还需要进一步研究和讨论。
参考文献:
[1] CHEW E P,LEE C,LIU R. Joint inventory allocation and pricing decisions for perishable products[J].International Journal of Production Economics,2009,120(1):139-150.
[2] BANTERLE A,STRANIERI S. Information, labelling,and vertical coordination:An analysis of the Italian meat supply networks[J].Agribusiness,2014,24(3):320-331.
[3] RAAB V,DETERSEN B,KREYENSCHMIDT J.Temperature monitoring in meat supply chains[J].British Food Journal,2013, 113(10):1267-1289.
[4] 王之泰.冷鏈——从思考评述到定义[J].中国流通经济,2010, 24(9):15-17.
[5] 兰洪杰,汝宜红. 2008北京奥运食品冷链物流需求预测分析[J].中国流通经济,2008,22(2):19-22.
[6] 朱坤萍,江琳琳,王赫男.河北省农产品冷链物流市场分析及对策[J].价格月刊,2016(12):64-68.
[7] YU D,QI F Z. The model of highway logistic demand forecasting based on gray neural network[J].Soft Science,2009(11):132-135.
[8] YAHIA E M,ERKAN M,AKSOY U.Cold chain development and challenges in the developing world[J].Acta Horticulturae,2010,877(877):127-134.
[9] 孟凡博,黄开胜,曾祥瑞,等.基于马尔可夫链的混合动力汽车模型预测控制[J].中国机械工程,2014,25(19):2692-2697.
[10] 崔庆安.基于主成分分析与支持向量机的能源需求预测方法[J].统计与决策,2013(17):70-72.
[11] 郝思雨,谢 汀,伍 文,等.基于RBF神经网络的成都市城镇建设用地需求预测[J].资源科学,2014,36(6):1220-1228.
[12] 江登英,张骁腾.高等教育投资需求预测模型构建与统计检验[J].统计与决策,2016(11):38-41.
[13] 刘 伟,夏唐斌.医疗资源配置的动态生成系数灰色预测模型[J].工业工程与管理,2016,21(4):147-151.
[14] BOGATAJ M,BOGATAJ L,VODOPIVEC R. Stability of perishable goods in cold logistic chains[J].International Journal of Production Economics,2005,93-94(1):345-356.
[15] 蒋智凯,陈晓华.基于灰色模型的连云港水产品冷链物流需求预测分析[J].淮海工学院学报(人文社会科学版),2017,15(8):101-103.
[16] 周 宾.陕西果品现代冷链物流需求的SD分析与对策[J].安徽农业科学,2012,40(21):11056-11058.
[17] 邓聚龙.社会经济灰色系统的理论与方法[J].中国社会科学,1984(6):47-60.
[18] 邓乃扬,田英杰.数据挖掘中的新方法——支持向量机[M].北京:科学出版社,2004.