李 兆
(中国人民银行哈尔滨中心支行,哈尔滨150001)
2005年的“阜阳奶粉事件”和2008年的“三聚氰胺”事件给势头正盛的中国奶制品行业带来致命性打击,受此影响,行业内不少企业生产停滞,奶制品总产量首次出现负增长。三鹿、蒙牛、雅士利、伊利等众多品牌泥足深陷,消费者对国产奶粉失去信任,2009年开始婴幼儿奶粉进口量出现爆发式增长。受到国际奶源价格、国内奶制品需求、进口奶粉数量、生产周期等因素的影响,原料奶价格出现了较大幅度的波动。原料奶价格关系到广大奶制品企业和众多奶农的生产和发展,同时关系到奶制品价格,对居民生活影响巨大。原料奶的未来价格走势一直是理论研究的重点。近年,已经有多种方法应用于原料奶价格预测中,如Holt-Winters季节乘积模型、ARIMA模型、时间序列分析等。上述模型和方法不能对原料奶价格的非线性特征、周期性因素、突发性事件进行良好的解释和预测,同时影响原料奶价格形成的因素众多,无法全部量化研究。基于此本文选用了Elman神经网络模型对原料奶价格走势进行预测,并取得了良好的效果。
神经网络是20世纪80年代由美国物理学家Hopfield提出的一种基于神经科学、数学、物理学等多个学科发展而来的技术。神经网络通过模仿人脑神经元信息处理机制建立起数据处理模型,是对人类大脑的简化和模拟。神经网络由大量人工神经元相互连接进行计算,神经元可以根据外界数据的变化发生改变,连接各神经元的权值通过对信息的不断学习发生变化,最终获得解决问题的能力。
神经网络可以通过对样本的训练实现从数据输入到数据输出的任意非线性函数关系的映射,通过这种映射得出数据的内在规律。神经网络的特征有以下几种。一是自学习、自适应性。神经网络可以通过自主学习、训练、发掘历史数据隐含的规律,通过调节权值和阈值改变自身性质以适应环境。学习功能对时间序列预测具有重要意义。二是非线性特征。由于价格变化受到供需、政策、环境等复杂因素影响,传统的线性预测模型往往难以在短时间内找出影响变量,对价格趋势作出准确判断。非线性的神经网络可以对复杂的、缺乏规律的数据进行处理,具有无可比拟的优势。三是容错性。神经网络对信息的储存是分散的,每个神经元都接受信息并单独进行运算输出结果,因此网络中局部神经元损坏不会影响神经网络的整体功能。由于神经网络具有上述特点,本文将使用该模型对原料奶短期价格走势进行研究。
Elman神经网络是一种典型的局部回归网络,它由输入层、隐含层、连接层和输出层组成。连接层有一个延迟单元,可以记忆过去的状态,并在下一时刻作为隐含层输入,因此该模型具有动态记忆功能,比较适合处理时间序列问题。假如采用前n期的数据预测第n期的数据,Elman网络结构如图1所示。
图1 Elman网络结构
Elman网络将数据分为训练样本和测试样本。抽取x1——xn作为第一个训练样本,这里用x1、x2…xn-1作为自变量,xn作为目标变量;抽取x2——xn+1作为第二个训练样本,这里用x2、x3…xn作为自变量,xn+1作为目标变量,以此类推。
原料奶属于鲜活的畜牧业产品,价格在短期内波动幅度较大,影响因素包括产量、需求量、地理位置、税收政策、天气因素、成产成本、奶产品销售价格等。传统的计量模型在预测原料奶未来价格时往往会出现重要影响因素遗漏和政策因素难以量化成数据的问题,计量结果难以准确预测未来价格。神经网络模型的自学习和非线性特征可以通过对网络训练寻找时间序列的隐含规律和特征,并将规律和特征在预测中延续下去。因此,可以采用过去的原料奶价格预测其未来价格。
本文整理了农业部市场与信息经济司2009年1月至2017年11月每月发布的《农产品供需形势分析月报》中原料奶月度平均收购价格,单位为元/千克,共计107个数据。为了加快模型训练的收敛速度并消除各向量的量纲差异,避免预测误差。首选使用mapminmax方法对矩阵进行归一化处理,将矩阵的每一行处理成-1至1之间。
产量、需求量、地理位置、税收政策、天气因素、成产成本、奶产品销售价格这些原料奶价格影响因素在短期内具有一致性。从原料奶价格走势中也可以看出,每半年的价格变化趋势是接近一致的。因此本文在构造样本集时选择每6个数据样本作为自变量,第7个数据样本作为目标变量。这样,将原本107个数据向量转化为7*101的矩阵,该矩阵每一列均为一个样本。
本文将2009年至2016年的样本数据作为训练样本,将2017年的样本数据作为测试样本。即将前90个样本作为训练样本,后11个样本作为测试样本。
使用MATLAB神经网络工具箱中的elmannet函数构建模型。神经网络的隐含层神经元数量会影响网络的预测能力。测试后,本文设置隐含层神经元个数为15个,最大迭代次数为2000次。训练过程如图2。
图2 Elman网络结构
将归一化处理后的原料奶价格输入Elman反馈网络并进行训练。对测试样本和预测样本进行测试和预测。因为进行测试时使用的是归一化后的数据,这里将实际输出结果反归一化为正常的数据。训练数据和测试数据的拟合效果如图3所示。可以看出通过训练得到的Elman输出值和训练数据和测试数据本身拟合度很高。其中训练数据的模型的均方差值为9.561e-4,测试数据模型的均方误差值为3.776e-4。
图3 拟合结果
本文选用了2017年的原料奶价格作为测试数据,输入训练好的Elman网络模型中后得到预测值(见下表),测试样本的相对误差在0.07%至0.99%之间,模拟精度比较高。这表明训练好的Elman网络模型对测试数据也具有很好的适应性。该方法是测原料奶价格走势的一个比较准确的方法。同时这种方法也可以运用于其他农畜产品价格预测中。
表 2017年原料奶价格预测结果
Elman人工神经网络模型具有自适应、自学习的能力,能够找到时间序列中输入—输出之间的非线性映射关系。实证结果表明,使用Elman神经网络模型能够较为准确的预测原料奶短期价格走势,具有非常高的精准度,相对其他价格预测方法具有一定优势。这一研究对原料奶价格建模和预测、帮助奶产品企业制定生产采购计划具有理论和实践意义。
参考文献:
[1] 陈 思,钱贵霞.原料奶价格波动及其调控政策[J].农业展望,2011(6).
[2] 张喜才,张利痒.原料奶价格形成机制的特征、模式与政策建议[J].中国乳业,2010(4).
[3] 孙红敏,吴静婷,李晓明.基于改进BP神经网络的价格预测模型研究[J].东北农业大学学报,2013(8).
[4] 贺艳辉,袁永明,张红燕,等.基于神经网络的水产品价格预测模型研究[J].农业网络信息,2010(11).