基于集合经验模态分解和自回归神经网络的陇东农产品价格预测方法

2022-09-14 09:46王新武靳佩芸
兰州工业学院学报 2022年4期
关键词:预处理神经网络小麦

王新武 ,靳佩芸

(甘肃医学院 a.公共课教学部;b.药学系,甘肃 平凉 744000)

农业、农村、农民问题的解决事关老百姓的切身利益,乃至整个国民经济的持续稳定发展[1]。伴随着现代农业发展和供求态势的变化,区域农产品市场竞争日益激烈,农产品价格已完全由市场供需关系决定,而农产品市场风险的不断涌现深刻影响着农产品的供给,进而影响到农产品的市场价格呈现波动变化,有时其变化甚至是跃变的[2]。因此,农产品价格的准确预测是农产品市场风险管理和供求宏观调控的前提。

由于农产品价格时间序列呈现出非线性、随机性及多重周期性的复杂特征,传统的基于时间序列的模型如ARIMA、ARCH、多变量回归等[3],通常是在时间序列具有线性变化的前提下构建模型。现实中,影响农产品市场价格的因素众多,农产品市场价格呈现出非线性的特征,传统的时间序列模型只能部分的模拟其变化趋势,且预测精度不高。

近年来,由于机器学习模型能够通过训练和测试,很好的实现具有复杂特征的时间序列的准确拟合[4]。相对于传统的时间序列模型,机器学习模型具有更好的鲁棒性和预测性能。 由于传统的机器学习预测模型多是基于原始时间序列,没有充分考虑到时间序列中的高频噪声,使得机器学习模型在训练过程中难以收敛,因此,选取恰当的数据预处理技术实现对农产品价格时间序列主要特征的提取,进而实现农产品价格的准确模拟就显得尤为重要。集合经验模态分解(Ensemble Empirical Mode Decomposition ,简称EEMD)具有稳健的自主分解能力,能够有效地去除时间序列中混合的噪声,与离散小波变换相比,具有非常明显的优势[5]。因此,基于已有的农产品价格时间序列,构建基于数据预处理和神经网络模型相结合的混合模型,以期实现农产品价格的准确预测仍然是一个研究热点[6]。

基于2020~2021年陇东主要农作物小麦的价格时间序列,采用EEMD对收集到的陇东地区主要农产品小麦的价格时间序列进行数据预处理,借助于NAR神经网络实现农产品价格预测,最后,采用多个评价指标对混合预测模型的精度进行评价。数值模拟实验表明,构建混预测模型EEMD-NAR能够准确实现陇东基础农作物小麦的价格预测。

1 基于数据预处理的集成预测模型

1.1 集合经验模态分解(EEMD)

基于EEMD的数据预处理过程如下:

1) 预先设定平均次数以及添加的白噪声的幅度。

2) 在原始时间序列X(t)中加入幅度为K的白噪声,即

x(t)=X(t)+w(t).

(1)

3) 将新得到的时间序列x(t)通过EMD分解为若干个本征模函数gi(t),i=1,2,…,n与一个残余项Rn(t)的和,即

(2)

4) 重复步骤2)和3),得到不同频率的IMF构成的集合。

5) 由于IMF1包含了高频分量,因此将其去除,将其余IMF分量求和得到最终的数据预处理结果。

1.2 NAR神经网络模型

NAR神经网络模型是一种采用静态神经元和各层网络的输出反馈的动态网络,通过其自回归特性将网络的输出结果再次输入到NAR网络中实现时间序列的模拟。设xi代表NAR的输入,输入层与隐含层的连接权重为ωij,阈值为aj,则NAR神经网络第j个神经元的输出为Hj,即

(3)

式中:i表示输入数据的维数;f是激活函数。将第j个神经元的输出Hj重新输入NAR网络中,得到整个网络输出值O,即

(4)

式中:wj为隐藏层中第j个神经元与输出层神经元相连的权重;b为阈值。NAR的预测误差为

(5)

1.3 混合预测模型

构建的混合预测模型流程如图1所示,具体步骤如下:

1) 采用EEMD对收集到的小麦价格时间序列进行分解。

图1 EEMD-NAR混合预测模型结构

2) 将EEMD生成的新的时间序列划分为训练集和测试集,输入NAR进行预测。

3) 采用纳什效率系数 (NSCE)、相对平均误差 (MAPE)及均方根误差(RMSE)对混合模型EEMD-NAR和单个的NAR、BPNN、ELM预测效果进行评价。

2 EEMD-NAR混合预测模型应用实例

2.1 数据样本选择

我国陇东地区以种植业为主,小麦是陇东地区的基础农作物,小麦价格时间序列来源于金投网(2020-06-25—2021-05-26共336个数据)。整体上,小麦价格具有不稳定、不规则波动特征。受新冠疫情的影响,小麦价格在2020-10-26—2020-10-28出现了暴涨,但很快趋于平稳。实验过程中,选择2020-06-25—2021-04-08的288个样本作为训练集,2021-04-09—2021-05-26的48个样本作为测试集,以验证所构建的EEMD-NAR混合预测模型的预测效果。

2.2 模型评价标准

文中采用NSCE、MAPE及RMSE等评价模型的预测精度,各评价指标的计算如式(6)~(8)所示:

(6)

(7)

(8)

2.3 EEMD-NAR混合预测模型应用

从收集到的陇东地区主要农产品小麦的价格时间序列变化图中可以看出,收集到的时间序列蕴含着随机性和非线性的变化特征。为了获得更好的预测效果,采用EEMD对收集到的小麦价格时间序列进行分解,共得到8个本征模态函数分量,结果如图2所示。

(a) 小麦价格序列

(b) EEMO分解图2 小麦价格序列及EEMD分解结果

从图2可以看出,IMF1和IMF2具有变化频繁和短周期的特征,而IMF3至IMF7具有波动周期长和变化比较平缓的特点,残余量IMF8反映了农产品价格时间序列的总体变化趋势。从IMF8的变化趋势来看,整体上小麦价格序列具有下降趋势。

用NAR分别对分解出来的8个IMF序列进行预测。神经网络的输入层为3,即使用当前3天的价格数据来提前一步预测,选择RMSE作为适应度函数。对模型输出结果反归一化处理,并将所有IMF序列的预测结果相加,作为最终的预测结果。

为了比较所构建的混合EEMD-NAR模型的预测精度,基于原始的观测数据,分别采用ELM、NAR、 BPNN等多个神经网络模型进行预测。所有模型的预测结果如图3所示,各模型预测精度评价指标结果如表1所示。

图3 不同模型预测结果比较

表1 不同模型的预测精度

从图3和表1可以看出,与单个的BPNN、ELM及NAR相比,EEMD-NAR混合模型的预测精度有了较大的提高,这是由于原始的农产品价格序列经过EEMD分解后所得到的各主要IMF分量(IMF2-IMF8)的变化呈现出了强烈的规律性,从而减少了NAR预测的复杂度。从各个模型的预测精度评价指标看,BPNN、ELM及NAR均能够很好的实现陇东地区基础农作物小麦价格的准确预测,这3个单个的预测模型中,NAR的预测精度最高,ELM次之,BPNN的预测效果最差,但NAR的预测精度仍然有待提高。EEMD-NAR混合预测模型的NSCE为0.957 2,RMSE为0.025 6, MAPE 为1.35%,而单一的BPNN、ELM、NAR的NSCE、RMSE、MAPE与EEMO-NAR相比,EEMD-NAR混合预测模型的正向指标NSCE 最大,BPNN的最小;负向指标值RMSE和MAPE显示,EEMD-NAR的RMSE和MAPE均小于单一的BPNN、ELM及NAR预测模型。

相对于单一的预测模型,EEMD-NAR 混合预测模型有着更为突出的优势,这是由于采用BPNN、ELM及NAR进行预测时,未对时间序列进行有效的数据预处理,从而导致预测结果误差较大。因此,采用神经网络模型预测农产品价格时,需要对收集到的时间序列采用必要的数据预处理,从而提取出蕴含在价格时间序列中的波动频率,降低时间序列的波动幅度,对于获得准确的预测结果至关重要。

3 结语

针对陇东地区基础农作物小麦价格时间序列的变化特征,采用了先进的数据预处理技术,实现了原始农产品价格序列中不同特征分量的提取,并构建了EEMD-NAR混合预测模型,对小麦价格时间序列进行了模拟。模拟数值结果表明,构建的混合EEMD-NAR模型较之BPNN、ELM及NAR等单个模型具有更高的预测精度,为基于时间序列建模的农产品价格预测提供了一种新的思路和新的建模方法,为有效实现农产品市场的风险管理和缩短农产品供求宏观调控时滞提供了必要的依据。

猜你喜欢
预处理神经网络小麦
主产区小麦收购进度过七成
求解奇异线性系统的右预处理MINRES 方法
孔令让的“小麦育种梦”
叶面施肥实现小麦亩增产83.8千克
哭娃小麦
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
基于预处理MUSIC算法的分布式阵列DOA估计
浅谈PLC在预处理生产线自动化改造中的应用
基于神经网络的拉矫机控制模型建立