文欢+陈华
摘要:为提高加工番茄产量预测精度,提出一种串联型组合灰色神经网络模型(grey neutral net model,GNNM)的番茄产量预测方法。通过以新疆某加工番茄产业基地的历史数据作为研究对象,利用灰色关联分析法,获取与加工番茄产量相关性较大的影响因素,剔除非主要影响因素。以主要影响因素和灰色模型(grey model,GM)预测值作为神经网络模型输入,加工番茄产量作为输出,构建GNNM预测模型。仿真试验结果表明,新预测模型具有更好的逼近能力和预测精度,为加工番茄产量精准预测提供了一种新的方法。
关键词:加工番茄;灰色模型;神经网络;产量预测
中图分类号: S11文献标志码: A
文章编号:1002-1302(2017)11-0167-04[HS)][HT9.SS]
新疆独特的光热和水土条件成就了优质番茄的生长,为大规模的番茄酱加工创造了有利条件。加工番茄作为新疆的优势果蔬产业,种植规模达7万hm2以上,已经达到全国总产量的90%,番茄酱出口量接近全国贸易总量的1/4,被誉为新疆的红色支柱产业[1]。因此研究加工番茄产量预测模型可以为本地区番茄种植规划、番茄产业的宏观调控、加工及储藏等方面提供一定的参考价值。
然而国内针对加工番茄產量预测的理论研究较少,已有的相关研究大都集中于线性回归模型、移动平均法、指数平滑法和误差反向传播(back propagation,BP)神经网络等预测方法上。姜波等利用粒子滤波对番茄产量进行短期预测[2];袁莉等运用灰色系统理论建立了加工番茄产量预测灰色模型[3];尤坤鹏等采用马尔科夫预测技术建立番茄产量预测模型[4];韩泽群等通过加权将3种统计分析方法加以组合建立了组合预测模型[5]。综上所述,前人采用了不同的预测方法对加工番茄产量进行预测,并取得了一定的成果,但是在对加工番茄产量进行建模预测时,忽略了加工番茄产量与其影响因素之间存在着灰色性、不确定性和模糊性的关系,影响了预测精度和可靠性。
针对上述问题,本研究提出串联型组合灰色神经网络模型(grey neutral net model,GNNM),通过灰色关联分析法对影响加工番茄产量的因素进行全面定量分析,选择关联度较高的影响因素作为GNNM模型的输入节点,将GM(1,1)与BP神经网络进行组合应用于加工番茄的产量预测, 通过仿真结[LM]果分析,该预测模型可进一步提高加工番茄产量的预测精度,为制定合理的种植规划和管理决策提供科学依据。
1基本原理与方法
1.1灰色预测模型
灰色预测又称为灰色系统预测,即通过对原始数据进行处理并分析其中的变化规律,生成具有较强规律性的数据序列,然后建立相应的灰色系统模型,从而定量预测系统的未来状态。灰色系统理论与方法的核心是灰色模型,而灰色模型是通过序列生成而建立的近似微分方程,是具有部分微分、部分差分性质的模型[6]。灰色模型应用最广泛的是灰色序列模型,它采用一阶单变量灰微分型方程,即GM(1,1)。
设非负原始序列为
即得到原始数据序列的预测值。
1.2GNNM预测模型
灰色预测的优点是所需样本数据少,不需要考虑其分布规律及变化趋势,建模比较简单,而且运算方便[7];但是缺乏自学习、自组织和自适应能力,对非线性信息的处理能力较弱,不适合逼近复杂的非线性函数。而BP神经网络是由大量简单的神经元相互连接构成的复杂网络系统,其非线性系统具有很强的模拟能力[8-9]和很强的学习、联想、容错、逼近任意函数的能力,但会因为过分逼近数据变化曲线上的细节而影响泛化能力。
灰色预测的少信息、建模简单及非线性处理能力弱等特征与BP神经网络预测大样本、非线性处理能力及学习能力强等特点具有优势互补性,将灰色模型与BP神经网络进行组合应用于产量预测,能够提高预测精度、可靠性和稳定性[10-12]。因此,本研究提出一种串联型灰色神经网络模型,其原理是将加工番茄产量历史数据归一化后作为灰色预测模型的输入,通过计算得到历史数据序列的预测值,将预测值与影响加工番茄产量的主要因素统一综合到BP神经网络作为输入样本,实际值作为输出样本,采取一定的网络结构对神经网络进行训练,利用神经网络的非线性拟合能力和能够逼近任意函数的特性,得到一系列相应节点的权值和阈值,实现预测值与实际值的最佳拟合。
其网络拓扑结构如图1所示,其中di为灰色预测模型预测值输入参数,f1、f2、f3为主要影响因素输入参数;ω21、ω22、…ω2n、ω31、ω32、…ω3n为BP神经网络权值,y为GNNM模型输出预测值。
2加工番茄产量影响因素选择
加工番茄产量涉及到诸多外部和内部因素,为提高番茄产量的预测精度,需要对这些因素进行分析。表1为2000—
[FL(2K2]2014年新疆某加工番茄基地番茄产量(N0)及其影响因素的历史数据,其中影响番茄产量的因素由第一产业劳动力(N1)、农业机械总动力(N2)、有效灌溉面积(N3)、化肥施用量(N4)、受灾面积(N5)及成灾面积(N6)等6个因素组成。[JP2]考虑到各因素之间的相关性会使番茄产量预测结果不准确,且不同的因素对其产量的影响程度不同,因此,为确定各因素对番茄产量的影响大小,本研究通过灰色关联分析法对各因素进行一定的主成分分析,从而得到影响加工番茄产量各因素所占的权重,对影响小的成分进行剔除,保留影响较大的因子。[JP]
2.1参考数列与对比数列的确定
分别选取影响加工番茄产量的因素Ni(i=1,2,…,6)共6个变量作为参考数列,2000—2014年加工番茄产量N0作为对比数列,其中参考数列记为x0(k),对比数列记为xi(k)。
2.2数据无量纲化处理
数据量纲的不同会对分析结果产生一定的影响,为消除这种影响需要对数据进行无量纲化处理。常用的有标准化、初始化、极差法和最大值化等[13],在此选用极差法进行处理,其处理公式为
[JZ(]xij′=[SX(]xij-mjMj-mj[SX)](i=1,2,…,7;j=1,2,…,15)。[JZ)][JY](8)
其中,Mj=max[DD(]1≤i≤7[DD)]{xij},mj=min[DD(]1≤i≤7[DD)]{xij}(j=1,2,…,15),则x′ij∈[0,1]是无量纲的指标观测值。
2.3确定关联系数与关联度
参考数列x0(k)与对比数列xi(k)的关联系数εi(k)为
εi(k)=[SX(]min[DD(]i[DD)] min[DD(]k[DD)]|xi(k)-x0(k)|+ρmax[DD(]i[DD)] max[DD(]k[DD)]|xi(k)-x0(k)||xi(k)-x0(k)|+ρmax[DD(]i[DD)] max[DD(]k[DD)]|xi(k)-x0(k)|[SX)],i=1,2,…,6;k=1,2,…,15。[JY](9)
其中,|xi(k)-x0(k)|为x0(k)和xi(k)第k个点的绝对误差;min[DD(]i[DD)] min[DD(]k[DD)]|xi(k)-x0(k)|为两级最小差;ρ为分辨系数,ρ∈(0,1),一般取ρ=0.5,其作用一般在于提高关联系数间的差异显著性。对关联系数进一步处理后得到数列xi对x0的关联度γi,其公式为
[JZ(]γi=[SX(]1n-1[SX)]∑[DD(]nk=1[DD)]εi(k)。[JZ)][JY](10)
计算得出番茄产量与影响因素之间的灰色关联度,选取关联度较高的第一产业劳动力、有效灌溉面积和化肥施用量作为灰色神经网络的输入节点。
3GNNM模型实例验证
3.1GM(1,1)预测模型
利用MATLAB软件编程建立GM(1,1),对表1中2000—2010年的番茄产量数据进行预测。求得模型的系统发展系数a=-0.081 9,内生控制变量b=174 101.8,则 GM(1,1) 的白化响应式为
x[DD(-1*2][HT6]^[DD)](1)(k+1)=2 294 203.81e-0.081 9k-2 125 271.3(k=0,1,2,3…)。[JY](11)
通过MATLAB软件求得最终预测值(表2)。
3.2建立GNNM
将表2中GM(1,1)预测的2000—2010年产量数据和表1中灰色关联度较高的3个影响因素同时作为网络训练样本,2011—2014年的历史产量数据作为测试样本,使用 MATLAB 软件建立GNNM,并与GM(1,1)、BP网络进行比较分析。
由于表1中数据间数量级存在差别,为避免因为输出数
据数量级差别而造成网络预测误差较大,故先对数据按照公式(12)进行归一化处理。
[JZ(]x′k=[SX(]xk-xminxmax-xmin[SX)](k=1,2,3,…)。[JZ)][JY](12)
其中,xmax为序列中的最大值,xmin为序列中的最小值,最终把所有数据转化为[0,1]之间的数。
本研究选择3层BP神经网络,经过多次训练,根据网络预测输出与期望输出的误差调整权值和阈值,得出误差最小的隐含层节点数为10。由于本研究中输入数据为4维,输出为1维,故网络结构为4-10-1。输入层与隐含层的传输函数为Sigmoid函数f(x)=[SX(]11+e-x[SX)],隐含层与输出层传递函数为Purelin函数。设定训练精度为0.000 01,训练次数为 1 000,训练方法采用动量法和学习率自适应调整策略。
对设计好的GNNM进行训练,训练稳定后得到的均方误差在迭代10次时达到9.9×10-6,网络平滑地收敛于全局极小值(图2)。
于实际数据,2010—2014年番茄产量预测值与实际值拟合程度较好。
为了进一步验证GNNM的预测效果,本研究用GM(1,1)、BP神经网络、GNNM对2011—2014年番茄产量预测结果进行分析对比。从表3可知,采用GM(1,1)、BP神经网络和GNNM的预测结果与实测值的相对误差绝对值均小于10%,其均方误差分别为7.68%、1.98%、0.61%。用GM(1,1)进行加工番茄产量预测时,其方法虽然简单,但是预测精度并不高。对于BP神经网络模型来说,加工番茄产量预测精度有所提高,但个别年份预测精度并没有改善。相比较而言,GNNM 的拟合精度、预测效果均优于GM(1,1)和BP神经网络预测模型,更符合准确预测精度要求。因此,选择GNNM模型进行加工番茄产量预测是可行、高效的。
4结论
本研究利用GM(1,1)与BP神经网络各自的优点组合进行加工番茄产量预测,同时考虑到影响加工番茄产量的6个因素,采用灰色关联度分析法选取其中3个关联度高的因素作为BP神经网络的输入,构建了以新疆某加工番茄基地为例的GNNM,预测加工番茄产量。仿真结果表明,与 GM(1,1) 和BP神经网络单一预测模型相比,GNNM的均方差更小、精度更高,更符合加工番茄产量预测,对农业生产实践具有指导意义。
参考文献:
[1]唐世輝,霍彬,朱平. 新疆番茄产业发展现状分析[J]. 合作经济与科技,2014(11):8-10.
[2]姜波,许竞. 粒子滤波在农作物产能短期预测中的应用[J]. 江苏农业科学,2012,40(3):357-358.
[3]袁莉,姜波. 基于灰色系统理论的加工番茄产量预测模型研究[J]. 农业科学与技术,2011,12(5):632-633,642.
[4]尤坤鹏,姜波. 马尔科夫链在加工番茄产量预测中的应用研究[J]. 安徽农学通报,2012,18(15):29-30,38.
[5]韩泽群,姜波. 加工番茄产量组合预测模型研究[J]. 中国农学通报,2013,29(3):161-165.[HJ1.7mm]
[6]郭秀英. 预测决策的理论与方法[M]. 北京:化学工业出版社,2010.
[7]Liu S F,Tao L Y,Xie N M,et al. On the new model system and framework of grey system theory[C]//Grey Systems and Intelligent Services (GSIS),IEEE International Conference,2015.
[8]Hsu C C,Chen C Y. Applications of improved grey prediction model for power demand forecasting[J]. Energy Conversion and Management,2003,44(14):2241-2249.
[9]李吉龙,刘新平. 基于BP神经网络的未利用地开发生态风险预警研究——以新疆阜康市为例[J]. 江苏农业科学,2015,43(10):500-503.[ZK)]
[10]刘静,傅泽田,张小栓. 基于GM-RBF神经网络的冷链运输环境预测[J]. 江苏农业科学,2015,43(10):498-500.
[11]张婷. 基于灰色神经网络组合模型的能源需求预测[D]. 天津:天津大学,2007.
[12]史峰,王小川,郁磊,等. MATLAB神经网络30个案例分析[M]. 北京:北京航空航天出版社,2010:258-267.
[13]何乃强,惠晓滨,周漩. 基于正态区间估计的改进型无量纲化方法[J]. 计算机工程与应用,2012,48(5):236-238.[ZK)][HT][HJ][FL)]