遗传算法与小波神经网络在ET0预测中的应用

2019-05-21 08:11樊湘鹏周建平李志磊

燕山大学学报 2019年2期

樊湘鹏，许燕,*，周建平，李志磊

(1.新疆大学机械工程学院，新疆乌鲁木齐 830047；2.新疆大学工程训练中心，新疆乌鲁木齐 830047)

0 引言

参考作物腾发量(ET0)作为获取作物需水状况的重要根据，其对于制定中长期的农业需水预测与水文规划具有重要的指导意义[1]。针对ET0的计算，国内外专家学者提出经验公式法、水汽扩散法、能量平衡法和综合法等计算模型[2]，国际备受推崇的Penman-Monteith公式既包含了作物的生理特征，又将空气动力学参数作为计算因子，在多种不同气候条件和不同类型的地区都有较高精度的验证[3-4]。由于P-M公式在计算时要求气象条件多，在面积广阔和天气极端的地区尤其是在新疆地区同时测量这些气象数据是非常困难的，该公式受到一定的限制[5]。因此若要准确计算ET0值或需要对ET0未来变化趋势进行预测时就需要利用精度较好、能够准确反映ET0在作物生长期内变化的预测模型来代替基于数值计算而建立的P-M公式模型[6]。

近年来，针对人工智能和数据挖掘的研究不断深入，如最小二乘支持向量机[7-8]、基因编程、自适应模糊神经推理系统[9-11]和人工神经网络[12-16]等被引入水文科学非线性系统的数据预测研究中，比传统的灰色预测、回归拟合等更有优越性[17-18]，国内外学者针对数据挖掘展开的ET0的预测模型或方法在精度方面可以满足应用，但从ET0的物理因素上来看，由于四季更替与昼夜变化，气候与环境表现出周期性的非平稳特性，ET0在时域上也具有冬春小、夏秋大的周期性年际变化特点[19]，若不采取有效的处理办法降低时间序列的非平稳特性，在进行建模过程中很难保证精确的预测结果和良好的收敛性能。将小波分析与神经网络相结合可有效提取非线性、非平稳的ET0时间序列时频分析特性，使神经网络具有更灵活的逼近能力和更强的模型识别能力与容错能力，结合遗传算法优化网络，能够在精度和收敛性能上得到提高。因此，本文提出一种将遗传算法和小波神经网络相结合的ET0预测方法，用于新疆干旱地区农作物中长期需水预测与水文研究。

1 资料与方法

1.1 研究地区概况

本次研究所选择地区为新疆喀什地区。该地区位于新西北内陆，介于E 71.39′～79.52′、N 35.28′～40.16′之间，东边是塔克拉玛干大沙漠，东北紧邻阿克苏地区。主要种植粮食作物是玉米、小麦，经济作物是棉花，是重要的棉花基地之一(信息来自中国地理信息中心)。

1.2 资料来源与研究方法

研究的数据资料来源为中国气象网和新疆气象局从2007年至2016年的喀什气象站点的观测资料。需要的数据类型为日最高气温(Tmax)、日最低气温(Tmin)、日照时数(Hs)、相对湿度(hr)、风标高度处的风速(Uh)等。根据站点的气象资料利用P-M公式计算得出ET0作为标准值并对数据进行归一化处理；在MATLAB中建立三层小波BP神经网络结构模型，小波基函数可将ET0序列分解为高频量和低频量，采用遗传算法对小波BP神经网络参数值进行优化，归一化的数据变量进行网络训练与测试，得到与P-M标准值进行拟合的预测曲线，仿真分析比较模型的预测精度与性能并在水肥一体化实验平台上验证其应用效果。

2 GA优化小波神经网络原理

2.1 小波神经网络理论基础

BP神经网络有良好的非线性特征和自组织学习方法，在时间序列的预测建模中有着广泛的应用。但是单一的BP神将网络在训练中容易陷入局部极值而非全局最优值且收敛速度慢[20]。小波分析同神经网络的组合使用，能够将良好的时频局部和变焦特征与神经网络自学习、自适应性、强鲁棒性相结合，有效提高网络模型的收敛速度和逼近能力，从而更好地实现预测功能[21]。但在参数优化方面受限于固定的梯度下降法，易陷入局部极小值、引起振荡效应[22]。小波神经网络结构如图1所示。

2.2 遗传算法优化小波神经网络

遗传算法(GA,Genetic Algorithm)是采用生物选择和遗传学机制的全局自适应概率的搜索算法，能提供通用的优化框架从而避免落入局部最优的陷阱[23]。GA优秀的全局搜索能力可在复杂、多态性、不连续的气象数据和ET0序列与空间里优化小波神经网络结构和参数，大大提高预测速度、精度和模型泛化能力[24]，避免小波神经网络收敛速度慢和陷入局部极小、产生振荡效应的缺点。GA优化网络训练的步骤如下：

1) 初始化种群，对小波神经网络参数进行编码；

2) 设定遗传算法迭代次数、种群规模、交叉概率和变异概率等参数；

3) 计算个体适应度并将其排序；

5) 交叉变异操作优化群体，没有交叉操作的个体进行直接复制；以变异概率Pm变异产生新的个体，采用均匀变异的方法产生新的种群；

6) 重复(2)～(4)直接达到最大迭代次数或达到预设值或者结束条件时，得到最优群体，并将最优个体解码获得小波神经网络参数，作为最优的网络初始参数；

7) 利用小波神经网络梯度下降法对(6)所得到的最优初始参数进行二次训练得到最优值用于参考作物腾发量的预测。

图1 小波神经网络结构
Fig.1 Structure of WNN

图2 算法流程图
Fig.2 Algorithm flow chart

3 模型建立与预测

3.1 选取输入量

段春峰等人利用偏相关分析法得到了西北地区多种气象因子对ET0变化的重要程度，结合参考文献[25-26]得出了影响西北干旱地区参考作物蒸散量的主要因素为：风速、太阳辐射量、气温和相对湿度。为提高网络模型的预测精度，利用SPSS软件对影响ET0值的因素进行相关性分析(见表1)，但最高气温与最低气温具有显著相关性，根据经典统计学理论，自变量之间相关性过大会导致模型精度下降。因此选择对ET0的值影响大较大的最高气温、日照时数、日均风速和相对湿度这4个因子作为模型的最优输入组合。

表1 各气象因子与ET0相关系数
Tab.1 Correlation coefficients between meteorological factors and ET0

3.2 建立模型参数

从理论上可知，单隐含层的多输入单输出三层神经网络能够实现有界区域上的任意复杂的非线性映射问题，因此选择单隐含层的三层神经网络建立预测模型[22]。

由Kolmogorov定理可知，对于m个输入向量的问题，采用(2m+1)个隐层节点的神经网络，能达到非线性函数精确拟合的程度[27]。模型其他参数如表2所示。

表2 GAWNN模型参数
Tab.2 Parameters of GAWNN

参数名称参数设置种群规模10进化次数20交叉概率0.3变异概率0.1

图3 初始样本序列
Fig.3 Initial sample sequence

3.3 数据预处理

实验数据选自新疆喀什站点2007～2016年逐日气象数据，首先利用P-M公式对这10年内的逐日ET0值进行计算与统计作为标准值或实际值，并将其中的3 140组数据序列分为2组，选择其中的前3 000组样本点数据作为训练数据，另外一组140组样本序列作为预测数据进行预测。

为便于计算和提高网络训练速度对网络模型的输入数据进行归一化变量预处理，在数据训练和数据预测之前利用如下公式进行归一化处理，以便将输入值映射在[-1,1]的区间之内：

式中，x为归一化前样本；y为归一化后的输入值。

3.4 预测结果分析

在数据归一化处理后，利用小波变换将预测样本序列单尺度分解和重构后得到低频ET0量和高频ET0量。利用遗传算法优化小波神经网络(GAWNN)预测模型分别进行低频序列预测和高频序列预测，得到的低频ET0预测结果和高频ET0预测结果，之后进行高频低频叠加预测，预测结果如图4～6所示。

图4 GAWNN模型预测低频ET0拟合效果图
Fig.4 GAWNN Model predicts low-frequency ET0fitting

图5 GAWNN模型预测高频ET0拟合效果图
Fig.5 GAWNN Model predicts high-frequency ET0fitting

图6 GAWNN模型预测叠加ET0拟合效果图
Fig.6 GAWNN predicts superposition ET0fitting

为了表现遗传算法的必要性，在不加遗传算法的情况下利用小波神经网络(WNN)预测模型进行低频量和高频量的预测，得到结果如图7所示。为便于直观对比，又建立了WNN和GAWNN两种模型同时预测的拟合效果对比图。

图7 两种预测模型拟合效果对比
Fig.7 The comparison diagram of two prediction models

3.5 模型分析与评价

研究过程中，模型分别利用平均绝对误差(MAE，Mean Absolute Error)、均方误差(MSE，Mean-square Error)、均方百分比误差(MSPE，Mean-square Percentage Error)三个指标进行评价，其计算公式为

经过计算各项指标如表3所示，对比可知WGANN模型相对WNN模型具有更优异的预测性能，即遗传算法优化小波神经网络确实提高了小波神经网络的预测精度。同时在模型的速度收敛上，给出了两种预测模型网络训练过程结束时的性能曲线。神经网络训练过程中，WGANN比WNN预测模型的有更快的收敛速度，更快达到设定误差。

表3 GAWNN与WNN模型预测评价
Tab.3 GAWNN and WNN model prediction evaluation

模型类型MAERMSEMSPEWNN0.456 40.120 70.03WGANN0.180.092 30.002

4 实验验证

为了进一步验证遗传算法优化后小波神经网络的性能，在智能灌溉与水肥一体化精准控制系统的平台上对模型进行实验测试。实验平台主要由中央控制端、电磁阀、水泵、电磁阀、电磁流量计、水过滤器、压力变送器和土壤温湿度传感器以及户外小型气象站组成。图8为智能灌溉与水肥一体化精准控制系统样机。

图8 智能灌溉与水肥一体机实物模型
Fig.8 Model of intelligent irrigation and water fertilizer machine

作物需水量通过系统模型库，由参照作物腾发量与相应农作物系数相乘得到。本实验选择冬小麦为实验对象，需水系数Kc在总的生长期取值为0.850，ET0由灌溉决策系统中的预测模型得到。水路的电磁流量计采集水量并反馈给控制端，同时在灌溉决策系统界面实时显示。本实验将P-M公式值与小波神经网络预测模型和遗传算法优化后的小波神经网络预测模型做比较。

实验日期选择为2017年10月30日到11月16日，系统根据设定时间读取流量计的值，将传感采集环境数据输入到智能灌溉决策系统的预测模型中，得到ET0值。流量计的值大小代表灌水量，将流量计采样的数据利用MATLAB绘制成曲线图。图9为3种预测方法得到的电磁流量曲线对比图。

图9 3种预测方法得到的流量曲线
Fig.9 The flow curves obtained by three prediction methods

图9中方块线条是利用P-M公式计算ET0时得到的电磁流量计流量值，圆圈线条是直接利用小波神经网络模型预测ET0值时得到的流量计流量值，三角形线条是经遗传算法优化后的小波神经网络模型预测得到ET0时流量计流量值。通过分析图9中P-M公式值、WNN预测值与WGANN预测值折线图可以很清晰地看到经遗传算法优化后后的小波神经网络模型得到的预测值更加接近PM计算值。

5 结论

本文提出一种基于遗传算法优化小波神经网络的ET0预测方法，能针对ET0的周期性非平稳特性将时间信号分解为高低频两种序列，得到较为平稳的ET0时间序列，起到了降低神经网络模型在预测中的随机误差的效果。同时文中建立的GAWNN预测模型利用喀什地区气象站点资料对当地的ET0值进行训练、预测并与WNN模型预测结果与收敛性能进行比较分析，表明遗传算法优化小波神经网络比不采用遗传算法优化的小波神经网络具有更高的精度和更小的误差，且在预测性能上具有更快的收敛速度。基于此模型，在智能灌溉与水肥一体化系统平台上进行灌溉决策的实验验证，得到3种不同方法的作物灌水量曲线图，充分表明了GAWNN预测模型在作物需水决策中的良好性能，为计算参考作物腾发量提供了新的思路和依据。