BP模型的改进及应用

2010-07-12 00:50崔海朋邢贞相关长瑜
水利科学与寒区工程 2010年6期
关键词:隐层积温权值

□崔海朋 邢贞相 关长瑜

水稻是我国主要粮食作物之一,不同年景对粮食产量影响较大。经研究证明,水稻生长季节≥20℃的积温与产量高低有密切关系。当≥20℃的积温在2100℃以下时,就会因热量不足而发生延迟型或障碍型冷害,最终造成粮食严重减产。只有≥20℃的积温得到基本满足,且光、水条件适宜时,粮食才能获得高产。由此可见,≥20℃积温的多少,对保证粮食产量至关重要。B P神经网络模型是一种模仿动物神经网络行为特征,进行分布式并行信息处理的数学模型,具有较强的非线性映射能力,近年来应用B P模型通过积温对水稻产量进行预报,效果良好。

一、基本情况

由于年际积温变化大,必须按照常规气候指标安排生产。作者利用沈阳市统计局1951~1990年水稻单产(k g/亩)与沈阳≥10℃和≥20℃积温资料进行相关分析,采用5年滑动平均法分解气象产量,通过与≥10℃和≥20℃积温的相关计算,得出≥20℃的积温与水稻产量有密切关系。

表1 1955~1990年分型种类表

上表对各年分型的预报采用的是相关分析法,算法繁琐,技术复杂,且精度不高。由于B P人工神经网络有很强的函数映射功能,每一个特定的网络都能够表达十分复杂又难以用数学表达式表达的函数关系,尤其是非线性关系。但神经网络的收敛速度较慢,且由于训练样本容量的限制而影响网络的学习能力和预报准确性。为克服训练样本容量不足,本文采用马尔可夫链蒙特卡罗模拟技术模拟足够多的样本为B P模型训练所用,并将其用于各年分型预报中。

二、BP神经网络

在多层前馈B P网络的应用中,以图1所示的网络应用最为普遍。所谓三层包括了输入层、隐层和输出层。在三层前馈网络中,输入为X=(x1,x2,…,xr)T,再加入x0=1,可为隐层引入阈值;隐层输出向量为Y=(y1,y2,…ym)T,再加入y0=1,可引入阈值;输出层的输出向量为O=(o1,o2,…,ok,ol)T;期望输出向量为:d=(d1,d2,…,dk,dl)T。输入层到隐层间的权值矩阵V=(V1,V2,…,Vj,Vm),其中列向量Vj为隐层第j个神经元对应的权向量;隐层到输出层间的权值矩阵W=(W1,W2,…,Wk,Wl),其中列向量Wk为输出层第k个神经元对应的权向量。在隐层中的转移函数多采用S型激活函数,可有效地避免出现过饱和现象,而输出层多采用线性函数,以适应实际问题的需要。

网络误差的定义如下式所示(以三层神经网络为例,拓扑结构见图1):

进一步展开至输入层,得:

由上式可看出,网络的输入误差是各层权值wij、vij的函数,因此不断调整权值就可以改变误差使之达到预定的精度。

B P算法的权值调整计算公式为:

式中α为学习速率,其他符号意义同上。

三、蒙特卡罗模拟算法

作为随机模拟方法的马尔可夫链蒙特卡罗(MCMC)方法早已被许多学者应用到物理、天文、气象、通信等方面。常用的采样方法有Metropolis-Hastings算法、吉布斯(Gibbs)采样和Adaptive Metropolis (AM)算法。这三种方法中只有AM算法不依赖于事先确定的推荐分布且能够考虑多维变量间的相关性,收敛速度快,故本文采用A M算法。

AM (Adaptive Metropolis)算法是Haario于2001年提出的一种改进的MCMC采样器,相比传统的M-H与Gibbs采样,AM不再需要事先确定变量的推荐分布,而是决定于初始抽样的协方差。将推荐分布定义为参数空间的多维正态分布形式,其初始协方差可根据先验信息确定。在抽样过程中根据马尔可夫链的历史抽样信息调整推荐密度(即协方差矩阵),且可并行运算,从而提高了算法的收敛速度。

四、基于MCMC算法的BP网络(MCMC-BP)

为获得B P网络训练过程所需的足够样本,首先根据实测数据利用MCMC算法模拟出指定容量的训练样本,具体作法如下:

由于实测数据在测量过程中存在不可避免的随机误差,且观测数据具有随机性,故本文假定观测数据符合以实测数据为均值的白噪声分布,设方差为实测值的5%。利用MCMC算法从高斯分布中随机模拟20个样本,将样本容量增加20倍,以其中的4/5作为BP网络训练样本,其余作为其验证样本。

实验证明BP网络收敛的速度与网络的初始权值和阈值有密切关系,好的初始权值和阈值会大大提高其收敛速度。

五、应用实例

(一)输入和输出数据的处理

神经网络输入神经元采用1个,即为该年的积温值,当输入值为1时,由于sigmoid转移函数对[0,1]区间的输入比较敏感,故对积温值进行归一化处理。将数据变换为[0,1]区间的值的变换公式为:

式中:xi代表输入或输出数据,xmin代表数据变化的最小值,xmax代表数据变化的最大值。

(二)模型参数的选定及网络结构的确定

输出层神经元采用4个,即分别对应高温型、正常偏高型、正常偏低型、冷害型四种年景分型,和该年的积温值。当输入值为1时,表示该年为相应的分型年;当输入值为0时,则不属于该分型年,形式分别为(1,0,0,0),(0,1,0,),(0,0,1,0),(0,0,0,1)。

BP算法,经过1868次训练,最后收敛到总体能量函数值为4.5137×10-4,平均误差为3.1345×10-6,拟合率达到93%,此时网络的拓扑结构为1-5-4,训练结果见表2。

表2 MCMC-BP对年景分型的训练结果

由表2可看出,用本文提出的MCMC-BP模型对水稻生长季≥20℃积温进行预报,拟合度较高。利用训练得到的神经网络结构预报1991~1994年的年景分型种类,结果见表3。

表3 MCMC-BP对1991~1994年景类型预报表

由表3可以看出,用MCMC-BP训练收敛后的网络结构来预报水稻产量年景,预报结果与实际年景完全相同,可见预报精度高,方法切实可行。

六、结论

(一)MCMC-BP能够准确地映射水稻生长季≥20℃积温与相应年景类型之间的非线性关系,且具有较高的预报精度。

(二)本文提出的MCMC-BP模型采用Matlab语言编写,便于操作、推广,计算速度快、精度高,适于大量数据的计算。

(三)MCMC-BP模型的训练不受人为因素的干扰,同时可考虑增加其他影响水稻产量年景因素,使预测结果更准确。

(四)本文提出的MCMC-BP模型还可应用到其他与预报、预测有关的问题中,具有广阔的应用前景。

猜你喜欢
隐层积温权值
基于RTD可编程逻辑门的n变量函数实现算法
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
基于BP神经网络学习算法的图像压缩技术研究
湟源县30年0℃活动积温变化特征分析
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
石河子地区近50年积温变化特征分析
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
石河子市近51a≥0℃积温变化特征分析