几种神经网络模型在湖库富营养化程度评价中的应用

2012-11-29 07:28崔东文
水资源保护 2012年6期
关键词:湖库富营养化权值

崔东文

(云南省文山州水务局,云南文山 663000)

湖库富营养化评价,就是通过与湖库营养状态有关的一系列指标及指标间的相互关系,对湖库的营养状态作出准确的判断[3-4]。湖库富营养化程度的表征和评价技术不仅能够应用于湖库科学、客观的描述和评估,且对于湖库的可持续管理和保护都具有重要意义。目前湖库富营养化评价的方法众多,主要有模糊度法[5]、多目标模糊灰色决策法[6]、模糊数学运算法[7]、灰色局势决策[8]、灰色聚类法[9]、灰色层次决策法[10]、主分量分析法[11]、贝叶斯公式法[12]、人工鱼群算法[13]等,这些研究取得了一定的成果,但也存在一些问题[14]。近几年,随着人工神经网络技术的迅速发展和日益成熟,国内外的研究人员将其成功地运用于水环境的研究中,获得了相当满意的成果[15]。笔者基于我国湖库富营养化评价标准和 RBF、GRNN、BP、Elman神经网络算法原理,分别构建了RBF等4种神经网络湖库富营养化等级评价模型,对全国24个主要湖库富营养化程度进行评价,旨在将RBF等神经网络引入到湖库富营养化程度综合评价中,为湖库富营养化程度评价提供新的理论和方法。

1 湖库富营养化程度评价模型

1.1 RBF 神经网络模型[16-22]

径向基神经网络(RBF,radial basis function neural network)是以函数逼近理论为基础而构造的一种前向网络,它是由输入层、隐藏层和输出层组成的3层网络,如图1所示。第1层为输入层,由信号源节点组成;第2层是隐藏层,该层的变换函数采用RBF;第3层为输出层,对输入模式作出响应。

图1 径向基神经网络模型结构

RBF网络的基本思想是:用RBF作为隐单元的“基”构成隐藏空间,隐含层对输入量进行变换,将低维的模型输入数据变换到高维空间内,使得在低维空间的线性不可分问题在高维空间线性可分。RBF网络结构简单、训练简洁而且学习收敛速度快,能够逼近任意非线性函数,近年来的研究表明:无论在逼近能力、分类能力(模式识别)和学习速度等方面RBF均优于BP网络。RBF神经网络中常采用Gaussian函数作为径向基函数,因此RBF神经网络的激活函数可表示为

高斯函数可表示为

式中:x为输入样本;y为输出;ωik为隐含层到输出层的连接权值;i=1,2,3,…,m为隐含层节点数;k为Ci的数量;Ci为高斯函数的中心,且与x具有相同维数;x-Ci为欧式范数;φi(x)为第i个隐层节点的输出;σi为高斯函数方差。

径向基函数网络算法步骤如下:

①从输入向量中选一组初始中心值Ci。

②计算方差值σ。

式中:dmax为最大的距离;

③ 由输入x(n)计算 ^yi(n)。

④更新网络参数。

其中

式中:μN,μC,μσ为学习步长;yd(n)为网络期望输出。

⑤如网络收敛,则计算停止,否则转到步骤④。

1.2 GRNN 神经网络模型[16-22]

广义回归神经网络(GRNN,generalized regression neural network)是一种高度并行径向基网络,它是由输入层、模式层、求和层和输出层组成的4 层网络,对应网络输入 X=[x1,x2,…,xn]T,其输出为 Y=[y1,y2,…,ym]T,如图2所示。

GRNN在结构上与RBF网络较为相似,具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性,适用于解决非线性问题。GRNN在逼近能力和学习速度上较RBF网络有更强的优势,网络最后收敛于样本量积聚较多的优化回归面,并且在样本数据较少时,预测效果也较好。此外,网络还可以处理不稳定数据。GRNN网络算法步骤原理如下:

图2 广义回归神经网络模型结构

①输入层。输入神经元数目等于学习样本中输入向量维数,各神经元是简单的分布单元,直接将输入变量传递给模式层。

②模式层。模式层神经元数目等于学习样本数目n,各神经元对应不同样本,模式层神经元传递函数为

式中:X为网络输入变量;Xi为第i个神经元对应的学习样本;ν为光滑因子。

③求和层。求和层使用两类神经元进行求和。一类计算公式为

式(11)对所有模式层神经元的输出进行算术求和;另一类计算公式为

式(12)对所有模式层神经元进行加权求和,式中Yi为样本观测值的权重因子。

④输出层。输出层中的神经元数目等于学习样本中输出向量的维数m,并将模式层神经元加权求和SNj与模式层神经元输出的算术求和SD相除,即为网络输出yi。

1.3 BP 神经网络模型[16-23]

BP网络(back-propagation network)是一种单向传播的多层前馈神经网络,其主要特点是信号前向传播,误差反向传播。在前向传播中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态,如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。由非线性变换单元组成的BP神经网络,不仅结构简单(仅含输入,输出和隐节点3层),而且具有良好的非线性映射能力。BP网络主要应用于函数逼近、模式识别、分类和数据压缩等领域。BP神经网络的拓扑结构如下图3所示。

图3 BP神经网络拓扑结构

图3中,X1,X2,…,Xn是 BP 神经网络的输入值,Y1,Y2,…,Ym是 BP 神经网络的预测值,ωij和 ωjk为BP神经网络权值。从图3可以看出,BP神经网络可以看一个非线性函数,网络输入值和预测值分别为该函数的自变量和因变量。当输入节点数为n,输出节点数为m时,BP神经网络就表达了从n个自变量到m个因变量的函数映射关系。BP神经网络预测前首先要训练网络,通过训练使网络具有联想记忆和预测能力,其标准算法具体实现步骤如下。

①网络初始化。根据系统输入输出序列(X,Y)确定网络输入层节点数n、隐含层节点数l,输出层节点数m,初始化输入层、隐含层和输出层神经元之间的连接权值为ωij,ωjk,初始化隐含层阈值a,输出层阈值b,给定学习速率和神经元激励函数。

②隐含层输出计算。根据输入向量X,输入层和隐含层间连接权值ωij以及隐含层阈值a,计算隐含层输出H。

式中:l为隐含层节点数;f为隐含层激励函数,该函数有多种表达形式,本文所选函数为

③输出层输出计算。根据隐含层输出H,连接权值ωjk和阈值b,计算BP神经网络预测输出O。

④误差计算。根据网络预测输出O和期望输出Y,计算网络预测误差e。

⑤权值更新。根据网络预测误差e更新网络连接权值 ωij,ωjk。

式中:i=1,2,…,n;j=1,2,…,l。

式中:η为学习速率。

⑥阈值更新。根据网络预测误差e更新网络节点阈值 a,b。

⑦判断算法迭代是否结束,若没有结束,返回步骤②。

1.4 Elman 神经网络模型[16-22]

Elman神经网络是Elman于1990年提出的,该模型在前馈式网络的隐含层中增加了一个承接层,作为一步延时算子,以达到记忆的目的,从而使系统具有适应时变特性的能力,能够更生动、更直接地反映系统的动态特性。Elman网络结构见图4。

图4 Elman神经网络模型结构

Elman神经网络一般分为4层:输入层,隐含层(中间层),承接层和输出层。如图4所示,输入层、隐含层、输出层的连接类似于前馈式网络,输入层单元仅起信号传输作用,输出层单元起线性加权作用。隐含层单元的传递函数可采用线性或非线性函数,承接层用来记忆隐含层单元前一时刻的输出值并返回网络输入,可以认为是一个一步延时算子。Elman神经网络的特点是隐含层的输出通过承接层的延迟与存储,自联到隐含层的输入,使其对历史状态数据具有敏感性,增加了网络处理动态信息的能力,达到动态建模的目的。Elman网络可以按照任意精度逼近非线性函数,工程中主要用于动态预测[24-25],但在函数逼近、模式识别等方面均有应用[3]。

以图4为例,Elman网络的非线性状态空间表达式为

式中:y为m维输出结点向量;x为n维中间层结点单元向量;δ为r维输入向量;xc为n维反馈状态向量;w3为中间层到输出层连接权值;w2为输入层到中间层连接权值;w1为承接层到中间层的连接权值;g(·)为输出神经元的传递函数,是中间层输出的线性组合;f(·)为中间层神经元的传递函数,常采用S函数。

Elman神经网络也采用BP算法进行权值修正,学习指标函数采用误差平方和函数。表达式为

2 湖库富营养化程度评价模型的建立

2.1 评价指标及标准

依据水利部SL395—2007《地表水资源质量评价技术规程》湖库营养状态评价标准[26],选取叶绿素a(Chl-a)、总磷(TP)、总氮(TN)、高锰酸盐指数(CODMn)和透明度(SD)作为湖库营养状态评价指标,见表1。将湖库营养程度按由轻到重分别记为1、2、3、4、5、6 级[1],选取重富营养临界值的 2 倍作为评价指标极大值(上限值),贫营养临界值的0.5倍作为评价指标极小值(下限值),并以其上下限值作为评价对象评价指标的极点值。

2.2 湖库富营养化程度评价的实现

表1中湖库富营养化程度评价指标分为正向指标和负向指标,为了消除不同量纲对评价结果的影响,首先需对评价指标数据进行标准化处理。对湖库富营养化程度评价等级起正作用的指标,如Chl-a、TP等,其处理方法为:

对湖库富营养化程度评价等级起负作用的指标,如透明度,其处理方法为:

经过标准化处理后,数据处于[0~1]范围之内,有利于网络训练。

2.2.1 指标数据标准化处理

表1 我国湖库富营养化评价标准

2.2.2 训练样本设计

依据表1,以各评价因子上下限(极小极大值)为限值,利用线性插值方法将标准化的各评价因子插值得到60个训练样本作为网络的输入,并将经过插值、标准化处理得到评价指标均值作为网络的输出。把我国湖库富营养化评价等级临界值作为评价样本进行“预测”,并将“预测”结果作为湖库富营养化程度评价等级的划分依据,对全国24个湖库富营养化程度进行评价分析。

2.2.3 网络训练[16,21]

笔者采用RBF等4种神经网络对湖库富营养化程度进行评价,见图1~4。以表1中各评价指标作为输入向量,即输入层神经元个数为5个;以经过插值、标准化处理得到评价指标均值作为输出向量,即输出层的神经元数为1个。对于RBF和GRNN神经网络,由于人为调节的参数少,只有1个阈值,因此网络根据训练算法和样本即可开始学习训练,当网络训练好后,各个隐节点的数据中心相应的输出权值将不再改变,此时神经网络可进行湖库富营养化程度评价。对于BP和Elman神经网络,综合考虑其性能和速度,将隐含层神经元个数设定在3~10。

笔者采用MATLAB软件编写RBF等4种神经网络算法程序对湖库富营养化程度进行评价,程序采取循环训练算法,最终确定RBF和GRNN神经网络的SPREAD分别选取为1.2和0.1、BP神经网络模型结构为5-5-1(隐含层和输出层传递函数分别采用tansig和logsig,训练函数采用traingdx,阀值和权值的学习函数采用learngd,性能函数采用mse,设定期望误差为1×10-5,最大训练轮回为2 000次)、Elman神经网络模型结构为5-3-1(隐含层和输出层传递函数分别采用tansig和logsig,设定期望误差为1×10-4,最大训练轮回为2 000次)时网络达到最佳评价效果。

3 实例应用

3.1 数据来源

选取我国主要湖库的调查资料进行实例分析(表2)。

表2 我国主要湖库调查资料[1]

3.2 评价结果及分析

依据表1中的我国湖库富营养化评价标准,利用上述训练好的RBF等4种神经网络模型分别对湖库富营养化程度评价等级临界值及表2中我国主要湖库调查资料进行评价,评价依据和评价结果分别见表3和表4。

表3 4种神经网络模型对湖库富营养化程度评价等级临界值模拟结果

表4 我国主要湖库富营养化程度评价结果

分析表3、表4可以得出以下结论:①RBF、GRNN、BP、Elman神经网络模型对全国24个主要湖库富营养化程度评价结果基本相同,与文献[1]投影寻踪法评价结果较为接近,与文献[2]评分指数法评价结果略有差别,但均能达到湖库富营养化程度等级评价的精度要求,表明研究建立的RBF等4种神经网络湖库富营养化程度评价模型和评价方法均是合理可行的,其模型简单易行,评价精度高,可为湖库富营养化程度评价提供新的途径和方法。②从所建立的RBF等4种神经网络湖库富营养化程度评价模型比较而言,RBF与GRNN神经网络模型评价结果完全相同,与BP神经网络模型评价结果最为接近,仅有淀山湖一湖之别,偏大1个等级;与Elman神经网络模型评价结果有2湖之别,南四湖偏小1个等级,邛海偏大1个等级。BP与Elman神经网络模型评价结果基本相同,也仅有淀山湖、南四湖、达理湖偏小1个等级,邛海偏大1个等级。③BP和Elman神经网络隐含层神经元个数需要人为确定,是一个较为复杂的问题,确定个数的合理与否,直接影响到评价的精度。同BP和Elman网络算法相比,RBF与GRNN神经网络模型不仅对湖库富营养化程度评价结果完全相同,且模型具有收敛速度快、预测精度高、调整参数少(只有SPREAD参数),不易陷入局部极小值等优点,可以更快地预测评价网络,具有较大的计算优势。④GRNN网络在逼近能力和学习速度上较RBF网络有更强的优势,网络最后收敛于样本积聚较多的优化回归面,并且在样本数据较少以及存在不稳定数据时,预测效果也较好。

4 结语

a.利用RBF等4种神经网络模型作为湖库富营养化程度评价的方法,从评价结果与其他评价方法对比可以看出,RBF等4种神经网络可以有效评价湖库富营养化程度,可以作为湖库富营养化等级评价的方法之一。

b.应用RBF等4种神经网络评价模型对湖库富营养化程度进行评价,能科学、客观地将湖库富营养化评价的多指标问题综合成单一指标问题,最大限度地克服了主观臆断成分,使评价具有客观性和通用性。

c.制约人工神经网络广泛运用的关键因素之一就是训练样本获取的难易,本文采用内插法构造网络训练样本,在经过一定次数的训练后,网络的目标误差达到精度要求,测试和评价结果令人满意。这一方法可以根据映射关系的复杂程度动态调整网络训练样本的容量,以满足评价或预测的精度要求;可以解决训练样本难以获取的客观条件限制;可以有效控制训练样本范围,以拓宽神经网络在分类、模式识别以及预测方面的应用。

[1]王贵作,任立良,王斌,等.基于投影寻踪的湖泊富营养化程度评价模型[J].水资源保护,2009,25(5):14-18.

[2]舒金华.我国主要湖泊富营养化程度的评价[J].海洋与湖沼,1993,24(6):616-620.

[3]王明翠,刘雪芹,张建辉.湖泊富营养化评价方法及分级标准[J].中国环境监测,2002,18(5):47-50.

[4]李凤彬,肖勇,杜亮.相关加权综合营养状态指数方法在洋河水库富营养化评价中的应用[J].河北环境科学,2003(3):43-45.

[5]李祚泳,邓新民,张辉军,等.模糊度概念用于湖泊富营养化评价[J].环境科学研究,1991,4(2):32-36.

[6]李祚泳,邓新民,张辉军.湖泊富营养化程度的多目标Fuzzy-Grey决策评价[J].系统工程,1990,8(3):60-65.

[7]李祚泳,邓新民,张辉军.模糊数运算法用于湖泊营养类别评判[J].重庆环境科学,1990,12(5):28-32.

[8]李祚泳,李继陶,陈祯培.灰色局势决策法用于水质富营养化评价[J].重庆环境科学,1990,12(1):22-26.

[9]李祚泳,邓新民,李红卫.湖泊富营养化灰色聚类评价及几种评价方法比较[J].成都气象学院学报,1990(1):41-48.

[10]李祚泳,邓新民,张辉军.湖泊富营养化的灰色层次决策法综合评价[J].上海环境科学,1992,11(3):17-21.

[11]李祚泳,邓新民,洪继华.主分量分析法用于湖泊富营养化评价的相互比较[J].环境科学学报,1990,10(3):311-317.

[13]谢平,李德,陈广才,等.基于贝叶斯公式的湖泊富营养化随机评价方法及其验证[J].长江流域资源与环境,2005,14(2):224-228.

[13]赵晓莉,李祚泳,闫军.人工鱼群算法在湖泊富营养化综合评价中的应用[J].水资源保护,2008,24(1):49-51.

[14]高军省.湖泊富营养化综合评价的五元联系数法[J].人民长江,2010,41(21):81-84.

[15]王晓萍,孙继洋,金鑫.基于BP神经网络的钱塘江水质指标的预测[J].浙江大学学报:工学版,2007,41(2):361-364.

[16]周秀平,王文圣,曾怀金.偏最小二乘与人工神经网络耦合模型在酸雨pH值预测中的应用[J].水利水电科技进展,2006,26(4):50-52.

[17]董长虹.Matlab神经网络与应用[M].北京:国防工业出版社,2005.

[18]丛爽.面向MATLAB工具箱的神经网络理论与应用[M].合肥:中国科学技术大学出版社,2009.

[19]杨淑莹.模式识别与智能计算Matlab技术实现[M].北京:电子工业出版社,2008.

[20]张良均,曹晶,蒋世忠.神经网络实用教程[M].北京:机械工业出版社,2008.

[21]韩涛,李怀恩,彭文启.基于MATLAB的神经网络在湖泊富营养化评价中的应用[J].水资源保护,2005,21(1):24-26.

[22]傅荟璇,赵红.MATLAB神经网络应用设计[M].北京:机械工业出版社,2009.

[23]崔东文.BP神经网络模型在湖泊富营养化程度评价中的应用[J].云南水利水电,2011(1):61-67.

[24]刘永霞,冯仲科,杜鹏志.Elman动态递归神经网络在树木生长预测中的应用[J].北京林业大学学报,2007,29(6):99-103.

[25]符利勇,何 铮,刘应安.基于改进Elman神经网络的林隙大小预测模型[J].南京林业大学学报,2011,35(3):28-32.

[26]SL395-2007地表水资源质量评价技术规程[S].

猜你喜欢
湖库富营养化权值
基于临界点的杭州湾水体富营养化多年变化研究
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
湖库富营养化形成原因和处理策略
洪口水库近年富营养化程度时间分布的研究
卫星测高数据筛选方法研究
秀山县湖库水质特征分析及富营养化评价
基于权值动量的RBM加速学习算法研究
洞庭湖典型垸内沟渠水体富营养化评价
基于多维度特征权值动态更新的用户推荐模型研究