基于相空间重构原理的遗传神经网络模型在城市需水预测中的应用

2014-12-16 07:58崔东文
水利水电科技进展 2014年1期
关键词:相空间需水延迟时间

崔东文

(云南省文山州水务局,云南文山 663000)

城市需水预测是城市供水总体规划和工程规划的基础。城市需水预测的方法众多,如定额法、时间序列法、弹性系数预测法、回归分析法以及灰色预测法等,这些方法广泛应用于城水需水预测中,但均存在预测精度不高等问题[1]。为提高需水预测的精度,混沌理论、灰色系统理论、神经网络理论、系统动力学方法等一些非传统需水预测理论及方法被引入到需水预测中,并在提高需水预测精度上取得了较好 的 效 果[2-6]。 人 工 神 经 网 络 (artifical neural network,ANN)具有较强的非线性映射能力以及鲁棒性、容错性、自适应性、自组织性、自学习性等特性,适宜解决高维、非线性系统问题,是智能算法中运用最为广泛的算法之一。BP神经网络(backpropagation neural network)是ANN中常用的神经网络模型,广泛运用于需水预测。然而,将BP神经网络应用于需水预测存在两个方面的不足:①输入向量(影响因子)间可能存在着高度相关性,易产生共线性问题从而影响模型的预测精度和泛化能力;②BP神经网络存在学习收敛速度慢、易陷入局部极值以及网络结构难以确定等缺点,极大地制约了BP神经网络在需水预测中的精度和泛化能力。近年来,随着对混沌理论及其应用技术研究的不断深入,基于混沌时间序列建模和预测已成为混沌信息处理研究领域中的热点,并成功应用于城市需水预测中[7],其相空间重构是影响需水预测成败的关键,而延迟时间τ和嵌入维数m的选取对相空间重构具有十分重要的意义。关于延迟时间τ与嵌入维数m的选取,目前主要有两种观点:一种观点认为两者互不相关,即τ和m的选取是独立进行的,如求延迟时间的自相关函数法[8]、互信息法[9],求嵌入维数的 G-P 算法[10]、假最近邻法[11]等;另一种观点认为两者是相关的,即τ和m的选取是互相依赖的,如嵌入窗法[12]、C-C 方法[13]等,可同时计算出延迟时间和时间窗口。然而,在实际应用中对于同一时间序列,上述各种方法的确定结果往往不尽相同,这对延迟时间τ和嵌入维数m的选取带来困难。遗传算法(genetic algorithm,GA)具有很强的宏观搜索能力和良好的全局优化性能,将GA与BP神经网络相结合,利用GA训练BP神经网络的权值和阈值,有效克服了BP神经网络易陷入局部极值等缺点。

针对上述问题及原因,本文基于相空间重构原理,利用试凑的方法确定需水预测时间序列中的延迟时间τ和嵌入维数m,将一维需水时间序列拓展为多维,以解决多变量需水预测模型中变量之间普遍存在的多重共线性问题;对于BP神经网络的固有缺陷,采用GA优化BP神经网络的权值和阈值,以克服BP神经网络易陷入局部极值等缺点,提出基于相空间重构原理的GA-BP需水预测模型,以上海市需水预测为例进行实例分析,研究提高需水预测精度的有效方法。

1 基于相空间重构原理的GA-BP需水预测模型

1.1 相空间重构原理

图1 GA-BP算法流程

相空间重构的目的是在高维相空间中恢复混沌吸引子。由于吸引子的内在行为具有不规则性及混沌吸引子具有复杂的几何结构,一般来说,不同的混沌实测数据应建立不同的混沌模型。混沌模拟是在相空间中进行的,其原理就是在相空间中找到一个非线性模型去逼近系统动态特性,实现一定时期内的预测[14]。

设给定的时间序列为xt(t=1,2…,N),将一维时间序列延拓为m维相空间时间序列:

式中:N为总相点数;m为嵌入维数;τ为延迟时间;M为相空间中的相点数,且 M=N-mτ。根据Takens定理,选择合适的嵌入维数和时间延迟就可以在拓扑等价的意义下恢复原来系统的动力学形态,因此存在一个光滑映射F:Rm→Rm,给出相空间轨迹的表达式为

式中:η为预测步长。

1.2 GA-BP 算法流程

GA与BP神经网络均具有极强的解决问题的能力[15-18],二者相结合形成GA-BP算法,该算法将GA的全局寻优能力与BP神经网络的指导性搜索思想相结合,既克服了寻优中的盲目性,又避免了局部收敛情况的发生,使网络性能得到极大的改善[19-20]。GA-BP算法流程如图1所示。

GA-BP算法的实现步骤如下:

a.初始化种群P,包括交叉规模、交叉概率Pc、突变概率Pm以及对网络权值和阈值初始化,并采用实数编码方式对初始值进行编码,设定种群规模n。

b.计算各个体评价函数,将其排序,按下式概率值选择网络个体:

式中:pi为选择概率;fi为个体i的适应度值;n为染色体数;Ei为误差平方和;r为学习样本数;q为输出节点数;γi为网络实际输出;di为期望输出。

c.以交叉概率Pc对个体Gi和Gi+1进行交叉操作,产生新个体G'i和G'i+1,没有进行交叉操作的个体直接进行复制。

d.利用变异概率Pm突变产生Gj的新个体G'j。

e.将新个体插入到种群P中,并计算新个体的评价函数。

f.判断计算是否结束。如果找到满意个体,则结束;否则转到步骤c进入下一轮运算。

g.计算结束,达到预先设定的性能指标后,将最终种群中的最优个体解码,即可得到优化后的网络连接权值系数。

h.将优化得到的网络连接权值系数赋值给BP神经网络进行训练及预测输出。

1.3 GA-BP需水预测模型

基于相空间重构原理,利用试凑的方法确定需水预测时间序列的延迟时间τ与嵌入维数m,构建BP神经网络需水预测模型。在确定BP最佳网络结构以及获得较好预测精度的前提下,为不失一般性,在相同网络结构、传递函数、训练函数及期望误差等条件下,运用GA来优化BP神经网络的初始权值和阈值,构建GA-BP需水预测模型,具体预测步骤如下:

a.利用试凑的方法确定需水预测时间序列的延迟时间τ与嵌入维数m,确定BP神经网络的输入向量、输出向量、训练样本和检验样本,构建BP神经网络需水预测模型。

b.依据经验给定BP神经网络需水预测模型的期望误差和训练次数,根据Kolmogorv定理得出一个初始隐含层节点数,利用逐步增长或逐步修剪法确定最终隐含层节点数;然后采用调整期望误差或训练次数,以及替换传递函数和训练函数等方法获得最佳预测效果时的各相关参数。

c.在BP神经网络需水模型预测精度达到较理想状态下,为不失一般性,利用GA优化BP神经网络的初始权值和阈值,构建GA-BP需水预测模型。

d.利用训练样本对GA-BP需水预测模型进行训练,确定GA-BP预测模型等相关参数。

e.采用平均相对误差和最大相对误差两个性能评价指标对BP神经网络需水预测模型和GA-BP需水预测模型的预测效果进行评价分析。

2 实例验证

2.1 数据来源与相空间重构

以上海市需水预测为例,收集了上海市1980—2011年的年用水量,并以1980—2009年的数据构建需水预测模型的输入、输出向量,其中以上海市1980—2004年的年用水量作为训练样本,2005—2009年的年用水量作为检验样本,在模型达到期望精度后用于上海市2010—2015年的需水预测。

由于用水时间序列较短,设定延迟时间τ和嵌入维数m的取值范围为1~4,并利用试凑的方法最终确定τ=1、m=4时的模型具有较好的预测效果,模型的输入、输出向量见表1。

2.2 需水预测的实现

2.2.1 时间序列预测方法

在单变量时间序列预测中,设有时间序列{xi},其中历史数据为{xj,xj+1,…,xj+l},对未来 j+l+η(η >0)时刻的取值进行预测,即预测xj+l+η的值。方法是求出历史数据{xj,xj+1,…,xj+l}与 xj+l+η的某种非线性函数关系:xj+l+η=F(xj,xj+1,…,xj+l)。

表1 上海市1980—2010年需水预测模型输入、输出向量 亿m3

单变量时间序列预测常用的方法有3种:单步预测(η=1)、多步预测(η>1)和滚动预测(进行单步预测,然后将输出反馈给输入端作为网络输入的一部分,预测未来某个时刻的值)。本文采用单变量滚动预测的方法对上海市2010—2015年的需水量进行预测。

2.2.2 数据标准化处理

对原始数据进行归一化处理有利于神经网络训练。本文采用最大最小法进行数据处理,公式如下:

2.2.3 神经网络训练

BP神经网络模型:采用MATLAB软件编写BP神经网络算法程序实现需水预测,程序采取循环训练算法确定网络结构,最终确定BP神经网络需水预测模型的结构为4-3-1,隐含层和输出层传递函数分别采用logsig和purelin,训练函数采用traingdx,学习速率为0.01,设定期望误差为0.0001,最大训练轮回为10000次时网络达到了较好的预测精度。

GA-BP模型:基于公平原则,在上述BP神经网络较佳结构及相同参数条件下,运用GA来优化BP神经网络的权值和阈值。GA参数设置为:种群规模为100,进化次数为100次,交叉概率和变异概率等参数采用谢菲尔德GA工具箱的默认值。

2.2.4 模型评价指标

选取平均相对误差eMRE、最大相对误差emaxRE作为模型的评价指标,其计算公式如下:

2.3 需水预测结果及分析

利用上述训练好的BP神经网络需水预测模型、GA-BP需水预测模型对上海市2005—2009年的样本进行检验,并对2010—2015年的年需水量进行预测,结果见表2和表3。

表2 上海市2005—2009年的年用水量检验结果及比较

表3 上海市2010—2015年的年需水量预测结果及比较

分析表2、表3可以得出:

a.基于相空间重构的BP神经网络需水预测模型和GA-BP需水预测模型的需水预测效果均令人满意,GA-BP需水预测模型样本检验的平均相对误差和最大相对误差分别为1.4344%和2.7672%,均优于BP神经网络模型预测结果,表明基于相空间重构的GA-BP需水预测模型用于需水预测具有较好的预测精度和泛化能力,是提高需水预测精度的有效途径和方法。

b.由于本文BP神经网络训练采用traingdx算法,该算法具有附加动量和自适应调整算法的优点,在一定程度上能有效避免收敛速度慢、陷入局部极值的缺陷。因此,基于相空间重构原理的BP神经网络需水预测模型在上海市需水预测中同样具有很好的预测精度。在相同网络结构、传递函数、训练函数等条件下,采用GA算法优化BP神经网络权值和阈值,使GA-BP模型的需水预测达到了更高的精度。

c.从表3可以看出,相同年份的GA-BP预测模型对上海市的需水预测结果要小于BP神经网络需水预测模型。GA-BP需水预测模型对2010—2015年的需水预测结果表明,其年需水量增幅在1.24%~0.88%之间,呈逐年下降趋势,这与我国实行最严格水资源管理制度以及城市需水增长缓慢的实际基本相符,表明基于相空间重构的GA-BP需水预测模型用于城市需水预测的精度更高、更合理。从2010—2011年需水预测结果与实际值相比来看,GA-BP需水预测模型需水量预测结果的相对误差仅分别为0.5136%和0.0270%,均优于BP神经网络需水预测模型。

3 结语

针对多元变量需水预测模型中变量之间普遍存在多重共线性问题以及BP神经网络收敛速度慢、易陷入局部极值等缺点,提出了一种基于相空间重构原理的GA-BP单因子需水预测模型,并对上海市需水预测为例进行实例验证。结果表明,GA-BP需水预测模型克服了传统多变量需水预测模型输入变量之间产生的多重共线性问题以及BP神经网络易陷入局部极值等缺点,提高了需水预测的精度。GA-BP模型具有预测精度高、泛化能力强等优点,有着良好的推广应用价值。按照本文提出的相空间重构GA-BP单因子需水预测模型预测出上海市2012—2015年的年需水量分别为 31.51亿 m3、31.86亿m3、32.17亿m3和32.45亿m3。

[1]刘卫林.几种需水量预测模型的比较研究[J].人民长江,2008,39(6):19-22.(LIU Weilin.Comparative research on several models for water demand forecast[J].Yangtze River,2008,39(6):19-22.(in Chinese))

[2]王建华.城市需水量的混沌预测[J].中国农村水利水电,2008(8):32-34.(WANG Jianhua.Chaos-prediction in urban water consumption[J].China Rural Water and Hydropower,2008(8):32-34.(in Chinese))

[3]蒋绍阶,江崇国.灰色神经网络最优权组合模型预测城市需水量[J].重庆建筑大学学报,2008,30(2):113-115.(JIANG Shaojie,JIANG Chongguo.Urban water demand forecasting by combining improved BP neural network and grey model with optimum weight[J].Journal of Chongqing Jianzhu University,2008,30(2):113-115.(in Chinese))

[4]CUBERO R G.Neural networks for water demand time series forecasting[C]//The proceedings of international workshop on artificial neural networks(IWANN),1991.Granada:[s.n.],1991:453-460.

[5]张雪花,张宏伟,张宝安.SD法在城市需水量预测和水资源规划中的应用研究[J].中国给水排水,2008,24(9):42-46.(ZHANG Xuehua,ZHANG Hongwei,ZHANG Baoan.Application of system dynamics approach to urban water demand forecasting and water resources planning[J].China Water & Wastewater,2008,24(9):42-46.(in Chinese))

[6]张志果,邵益生,徐宗学.基于恩格尔系数与霍夫曼系数的城市需水量预测[J].水利学报,2011,41(11):1304-1306.(ZHANG Zhiguo,SHAO Yisheng,XU Zongxue.Prediction of urban water demand based on Engel Index and Hoffmann Coefficient[J].Journal of Hydraulic Engineering,2011,41(11):1304-1306.(in Chinese))

[7]刘勇健,沈军.城市需水量预测的混沌神经网络模型[J].水 电 能 源 科 学,2005,23(1):15-17.(LIU Yongjian,SHEN Jin.Prediction model of urban water consumption based on chaos neural network [J].Hydroelectric Energy,2005,23(1):15-17.(in Chinese))

[8]KANTZ H,SCHREIBER T.Nonlinear time series analysis[M].Cambridge:Cambridge University Press,1997.

[9]FRASER A M,SWINNEY H L.Independent coordinates for strange attractors from mutual in formation[J].Physical Review A,1986,33(2):1134-1140.

[10]GRASSBERGER P,PROCACCIA I.Measuringthe strangeness of strange attractors[J].Physica D,1983,9:189-208.

[11]KENNEL M B,BROWN R,ABARBANEL H D I.Determining embedding dimension for phase-space reconstruction using a geometrical construction [J].Physical Review A, 1992, 45( 6) : 3403-3407.

[12]KUGIURMTZIS D.State space reconstruction parameters in the analysis of chaotic times series-the role of the time window length[J].Physica D,1996,95:13-28.

[13]KIM H S,EYKHOLT R,SALAS J D.Nonlinear dynamics,delay times and embedding windows[J].Physica D,1999,127:48-60.

[14]邵东国,刘丙军,阳书敏,等.水资源繁杂系统理论[M].北京:科学出版社,2012.

[15]崔东文.基于BP神经网络的文山州水资源承载能力评价分析[J].长江科学院报,2012,29(5):9-15.(CUI Dongwen.Evaluation and analysis of water resources carrying capacity in wenshan prefecture based on BP neural network[J].Yangtze River Scientific Research Institute,2012,29(5):9-15.(in Chinese))

[16]崔东文.几种神经网络模型在湖库富营养化程度评价中的应用[J].水资源保护,2012,28(6):12-18.(CUI Dongwen.Applications of several neural network models to eutrophication evaluation of lakes and reservoirs[J].Water Resources Protection,2012,28(6):12-18.(in Chinese))

[17]王小川,史峰,郁磊,等.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.

[18]苑希民,李鸿雁,刘树坤,等.神经网络和遗传算法在水科学领域的应用[M].北京:中国水利水电出版社,2002.

[19]翟宜峰,李鸿雁,刘寒冰,等.遗传算法优化神经网络初始权重方法的研究[J].吉林大学学报:工学版,2003,33(2):45-50.(ZHAI Yifeng,LI Hongyan,LIU Hanbing,et al.Method for optimizing initial weights of ANNs by GAs[J].Journal of Jilin University of Technology:Natural Science Edition,2003,33(2):45-50.(in Chinese))

[20]汪金良,卢宏,曾青云.GA-BP算法及其在冰铜品位神经网络模型中的应用[J].江西有色金属,2003,17(3):39-41.(WANG Jinliang,LU Hong,ZENG Qingyun.Application of GA-BP to the Matte Grade Model Based on Neural Network[J].Jiangxi Nonferrous Metals,2003,17(3):39-41.(in Chinese))

猜你喜欢
相空间需水延迟时间
二氧化碳对乙烷燃烧着火延迟时间的影响
LTE 系统下行链路FDRX 节能机制研究
基于分层COX模型的跟驰反应延迟时间生存分析
新立城水库生态需水及调度研究
延迟时间对气辅注射成型气体穿透行为影响的数值模拟和实验研究
非对易空间中的三维谐振子Wigner函数
基于相空间重构的电磁继电器电性能参数预测研究
河套灌区试用无人机获取作物需水信息
相空间重构和支持向量机结合的电力负荷预测模型研究
北运河河流生态需水分段法研究