ARIMA模型在降水量预测中的应用

2012-02-28 06:04吕树龙
水科学与工程技术 2012年2期
关键词:降水量水文差分

吕树龙

(辽宁省水文水资源勘测局营口分局,辽宁 营口115003)

1 引言

自然现象受自然界各种因素如气候、环境及人为活动影响,变化规律极其复杂,如水文现象中的雨量,用物理的方法加以分析,因影响因素未全面了解而导致分析模型的复杂和效果不理想。在降水量预测问题的研究中,针对准确预测降水量和降水变化规律,利用时间序列预测模型(ARIMA)对降水量原始数据进行处理,将非平稳性数据处理成平稳性数据,采用能够进行时间序列分析的ARIMA模型对平稳后的降水量进行模拟,建立最优降水量预测模型,并对实际降水量进行预测对比。

2ARIMA模型

2.1 概念

ARIMA模型全称为自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于20世纪70年代初提出的时间序列预测方法,又称为box-jenkins模型、博克思—詹金斯法。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对其滞后值及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)及ARIMA过程。

ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后可以从时间序列的过去值及现在值来预测未来值。

2.2 ARIMA模型预测的基本程序

(1)根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。

(2)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值平均值接近零。

(3)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。

(4)进行参数估计,检验是否具有统计意义。

(5)进行假设检验,诊断残差序列是否为白噪声序列。

(6)利用已通过检验的模型进行预测分析。

3 ARIMA模型对降水量趋势分析与预测

3.1 数据准备与处理

以营口1960~2000年降水量数据作为分析样本用于建立ARIMA模型,并进行向前预测,使用2001~2005年降水量数据进行检验。

首先在SPSS软件平台进行降水量的录入与定义日期,然后进行数据序列图的绘制,如图1。

图1 营口市1960~2000年降水量序列

从图1可以看出,该时间序列具有一定的向下趋势,并不平稳,需要进行平稳化处理。对数据进行一阶差分变换并绘制序列图,可以看到差分后的序列在均值附近上下波动,序列基本平稳,如图2所示。

图2 降水量平稳化序列

3.2 ARIMA模型参数估计、定阶及检验

利用SPSS软件绘制降水量1阶差分的自相关和偏自相关图,从图3中可以看出一阶差分后数据序列的自相关和偏自相关函数值较接近零,判定数据序列基本平稳。由于对数据序列进行一阶差分,故ARIMA模型参数d取值为1。

图3 降水量平稳化序列自相关图和偏自相关图 单位:mm

根据自相关图和偏自相关图可以看出均表现为拖尾现象,适用于ARMA模型,偏自相关图中1、2阶函数超出置信区间,显著不为0,之后趋于0,并呈现拖尾现象,故判断p值取1或2;自相关图中1阶函数超出置信区间,显著不为0,之后趋于0,并呈现拖尾现象,判断q值取0或1。利用SPSS建立ARIMA模型分析判定,再运用最佳准则函数定阶法,即BIC准则。一般来讲,在给出不同模型的BIC计算公式基础上,选取BIC达到最小的那一组阶数为理想阶数。通过SPSS软件的参数评估,最后选点ARIMA(2,1,1)模型最为合适。

图4 残差序列自相关图和偏自相关图

模型的显著性检验即为残差序列的白噪声检验,从SPSS的输出结果来看ARIMA(2,1,1)模型的Ljung-Box 统计量Q=10.384,p值为0.795显著大于0.05的检验水平,因此可认为这个序列为白噪声序列。

从图4分析,模型残差服从以0为均值的平稳随机过程,是白噪声的,说明模型效果较好。

3.3 ARIMA模型预测分析

利用SPSS建立ARIMA(2,1,1),使用1960~2000年降水量数据拟合分析,对2001~2005年降水量数据进行预测检验,预测对比结果见表1及图5。

表1 2001~2005年降水量预测值与实际值对比

从预测结果对比分析可以看出,利用SPSS建立的ARIMA(2,1,1)模型对2001~2005年降水量的预测值与实际值相差不大,相对误差均在10%之内。预测值的年度变化趋势与实际值也相符,能够反映出降水量的年际变化,可以作为一种手段用于早期的预测与趋势分析。

图5 2001~2005年降水量预测结果

4 结语

ARIMA模型可以用于预测降水量的变化趋势。由于影响降水量的因素很多,其中的自然因素错综复杂,在建立预测模型时,各种相关因子的考虑对预测结果至关重要,特别是当今人类活动已严重影响到天气和气候,过去的规律有可能被打破。本文运用SPSS软件针对降水量预测方面进行探讨,旨在进一步挖掘SPSS软件在水文、水资源等方面的运用,为水文、水资源相关资料的统计与计算分析提供一种新的分析方法和手段。

[1]陈耀辉,李楚森.分数阶ARIMA模型的参数估计与预测[J].系统工程,2004,22(6):87-90.

[2]李纪人,刘德平.水文时间序列模型及预报方法[M].南京:河海大学出版社,1991.

[3]胡军华,张庆波,鲍雷鸣.SPSS统计软件在水文预报中的应用[J].西北水电,2006(2):3-4.

[4]卢文岱.SPSS for windows应用[M].北京:电子工业出版社,2002.

猜你喜欢
降水量水文差分
继往开来 守正创新——河北省水文工程地质勘查院
数列与差分
水文
水文水资源管理
降水量是怎么算出来的
黄台桥站多年降水量变化特征分析
1988—2017年呼和浩特市降水演变特征分析
水文
基于小波变换的三江平原旬降水量主周期识别
基于差分隐私的大数据隐私保护