杨昕馨
(新疆宏昌水利规划设计公司,新疆乌鲁木齐830000)
基于平稳时间序列模型的开都河年径流量预报
杨昕馨
(新疆宏昌水利规划设计公司,新疆乌鲁木齐830000)
提供一个具有较好的适应性和预报精度的模型预报应用程序。运用C#语言设计实现模型的建立及年径流量的预报,通过新疆开都河大山口水文站年径流量时间序列的应用表明,该模型的预报精度满足要求。
平稳时间序列分析;自回归模型;年径流量;开都河
平稳时间序列分析在预报中已有多年的应用,把水文要素随时间的变化作为一个随机过程来研究,将某一水文随机过程离散化以后可得到一个水文时间序列,在一定条件下,可分析出水文要素前后期演变情况的统计规律,并可应用这一统计规律由前期水文要素的数值作出后期要素的预报。
平稳时间序列分析是研究具有平稳性的一个时间序列在不同时间间隔之间自身线性相关关系的方法,所建立的模型称为自回归方程。其表达式为
式中:p为自回归模型的阶数,原则上p可为任意非负整数;Yt、Yt-1、Yt-p分别为时间序列在 t、t- 1、t- p 时的观测值;Ф1,Ф2,…,Фp为自回归模型的参数;et为误差或偏差,表示不能用模型描述的随机因素。
自回归模型是在各态历经平稳的假定下来进行预报的。但是,在水文数据不能根据简单的物理考虑作出是否接受平稳性假设时,可对时间序列先进行零均值化、差分平稳化等处理,使其满足模型前提条件。零均值化处理,是指对均值不为零的时间序列中的每一项数值都减去该时间序列的平均数,构成一个新的均值为零的时间序列,即
式中:Y均是原时间序列的平均数。
差分平稳处理是指对零均值的非平稳时间序列进行差分,使之成为平稳的时间序列。即对序列Yt进行一阶差分,得到一阶差分序列▽Yt。
对一阶差分序列▽Yt再进行差分,得到二阶差分序列▽2Yt。
依此类推,可得到n阶差分序列。一般情况下,非平稳序列在经过一阶差分或二阶差分都可以实现平稳化。模型中的自相关系数与偏相关系数对识别时间序列的特性具有重要的作用。一般地,Yt-k是其滞后k时数据形成的序列。时间序列相差k个时期的两项数据序列之间依赖程度或相关程度可用自相关系数rk表示:
式中:表示第t时段观测值;表示时段平均值;n为序列长度;k为滞时,k=1,2,…,m。
偏自相关是时间序列 Yt在给定了 Yt-1,Yt-2,…,Yt-k+1的条件下,通过剔除其它各期的影响,Yt与滞后k时间序列之间的条件相关。它用来度量当其它滞后1,2,3,…,k-1时间序列的作用已知的条件下,Yt与Yt-k之间的相关程度。这种相关程度可用偏自相关系数来度量Φkk,可用偏自相关系数来初步判定模型的阶数,偏相关系数可用递推法求解,其计算公式为:
模型的阶数识别对自回归模型来讲甚为重要,可用FPE(最终预报误差)准则来识别:
FPE(k)=(1+k/n)(1-k/n)δ2(k)
式中:δ2(k)=r(0)- ∑B(k,i)r(i),其中 i=1,2,…,k。
当k分别取1,2,…,n-1时,可求得不同的 FPE(k)值,其中最小FPE(k)对应的k值即为模型阶数的估计值。另据经验分析,模型阶数k可取值于n/10与n/4之间。如果n≥50时,可取k<n/4,常取k在n/10左右;如果n<50时,可取k在n/4左右。
模型建立采用面向对象的编程方法来实现,程序设计语言采用C#。C#是一种最新的、面向对象的编程语言。它可快速地编写各种基于Microsoft.NET平台的应用程序。最重要的是C#使得C++程序员可以高效地开发程序,而绝不损失C/C++原有的强大功能。应用程序采用3层设计:①数据层,该层提供了对时间系列数据的提取访问,对系列的特征值、模型各项参数的存储功能等,本系统采用Microsoft Access数据库;②事务逻辑层:该层是程序的核心部分,完成模型的构建与求解等功能。该层包含的模块有数据序列的平稳化,可根据用户需要选择一种或一种以上的数据系列平稳方法,使系列满足模型的前提条件,系列特征值求解、自相关系数求解,自回归系数求解,求预报值,误差统计,拟合度检验等;③表示层,该层提供应用程序与用户的接口,也就是用户界面。主要实现与用户的交互,如数据序列的选择、模型参数的选择,自回归系数、偏相关系数的显示,显示历史拟合曲线图等。
开都河位于新疆巴音郭楞蒙古自治州境内,发源于天山南麓中部的伊连哈比尔尕山,流经巴州和静、焉耆、博湖三县,最终流入全国最大的内陆淡水湖——博斯腾湖。河流全长525 km,多年平均径流量32.89亿 m3,天然落差1 843 m,水能资源理论蕴藏量1 420 MW。
选用新疆开都河大山口水文站1961~2002年共42 a年径流量序列,用平稳时间序列进行分析计算,并对2003~2007年年径流量进行预报。运行平稳时间序列分析程序,从数据库导入上述数据做为预报系列,根据对系列的分析选择相应的平稳方法使其满足模型要求,输入模型参数,这里采用FPE来识别模型阶数,进行预报。
模型对开都河年径流量的模拟与预测值见图1。
根据时间序列模型求得开都河2003~2007年径流量预测值(见表1)。模型拟合效果统计值见表2。从以上模型计算与检验的结果来看,所建立的自回归模型对于预报开都河径流量具有一定的实用价值。
表1 模型预测误差分析
表2 模型模拟样本拟合效果分析
图1 开都河年径流量实测值与模拟值对比
采用平稳时间序列分析的方法,对预报系列进行差分、零值化、滤波处理等,消除了异常值的影响,预报过程清晰简单,可很快给出中期较为合理的预测值,为水文长期预报提供了一个方便且较为可靠的预测方法。但在建模过程中,由于选用的参数修正方法不够合适,使得模型在拟合过程中存在较大误差,为此需要选用更好的参数修正方法以得到更精确的模拟和预测。
[1]Karli Watson.C#入门经典[M].北京:清华大学出版社.2002.
[2]何书元.应用时间序列分析[M].北京:北京大学出版社.2002.
[3]SL250-2000,水文情报预报规范[S].
P338
B
1004-1184(2012)03-0140-01
2012-02-03
杨昕馨(1980-)女,新疆库尔勒人,工程师,主要从事水利工程规划设计工作。