基于时间序列分析的无为县降水量预测模型的研究

2018-05-31 00:53奚立平蔡文庆吴海鹰

安徽水利水电职业技术学院学报 2018年1期

奚立平，蔡文庆，吴海鹰

(1.安徽水利水电职业技术学院，安徽合肥 231603；2.无为县气象局，安徽芜湖 238300)

无为县地处安徽省中南部,属亚热带季风气候区,旱涝频发,严重影响农业生产、社会经济发展等,因此利用时间序列分析法,建立降水量预测数学模型,服务于生活生产,尤其在防汛抗旱、农业生产等方面具有现实需求。

1 时间序列分析原理

降水是随时间变化的,对其观测形成一组有序的数据,称为时间序列,从“时域”角度对降水进行分析,称为时间序列分析,其基本思想是认为降水在随时间变化过程中任一时刻的变化和前期降水变化有关,利用这种关系建立适当的模型来描述它们变化的规律性,然后利用所建立的模型做出降水未来时刻的预报值估计。平稳时间序列模型主要有3种。

(1)自回归模型AR(p)。

Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+at

(1)

其中,p为模型的自回归阶数;Xt为平稳、正态、零均值的时间序列;φ为不为零的模型系数,表示时间序列中要素前后时刻间相关性大小;at为白噪声序列。

(2)移动平均模型MA(q)。

Xt=at-θ1at-1-θ2at-2-…-θqat-q

(2)

其中,q为模型的移动平均阶数;Xt为平稳、正态、零均值的时间序列;θ为不为零的模型系数,表示时间序列中要素与前期时刻白噪声间相关性大小;at为白噪声序列。

(3)自回归移动平均模型ARMA(p,q)。

Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p+at-θ1at-1-θ2at-2-…-θqat-q

(3)

自回归移动平均模型ARMA(p,q)可以看成是自回归模型AR(p)的发展,即用p阶自回归模型AR(p)描述Xt所余下无法拟合的部分,用q阶移动平均模型MA(q)来描述。

2 降水量时间序列模型的建立及预测

图1 无为县年降水量序列图

图2 无为县年降水量自相关系数图

图3 无为县年降水量偏自相关系数图

利用spss 23统计软件,输入无为县1957～2016年年降水量资料,其序列图如图1所示,显然是平稳序列。

进一步对自相关性和偏自相关性进行检验,结果如图2、图3所示,由图可知,无为县年降水量序列接近于白噪声序列,反映无为县年降水量随机性强。

对序列进行1阶和2阶差分处理,其相关性仍然较弱难以建模。

为了增强序列的相关性,对降水量进行5年叠加,1957～1961年的降水量叠加作为新序列的第1个值,1958～1962年的降水量叠加作为新序列的第2个值,以此类推,得到5年叠加后的新序列,对自相关性和偏自相关性进行检验,结果如图4、图5所示,由图可知,新序列是平稳非白噪声序列。

由图4、图5可见,自相关系数在K=2之后基本都落在2倍标准差范围内,可判断其为自相关系数2阶截尾,偏自相关系数在K=1后基本上落入2倍标准差范围以内,可以判断其偏自相关系数1阶截尾,而自相关系数、偏自相关系数开始逐渐变化,且后边还有接近甚至稍大于2倍标准差的,故也可以判断其拖尾,因此,可采用MA(2)、AR(1)以及ARMA(1,2)分别进行拟合。

图5 无为县5年叠加降水量偏自相关系数图

尝试建立MA(2)模型,从模型统计量表1可知,平稳的R2=0.493,杨-博克斯统计量为32.520,伴随概率小于0.05,反映拟合模型的残差存在相关性,不为纯随机序列,从自相关图和偏自相关图如图6所示也能看出这一点,因此,采用MA(2)建模效果较差。

表1 MA(2)模型统计量

再尝试建立AR(1)模型,从模型统计量表2、自相关图和偏自相关图(图7)可得出与上述相似的结论,因此,采用AR(1)建模效果也较差。

表2 AR(1)模型统计量

图6无为县5年叠加降水量MA(2)自相关系数与偏自相关系数图

图7 无为县五年叠加降水量AR(1)自相关系数与偏自相关系数图

最后,尝试建立ARMA(1,2)模型,模型参数如表3所列,经过t检验,自回归系数的伴随概率均小于0.05,显著非零,有统计学意义。从模型统计量表4可知,平稳的R2=0.563,杨-博克斯统计量为22.375,伴随概率大于0.05,再结合从自相关图和偏自相关图(图8)来看,反映拟合模型的残差项不存在相关性,残差序列为白噪声序列,另外,采用ARMA(1,2)拟合的模型不存在离群值,模型的拟合度较好。