基于加权马尔可夫链的榆林地区年降水状态预测研究

2018-07-03 01:29苗正伟徐利岗
山西建筑 2018年14期
关键词:马尔可夫步长降水量

苗正伟 徐利岗

(1.河北水利电力学院,河北 沧州 061001; 2.宁夏水利科学研究院,宁夏 银川 750021)

0 引言

降水的科学预测,不仅可为制定水资源开发利用策略提供依据,又可为防灾、抗灾、减灾提供参考。由物理成因的定性分析及大量降水序列资料的统计分析得知,降水量可视为一列相依的随机变量,其相依程度的强弱,可采用自相关系数作为其定量的测度[1],基于此,可建立马尔可夫链模型进行预测分析。但实际上,降水是一种非常复杂的自然现象,具有大量的不确定性因素,很难严格满足“齐次性”[2];同时,有研究表明:考虑随机变量的中间过程状态从而充分利用信息,可提高预测精度[3],因此本文以降水量序列的规范化后的各阶自相关系数为权,建立加权马尔可夫模型进行预测。

1 加权马尔可夫链模型

其原理参见文献[4],基本步骤如下:

1)建立年降水量的分级标准[5],从而确定降水序列的状态空间。可以样本的均值—标准差为标准,将年降水序列划分为五级,此时年降水序列的状态空间E={1,2,3,4,5}。

2)按照上述分级标准确定资料序列中各年降水量的状态,构成年降水状态序列。

3)计算一步转移概率:对于降水状态这一随机变量,很难确定其准确的转移概率,但样本序列足够长时,可用转移频率近似代替转移概率,其计算公式如下:

(1)

其中,m为样本序列的状态个数;fij为样本序列中年降水量从状态i一步转移到j的频次;pij为由样本序列统计得出的状态i到j的一步转移概率(频率)。

4)对样本序列做马氏性检验[6]:当样本序列长度较大时,构造服从自由度为(m-1)2的χ2分布的统计量:

(2)

其中,p*j为边际频率,计算公式如下:

(3)

给定显著性水平α,查表可得分位点χ2((m-1)2)的值,若χ2>χ2((m-1)2),则认为样本序列具有马氏性,可作为马尔可夫链来处理。

5)计算各阶自相关系数:

(4)

6)对各阶自相关系数规范化:

(5)

其中,ωk为步长为k的转移概率的权重;b为按预测需要计算到的最大步长。

7)计算转移矩阵:与式(4)同理,由样本序列统计各状态间各步长的转移概率,各步长的转移概率构成相应步长的转移矩阵,它决定了降水状态转移的概率法则。

关于扩大灌溉面积。第一,还是要坚持外延与内涵相结合。内涵就是对老的配套不完善的这些灌区进行挖潜改造,特别是着力解决好“最后一公里”的问题,这样可以使有效灌溉面积得到恢复和改善。第二,在水土资源条件组合比较好、有开发利用潜力的地方,结合千亿斤粮食生产规划,大力发展灌溉面积。第三,大力推行节水措施,包括北方地区的节水、东北四省区的节水、西北地区的节水。第四,充分地调动农民的积极性,调动社会的资金。比如像刚才郝益东同志提出,内蒙古搞的大型喷灌,基本上很多都是用社会资金来搞的。还有水权置换,工业企业要上新项目,但是没有用水指标,那么就支持河套灌区的农业节水,通过节出来的水量发展工业项目。

9)将同一状态的各预测概率加权后求和:

(6)

则,max{pi,i∈E}所对应的i即为该年年降水的预测状态。若该年年降水状态可确定,将其加入原序列,重复以上步骤进行下一年度的预测。

10)进一步对该马尔可夫链的特征(非周期、遍历性、平稳分布等)进行分析。

2 榆林地区年降水状态预测

于“中国气象数据网”下载了榆林地区1951年—2010年的逐月降水数据,并将之整理为年降水序列。首先以1951年—2008年的资料建立模型预测2009年的年降水状态。

表1 榆林地区1951年—2008年降水量分级表

表2 榆林地区1951年—2008年降水量及其状态

3)一步转移概率及马氏性检验。经统计计算:

由表1知榆林地区年降水序列的状态数m=5,给定显著性水平α=0.05,查χ2分布分位数表可得χ2((5-1)2)=χ2(16)=26.296。可见,χ2>χ2(16),因此,该时间序列具有马氏性,即榆林地区1951年—2008年年降水状态序列可视为马尔可夫链。

4)计算各阶自相关系数和权重,结果如表3所示。

表3 各阶自相关系数及权重

5)对降水状态序列进行统计计算,得步长从1~5的转移概率矩阵:

6)根据2004年—2008年的年降水状态预测2009年的年降水状态,结果见表4。

表4 2009年年降水状态预测

由表4可知max{pi,i∈E}=0.449,对应的状态为3,即榆林地区2009年年降水量状态为3,平水年。榆林地区2009年的实际降水量为420.8 mm,由表1知,正属于状态3。预测结果与实际结果吻合。

7)以1951年—2009年的实测资料重复上述步骤预测2010年的降水状态,结果见表5。

表5 2010年年降水状态预测

由表5知,榆林地区2010年年降水量预测状态为3,其实际降水量为363.9 mm,属于平水年,预测与实际相吻合。

3 结论与展望

1)按照均值—标准差方法将榆林地区实测年降水序列划分为丰水、偏丰、平水、偏枯、枯水年五种状态,利用加权马尔可夫链分别对2009年,2010年降水状态进行预测,结果均与实测情况吻合,初步说明用加权马尔可夫链预测榆林地区的年降水状态是可行的。

2)状态标准的划分有一定的随意性,对结果会产生一定影响,如何更科学的划分降水状态有待于进一步探讨。

3)马尔可夫链的预测结果是一个区间,如何结合其他理论或方法进一步预测出较为精确的具体数值,从而拓展预测结果的适用范围,值得进一步研究。

4)用马尔可夫链进行预测的基本假设是:年降水状态序列是齐次马尔可夫链,但实际上这很难严格满足:齐次马氏链的统计特性完全取决于初始分布和一步转移概率,但对于年降水状态序列却很难获得准确的转移概率,只能用由足够长的实际资料进行统计得出的转移频率代替转移概率;齐次马尔可夫链的n步转移概率矩阵等于一步转移概率矩阵的n次方,这对于由统计计算得出的各步转移矩阵显然是难以成立的。这些都会对预测精度产生影响,尽管引入了加权马氏链,但这不能从根本上消弭不足。因此该方法对于水文时间序列预测的适用程度有待进一步检验。

参考文献:

[1] 韩璞璞,张 生,李畅游,等.基于权马尔可夫链模型的庐江县降水量预测[J].水文,2012,32(3):38-42.

[2] 韩合忠,高淑会,国伟华.基于加权马尔可夫模型的济南市降水丰枯状况预测研究[J].水文,2012,32(5):72-75.

[3] 王鑫东.加权马尔科夫链模型在农业灌溉用水预测中的应用研究[J].中国农村水利水电,2016(5):58-64.

[4] 刘次华.随机过程[M].第5版.武汉:华中科技大学出版社,2014.

[5] 王宇博,梁秀娟,乔 雨,等.基于叠加马尔科夫链和BP神经网络模型的降水量预测研究[J].中国农村水利水电,2014(9):80-86.

[6] 王 涛,钱 会,李培月.加权马尔可夫链在银川地区降雨量预测中的应用[J].南水北调与水利科技,2010,8(1):78-81.

猜你喜欢
马尔可夫步长降水量
1958—2019年新兴县汛期降水量的气候特征
成都市年降水量时空分布特征
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
降水量是怎么算出来的
基于马尔可夫链共享单车高校投放研究
基于马尔可夫链共享单车高校投放研究
1988—2017年呼和浩特市降水演变特征分析
多状态马尔可夫信道的时延分析
基于动态步长的无人机三维实时航迹规划
基于SOP的核电厂操纵员监视过程马尔可夫模型