基于加权马尔可夫链的榆林地区年降水状态预测研究

2018-07-03 01:29苗正伟徐利岗

山西建筑 2018年14期

苗正伟徐利岗

(1.河北水利电力学院，河北沧州 061001； 2.宁夏水利科学研究院，宁夏银川 750021)

0 引言

降水的科学预测，不仅可为制定水资源开发利用策略提供依据，又可为防灾、抗灾、减灾提供参考。由物理成因的定性分析及大量降水序列资料的统计分析得知，降水量可视为一列相依的随机变量，其相依程度的强弱，可采用自相关系数作为其定量的测度[1]，基于此，可建立马尔可夫链模型进行预测分析。但实际上，降水是一种非常复杂的自然现象，具有大量的不确定性因素，很难严格满足“齐次性”[2]；同时，有研究表明：考虑随机变量的中间过程状态从而充分利用信息，可提高预测精度[3]，因此本文以降水量序列的规范化后的各阶自相关系数为权，建立加权马尔可夫模型进行预测。

1 加权马尔可夫链模型

其原理参见文献[4]，基本步骤如下：

1)建立年降水量的分级标准[5]，从而确定降水序列的状态空间。可以样本的均值—标准差为标准，将年降水序列划分为五级，此时年降水序列的状态空间E={1,2,3,4,5}。

2)按照上述分级标准确定资料序列中各年降水量的状态，构成年降水状态序列。

3)计算一步转移概率：对于降水状态这一随机变量，很难确定其准确的转移概率，但样本序列足够长时，可用转移频率近似代替转移概率，其计算公式如下：

(1)

其中，m为样本序列的状态个数；fij为样本序列中年降水量从状态i一步转移到j的频次；pij为由样本序列统计得出的状态i到j的一步转移概率(频率)。

4)对样本序列做马氏性检验[6]：当样本序列长度较大时，构造服从自由度为(m-1)2的χ2分布的统计量：

(2)

其中，p*j为边际频率，计算公式如下：

(3)

给定显著性水平α，查表可得分位点χ2((m-1)2)的值，若χ2>χ2((m-1)2)，则认为样本序列具有马氏性，可作为马尔可夫链来处理。

5)计算各阶自相关系数：

(4)

6)对各阶自相关系数规范化：

(5)

其中，ωk为步长为k的转移概率的权重；b为按预测需要计算到的最大步长。

7)计算转移矩阵：与式(4)同理，由样本序列统计各状态间各步长的转移概率，各步长的转移概率构成相应步长的转移矩阵，它决定了降水状态转移的概率法则。

关于扩大灌溉面积。第一，还是要坚持外延与内涵相结合。内涵就是对老的配套不完善的这些灌区进行挖潜改造，特别是着力解决好“最后一公里”的问题，这样可以使有效灌溉面积得到恢复和改善。第二，在水土资源条件组合比较好、有开发利用潜力的地方，结合千亿斤粮食生产规划，大力发展灌溉面积。第三，大力推行节水措施，包括北方地区的节水、东北四省区的节水、西北地区的节水。第四，充分地调动农民的积极性，调动社会的资金。比如像刚才郝益东同志提出，内蒙古搞的大型喷灌，基本上很多都是用社会资金来搞的。还有水权置换，工业企业要上新项目，但是没有用水指标，那么就支持河套灌区的农业节水，通过节出来的水量发展工业项目。

9)将同一状态的各预测概率加权后求和：

(6)

则，max{pi，i∈E}所对应的i即为该年年降水的预测状态。若该年年降水状态可确定，将其加入原序列，重复以上步骤进行下一年度的预测。

10)进一步对该马尔可夫链的特征(非周期、遍历性、平稳分布等)进行分析。

2 榆林地区年降水状态预测

于“中国气象数据网”下载了榆林地区1951年—2010年的逐月降水数据，并将之整理为年降水序列。首先以1951年—2008年的资料建立模型预测2009年的年降水状态。

表1 榆林地区1951年—2008年降水量分级表

表2 榆林地区1951年—2008年降水量及其状态

3)一步转移概率及马氏性检验。经统计计算：

由表1知榆林地区年降水序列的状态数m=5，给定显著性水平α=0.05，查χ2分布分位数表可得χ2((5-1)2)=χ2(16)=26.296。可见，χ2>χ2(16)，因此，该时间序列具有马氏性，即榆林地区1951年—2008年年降水状态序列可视为马尔可夫链。

4)计算各阶自相关系数和权重，结果如表3所示。

表3 各阶自相关系数及权重

5)对降水状态序列进行统计计算，得步长从1～5的转移概率矩阵：

6)根据2004年—2008年的年降水状态预测2009年的年降水状态，结果见表4。

表4 2009年年降水状态预测

由表4可知max{pi，i∈E}=0.449，对应的状态为3，即榆林地区2009年年降水量状态为3，平水年。榆林地区2009年的实际降水量为420.8 mm，由表1知，正属于状态3。预测结果与实际结果吻合。

7)以1951年—2009年的实测资料重复上述步骤预测2010年的降水状态，结果见表5。

表5 2010年年降水状态预测

由表5知，榆林地区2010年年降水量预测状态为3，其实际降水量为363.9 mm，属于平水年，预测与实际相吻合。

3 结论与展望

1)按照均值—标准差方法将榆林地区实测年降水序列划分为丰水、偏丰、平水、偏枯、枯水年五种状态，利用加权马尔可夫链分别对2009年，2010年降水状态进行预测，结果均与实测情况吻合，初步说明用加权马尔可夫链预测榆林地区的年降水状态是可行的。

2)状态标准的划分有一定的随意性，对结果会产生一定影响，如何更科学的划分降水状态有待于进一步探讨。

3)马尔可夫链的预测结果是一个区间，如何结合其他理论或方法进一步预测出较为精确的具体数值，从而拓展预测结果的适用范围，值得进一步研究。

4)用马尔可夫链进行预测的基本假设是：年降水状态序列是齐次马尔可夫链，但实际上这很难严格满足：齐次马氏链的统计特性完全取决于初始分布和一步转移概率，但对于年降水状态序列却很难获得准确的转移概率，只能用由足够长的实际资料进行统计得出的转移频率代替转移概率；齐次马尔可夫链的n步转移概率矩阵等于一步转移概率矩阵的n次方，这对于由统计计算得出的各步转移矩阵显然是难以成立的。这些都会对预测精度产生影响，尽管引入了加权马氏链，但这不能从根本上消弭不足。因此该方法对于水文时间序列预测的适用程度有待进一步检验。

参考文献：

[1] 韩璞璞,张生,李畅游,等.基于权马尔可夫链模型的庐江县降水量预测[J].水文,2012,32(3):38-42.

[2] 韩合忠,高淑会,国伟华.基于加权马尔可夫模型的济南市降水丰枯状况预测研究[J].水文,2012,32(5):72-75.

[3] 王鑫东.加权马尔科夫链模型在农业灌溉用水预测中的应用研究[J].中国农村水利水电,2016(5):58-64.

[4] 刘次华.随机过程[M].第5版.武汉:华中科技大学出版社,2014.

[5] 王宇博,梁秀娟,乔雨,等.基于叠加马尔科夫链和BP神经网络模型的降水量预测研究[J].中国农村水利水电,2014(9):80-86.

[6] 王涛,钱会,李培月.加权马尔可夫链在银川地区降雨量预测中的应用[J].南水北调与水利科技,2010,8(1):78-81.