苗正伟 徐利岗
(1.河北水利电力学院,河北 沧州 061001; 2.宁夏水利科学研究院,宁夏 银川 750021)
降水的科学预测,不仅可为制定水资源开发利用策略提供依据,又可为防灾、抗灾、减灾提供参考。由物理成因的定性分析及大量降水序列资料的统计分析得知,降水量可视为一列相依的随机变量,其相依程度的强弱,可采用自相关系数作为其定量的测度[1],基于此,可建立马尔可夫链模型进行预测分析。但实际上,降水是一种非常复杂的自然现象,具有大量的不确定性因素,很难严格满足“齐次性”[2];同时,有研究表明:考虑随机变量的中间过程状态从而充分利用信息,可提高预测精度[3],因此本文以降水量序列的规范化后的各阶自相关系数为权,建立加权马尔可夫模型进行预测。
其原理参见文献[4],基本步骤如下:
1)建立年降水量的分级标准[5],从而确定降水序列的状态空间。可以样本的均值—标准差为标准,将年降水序列划分为五级,此时年降水序列的状态空间E={1,2,3,4,5}。
2)按照上述分级标准确定资料序列中各年降水量的状态,构成年降水状态序列。
3)计算一步转移概率:对于降水状态这一随机变量,很难确定其准确的转移概率,但样本序列足够长时,可用转移频率近似代替转移概率,其计算公式如下:
(1)
其中,m为样本序列的状态个数;fij为样本序列中年降水量从状态i一步转移到j的频次;pij为由样本序列统计得出的状态i到j的一步转移概率(频率)。
4)对样本序列做马氏性检验[6]:当样本序列长度较大时,构造服从自由度为(m-1)2的χ2分布的统计量:
(2)
其中,p*j为边际频率,计算公式如下:
(3)
给定显著性水平α,查表可得分位点χ2((m-1)2)的值,若χ2>χ2((m-1)2),则认为样本序列具有马氏性,可作为马尔可夫链来处理。
5)计算各阶自相关系数:
(4)
6)对各阶自相关系数规范化:
(5)
其中,ωk为步长为k的转移概率的权重;b为按预测需要计算到的最大步长。
7)计算转移矩阵:与式(4)同理,由样本序列统计各状态间各步长的转移概率,各步长的转移概率构成相应步长的转移矩阵,它决定了降水状态转移的概率法则。
关于扩大灌溉面积。第一,还是要坚持外延与内涵相结合。内涵就是对老的配套不完善的这些灌区进行挖潜改造,特别是着力解决好“最后一公里”的问题,这样可以使有效灌溉面积得到恢复和改善。第二,在水土资源条件组合比较好、有开发利用潜力的地方,结合千亿斤粮食生产规划,大力发展灌溉面积。第三,大力推行节水措施,包括北方地区的节水、东北四省区的节水、西北地区的节水。第四,充分地调动农民的积极性,调动社会的资金。比如像刚才郝益东同志提出,内蒙古搞的大型喷灌,基本上很多都是用社会资金来搞的。还有水权置换,工业企业要上新项目,但是没有用水指标,那么就支持河套灌区的农业节水,通过节出来的水量发展工业项目。
9)将同一状态的各预测概率加权后求和:
(6)
则,max{pi,i∈E}所对应的i即为该年年降水的预测状态。若该年年降水状态可确定,将其加入原序列,重复以上步骤进行下一年度的预测。
10)进一步对该马尔可夫链的特征(非周期、遍历性、平稳分布等)进行分析。
于“中国气象数据网”下载了榆林地区1951年—2010年的逐月降水数据,并将之整理为年降水序列。首先以1951年—2008年的资料建立模型预测2009年的年降水状态。
表1 榆林地区1951年—2008年降水量分级表
表2 榆林地区1951年—2008年降水量及其状态
3)一步转移概率及马氏性检验。经统计计算:
由表1知榆林地区年降水序列的状态数m=5,给定显著性水平α=0.05,查χ2分布分位数表可得χ2((5-1)2)=χ2(16)=26.296。可见,χ2>χ2(16),因此,该时间序列具有马氏性,即榆林地区1951年—2008年年降水状态序列可视为马尔可夫链。
4)计算各阶自相关系数和权重,结果如表3所示。
表3 各阶自相关系数及权重
5)对降水状态序列进行统计计算,得步长从1~5的转移概率矩阵:
6)根据2004年—2008年的年降水状态预测2009年的年降水状态,结果见表4。
表4 2009年年降水状态预测
由表4可知max{pi,i∈E}=0.449,对应的状态为3,即榆林地区2009年年降水量状态为3,平水年。榆林地区2009年的实际降水量为420.8 mm,由表1知,正属于状态3。预测结果与实际结果吻合。
7)以1951年—2009年的实测资料重复上述步骤预测2010年的降水状态,结果见表5。
表5 2010年年降水状态预测
由表5知,榆林地区2010年年降水量预测状态为3,其实际降水量为363.9 mm,属于平水年,预测与实际相吻合。
1)按照均值—标准差方法将榆林地区实测年降水序列划分为丰水、偏丰、平水、偏枯、枯水年五种状态,利用加权马尔可夫链分别对2009年,2010年降水状态进行预测,结果均与实测情况吻合,初步说明用加权马尔可夫链预测榆林地区的年降水状态是可行的。
2)状态标准的划分有一定的随意性,对结果会产生一定影响,如何更科学的划分降水状态有待于进一步探讨。
3)马尔可夫链的预测结果是一个区间,如何结合其他理论或方法进一步预测出较为精确的具体数值,从而拓展预测结果的适用范围,值得进一步研究。
4)用马尔可夫链进行预测的基本假设是:年降水状态序列是齐次马尔可夫链,但实际上这很难严格满足:齐次马氏链的统计特性完全取决于初始分布和一步转移概率,但对于年降水状态序列却很难获得准确的转移概率,只能用由足够长的实际资料进行统计得出的转移频率代替转移概率;齐次马尔可夫链的n步转移概率矩阵等于一步转移概率矩阵的n次方,这对于由统计计算得出的各步转移矩阵显然是难以成立的。这些都会对预测精度产生影响,尽管引入了加权马氏链,但这不能从根本上消弭不足。因此该方法对于水文时间序列预测的适用程度有待进一步检验。
参考文献:
[1] 韩璞璞,张 生,李畅游,等.基于权马尔可夫链模型的庐江县降水量预测[J].水文,2012,32(3):38-42.
[2] 韩合忠,高淑会,国伟华.基于加权马尔可夫模型的济南市降水丰枯状况预测研究[J].水文,2012,32(5):72-75.
[3] 王鑫东.加权马尔科夫链模型在农业灌溉用水预测中的应用研究[J].中国农村水利水电,2016(5):58-64.
[4] 刘次华.随机过程[M].第5版.武汉:华中科技大学出版社,2014.
[5] 王宇博,梁秀娟,乔 雨,等.基于叠加马尔科夫链和BP神经网络模型的降水量预测研究[J].中国农村水利水电,2014(9):80-86.
[6] 王 涛,钱 会,李培月.加权马尔可夫链在银川地区降雨量预测中的应用[J].南水北调与水利科技,2010,8(1):78-81.