基于BP神经网络对黄河源区降水的降尺度模拟研究

2013-10-21 11:17石晓燕郑庆康
三峡大学学报(自然科学版) 2013年5期
关键词:源区降雨尺度

石晓燕 郑庆康 杨 涛

(1.河海大学 水文水资源与水利工程科学国家重点实验室,南京 210098;2.河海大学 岩土工程科学研究所,南京 210098)

目前较多使用气候模式(GCM)来评价气候变化对水文水资源的影响,但其分辨率较粗,因此通常需进行降尺度分析,统计降尺度法(SDSM)的精度不低于动力学法[1],且简便易行又具灵活性.国内外统计降尺度模型已经有诸多成果,研究表明温度的降尺度效果明显优于降雨[2-3],尤其是日降雨的降尺度效果较差,主要原因是降雨与各因子之间呈较复杂的非线性关系,目前还未实现机制上的完全理解.Fealy R等[4]指出影响不同季节气候的大气环流因子存在差异,与降雨相关度高的气候因子随季节而变化,但从季节或月尺度选择预报因子对降水的研究分析国内还尚无报道.还有一些研究发现[5]有些气候因子在不同的季节均与降雨有密切的关系,但在某一季节,某些特定的气候因子也是与降雨密切相关的.而在实际的降尺度应用中,多数未考虑这一点,大尺度气候因子选择的时间尺度很少为季节或月的.

BP神经网络是具有很强的处理非线性问题能力的处理系统,适合于解决复杂的非确定性推理问题[6-8].为了比较时期划分的合理性,设计全年式、两个时段(丰水期及枯水期)、四季来分别选择气候因子,采用BP神经网络的方法建立相应时段的大尺度因子与降水的统计关系,选择较优的降尺度模型,并应用于GCM以生成未来气候情景,以期为提高日降水降尺度能力奠定基础.

1 人工神经网络模型及BP算法

人工神经网络模型建立过程中,对于隐含层节点数的优选法,本文是通过多次试验选出的最优结果,这种不确定性和随机性还是会影响模型预测的精准性,有待提高.神经网络模型较多,本文采用目前应用最广泛计算较成熟的BP神经网络,其计算步骤总结为:

1)随机的给出输入层到隐层,隐层到输出层的权矩阵vij、wj并且自行设定总体收敛误差ε及训练方式;

2)根据样本训练网格,计算网格实际输出的结果与期望结果的误差,并运用前馈网格的误差逆传播学习算法,调整输入层到隐层和隐层到输出层的权系数;

3)当模型的收敛误差大于ε时,返回步骤2),否则训练结束,并根据权系数和阈值由公式(1)计算预报值.

式中,y(t)为模型输出t时刻的预报值;f为转移函数,本文取用Sigmoid函数:f(x)=(1+e-x)-1;wj为连接隐含层和输出层的权系数;xi(t)为模型输入t时刻第i个气候因子值;vij为连接层和隐层的权系数;n为气候因子的个数;m为隐层的维数;θj为隐层阈值;θ0为输出层阈值.

2 研究区域和数据

黄河源区指唐乃亥水文站以上的流域,本文的数据选用的是1961~2000年黄河源区11个气象站降雨量的日资料系列,全球气候模式(GCM)的模拟结果选用的是英国的Hadley中心的海气耦合模式在东亚地区适用性较好[9]的 HadCM3输出结果.NCEP全球再分析日资料(1961~2000年)和HadCM3模拟的现在和A2、B2情景下的大气数据(1961~2099年)均来自于加拿大气候影响和情景项目(CCIS),共提供了26种大尺度预报因子变量.其中NCEP再分析数据是由CCIS经过网格再划分(使其与HadCM3的分辨率相同)的转换而得到的.

3 基于BP神经网络对黄河源区降水的统计降尺度模拟

本文利用黄河源区实测的水文气象资料、NCEP再分析数据及HadCM3情景模式,分别用3种方法来进行降雨的降尺度研究.运用全年的降水资料来选择气象因子,记为S1;分两个时段来分别选择气候因子,即以6~10月为丰水期,11~5月为枯水期,记为S2;分4个季节来分别选择气候因子,即以3~5月为春季,6~8月为夏季,9~11月为秋季,12~2月为冬季,记为S4.

3.1 降水的评价指标

本文使用纳什效率系数(Ens)来衡量模型对量和趋势的捕捉能力,计算公式为

式中,Qoi为第i时实测值;Qpi为第i时使用统计降尺度方法得出的模拟值;Qavg为实测平均值;n为实测个数.一般认为Ens的值在0.6以上为可信的.

评价模型的系统偏差利用平均偏差(bias)计算,公式为

式中,n为总天数;Si为模拟值;Oi为观测值.

模型对指标变率的捕捉能力用标准偏差的比值(RS)来检验,公式为

式中,SSIM为模拟值的标准偏差;SOBS为观测值的标准偏差.

另外,率定期的解释方差(E)用来评估建立模型的优劣,该值越接近1则模型越优秀.降水的指标见表1.

表1 降水的统计指标表

3.2 模型选用因子的方法及分析

BP模型的因子选择采用的是偏相关系数法,能排除其他因子的线性影响后两个因子间的相关关系.变量i与变量j都受到第3个因子变量k线性相关影响,则两者间的偏相关系数为

式中,Rij为变量i与变量j的相关系数.在偏相关方法中,pvalue值用以消除任何的预测因子.pvalue值是通过变换相关系数R为具有n-2自由度得t统计量,式中的n为观测长度:

式中,t统计量显示了在一定的置信度下,该种相关关系出现错误的概率.基于24个NCEP网络的624个待选因子,计算不同因子与预报量的偏相关系数,以所有因子的偏相关系数均大于0.1为标准[10],逐步缩减所选预报因子的维数,最终选出最优统计降尺度模式所需的预报因子.

当降水作为预报量时,降水的观测时间是第1天8:00到第2天8:00,而其他气象因子是第1天0:00到第2天0:00,又由于某些因子迟滞一天后与降水量的相关程度更高一些,因此考虑因子迟滞一天来选择预报因子.最终所选的预测因子见表2,在选择预报因子过程中,与降水相关度最高的为最敏感因子,因此对全年降水来讲,比湿是最敏感的预报因子;对于分两段的情况,旱季、涝季最敏感预报因子分别是温度和500百帕位势高度的湿度;对于分四季的情况,春、夏、秋、冬季的最敏感因子分别为比湿、水平向的风速、比湿和地面涡度.

表2 不同分段方法选定的降雨预报因子

3.3 模型评价

采用Ens、偏差bias和RS来评价所建立统计降尺度方法的优劣.从表3可看出不同模型均低估了多数降雨指标(除pxcdd及pwet)的变率;从效率系数来看,除pxcdd指标外,均是S1模型的模拟效果最佳;模型对极值降雨指标均存在系统偏低,但对湿日发生天数的模拟略偏高.模型对极值降雨的捕捉能力还有待提高.

表3 3种模型率定期和验证期不同降雨统计指标

3.4 模型模拟的降水指标比较

黄河源区psum3种分段方法模型在验证期均模拟出了降雨总量的变化趋势,如图1所示,但在夏季7、8月中的误差均较大,相较之S4模型的模拟效果最佳,夏季7、8月中比湿、水平向风速对降水影响较大.对pmax,其模拟值均低于观测值,说明模型对降雨极值指标不能准确把握,基本偏低,但是大致趋势一致.相比较3种方法,7~9月S1方法模拟的效果较好,而12~4月S4方法模拟的效果较好.对px5d,3种分段方法模型在验证期的模拟效果均较好,但均在6~8月系统低估,只是秋季几个月中的误差较大.3种模型均可模拟出在黄河源区pxcdd的年内变化趋势,但低值低估高值高估的系统误差在验证期表现的尤其明显.另外,S4模型在3~10月的系统偏低最明显.夏秋季降水主要受局地的对流控制,而地形是引起区域对流的主要因素,夏秋季降水机理较复杂,BP神经网络模型不能准确捕捉其规律.3种不同数据选择因子的模型对pwet的模拟值高于观测值,但其大致的变化趋势一致.其中,S4方法的偏高程度最大.由上可见,3种分段方式,对黄河源区来说,四季分段方式可能存在一些不确定性,对降尺度模型精度产生影响,应多方位考虑.

图1 验证期(1991~2000年)3种分段方法模型模拟的降水指标比较

4 黄河源区未来的降雨变化预测

对极值指标的模拟,其性能是随着方法变化的,即没有一种方法对所有的极值指标均有较好的模拟效果.但从平均态来看,S1方法的性能优于其他方法,所以本文采用S1方法对未来90a的降雨进行预测.

图2显示的是未来90a在A2和B2情景下年平均降雨的变化比较,可见未来降水有增有减,A2情景明显低于B2情景下的年总降水量.

图2 在A2和B2情景下于2010~2099年的年平均降雨的变化情况比较

由图2可见,未来2080s(即2070~2099年)的年平均降水量的增量明显有所增加,但2080s年代后期又有所回落.具体来看,未来3个时段的多年平均降水相对于基准期的变化如表4所示,在A2情景下,2020s、2050s、2080s的平均降雨相对于基准期的变化值为-0.13mm、-0.12mm、-0.08mm.而B2情景下,2020s、2050s、2080s的平均降雨相对于基准期的变化值为0.05mm、0.06mm、0.07mm.另外,2050s及2080s时A2情景的增幅不及B2情景.

表4 在A2和B2情景下模拟未来平均降雨变化情况

图3分别列出了未来不同降雨指标的季节变化.pmax图表明春季的降雨增加显著,尤其是2050s的A2情景,增幅达160%,而其余3季的变幅是随情景及时段而变化的.px5d在2050s及2080s的四节均呈现了增加趋势,尤其在春天较显著.与湿天发生概率(pwet图)的变化相对应,pxcdd将在春季显著减小.降雨总量(psum图)在春季增加显著,而其他季节降雨总量在2020s呈减小趋势,而2080s呈增加趋势,2050s的降雨总量会随着季节和情景而变化.

图3 A2和B2情景下未来时段(2010~2099年)降雨的预测

这些极值变化会直接或间接地对水文过程、生态环境产生影响,如源区断流一般发生在枯水期(冬春季节),春季极值事件的增强可能会引起地表径流的及早发生及强度增大,这对避免源区断流有一定的贡献作用.

5 结 论

本文基于BP神经网络统计降尺度法,通过样本因子的选取,反复的网络训练和检验得到了较为合理的降尺度模型,并分析预测了黄河源区未来气候的变化情况,得到如下结论:

1)对于降雨模拟,3种方法模拟效果的优劣是随着研究的时间尺度而变化的,从年尺度来看,S1方法的模拟效果最好;从季节尺度来看,3种方法对多数降雨指标的变化趋势能成功捕捉,但对量的模拟效果是随着指标及季节而变化的,如S1方法对夏秋的pwet的模拟效果最佳,S4方法对冬春季节的最大5日降雨量有较好地模拟效果;但3种方法对极端指标(如:降雨极大值、最大持续干旱日数)的模拟效果均较差,也暗示了模型对降水异常及降雨状态的持续性的模拟能力有局限性.因此,3种方法各有优劣,均不能较好的模拟所有的降雨指标.

2)未来90a中,最大5日降雨、最大季节降雨及季节总降雨在春季均显著增加,pxcdd在春季显著减少,而其他季节的这些极值指标是随着季节及情景的变化而变化的.而春季极值事件的增强可能会引起地表径流的及早发生及强度增大,这对避免源区断流有一定的贡献作用.

[1] 秦大河,陈振林,罗 勇,等.气候变化科学的最新认知[J].气候变化研究进展,2007,3(2):63-73.

[2] 赵芳芳,徐宗学.统计降尺度方法和Delta方法建立黄河源区气象情景的比较分析[J].气象学报,2007,65(4):653-662.

[3] 王晓燕,杨 涛,郝振纯.基于统计降尺度的黄河源区气象极值预测[J].水电能源科学,2011,29(4):1-4,34.

[4] Fealy R,Sweeney J.Statistical Downscaling of Precipitation for Selection of Sites in Ireland Employing a Generalised Linear Modelling Approach[J].International Journal of Climatology.2007,27(15):2083-2094.

[5] 郝振纯,时芳欣,王加虎.统计降尺度法在黄河源区未来降水变化分析中的应用[J].水电能源科学,2011,29(3):1-4.

[6] 施 彦,韩立群,廉小勤.神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009.

[7] 胡江林,张礼平,宇如聪.神经网络模型预报湖北汛期降水量的应用研究[J].气象学报,2001,59(6):776-783.

[8] 崔永华,左其亭.基于人工神经网络的多直流河流汇流计算研究——以塔里木河流域为例[J].干旱区研究,2006,23(2):1001-4675.

[9] Kiktev D,Sexton D M H,Alexander L,et al.Parison of Modeled and Observed Trends in Indices of Daily Climate Extremes[J].Journal of Climate,2003,16(22):3560-3571.

[10]Olsson,Uvo C B,Jinno K,Statistical Atmospheric Downscaling of Short-term Extreme Rainfall by Neural Networks[J].Physics and Chemistry of the Earth,Part B:Hydrology,Oceans and Atmosphere,2001,26(9):695-700.

[11]徐 影,丁一汇,赵宗慈.近30年来人类活动对东亚地区气候变化影响的检测与评估[J]..应用气象学报,2002,13(5):513-525.

猜你喜欢
源区降雨尺度
受焦化影响的下风向城区臭氧污染特征及潜在源区分析
安徽沿江地区早白垩世侵入岩成因及其找矿意义
冬小麦蒸散源区代表性分析
财产的五大尺度和五重应对
龙王降雨
兴安落叶松林通量观测足迹与源区分布
泥石流
宇宙的尺度
9
江垭水库降雨径流相关图的建立