林广洪,朱碧莹,陈 杰,邱元霖,刘建华,陈 华
(1. 天生桥一级水电开发有限责任公司水力发电厂,贵州 兴义 562400;2. 水资源工程与调度全国重点实验室(武汉大学),湖北 武汉 430072)
短期气候预测(曾命名为长期天气预报)主要是指预见期超过一个月、但不超过一年的气候预测[1]。传统的气候预测方法主要是结合影响降水和气温的各种气象和地理因素,根据往年数据以及过往经验使用统计方法或者主观预估月尺度降水和气温。20 世纪80 年代短期气候预测随着一些大陆尺度的中长期水文气象预报系统的出现而迅速发展,如中国气象局国家气象中心逐步建立了全球中期天气预报模式[2-5],并于2001 年自主研发了我国新一代全球与区域一体化数值天气预报系统[6]。在国外被广泛应用的有美国国家环境中心发布的基于大气、海洋和陆地同化资料的海气耦合模式CFSv1 和其二代系统CFSv2[7],日本气象局(Japan Meteorological Agency,JMA)的日本全球模式大气环流模式TL159、亚洲区域模式,欧洲中期预报中心(European Center for Medium-Range Weather Forecasts,ECMWF)发布的基于海温异常强迫的月尺度气候预测系统T159L40等[8-10]。
气候模式是目前短期气候预测的常用方法,即利用气候模式模拟气象物理演变过程,进而预测气象变量。近年来,用于短期气候预测的气候模式主要利用基于海洋、陆地和大气数据的全球气候模式,例如美国国家基金会启动的北美多模式集合(North American Multi-Model Ensemble, NMME)中包含的模式CFSv2,CanCM3,CanCM4 和GFDL 等[11-13]。国内外研究人员使用气候模式在多个区域评估了气候模式预测性能并比较了不同模式的表现优劣。如: Slater 等人[14]比较了CCSM3,CCSM4,CanCM3,CanCM4,GFDL,GEOS5和CFSv2模式在美国地区的气候预测能力。可以发现,尽管单个模式能够很好地预测特定事件(例如,CFSv2 预测1988 年的干旱事件和CanCM3 预测2012年的干旱事件),但没有一个模式能够始终优于其他模式,均随着空间和时间的改变有不同的表现。Ma等[15]将11个NMME模式应用于中国多个流域评估其降水预测能力。研究发现预测能力有明显季节和地区差异,秋季和春季预测效果明显优于夏季。除东南季风地区以外的大多数地区都具有较高的预测能力,在所有NMME模式中CFSv2模式表现出最好的预测性能。
尽管气候模式较为准确的预测大规模的月降水和气温,但其存在着分辨率过低和系统偏差大等问题,在局地预测性能较差,尤其是对降水的预测[16]。因此,在应用气候模式对其输出结果进行偏差校正显得尤为重要。常用的偏差校正方法包括基于均值的校正方法和基于分布的分位数映射法。这两类方法主要的区别是前者只校正均值,而后者同时校正预测变量的概率分布。以往研究表明,线性缩放方法和基于伽玛分布的分位数映射方法在校正夏季总降水量方面有较好的表现[17],而非参数分位数映射法在校正月降水和气温方面表现较好[18]。
短期气候预测由于时间跨度长和随机性强等特点,导致预测难度增大,尤其是降水,且随着预见期延长不确定性逐渐增大,预测精度下降明显[19,20]。目前所使用的气候模式降水预测虽然有最长11 个月的预见期,但其预测的精度有限,局地预测效果较差,需要对其进行一定的后处理,而目前在中国区域尚未进行系统的研究。因此,本文的主要目标为:①评价9种气候模式在中国大陆区域实施月降水预测的时空表现;②采用聚类分析方法,对夏季月降水预测能力随预见期的变化规律进行分析,明确气候模式预测能力的变化规律;③采用两种偏差校正方法对9 种气候模式进行偏差校正,比较不同方法对校正降水预测结果的表现。
以中国大陆为研究区域,采用的数据包括全国逐月实测降水栅格数据和9种气候模式发布的月预测追算降水数据。逐月实测降水栅格数据(1981-2014 年)来源于中国地面降水0.5°×0.5°格点数据集(V2.0),由中国气象数据网(http://data.cma.cn/)提供。该数据已经多次被学者证实其可靠性,如赵煜飞等[21]分析了不同空间,不同季节栅格数据与站点数据的差距,表明栅格数据准确描述了降水的分布特征。
共选取了6个气象预报发布机构发布的用于全球气象预报的9 个气候模式(表1),所有模式的分辨率为1°×1°,除SEAS5模式外其他模式均属于北美多模式集合预测实验。由于9个气候模式栅格经纬度与实测栅格数据存在差异,所以采用双线性插值法将追算数据与实测数据的栅格统一。每个模式均由多个集合成员组成,为了消除集合成员的随机误差,将所有成员进行集合平均,即将所有成员预报结果的平均值作为该模式的预报结果。预见期代表气候模式的预测能力,预见期为0 个月代表由本月初发起本月预测,预见期为1 个月代表由本月初发起对下个月的预测。
表1 9种气候模式的主要信息Tab.1 Information of the nine global climate models
本研究首先采用相关系数(R)、平均绝对相对误差(MAPE)和平均方差技巧评分(MSSS)作为评估指标,评价各气候模式在不同预见期对全国降水的总体预测能力,之后采用聚类分析的方法探究各气候模式预测能力随预见期的变化特征,最后采用两种偏差校正方法对各气候模式的预测降水数据进行偏差校正,并评估各偏差校正方法的效果。
1.2.1 聚类分析
聚类分析(Clustering Analysis,CA),是一个将一组对象按照某特征进行分类的统计分析方法,在水文气象领域中常被用来识别具有相似特征的子区域[22-25]。在进行聚类分析之前需要确定需要聚类的变量。选取中国逐个网格单元预见期为1-6月的预测数据与实测的夏季降水数据的斯皮尔曼等级相关系数作为聚类变量。斯皮尔曼等级相关系数采用的是降水等级数据(降水数据由大到小排列,依次确定等级),其值越接近于1代表预测数据的精度越高:
在评估不同预见期气候模式预测能力时,使用层次等级聚类方法对不同网格单元预测与实测的斯皮尔曼等级相关向量进行分组[26]。首先,将每个向量视为一个独立的簇,然后计算不同对象之间的距离,而后将簇合并为小集群,小集群合并为大集群,最后创建集群的层次结构[27,28]。本文计算不同格点i和j距离时采用欧几里得距离法,其计算公式如下:
式中:i和j代表不同的格点;m代表月份;rm,i和rm,j分别为i格点和j在m月预见期的斯皮尔曼等级相关系数。
在创建集群的层次结构后,使用经典的Silhouette分数[29]评估最佳聚类方式,计算公式如下:
式中:a(i)为向量簇中i向量到向量簇中其他向量的平均距离;b(i)表示i向量到非i所属向量簇的最短平均距离。单个向量的Silhouette得分平均值代表了不同簇数量的聚类方案的效果,即平均Silhouette得分越高,聚类方法效果越好[26]。在本文中,聚类方案所选簇的数量从2逐渐增加到10。
1.2.2 偏差校正方法
选取线性缩放方法(Lineer Scaling method, LS)和分位数映射法(Quantile Mapping method, QM),对气候模式预测的降水进行后处理,选择1981-2007 年作为率定期,2008-2014 年作为验证期。
(1)线性缩放方法。线性缩放方法是在假设预测数据和观测数据的月偏差在率定期和验证期具有一致性的前提下,将气候模式回算的各预见期降水均值和观测均值之间的比例作为校正因子,用于校正气候模式在各预见期降水预测结果[30-32],即LS方法首先计算各月份的校正因子,再将该因子应用于同一月份的预测数据。其公式如下:
(2)分位数映射法(QM)。分位数映射法是根据观测值的累积概率分布去校正预测值的累积概率分布[33-35]。本文采用的是基于经验分布的分位数映射法,即计算历史期各追算月降水预测数据相对于观测数据在经验分布(以百分位数代表)上的偏差,公式如下:
1.2.3 评价指标
本文使用相关系数(R)、平均绝对相对误差(MAPE)和平均方差技巧评分(MSSS)指标评估降水预测能力,计算公式如下:
(1)相关系数(R)。
(2)平均绝对相对误差(MAPE)。
(3)平均方差技巧评分(MSSS)。
式中:j为某一预测格点;g为全国范围内总格点数;i为时间序列;n为时间序列长度;fij为这一格点的降水预测值;xij为格点实测值;MSE为格点预测值的均方误差;MSEcj为气候预测的均方误差;θj为某一格点的纬度(单位为弧度)。需要注意的是,在计算单个格点的MSSS评分需要使用公式(11),全国范围MSSS评分时采用公式(12)。
图1 展示了采用R、MARE和MSSS三个指标评价0~11 个月预见期下全国栅格尺度预测降水的效果。图中不同颜色折线代表未进行后处理的九个气候模式的原始预测结果。各指标评估结果均显示SEAS5模式在0~5个月预见期下的降水预测表现最优。采用MARE和MSSS指标评估时,CCSM4 模式表现最差,但采用R指标时GFDL 模式表现最差,CCSM4 模式表现适中。原因可能是CCSM4模式与实测数据相关性较好,但整体偏差较大。另外,SEAS5、GEMNEMO 和CanSips 三个模式的表现明显优于其他模式。除CCSM4、GFDL 和CanCM3 模式在预见期0~1 个月时表现明显差于其他预见期外,单个模式在不同预见期下表现相对稳定。原因可能是全国各栅格点指标平均带来的坦化,需要结合不同预见期和空间分布作进一步分析。
图1 全国0~11月预见期下9个气候模式(CFSv2, SEAS5, CanSips, GEMNEMO, CCSM4, GFDL, CanCM3, CanCM4, GEOSS2S)中格点预测降水的相关系数(R)、平均绝对相对误差(MARE)和平均方差技巧评分(MSSS)平均Fig.1 The national average of the grid-scale R, MARE, and MSSS of nine climate model for predicted precipitation in 0~11 month forecasting periods
图2 展示了9 个模式1 个月预见期降水预测的MAPE值的空间分布。结果表明SEAS5 相比其他模式在中国西南部和东北部的降水预测中有明显的优势。CanSips 和GEMNEMO 相比其他模式在中国南部地区表现更优。CCSM4,GFDL,CanCM3和CanCM4在西北内陆河流域和黄河流域表现明显较差,MARE大于100%,部分原因是由于该区域月降水量较小,即使降水量的绝对偏差较大,也可以产生较大的相对偏差。
图2 9个气候模式预见期1个月时预测降水MAPE的空间分布Fig.2 The MAPE spatial distribution of predicted precipitation in one month forecasting period of nine climate models
图3 使用MAPE指标针对不同月份和不同预见期(0~11 个月)分析了模式预测降水的能力,结果显示SEAS5 模式在所有月份和所有预见期的表现均为最优,部分模式(CFSv2,CCSM4,GFDL)在不同月份有不同表现。具体来说,CFSv2 模式在9-12月的预测能力仅次于SEAS5,但在其他月份表现差于半数模式。CCSM4 和GFDL 模式仅在夏季(6-8 月)的表现与其他模式相近,其他季节尤其是冬季(12-次年2 月)和春季(3-5 月)MAPE明显高于其他模式。此外,除了CCSM4 和GFDL 模式在冬季的预测能力随预见期增加而明显减少,预见期超过5 个月后预测能力变化不大,其他模式在不同月份和不同预见期表现基本没有差异。
图3 9个气候模式在0~11个月预见期下的预测降水在不同月份的MAPE集合平均Fig.3 The ensemble averaged MAPE of nine model predicted precipitations in different months in 0~11 month forecasting periods
以上研究表明SEAS5 模式对降水的预测能力最优,为了进一步分析固定的预测发起时间下,气候模式在不同预见期预测中国降水的能力,以SEAS5模式预测的夏季降水为例,图4展示了预见期0~5 个月下1981-2014 年夏季降水与实际观测降水的斯皮尔曼等级相关系数(r)。这里的实际观测夏季降水指的是6-8 月的降水量之和,降水发生时间默认为7 月。图中,每个网格单元的颜色表示相关值,红色代表正相关,蓝色代表负相关。红色越深证明相关性越好,而蓝色越深则证明相关性越差。图4 中显示在预见期0 个月(月初发起预测)时预测降水与实际降水的相关性最高。在0~5 个月预见期下,SEAS5 模式预测降水与观测降水的相关性具有明显的空间差异,如预见期为1 和2个月时在北方地区预测降水与观测降水绝大多数栅格呈现负相关,但预见期为5 个月时呈正相关格点数明显多于负相关格点数。总而言之,随着预见期延长,降水预测能力的变化具有明显的区域差异。
图4 SEAS5气候模式在不同预见期条件下预测降水与夏季观测降水的斯皮尔曼等级相关性(r)Fig.4 The r between SEAS5 predicted and observed summer precipitation in different forecasting periods
由于每个栅格的r随预见期变化较大,预测能力波动且未呈现明显的变化规律。同时2.1 节仅研究了不同预见期气候模式预测表现在栅格尺度上平均后的结果,没有结合不同预见期,不同经纬度对气候模式预测能力进行综合评价。因此该部分使用了层次聚类分析方法作进一步分析。首先将已计算得到的1981-2014 年夏季降水的r按照对应预见期由短至长的先后顺序组成一个向量,并将不同格点的向量合并为不同类作为聚类分析对象。Silhouette分数用于选择最优聚类数方案,Silhouette分数越高代表不同类别的差距越大,分类效果越好。图5 展示了9 个气候模式对应不同聚类数方案的Silhouette分数,所有模式在聚类数为2时聚类表现最优,随着聚类数量的增大聚类表现逐渐变差,部分气候模式的聚类表现在聚类数大于6时有小幅度提升(如CCSM4)。
图5 9个气候模式在不同聚类数条件下的Silhouette分数Fig.5 The silhouette scores of different number of clusters for nine climate models
因此基于Silhouette分数,将r随预见期的变化趋势分为两类最佳,分别命名为集群a和集群b,每个集群均为r随预见期的变化趋势最为相似的格点的集合。以SEAS5 模式为例,图6展示了属于集群a和集群b的各栅格的r随预见期的变化情况,红色线代表所有该集群内所有栅格r的集合平均值。可以看出,在集群a中不同预见期的r均大于0,且随预见期的延长,r整体呈现先快速减少至0.1 左右而后在0.1 上下小幅度波动的趋势。而在集群b中,当预见期由0个月延长至1个月时,r明显下降至0,而在预见期大于等于1 个月时,r在0 上下小幅度波动。该结果表明,集群a的表现明显优于集群b,且后者在预见期超过1 个月时几乎没有预测能力,也没有改善趋势。预见期为0个月时预测能力明显优于其他预见期。也再次证明聚类分析有效地过滤了噪声并展示了降水的等级相关性随预见期的变化趋势。
图6 SEAS5模式在聚类数为2时集群a和b所有格点在不同月份的斯皮尔曼等级相关系数(r)表现Fig.6 The grid-scale r of SEAS5 predicted and observed precipitation of cluster a and b (two clusters) in different forecasting periods
图7展示了9个气候模式各栅格r所属集群的空间分布,蓝色栅格代表集群a,红色栅格代表集群b。结果表明,不同模式集群a和b的栅格分布不同,其中集群a栅格数量占比最高的模式是SEAS5,即综合不同预见期结果预测能力表现最好的模式。这个结论与3.1节的结论一致,集群a的栅格主要分布在西北、青藏高原部分地区以及中国的中部地区(长江、黄河和淮河的部分区域)。表现最差的模式是CanCM3 模式,其集群a的栅格零散地分布于西北和南方部分地区。其余模式与最优模式之间集群a的栅格占比相差不超过25%。
图7 9个气候模式栅格的斯皮尔曼等级相关系数(r)所属集群的空间分布(蓝色为集群a,红色为集群b)Fig.7 The spatial distribution of the clusters calculated by r of nine climate models. The blue shade indicates the cluster a,and the red shade indicates the cluster b
采用R、MAPE和MSSS三个评价指标在验证期评估了两种偏差校正方法(LS 和QM)对降水预测的校正效果,结果如图8所示。总体而言,两种偏差校正方法表现相近,对验证期数据的MAPE和MSSS指标的校正效果较明显,但对R校正效果不明显。经两种方法校正后的气候模式在不同预见期的表现相近,评价指标相差较小;模式预测的最大MAPE由140%减少至46%,最小MSSS由-3 提升至0.5。两种方法对GEMNEMO 的校正效果差异最大,从R和MAPE指标来看,LS方法的校正效果略优于QM 方法,就MSSS指标而言,在预见期5~6个月时QM 的校正效果略优于LS。
图8 9个气候模式两种偏差校正方法降水偏差校正前后验证期的相关系数(R)、平均绝对相对误差(MAPE)和平均方差技巧评分(MSSS)Fig.8 The R, MAPE and MSSS before and after the two bias corrections in validation period of nine climate model for predicted precipitation
图9和图10使用MAPE指标分别评估了验证期LS和QM方法校正1 个月预见期全国降水预测的能力。具体来说,LS 和QM 方法对青藏高原部分地区和长江流域上游降水预测有最明显的提升效果,最大MAPE由原来的100%将至40%以下。两种校正方法效果的差异主要体现在西北地区,对于GEMNEMO模式而言,QM校正后的MAPE大于60%的栅格数更多,但LS校正后的MAPE大于80%的栅格数更多。经校正后不同模式MAPE的分布相似,呈现西南地区和长江流域上游表现较好,MAPE在20%~40%范围内,西北和东部部分地区表现较差,MAPE在50%~70%范围内,少部分区域的MAPE在80%~90%范围。两种偏差校正方法校正后均呈现SEAS5 模式表现最好,GEOSS2S模式表现最差。
图9 LS校正的预见期为1个月的预测降水的验证期平均绝对相对误差(MAPE)的空间分布图Fig.9 The MAPE spatial distribution after the LS bias correction in validation period of nine climate model for predicted precipitation in 1 month forecasting period
图10 QM校正的预见期为1个月预测降水的验证期平均绝对相对误差(MAPE)的空间分布图Fig.10 The MAPE spatial distribution after the QM bias correction in validation period of nine climate model for predicted precipitation in 1 month forecasting period
使用R, MAPE和MSSS三个指标评价了9 个气候模式预见期为0~11个月对中国大陆地区降水的预测能力,分析了不同预见期下降水预测能力的变化规律,并采用LS 和QM 偏差校正方法对预测结果进行后处理,比较了不同方法的校正效果,得到了如下主要结论。
(1)在预见期0~5个月时,SEAS5模式对降水的预测表现最好,在预见期6~11 个月时,GEMNEMO 模式的预测表现最好。SEAS5 模式针对中国西南部和东北部地区的降水预测有明显优势,GEMNEMO模式在中国南部地区表现最优。
(2)不同模式预测夏季降水的能力随预见期和预测区域的不同而变化,将所有模式栅格在不同预见期预测能力进行聚类,在分类数为2 时聚类效果最好。综合多个经纬度和多个预见期的表现,SEAS5 模式的表现最好,其中超过50%的栅格预测夏季降水的能力强;并整体呈现随预见期延长,预测能力先下降后趋于稳定不变的趋势。所有模式中CanCM3 模式表现最差。
(3)LS 和QM 校正方法对所有气候模式的降水预测均有明显的提升效果。就不同校正方法而言,除对GEMNEMO 模式的校正外,两种方法校正效果相似,但对于GEMNEMO 模式,LS校正方法对西北地区降水预测的提升效果更好。总体而言,经校正后降水预测表现最优的仍为SEAS5模式。