吴旭树 ,王兆礼,陈柯兵,钱姝妮,王 俊,陈晓宏
(1.华南理工大学土木与交通学院, 广东 广州 510640; 2.长江水利委员会水文局, 湖北 武汉 430010;3.武汉大学水资源与水电工程科学国家重点实验室, 湖北 武汉 430072;4.中山大学土木工程学院, 广东 珠海 519000)
长期降水预报对水库防洪兴利综合调度具有重要的理论价值和现实意义。但降水受众多因素的影响,不确定性很大,预报难度通常较大。在现有的预报产品和方法中,长期降水的预测效果仍然不尽人意,难以在生产实践中提供有效指导。因此,探索长期降水预报新方法、新技术仍然是一项艰巨且必要的任务。
自然界的降水过程牵涉到大气-海洋-陆面热动力学的交互耦合,不可避免地受大气环流和海洋表面温度场(sea surface temperature, SST)的影响[1],其中SST是影响地区降水的重要因素,甚至是第一强信号[2]。国内外学者通过建立大气环流因子和SST与降水的统计关系推测未来降水,取得了相对丰硕的研究成果。例如,赵俊虎等[3]利用前冬太平洋/北美型遥相关和欧亚型遥相关指数,构建中国东部夏季3类雨型预测概念模型,得到较为理想的拟合效果;Guo等[4]以前冬北太平洋SST波动、东亚海平面气压等为预报因子,建立滑动更新的统计预报模型,较有效地预测了长江中下游夏季降雨;Baker等[5]通过海平面气压指数构建逐步回归预测模型,提高了英国部分地区的季节性降雨预报精度。长期降水预报方法一般可分为动力数值模拟方法和数理统计方法两种(动力统计相结合方法亦建立在此两类方法基础上)。动力数值模型具有明确的物理机制,但模型结构复杂,计算量大,耗时长,且对实际中错综复杂的物理机制反映不足。相比于动力数值模型,数理统计模型虽然不具备物理机制,但模型结构简单,在缺乏动力机理认识的复杂气象要素和天气预报中得到广泛应用[6-8]。数理统计模型按预报因子个数又可分为单因子模型和多因子模型。单因子模型的主要原理是从众多影响因子中搜寻一个与降水最密切相关的因子建立预报模型,其优点是模型简单,可操作性强,缺点是仅考虑单个预报因子,模型输入信号过于单一,难免遗漏对降水预报有用的其他信号[9-10]。多因子模型考虑多个影响因子,但由于预报值是由各个因子的预报意见综合得到,难以捕捉极大值或极小值[11-13],且当不同因子之间意见冲突时模型预报结果往往偏差较大[14]。因此,如何权衡并综合利用单因子和多因子模型,取长补短,是实践中面临的一个重要问题。
本文以大气环流和SST为影响因素,提出时变海温多极(multiple time-varying sea-temperature,MTS)指数和因子预报意见指数(forecast opinion index,FOI),构建基于MTS指数的单因子回归预报模型和基于大气环流及MTS指数的多因子回归预报模型,通过FOI对单因子和多因子回归预报模型进行结合形成组合降水预报模型。以三峡水库流域为例预报汛期5—10月的月降水量,论证模型的适用性和优势,以期为三峡防洪和兴利综合调度提供参考。
研究表明,SST通常具有单极、偶极和多极特征,并且不同海温极子之间存在空间关联性[15-16]。SST的这些特征能有效指示降水变化,甚至比传统的厄尔尼诺(ENSO)等SST基本指标更具有指示意义。以海温偶极为例,海温偶极传统上定义为两处不同海域的海温差[15],Chen等[16]将海温偶极概念扩展为两处不同海域的海温叠加值或差值。本文一个海温极子表示与降水显著相关的、空间上连续的一簇海温格点,海温极子MSST定义[17]为
(1)
式中:Ki为第i个海温极子的SST;ψi为联合系数。联合系数ψi由海温极子与降水的相关性决定:显著正相关取1(不同海温极子叠加),显著负相关取-1(不同海温极子温差),其余情况联合系数为0[17],另外,为避免计算过于繁琐,当n≥15时,建议取n=12。
海温多极指数计算中的海温极子空间上一般不随时间变化而变化,换言之,海温多极并未考虑影响降水的海温极子的时变性。实际上,在气候变化的背景下,影响某一地区降水的海温场(极子)空间上存在迁移变化的可能[18]。为考虑这一因素,将海温多极分为关键海温多极和MTS两类,用滑动窗方法考查海温极子与降水的关系。给定显著性水平,若不同时间窗口下与降水显著相关的海温极子空间位置不变,则为关键海温多极,若空间位置发生变化则为MTS(图1)。由此可计算MTS指数:
MTS=αMSSTe+βMSSTf
(2)
其中
α+β=1
式中:MTS为MTS指数值;MSSTe、MSSTf分别为关键海温极子和时变海温极子;α、β为对应的海温多极贡献度,用于衡量关键海温极子和时变海温极子对MTS指数的贡献权重,其值可根据MSSTe和MSSTf(作为自变量)与MTS(作为因变量)的调整相关系数平方和Rα、Rβ进行初步估算,即α∶β=Rα∶Rβ。
图1 关键海温多极和MTS示意图Fig.1 Sketch map of key multipole SST and MTS
采用Gerrity Skill Score评分方法筛选与降水有明显相关关系的环流因子,该方法是国际气象组织推荐的一种预报效能评价方法,广泛应用于预报对象和预报因子相关关系的甄别问题[19-20]。评分值GSS的计算公式为
GSS=PS
(3)
式中:P为预报因子与预报对象的联合概率矩阵,其元素为预报因子和预报对象序列的联合分布及对序列量值的等级划分情况(偏低、正常、偏高3个等级);S为评价系数矩阵,其元素由下式计算[26]:
(4)
式中:J为事件等级数;pr为预报对象r的频率分布;Di为优势比,即比值比。GSS取值范围为[-1,1],其值越大,预报对象与预报因子之间的相关性越好;当数据长度为30时,GSS>0.25时预报对象与预报因子具有相关性[16]。
在多因子预报模型中,当不同因子之间意见出现冲突时,模型难以准确预测未来降水情况。另有研究指出,多因子预报模型应当注意个别因子的极端值对预报结果的影响[14]。因此,提出FOI用于反映不同预报因子的综合预报意见。设预报因子与预报对象成正(负)相关关系,对因子中观测值x,小于(大于)或等于该值的累积频率为Pcum,定义归档值Np为
(5)
由式(5)可知,Np为-1、0、1分别代表正(负)相关预报因子的低(高)值、中值和高(低)值部分。考虑到不同预报因子取值的差异问题,对数值随时间变化很小、不适宜按频率分布划分归档的预报因子,按数值从大到小(若与降水呈负相关关系则为从小到大)排序,排位前1/3的数值归档为1,后1/3的归档为-1,其余归档为0。通过归档值Np可以判断某一时间的数据相对历史观测序列而言是否偏高或偏低(档位1为偏高,-1为偏低)。将不同预报因子的归档值求代数和,即得到FOI值。FOI值越大,处于档位1的预报因子个数越多;反之,FOI值越小表示处于档位-1的多。故当FOI绝对值较大时,说明多数因子的档位值相同,也即预报意见较为一致。因此,该指数一定程度上可表征不同因子之间预报意见的一致性程度。
利用MTS指数构建单因子回归模型,即P-MTS模型:
P=asMTS+bs
(6)
式中:P为降水量:as、bs分别为回归模型斜率和截距。
再用MTS指数和筛选出的大气环流因子构建多因子回归模型:
(7)
式中:xi为大气环流因子;k为环流因子个数;am、bi分别为MTS指数和环流因子的回归系数;bm为回归模型常数项。
将P-MTS模型和多因子模型进行组合,其原则为:当因子之间预报意见较为一致时,采用式(7)的多因子模型,否则采用式(6)的P-MTS模型。对此,设定当FOI的绝对值大于或等于总的预报因子(包括MTS指数)个数的50%时,认为因子之间预报意见较为一致,得到组合预报模型及适用条件:
(8)
式中F为FOI值。由于模型构建包括率定和检验过程,而F的计算是建立在预报对象与预报因子相关性分析的基础上,故F主要在模型检验期应用。
选用相关系数R、平均绝对误差MAE和平均相对误差MRE评价模型预报精度,这3个指标在气象、水文等领域的模型精度评价上广泛应用[6, 16-17],效果较好。
以三峡水库流域为研究区,对1961—2020年汛期5—10月的月降水量进行预报。组合预报模型预见期为1~3月,采用滑动窗检验方法率定和校验,滑动窗长度取30 a。
三峡水库流域面积约为100万km2,流域内长江干流长度约4 500 km。流域除源头外,大部分地区属于亚热带季风气候区,干湿季分明,80%以上的年降水量集中在汛期5—10月,且汛期各月降水差异明显,对三峡水库有显著影响。发布准确的降水预报,对三峡水库调度具有重要的现实意义。
研究采用的降水数据为中国气象局发布的0.5°×0.5°逐日格点数据(http://www.cma.gov.cn/);SST数据为美国大气与海洋管理局发布的5°×5°逐月格点数据(https://www.esrl.noaa.gov/ psd/data/gridded/tables/temperature.html);大气环流数据为国家气候中心发布的逐月大气环流数据集,大气环流因子共88项(https://cmdp.ncc-cma.net/cn/download.htm),数据时间跨度均为1961—2020年。
表1为预见期1~3月情况下P-MTS模型采用的海温极子数、关键海温多极和MTS的权重范围。由表1可知,不同月份的海温极子数差别较大,说明对研究区降水和SST关系的影响随月份变化而变化。具体而言,5月和6月海温极子多数和降水呈正相关,7—10月则相反,但预见期1月情形下7月和 8月降水与海温极子主要为正相关。另外,预见期1月情形下5月降水预报、预见期3月情形下7月 和9月降水预报中模型采用的海温极子数较多。从权重来看,9月关键海温多极占主导,贡献较大,说明影响降水的海温场空间上具有相对稳定性,而5月和10月则相反,故影响降水的海温场位置并不固定。主汛期6—8月的关键海温多极和MTS贡献度差别不大,基本上对MTS指数的贡献各占50%。
表1 预见期1~3月情况下P-MTS模型参数和权重范围Table 1 P-MTS model parameters and weight range in forecast period of 1 to 3 months
表2 预见期1~3月情况下组合预报模型在率定期和检验期的预报精度Table 2 Prediction accuracy of combined forecasting model in calibration and validation periods in forecast period of 1 to 3 months
对于海温极子空间分布(限于篇幅未展示),影响5月降水的海温极子主要分布于赤道东太平洋(ENSO区)、澳大利亚西南海域;影响主汛期6—8月降水的极子分布在南太平洋、北大西洋、南海等海域;影响9月降水的极子主要在印度洋东部和ENSO区;影响10月降水的极子则主要分布于北太平洋、东印度洋、北太平洋等区域。Yuan等[21]发现印度洋偶极子与长江上游降水密切相关;周波涛[22]研究发现澳大利亚东侧冬季海温与我国长江流域夏季降水之间具有同位相变化关系;Wei等[23]指出前冬ENSO活动对次年春夏长江上游降水的影响与中下游降水影响相反。这些研究结果与本研究中识别的海温极子空间分布规律基本一致,说明模型采用的海温极子具有一定的物理意义。
表2为组合预报模型在率定期与检验期的预报精度。其中,组合预报模型采用的环流因子共30个,主要包括北半球极涡面积指数、北半球极涡强度指数、登录台风、大西洋副高面积指数等。率定期不同月份的预报降水与观测值的相关系数R基本在0.6~0.8之间,MAE在17 mm以下,MRE为5%~14%,说明模型拟合精度较高。检验期,不同预见期下6月、7月和9月精度较高,相关系数R基本在0.70以上,其中9月R超过了0.8,为所有月份中预报精度最高;8月和10月精度次之,R多数在0.6左右,预见期3月情形下R低于0.6,精度相对较低;5月预报精度较差,预见期1月情况下R可达0.6,但预见期2月和3月的R低于0.4。7月和8月MAE基本在18~22 mm之间,总体上7月预报精度高于8月,其余月份MAE在10 mm以下,其中10月MAE最小。结合MRE可知,6月和9月预报精度最高,大部分MRE在10%以下;8月MRE较其他月份高,但低于19%;尽管5月R不高,但不同预见期的MRE均在14%以下。此外,模型预报精度大体上随预见期延长而有所下降。图2为组合预报模型在检验期1991—2020年的预报结果,可知多数年份的预报结果与实际相符,模型总体上能反映月降水量的年际波动,在个别极端年份偏差较大,如1998年的8月、2012年7月和2015年7月。尽管如此,模型仍能较为准确地捕捉2020年主汛期6—8月的强降雨情况。综上,可认为模型能有效预报三峡水库流域汛期的月降水量。
(a) 5月
表3 各模型1991—2010年汛期月降水预报精度对比Table 3 Comparison of monthly precipitation forecast accuracy of different models in flooding seasons from 1991 to 2010
为进一步验证组合预报模型在长期降水预报中的可行性和优势,采用多元线性回归(MLR)[24]和随机森林(RF)[25]两种传统方法对三峡水库流域汛期5—10月的降水进行预报。预报因子同样分为海温和大气环流两大类。根据组合预报模型的构建原理,组合模型与传统模型的主要区别为海温信号的提取与利用,因此传统方法采用不同的海温因子和相同的大气环流因子。传统方法的海温因子采用Nino3.4指数、北大西洋海温三极子(NAT)、副热带南印度洋偶极子(SIOD)和北太平洋年代际涛动指数(PDO),数据时间跨度均为1961—2020年,来源于国家气候中心(http://cmdp.ncc-cma.net/)。MLR和RF模型的预报因子与预报对象滞时为1~3月,采用滑动窗检验方法率定和检验模型。此外,从美国国家环境预报中心(NCEP)CFSv2动力数值模型、欧洲中期天气预报中心(ECMWF)季节性预报系统System 4(SYS4)发布的1982—2010年历史降水回报产品中,挑选1991—2010年预见期1~3月的月降水预报结果加以对比。选取每种模型1991—2010年汛期月降水预报的最佳预报结果,比较MAE和MRE两个指标,结果见表3。可见,对于主汛期 6—8月的预报,组合预报模型相比MLR和RF模型的MAE降低6~10 mm,MRE减少约4%~8%;而相比于动力数值模型CFSv2和SYS4,MAE和MRE降低明显,其中6月CFSv2和SYS4模型的MAE为组合预报模型的5~6倍,MRE为5~7倍,说明组合预报模型在预报6月降水量方面表现更为优异。初汛期5月,组合预报模型精度与RF模型相当,相比MLR模型则有较大的提高,而MAE和MRE比CFSv2和SYS4模型分别降低约10 mm和17%,提高效果显著。对于后汛期9月和10月,5个模型中组合预报模型精度同样最高,其MAE和MRE分别在10 mm和10%以下;MLR和RF模型精度次之,两者MRE均在12%以上;CFSv2和SYS4模型表现较差,MAE在20 mm以上,MRE大于17%,误差约为组合预报模型的2倍。综上,组合预报模型总体上比其他模型精度高,在不同月份的降水预报上表现也较为稳健;相比于NCEP和ECMWF机构的动力数值模型CFSv2和SYS4,组合预报模型具有显著的优势。
a.组合预报模型是基于海温场的单因子降水预报模型和基于大气环流、海温场的多因子降水预报模型的结合,以FOI为判定条件,理论上可降低单纯采用单因子或多因子模型而导致预报精度下降的风险。
b.组合预报模型能有效预报三峡水库流域1961—2020年汛期的月降水量,其中6月和9月预报精度最高,主汛期7月和8月的预报效果不如其他月份,且模型精度随预见期延长而有所下降。
c.组合预报模型的月降水预报精度高于传统的MLR模型、RF模型以及NCEP的CFSv2动力数值模型和ECMWF的季节性预报系统SYS4,具有较好的应用价值和推广前景。