邹晨曦 杨昭明 张培群
(1 北京思湃德信息技术有限公司,北京 100086;2 青海省气候中心,西宁 810001)3 国家气候中心,北京 100081)
青海省位于我国西北内陆,属高原大陆性气候。其西部地区海拔较高,呈梯型下降,向东倾斜;东部地区为青藏高原向黄土高原过渡地带,地形复杂,地貌多样。降水主要集中在夏季,约占全年的60%以上,夏季旱涝直接影响着青海省的农业与经济。同时作为长江、黄河、澜沧江的发源地,青海省夏季降水异常还会影响草地、湖泊等环境系统。因此,做好青海省夏季降水预报,对防灾减灾、维护经济发展和生态屏障都有着重要的意义[1-3]。
目前,全球气候预测模式对我国西部地区气候,尤其是降水预测的能力远远不能满足防灾减灾工作的实际需求,且其预测性能在短时间内也很难实现快速提升,因此,需要通过其他方法对全球气候模式的预测产品进行释用[4]。比较高效可行的方法有动力降尺度法和统计降尺度法[5]。
动力降尺度法是将全球气候模式与高分辨率区域气候模式进行嵌套,利用区域模式更高的分辨率和更细致的物理过程参数化方案来改进区域气候、尤其是复杂下垫面区域气候的模拟性能[6-7]。统计降尺度法则是利用全球模式预测的、具有较高可预报性的大尺度环流信息与局地气候要素之间的统计关系,建立预测因子与预测量之间的统计预测模型,开展气候预测。相比之下,统计降尺度法比动力降尺度法所需的计算量更小,耗时更少,更易满足目前短期气候预测的日常业务需要[8-11]。
统计降尺度法已经在短期气候预测中得到较多应用,并取得了较好的预测效果[12]。Feddersen, et al[13]指出,利用多模式集合的统计降尺度预测方法对欧洲、美国等地区的气温和降水预测都明显优于全球模式的直接预测结果。对于我国的短期气候预测,统计降尺度方法也得到了广泛应用。如,陈丽娟等[14]利用BCC_CSM1.1m模式预测技巧较高且对黄淮地区夏季降水影响有物理含义的环流异常作为预测因子,提高了该模式对黄淮地区夏季降水的预测技巧。苏海晶等[15]利用两种统计方法对国家气候中心全球海气耦合模式输出的夏季气温进行了误差订正,可以有效提高模式的预测效果。GUO,et al[16]利用优选的西南印度洋区域海平面气压和中国东部的850 hPa经向风为预测因子,并将建立的预测模型直接应用于CFSv2预测结果,发现该方法对CFSv2提前1个月的降水预测结果改进最大。ZHU, et al[17]、刘颖等[18]、秦正坤等[19]将经验正交(Empirical Orthogonal Function,EOF)和奇异值分解(Singular Value Decomposition, SVD)方法相结合,对全球气候模式预报产品进行统计降尺度,结果都比模式直接预测能力有着明显提升。
气候变量的年际增量预测技术是近十余年发展起来的一种新的技术方法[20-21],该方法将气候量的年际增量作为一个新的预测对象来替代原来的气候距平值[8],将传统的基于气候距平的预测关系,转化为建立以年际增量为预测因子和预测对象的预测关系,在得到预测对象的年际增量的预测之后,再通过叠加前1 a预测对象的实际距平值来得到当年的预测对象气候距平的预测值。这样能够有效地利用前1 a的观测信息和气候变量的准2~3 a变化的规律,更好地突出和捕捉气候变量年际变化,消除年代际变化的不确定性影响。近年来在降水季节预测中得到研究应用,并且最近研究表明,该方法在东亚夏季风[22]、冬季北大西洋涛动[23-24]和我国夏季降水季节预测[25-27]应用中,取得了较好效果。
在实际建立年际增量预测模型时,如果预测对象是大尺度环流变量或由其导出的指数指标(如东亚夏季风指数、NAO指数等[22-23]),由于气候模式对大尺度环流的预测能力相对较高,因而可以直接将气候模式的环流预测结果得出的年际增量作为预测因子之一,经过必要的统计订正引入预测模型,同时引入其他大气环流或海洋/陆面/冰雪等慢变的影响因子(同样为年际增量)作为预测因子。如果预测对象为降水等模式直接预测能力较弱的要素[20-21,25-27],则不能直接引入模式对要素的预测作为预测因子,而是需要采用降尺度技术,将大尺度的大气环流或海洋/陆面/冰雪等慢变量场(同样为年际增量)中获取预测因子,建立预测模型。
确定预测因子既可以选取与预测对象同期因子,也可选取预测对象前期因子。同期因子由气候模式预测得出,而前期因子可由实况资料得到,这种同时考虑不同时期预测因子信息的模型被称为组合统计降尺度预测模型(HSDP)[28]。本文利用美国国家环境预报中心(National Centers for Environmental Prediction, NCEP)的第二代气候预测系统(Climate Forecast System, CFSv2)模式的预测和历史回报资料,讨论建立适用于青海区域的基于年际增量预测技术的组合降尺度预测模型。
(1)采用全球气候实况数据为欧洲中期天气预测中心 ECMWF发布的第三代再分析资料ERA-Interim再分析资料[29],包括500 hPa高度场、200 hPa风场、海平面气压场和海表面温度场。该资料提供每天4次的同化分析数据,时间段为1979—2019年,水平分辨率接近79 km(0.7°×0.7°),垂直方向为60层。
(2)降水资料采用青海省50个气象观测站1982—2018年的降水资料[30],位置如图1所示。
图1 1982—2018年青海省夏季平均降水及50个观测站点所处位置
(3)使用的NCEP CFSv2模式从2011年3月投入业务运行,可滚动制作全球次季节至季节的多时间尺度气候预测[31],且提供1982—2010年的回报试验结果。本文使用CFSv2版本的月平均资料,模式水平分辨率为1°,起始时间为1982年,资料更新至今。各月每隔5 d分别从00、06、12和18时(世界时,下同)开始积分,积分时间为9个月,即回报当月数据并对未来1—9个月进行预报。该模式已经得到了国内外学者的广泛应用,部分结果表明该模式对东亚地区降水和环流都有着一定的预报能力[32-33]。
本文所采用的的组合降尺度方案具体实施步骤如下:
(1)预测对象和预测因子来自青海省夏季降水和CFSv2预报/再分析的环流变量。计算环流因子和青海夏季降水的年际增量,作为预测因子和预测对象。具体的计算方法为某1 a的气候变量减去前1 a的气候变量值,所得结果即为气候变量在该年的年际增量。
优势包括: ①放大了预测对象的方差,使之更容易被预测; ②充分利用了前1 a的观测信息,预测往往更准确; ③与东亚气候准2 a周期相契合, 物理意义更清楚; ④能够去除气候变暖、人为影响等长期趋势,专注于确定性异常的预测[8-9,32]。
(2)在建模的拟合时段(1982—2011年)内,利用EOF分析,分别对预测因子和预测变量场进行分解,提取主要特征,再基于Kaiser’s标准[34]保留主模态进而将预测因子和预测量回算到原始变量场形式,用以去除噪声,从而实现滤波的目的。Kaiser’s标准如下:
(1)
其中:am为保留的EOF特征值;SK,k为所分解变量的第k个方差;T为阈值参数,取T=0.7[35-36]。
(3)将经过EOF还原处理之后的预测因子和预测量进行奇异值分解,提取两个变量场之间的耦合变化型,从而更多地引入预测因子对降水预测的有效信息。与EOF分析专注于单一变量场的分析不同,奇异值分解可以基于左、右两个变量场之间的关系进行分解。SVD基于谱分析理论,可以直接对两个空间矩阵进行分解,在充分保留左、右两场空间信息的基础上,将相关的主要信息分解提取出来。
(4)利用多元线性回归方法,针对每个站点建立预报模型。降水预测是一个复杂的非线性过程,单纯地利用多元线性回归方法,容易造成建模的结果的不准确,因此前三步主要是为了尽量多地保留预测因子的主要特征、去除多余噪声。
(5)将步骤(4)中针对年际增量的预测结果,与前1 a青海省夏季降水的站点实况相加,即得该年的预测结果。
对于预测因子的选取,本文遵循以下两个原则:一是从物理机制的角度,选择已经被证明能对青海省夏季降水造成影响的气候因子;二是对于上述气候因子关键区的选择,一方面要保证该区域的气候因子与青海省夏季降水的相关系数基本都通过α=0.05信度的显著性检验,另一方面也要对CFSv2模式预测产品进行评估,确定CFSv2模式对该区域的气候因子具有较强的预测能力[37]。
对于预测结果的检验,主要是进行误差分析:分别计算预测产品与实况的相关系数(R)、均方根误差(RMSE)、平均相对误差(MFE)、平均相对偏差(MFB)[38]。对于预测产品的检验标准为:当平均相对误差在±30%以内,且平均相对偏差小于50%时,认为预测是准确的[39-40]。
,
(2)
(3)
,
(4)
(5)
其中:S、O分别为模式模拟所得和实况序列,该序列样本数为n,第i个样本记为S(i)、O(i)。Cov(S,O)为S与O的协方差,Var(S)、Var(O)分别为S和O的方差。
图1为青海省1982—2018年夏季降水多年平均的空间分布。可见青海省的夏季降水主要集中于东南部地区,而位于西北部的高原地区降水较少,且观测站较稀疏。
图3 青海省1982—2011年夏季降水的EOF前4个模态的时间系数:(a)EOF1;(b)EOF2;(c)EOF3;(d)EOF4
对1982—2011年青海省夏季降水进行EOF分析,图2、3分别给出了青海省夏季降水前4个EOF的空间分布和对应的时间系数变化的特征。由EOF第一模态的空间分布及时间变化曲线可见,青海省夏季降水空间分布最主要的特征就是北少南多,而且存在着一个2~3 a的振荡周期。且EOF第一模态中的时间系数也有较为明显的趋势性变化,与第一模态空间分布相结合可见,青海省降水整体呈增加趋势。EOF的第二、三、四模态中,在青海省的东南部地区都存在一个降水大值区,而位于青海西部的高原地区,降水都明显较少。 前4个EOF的累积解释方差超过82%。
图2 1982—2011年青海省夏季降水的EOF第一、二、三、四模态:(a)EOF1;(b)EOF2;(c)EOF3;(d)EOF4
为了定量筛选预测因子,本文对ERA-Interim再分析资料的500 hPa高度场、200 hPa风场、海平面气压场和海表面温度场做EOF分析,基于Kaiser’s原则保留主要模态,还原以提取主要模态信号,然后计算其年际增量,再将其与经过同样处理的青海夏季降水年际增量全省平均做相关分析。图4给出了这些环流和海温的年际增量与青海夏季降水平均年际增量1983—2011年期间的同期和前期相关系数的分布,阴影区域的相关系数通过了α=0.05信度的显著性检验。
张仲杰等[41]、陈亚宁等[42]的研究表明,夏季同期贝加尔湖脊、乌拉尔脊、新疆脊的强弱及位置,对青海省夏季降水存在显著影响。图4a显示500 hPa高度年际增量场在上述地区的相关系数较高,其中(40°~60°N,70°~120°E)区域的相关系数通过了α=0.05信度的显著性检验,反映出年际增量可以突出预测因子与预测对象之间原有的年际变化的联系[22-24]。因此本文将该区域选为500 hPa高度场的关键区。
由于青海省位处中高纬度地区,受到青藏高原大地形影响,因此中高纬度纬向西风带环流也会造成青海夏季降水异常[39]。同样,图4c显示在亚洲中高纬地区存在显著的相关关系,因此将200 hPa纬向风场的关键区域选为(40°~60°N,30°~100°E)。
图4 基于ERA-Interim再分析资料,经EOF分析再还原后所得1983—2011年夏季同期(a)500 hPa高度场、(c) 200 hPa纬向风场、(b)前期秋冬季海平面温度SST、(d)地面气压场的年际增量与青海省夏季降水年际增量的相关系数分布(网格线表示通过α=0.05信度的显著性检验区域)
王楠等[43]研究表明,与热太平洋海温相关的ENSO现象对我国西北部地区降水有较大影响,青藏高原东侧的气候变化敏感区对El Nio的响应程度要高出其他区域。热太平洋海域中(20°S~20°N,160°E~130°W)区域的前期秋冬季海表面温度SST(Sea Surface Temperature)的年际增量与青海夏季降水年际增量的相关系数较高(图4b),基本通过了α=0.05信度的显著性检验,这一关系反映了慢变的外强迫因子的持续影响,因此将该区域选为SST的关键区。
侯亚红等[44]指出,前期秋冬季的西伯利亚高压也是青海省夏季降水的重要影响因子之一。由图4d可见,整个西伯利亚区域的地面气压年际增量与青海省夏季降水年际增量的相关系数也都通过了α=0.05信度的显著性检验,因此将地面气压场的关键区选为西伯利亚区域(40°~60°N,70°~120°E)。
图5a、c为CFS回报的夏季500 hPa高度场、200 hPa纬向风年际增量与青海夏季降水年际增量的相关系数。可见CFS模式对前述筛选出的关键区域的预测因子都有着较好的回报能力,相关系数大多通过了α=0.05信度的显著性检验。图5b、d是将CFS回报结果通过EOF分析提取主要特征、去除多余噪声之后的变量场的年际增量与青海夏季降水年际增量的相关系数。与ERA-Interim(可以看作为实况)的相应500 hPa高度场和200 hPa风场的的相关系数(图4a、c)相比,可见经过EOF处理后的CFSv2的预测变量场年际增量与降水的关系更为接近和显著。
图5 1982—2011年夏季同期(a) 500 hPa高度场、(b)经EOF分解再还原后的500 hPa高度场,(c) 200 hPa纬向风场、(d)经EOF分解再还原后的200 hPa纬向风场的年际增量,与青海省夏季降水年际增量的相关系数分布(网格线表示通过α=0.05信度的显著性检验区域)
综上,本文将预测因子选为CFSv2模式预测的同期(40°~60°N,70°~120°E)区域的500 hPa高度场年际增量、(40°~60°N,30°~100°E)区域的200 hPa风场年际增量,以及ERA-Interim再分析的前期秋冬季(20°S~20°N,160°E~130°W)区域的海平面温度SST、西伯利亚区域(40°~60°N,70°~120°E)地面气压场的年际增量。
将上述筛选出的预测因子(同期因子为CFSv2预测的年际增量,前期因子为ERA-Interim再分析的年际增量),与实况资料得到的青海夏季降水的年际增量进行SVD分析,利用多元线性回归方法,进行组合降尺度建模。建模时段为1983—2011年。并利用该建模结果,对青海省1982—2018年夏季降水进行回报,其中对2012—2018年青海夏季降水的为独立样本回报。回报所得1983—2018年青海省夏季降水的时间变化曲线如图6。可见,统计回报的降水(红线)与实况(蓝线)更为接近,而CFSv2的降水预测结果(绿线)则与实况(蓝线)距离较远。采用1.3节中误差分析方法计算所得1983—2011年(29 a时间序列)和2012—2018年(7 a时间序列)的CFSv2模式预测结果、统计降尺度方案预测结果与实况的相关系数、均方根误差、平均相对误差和平均偏差如表1。可见CFSv2预测1983—2011年和2012—2018年青海省夏季降水与实况的平均相对误差和平均相对偏差都在正确的范围之内,但是预测所得降水整体比实况偏多,且对降水的时间走势预测的并不好(1983—2011年相关系数为-0.16,2012—2018年相关系数为-0.26)。而组合统计降尺度方案对CFSv2的预测产品表现有着显著的改善:预测产品与实况的相关系数得到了明显提高(2012—2018年相关系数为0.76,1983—2011年相关系数为0.48,均通过了α=0.05信度的显著性检验),而且均方根误差、平均相对误差和平均相对偏差都比CFSv2的低[45-46]。
图6 观测、CFSv2模式、组合降尺度预测1982—2018年夏季青海省降水的时间曲线
为进一步检验模型预测能力,本文对统计建模时段(1983—2011年)内青海省夏季降水的回报结果进行了交叉检验(图7)。可知1983—2011年青海省夏季降水与实况的相关系数为0.46,略低于组合降尺度预测结果与实况的相关系数(0.48),但也通过了α=0.05信度的显著性检验,可见该预测模型比较可靠和稳定。
图7 组合降尺度预测1982—2011年青海省夏季降水的交叉检验
由图6可见,2012—2018年期间,对青海夏季降水整体的独立回报预测除在2012和2015年与实况差异较大外,其余的5 a都较好。图8给出了2012—2018年7 a青海夏季降水的实况和不同方法的预测分布。对比分析可见,CFSv2模式预测的降水基本表现为北多南少,而实际上,青海省的降水更多地呈现出位于西北部的高原地区偏少,东南部地区偏多的特点。在降水的空间分布形态方面,统计降尺度预测方法回报的结果更为接近实况,但是存在容易将青海省南部的降水大值区位置预测地较实况偏西。为了更客观、定量地比较降尺度预测降水和实况降水的空间特征,本文计算了2012—2018年每年的站点实况与降尺度预测所得降水之间的相关系数、均方根误差、平均相对误差和平均相对偏差。这些统计量随年份变化的曲线如图9。可见,2012—2018年,降尺度预测结果与实况的空间相关系数基本都在0.5以上,均方根误差也都基本不超过1.0。平均相对误差MFE和平均相对偏差MFB,分别都在30%和50%的阈值以下。这些空间统计量与时间序列的统计量(表1)相比都略显不足,表明降尺度预测结果对于青海省夏季降水的空间分布也有着较强的预报能力,但是还是比再现青海省夏季降水时间变化的能力稍弱。
图8 2012—2018年夏季实况降水(a、d、g、i、m、p、s),CFSv2模式预测降水(b、e、h、k、n、q、t),统计降尺度方案预测降水(e、f、i、l、o、r、u)
图9 2012—2018年夏季实况降水与统计降尺度方案预测降水空间分布的相关系数、均方根误差、平均相对X误差和平均相对偏差
表1 1983—2011年、2012—2018年CFSv2模式预测夏季降水、统计降尺度方案预测夏季降水分别与实况的相关系数、均方根误差、平均相对误差和平均相对偏差
本文利用组合统计降尺度方法,结合气候模式预测产品和前期观测实况,利用年际增量预测方法,结合EOF和SVD分析,提取预测因子和预测量之间的耦合信息场,利用多元线性回归方法进行统计建模,从而实现对青海省夏季降水的降尺度预测。用于训练建模时段为1983—2011年,用该统计降尺度模型对1983—2018年青海省夏季降水进行了回报。本文从已有研究表明与青海省夏季降水存在较强的相关,且物理机制明确的气候因子中,筛选CFSv2模式有着较强预测能力的关键区和气候因子,最终确定预测因子为以下几个气候变量的年际增量:CFSv2回报所得当期(40°~60°N,70°~120°E)区域的500 hPa高度场、(40°~60°N,30°~100°E)区域的200 hPa风场,以及前期秋冬季的ERA-Interim资料中(20°S~20°N,160°~130°W)区域的海平面温度SST、西伯利亚区域(40°~60°N,70°~120°E)地面气压场。
为了更好地保留预测因子的主要特征、过滤多余噪声,本文对预测因子进行了EOF分析后,再通过EOF主模态还原的处理。为了增加预测因子中所包含的预测量(即青海省夏季降水年际增量)的信息,本文对预测因子和预测量进行了SVD分解,之后再利用多元线性回归方法进行建模。
对该统计降尺度方案预测降水的检验结果表明,该方案对CFSv2模式对青海省夏季降水的预测结果有着显著的改善。对青海省1982—2018年夏季降水的EOF分析结果表明,青海省夏季降水存在南多北少的特点,并且存在着一个2~3 a的振荡周期。利用组合统计降尺度预测方案,基本能够再现青海省夏季降水由西北地区向东南地区逐渐增加的特点。相关系数、均方根误差、平均相对误差、平均相对偏差等统计量的计算表明,统计降尺度方案对于2012—2018年青海省夏季降水的预测结果都比CFSv2直接预测产品更加接近实况,其降水总量与实况偏差更小,相关系数也将CFSv2模式的-0.26提高到了0.76。交叉检验的结果也表明该预测模型具有较强的稳定性和可靠性。此外,统计降尺度预测方案对于降水显著偏少的年份(如2015年)和显著偏多的年份(如2012、2018年)的降水预测都有很好的表现。
利用动力气候模式对我国夏季降水进行降尺度预测的技术已经得到较广泛应用,也有着一定的预报能力。通过对CFSv2模式预测结果应用于青海省夏季降水的检验发现,模式预测的直接应用或简单的统计降尺度释用效果都不好。为此,本文研发了基于CFSv2模式产品、结合年际增量预测技术的组合统计降尺度模型,利用1983—2011年的历史资料进行建模,并做了历史回报和交叉检验,以及2012—2018年的独立样本预测与检验,表明该方法对青海夏季降水具有较好的预测能力和效果。近年来,该方法已经根据业务需求,集成到《青海省智能化气候预测平台》[27]当中,成为青海省气候预测业务的重要支撑工具之一,丰富了气候预测服务产品,服务于日常业务和防灾减灾工作需要。