统计降尺度方法预测长江中下游气温初步研究

2014-12-30 11:21冉超翟宇梅王力维
科技创新与应用 2014年3期

冉超 翟宇梅 王力维

摘 要:文章利用经验正交函数(EOF)和逐步线性回归相结合的统计降尺度方法建立大尺度信息与长江中下游地区25个气象站1月及7月,月平均气温之间的统计关系共计36个统计降尺度模型,其中联合预报因子变量场采用空间联合的经验正交函数分解法。结果表明:(1)长江中下游地区25个站点建立的模型通过独立检验,均取得了较好的Pc得分。(2)对于1月的模拟性能都高于7月,这可能与当地处于亚热带季风区,夏季较冬季多雨气温变化较大有关。(3)分析得分较高方案发现海拔较高站点模拟效果优势明显且采用联合预报因子变量场的效果更好。

关键词:统计降尺度;联合EOF分解;长江中下游;短期气温预测

引言

虽然随着数值预报的发展,天气预报对气温已有很好的预报,肖明静等[1]对2010年6月至2011年5月WRF-RUC和T639模式预报的24h2m温度预报产品进行分析与订正, 阈值2度的预报准确率均达到80%以上,但是短期气候预测效果依然不尽如人意。例如08年发生南方冰冻雨雪灾害,虽然天气预报当时已经可以很好的预报出未来几天的天气变化,但是却没能提供良好的短期气候预测,依旧造成非常大的影响和损失。目前,常用的短期气候预测方法有天气气候学、统计气候学和动力气候学方法。天气气候学和统计气候学方法难以从根本上解释气候形成的物理机制,虽历史拟合率可能较好,但预报准确率有限且不稳定,同样大气环流模式(GCMs)是进行气候预测最行之有效的方法之一[2-4],然而由于它的空间分辨率一般是上百公里,虽然对大尺度信息的模拟与预测是不错的,却不能达到局地或区域气候预测空间尺度的精度[5]。可以弥补大气环流模式的这种不足目前有两种方法[6],一是发展更高精度的气候模式,另外一种即是采用降尺度方法。第一种方法计算代价巨大耗时,结果却未必理想,“性价比”不高。相形之下,降尺度可以在已有模式的基础上通过动力或者统计的方法来提高局地气候预测的精度,是更可性的方法。

从90年代初变开始了统计降尺度的研究,这是一门较新的科学,经历初期集中在欧洲等地的研究和应用后,近年来国内也开始对统计降尺度展开研究。无论是线性方法、非线性方法以及动力-统计降尺度[7-9],很多学者都将落脚点放在降尺度方法本身,而对预报因子变量、预报区域选取和对不同区域的适用性问题关注较少。本文采用PCA与逐步回归相结合的统计降尺度方法,通过改变初始输入的预报因子变量区域、预报因子变量场和输入回归方程中主成分的个数,建立了不同模型,再通过对长江中下游各台站气温多个统计降尺度模拟结果进行研究比对,选择最优预报方程,从而提高该地区气温预测精度。值得注意的是由于统计降尺度多种不确定性,未来方向[10]将是不断提高气候模式的预测能力,将模式良好的输出信息作为预报因子才能提高区域降尺度的发展,同时用不同的气候模式驱动不同的降尺度模型即超级集合以期得到更好的关于未来短期或长期等的气候预测,同时将降尺度的方法应用在各种复杂多样的区域气候下,尤其气候累计观测资料较少的地区,可以用不同统计降尺度方法进行对比试验,来提高资料稀少地区的区域气候预测能力。

1 资料选取

对统计降尺度的研究可知[11-13],在建立统计降尺度模型时,需要观测的预报因子变量及观测的预报量两种数据进行建模,前者代表大尺度信息,后者代表区域尺度。中国地域辽阔,不同教材对各区域有不同的划分,为了便于统计降尺度方法的研究与应用,Liu Y等[14]对中国南方地区进行重新划分,本文在此基础上,选取了长江中下游地区共计25个站点1961-2010年1月和7月的月平均溫度资料。图1为长江中下游地区25个测站分布图,图中长江中下游地区包括湖南、湖北、江苏、浙江、安徽五省,由图1可以看出25个站点分布较均匀。由表1可知,站点地形海拔较为均匀,除个别站点外,海拔都低于100m。

预报因子来自于同时期NCEP/NCAR分辨率为2.5°*2.5°的月平均资料,包括17个等压面(1000,925,850,700,600,500,400,300,

250,150,200,100,70,50,30,20,10(hPa))上的温度(t),位势高度(hPa),全风速,u分量风速,v分量风速,以及垂直风速(w)等共计102个预报因子。首先对预报因子做距平化处理,然后对预报因子进行初选,即102个因子分别与25个站点做全球相关场分析,选出温度场中相关性最好的850hPa温度场、高度场中相关性最好500hPa位势高度场(1月是1000hPa)和海平面气压场,选取了站点与区域为(110°~125°E;20°~40°N)的T850温度场平均相关系数进行说明(图2)。一些研究中表明[15],在使用统计降尺度方法对地面温度进行预测时,采用大尺度温度场作为预报因子变量比大气环流作为预报因子变量效果好,同时研究还认为温度因子和环流因子的联合预报因子变量比单个变量作为预报因子变量更能得到真实的结果。所以本文采用850 hPa大尺度温度场、500 hPa位势高度场、海平面气压场与850 hPa大尺度温度的联合场(SLP+T850),以及500hPa高度场和850 hPa温度的联合场(H500+T850)作为预报因子变量场,其中1月选取的大尺度位势高度场为1000hPa。除了预报因子变量外,其预报因子具体取值区域和代入统计模型的主成份(PCs)个数对统计降尺度的模拟结果也有很强的敏感性。因此本文在全球相关场分析的基础上还选择了三个预报因子变量的取值区域和三种PCs输入个数,对25站1月和7月分别建立了共计36种统计降尺度模型(详见表2)。

2 方法介绍

2.1 主成份分析

在建立统计降尺度模型之前,首先对资料需要进行主成份分析,来减少系统维数,提取主要特征,主成分分析(PCA)在气象资料分析中有着广泛使用。

图2 站点与该区域T850温度场的平均相关系数

它目的是降低资料的自由度和维数,也就是用少数几个新变量序列反映原多个变量的变化信息[16]。为了从资料中分离出有用的大尺度信息减少计算量,需要先对NCEP再分析资料进行主成分分析。

单个变量场(如T850)作为预报因子变量场进行分析可以写成如下形式: 其中其中m为格点数,n为样本数,

代表主分量的矩阵。其中n=1为第一主分量,n=2为第二主分量,依次类推。主成分具体运算过程可以参考文献[17]。对于两个变量的联合场(如T850+H500)与单量场类似,需要把两个变量场在空间上联合为一个新变量场,需要注意的是其空间格点数为两个场空间格点数的总和,然后进入EOF分解步骤。因为T850和H500两个变量场取自同区域的相同格点,所以场其特征向量为两者空间格点数总和,而绘制EOFs空间模态时应该把两个变量绘于相同网格上,以便考察两个变量在空间上的耦合情况,同样的联合EOF分解得到的PCs代表了联合场随时间变化的共同特征。以1月,预报因子变量为T850+SLP和T850+H1000,取值区域为(110°~125°E;20°~40°N)来对比说明单变量预报因子场和双预报因子联合场的EOF分解结果。如果是单个温度场T850分解的第一EOF模态只能表示温度场的变化趋势。图3a表示了联合场T850+SLP的EOF分解结果,其中包含了两种等值线,实线代表SLP的等值线,虚线代表T850的等值线,两者绘于同区域,可以看出气候变量空间模态的耦合特征,第一EOF反应了与单因子T850类似的温度变化模态,同时还伴随海平面气压的增加(减少)变化趋势,所以表征了温度和海平面气压之间的物理联系,同理,图3b也同时反映了该场温度变化,及其随位势高度的增加(减少),表征了温度和位势高度场之间的物理联系,使得预报因子物理意义更加明显。

2.2 逐步回归

在建立多元线性回归模型时,有时自变量会非常多。逐步回归可以按照一定的显著性条件选出重要因素达到既能减少自变量个数,又能保证回归效果的目的。其主要的分析思路为:首先对多元线性回归进行因子筛选;最后给出在一定显著性水平下,各因子均为显著回归方程中的回归系数。以公式 说明,其中以

代表1月份,第n站的气温序列, 代表k个主分量组成的矩阵,因为代入统计模型的主成份(PCs)个数对统计降尺度的模拟结果一定影响,所以本文分别选取了k为10、15、20来进行建模。 为多元线形回归模型的系数,?着为残差部分,是不能被多元回归方程解释的部分。对k个主分量利用逐步回归方法,进行逐步筛选,得到对气温统计模式显著的主分量。筛选得到的通过显著性检验(本文取α=0.25)的PC主分量,再建立多元线形模型,估计出多元线形回归的系数。在本文中由于受资料时间长短的限制,对长江中下游地区1月及7月份气温使用前40年(1961-2000年)的资料建模,而后10年(2001-2010年)的资料进行模型独立检验,采用距平符号一致率Pc来进行评分。

3 统计降尺度模式的评估

图4显示了1月及7月36个预报因子变量选择方案的独立检验符号一致率Pc的平均得分分布图。分析图4可以看出,相对与7月,1月的各方案模拟效果更优,直观上说明冬季气温可预报性更高。同时可以看出预报因子变量及其区域的选择,以及输入的PCs个数对模拟的效果有着明显影响。输入的PCs上来说,平均得分较高的是选择10个PCs作为输入,其模拟结果优于较大的输入个数。而从预报变量取值区域上看较小的区域3结果优于其它区域,这与预报因子初选有着密切关系,在建立模型前进行了大尺度资料102个因子全球相关场的对比,从实验的结果证明相关性越高的区域最终模型得分也较高,进一步说明不同区域预报因子的适用性不同,预报因子区域的确定也為进一步研究长江中下游地区气候变量打下了基础。

预报因子实验方案还考虑了预报因子的物理意义所以选用了双因子和单因子进行比较,以区域3和输入10个PCs为例,发现同样对于1月或是7月,T850+SLP和T850+H1000优于单因子T850、H1000的模拟性能说明联合场的预报因子考虑了两个场的物理意义其适用价值高于单预报因子场。总体上看36个预报因子变量方案Pc得分都高于0.5,然后从图4的曲线变化可以明显看到36个预报因子变量方案平均得分变化较大,存在差异性,进一步证明,预报因子变量的选择对统计降尺度模型的直接影响及对结果的敏感性。

图5是25个测站的36个预报因子变量方案符号一致率得分的箱线图,x轴是预报因子变量方案,y轴是Pc得分,由图5a,1月的Pc得分可以看出箱体的中位数位置基本较高,中心趋势除个别站点外均高于0.6,而4、12和25号站点模拟性能较集中且分散程度也较小,其中最高得分0.9也出现在4号和25号站,说明这些站点对统计降尺度结果都有较好的模拟性能,这和其海拔较高有一定关系。总体上看各站点地理位置基本分布较集中,长江中下游地区属于亚热带季风气候,干湿两季较明显,所以冬季气温变化温和,预报因子变量模拟方案较夏季更好,分散程度也较小。由图5b,7月的箱线图分布可以看出其中位数波动随站点变化较大,预报因子变量方案Pc得分差异也较大,这和预报因子取值区域和输入的PC个数有关,而站点12和25号站中位数依旧较高,模拟性能较集中,进一步说明海拔较高的站点对统计降尺度结果模拟性能更好。虽然7月份与1月份模拟结果相比Pc得分存在一定差异,但总体上看25个站点几乎都有得分为0.8左右的预报方案并且所有范围均超过0.5,这对进一步研究长江中下游地区统计降尺度方法适用性提供了前提基础。

图5 1月(a)和7月(b)36个预报因子变量模拟的25个

台站气温的统计降尺度独立检验Pc得分箱线图分布

4 结束语

(1)首次较详尽的对长江中下游地区各站点的气温观测资料和NCEP再分析资料的T850、H1000、T850+H1000和T850+SLP(7月为H500)建立的36种统计降尺度模型,通过独立检验Pc得分可以看出,1月的模型得分均高于7月,并且无论1月或是7月,都有得分0.8左右的预报方案,并且36个预报变量方案模拟结果Pc得分均超过了0.5,这为进一步研究该区域统计降尺度方法提供了参考性和前提保障。

(2)对25个站点36种预报因子变量方案,筛选出Pc得分较高的预报方案进一步分析发现对于EOF与逐步回归相结合的统计降尺度方法,PC输入个数为10,预报因子取值区域较小的区域3模拟的平均得分最高,而对于联合的预报因子变量其模拟性能比单个预报因子变量模拟性能更佳,说明物理意义更明确的预报因子选择价值更大,同时无论1月还是7月较高得分方案均集中出现在海拔较高的站点,说明海拔较高的站点对统计降尺度模拟性能更好。

(3)通过25个站点多个统计降尺度模型的箱线图分布可以看出,1月中位数位置较高分散程度也比7月份小,这跟长江中下游地区的气候特点可能有关。同时分析7月各站点Pc得分分散程度可以看出建模时输入PC的个数、预报因子区域的选择对模拟性能有很大影响,进一步说明预报因子变量方案的选择对统计降尺度模型建立的重要性,不同区域要具体分析。

参考文献

[1]肖明静,隋明,范苏丹,等. 三种数值模式温度预报产品在山东应用的误差分析与订正[J].干旱气象,2012,30(3): 472-477.

[2]Schlesinger M E, Mitchell J F B. Climate model simulations of the equilibrium climatic response to increased carbon dioxide[J]. Reviews of Geophysics, 1987,25(4): 760-798.

[3]Stouffer R J,Manabe S, Bryan K. Interhemispheric asymmetry in climate response to a gradual increase of atmospheric CO 2[J]. Nature,1989,342(6250): 660-662.

[4]Mearn L O,Bogardi I, Giorgi F,et.al. Comparison of climate change scenarios generated froom regional climate model experiments and statistical downscaling. JournalGeophysicsResearch1999,104(D6):6603-6621.

[5]Cubasch U, Von Storch H, Waszkewitz J, et al. Estimates of climate change in Southern Europe derived from dynamical climate model output[J]. Climate Research, 1996, 7(2): 129-149.

[6]范麗军,符淙斌,陈德亮. 统计降尺度法对未来区域气候变化情景预估的研究进展[J]. 地球科学进展,2005,20(3): 320-329.

[7]柯宗建,张培群,董文杰,等. 最优子集回归方法在季节气候预测中的应用[J].大气科学,2009, 33(5): 994-1002.

[8]何慧,金龙,覃志年. 基于 BP 神经网络模型的广西月降水量降尺度预报[J].热带气象学报,2007, 23(1): 72-77.

[9]严小冬, 吴战平, 马振锋, 等. Downscaling 法在贵州冬季气温和降水预测中的应用[J]. 高原气象,2008,27(1): 169-175.

[10]任丽娜,翟宇梅,王力维. 多模式集合在统计降尺度应用上的研究进展[J].科学技术与工程,2011,11(29): 7185-7194,7201.

[11]赵芳芳,徐宗学. 黄河源区未来地面气温变化的统计降尺度分析[J].高原气象,2008,27(1): 153-161.

[12]曾晓青,王式功,刘还珠,等. 统计降尺度方法在青海省冬季最低温度预测中的应用[J].高原气象, 2009,28(6): 1471-1477.

[13]陈丽娟,李维京,张培群,等. 降尺度技术在月降水预报中的应用[J]. 应用气象学报,2003,14(6): 648-655.

[14]Liu Ying, Fan Ke, WANG Hui-Jun. Statistical Downscaling Prediction of Summer Precipitation in Southeastern China[J]. Atmospheric and Oceanic Science Letters, 2011,4(3): 173-180.

[15] Huth R. Statistical downscaling of daily temperature in central Europe[J]. Journal of Climate, 2002, 15(13): 1731-1742.

[16]吴洪宝,吴蕾.气候变率诊断和预测方法[M].北京:气象出版社,2005: 33-34.

[17]施能.气象统计预报[M].北京:气象出版社,2009:91-96.

作者简介:冉超(1989-),男, 四川成都, 研究生在读, 研究方向:短期气候预测。