权晨 赵彤 何杰 沈晓燕 申燕玲
(1 青海省气象科学研究所,青海省防灾减灾重点实验室,西宁 810001;2 中国科学院青藏高原研究所,北京 100101)
青海省地处青藏高原东北部,拥有“中华水塔”三江源区、“聚宝盆”柴达木盆地,同时也是气候变化的敏感区和生态环境脆弱区。因此,研究青海省的气候变化、水文过程、生态演变以及陆气相互作用能够为区域经济和社会发展、清洁能源规划和利用、生态保护和国家公园建设等方面提供重要支撑。
陆面驱动数据作为陆面模式的输入,是开展气候、水文、生态等过程的模拟,进而揭示地表与大气交换的物理及生物化学过程不可或缺的数据[1]。根据不同的科研需求,陆面系统模式对其输入数据的要求也不尽相同,但随着模式技术的发展,进行长时间、高分辨率的数值模拟是必然趋势,也是各国科研机构开发长时间序列、高时空分辨率模式输入数据的一个主要动机[2]。目前,用于数值模式输入的再分析资料有很多,其中使用最为广泛的是美国生产的NCEP/NCAR再分析资料[3]和MERRA-2再分析资料[4]、欧洲中期天气预报中心的ERA5再分析资料[5],以及日本的JRA-55再分析资料[6]。除此之外,还有旨在用于陆面数值模式的Princeton驱动数据[7],专注于描述大气辐射状况的GEWEX-SRB数据[8],以及根据TRMM卫星遥感数据和其他卫星数据反演得到的降水数据产品[9]等。国内再分析或陆面驱动数据取得了重大进展,主要有中国气象局中国全球大气/陆面再分析数据集(CMA-RA)[10-11]和CMA陆面数据同化系统(CLDAS)近实时产品数据集[12],以及中国区域近地面气象要素驱动数据集(CMFD)[13]。这些数据产品中的大多数都覆盖了全球范围,或至少覆盖了地球表面的大部分,但这并不意味着同一产品中的数据在不同的区域都具有相同的可信度。由于全球范围观测数据的分布不均,以及数据同化系统自身存在缺陷等原因,数据产品中可能出现区域性的系统偏差。青藏高原地区地形复杂、站点稀少,各类数据集往往存在较大偏差或空间分辨率较低。刘婷婷等[14]对ERA5降水与实测数据的相关系数评估得出高原地区整体低于0.40,无法满足该地区格点化气象分析以及水文、生态模型的应用需求。
因此,为了满足陆面数值模拟工作的需要,有必要消除既有资料中的偏差,开发出一套适用于青海高原区域的长时间序列、高时空分辨率的陆面模式驱动数据(QMFD),以求获得更好的模拟结果。该数据集主要采用阳坤团队研发的中国区域气象要素驱动数据集(CMFD)研制方法[13],融合了青海省气象局1980—2003年1日4次(时间分辨率为6 h)和2004—2018年国家气象站(50个站)逐小时气压、气温、降水、相对湿度、风速,以及日平均气温、日最高气温、日最低气温等高时空分辨率气象观测数据制作而成,其时间分辨率为3 h,水平空间分辨率0.01°×0.01°,包含近地面气温、地表气压、近地面空气比湿、近地面全风速、地面降水率共5个要素(变量)。该数据集实现了青海区域较高时间和空间分辨率,且数据质量不低于国内外主流陆面驱动数据集,能够很好地满足高原地区中小区域内生态水文过程模拟以及气象资料分析,相对于主流数据集具有不可替代的作用。各气象要素见表1所示。
表1 各气象要素物理意义及单位Table 1 Physical significance and units of meteorological elements
1.1.1 地面气象观测数据
地面气象站观测数据包括青海省1980—2003年1日4次(时间分辨率为6 h)和2004—2018年国家气象站(50个站)逐小时气压、气温、降水、相对湿度、风速,以及日平均气温、日最高气温、日最低气温。
1.1.2 TRMM卫星降水数据
采用2004—2018年TRMM卫星降水再分析数据(3B42),时间分辨率为3 h,空间分辨率为0.25°。TRMM降水数据的准确度已经成为国际公认的事实,TRMM 3B42数据在本工作中不仅起到了为插值提供“背景”的作用,而且是作为判断某时刻某格点上是否出现降水的依据。这种通过卫星遥感数据判断降水是否发生的方法极大地克服了纯数学插值方法在格点上产生虚假降水的难题。区域内40°N以北地区,TRMM数据未覆盖地区由APHRODITE(Asian Precipitation-Highly Resolved Observational Data Integration Towards Evaluation of Water Resources)降水数据集替代,该数据集是由日本综合地球环境研究所(RIHN)和日本气象厅气象研究所(MRI/JMA)整编了亚洲各国家和地区的雨量站观测资料建立的一套逐日高分辨率网格化降水数据集[15]。
1.1.3 GLDAS同化数据
GLDAS(Global Land Data Assimilation System)是描述全球陆地信息的模型,该模型包含了全球降雨量、水分蒸发量、地表径流、地下径流、土壤湿度、地表积雪的分布以及温度和热流分布等数据[16]。模型的空间分辨率有1°×1°和0.25°×0.25°,时间分辨率为逐3 h、逐日、逐月不等。
1.1.4 Princeton陆面模式驱动数据
Princeton陆面模式驱动数据是由Princeton大学陆面水文研究组开发的一套旨在用于陆面过程数值模拟的格点资料[7]。其时间序列覆盖了1948—2006年的近60年长度,时间分辨率为3 h,水平空间分辨率为1.0°。文中采用近地面气温、地表气压、近地面空气比湿、近地面全风速这4个变量。
1.1.5 评估数据
利用青海省不同区域、不同海拔高度的30个区域气象站观测资料对生成的栅格数据进行评估(表2)。该数据在栅格数据生成过程中未参与融合。
表2 数据集评估所需区域气象站信息Table 2 Information of regional meteorological stations for dataset evaluation
1.2.1 总体方案
气象台站观测数据准确,因此,制作栅格数据产品最简单的思路是直接用台站观测数据进行空间插值,但在观测站点稀少地区,通过简单数学插值方法将站点数据插值至格点会产生巨大的偏差。再分析或遥感格点产品虽具有区域性的系统偏差,但其时空分布连续性好,其空间分布可作为空间插值的参考信息。因此,为了得到高时空分辨率的气象要素栅格数据产品,就必须将这两类数据融合,使其优点相结合。如:降水数据采用TRMM卫星降水数据、GLDAS同化数据以及地面站点数据;气温、气压、全风速、比湿等要素则采用Princeton陆面模式驱动数据和地面气象观测数据。
本数据集采用CMFD的研发思路[13],即先假定所需的Princeton陆面模式驱动数据、GLDAS同化数据和TRMM卫星遥感数据相对于气象站观测数据的偏差在空间上是连续分布的,在每个站点对应的位置上求出该气象要素的偏差并将其插值到格点上,再订正原始的再分析资料或卫星遥感数据中的偏差,最终实现再分析或卫星遥感栅格资料与气象站点观测数据的融合。其中,在近地面气压、气温、全风速、比湿和降水率等5个要素数据集的建立过程中,采用“差值法”来表示再分析资料相对于观测数据的偏差,在向下短波辐射数据中采用“比值法”来描述。空间降尺度方面,选择ANUSPLIN插值工具来将站点数据插值到0.01°空间分辨率格点,对于气温、气压等对地形高度比较敏感的变量,利用高分辨率的地形数据来提供高空间分辨率的信息。
1.2.2 时间降尺度过程中的质量控制
为了避免在制作的数据产品中出现物理上不合理的数值,如负降水量、大于100%的相对湿度等情况,必须对插值结果进行质量控制。防止插值“过界”的最简单办法就是确定变量的变化阈值,并且将插值结果中超出阈值的数值校正到合理范围之内。对于提供了日变化极值的变量,采用观测的日变化极值作为该变量在当天的变化阈值。对于气象站资料中没有提供日变化极值的变量,则根据该变量的物理意义来确定阈值,如:降水量不可能为负,那么降水量的最小阈值就是0;相对湿度不可能超过100%,则相对湿度的最大阈值就是100%。此外,为变量设定阈值并不是避免插值结果出现不合理数值的唯一途径,采用了Logistic变换的方法来避免出现相对湿度超过100%的情况。
1.2.3 空间插值中地形高度处理
气温、气压变量的数值随高度的变化是十分显著的,因此在对这两个变量的数据进行空间插值时必须考虑地形高程的影响。首先将Princeton格点再分析数据和气象站点观测数据中的气温和气压数据统一订正到海平面高度上,然后使用海平面气温、气压数据来完成校正和降尺度过程,最后再将校正后的数据订正回地形高度上,得到最终数据产品。
数据评估采用直接对比气象站点值和与其空间对应的栅格格点值方法,对气象站点实测值与栅格数据估测降水值进行对比,方法主要包括均方根误差(RMSE)、相关系数(R)、平均绝对误差(MAE)、标准偏差(BIAS)。具体公式如下:
式中,n是数据记录的总个数;i是全体数据中的第i个数据;xi是栅格数据提取的值;yi是台站观测的值。
利用青海省50个国家气象站和30个区域气象站对气温、降水、风速、湿度、气压这5个要素的月值进行了评估。
2.2.1 国家站数据评估
对1978—2018年50个国家气象站的评估结果(表3)可以看出,栅格数据与地面气象站间的相关系数总体较高,其中气温的各站平均相关系数高达1.00;降水次之,为0.97;风速相关系数达到0.81;气压相关系数为0.74;相对湿度最低,但也达到了0.69。从各要素RMSE、MAE以及BIAS来看,风速数据相对最好,其次为气温数据。
表3 国家气象站月尺度数据评估结果Table 3 Monthly-scale data evaluation results of national meteorological stations
2.2.2 区域站数据评估
对2016—2018年30个区域气象站进行评估(表4),可以看出,栅格数据与地面气象站间的相关系数总体较高,其中气温相关系数高达1.00;相对湿度次之,为0.92;降水相关系数为0.85;气压相关系数为0.82;风速最低,为0.74。从各要素RMSE、MAE以及BIAS来看,风速数据相对最好,其次为气温数据。
表4 区域气象站月尺度数据评估结果Table 4 Monthly-scale data evaluation results of regional meteorological stations
2.3.1 国家站数据评估
对1978—2018年50个国家气象站的日数据评估结果(表5)可以看出,栅格数据与地面气象站间的相关系数相差较大,其中气温相关系数高达0.98;相对湿度次之,为0.79;风速、降水、气压相关系数均<0.60。从各要素RMSE、MAE以及BIAS来看,气温数据相对最好,其次为相对湿度数据。
表5 国家气象站日尺度数据评估结果Table 5 Daily-scale data evaluation results of national meteorological stations
2.3.2 区域站数据评估
对2016—2018年30个区域气象站日数据进行评估(表6),可以看出,栅格数据与地面气象站间的相关系数相差很大,其中气温相关系数高达0.96;相对湿度次之,为0.61;风速相关系数为0.26;降水和气压相关系数分别为0.17和0.02。从各要素RMSE、MAE以及BIAS来看,气温数据相对最好,其次为相对湿度数据。
表6 区域气象站日尺度数据评估结果Table 6 Daily-scale data evaluation results of regional meteorological stations
挑选2018年6月和9月NCEP、ERA5、CLDAS这3类数据集与青海长序列高分辨率气象要素栅格数据集进行评估对比,提取了青海省30个区域气象站月数据,结果(表7)显示,青海长序列高分辨率气象要素栅格数据集气温数据与观测数据的相关系数分别为0.84和0.74,明显高于ERA5和NCEP数据集,RMSE和MAE明显低于其他数据,而且时空分辨率方面亦有优势。对于降水数据,亦采用相同的评估方法,结果(表8)显示,青海长序列高分辨率气象要素栅格数据集降水数据相关系数分别为0.61和0.51,明显高于除CLDAS外其他数据集,RMSE和MAE明显低于其他数据,同样,时空分辨率方面亦有优势。
表8 青海长序列高分辨率气象要素栅格数据集(QMFD)与其他同类数据集降水评估结果对比Table 8 Comparison of precipitation evaluation results between QMFD and other similar datasets
1)构建了1979—2018年长达40 a的青海省近地面气压、气温、风速、降水率、相对湿度5个气象要素逐3 h的0.01°×0.01°栅格数据集,弥补了空间上无站点地区的气象数据,为气候变化、生态评估、水资源评估提供基础数据。
2)月数据评估结果显示,数据集与地面气象站观测数据间的相关系数总体较高,其中气温相关系数最高,达1.00;相对湿度次之,为0.92;降水相关系数为0.85;气压相关系数为0.82;风速最低,为0.74。日数据评估结果显示,气温相关系数为0.96,相对湿度为0.61,其他要素较差。总体上,青海长序列高分辨率气象要素栅格数据集在月尺度上相关系数、均方根误差及标准偏差指标方面表现较好,气温和相对湿度在日尺度上优于其他要素。
3)与NCEP、ERA5、CLDAS几类数据集评估结果对比显示,青海长序列高分辨率气象要素栅格数据集气温数据相关系数超过0.74,降水数据相关系数超过0.51,明显高于除CLDAS外其他2个数据集,而且时空分辨率方面亦有优势。
Advances in Meteorological Science and Technology2023年4期