中国大陆地区多源降水产品的适用性分析

2022-05-10 01:40宫辉力苏德斌陈蓓蓓崔要奎
无线电工程 2022年5期
关键词:青藏新疆地区适用性

王 静,高 博,5*,宫辉力,5*,苏德斌,陈蓓蓓,5,崔要奎

(1.首都师范大学 地面沉降机理与防控教育部重点实验室,北京 100048;2.成都信息工程大学 中国气象局大气探测重点开放实验室,四川 成都 610225;3.首都师范大学 水资源安全北京实验室,北京 100048;4.首都师范大学 资源环境与旅游学院,北京 100048;5.河北沧州平原区地下水与地面沉降国家野外科学观测研究站,河北 沧州 061000;6.北京大学 遥感与地理信息系统研究所,北京 100871)

0 引言

降水(Precipitation)在全球地表能量交换和物质循环中起着至关重要的作用[1-3]。通过地面雨量计、卫星和雷达测量获取的降水信息已被构建成许多高质量、高时空分辨率的数据集[4-8]。

众多学者已对全球降水计划多卫星降水联合反演数据集的各时空尺度[9-13]进行分析,发现其优于其他卫星产品。但其时间尺度较短,在海拔高、地势地貌复杂以及干旱气候地区[14-17]存在问题。中国逐日网格降水量实时分析系统(CGDPA)数据集通过最佳插值方法将约2 400个气象数据生成了长时间尺度、高时间分辨率(1 d)的数据集[18],然而其准确性取决于站点采样误差、密度和空间代表性[19-20]。中国1 km分辨率逐月降水量(TP1 km)数据集加入了气温和降水变量,生产了长时间尺度、高空间分辨率(1 km)的数据集。这3个数据集各有优劣并相互补充。

为了能够高效、精确地应用多源降水产品,本文首先分析了3个数据集在中国大陆2008—2017年不同时空尺度的适用性;进而选择精度较高的2个降水数据集通过加权最小二乘法作为数据筛选器构建数据集;最后对构建的降水数据集进行适用性评价,以确定本研究中的构建方案及结果的可靠性。

1 研究区域与研究数据

1.1 研究区域

中国位于欧亚大陆的东南部,国土总面积约960万km2。复杂的地形与气候导致了复杂的气候环境,使得中国大陆成为系统评价卫星降水数据的良好试验平台。本文根据海拔高度、年降水量以及山脉分布将中国大陆地区划分为8个区域[21]:① 东北地区、② 华北地区、③ 长江中下游地区、④ 华南地区、⑤ 西北地区、⑥ 云贵地区、⑦ 新疆地区和⑧ 青藏地区。新疆地区属于干旱半干旱气候,全年降水量少;青藏地区地形复杂,海拔高,受高原山地气候影响;西北地区主要受温带大陆性气候影响;东北和华北地区主要受中纬度季风气候控制;云贵、长江中下游和华南地区以亚热带季风气候为主。

中国大陆的地面气象站主要分布在东部低海拔地区;西部地区地形复杂、无人区较多、气候恶劣,导致西部地区难以架设更多气象站点。所以气象站点在中国大陆分布十分不均:东部较为密集,西部较为稀疏。

1.2 研究数据

1.2.1 中国地面气候资料日值数据集(V3.0)

中国地面气候资料日值数据集(3.0版)经过气候极限值和站极值检验并使用Kendall自相关检验和Mann-Whitney同质性检验进行质量控制[22]。每天的降水数据记录时间为北京时间8:00—次日8:00(比协调世界时(UTC)时间提前8 h),因此UTC时间为00:00—24:00,与卫星数据同步。

1.2.2 GPM卫星降水产品

GPM是热带降水测量任务(Tropical Rainfall Measuring Mission,TRMM)的继任者,主要有3个方面的改进:① 轨道倾角从35°增加到65°,观测范围从南北纬50°延伸至南北极圈,覆盖了部分温带大陆气候区、温带海洋气候区、温带季风气候区以及全部的极地气候区;② 为了加强对小雨的敏感性,将雷达升级到2个频率;③ 无源微波传感器成像仪添加了“高频”通道(165.5 GHz和183.3 GHz),有助于对微量降水的感知[23]。全球降水计划多卫星联合反演(Integrated Multi-satellite Retrievals for GPM,IMERG)是将卫星微波降水估算、微波校准的红外卫星估算、雨量计分析以及其他潜在的时间和空间降水估算通过校准、合并和插值等一系列步骤生成。NASA根据对数据不同的处理水平和应用需求,提供了不同的降水产品,分别为Early Run,Late Run和Final Run。其中Final Run产品是使用GPCC地面气象观测数据,在Late Run的基础上进行偏差校正生产的。本文只针对IMERG第6版本校正后的Final Run产品进行评估。

1.2.3 中国逐日网格降水量实时分析系统(V1.0)

中国逐日网格降水量实时分析系统(CGDPA)(1.0版)数据集根据中国大陆大约2 400个国家地面气象站的日降水量数据生产。它是“基于气候背景场”,采用最优插值方法制作的空间分辨率约为25 km的日降水量栅格数据集[24-26]。

1.2.4 中国1 km分辨率逐月降水量数据集(1901—2017)

国家青藏高原科学数据中心提供的中国1 km分辨率逐月降水量(TP1 km)数据集的时间尺度是1901年1月—2017年12月。它根据CRU发布的全球0.5°气候数据集和WorldClim发布的全球高分辨率气候数据集,并利用Delta空间降尺度方案在中国进行了降尺度处理生产[27]。

2 评价指标

本文利用3个指标对降水数据进行适用性分析,所用到的评价指标的名称、公式与最优值如表1所示。

表1 评价指标及最优值Tab.1 Evaluation specification and optimal value

3 降水产品与重建数据集的适用性分析

3.1 降水产品的适用性分析

3.1.1 月尺度分析

以气象站观测数据为参考,中国大陆8个研究区2008年4月—2017年12月IMERG,CGDPA以及TP1 km降水数据集的评价指标箱型图如图1所示。3列评价指标中,左列为相关系数(CC),中间列为相对均方根误差(RRMSE),最右列为相对偏差(BIAS)。

图1 中国大陆2008年4月—2017年12月的月尺度评价指标箱型图Fig.1 Box diagram of monthly scale evaluation specifications in Chinese Mainland from April 2008 to December 2017

结果表明,3个降水数据的指标统计结果在不同区域上存在很大差异。首先,相关系数(CC)在CGDPA与IMERG大部分区域在0.80以上,在TP1 km基本大于0.70,在所有地区均表现出CGDPA>IMERG>TP1 km。相关性最高的地区在华南地区,CGDPA与IMERG的CC基本达到0.9以上,这与华南地区地势起伏小、降水量大有一定关系[31]。而在新疆地区3种数据的相关性同时降低,且TP1 km数据下降的最为明显,基本在0.70以下。其次,相对均方根误差(RRMSE)在GGDPA大部分地区都小于IMERG与TP1 km,表现最好。根据RRMSE的阈值(50%)发现,TP1 km数据仅在长江中下游和华南的部分地区被认为是可靠的,其他2种数据的RRMSE同样在华南地区表现最好,基本小于40%。表现最差的是新疆地区,其次是青藏地区。这是由于新疆和青藏地区地形地势较为复杂,地面站点比较稀疏,从而影响了数据的生产以及卫星数据的校正[32]。此外,有研究发现随着雨量计数量的增加,误差呈下降趋势[33]。最后,相对偏差(BIAS)在IMREG与CGDPA各地区大于TP1 km,前二者基本呈现出正偏差,而TP1 km在部分地区呈现负偏差。BIAS在空间分布上与CC和RRMSE的表现基本相同,中国大陆东部地区的BIAS显示出比西部稳定(-30%~30%),极值集中在西部的新疆和青藏地区,尤其是IMERG表现出显著高估。这是由于新疆地区的降水量小、蒸发强,传感器能够检测到部分被蒸发还没有落到地面的降水[34-35],而且由于卫星反演算法问题会将部分沙漠地区识别为下雨的土地[36]。

基于RRMSE,BIAS与CC在不同区域月尺度上的统计结果发现:① 3个数据在中国大陆东部的华南地区表现最好,而在新疆和青藏对降水信息的估计仍然存在问题;② CGDPA均表现出较高的精度(CC>0.90,RRMSE<50%,BIAS介于0~15%),IMERG次之(CC>0.85,RRMSE<60%,BIAS介于0~25%)。

3.1.2 月尺度时间序列分析

2008年4月—2017年12月IMERG,CGDPA以及TP1 km数据集与气象站观测数据在中国大陆地区的时间序列降水量变化趋势如图2所示。

图2 中国大陆2008年4月—2017年12月降水量时间序列Fig.2 Time series of precipitation in Chinese Mainland from April 2008 to December 2017

从3个数据集中能直观地观察到规律的周期性变化,并且在不同子区域都显示出非常相似的波动模式,即由每年的1月份降水量逐渐上升,到7月份降水量达到最高值,随后逐渐下降。将3个数据集逐月降水量值的时间变化在不同区域的观测值进行比较,可以清楚地显示出差异。CGDPA与IMERG均能捕捉到降水时空变化模式,在东北、华北、长江中下游、华南和云贵地区十分相近。而TP1 km几乎在所有区域都偏离了气象站点观测数据,降水量偏低或偏高,不能十分准确地获取降水量信息。但TP1 km,IMERG和CGDPA三个数据似乎都不能准确地反映青藏地区的降水量及变化趋势。在青藏地区,3个数据集的降水量都与气象观测数据存在较大差异。近十年气象站观测数据在青藏地区的降水量呈现轻微上升趋势,而其他3个数据集与其相反,呈现递减趋势。如果以站点数据为准,则3个数据集在该地区的降水获取精度均不可靠。

3.1.3 季节尺度分析

受亚洲季风和青藏高原的影响,中国大陆降水的区域和季节分布差异很大,所以本节在对月尺度分析的基础上,对季节尺度做进一步的分析。在气象学上,通常以一年的3月—次年的2月作为一个季节周期,即3—5月为春季,6—8月为夏季,9—11月为秋季,12—次年2月为冬季。以气象站观测数据为参考,IMERG,CGDPA和TP1 km降水数据集在中国大陆的8个研究区评价指标箱型图如图3所示。最左列为CC,中间列为RRMSE,最右列为BIAS。

法线贴图技术在普通纹理贴图技术的基础上,增加了对法线向量信息的利用。通过物体表面因朝向不同而产生的明暗变化来表现凹凸不平的效果。图12展示了矩形平面在一点光源照射下,利用法线贴图技术实现的效果。

图3 中国大陆2008年4月—2017年12月季节尺度评价指标箱型图Fig.3 Box diagram of seasonal scale evaluation specifications in Chinese Mainland from April 2008 to December 2017

结果表明,IMERG,CGDPA和TP1 km降水数据集的评价指标在8个区域表现基本一致,但在季节上变化明显。8个区域的相关性基本是夏季表现较差,其余3季相对较好,且CGDPA>IMERG>TP1 km。在新疆地区3个数据集的相关性同时降低,特别是TP1 km数据集在夏季CC<0.50。TP1 km数据集在大部分地区显示RRMSE>50%,所以季节尺度上TP1 km在中国大陆的可靠性不稳定。在新疆地区和青藏地区的冬季,IMERG与CGDPA的可靠性也较低,这可能是由于青藏高原冬季较为寒冷,降水相态发生变化,并且地表结冰,从而影响降水获取能力。CGDPA与IMERG在8个区域的BIAS都表现为高估,其中IMERG在新疆地区的BIAS显著升高,这是IMERG卫星反演降水数据需要解决的主要问题之一。

3.2 基于适用性分析结果的高精度降水数据集构建

基于对IMERG,CGDPA以及TP1 km数据集在中国大陆地区的适用性分析发现,CGDPA和IMERG降水数据在大部分地区表现出较好的性能,能够反映出真实的降水信息,而TP1 km降水数据集与气象站数据的一致性较低。因此本文采用一个高效的数据筛选器对CGDPA和IMERG降水数据集进行筛选,进而构建一个新的高精度的降水数据集。其中地面气象观测数据为真值,IMERG与CGDPA为参考数据集,并统一为相同的时间分辨率(1月/25千米),在此基础上进行适用性分析。

3.2.1 构建方法

(1)

用矩阵可表示为:

(2)

假定2个降水产品与地面观测数据之间的误差均为0均值且相互独立,这时降水产品误差的协方差矩阵如下:

(3)

(4)

3.2.2 构建结果分析

以气象观测数据为准,2008年4月—2016年12月重建数据集在中国大陆8个地区的月平均降水量评价指标箱型图如图4所示,从左至右分别为相关系数(CC)、相对均方根误差(RRMSE)和相对偏差(BIAS)。结果显示,重建与IMERG和CGDPA降水量数据集相比,相关性在各地区都有明显提升,尤其是新疆地区,除云贵地区外CC均在0.90以上。云贵地区相关性略低可能由于该地区不仅降水来源复杂(南亚季风、东亚季风、青藏高原季风和西风)[38-39],而且还受到复杂地形控制的小气候的影响,降水具有较高的时空变异性[40]。重建数据集的RRMSE在各地区都有所下降,尤其在新疆地区,RRMSE从50%以上下降到40%以下,同时在青藏地区也有所下降,改善了在新疆和青藏部分地区不可靠的问题。根据BIAS的比较结果来看,通过加权最小二乘法重建的数据集降低了各地区的过度偏差,包括正偏差和负偏差。特别是新疆和青藏地区BIAS基本集中在-30%~20%的合理范围内,证明该数据集重建方法的可靠性。但根据这3个评价指标在月尺度上的空间分布来看,重建后的数据集在新疆地区以及青藏西部地区仍然存在问题。

图4 中国大陆地区重建数据集2008年4月—2016年12月月尺度评价指标箱型图Fig.4 Box diagram of monthly scale evaluation specifications for the reconstruction dataset of Chinese Mainland from April 2008 to December 2016

重建后数据集在季节尺度上的箱型图如图6所示。重建后的数据集在季节尺度上提升了各地区的相关性,尤其是夏季。几乎各地区各季节的CC均在0.80以上,其中新疆和青藏地区偏低,但也提升至0.6以上。RRMSE在各地区各季节也有明显降低(RRMSE<50%),属于可靠范围。但是,新疆地区除夏季外以及青藏地区的冬季还是不可靠。BIAS除新疆和青藏的冬季外都在合理范围。

4 结束语

本文以地面气象站观测数据为参考,对2008—2017年中国大陆地区IMERG,CGDPA和TP1 km降水数据集进行了适用性分析,在此基础上利用加权最小二乘法作为数据筛选器构建了一个新的高精度的降水数据集并进行系统的精度评价,结论如下:

① 在月尺度评价指标的箱型图上,CGDPA降水数据精度更好,IMERG次之。相同的是三者都在东南地区表现较好,新疆和青藏地区可靠性较差。

② 月尺度降水量时间序列变化趋势表现出IMERG与CGDPA能够较好地反映出气象观测数据集的降水量并且变化趋势比较一致。而3种数据集在青藏地区均表现出与真实值降水量相差较大甚至趋势相反。

③ 对季节尺度进行分析发现,IMERG,CGDPA和TP1 km数据集对降水的获取能力在4个季节具有显著差异,春季、秋季和冬季效果较好。3个数据集在新疆地区都表现出相关性显著降低,RRMSE超过50%,BIAS过高。

④ 利用加权最小二乘法作为数据筛选器对IMERG,CGDPA降水数据进行重新构建以形成新的数据集,通过评价结果发现其在中国大陆各地区、各时间尺度的相关性都得到明显提高(CC>0.9),RRMSE降低至50%以下的可靠范围,BIAS也得到控制。虽然在新疆和青藏西部地区的适用性也有提升,但总体精度仍不是十分可靠。

综上所述,地面观测降水数据在一定程度上能够代表真实准确的降水量,但在站点稀疏甚至无站点的地区缺乏代表性。所以在这些地区可以参考适用性较高的地面模拟数据、卫星反演降水数据以及通过加权最小二乘法构建的降水数据集。但本研究构建的降水数据集在时空分辨率上不够高(1月/25千米),时间尺度不长(2008—2017年),并且在高海拔、地形复杂以及干旱半干旱的青藏、新疆地区仍存在降水估计不准确的问题。因此,在未来研究中需引入更多的参考数据以建立高质量、长时间尺度、高时空分辨率的降水数据集。

猜你喜欢
青藏新疆地区适用性
“青藏之窗·雪域羚城”全国散文诗大赛获奖名单
燃煤机组改烧生物质黑颗粒燃料的适用性研究
强调简洁和适用性 MICHI by Rotel X5/X3合并功放
无人潜航器作战保障适用性评估方法
青藏星夜
融入情境 落实新课标 凸显地理实践力——以骑行青藏为例
如何提高学具在数学教学中的适用性
丙申三月独走青藏老妻为备行囊(外一首)
新疆地区非物质文化旅游经济开发实证分析
新疆地区小学数学双语教师课堂教学能力培养探讨