柏荷,明義森,刘启航,黄昌,3
1.陕西省地表系统与环境承载力重点实验室,西安 710127
2.西北大学城市与环境学院,西安 710127
3.西北大学城市与环境学院 地表系统与灾害研究院,西安 710127
近几十年来,随着全球气候变暖加速水循环,极端降水、干旱等极端天气事件频繁发生,使洪涝、干旱、崩塌、滑坡、泥石流等灾害事件发生次数随之增加。极端降水具有突发性和复杂的时空分布特征,不仅对人类生命财产安全产生威胁,而且对生态环境和社会经济发展造成巨大危害,因此极端降水的时空变化规律等成为各国学者关注和研究的重点[1-3]。
中国地处亚欧大陆东部,太平洋西岸,幅员辽阔,地势西高东低且地形复杂,气候类型多样,大陆性季风气候显著。中国因其独特的气候特征和复杂的地形,造成水旱等自然灾害频繁发生[4]。获取高精度、高时空分辨率且长时间连续极端降水观测资料是我们全面认知不同气候区内极端降水变化趋势的重要手段。传统的地面直接观测降水方式主要包括雨量计和雷达两种,然而,这类观测站点数量有限且空间分布不均,使得高空间分辨率的降水数据资料匮乏,在研究降水方面数据受到限制[5]。随着卫星技术的发展,遥感反演降水为获取降水资料提供了一种新途径。卫星遥感数据具有不受天气和复杂地形影响、陆地海洋全覆盖、大面积、全天候观测等特点,因而成为获取降水时空变化信息的重要方式[6]。本文基于长时间序列全球降雨测量(Global Precipitation Measurement,GPM)研制了2001-2019年中国逐日的空间分辨率为0.1°×0.1°的暴雨数据集,来揭示中国暴雨的时空变化特征。本数据集使用GPM卫星遥感数据进行研制,克服了传统降雨观测站点空间分布不均匀、难以连续反映降水的空间分布等缺点,具有更广的覆盖范围以及更高的空间分辨率,有利于分析全国范围内暴雨的时空变化特征。
本文采用的GPM数据来源于美国国家航空航天局(NASA)网站(https://www.nasa.gov/),气象站点观测数据来源于国家气象信息中心(http://data.cma.cn)。GPM卫星计划是由美国宇航局(NASA)执行,日本宇宙航空开发机构(The Japanese Aerospace Exploration Agency,JAXA)以及欧盟等其他一些国际组织合作建设的主要用于气象预报的卫星监测系统,目的在于提高测量精度和采样频率,实现更准确的、更早的气象预报。GPM 卫星数据与传统的热带降雨测量任务(Tropical Rainfall Measuring Mission,TRMM)卫星数据相比,提高了对弱降水(<0.5 mm/h)和固态降水的探测能力,更大程度上提高其时空分辨率、观测精度和准确性,真正实现了全球降水(含雨雪)产品的功能[5,7]。GPM卫星计划根据其数据反演算法不同提供了4个级别的产品,本数据集选取IMERG(Integrated Multi-satellitE Retrievals for GPM)产品的最新版本IMERG V06数据。该数据于2019年3月发布,它整合了可用的GPM、TMPA(TRMM Multi-satellite Precipitation Analysis)遥感器获取的信息,并进行互相校准、合并、插值和融合生成一致的降雨数据,实现了2000年6月至今的降雨估测[8]。为了保证研究周期内的数据完整性,本数据集的生产选用空间分辨率为0.1°×0.1° 的逐日GPM IMERG产品(IMERG_final),时间范围为2001年1月至2019年12月。
本数据集采用的GPM数据来源于美国国家航空航天局(NASA)网站,数据的下载、格式转换、裁剪等基本处理完成后,运用Python开发的暴雨识别工具[9],识别每个网格内的暴雨。暴雨识别工具可以自动化从网格时间序列的降水数据中识别每个网格内发生的暴雨事件。运用暴雨识别工具提取出数据库,用来记录每个网格所对应的降雨量峰值、降雨量峰值时间、降雨量持续时间和强度。再根据该数据库进行暴雨数据集的提取。在本数据集中以StormCount、StormDuration、StormLevel、StormPeak、StormTime、StormVolume呈现。
暴雨识别的核心算法是,检验覆盖研究区域的N(i=1,2,3,…,N)个网格(G)中,每个网格从开始到结束的时间内(t=1,2,3,…,n)是否有暴雨事发生,时间间隔(TR)根据输入降水数据的时间分辨率设置。暴雨识别算法流程图如图1所示,将暴雨事件中,StormDuration(暴雨持续时间)、StormLevel(暴雨等级)、StormPeak(暴雨峰值雨量)、StormTime(暴雨发生时间)和StormVolume(暴雨雨量)5个变量的初始值设为0,其中StormLevel为StormVolume/StormDuration。每一个网格从初始时间到结束时间的降雨量设为Git,通过比较i=1,t=1时Git与StormPeak(SPi)的大小来确定暴雨事件是否发生。当Git> SPi时,说明Git为此刻的暴雨峰值雨量,其他四个相关变量也随之更新;当0< SPi 本数据集采用2001-2019年GPM降水数据作为输入数据,设定时间间隔TR为24h。根据中国气象局对暴雨的定义,一般指每小时降雨量16mm以上,或连续12小时降雨量30mm以上,或连续24小时降雨量50mm以上的降水为暴雨(http://www.cma.gov.cn/)。因此,我们将Th与暴雨持续时间SDi以小时为单位设定,见公式(1)。 本数据集为中国0.1°×0.1°分辨率的 24小时暴雨栅格数据集。时间范围为 2001年1月至 2019年12月。数据集压缩后文件共计16.2 MB,按照年份不同分别存储在19个文件夹中,数据存储格式为GeoTIFF(.tif)栅格数据格式。数据集文件命名规则为:StormCount +年份.tif;StormDuration +年份.tif;StormLevel +年份.tif;StormPeak +年份.tif;StormTime +年份.tif;StormVolume +年份.tif。文件名含义见表1。图2为2019年暴雨数据集文件示例。 表1 文件名含义Table 1 Meaning of file names 为了保证暴雨数据集的精度并且能够进一步实现数据集的有效共享,本文采用GPM卫星降水数据产品进行暴雨数据集的研制。近年来,国内外众多学者对卫星降水产品的精度进行了评估,并且已经有研究主要针对 GPM 卫星降水数据产品在中国区域内的适用性进行了精度验证并给予了积极肯定的态度。如张茹等[10]采用6种评价卫星降水数据的统计指标,结合误差分解的方法评估了GPM卫星降水产品在大陆地区的降水反演精度,证明GPM卫星降水产品能够较好地反映中国大陆地区的降水情况;Chen等[11]收集了2015年到2018年间包括GPM在内的三种高分辨率卫星降水产品,并用雨量计观测数据分析和评估卫星降水产品在中国区域内的时空精度特征等,得到高分辨的卫星降水产品能够更精确地表达降水的空间特征,并且GPM能够更好地表达暴雨事件。IMERG是通过GPM卫星群获取微波、红外和雷达数据大量遥感信息,反演生成的降水卫星数据集,能够实现多源传感器之间优势互补[12,13]。IMERG作为GPM的代表产品,具有空间分辨率0.1°x0.1°、时间分辨率0.5h并且覆盖区域达到了60°N~60°S的特点。IMERG根据源数据处理过程不同,向用户提供了包括近实时Early-Run(Early)、Late-Run(Late)和滞时Final-Run(Final) 3种产品。其中IMERG_Final 产品包括纯卫星融合数据集(IMERG_Uncal)和通过全球降水气候中心(The Global Precipitation Climatology Centre,GPCC)站点资料进行校正后的数据集(IMERG_Cal)[12,14],近年来,众多国内外相关学者研究表明IMERG_final产品精度有显著的提升,其精度最接近实际降水数据,在水文模拟和气候变化等研究方面具有重要意义[13,15-17]。 为了验证利用GPM卫星降水数据产品生产的暴雨数据集的可靠性,我们利用本数据集中的暴雨雨量峰值提取等值线,发现其等值线分布与《中国暴雨统计参数图集》[18]中的年最大24h点雨量均值等值线图具有类似的空间分布。同时,利用本数据集中的暴雨量值通过暴雨发生时间,分别提取春、夏、秋、冬、四个季节的暴雨量信息,发现与Zhai等人[19]利用1951-2000年期间740个降雨观测站点生成的的日观测降水数据集,描述整个中国极端降水事件的变化特征,得到“中国极端降水事件整体上趋势变化不大,但是具有明显的区域性和季节性变化特征”的结论基本保持一致;在空间上分布上也与叶梦茜等[20]利用高密度降雨观测站点数据对比两种监测方法探讨极端降水事件特征的研究中,发现“极端降水事件发生最频繁的地区位于长江流域和华南地区”的结论相似。 Huang等[9]使用暴雨识别算法,通过TRMM卫星降水数据和降雨观测站点数据进行暴雨识别算法的评估。将TRMM数据与降雨量观测站点识别到的暴雨事件相比较,发现在大多数降雨观测站点中TRMM数据高估了暴雨事件的发生。这是由于两种数据源具有不确定性,对暴雨事件的识别产生影响,但是相比较降雨观测站点数据获取极端降水信息,使用暴雨识别算法提取卫星降水数据产品可以获取整个研究区域的极端降水数据,这对于降雨观测站点分布稀疏、不均匀的国家和地区通过卫星降水数据产品研究极端降水提供了帮助。 此外,利用中国区域内降雨观测站点2001年1月至2019年12月的日降水量观测数据作为参考对其进行进一步验证。使用暴雨量阈值对GPM卫星降水产品和气象站点观测数据进行暴雨的提取,将两种数据提取的到的暴雨信息进行比较,本文中利用GPM与站点观测数据提取到的暴雨次数差值以及暴雨量差值进行本数据集的质量评估。在2001年1月至2019年12月之间,如图3中的(a)和(b)所示,从整体上来看GPM高估了中国区域内暴雨发生的次数和暴雨量,在中国东南部地区较为显著。从图3(a)中可以看出,在2001年至2019年间,GPM提取的暴雨次数比气象观测站点数据提取的暴雨次数差值最多的为几十次,但是在中国西部以及北部地区GPM数据表现良好,在中国西部地区尤为明显。在图3(b)中,GPM提取到的暴雨量普遍比气象站点观测数据提取的暴雨量高,在中国新疆和西藏地区GPM暴雨量值表现良好。从整体看,GPM数据总体普遍高估了暴雨量,其高估区域无明显空间模式。 中国是暴雨事件发生比较频繁的国家之一,近年来极端降水事件频发,严重威胁人类的人身和财产安全以及危害生态环境。本数据集具有高空间分辨率、精度高、时间序列长,能提供整个研究区域的暴雨信息等特点,一定程度上弥补了传统气象观测雨量站观测站点空间分布不均匀造成的降雨数据缺失,能够帮助我们了解全国范围内暴雨的时空变化动态特征,并且为研究全国近十几年来的暴雨提供有价值的数据源。该数据集可用于暴雨时空特征的预测防灾减灾,为社会经济以及生态环境的发展提供助力,具有重要的理论与实际应用价值。 数据作者分工职责 柏荷(1996—),女,黑龙江省哈尔滨人,硕士研究生,研究方向为遥感和GIS应用,主要承担工作:研究思路与方案设计、数据集研制、精度验证、共享服务、论文撰写。 明義森(1997—),男,湖北省十堰人,硕士研究生,研究方向为遥感和GIS应用,主要承担工作:数据可视化、算法修改。 刘启航(1997—),男,陕西西安人,博士研究生,研究方向为遥感和GIS应用,主要承担工作:算法修改。 黄昌(1986—),男,江西宜春人,博士,副教授,研究方向为遥感和GIS应用,主要承担工作:算法研究,数据集产品评估。2 数据样本描述
3 数据质量控制和评估
3.1 质量控制
3.2 质量评估
4 数据价值