基于GPM数据和XGBoost算法的降雨侵蚀研究

2023-09-22 13:43
水利技术监督 2023年9期
关键词:栅格降水量降雨

杜 妍

(韶关市防洪管理中心,广东 韶关 512026)

土壤侵蚀是自然和人类活动对土地资源的破坏过程,导致了生态环境退化和农业生产受损等问题。持续性水土保持作为一项重要生态治理工程,对维系土地生态健康、水资源涵养、植被多样性有着不可忽视的作用[1-3]。在土壤侵蚀防治实践中,需要提取一系列生态因子,而降雨侵蚀力因子是其中关键参数之一,其表征了降雨能量对地表土体产生的击溅、剥离、运移能力。传统研究中对区域尺度降雨侵蚀力因子提取依赖于稀疏雨量站资料,并结合空间统计方法进行分析处理,其显著缺点是无法准确刻画降雨侵蚀力栅格面,尤其在站点稀疏地区的估算精度存在较大不确定性[4-5]。近年来随着卫星遥感和机器学习技术发展,通过卫星降水产品和非线性拟合方法,提出了一些快速准确提取降雨侵蚀力因子的方法,例如陈君等[3]利用GBDT和GPM数据生成了华南地区降雨侵蚀力产品,梁宇靖等[2]利用GLAS数据得到了中国降雨侵蚀力信息。基于前人研究基础上,基于GPM卫星降水数据和XGBoost算法,探索了一种新的提取降雨侵蚀力因子的方法,并利用地面雨量站数据验证了该方法的有效性。

1 材料与方法

1.1 研究区概况

广东地处我国大陆南端,南海北岸、珠江流域中下游,总面积17.8万km2,海岸线长3368km。区域属岭南丘陵、珠江三角洲平原和沿海平原地形,总体地貌崎岖破碎海拔为0~1902m。受西太平洋季风、印度洋季风、赤道低压和副热带高压影响,区域形成南亚热带湿润季风气候,具有全年温和、降水充沛特点,年平均气温18~24℃、降水量在1500~2000mm、无霜期约270~320d、积温5800~7500℃、日照时数1500~2100h。其中降雨量集中于4—9月,其他月份降水较少,常有台风、暴雨、干旱、洪水、雷电和霜冻等气象灾害影响。由于季风性降水集中性强、强度大,在降水月易形成强烈降雨侵蚀破坏力,对地表产生剧烈冲刷、剥离,因此该地水土流失现象极为普遍。如图1所示。

1.2 数据来源

选择准确而具有代表性的气象环境数据是提取大尺度降雨侵蚀力分布信息的重要基础。文中使用的数据主要有:①地面雨量站数据,从气象数据共享服务网(https://urs.earthdata.nasa.gov/)收集到研究区2020年85个气象站点日降水资料;②GPM卫星降水数据,从google earth engine开源平台获取“NASA/GPM_L3/IMERG_V06”产品,生成研究区GPM降水数据;Aster DEM数据,从地理空间数据云下载研究区DEM产品,用以提取高程、栅格点的经度、纬度等信息。

1.3 降雨侵蚀力计算方法

研究表明,水土流失领域著名专家Xie等[6]提出的降雨侵蚀力模型在我国具有良好应用性,故而利用该模型计算站点尺度降雨侵蚀力,公式如下:

(1)

式中,Rday、Pd—日降雨侵蚀力、日侵蚀性降雨量;α—物候参数,规定5—9月该参数取值为0.3937,10—4月取0.3101。

1.4 基于XGBoost算法空间尺度降雨侵蚀力提取流程

XGBoost(extreme gradient boosting)是一种集成学习算法,其在梯度提升基础上,通过迭代地添加弱学习器来提高模型性能[7-8]。即每次迭代中,XGBoost在上一次迭代的结果基础上拟合一个新的决策树,并通过梯度提升对之前预测结果的残差进行拟合,如图2所示。通过这种方式,XGBoost能够逐步提升模型的泛化能力,因此具有高效性、精度高、灵活性特点,可以适应不同应用场景。该算法具体数学过程原理,详见Chen等[7]人的研究。

图2 XGBoost算法结构图

借鉴陈君[3]和梁宇靖[2]等人相关经验,使用XGBoost算法提取广东省降雨侵蚀力因子简要流程如下:

(1)利用公式(1)计算并合成全部85站点2020年降雨侵蚀力。

(2)对原GPM卫星数据、DEM影像等进行重投影、去噪、重采样、空间统计等预处理,生成1km空间分辨率的环境变量栅格数据集;然后利用全部站点点位提取栅格变量集里各变量数值信息,进而构建样本集;随机选择其中70%的样本为建模集(n=59)、30%为验证集(n=25)。

(3)利用训练集结合Python3.9程序设计XGBoost回归算法,因变量为站点测量侵蚀力,自变量为GPM降水量、海拔、经度和纬度。为确保模型稳健性,利用Grid方法对XGBoost算法进行优化。

(4)基于训练好的XGBoost模型对栅格变量集进行空间预测,生成广东省1km空间分辨率的降雨侵蚀力因子栅格面。

(5)利用未参与模型训练的气象站点空间点位进行独立验证,即XGBoost算法预测得到的侵蚀力栅格面对应位置处侵蚀力值y′为参考值,以地面观测站计算的侵蚀力y为真值,计算决定系数(R2)、平均绝对误差(MAE)和均方根误差(RMSE),对区域降雨侵蚀力提取精度进行量化评估。

2 广东省降雨侵蚀力提取结果

2.1 广东省站点观测降雨侵蚀力统计特征

广东省2020年降水量最低值为1458.26mm,出现在德清站,最高值为增城站的2411.42mm,最大、最小相差953.16mm;进一步统计表明全部站点降水量平均值为1893.45mm,在全国属丰水区,其空间离差系数为16.52%,表明全境降水量存在明显不均性。见表1。另利用Xie模型得到的区域侵蚀力值介于5080.23~17958.04[MJ·mm/(hm2·h·a)]之间,全省平均值为9574.49[MJ·mm/(hm2·h·a)],其侵蚀强度局全国较高水平。经单样本Kolmogorov-Smirnov检验发现,上述序列变量渐进显著性sig值均<0.05,说明其不符合正态分布假设,在后续分析中须进行对数变换处理进而减少数据噪声[9]。

表1 广东省85个气象站点降水量和降雨侵蚀力统计特征

利用GIS空间可视化功能得到研究区2020年降雨量分布栅格面图3。研究区原GPM降水量数据的粗集产品揭示了降水量分布格局,可见该年度降水量中心位于珠三角及江门南部沿海地区,GPM数值可达2500mm;降水量低值出现在粤东和粤西丘陵地区,像素值在1700mm以下;总体呈现自珠三角核心区向周边减少的分布特征。

图3 广东省GPM降水量空间分布图

2.2 广东省降雨侵蚀力与GPM降水之间关系特征

GPM降水量产品作为研究区降雨侵蚀力因子提取的重要协变量之一,GPM降水数值大小及其分布特征对区域尺度侵蚀力特征有一定影响。经相关性分析发现图4,二者拟合关系形式为y=7.4689x-4737.6,其R2=0.48,P<0.01,说明卫星降水产品与近地表降雨侵蚀力之间存在密切关系,因此可作为区域降雨侵蚀力空间提取的有效协变量之一。

图4 广东省GPM降水量与站点降雨侵蚀力之间相关性散点图

2.3 广东省降雨侵蚀力提取结果分析

图5a直观呈现了广东省2020年降雨侵蚀力空间细致分布。与图5b对比可知,区域降雨侵蚀力与降水量具有高度一致性,这是由于前者是后者的函数。区域降雨侵蚀力分布范围介于5584~15318[MJ·mm/(hm2·h·a)]之间,空间平均值为10864[MJ·mm/(hm2·h·a)],离差系数为36.79%,意味着该省域降雨侵蚀力空间分异性显著。其中降雨侵蚀高值区聚集于珠三角中北部边缘、阳江和江门南部一带,局部可达12000[MJ·mm/(hm2·h·a)]以上;结合相关观测资料可知,2020年湿润季风在该局地停留时间长、降雨强度大,由于这些地区处于城建核心区和城乡结合带,强烈降雨侵蚀可能诱发崩岗、滑坡、泥石流等灾害。侵蚀力低值区出现在粤东、粤西和粤北边缘地区,在10000[MJ·mm/(hm2·h·a)]以下,主要由于这些地区当前降水量较小而强度低;然而这些地区长期处于低影响开发、良好植被覆盖状态,因此该地产生的侵蚀风险可忽略不计。

图5 广东省降雨侵蚀力和降水量空间分布图

2.4 降雨侵蚀力提取精度分析

研究区25个独立验证样本点的XGBoost模型预测降雨侵蚀力与地面站点侵蚀力之间拟合散点图,如图6所示。分析发现二者散点分布于1∶1直线两侧,其拟合关系形式为y=0.6304x+3894.4,经检验得到其P值<0.01,表明二者关系具有统计显著水平。利用公式(5-7)计算得到其R2为0.36,表明侵蚀力真值与预测值具有良好一致性;且MAE和RMSE依次为1451.6、2880.9[MJ·mm/(hm2·h·a)],意味着该降雨侵蚀力栅格面具有较低不确定性,因此图4所示栅格面可用作区域水土流失评价或侵蚀模数计算的替代品。需指出的是,尽管该提前精度在可接受范围内,但由于区域内侵蚀范围大,到其RMSE也较大,因此该侵蚀力栅格面仍有改进潜力。

图6 广东省降雨侵蚀力提取精度散点图

3 结论

(1)GPM降水与降雨侵蚀力之间存在密切线性关系,可成为空间尺度降雨侵蚀力研究新的有效数据源。

(2)XGBoost模型基于其非线性拟合优势,生成了精度可靠的侵蚀力栅格面,并具有精细水平表现力。

(3)该改进的方案可为广东省水土流失评价、生态建模等贡献新思路。本研究仍存在不足,例如GPM数据本身仍为粗糙产品(空间分辨率为10km),利用简单重采样方法将其转换为1km分辨率可能产生尺度转换误差。因此,后续研究应先将GPM数据进行降尺度处理,明确其尺度转换误差后用以辅助生成精细的降雨侵蚀力分布式信息。

猜你喜欢
栅格降水量降雨
基于邻域栅格筛选的点云边缘点提取方法*
降水量是怎么算出来的
黄台桥站多年降水量变化特征分析
1988—2017年呼和浩特市降水演变特征分析
沧州市2016年“7.19~7.22”与“8.24~8.25”降雨对比研究
基于小波变换的三江平原旬降水量主周期识别
红黏土降雨入渗的定量分析
不同剖面形状的栅格壁对栅格翼气动特性的影响
南方降雨不断主因厄尔尼诺
基于CVT排布的非周期栅格密度加权阵设计