基于GPM和GPR算法烟台降雨量空间分布预测研究

2023-08-29 02:25孟令远
河南水利与南水北调 2023年7期
关键词:烟台市降水量降水

孟令远

(烟台市水文中心,山东 烟台 264000)

1 概况

烟台位于中国东部山东省南部,地理坐标介于36°24'~38°23'N、119°18'~121°57'E,行政面积为13 756 km2,其中陆地、海域分别占56.36%、43.64%。属于暖温带半湿润季风气候,气候温和湿润,年平均气温为12.8 ℃,降水量为700 mm,年日照时数2 500-2 600 h,无霜期为200-240 d,积温4 000 ℃~4 200 ℃。受副热带季风与海陆位置影响,该地降水量分配不均衡,7-9 月降水约占70%以上,具有强度大、集中性特点,易受台风天气影响。该区属鲁南山地向黄海过渡带,海拔介于0~1 548 m,地势自北向东南倾斜,受地貌影响,区域河流短促而流速急,流域面积达1 714 km2,年均径流量为1.32亿m3。

2 研究方法

2.1 数据资料介绍

此研究使用的主要数据来源是研究区2019年GPM卫星降雨数据和地面雨量站资料,数据源自GPM 官网气象站点降雨量数据来源于中国气象局(China Meteorological Administration,CMA)的气象科学数据中心(http://data.cma.cn/),共收集到研究区19个站点资料。

2.2 GPR回归算法

高斯过程回归(GPR)是一种基于贝叶斯理论的空间插方法,其基本思想是将空间数据看作多元高斯分布,通过分析样本数据的各自位置之间的空间相似性,建立出空间位置与对应变量之间的协方差函数,从而根据观测数据和协方差函数,计算未知位置上预测值和方差。对于变量集合X={x1,x2…xn},设其满足高斯(GP)分布,则有:

模型y=f(x)+δ2,δ2=N(0,),y为因变量,δ2为协方差,对于测试点x*,对应的y*的后验分布:

式中:υ*、∑*、In分别为均值、总方差、n维矩阵。经研究表明,平方指数核函数能够较好促进GPR模型收敛,其形式如下:

2.3 降水量空间预测精度评价

利用气象站点点位提取预测得到的降水栅格面对应位置处降水量y',以地面观测值为真值y,计算二者之间相对误差,进而评价区域降水量空间预测精度,计算公式如下:

式中:y、y'分别是GPR预测降水量、地面降水量值,i=1,2…n为样本数量。R2、MAE和RMSE分别为决定系数、平均绝对误差、均方根误差。

3 烟台市降水量空间预测结果分析

3.1 GPM和地面降水量空间统计分析

研究区GPM卫星降水资料见图1,图中10 km×10 km空间分辨率的GPM 像素值初步描述了区域降水量分布特征,其最大、最小值分别为802 mm、1 054 mm,空间平均值为894 mm,覆盖区域总像素数为137 个。但其栅格面呈现明显机械性特征,邻域之间降水量存在不平滑渐变。据烟台19 个气象站点2019年降水量统计特征,其统计最大值出现在栖霞区南部,达1 012 mm,最小值为莱州市西部的795 mm,全部站点平均值为867 mm,离差系数达19.49%。并且这些样点数据通过了0.05水平整体分布检验。

图1 研究区GPM降水量特征图

为评估所选的环境变量对区域降水量空间分布预测的有效性,利用Pearson 相关性系数分析了环境变量与地面观测降水量之间线性关系。依图2可见,除坡向、坡度外,降水量与其他环境因子之间呈现显著线性关系,其中与经度、纬度和经纬度乘积的相关性系数依次达到-0.49、-0.28、-0.49,表明区域降水量呈现一定程度自西向东递增、自南向北减少、自西南向西北递减的特征,这反映了该地降水分布受海陆位置影响。与DEM呈负的显著性关系,相关系数为-0.41,说明海拔高程控制着降水量在局域尺度上分布。而GPM降水量值与地面观测降水量之间呈极显著相关性(P<0.05),相关系数为0.51,表明GPM 卫星降水量产品在该地具有良好替代性,因此可作为新的有效环境变量预测区域降水量分布。

图2 环境变量与地面观测降水量之间相关性图

3.2 GPR模型建立

GPR模型有两个超参数:scale,控制高斯核函数相关性,决定了样本之间相似度;degree决定了高斯核函数在每个样本点的方差,即噪声水平。这些超参数的组合配置直接影响了模型拟合及预测能力。为避免过拟合或欠拟合,采用grid方法自动化寻优(图3),可见当scale 和degree 参数均取0.1 时,模型RMSE最小,此时具有良好拟合能力。

图3 GPR模型超参数优化过程图

在上述基础预测了烟台市降水量栅格面,并利用站点降水量进行独立验证。可见,降水量预测值与实际值之间具有良好相关性,二者随机分布于1:1 直线两侧,总体离散度低。具体来看,模型R2达0.71,MAE和RMSE仅为32.81 mm、39.99 mm,表明GPR算法利用协变量较好拟合了区域降水量空间分布规律,该预测模型精度拟合能力好,预测精度可靠。

3.3 烟台市降水量空间预测结果

烟台市2019 年降水量空间分布格局,与图1 中GPM 卫星降水量值基本一致。可见,空降尺度上降水量分布范围介于728~963 mm之间,空间平均值为823 mm,标准差为267 mm,离差系数仅有32.44%,表明局域降水量分布存在明显异质性。具体来看,东南海岸线地区降水量偏少反而在海岸线内侧产生降水中心。这是由于海洋对降水蒸发作用,使得海滨风向上空空气中蒸汽含量大,容易形成云团而产生降水,但易缺少地表粗糙度对运移迟滞影响,进而使降水中心偏离海岸。而在内陆的烟台西部地区降水量,主要是距海洋水汽较远、受西伯利亚高压控制,加之局部山地阻挡影响,导致空气湿度较小,降水量相对较少。需指出的是,该分布图并未出现传统降水量插值过程中出现机械性条带、“牛眼”特征等,在刻画降水量分布渐变特征方面具有良好平滑性,因而更符合区域实际。

4 结论

此研究对烟台市2019 年降水量数据进行空间预测研究,分析了预测精度,主要结论如下:①烟台市2019年GPM年降水数据与地面站点观测数据具有良好一致性,整体相关系数达0.51,尽管其空间分辨率粗糙,但初步揭示了区域降水量分布实际特征。②基于GPR算法建立的非线性模型可较好拟合降水量与地形、海陆位置因子之间关系,进而帮助预测区域其他位置上降水量分布,预测结果展示了平滑分布特征,总体可信度较高。③GPR模型的精度R2达0.71,反映了该算法较好应用能力。但文中仍存在不足,首先,文中仅有19 个站点资料,这在建模时可能由于样本数据不足导致模型训练不充分而产生不确定性;其次,研究区下垫面环境和风向强度复杂,在构建降水量预测模型时未纳入这些因子,进而降低了预测精度。后续考虑引入其他对区域降水敏感的环境协变量,进而建立更复杂、系统性的预测模型。

猜你喜欢
烟台市降水量降水
黑龙江省玉米生长季自然降水与有效降水对比分析
《灌木丛篁图》
烟台市苹果种植存在的问题及建议
博物馆在公共文化教育中的探索——以烟台市博物馆为例
降水量是怎么算出来的
黄台桥站多年降水量变化特征分析
为什么南极降水很少却有很厚的冰层?
1988—2017年呼和浩特市降水演变特征分析
对烟台市旅游业发展的探析与思考
降水现象仪模拟软件设计与实现