董甲平,冶运涛,顾晶晶,曹 引,赵红莉,蒋云钟
(1.兰州交通大学测绘与地理信息学院,甘肃 兰州 730070;2.地理国情监测技术应用国家地方联合工程研究中心,甘肃 兰州 730070;3.甘肃省地理国情监测工程实验室,甘肃 兰州 730070;4.中国水利水电科学研究院水资源研究所,北京 100038; 5.水利部数字孪生流域重点实验室,北京 100038)
高质量的降水数据对于水资源开发利用和管理有着重要的价值[1],而且能够为防洪、抗旱等自然灾害的应急决策提供科学的数据支撑[2]。目前获取降水数据的手段主要有气象站点、雷达观测和卫星遥感[3-4]等。受获取手段的限制,卫星遥感降水数据分辨率过于粗糙,无法满足精细水文水资源研究的需要,卫星遥感降水降尺度成为解决该问题的重要手段[5]。卫星遥感降水降尺度主要分为统计降尺度和动力降尺度两种。随着近几年机器学习和深度学习的发展,通过构建环境因子与降水数据关系的统计降尺度方法成为研究热点[6]。
统计降尺度算法依托降水与其他环境因子的关系[7]获取高空间分辨率的降水数据。因此环境因子的选取成为决定降尺度结果优劣的前提条件。国内外不少学者使用不同环境因子对统计降水降尺度开展了研究。如Jia等[8]基于多元线性回归模型,使用DEM和NDVI因子在柴达木盆地进行了降水降尺度研究;Chen等[9]在扬子江流域使用地理加权回归,对比了将NDVI、DEM和EVI、DEM等环境因子分别作为参数的降尺度模型的表现;Xie等[10]在内蒙古地区使用NDVI、高程、坡度、坡向、经度和纬度等环境因子,就指数回归、多元线性回归、广义线性回归和地理加权回归算法展开研究;宁珊等[11]结合相对湿度、经度、纬度、高程、坡向、坡度和植被因子,构建了新疆地区的TRMM降水量偏最小二乘法降尺度模型;范田亿等[12]使用NDVI、DEM、坡度、坡向、经度和纬度等环境因子建立了湘江流域地理加权回归降尺度模型。从已有研究来看,大部分研究基于简单的相关系数分析法选取环境因子[13],或直接使用前人的研究成果。但是不同的时间尺度及不同的流域范围,影响因子均有可能发生变化,所以对降水降尺度环境因子的影响进行定量分析十分必要。
地理探测器自2010年提出之后,已经在土地利用、公共健康、区域规划[14]、地质、气象、生态和遥感等众多领域得到了广泛的应用[15]。地理探测器能够探测空间分异性,并揭示其背后的驱动力,成为探究全局驱动因子、局域驱动因子及不同时间尺度、空间尺度驱动因子变化的强力工具。与其他分析方法相比,地理探测器具有以下优势[15]:①既可以探测数值型数据,也可以探测定性数据;②可以判断两个自变量是否存在交互作用,以及交互作用的强弱、方向、线性还是非线性;③地理探测器Q值具有明确的物理含义,能够客观地表明自变量解释了Q×100%的因变量。虽然地理探测器具有强大的因子探测能力,但是尚未有学者将地理探测器用于统计降水降尺度环境因子分析。
本文以滦河流域为研究对象,使用DEM数据和2018年卫星遥感产品提取经度、纬度、高程、NDVI、坡度和坡向6项环境因子,利用地理探测器定量分析了IMERG卫星降水空间分布的影响因子、多因子的交互作用及多因子的差异性。
滦河流域(115°30′E~118°45′E,39°10′N~42°40′N)位于辽宁省、河北省和内蒙古自治区的交界地带,流域面积44750km2,地形差异较大,地形总趋势由西北向东南倾斜。滦河上游为坝上高原,海拔高度为1300~1400m;中部为燕山山地,地形复杂,海拔高度1000~1800m;东南部主要为平原,海拔在1000m以下(图1)。滦河流域位于半湿润半干旱过渡带,气候复杂多变,年平均气温为1~11℃,多年平均降水量400~800mm。滦河流域是我国北方重要的生态屏障区,其降水的时空分布差异非常明显[16],具有典型性和代表性。作为引滦入津工程的重要水源地[17],对其进行水资源管理和保护具有重要的意义。
图1 滦河流域范围及高程
图2为2018年滦河流域的年降水量分布情况,滦河流域降水由东南向西北递减[18],呈现明显的条带状空间分布特征。降水主要集中在东南部的平原地带,年降水量超过650mm,向西北坝上高原方向降水量逐渐减少,坝上高原区降水量小于450mm。
图2 降水空间分布
1.2.1 环境因子
根据Jia等[8-12]研究结果,选择NDVI、高程、坡度、坡向、经度和纬度[19]作为本文的环境因子进行因子探测、交互探测和生态探测。
1.2.2 数据来源
使用的数据包括空间分辨率为0.1°的IMERG(integrated multi-satellite retrievals for global precipitation measurement)卫星降水产品以及统一分辨率为0.1°的NDVI、高程、坡度、坡向、经度和纬度等环境因子。其中IMERG、NDVI为下载的卫星产品;在90 m分辨率的DEM下通过ArcGIS提取坡度、坡向和高程数据,并将坡度、坡向和高程数据重采样至0.1°分辨率与其他数据相匹配;提取0.1°高程数据的中心经纬度作为经纬度信息。卫星产品来源见表1。
表1 数据来源及信息
利用地理探测器定量分析影响降水空间分布的环境因子,其核心思想是[15]:若NDVI、高程、坡度、坡向、经度、纬度中某个环境因子对降水空间分布有重要的影响,则其与降水空间分布应该具有相似性。地理探测器主要包括因子探测、交互探测、生态探测3种类型。
2.1.1 因子探测
用于分析环境因子对降水空间分布的解释力,表达式为
(1)
结合其他降水降尺度环境因子的选择及地理探测器在其他领域设置的阈值[20],最终选择影响力大于10%作为主要影响因子,能够显著影响降水的空间分布;影响力大于1%且小于10%作为次要影响因子,能够与其他因子交互对降水空间分布产生显著的影响;影响力小于1%的环境因子对降水空间分布无直接影响,且与其他因子的交互不会起太大的作用。
2.1.2 交互探测
用于分析环境因子的交互作用对降水空间分布的影响。通过比较自变量X1和X2的Q(X1)和Q(X2)及其叠加变量X1∩X2的Q(X1∩X2),分析其交互作用。交互类型包括非线性减弱、单因子非线性减弱、双因子增强、独立和非线性增强5种类型[15]。
2.1.3 生态探测
用以比较不同环境因子对降水空间分布的影响是否有显著的差异。用F统计量来衡量,正则假设H0为:X1和X2的层内方差之和相等,如果在α=0.05[15]的显著性水平上拒绝H0,则表明2个自变量对因变量空间分布的影响存在显著差异。
利用地理探测器分析环境因子对降水空间分布影响的重要环节是讨论可塑性面积单元问题(modifiable areal unit problem,MAUP)。MAUP包括尺度效应和分区效应两方面[21],前者讨论空间统计格网大小对地理探测器模型的影响,后者讨论自变量离散方法及分类数量对地理探测器模型的影响。
为保证卫星降水数据的分辨率,空间统计格网的大小应与IMERG产品的分辨率保持一致,以避免尺度效应的影响。针对分区效应,选择等距分类(equal)、自然断点分类(natural)、分位数分类(quantile)、几何分类(geometrical)和标准差分类(sd)5种离散方法,并将自变量分为3~9类分别计算Q值[22],选择Q值最大的组合作为离散方法和分类数量的最佳组合。
图3以年尺度为例展示了离散方法与分类数量组合选取过程。图4为使用最佳组合得到的自变量分区,其中红色竖直线为不同分区的分隔线。表2为年尺度最佳组合的结果。
表2 分区效应最优组合
图3 离散方法与分类数组合
表3统计了年、季尺度各环境因子对降水空间分布影响力大小。年尺度下,纬度、高程、经度和NDVI的影响力超过10%,为主要因素,其中纬度影响最大。坡度、坡向的影响力超过1%但小于10%,为次要因素。环境因子的影响力均超过1%,说明该6项因子均对降水空间分布有直接影响。季尺度下,春季降水主要受纬度、经度、高程和NDVI的影响;夏季降水主要受纬度、高程、经度和NDVI的影响;秋季降水主要受经度、纬度、高程、NDVI和坡向的影响;冬季降水主要受经度、纬度和高程的影响。对比4个季度的环境因子Q值,Q值前三的环境因子均为纬度、经度和高程;不同季节环境因子的Q值有所差别,春季、夏季、冬季降水受纬度的影响最大,Q值均超过0.8,其中春冬两季第二影响因子为经度,夏季第二影响因子为高程,秋季最大影响因子为经度且Q值超过0.53。
表3 年、季尺度自变量因子探测
表4为月尺度下各环境因子对降水空间分布的影响力大小。不同月各环境因子的Q值虽有所变化,但除6月外前3个贡献因子仍然是纬度、经度、高程。12个月中,1月、3月、8月、11月和12月纬度、经度和DEM的影响力均超过25%,为主要因素,NDVI、坡度和坡向影响力超过1%但低于10%,为次要因素;其他月主要因素为经度、纬度、DEM和NDVI,次要因素为坡度和坡向。12月中,有7月纬度为第一贡献因子,分别是1月、2月、4月、7月、8月、10月、12月;其余5个月第一贡献因子为经度;只有1月、2月第一贡献因子Q值小于0.5,其余月第一贡献因子的Q值均超过0.63,其中Q值超过0.8的有6个月,4月和10月的Q值均达0.92。
表4 月尺度自变量因子探测
表5为旬尺度下各环境因子对降水空间分布的影响力大小。除1月中下旬、2月中旬和11月中旬,其他32旬前3个贡献因子均为经度、纬度和高程。1月中下旬、2月中旬和11月中旬的因子影响力偏低,均低于30%。分析其主要原因,秋冬季北方降水更易受冷空气的影响,高程对降水空间分布的影响减弱,降水与NDVI的关系增强。1月中旬环境因子对降水空间分布的影响力最低,所有因子的影响力均低于10%,为次要因子,其次是9月上旬和11月下旬,只有一个主要因子,分别为经度和纬度,其余皆为次要因子。
整体来看,在年、季、月和旬尺度上,经度、纬度和高程都起到了主导降水空间分布的作用,结合图2可知,滦河流域降水空间分布呈现由东南向西北递减的趋势,这使得经度、纬度和降水空间分布出现较高的相似性,使得Q值相较于其他因子更高。由图1可知,滦河流域由东南部平原到中部山地再到西北部坝上高原,高程逐渐增加,降水逐渐减少,造成高程的离散化结果与降水的空间分布具有明显的相似性,也使高程的Q值较高。随着春夏季节植被的增加,蒸腾作用的增强,NDVI对降水的影响力也随之增大。坡度和坡向的影响力均小于10%,单因子对降水的影响并不明显。
降水空间分布受环境因子的综合影响。环境因子的交互可能会提升或减弱单个因子的影响力。图5为年、季尺度环境因子的交互结果。由图5(a)可以发现年尺度下环境因子两两交互均起到了增强作用。其中经度和纬度交互的Q值达到了0.97。图5(b)~(e)为季尺度环境因子的交互结果,季尺度下所有环境因子的交互作用均为增强,相较于单个环境因子,交互作用的Q值均有较大幅度的提升。Q最大值均为经度-纬度的交互,其中春季、夏季、秋季、冬季的Q最大值分别为0.97、0.97、0.87和0.93。4个季度对比发现,秋季受限于单个环境因子的影响力,交互作用下Q值偏低。
图5 年、季尺度自变量交互探测
表6为12个月环境因子交互结果,只有2月坡度与DEM的交互结果为单因子非线性减弱,其他月以及其他因子的交互结果均为增强。与其他时间尺度相同,交互结果的最大Q值均为经度和纬度的交互结果。其中4、5、7、8、10、12月的Q最大值超过了0.95。其他月的Q最大值也均超过了0.6,说明因子之间的交互结果能够更好地影响降水的分布特征。
表6 月尺度自变量交互作用探测
表7为2018年36旬环境因子交互作用的结果,其中ND表示NDVI,LA代表纬度,LO代表经度,DE代表高程,SL代表坡度,AS代表坡向。只有7月上旬NDVI与经度的交互结果为单因子非线性减弱,其余环境因子的交互结果均为增强。其中,1月上旬和2月上旬最大交互结果为纬度与坡向的交互,其他旬最大交互结果为纬度与经度的交互。且最大交互结果的影响力均超过20%,说明在旬尺度下,交互作用能够更好地反映降水的空间分布。
表7 旬尺度自变量交互作用探测
由图5、表6、表7可知,年、季、月和旬尺度环境因子最优交互结果几乎全为经度-纬度,并且交互作用均为增强。主要因为降水量由东南向西北递减,经度-纬度的交互作用更能体现降水的这种分布情况。同样其他因子与高程的交互起到了增强的效果,且因子探测中表现不佳的单因子与其他因子的交互作用也起到了不凡的增强效果。
生态探测用于探测年尺度、季尺度、月尺度和旬尺度下,不同组合的两个环境因子对降水分布的影响是否存在显著性差异。
在年尺度下,所有环境因子对降水分布的影响均存在显著性差异。在季尺度下,春季经度-高程、坡度-坡向,夏季经度-高程,冬季NDVI-坡向、经度-高程不存在显著性差异。而秋季所有因子均存在显著性差异。
月尺度下,由12月与6个因子两两组合所形成的180个结果中存在10个差异不显著的结果,占全部结果的6%。12月中1月、4月、5月、7月和12月经度-高程对降水分布的影响无显著性差异。另外1月坡度-坡向、2月NDVI-经度、5月纬度-经度和纬度-高程、12月NDVI-坡向对降水分布的影响无显著性差异。其余结果均造成了显著性差异。
旬尺度下,差异不显著结果有36个占总结果的7%。包含了NDVI-经度、NDVI-高程、NDVI-坡度、NDVI-坡向、纬度-经度、纬度-高程、经度-高程、经度-坡向、坡度-坡向。其中有10旬的经度-高程对降水分布的影响无显著性差异。在年、季、月和旬尺度,整体上不同因子对降水分布影响有显著的差异,因子之间差异不显著结果占比小于7%。
a.不同时间尺度下降水空间分布的主导因子有所差异,年尺度以及春季、夏季、冬季的主导因子为纬度,且影响力超过80%,秋季的主导因子为经度,影响力为53%。月尺度的3月、5月、6月、9月和11月主导因子为经度,其余月为纬度,且影响力均超过44%。旬尺度下,1月中旬主导因子为坡度,2月上旬主导因子为高程,其他旬主导因子均为经度和纬度,且平均影响力超过51%。
b.在不同时间尺度环境因子的交互探测中,只有2月高程-坡度及7月上旬NDVI-经度的交互作用为单因子非线性减弱,其余交互作用均起到了增强的效果。交互结果的影响力均超过10%,与单因子影响力相比有较大幅度的提升。
c.在年、季和月尺度下,纬度-经度的交互作用影响力最大,超过60%。旬尺度下,只有1月上旬和2月上旬最大Q值为纬度-坡向的交互作用,其余均为经度-纬度的交互作用。
d.生态探测结果表明,整体上不同环境因子对降水空间分布的影响差异显著。其中有显著性差异的结果在所有结果中占比超过90%。
e.影响降水空间分布的环境因子在年、季、月尺度有较大变化。从整体上看,经度、纬度和高程对降水空间分布的影响显著,这也符合季风气候区降水量由东南向西北递减的客观规律。交互探测发现,原本影响力较小的NDVI、坡度和坡向,在与其他因子交互之后起到了不俗的增强效果。生态探测发现,不同环境因子对降水空间分布影响差异与时间尺度有密切联系,这为统计降水降尺度研究提供了基础。6个环境因子在年尺度和秋季的单因子影响力均超过6%,且交互作用的影响力超过22%,对降水空间分布的影响差异显著,可以都被选择进行降尺度模型构建。对春冬季来说,单因子影响力较弱且与其他因子差异不显著的环境因子可以适当删除,这样在不影响计算精度的情况下能够提升模型的计算效率。后续还应增加更多的潜在环境因子[23-24],并增加监督分类方法使MAUP问题更加严密完整。