陈世雪,玉素甫江·如素力,2*
(1.新疆师范大学地理科学与旅游学院,乌鲁木齐 830054;2.新疆干旱区环境与资源重点实验室,乌鲁木齐 830054)
【研究意义】水资源是干旱区人类生存、生态环境保护、经济可持续发展的物理基础与瓶颈,其有效利用已成为国际社会关注的热点问题[1-3]。随着气候变化和人类活动的加剧,深刻影响水循环过程,导致水资源的时空变化,因此,正确模拟水循环的重要组成部分—地表径流的变化,对流域水资源的合理、有效利用具有重要意义[4]。且准确测量降水时空分布有助于掌握水文水分状况,对水资源管理、干旱洪水灾害预测以及水文生态模拟具有重要意义。
【研究进展】我国西北地区下垫面及其地理分异规律复杂,气象站点空间分布不均、站点稀少,气象要素观测资料的缺乏制约了人类对该地区水资源过程的认识和理解,为数据缺乏地区进行水文气象研究寻找高精度、高时空分辨率的气象数据至关重要。基于卫星和再分析的气象数据成为数据缺乏地区的重要数据来源,再分析数据集采用数据同化技术对各种来源的观测资料进行质量控制和同化处理[5],不仅包含的要素多、范围广,而且具有长时间序列已经成为水文气象研究的重要数据源。目前,全球主要的再分析数据集包括:欧洲中期天气预报中心的ERA 系列[6]、美国NASA 的MERRA 数据集[7]、美国国家环境预报中心的NCEP 系列[8]、日本气象中心的JRA 系列[9]等。中国大气同化驱动数据集CMADS(The China Meteorological Assimilation Driving Datasets for the SWAT model)引入中国气象局大气同化系统CLDAS(CMALand Data Assimilation System)同化技术,利用数据循环嵌套、模式推算等多种科学手段而建立,具有多来源、多尺度和多分辨率的特点[10],在数据缺乏地区具有很大的应用潜力。SWAT 分布式水文模型由于其具有较强的物理机制,在流域地表径流评估和地下水评价等方面得到广泛应用[11-13]。目前,对多源气象数据精度评估主要以地面气象站数据为基准采用数学统计方法进行验证[14-16],已有研究人员利用分布式水文模型融合验证,进一步验证多源气象数据的精度及适用性[17-19]。近年来,CMADS 数据集在东亚地区得到广泛应用,在马来西亚穆达河流域[20]、越南Cau 河流域[21]、朝鲜半岛汉江流域[22]精度评估和水文模拟研究中取得满意结果。目前对CMADS 数据集的评估国内主要集中在中国东北[10,23]、中国南部[24-26]。西北干旱地区在玛纳斯河[27]、黑河[28]、精博河[29]等流域有相关的研究。【切入点】现有研究对土地面积辽阔、地形地貌复杂、地面气象观测站点稀少、区域气候差异较大的我国西部地区的CMADS 数据集的精度及适用性评估较少,而且对再分析数据在干旱地区的适应性国内外学者有不同的看法。【拟解决的关键问题】故本文选择干旱区内陆河流开都河上游作为研究区,评估CMADS 数据集的精度及其在流域水文模拟中的适用性,从而验证CMADS 数据在大气观测数据缺乏地区的可用性及优势,对该区域的生态环境演变、水文与水资源研究具有重要意义。研究结果可验证CMADS 在开都河上游流域的精度及在径流模拟中的适用性,为站点稀少的内陆干旱区开展水文研究寻找替代数据提供科学参考。
开都河是我国西北地区典型的干旱区内陆河流,源起天山中部,流经大、小尤尔都斯盆地后穿过峡谷,经焉耆盆地自大河口注入博斯腾湖,流域内包括和静、焉耆、和硕、博湖4 县以及8 个团场[30]。开都河是焉耆盆地和孔雀河流域社会经济发展的重要资源,也是塔里木河下游的重要补给水源,对塔河生态恢复和重建起了关键作用[31]。大山口(85°44′E,42°13′N)是开都河流域的唯一出山口,将开都河流域分为上游山区和下游平原区,本文以开都河上游为研究区域,地处82°56′—86°10′E,42°12′—43°20′N 之间,流域集水面积18586 km2。研究区示意图如图1所示,开都河上游气象站点稀少,仅巴音布鲁克1 个气象站点,限制了该地区的水文气象研究。开都河上游位于新疆天山中段的山间盆地,地形复杂,主要由周围山区围绕的小尤尔都斯盆地、大尤尔都斯盆地和峡谷组成,平均高程2 998 m。地势西北高,东南低,由西北向东南倾斜。开都河是典型的干旱区内陆河,由于距海远和山脉的阻挡,研究区降水少蒸发大,流域内多年年均降水量165 mm,多年平均气温5~8 ℃。降水的时空异质性导致流域内降水时空分布不均,时间上看降水主要集中在6—9月,空间上看降水西多东少,呈自东向西递增趋势。
图1 研究区示意图Fig.1 Schematic diagram of study area
1.2.1 DEM 数据
数字高程数据取自地理空间数据云(http://www.gscloud.cn/)SRTM(30 m)DEM,SWAT模型可根据DEM 数据划分子流域,生成数字河网。为保证模型输入数据的一致性,将DEM、土地利用、土壤数据统一投影为:WGS_1984_UTM_Zone_45N,数据为GIRD 格式。
1.2.2 土地利用数据
土地利用数据来自于中国多时期土地利用土地覆被遥感监测数据集(CNLUCC),空间分辨率30 m,该数据集包括6 个一级分类,25 个二级分类,结合SWAT 模型土地利用分类标准将研究区土地重分类为6 类(图2)。其中主要土地利用类型草地占总面积的74.73%,其次未利用土地占17.42%、湿地占5.38%、水域占1.99%、林地占0.47%、建设用地占0.01%。
图2 开都河上游土地利用类型分布Fig.2 Distribution of land use types in the upper reaches of the Kaidu River
1.2.3 土壤数据
土壤数据自世界土壤数据库HWSD 土壤数据库下载,不需要进行粒径转换。根据土壤分组将土壤数据重分类为:简育灰色土、钙积栗钙土、黏化钙积土、石化石膏土、松软潜育土、永冻薄层土、松软薄层土、饱和薄层土、冰川9 种类型(图3)。
图3 开都河上游土壤类型分布Fig.3 Distribution of soil types in the upper reaches of the Kaidu River
1.2.4 气象与水文数据
本研究地面实测气象输入数据由研究区及周围气象站点组成,利用天气发生器弥补缺失数据,输入SWAT 模型进行径流模拟。地面气象数据包括:逐日降水量、日最高/最低气温、平均相对湿度、平均风速、日照时间,辐射数据由日照时间计算得到。本文使用开都河出山口大山口水文站1990—2018年逐月径流数据用于模型率定与验证。
1.2.5 CMADS 数据集
由于研究区内地面气象观测站稀少,制约该地区进行水文气象研究。本文采用高分辨率CMADS1.1数据集(时间分辨率:逐日;空间分辨率:1/4°;时间尺度:2008—2018年)驱动SWAT 模型进行水文模拟。该数据集按照SWAT 模型输入驱动数据格式进行了格式整理与修正,使SWAT 模型可直接使用该数据集而不需要任何格式转换[32]。SWAT 模型在开都河上游自动读取CMADS 数据集35 个格网点,相比传统气象站点具有数量优势。传统气象站还存在部分数据缺测现象,构建SWAT 模型需要调用天气发生器弥补缺测数据进行水文模拟,CMADS 数据集不存在缺测数据,这是该数据集相较传统气象站的另一个优点。CMADS 数据集提供了SWAT 模型运行所需的5 种气象数据(降水量、气温、相对湿度、太阳辐射和风速),给水文模拟研究提供了便利。因此,评估CMADS 数据精度及其在水文模拟中的适用性对数据缺乏地区开展水文研究意义重大。
1.3.1 SWAT 模型
SWAT(Soil and water assessment tool)分布式水文模型是由美国农业部开发的基于长时间序列的大尺度分布式水文模型。基于DEM 数据,生成流域边界和33 个子流域,进一步划分为具有均匀土地利用、土壤和坡度的水文响应单元(HRU)247 个,在HRU尺度上进行水文模拟。设置2008—2009年为预热期,2010—2014年为率定期,2015—2017 为验证期。
对模型率定有2 种方法,一是利用历史观测数据率定出最佳参数,将多源降水数据输入率定好的模型进行模拟;二是用不同参数分别率定不同气象数据驱动的模型[33]。由于水文模型校准过程中存在参数不确定性,无法保证用实测数据率定得到的参数适合移植到再分析数据驱动的模型中,因此,本文选择对地面气象数据和CMADS 驱动水文模型分别率定,利用SWAT-cup 软件的SUFI-2 算法,选择26 个与径流有关的参数,基于参数敏感性水平t值和参数显著性水平p值筛选保留13 个敏感参数,经过多次迭代调整参数范围,寻找参数最佳值。选取线性回归方程决定系数R2、纳什效率系数NSE作为评价指标。NSE计算式为:
式中:n为模拟时间数;QO为径流观测值;QS为径流模拟值;为观测降水数据平均值。当R2>0.6,NSE>0.5 时,表示结果可接受。
1.3.2 精度评估指标
气温和降水是影响水文模型模拟精度的重要输入数据,为了评估CMADS 数据集在开都河上游的精度,本文选择距巴音布鲁克气象站最近格网点的逐日降水、日最高/最低气温数据评估该数据集的精度[34]。选择皮尔逊相关系数R、平均绝对误差MAE、均方根误差RMSE等3 个统计指标。
利用3 个分类评价指标反映多源降水数据对日降水的探测能力,包括探测率(Probability of Detection,POD)、误报率(FalseAlarm Ratio,FAR)和临界成功指数(Critical Success Index,CSI)3 种指标,并将日降水量0.1 mm/d 作为降水事件的阈值,具体计算式为:
式中:H为CMADS 数据集正确探测到降水事件的次数;M为CMADS 未探测到而实际发生降水的次数;F为CMADS 探测到而实际没有发生降水事件的次数。
降水探测率POD表示CMADS 对降水事件是否发生的探测命中率,POD值越高,降水产品对降水事件的漏报率越低,对日降水的探测能力越强;误报率FAR指对降水产品探测降水事件错误估计的概率,FAR值越低表示对降水事件的估计越准确;CSI关键成功指数反映了降水产品检测降水事件的能力,该指数能够很好地区分不同的降水事件。POD、FAR和CSI取值从0 到1,POD和CSI越大,FAR越小,表明CMADS 对降水的探测能力越好。
2.1.1 日尺度精度评价
对比分析2008年1月—2017年12月开都河上游CMADS 和传统气象站的降水量、最高/最低气温在日尺度的探测能力(图4)。从图4可以看出,CMADS 数据在温度估计方面有较好表现,日最高/最低气温的相关系数分别为0.95 和0.92。对日尺度降水探测表现较差,CMADS 逐日降水数据与实测降水数据的Pearson 相关系数为0.59,主要是由于降水的空间异质性更加显著,更难准确预测。在误差表现上,降水的表现优于气温。总的来说,CMADS 数据集和地面观测数据较吻合,表明CMADS 数据集在开都河上游水文气象研究中具有较好的潜力。
图4 CMADS数据集日降水量、日最高温度和日最低温度散点图Fig.4 Scatter plots of daily precipitation,daily maximum temperature and daily minimum temperature for the CMADS dataset
表1是CMADS 降水量数据在日尺度降水量探测中分类评价指标评估结果。从表1可以看出,CMADS捕捉实际降水事件的能力表现较好,探测率POD=0.69,临界成功指数CSI=0.43,但同时出现了较大的空报率FAR=0.45,总的来说,CMADS 对日降水量的探测命中率较高但同时存在较多空报的情况。
表1 CMADS日降水量分类评价指标评估结果Table 1 Evaluation results of CMADS daily precipitation classification evaluation index
2.1.2 月尺度精度评价
表2是CMADS 数据集对降水量、气温的月尺度探测水平。分析发现,CMADS 数据集在月尺度降水探测中相关性的表现显著优于日尺度相关性,月尺度气温的表现能力也较日尺度有所改善,但同时月尺度降水量和气温探测也出现了更大的平均绝对误差和均方根误差。因此CMADS 数据集对月尺度气温和降水量的探测总体比较符合实际气象数据,但是存在一定的偏差。
表2 CMADS 数据集和实测降水量、气温月尺度统计指标Table 2 CMADSdataset and monthly scale statistical indicators of measured precipitation and air temperature
2.1.3 季节尺度精度评价
开都河流域是典型的干旱区内陆河,降水季节分配不均。按照春(3—5月)、夏(6—8月)、秋(9—11月)、冬(12—次年2月)4 个季节进行统计分析,进一步评估CMADS 数据集在开都河上游季节尺度的表现。图5是开都河上游季节尺度降水量和气温的探测精度评估结果。从图5可以看出,CMADS降水量数据在季节尺度误差较小;相关性在夏季表现最好,冬季较差,可能是CMADS 数据集对积雪的探测能力较差。气温在冬季相关性低于春、夏、秋季,同时冬季出现最大误差,说明CMADS 对冬季气温探测误差较大。总的来说,CMADS 数据集对夏季气温和降水量探测较准确,对冬季气温和降水量的探测能力较差,气温和降水量均出现较大的均方根误差和平均绝对误差。
图5 CMADS 数据集降水量、气温在不同季节的精度评价Fig.5 Accuracy evaluation of CMADS dataset for precipitation and air temperature in different seasons
2.1.4 多时间尺度精度评估结果分析
基于巴音布鲁克气象站数据,分别在日、月、季节尺度上评估了CMADS 降水量数据和气温数据精度与误差,结果表明,CMADS 降水量数据在月尺度表现较好,主要是由于CMADS 数据对月降水量的探测存在较小误差;在日尺度表现不佳,主要原因是CMADS 降水量数据存在较多空报降水事件的情况;在季节尺度对夏季探测较好,在冬季由于对降雪事件的探测能力较差导致误差较大。从对气温的多时间尺度精度评估发现,CMADS 数据对气温的探测能力较强,只在冬季表现出较大的误差。
对地面气象数据和 CMADS 数据集驱动的SWAT 模型分别进行率定。经过多次迭代,确定13个敏感参数及其敏感性排序(表3),不同气象数据的敏感参数排序及参数最佳值不同,地面气象数据驱动的模型最敏感的3 个参数分别是:各土壤层底层到土壤表层的深度SOL_Z、融雪温度SFTMP、SCS 曲线系数CN2;CMADS 数据集驱动模型最敏感参数是:浅层地下水再蒸发阈值深度REVAPMN、融雪基温SMTMP、SCS 曲线系数CN2,其中共同的敏感参数是径流参数CN2和融雪参数,说明地表径流和融雪是开都河径流模拟中的重要影响参数。从表4可以看出,CMADS 数据集驱动的SWAT 模型其率定期、验证期模拟效果均优于地面气象数据模拟结果,且R2和NSE均在0.7 以上,表明CMADS数据集驱动的SWAT 模型在开都河流域具有较好适用性。总的来说,地面气象数据在率定期模拟结果没有达到满意标准,不适用于开都河径流模拟研究,CMADS 数据在率定期和验证期均表现较好的模拟结果,表明CMADS 数据集模拟效果比地面气象数据好,与实测径流量的相关性更高。说明CMADS数据集可以替代地面观测气象数据进行水文模拟研究。
表3 开都河流域大山口水文站径流敏感性参数Table 3 Runoff sensitivity parameters of oyamaguchi hydrological station in Kaiduhe River Basin
表4 开都河流域大山口水文站月径流模拟结果Table 4 Simulation results of monthly runoff at Dashankou hydrological station in Kaidu River basin
图6是地面气象站驱动SWAT 模型径流模拟结果,从图6可知,率定期模拟径流量与实际径流量吻合度较差,对径流的高估较多,且存在波动。验证期模拟结果有所改善,对径流峰值出现的时间再现较为准确,且对出现2 个峰值的径流模拟出2 个峰值,但是存在径流高估。总的来说,用巴音布鲁克及周围气象站数据驱动SWAT 模型模拟2008—2018年径流量,对率定期径流模拟表现较差。
图6 地面气象站数据驱动SWAT 模型径流模拟结果Fig.6 Results of ground-based weather station data-driven SWAT model runoff simulations rate period,validation period
图7是CMADS 数据集驱动SWAT 模型的径流模拟结果,在率定期和验证期都能达到满意效果,表明CMADS 数据集可以作为地面气象数据的替代数据应用于水文模拟研究。从时间上看,CMADS 数据集对径流的洪峰捕捉较为准确,模拟径流和实际径流时间变化基本一致,但是对一些高值和低值的捕捉不够准确,存在波动。对于径流存在2 个峰值的模拟效果较差,仅模拟出1 个峰值。在率定期,存在基流高估事件;对于较高的峰值出现低估,较低峰值出现高估。验证期表现为低估峰值、略高估基流。总的来看,CMADS 数据集驱动的SWAT 模型模拟结果虽然存在部分模拟不够精确的情况,但总体符合实际径流量变化情况。
图7 CMADS 数据集驱动SWAT 模型径流模拟结果Fig.7 CMADS dataset driven SWAT model runoff simulation results
基于卫星和再分析的气象数据成为数据缺乏地区的重要数据来源,CFSR 和CMADS 再分析数据具备SWAT 模型所需的气象要素,被广泛应用于径流模拟等领域。田霖等[35]评估了CFSR 再分析数据集在开都河水文模型中的适用性,结果发现,未经校正的CFSR 数据集在该地区日径流模拟中表现较差(NSE<0.34)。本文评估CMADS 再分析数据集在开都河上游径流模拟中的表现,模拟结果较好,说明CMADS 比CFSR 更适合该地区径流模拟研究,这也与Meng 等[28]在黑河地区以及Zhang 等[10]在东北地区的研究结果一致:CMADS 径流模拟结果总体优于CFSR。由于气象插值会引入误差和不确定性,本文放弃将CMADS 数据插值到研究区内站点,选择距站点最近的网格点数据进行精度评估和误差分析,利用地面站点数据对CMADS 数据集的降水量和气温数据进行精度评估,结果发现气温在多时间尺度上均呈显著相关性,降水相关性略低,这与Zhang 等[20]、Dao 等[21]、Vu 等[22]在东亚地区的评估结果一致。
开都河上游仅有巴音布鲁克1 个气象站,气象站点稀少、气象观测数据缺乏,用单站点地面观测数据评估降水产品精度存在不确定性,且1 个站点的精度也不能代表整个开都河上游,因此,使用巴音布鲁克气象站评估CMADS 数据网格点的精度仅表明该网格点的精度,对CMADS 数据集在开都河上游的精度评估具有参考性不具有代表性。SWAT 水文模型需要输入整个上游网格气象数据,使用CMADS 网格点数据输入SWAT 模型模拟径流可以进一步评估CMADS在流域的精度及适用性。CMADS 驱动SWAT 模型径流模拟结果较好,说明CMADS 在西北地区具有较好的适用性,这与谷新晨等[27]、孟现勇等[32]、刘俊等[36]的研究结果相似。
CMADS 数据集输入SWAT 模型径流模拟取得较好结果,说明CMADS 数据集在开都河上游适用,但是CMADS 数据集仅提供2008—2018年的气象数据,不能满足长时间序列需求的水文气象研究,因此,后续研究会进一步为数据缺乏地区寻找长时间序列、高精度、高时空分辨率的数据源。
1)CMADS 数据集对气温的探测能力较好,除冬季气温探测较差以外,其余时间尺度相关性均在0.9 以上。对日降水探测表现较差,相关性为0.59,但误差较小;在月尺度上,对降水量和气温的探测相关性显著提高但同时出现更大的误差;季节尺度上对降水的探测精度较低,尤其对冬季降水量的探测存在较大偏差,CMADS 数据集对降雪的探测不敏感。
2)CMADS 径流模拟结果在率定期与验证期均优于地面气象数据径流模拟结果,CMADS 数据集适用于开都河上游径流模拟研究,可以替代地面观测数据用于该地区水文研究。
3)CMADS 数据集驱动的SWAT 模型径流模拟结果虽然存在部分模拟不够精确的情况,但总体符合实际径流量变化情况,在气象站点缺乏的干旱内陆地区CMADS 数据集可以作为地面站点替代数据开展水文模拟研究。