唐 榕, 王运涛, 李 敏, 周惠成
(大连理工大学 水利工程学院, 辽宁 大连 116024)
降水是水文过程模拟的关键因素,降水数据的精度影响着水文模拟预报的准确性[1]。获得高精度的雨量站点观测降水数据[1]往往受到观测站点分布不均、观测数据代表性差、观测数据的起始时间不一、观测资料缺失、部分站点数据难以获取等因素的影响,从而限制了部分流域(尤其是面积较大流域)的长系列水文模拟预报[2]。为此,部分机构开始推出长系列、多精度、广覆盖的降水产品数据,提供了一种数据获取新途径。国际上提供降水产品的有欧洲的ERA-Interim[3]、美国的NCEP/NCAR[4]、日本的JRA-55[5]等降水再分析数据、GPCP[5]、TMPA[2]、TRMM[6]、GPM[7]等卫星遥感数据集及GPCC[5]等基于地面观测数据的产品等[2,5],国内有中国气象局陆面数据同化实时产品数据集(CLDASV2.0产品)[8]和中国地面降水日值0.5°×0.5°格点的数据集等等。然而由于上述降水产品的数据来源不同、数据推出过程中使用的同化、插值、反演等计算方法不同,且在不同地形地势的区域中的表现不同,因此在具体应用中的精度各有差异[5]。在应用降水产品之前应针对具体研究区域进行必要的误差分析,并探究其在相应区域水文模拟预报中的适用性[2,5]。
目前,已在不同流域开展了不同降水产品的适应性研究。王书霞等[6]从年、月、日尺度评估了TRMM 3B42 V7、TRMM 3B42 RT、CMORPH、PERSIANN 4种遥感降水产品在澜沧江流域的精度。吴倩鑫等[5]对比了CMFD、ERA-Interim、GPCC、GPCP V2.3和JRA-55这5种降水产品的月尺度数据在疏勒河流域的精度。任英杰等[9]、王汉涛等[7]、许风林等[10]分别开展了GPM IMERG卫星产品在中国大陆地区、三峡区间渠溪河、黄淮海平原的适用性评估研究。朱红雷等[1]进行了辉发河流域的TRMM降水数据在日、月尺度上的径流模拟适宜性评价研究,张小丽等[11]评价了GLDAS、TMPA和ERA-Interim中日、月尺度数据在浑江流域水文模拟中的适用性。此外,还有对其他地区或流域的降水产品适用性评估研究[3-4,12]。尽管开展了不同流域不同降雨产品的适用性研究,但该方面的研究表明诸多降水产品在许多流域的精度不高、难以满足流域尺度水文模拟分析预测的需求[5-6,13],原因在于对降水产品来源、数据处理方式、数据用途上未做仔细分析,选择降水产品时多选用几种常用的降水产品数据,不能做到因地制宜。因此,对于不同流域不同降水产品的适用性探究仍须继续深入。
尼尔基水库位于黑龙江省与内蒙古自治区交界的嫩江干流中游,该水库坝址右岸为内蒙古自治区的尼尔基镇。为实现该水库考虑旬入库径流预报信息的长系列模拟优化调度,相应地,需要入库径流预报中起主要作用的长系列降水数据。不过,该流域面积较大,能获取的站点降水量数据有限,站点数据长度参差不齐,利用站点数据来进行长系列研究比较困难。而国家气象中心提供的中国地面降水日值0.5°×0.5°格点数据集提供自1961年至今共55 a的逐日降水数据,数据长度足够[14-15]。此外,该数据是基于地面国家级高密度台站插值而来,提供的是中国经纬度边界内的降水数据,会比诸多全球范围的降水产品更有针对性、系统误差更小,精度可能更高,因此拟使用该降水产品数据代替该流域实测站点数据。本文以尼尔基水库上游控制流域为研究区,利用收集到的站点测雨数据与该格点数据集中的数据进行流域面雨量的对比分析,评估格点数据应用到径流预报中的适用性,为后期预报调度中降雨数据的收集使用提供依据。
本文研究区域为嫩江干流上的大型控制性水利工程尼尔基水库以上控制流域(见图1),流域面积达6.64×104km2,占嫩江流域面积(28.95×104km2)的22.9%。嫩江流域从大兴安岭伊勒呼里山中段南侧至三岔河,全长1370 km。除了本文研究区涉及的上段和中段,还有下段,3段划分如下:上游段从河源到嫩江县,长661 km,左岸有卧都河、固固河、门鲁河和科洛河注入,右岸有那都里河、大小古里河和多布库尔河注入,该段有80%以上面积为茂密的森林覆盖,河流的含沙量较小;中段从嫩江县到莫力达瓦达斡尔族自治旗,长122 km,该河段支流很少,右岸主要有较大支流甘河汇入,是山区到平原区的过渡地带,两岸多低山、丘陵,地势比上游平坦,两岸不对称;下游段由莫力达瓦达斡尔族自治旗到三岔河,长587 km,下游支流较多,有诺敏河、雅鲁河、霍林河、乌裕尔河、洮儿河等等,该段为广阔的平原,河道蜿蜒曲折,沙滩、沙洲、江岔多。尼尔基水库多年平均径流量106.54×108m3,占嫩江流域多年平均径流量的44.5%;多年平均降水量为400~500 mm,年内降水量分配极不均匀,6-9月降水量占全年降水量的80%以上,冬季降水量极少,仅占年降水量的5%以下[16]。
图1 尼尔基水库上游流域及雨量站、水文站分布
2.2.1 降水产品数据 本文采用的降水产品数据为中国地面降水日值0.5°×0.5°格点数据集(V2.0),该数据集主要基于2 472个国家级气象观测站的降水资料、利用ANUSPLIN软件的薄盘样条法(TPS,Thin Plate Spline)进行空间插值所得,并结合数字高程资料来尽可能地消除高程对降水空间插值精度的影响。它可提供1961年1月1日开始至今59 a的地面格点的逐日(08:00-08:00,北京时间)降水值数据,即地面水平分辨率0.5°×0.5°(纬度1°约为111km,经度1°约为111×cosakm,其中a为对应纬度)的日值降水格点数据。数据覆盖范围为中国最西经度72°E 到最东经度136°E、最北纬度54°N至最南纬度18°N。
2.2.2 实测站点数据 通过多种途径收集到17个测站的日降雨数据,其中包含卧都河、罕达气、哈尔通、松岭、壮志、新天、白云、阿里河及吉文9个雨量站和霍龙门、古里、科后、柳家屯、加格达奇、石灰窑、库漠屯、嫩江8个水文站的雨量数据。各测站所在河流、收集到的资料起止时间、测站类型如表1所示,其具体分布见图1。由表1可知搜集到的站点实测降水资料长度不统一,难以通过上述测站资料获得该流域较完整的长系列面雨量资料。
表1 尼尔基水库上游流域水文站及雨量站基本信息表
注:年份后括号内的月份表示仅收集到相应月份数据。
2.2.3 数据处理 基于已有的站点实测降水数据,提取其中时间尺度统一的数据作为本文研究所用的实测数据,经对比选择2007-2013年6-9月的各测站逐日降水量,利用其加权求和得到该流域实测面雨量值系列,对系列中854 d的面雨量值求和平均,得到多日面雨量均值为2.78 mm。
中国地面降水日值0.5°×0.5°格点数据集(V2.0)提供的是整个中国范围的数据,而研究区域主要位于122.5°E ~127°E、48.5°N ~51.5°N内,该范围内的控制格点见图1。首先提取上述范围内2007-2013年6-9月的所有格点数据,通过各格点数据加权求和得到格点数据下的面雨量值(文中简称格点面雨量值),多日格点面雨量均值为3.24 mm。其中各格点降雨值的权重按以下步骤确定:假设各格点控制面积均等,以格点为中心作0.5°边长的正方形,与研究流域重叠的部分作为该格点的有效贡献部分,将其相应面积占研究流域面积的比例作为各格点的权重。
2.3.1 运用方法 流域面雨量精度是降水产品自身精度的直接体现,是降水产品是否可替代雨量测站实测降雨的基础,而降水产品在研究流域水文模拟预报的应用中能否达到水文模拟预报的要求是降水产品适用性的进一步衡量。为此,本文首先采用简单加权法计算降水产品数据应用下流域面雨量值,与雨量测站所得的面雨量值进行对比,评估格点降雨产品下的面雨量精度。其次,本文应用BP神经网络进行尼尔基水库6-9月份旬入库径流量预报,分别采用实测面雨量值和格点降雨产品所得面雨量值作为前期降雨因子,以确定本文所用格点降水产品在水文模拟预报中应用时是否能保持应用实测降雨时的效果、达到水文模拟预报的要求。
径流预报的基本假设[17]为:(1)前期后m天的径流量大小代表旬初土壤蓄水量,来反映前期降雨及径流对本旬初土壤蓄水量的影响;(2)前期后n天降雨量加上本旬未来前k天降雨量是本旬径流产生的主要因素。其中m、n、k主要通过分析因子与径流的相关性来确定,例如,如图2所示的实测和格点两种面雨量数据下,前期后n天降水量与旬径流量的相关系数R均随着n的增大而逐渐增大,且达到20 d的R值最大,因此确定前期后20 d降水量为径流预报的预报因子,即n=20。同样地,确定m=1,k=7。这样,下文利用前期后1 d径流量、前期后20 d累积降水量及未来7 d累积降水量3个预报因子来预测旬径流量。
根据选用的预报因子,本文BP神经网络旬径流预报利用2007-2009年6 -9月的数据作为预报中的拟合样本,2010-2011年作为检验样本,用于共同率定BP神经网络中学习率、训练次数、隐含层节点数等参数,以2012-2013年作为外推样本用以验证该BP神经网络预报模型的预报能力。直接采用上述年份相应数据预测时样本数量较少,为了增加样本数量,提高预报精度,采用逐日滚动获取的10 d量来生成旬径流系列数据,即如果以6月1日-6月10日数据作为第1个旬径流数据,则以往后滚动1日的6月2日-6月11日数据作为第2个数据,以此类推。相应地,3个预报因子也做类似处理。除此之外,为了减少预报降水量的不确定性对此处结果的影响,未来k天降雨量直接利用实测雨量代替[18]。
图2 前期后n天累积降水量与旬径流量相关关系
2.3.2 精度评估指标 相关系数R能够反映模拟值与实测值间的相关性程度,表征模拟值数据序列与实测值序列整体变化趋势的一致性程度[5];R越大,模拟值数据序列与实测值序列变化越一致。相对误差RE可以反映模拟值与实测值间的偏差程度[6],RE为正值说明模拟值大于实测值,即模拟值高估了实测值;RE为负说明整体看来模拟值小于实测值,即低估了实测值。均方根误差RMSE能够用来衡量模拟值与实测值之间的误差量[5],体现的是模拟值数据序列与实测值序列之间的靠近程度,RMSE值越小说明模拟值与实测值越靠近,越能替代实测值。本文应用R、RE和RMSE作为精度评估的指标[2]。3个指标计算公式分别如下。
相关系数R的计算公式为:
(1)
相对误差RE的计算公式为:
(2)
均方根误差RMSE的计算公式为:
(3)
适用性分析即应用相关系数R、相对误差RE以及均方根误差RMSE3个评估指标分别对应用降雨产品数据得到的流域面雨量值和未来10 d径流量预报值进行精度评估。
经计算得出格点数据下的面雨量值与实测面雨量之间的相关系数R为0.70,相对误差RE为16.64%,均方根误差RMSE为4.09 mm,按R>0.6、-20% 此外,从图2所示的前期后n天降雨量与旬径流量的相关系数R上可以看出:(1)格点面雨量数据下的相关系数均略小于实测面雨量值下的相关系数,这也论证了水文站及雨量站得到的面雨量值更能体现该流域的实际面雨量值;(2)格点面雨量数据下的相关系数变化规律与实测面雨量下的变化规律一致,随着累积降水天数的增长而增大,且也在n=20的时候达到最大,说明格点面雨量数据能代替实测面雨量来表征该流域降雨与径流之间的关系:前期较长时间的降水量(达两旬)都会对径流产生贡献,这与该流域面积较大且流域上游为蓄水能力较强的大面积森林、汇流时间较长有关[19]。 表2为分别应用实测面雨量和气象格点面雨量进行10 d径流预报的预报径流量与实测径流量的相关系数、相对误差和均方根误差。由表2可知:(1)两种数据应用下拟合期、检验期、外推期预测径流值与实测径流值的相关系数R基本相同,均在0.87以上,即预测值系列与实测值系列高度相关。(2)格点数据面雨量应用下的相对误差绝对值略大于雨量站实测面雨量应用下的相对误差绝对值,说明实测面雨量应用时径流预报偏差更小;两种数据在拟合期和检验期相对误差RE均为正值,说明两种降雨数据应用下均存在高估实测径流量的现象,不过RE均小于6%,说明径流预报值较实测径流值偏大不多;在外推期两种数据应用下的RE分别为-7.45%、-10.25%,均为负值,说明在该时期无论使用何种降雨数据均会低估实际径流值,这主要是因为2013年6-9月实际入库径流量属于历史记录中最大值,外推期包含了2013年中的较大径流,模型难以准确预测。(3)两种数据在拟合期、检验期的均方根误差RMSE均远小于2007-2013年6-9月日径流量均值737.98 m3/s,在外推期RMSE较大,分别为498.98和514.94 m3/s,误差较大,这主要与2013年较大径流难以准确预报有关,不过格点数据面雨量应用下的均方根误差与雨量站实测面雨量应用下的均方根相差不大,仅为3%。 表2 两种面雨量值应用下10 d径流量预报评价指标值 根据上述分析结合表2可知:格点数据面雨量应用时与实测面雨量应用时同样能够满足R>0.6、-20% 上述面雨量、径流预报值精度评估结果表明,中国地面降水日值0.5°×0.5°格点数据集在尼尔基水库上游流域的应用表现良好,可以替代雨量站点来提供降水数据。此外,在日尺度降雨产品数据上,该格点降水数据面雨量拟合结果中相关系数达0.7,比其他降水产品在国内其他流域应用中的相关系数高,如TRMM 3B42 V7、TRMM 3B42 RT、CMORPH、PERSIANN 4种遥感降水产品在澜沧江流域与实测降水的相关系数均低于0.5[6]。原因除了流域差异外,极可能是本文采用的格点降水数据是国内地面观测台站数据直接插值而来,同等情况下国内流域采用该降水产品时精度能够得以保证。尽管该降水产品插值存在误差,用于插值的站点也不一定能完全面描述研究流域径流,但与卫星雷达反演得到的降水产品以及经多种来源数据同化处理而来的再分析数据集所提供的降水产品相比,其精度高的可能性要更大。因此,在今后在选择实测降水数据的替代降水产品时,应当明晰降水产品来源,尽可能选择融合更多研究流域地面观测降水资料的降水产品,以保证替代降水产品的精度。 本文主要评估了国家气象信息中心提供的降水产品——中国地面降水日值0.5°×0.5°格点数据集(V2.0)在尼尔基水库上游流域的适用情况。评估包括格点降雨产品数据下的格点面雨量精度及格点降雨产品数据在10 d径流预报中的预报精度两方面。具体结论如下: (1)在考虑该流域范围内的面雨量时,格点面雨量值与实测面雨量值间R为0.70,相对误差RE为16.64%,均方根误差RMSE为4.09 mm,相关系数及相对误差基本满足R>0.6、-20% (2)在预报10 d径流量中,应用格点面雨量值得到的径流预报值与应用实测面雨量所得到的结果相差不大,拟合期、检验期、外推期R均大于等于0.87、相对误差的绝对值小于11%,均满足检验标准;应用格点面雨量值得到的预测径流值的相对误差、均方根误差均较小,不过均稍劣于应用实测面雨量时的相应值;均方根误差在外推期较大,但与实测面雨量时的均方根误差差异不大,仅为3%。当进行尼尔基水库上游流域长系列径流预报时,可直接采用格点面雨量值代替实测面雨量值。3.2 径流预报精度评估结果
4 讨 论
5 结 论