谢 平,吴林倩,吴子怡,桑燕芳,霍竞群,牛静怡,陈 斐,袁 苏
(1. 武汉大学水资源与水电工程科学国家重点实验室,湖北 武汉 430072;2. 生态环境部珠江流域南海海域生态环境监督管理局生态环境监测与科学研究中心,广东 广州 510610;3. 中国科学院地理科学与资源研究所陆地水循环与地表过程重点实验室,北京 100101;4. 复合链生自然灾害动力学应急管理部重点实验室,北京 100085)
水资源作为一种基础资源,其演变过程在水量增减和时空分配等方面受到气候变化与人类活动的双重影响[1-3]。从过程模拟的角度来看,水文过程受到了确定性和随机性因素的综合影响[4-5],当环境因素相对稳定时,可将水文序列近似看作满足“一致性”(独立同分布)要求的纯随机序列[6],概率分布函数将不随时间而变,表现较为稳定;当流域水循环和水资源形成的物理条件发生“非一致性”变化时,用于区域水资源评价的水文序列将含有反映变异特性的跳跃、趋势、周期和相依成分[7],破坏了工程水文分析计算的“一致性”假设前提[8]。因此,水资源序列及其评价结果(概率统计分布与特征值)是一个随环境动态变化的过程,科学的水资源演变分析与评价方法应能合理反映出从过去到现状不同环境下的水资源评价成果[9]。
水文水资源序列的变异识别与检验是研究水资源演变问题的重要内容之一[6],许多学者对此做出了创新与应用。例如,王银堂等[10]提出了具有局部与整体趋势识别能力的滑动窗口趋势分析法,此方法较现行方法更有助于合理估计水文设计值;Xie等[11]采用赋权的方式,对常用的12种跳跃变异点检验方法进行了综合加权,并利用Monte-Carlo 统计试验验证了这一思路的可靠性;Sang等[12]将经验模态分解(EMD)和最大熵谱分析(MESA)相结合,提出了可通过区分噪声、周期和趋势来提高整体的周期识别能力的EMD-MESA方法;黎清霞等[13]综合相关分析和随机森林算法,定量识别并对比了澜沧江中下游主要气象要素变化及径流间的相依性。但是,现有研究多是针对某单一变异成分进行诊断,且方法的选择较为主观,显著性评价标准不一,较少从整体的角度将趋势、跳跃、周期、相依所有成分及各成分之间的递进关系整合在一个诊断系统内来准确、全面地分析水文序列的变异特性,此外,中国水文分析计算中常采用的P-Ⅲ型分布有3个分布特征参数(位置参数、尺度参数和形状参数),这3个参数间接对应3个统计特征参数(均值、变差系数和偏态系数),每个参数都可能存在跳跃、趋势、周期、相依其中的1种或几种变异类型,无论哪个参数发生了变异,也无论变异是何种形式,都会对水文序列所属的概率分布特征产生影响。目前变异诊断的对象主要集中于原始序列的均值[10-13]和方差的变异分析[14-15],进一步考虑偏态系数变化的研究仍较少[16]。
谢平等[17]借鉴生物基因理论提出了具备普适性、完备性与拓展性的水文基因遗传、变异和进化原理,并定义水文序列的各阶原点矩和中心矩作为控制水文概率分布函数性状发生进化的基本遗传和变异单位。与其他途径相比,水文基因途径较为全面地考虑了包括一阶矩、二阶矩和三阶矩中可能出现的跳跃、趋势、周期、相依等变异成分和纯随机遗传成分,但尚未建立起一套较为全面的水文基因诊断系统,既能对各个变异成分进行确认,也可对其变异程度进行分级;且由于水文基因检测结果会有多种可能组合,仅依靠水文过程图或结果表格无法简洁明了地呈现所有的水文基因信息,因此,针对水文基因的遗传与变异规律有待提出更为直观的表示方法。
西南诸河流域水资源极其丰富,但现阶段水资源开发利用程度还较低[18-19],且目前对该区域水资源演变规律的研究较少或不够系统全面[20-21]。因此,本文选取中国西南诸河水资源区中的各个水资源二级区(藏西诸河、藏南诸河、雅鲁藏布江、怒江及伊洛瓦底江、澜沧江、红河)的地表水资源序列作为研究对象,构建基于相关系数测度的水文基因检测系统,并提出“水文基因图谱”的概念与绘制方法,从而揭示并直观地展示西南诸河地表水资源序列的遗传和变异规律,为进一步开展基于水文基因理论的西南诸河地表水资源的频率分布规律研究打下基础,也可为制定西南诸河水资源战略规划、实施重大水利工程建设和促进流域经济社会生态可持续发展等提供科学参考依据。
西南诸河水资源区位于中国西南边陲,是青藏高原与云贵高原的一部分,位于21°09′N—35°30′N,77°50′E—106°00′E。作为中国十大水资源一级区之一,西南诸河流域幅员辽阔,总面积约为85万km2,流域内河流众多,自西向东依次划分为藏西诸河、藏南诸河、雅鲁藏布江、怒江及伊洛瓦底江、澜沧江、红河共6个水资源二级区(图1),涉及新疆、西藏、青海、云南、广西5省(自治区)。西南诸河河流补给来源与类型复杂,西藏西部与青海大部分地区多为地下水补给为主的类型;云南西部和南部、西藏南部与东南部的河流河段多以降水补给为主;西藏的林芝、波密一带,雅鲁藏布江、朋曲等河的河源段多为冰雪融水、降水补给;怒江、澜沧江干流的径流补给多为地下水与降水的混合补给类型。西南诸河流域内国际河流众多,流域内除西藏南部有一些面积大小不等的内陆河零星分布外,其余河流分别由新疆、西藏、云南、广西流出国境[22-23],经其他国家入海,均属外流型国际河流。
图1 西南诸河水资源区及其各个二级区位置示意Fig.1 Location of secondary water resources regions in the Southwest rivers zone in China
本文选取西南诸河水资源区中的6个水资源二级区的地表水资源序列作为研究对象。地表水资源量是指由当地降水形成的河流、湖泊、冰川等地表水体中可以逐年更新的动态水量,用河川年径流量表示。选取的地表水资源量序列与年降水量序列的起止时间均为1956—2019年,其中,1956—2000年数据采用第二次全国水资源调查评价成果(以下简称“第二次评价”)。“第二次评价”中的径流序列由实测径流资料整理而来,大多经过还原与修正,以期消除由于水资源开发利用和下垫面变化所造成的影响,但由于西南诸河区人类活动影响极小,未进行还原[24]。2001—2019年数据来自水利部长江水利委员会发布的《长江流域及西南诸河水资源公报》(http:∥www.cjw.gov.cn/zwzc/bmgb/szygb/)。
生物学中,基因是控制遗传的基本单元,通过复制和突变(变异)将生物体的遗传信息由亲代传递到子代。在水文要素的遗传和变异过程中,水文基因即是具有传递性的水文过程信息载体,是可以控制水文“性状”(概率分布函数)发生“进化”的统计量[17]。考虑到水文序列的分布特征参数均可通过数字特征参数来表达,而数字特征参数是水文序列各个矩的转换函数,因此可以将水文变量的各阶矩定义为水文基因[17]。以中国常用的P-Ⅲ型分布为例,常规矩基因L1t、L2t和L3t(t为时序,作为下标表示变量随时间变化,下同)分别表示原始水文序列xt的一阶原点矩、二阶中心矩和三阶中心矩[25]。
类似的,水文基因的组成成分即为水文碱基。依据随机水文学原理[26-27],水文碱基包括确定性成分——跳跃(Jt)、趋势(Tt)、周期(Pt)成分和随机性成分——相依(Dt)、纯随机(即独立)(St)成分。对于仅包含纯随机成分的一致性水文序列,其概率分布不随时间发生变化,因此,纯随机成分为遗传碱基;而确定性成分Jt、Tt、Pt与随机性成分中的Dt均可以改变水文时间序列的统计特征,使其概率分布函数在过去、现在和未来的不同环境下具有不同的分布参数,因此,这些成分均为变异碱基。含有变异成分的水文序列是非一致性的,可将其看作是一致性水文序列的遗传性状适应环境变化发生变异后进化的结果。
图2 水文基因原理示意Fig.2 Schematic diagram of hydrological gene principle
水文基因变异决定了水文概率分布函数的“性状”发生进化的进程和程度,因此,如何识别水文基因的变异成分并度量其变异程度是进行非一致性水文频率计算的前提。本文选取相关系数(r)作为水文基因变异的测度指标以统一度量跳跃、整体趋势、周期、相依成分的变异分级程度[28-32],分级标准见表1;并基于相关系数测度,对水文基因的跳跃、整体趋势、局部趋势、周期和相依等变异成分进行识别与检验[33-37],关键公式总结见表2。
表1 水文序列变异程度分级标准
表2 水文变异的类型、描述、分级及识别
为全面考虑水文基因的变异与遗传规律,以上述基于相关系数测度的水文基因变异识别、检验与分级方法为基础,构建基于相关系数测度的水文基因检测系统,流程如图3所示。水文基因检测系统将原始水文序列作为输入,以“先判断水文基因变异成分,后验证水文基因遗传成分”为整体原则,得到水文序列包含的水文基因信息。具体来说,首先对序列可能存在的趋势及跳跃成分进行检测,依据相关系数值的大小从中确定最显著的一种变异成分,然后对已经剔除了趋势与跳跃这类变异成分或这类变异成分均不显著的水文序列进行周期变异成分的检测。在上述过程中,若某种成分显著存在则将其剔除,然后对剩余水文基因序列进行新一轮检测,循环此过程直至序列无显著变异成分,最后将剩余水文基因序列作为下一阶段检测的输入。当剩余水文基因序列不含显著的跳跃、趋势与周期成分时,还需对其是否存在显著相依成分进行检测,不同于跳跃、趋势、周期等变异成分可能在序列中多次出现,相依成分如显著存在也仅有“一次相依”,因此不再需要对剩余序列做循环识别。无论是未检出显著相依变异成分的序列还是已扣除相依变异成分的剩余水文基因序列,均需进行纯随机成分的验证,以确定其为水文基因序列的遗传成分[38]。若检验结果为纯随机,则此时水文序列的变异成分与遗传成分均已得到,可进一步结合实际的水文调查进行成因分析,确认后的成分即为该水文序列的水文基因结构组成;若剩余序列未通过纯随机检验,仍存在变异项,说明之前的步骤中可能出现错误,应对检测系统的每一步进行核查并重新检测。
图3 水文基因检测系统流程Fig.3 Flow chart of the hydrological gene detection system
生物学中,基因在染色体上的线性排列可以用基因图谱的方式表现出来,以精准反映其遗传与变异信息。为直观展示水文基因检测系统给出的水文基因信息,借鉴这种表达方式,本文提出水文基因图谱的概念与绘制方法。水文基因图谱是指依据水文基因识别与检测结果,按照判别顺序绘制成的用以反映序列水文基因构成信息的条状百分比图。
在对水文基因序列进行完整检测后,可以得到该序列各个变异成分与遗传成分的表达式,各个成分对原水文基因序列的贡献可借助相关系数这一指标进行量化。设水文基因序列共由k个变异成分及纯随机成分构成,分别计算各个成分与原始水文基因序列的相关系数,记为ri(i=1,2,…,k-1,k),则每种成分对原始水文基因序列的贡献率(Ci)可表示为
(1)
对比各变异成分与遗传成分的贡献率,可看出在原始水文基因序列中遗传成分与变异成分是按何种比例构成的;进一步,根据各变异成分所占比重,可判断各变异成分对序列影响的大小,贡献率大即占比大的成分,在原始水文基因序列中更为显著,也更易首先被检测系统识别出。
水文基因图谱的绘制方法:依据水文基因检测系统的结果,计算各水文基因成分对原水文序列的贡献率,并标注各成分的具体信息。① 跳跃变异点出现的位置、跳跃方向(上升↑、下降↓)、跳跃变异程度、跳跃变异成分的贡献率(即该成分在水文序列的占比);② 整体趋势方向(递增、递减)、整体趋势变异程度、整体趋势变异成分的贡献率;③ 局部趋势折点出现的位置、局部趋势的方向(由递增、递减、平缓→等各段子序列的趋势方向组成)、局部趋势变异成分的贡献率;④ 周期长度、周期变异程度、周期变异成分的贡献率;⑤ 相依变异的表现类型(AR模型、MA模型、ARMA模型)、相依变异成分的阶数、相依变异程度、相依变异成分的贡献率;⑥ 纯随机成分的贡献率(即1-变异成分贡献率)。图谱中通过不同的颜色表征不同的变异类型,无论是对于单个研究对象的不同阶矩的统计特征,还是不同研究对象的同阶矩的统计特征,通过水文基因图谱可方便地分析得到其时空变异性规律。
采用水文基因检测系统对西南诸河区6个二级区的地表水资源量序列进行水文基因检测,水文基因检测系统的显著性水平取α=0.05、β=0.01,表1中的分级阈值可确定为rα=0.246 1,rβ=0.319 8;然后针对每个二级区的各阶矩序列,分别计算其各个水文基因成分与该阶矩序列的相关系数,由公式(1) 计算每种水文基因成分对相应矩序列的贡献率,并以水文基因图谱的形式展示水文基因的遗传和变异信息,结果见图4。
图4 西南诸河各二级区地表水资源量各阶矩序列水文基因图谱Fig.4 Hydrological gene map of first-,second-,and third-order moment series of annual runoff in secondary regions of Southwest rivers
图4(a)中,藏西诸河二级区地表水资源量各阶矩序列均包含变异成分与遗传成分。一阶矩序列(原始序列)在2009年出现向上的跳跃中变异,且此成分所占比重达到了37.34%,明显高于周期中等变异成分(长度为10),表明跳跃成分对一阶矩序列的变异影响最为显著;二阶矩序列在2003年发生了向上的跳跃强变异,其成分占比达到42.53%,明显高于占比为12.39%的周期成分(长度为17);三阶矩序列含有周期(长度6)和相依(1阶MA模型,记为MA(1) )2种变异成分,且二者占比相近,说明各成分对序列的影响能力较为平均。
图4(b)中,藏南诸河二级区地表水资源量一阶矩及二阶矩序列的水文基因由变异成分与遗传成分构成,三阶矩序列不含变异成分。一阶矩序列中,2个周期成分(长度为9和12)占比差异不大,且均为中等程度变异,其水文基因成分构成较为简单;二阶矩序列的变异成分构成较复杂,包括占比分别为15.39%的2001年向下跳跃成分和1.81%的1996年向上跳跃成分,此外还有周期成分(长度为12)与相依成分(1阶AR模型,记为AR(1) ),各成分的变异程度均在中等及以下。
图4(c)中,雅鲁藏布江二级区地表水资源量一阶矩及二阶矩序列的水文基因由变异成分与遗传成分构成,三阶矩序列不含变异成分。一阶矩序列中所有变异成分的变异程度均在中等及以下,但变异成分整体占比较大,遗传成分占比仅有41.70%;二阶矩序列中遗传成分达到71.01%,变异成分仅包含周期变异成分(长度为3)。
图4(d)中,怒江及伊洛瓦底江二级区地表水资源量一阶矩及三阶矩序列的水文基因由变异成分与遗传成分构成,二阶矩序列不含变异成分。一阶矩序列中变异成分占比达到52.35%,其中,跳跃成分与周期成分对应的变异程度均达到了中等强度;三阶矩序列中变异成分占比较低,仅为34.22%,由17.27%的跳跃变异成分(在1973年上升)和16.95%的周期变异成分(长度为19)构成,各变异成分的变异程度均为弱变异强度。
图4(e)中,澜沧江二级区地表水资源量各阶矩序列的水文基因成分均由变异成分与遗传成分构成。其中,一阶矩序列与二阶矩序列的水文基因构成较为简单,三阶矩序列构成较为复杂。一阶矩序列中变异成分占比达到45.98%,由占比为24.07%的局部趋势变异成分(在1966年前后先升后降)和占比为21.91%的周期变异成分(长度为9)构成;二阶矩序列中,变异成分占比为32.06%,主要为周期中等变异成分(长度为9),遗传成分占比最大,达到67.94%;三阶矩序列中跳跃变异成分(在2008年下降)占比16.18%,周期变异成分(长度为15)占比14.88%,相依变异成分(1阶AR模型)占比16.59%。
图4(f)中,红河二级区地表水资源量的各阶矩序列均由变异成分与遗传成分构成,一阶矩序列与二阶矩序列中遗传成分占比较少,三阶矩序列遗传成分占比最大,达到62.17%。在一阶矩序列中,局部趋势(在1971年前后先升后降)在变异成分中所占比重最大,达到31.18%,长度为15的周期成分占比为16.02%;二阶矩序列和三阶矩序列的水文基因变异成分与一阶矩构成相似,均包括局部趋势与周期,但这2种成分的占比较小,对三阶矩基因的影响较小。
考虑到流域内河流的补给来源大多为降水补给,所以结合降水的基因图谱(图5)对地表水资源量基因图谱呈现的遗传与变异规律进行归因分析。整体上,对于一阶矩代表的原始地表水资源量序列,藏西诸河、藏南诸河和雅鲁藏布江均与降水呈现出了相同的变异规律,怒江的周期和相依变异以及红河的周期变异与降水的变异规律也是一致的,这说明降水变化是影响西南诸河地表水资源量的主要因素[39];地表水资源量的周期波动规律还存在明显的空间聚集性,由于西南流域的降水主要受印度季风控制,所以地表水资源量中普遍存在的9 a左右周期变化可能间接与印度季风存在的准11 a周期变化有关[40-42]。
图5 西南诸河各二级区降水量各阶矩序列水文基因图谱Fig.5 Hydrological gene map of first-,second-,and third-order moment series of annual precipitation in secondary regions of Southwest rivers
在二阶矩和三阶矩中,位于西藏南部且空间位置上相邻的藏南诸河和雅鲁藏布江的降水与地表水资源量也呈现出几近一致的变化规律,红河的降水周期也与地表水资源量的周期相近。由于二阶矩基因的变异对应方差的变化情况,三阶矩基因的变异与偏态系数或分布形状参数的变化有关,说明对于这些二级区地表水资源量主要统计特征的变化,降水因素起主导作用;其余二级区不存在明显的一致对应关系,可能与下垫面因素有关,对于这些区域更高阶矩基因变异现象背后的成因机制还需要进一步分析探讨。
本文选取西南诸河水资源区中的各个水资源二级区(藏西诸河、藏南诸河、雅鲁藏布江、怒江及伊洛瓦底江、澜沧江、红河)的地表水资源序列作为研究对象,通过建立水文基因检测系统得到了其地表水资源量一、二、三阶矩序列的水文基因构成,并绘制了相应的水文基因图谱,主要结论如下:
(1) 西南诸河各二级区地表水资源量的一阶矩序列均存在不同形式的水文基因变异成分,主要表现为跳跃、局部趋势、周期与相依,其中周期与跳跃变异成分出现的频率较高;二阶矩序列中,除藏南诸河外,其余二级区的二阶矩水文基因大多只存在周期弱变异成分,说明二阶矩代表的方差特性多呈现周期波动;三阶矩序列中,除澜沧江外,其余二级区的水文基因构成较为简单,说明高阶矩中存在的变异较少。
(2) 基因图谱从各水文基因成分的贡献率角度揭示了西南诸河地表水资源量的变异规律:藏西诸河的遗传(纯随机)成分在一阶矩序列(原始地表水资源量序列)与二阶矩序列中的占比均为45%左右,在三阶矩中增加到了59.77%;藏南诸河地表水资源量二阶矩序列的变异成分包括跳跃、周期、相依,共占比48.56%,一阶矩仅含有占比为47.29%的周期变异成分,三阶矩不含有变异成分;雅鲁藏布江地表水资源量各阶矩的遗传成分占比由一阶矩至三阶矩逐渐增大;怒江及伊洛瓦底江地表水资源量一阶矩及三阶矩序列的水文基因分别含有占比为52.35%和34.22%的变异成分,二阶矩序列只存在遗传成分;澜沧江地表水资源量一阶矩序列与二阶矩序列的水文基因构成较为简单,三阶矩序列构成较为复杂,变异成分占比达到47.65%;红河地表水资源量的各阶矩序列的水文基因均含有局部趋势与周期变异成分,三阶矩序列中遗传成分占比最大。
(3) 西南诸河各二级区地表水资源量一阶矩基因的变化主要受降水因素的影响,对于更高阶矩基因的变异归因还需在以后研究中分析探讨。
受篇幅限制,本文仅呈现了西南诸河各二级区地表水资源量基因的遗传与变异特征。进一步地,依据水文基因理论[17],还可由地表水资源量基因的变异规律推得其数字特征参数和分布特征参数的变化规律,最终得到随时间由一种状态“进化”到另一种状态的概率分布函数,为开展变化环境对随机水文过程产生的影响即适应性变化的研究提供科学依据。