兰芝梅,朱 咏,陈学林
(1.甘肃省张掖水文站,甘肃 张掖 734000;2.甘肃省水文站,甘肃 兰州 730000)
水文现代化建设主要是将先进的自动化监测设备应用到水文测验中,实现基础水文数据的自动化监测、传输、分析等功能。应用历年综合水位~流量关系曲线进行推流计算,是满足流量自动化监测的关键环节。传统的综合关系曲线率定方法主要是采用整编规范中的t 检验对相邻年份实测流量数据(2 个独立样本)的同分布显著性检验分析,将通过t 检验的3 年~4 年的流量数据作为绘制综合线的依据[1-3]。为进一步保证综合线的科学性、合理性,本研究提出采用spss 软件中单样本k-s 非参数检验和多样本k-w 非参数检验对实测流量数据进行分析研究。非参数检验在总体分布未知时有很大的优越性,总是比传统的参数检验安全[4],通过非参数检验的历史实测流量样本数据,表明该样本数据总体无显著性差异,每年的水位流量关系变化较稳定。对于稳定的水位流量关系,可以对其进行数学公式的选配,以一个数学方程式来表达这种水位流量关系[5]。最小二乘法曲线拟合方法是使实测值与拟合值差的平方和最小,可较准确地拟合水位流量关系曲线[6]。
正义峡水文站位于张掖市高台县罗城乡天城村,是黑河中游和下游的分界点,属国家重要水文站、省界测验断面,测验断面无明显冲淤变化;高崖水文站位于临泽县板桥乡土桥村以上1.5 km 处,是黑河中游的省级重要站、中央报汛站,属县界测验断面,测验河段基本顺直,河床及两岸系砾石细沙组成,属流沙河床,冲淤变化较大[7]。
k-s 非参数检验是基于连续型计量资料样本分布未知的前提下,用样本本身的信息来检验样本来自同一个总体假设的一种统计检验方法,其原理主要是运用某随机变量x 的顺序样本来构造样本分布函数,使得能以一定的概率保证x 的理论分布函数Fn(x)落在某个范围内[8]。k-s 非参数检验统计量Dn表示样本所有变量xi,在经验分布与理论分布对应值之差的最大绝对值[9],表达式为:
根据文献[6]提出当样本容量n<100 时,显著性水平=0.05,按照由Dn的精确分布制定的D(n,α)Lilliefors 修正临界值检验表查验,当样本实际统计量Dn 表1 单样本k-s 非参数检验结果 由表1 可得正义峡和高崖水文站单年实测流量样本数据的实际统计量Dn均大于查表值D(n,α),即单样本的总体均不服从正态分布,故传统方法采用t 检验分析率定历年综合线理论上不严密。 多独立样本k-w 检验用于在样本来自的总体分布未知情况下由多个独立样本数据检验多个总体的分布是否存在显著差异,其原理是将多组样本数据混合后按照升序排序,求出各变量的秩,检验各组秩的平均值是否存在显著差异,如果各组秩的均值不存在显著差异,则推断多个总体的分布无显著差异;如果各组秩的均值存在显著差异,则推断多个总体的分布存在显著差异,至少有一个样本不同于其他样本[10]。k-w 秩和检验统计量为: 式中:N 为总样本量;k 为样本组数;ni为第i 组的样本量;Ri为第i 组样本中的秩总和。一般数组中会存在相等秩值的情况,需按照校正系数C 进行调整: 当每个独立样本中实测数据大于等于5 时,KWC接近自由度为k-1 的卡方分布,用卡方分布进行统计量检验[11]。取显著性水平=0.05,当实际检验显著性值>0.05 时,接受原假设,即多个样本的总体分布无显著性差异。基于以上分析方法,应用spss 软件中k-w 检验对正义峡水文站和高崖水文站7 个独立样本进行检验分析,结果见表2。 表2 多独立样本k-w 非参数检验结果 由以上检验结果可知,正义峡水文站基本顺直河道的测验断面相对稳定,历年实测流量数据的总体分布无显著性差异,即在水力要素变化不大的前提下,每年的水位流量关系具有稳定性;高崖水文站基本顺直河道的测验断面不稳定,历年实测流量数据的总体分布存在显著性差异,即每年的水位流量关系会存在一定的差异,不具备率定历年综合关系曲线的条件。故可以采用正义峡水文站2012 年~2018 年实测流量数据,率定历年综合水位-流量关系曲线。 正义峡水文站2012 年~2018 年畅流期实测流量数据共239 测次,经分析舍弃在水位~流量关系上不合理的测次11 个,实际参与分析的共228 测次。其中实测最低水位2.17 m,最高水位5.70 m,水位变幅3.53 m;实测最小流量0.123 m3/s,最大流量570 m3/s。根据文献[12]中黑河非汛期生态需水量最小达到多年平均流量的10%,在水位低于2.44 m 时需独立率定综合线。综合以上分析,采用水位高于2.44 m(共202 测次)的实测流量数据拟合畅流期的常规综合线;水位低于2.44 m(共26 测次)的实测流量数据拟合畅流期的生态流量综合线。 曲线拟合是指采用某种方法求出某条光滑的曲线最佳拟合数据,最小二乘法的多项式拟合原理是从整体上考虑函数q(x)=anxn+an-1xn-1+an-2xn-2……+a0同实测数据点(xi,yi)的误差平方和(SSE)最小[13],即: 从几何意义上讲就是寻求与给定点(xi,yi)的距离平方和最小的函数曲线y=q(x),具体由多元函数求解极值的方法对式(5)中多项式系数进行求解,最终得到最佳多项式拟合函数。本文衡量拟合程度的指标为均方根(RMSE)、确定系数R-square,其表达式为: 式中:SSR 为预测数据与原始数据均值之差的平方和;SST为原始数据与原始数据均值之差的平方和,确定系数越接近1,表明方程的自变量对函数的解释能力越强。 参与综合线拟合的数据点共202 个,设自变量为水位z,因变量为流量q,经过拟合分析可得最优拟合函数: 综合线的RMSE=1.2978,R-square=0.9999。为满足高水推流的要求,将拟合函数高水延伸到历年最大实测流量值850 m3/s。拟合结果见图1。 图1 畅流期常规历年综合水位-流量关系曲线 参与综合线拟合的数据点共26 个,由于在生态流量期对推流精度要求高,因此根据数据点的散点图分布情况,取其中15 个率定综合线1,剩余11 个率定综合线2。设自变量为水位z,因变量为流量q,经过拟合分析可得综合线1 的最优拟合函数: 综合线2 的最优拟合函数: 综合线1 的RMSE=0.1178,R-square=0.9877;综合线2的RMSE=0.0772,R-square=0.9938。拟合结果见图2。 图2 畅流期生态流量历年综合水位-流量关系曲线 根据《水文资料整编规范》中定线精度要求,稳定的水位流量关系曲线应计算实测点对关系线的随机不确定度和系统误差,且一类精度水文站的系统误差绝对值小于1%;随机不确定度小于8%。经对前文得到的综合水位-流量关系曲线误差计算,可得表3。 表3 水位流量综合关系线型定线精度 正义峡水文站2019 年1 月~2020 年4 月畅流期实测流量共5 测次,应用本文畅流期常规历年综合线进行推流,可得数据对比表4。 表4 实测流量与综合线推流对比 由表3 可得,本文拟合的综合线定线精度符合规范要求;由表4 可得,相对误差均小于规范要求。 本文采用多样本k-w 非参数检验对河床基本稳定的正义峡和测验断面处河床不稳定的高崖水文站的参与综合线拟合的多样本数据进行对比分析,得出正义峡水文站历年实测流量多样本数据的总体无显著性差异,而高崖水文站历年实测流量多样本数据的总体有显著性差异,故可以采用正义峡水文站历年实测流量率定历年综合水位-流量关系曲线;按照q=f(z)函数对实测数据进行拟合分析,率定畅流期水位高于2.44 m 综合线一条;水位低于2.44 m 的生态流量期综合线2条,拟合指标均较好;经过相关检验误差分析,均符合规范要求。 根据本文分析结果,可得出历年综合线在低水期并非单一线;参与率定综合线的样本数据来自一个总体,在水力要素不发生大的变化前提下,关系线稳定不变。该方法适用于测验断面处河床基本稳定的天然河道。本研究拟合的历年综合水位-流量关系曲线为单一函数曲线,可作为流量自动化监测的技术支撑。 不足之处:本研究只是针对畅流期进行历年综合关系线定线分析,没有对非畅流期的关系线分析;测验断面基本稳定,而在水位较低时会出现不同的历年综合关系线,本文并没有对其产生的深层原因做分析说明。2.2 实测流量多样本同分布分析
3 历年综合水位流量关系曲线拟合
3.1 拟合数据分析
3.2 畅流期常规历年综合关系曲线
3.3 畅流期生态流量历年综合关系曲线
4 误差分析
5 结论与讨论
5.1 结论
5.2 讨论