基于逻辑回归模型的流量计算方法优选

2024-05-14 14:00左一鸣颜恩祝占寅秋
水利水电快报 2024年4期

左一鸣 颜恩祝 占寅秋

摘要:在推求水位流量关系时,不同水流状况适用的计算方法往往不同。为自动优选流量计算方法,以新安江水库库区街口水文站为研究对象,提出了基于逻辑回归模型的流量计算方法优选模型。分别采用二线能坡法和落差指数法进行流量计算,借用逻辑回归模型的大数据分析,依据实时水流状况进行流量计算结果优选,并根据率定结果自我学习,不断优化参数,提升优选准确率。结果表明:新安江水库库区回流状况的准确判定对流量计算结果精度影响较大,模型能够依据实时的上下游水位差、代表线流速等水流状况判断当前水流是否出现回流,从而智能优选流量计算方法。该方法推流结果合理,精度高于单一算法。

关键词:流量计算; 逻辑回归模型; 落差指数法; 二线能坡法; 街口水文站; 新安江水库

中图法分类号:P332.4 文献标志码:A DOI:10.15974/j.cnki.slsdkb.2024.04.002

文章编号:1006-0081(2024)04-0014-06

0 引 言

街口水文站为国家基本水文站,是新安江水库入库控制站和浙皖省界的水量控制站,监测的流量数据是新安江流域水量分配、生态流量管理、水资源统一调度和取用水总量控制的重要依据。街口水文站位于新安江水库库区,受上游来水及库区回水顶托综合影响,其水位流量关系曲线为复杂的绳套型曲线,科学确定两者关系是难点[1-2]。近年来,随着水文信息化的快速发展,对洪水水量快速监测提出了更高的需求。在满足现有洪水监测精度的前提下,通过精简测流垂线提升监测时效,以及应用二线能坡法[3],水文监测工作取得了一定的成效,但是该算法仍不能全面适用有回流的河道断面情况。为考虑回水顶托对流量的影响,可采用落差指数法[4-6],但是其适用于水流比降不大的情况,对于洪水期断面上下游比降较大的情况,测流误差较大。因此,针对街口水文站测验断面的具体测验环境状况及断面水流实时情势不同,需要一种可智能寻找出与当前水流情势匹配的流量计算方法,来满足街口水文站流量“全量程”自动监测需求。近年来,采用大数据算法开展径流预报与分析,已取得一定的效果[7-9],但是应用于水文监测的成果较少。本文采用基于逻辑回归模型的非线性大数据分类算法进行断面流量计算方法的自动优选,在满足街口水文站水文监测时效的基础上,进一步提升监测精度。

1 研究方法

1.1 落差指数法求解断面流量

将河道内水流假设为一维非恒定流,水位流量关系呈逆时针方向的绳套曲线关系。为将该绳套曲线进行单值化处理,以落差法为基础,通过优选落差指数β,并建立水位与流量同落差指数β次方之比的关系曲线来推求流量。该方法适用于断面基本稳定、落差具有代表性、受变动回水或受变动回水及洪水涨落综合影响的测站。

天然河道的洪水演进可用圣维南方程组描述。1977年,Ponce和Simons将洪水波根据动量方程各项的取舍分为运动波、扩散波、惯性波、恒定动力波以及动力波,并提出在平原河流,底坡较缓的河道水流以扩散波的形式向下游演进[10]。对于扩散波,惯性项ut+u2x相对于附加项hx可以忽略,流量Q简化形式为

1.2 二线能坡法求解断面流量

二线能坡法适用于测流河段顺直、稳定、水流集中,无分流、岔流、斜流、回流、死水等现象的河段,其原理是通过两条实测垂线流速获取垂线能坡参数值,把常规流量测验施测多条垂线流速变为计算多条垂线流速,最后通过流速面积法计算出断面流量。

各垂线流速的计算是根据每条垂线的水深和所处的起点距位置,分解为若干个虚拟矩形和三角形断面(图1)。

如图1所示,ABCD为垂线EF对应的虚拟矩形,ADE为垂线EF对应的虚拟三角形。虚拟矩形和三角形流速计算见式(10)和式(11):

式中:V矩(左)、V矩(右)、V三角形(左)、V三角形(右)为流速垂线对应虚拟矩形(三角形)左(右)两部分的平均流速,m/s;n(左)、n(右)为流速垂线对应虛拟矩形(三角形)左(右)两部分的糙率;R(左)、R(右)为流速垂线对应虚拟矩形(三角形)左(右)两部分的水力半径,m;V三角形(右)为流速垂线对应虚拟矩形断面流速修正系数;β(左)、β(右)为流速垂线对应虚拟三角形左(右)两部分的边坡系数改正值;S为能坡参数。

V垂(左)=V矩(左)-(V矩(左)-V三角形(左))A(左)A′(左)

V垂(右)=V矩(右)-(V矩(右)-V三角形(右))A(右)A′(右)

(11)

式中:A(左)、A(右)为虚拟矩形(三角形)断面左(右)两部分不透水面积,m2;A′(左)、A′(右)为流速垂线左(右)两边所对应的虚拟矩形和三角形面积之差,m2。

V垂=V垂(左)+V垂(右)2(12)

根据公式(12)计算出每条垂线流速后,通过流速面积法计算出断面平均流量Q。

Q=∑ni=1ViAi (13)

式中:Vi为第i部分两垂线的平均流速,m/s;Ai为第i部分断面面积,m2。

1.3 逻辑回归模型自动优选断面流量计算方法

逻辑回归是一种用于解决二分类问题的机器学习模型,其反映了一个因变量与多个彼此独立的自变量之间的回归关系。本文通过逻辑回归模型对断面流量计算方法进行自动优选,首先选定街口水文站流量、街口水文站水位、上游正口水文站水位、正口水文站与街口水文站水位落差4个指标作为特征,每次测量优选的方法作为标签;其次是根据率定数据计算参数ω,b,由此确定逻辑回归模型,在验证数据上根据率定好的公式(14),分别计算落差指数法和二线能坡法的概率,概率大者即为该次选定计算的方法。

2 实例分析

2.1 街口水文站概况

街口水文站位于安徽省黄山市绩溪县境内,紧邻省际边界,为新安江水库入库控制站。新安江水库是1959年新安江水电站建成后形成的人工湖,集水区面积达10 442 km2,占新安江流域总面积的86%。街口水文站监测项目有水位、流量和降水等。测验河段较为顺直,长度约1.9 km。基本水尺断面上游1 km、下游0.9 km各有大拐弯。主槽约110 m,河床主要为砂石,水域宽阔,测验断面宽约240 m,历史最高水位108.39 m,调查最大流量13 400 m3/s。水位和流量非洪水期间主要受下游

新安江水库回水顶托影响,属于典型受水利工程

调度影响和下游水库回水顶托影响的水文站,符合采用落差指数法定线推流的条件,洪水期间无分流、岔流、斜流、回流、死水等现象,也符合二线能坡法推流条件。

2.2 落差指数法流量计算

采用2023年街口水文站28组实测资料进行参数率定,分析街口水文站流量与街口水文站水位、上游正口水文站水位、正口水文站与街口水文站水位落差之间的关系。其中,街口水文站水位范围为102~104 m,流量范围为200~2 100 m3/s。计算正口水文站和街口水文站水位落差,落差范围为0.04~0.22 m。采用非线性回归方法拟合实测流量、水位和落差关系,综合比较拟合效果及方法复杂度等因素,成果见图2。

式中:Q为流量,m3/s;Z为街口水文站实时水位,m;Δz为街口水文站与正口水位落差(上下游水位落差),m。

选取5组数据进行验证,结果见图3。4组数据误差在15%以内,最大误差在20%左右。经综合分析率定与验证断面数据,流量大于600 m3/s时,断面受回流顶托效应较小,落差指数法理论推导中忽略惯性项与实际不符导致误差增大。

2.3 二线能坡法流量计算

采用2023年街口水文站28组实测资料进行参数率定,各垂线糙率为0.02~0.03,由率定及验证结果知,总体上流量大于1 000 m3/s时,二线能坡法流量计算精度大于落差指数法,特别是洪峰流量拟合误差在3%以内,经分析主要是断面流量大于1 000 m3/s时,断面不再出现回流现象,随着流量的增大,水流状况逐步接近二线能坡法适用条件,详细数据见表1,率定及验证结果见图4~5。

2.4 逻辑回归模型自动优选断面流量

选取街口水文站水位、街口水文站上游正口水文站水位、街口水文站断面两条垂线流速为特征,根据落差指数法和二线能坡法分别计算流量并与走航实测流量进行对比,取误差较小的方法为标签,详细数据见表1。通过逻辑回归模型进行学习,学习后的模型选择效果可由ROC曲线表示,曲线下方部分的面积被称为AUC,用来表示预测准确性,AUC值越高,也就是曲线下方面积越大,说明预测准确率越高。曲线越接近左上角(X越小,Y越大),预测准确率越高。

如图6所示,模型选择对应的AUC值为0.81,结合图4、图5率定与验证的成果可以看出,逻辑回归模型优选的流量精度有所提升。

3 流量误差分析

根据逻辑回归模型及相关流量计算方法拟合的关系曲线方程,分析走航ADCP实测值和拟合计算值的相对误差,详细数据见表1。14组实测数据资料的相对误差在±10%以内,系统误差为0.03,通过适线检验和偏离数值检验(t=-1.56)。与二线能坡法推流对比,计算精度有7%的提升,与落差指数法推流对比,计算精度有29%的提升。综上,结果表明该方法可行。同时,分析误差产生的原因主要有以下几点。

(1) 落差指数法理论误差。2023年街口水文站28次走航ADCP实测流量率定结果显示:流量小于600 m3/s时,断面受新安江水库回水顶托影响,水位流量关系一般为复杂的时序型绳套曲线,采用落差指数法忽略惯性项求解,可简化计算,基本符合实际。当流量大于600 m3/s时,忽略惯性项求解导致误差增大。

(2) 二线能坡法理论误差。2023年街口水文站28次走航ADCP实测流量率定结果显示:街口水文站流量大于1 000 m3/s时,二线能坡法求解流量与走航ADCP實测流量误差较小,经分析主要是断面流量大于1 000 m3/s时,断面不再出现回流现象,随着流量的增大,水流状况逐步接近二线能坡法适用条件。当流量小于1 000 m3/s时,受新安江水库回水顶托影响,误差增大。

(3) 统计误差。二线能坡和逻辑回归计算方法是根据2023年28次实测数据进行率定的,受自然条件等影响,流量覆盖范围不广,数据量偏小,会对二线能坡法的糙率、逻辑回归模型的逻辑回归系数等率定结果产生一定误差。

4 结 论

(1) 本文分别采用落差指数法和二线能坡法求解街口水文站断面流量,从理论和实践上均证明,单一流量求解方法不能很好地适用断面各种水流状况,利用多种流量计算方法协同计算才能进一步提高监测精度。

(2) 落差指数法和二线能坡法流量适用阈值是根据2023年街口水文站28次走航ADCP实测流量率定确定的,数据量较小,且该阈值会随着水流情势的改变而变化,因此不能简单地将固定流量大小作为选择流量计算方法的标准。

(3) 本文采用的逻辑回归模型是一种非线性回归分析模型,属于机器学习中的监督学习,广泛应用于数据分析领域。这种方法能根据水流状况自动优选流量计算方法,较单一算法流量计算方法精度提升,且随着今后比测流量数据的累积,能够通过学习进一步提高监测精度,能为“全量程”流量监测提供技术支撑,成果可为省界断面生态流量考核和新安江流域水量分配方案的实施提供参考。

参考文献:

[1]贺延虎.荆江河段沙市(二郎矶)站水位流量关系单值化方案优化分析[J].水利水电快报,2023,44(1):23-27.

[2]王汉卿,张春林.基于曼宁公式影响因子相关分析的洪水流量计算——以洮河流域为例[J].水利水电快报,2023,44(2):29-34.

[3]陈艳,杨逸,姚红军,等.二线能坡测流法能坡测速垂线组合分析[J].水文,2022,42(5):62-64.

[4]李正最.水位流量关系中落差指数法的直接解算方法[J].水电站设计,2001(9):6-8.

[5]程海云.推进新时代长江水文高质量发展体系建设构想[J].人民长江,2023,54(1):88-97.

[6]徐卫东,程公德,毛新伟,等.落差指数法在水文站自动测流中的应用[J].水利水电快报,2022,43(8):38-41.

[7]姬战生,张振林.基于卷积神经网络的钱塘江涌潮潮时预报[J].人民长江,2022,53(12):83-87,103.

[8]王镜淋,王敬,沈来银,等.基于人工神经网络的长期径流预报模型研究[J].水利水电快报,2023,44(9):6-10.

[9]杨锟,张文江,宋克超.资料长度对深度学习方法日径流预报效率的影响[J].人民长江,2023,54(3):83-89.

[10]PONCE V M,SIMONS D B.Shallow wave propagation in open channel flow[J].Journal of the Hydraulics Division,1977,103(12):1461-1476.

(编辑:江 文)

Optimization of flow calculation methods based on logistic regression model

ZUO Yiming,YAN Enzhu,ZHAN Yinqiu

(Bureau of Hydrology (Information Center),Taihu Basin Authority,Shanghai 200434,China)

Abstract: When calculating the relationship between water level and discharge,different flow conditions often apply different calculation methods.In order to realize the intelligent selection of flow calculation method according to the flow,taking Jikou Hydrology Station of Xin′anjiang Reservoir area as research object,the optimization of flow calculation method based on logistic regression model was proposed.Firstly,the two-vertical energy slope method and the fall exponent method were used for the flow calculations.Secondly,the logistic regression model based on big data analysis was used to optimal selection the push flow calculations based on real-time water flow conditions,and self-learning based on the calibration results can continuously optimize the parameters to improve the accuracy of selection.The results indicated that the accurate determination of the return flow situation in the reservoir area had a significant impact on the accuracy of the flow calculations.The model can determine whether the current water flow had returned based on the real-time upstream and downstream water level differences,representative line flow rates,and other water flow conditions,thus conducting intelligent optimization.The streaming results were reasonable and had a higher accuracy than using a single algorithm for streaming.

Key words: flow calculation; logistic regression model;fall exponent method; two-vertical energy slope method; Jiekou Hydrological Station;Xin′anjiang Reservoir

收稿日期:2023-10-08

作者簡介:左一鸣,男,高级工程师,博士,主要从事水文水资源信息采集、处理及分析研究工作。E-mail:632287713@qq.com