杨 俊,周露尘
(四川省乐山水文水资源勘测中心,四川 乐山 614000)
近几十年来,悬移质泥沙测验方式主要以人工监测为主,监测方法和测验手段相对传统落后。采样器类型大多采用横式采样器、瓶式采样器、调压积时式采样器等;所测泥沙需现场取样,并将水样送到实验室分析,不能进行实时动态监测。传统的泥沙监测测量周期长、洪水期取样时机难以把握、操作过程烦琐、劳动强度大、监测成果时效低等。随着社会的发展和科技的进步,同位素测沙仪、光电测沙仪、超声波测沙仪、振动式悬移质测沙仪器等自动测沙设备先后在水文测验中得到运用,在部分站点取得了一定的效果,但产品存在安装复杂、操作繁琐、难以灵活布设等问题,且精度未能实现实质性突破,无法测量颗粒级配,仍存在应用瓶颈。
随着光学、声学技术的发展,芯视界科技研发的量子点光谱悬移质泥沙监测新技术取得突破,在多处水文站中得到试用,取得较好的效果。量子点光谱技术,以其引领未来的颠覆性技术、实现对传统对象的全自动高精度监测,可为泥沙智慧化监测提供更全面、更准确、更有效的解决方案。本文对四川省安装的第一台量子点光谱泥沙监测系统(芯禹Sedi-Q D10)在夹江水文站的运用情况进行分析。
量子点光谱进行泥沙监测,采用世界领先的量子点光谱分析技术,将量子点与成像感光元件完美结合,开发原位、实时的泥沙监测方法[1]。用量子点光谱泥沙监测终端进行泥沙监测,通过测量被研究光的光谱特性,用非化学分析的手段获得水体中特定物质的光谱信息,包括波长、强度等谱线特征,建立光谱数据与水环境各要素的映射关系,通过大数据光谱分析快速返回物质信息,从而可以不用称重获取目标水域的泥沙信息。
光谱推算含沙量的原理来源于比尔-朗伯定律(Beer-Lambertlaw)[1]。公式如下:
式中,A为吸光度;It为透射光的强度;I0为入射光的强度;T为透射比或透光度;K为吸收系数;l为光在介质中通过的路程;c为吸光物质的浓度。
Beer-Lambert定律的物理意义在于:当光穿过溶液时,会被溶液中的分子通过吸收而衰减。根据量子力学,当入射光的能量与溶质分子的能级差相匹配时,就会发生光子被吸收的现象。根据Boltzmann分布,温度一定条件下,分子处于各能级的概率固定,能级分布决定了不同波长光被吸收的程度。溶质浓度越大,能吸收光子的分子数越多,吸收越强;光路程越长,交互作用距离越长,吸收也越多。基于此,将比尔-朗伯定律对吸光物质的浓度的计算演变于对含沙量的推算。但由于水体为混合介质,包含砂砾、表面附着的颗粒、造成干扰的气泡、木屑等,比尔-朗伯定律本身无法满足含沙量的推算,可以通过机器学习方法在光程一定的前提下训练出吸光度与含沙量的函数映射关系进而推算出含沙量。
推算公式为:
A=K1c1l+K2c2l+K3c3l+….+Kicil=Kcl
式中,Ki为第i种成份的吸光系数;ci为第i种成分的浓度;c是混合物总浓度;l为光在介质中通过的路程;K为等效折合吸光系数。
如果知道等效折合吸光系数,混合物总浓度可以按下式计算:
c=A/Kl=f(A)
利用米散射原理,测量混合溶液在不同方向或者不同波长的散射系数,即可识别泥沙的粒径。原则上,测量泥沙混合溶液在连续谱段的散射系数即包涵了泥沙种类和丰度的信息,对有限泥沙种类空间,可以通过数据驱动有监督学习方法训练出吸光度谱到泥沙总含量的映射关系,从而建立由水样的吸光度谱推测泥沙含量的算法模型。
表1 量子点光谱泥沙监测系统主要参数统计
夹江水文站设立于1936年,属国家重要水文站,是青衣江干流出口控制站,地处乐山市夹江县青衣街道千佛社区。隶属长江流域,大渡河青衣江水系,集水面积12 588 km2,域内河长245 km,至河口距离34 km。监测项目包括:水位、流量、泥沙、降水、蒸发、水温、水质。
(1)断面情况:夹江水文站基本水尺断面与流速仪测流断面重合,自建站以来基本断面未发生过迁移,断面呈“U”形,两岸为陡岸岩石,河底为沙卵石组成,断面有冲淤变化。下游约200 m处滩地为本站良好的中低水控制断面,再下游1 km处有铁路桥为本站高水控制。近5 a夹江站断面冲淤变化为-0.9%~6.2%。高水时水面宽为290 m,中水时水面宽为270 m,低水时水面宽为150 m左右,整个河段水面宽度变化不大。上游2 km为千佛岩电站尾水渠,区间为千佛岩景区,下游为毛滩电站库区。
(2)泥沙监测:夹江水文站的泥沙任务为悬移质单沙和悬移质输沙,主要取沙方法采用瓶式积深法。单沙测验在起点距100 m处取样,枯季或平水期含沙量较小时,采用人工取样2~5 d一次进行含沙量监测;汛期,每次洪水过程泥沙监测5~8次,洪峰与沙峰不一致时或含沙量变化较大时适当增加泥沙监测频次,特别是在含沙量变化转折处加密测次;枯季含沙量变化较小时,6~15 d取样一次,测次分布满足单断沙关系整编定线要求。
青衣江干流水电站众多,特别是受汛期电站关放水影响,悬移质泥沙变化改变天然状态规律,分布变化杂乱无章,相关关系极不稳定,夹江水文站断面含沙量横向分布不均匀,单断沙关系洪水期间影响较大,高沙监测存在一定难度。
为保证量子点光谱泥沙监测系统的正常运行及人工自动同步数据的准确性,夹江水文站在基本水尺断面左岸修建专用监测设备平台。根据夹江水文站多年低枯水水位及流速大小分布,确定水下探头的安装位置和高程,保证探头常年处于水下淹没状态,且低枯水设备位置有一定流速,确保自动泥沙数据的正常监测和记录。
量子点光谱泥沙监测设备于2023年5月正式安装完成,位置位于起点距21 m,水下405.70 m水深处(如图1所示),水位低于常年最低水位,安装固定位置不受泥沙淤积影响。
图1 水下探头安装断面位置示意
模型框架主要包括从数据预处理到特征工程再到模型选择最后到模型优化和模型测试等一系列流程,如图2所示。
图2 含沙量推算模型框架示意
建模步骤包括实际问题转化数学问题、数据获取、数据清洗、模型选择、模型优化等[1]。
(1)实际问题转化数学问题:含沙量预测问题转化为机器学习回归任务,以量子点光谱信息作为输入,含沙量作为输出构建机器学习模型并预测含沙量。
(2)数据获取:数据主要来源于量子点光谱终端测量结果,标签来源于人工采样测量。基于数据标签所对应的时间间隔,从数据库中选择该时间间隔内所有的光谱数据。
(3)数据清洗:数据清洗包括异常值诊断和异常值处理。根据物理常识和先验经验诊断异常值并剔除。
(4)模型选择:采用不同的机器学习回归模型对光谱指标和含沙量进行训练并测试。主要模型包括线性回归模型,集成模型和平均模型等。
(5)模型优化:对于集成模型,可以调节树模型的深度,树模型的个数,叶节点的个数,正则化系数等操作解决平衡模型欠拟合和过拟合问题。对于线性模型可以引入惩罚项系数控制模型过拟合问题,或者增加其他人工特征提高模型准确度。
2023年5月自动测沙设备安装好后,随即开展数据采集分析,由于5-6月水位较低含沙量小,一直处于设备调试阶段。7月1日开始在同位置进行人工取样数据监测,并记录同时段自动测沙数据,用于模型建立与分析。表2为2023年7月人工取样数据,根据人工取样数据对夹江水文站自动测沙进行模型建立。
表2 2023年7月人工取样数据
表3 2023年 8月人工取样及自动采集数据对比
夹江站的泥沙监测模型框架基于长江委与芯视界联合开发的长江通用模型,长江通用模型的研发基于长江上、中、下游的10个国家站200多天、300多次比测和17万组光谱数据,长江通用模型整体适用于长江流域的泥沙监测。长江通用模型采用超参数用于适应区域间的空间不一致性,本次比测通过1-7组泥沙数据拟合,第8组数据处于泥沙峰值前后,由于泥沙含量变化显著未使用此数据用于模型调试。用于调整长江通用模型的超参数以适应夹江站的本地泥沙特征。
模型拟合后的效果如图3所示,模型调试期间发生洪水1次,发生沙峰2次。8组人工采样数据中2组数据(1,2)处于低含沙量区间,6组数处于洪水期,且3组取样在第一次沙峰(3-5),3组取样在第二次沙峰(6-8)。整体取样涵盖了测点处不同含沙量的水样,有较高的代表性,且调试后模型趋势与人工法趋势存在显著正相关,相关系数达到0.75。
图3 夹江水文站洪水过程泥沙建模示意
模型建立后,8月份继续采用人工取样与自动测沙同步对比分析,主要经历1场洪水过程,对比分析测点均匀分布于洪水过程,洪水过程及对比测点分布见图4。
图4 同步取样点分布及泥沙过程示意
根据8月水沙变化过程,共同步对比测量数据21份,期间经历完整洪水过程。
根据人工数据与自动数据的比值进行平均计算,21组样本分析得出人工取样与自动测沙相关关系为:
Cs单=0.950 1×Cs自动
人工取样数据与自动测沙数据相关关系(见图5)及相关关系检验如下(见表4)。
图5 人工取样与自动测沙相关性分析
根据上述结果进行相关关系检验[2],未通过检验,其中随机不确定度较大但系统误差小,分别为42.6%和0.0%。主要原因为低沙部分偏离较大影响,完整洪水过程中的4组含沙量较大测点相关关系较好。通过对仪器设备安装位置、测验河段情况、对比取样过程等进行分析,产生较大误差的对比测点可能存在以下问题:洪水期间受电站泄洪及左岸尾水渠溢水影响,造成监测断面位置泥沙分布不均匀;自动设备测沙时间较短,且人工取样和自动测沙不完全在同一位置,且含沙量较小,低沙误差较大。
舍弃部分低水含沙量偏差在20%以上的测点后重新进行检验分析,见表5。
表5 8月人工取样及自动采集数据对比
人工取样数据与自动测沙数据相关关系图如下(见图6)。
图6 人工取样与自动测沙数据相关关系
根据上述结果进行相关关系检验[2],通过检验。标准差Se=5.0%,随机不确定度为10.0%,系统误差0.0%。检验情况见表6。
表6 人工取样与自动测沙相关关系检验
夹江站共计21组数据参与模型计算,实际含沙量范围0.049~1.81 kg/m3,采用光谱参数与含沙量建立回归模型,通过模型计算优选,最终系统误差为0,随机不确定度为 10.0%,满足一类精度水文站悬移质含沙量监测精度要求[3]。相关关系如下:
Cs单=0.963 1×Cs自动
利用光谱推算含沙量的方法最终是否能在大江大河主要控制站泥沙实时监测中推广使用,关键在于其含沙量比测精度是否满足国家现行相关标准规定要求。本次夹江站量子点光谱含沙量比测精度是以水文泥沙测验中常规的瓶式采样器汲取河水水样的方式,水样运送到室内采用“烘干称重法”进行处理分析成果近似“真值”的对比精度。通过对比分析试验结果可以看出,量子点光谱仪测验悬移质泥沙是可行的,且具有较高的精度。目前,从全国范围看,浊度计、激光测沙、声学测沙等在线监测进行了大量研究试用,取得了一些效果和一些应用,但其精度和应用瓶颈尚没有取得实质性的突破,芯视界量子点光谱泥沙监测系统具有光谱信息丰富优势,含沙量推算模型具有较好的泛化能力,在比测中已表现出优于以往泥沙在线监测精度。通过后期进一步进行产品适应性改造、算法调整、模型优化,量子点光谱仪会有更高的悬移质含沙量测验精度,更进一步在水文中得到广泛推广和应用,为泥沙测验带来“颠覆性”的技术。
(1)仪器设备安装位置应垂
直于水流方向且避开死水,安装高度应低于历年最低水位,上下游岸坡位置尽量顺直且没有干扰水流流向流速的物体。
(2)监测系统测量间隔为10 min/次,且为瞬时测量,就运行情况和测得的数据来看,存在一定的偶然误差。建议根据最短测沙间隔历时进行一定次数的测量,取得的测沙数据采用期间数据的平均值。如10∶00数据,采用9∶50/10∶00/10∶10三次数据平均值;或改为5 min/次测量频次,前后共5个数据进行平均处理。
(3)本次在夹江水文站对比分析量子点光谱泥沙监测系统测得的最大含沙量为1.81 kg/m3,对比分析建模含沙量相对较小,夹江水文站常年洪水含沙量最大值在5~10 kg/m3,历史最大含沙量可达40 kg/m3左右。后续将继续深入开展人工取样与量子点光谱泥沙监测对比分析工作,重点比测部分应至少经历2场完整的洪水沙峰过程,且测点应分布均匀。
(4)除加强量子点光谱泥沙单次监测对比分析外,还要加强单沙和断面平均含沙量规律的分析研究,以保证泥沙断面的测验精度。