地表水水质自动监测预警方法初探

2022-08-06 13:23嵇晓燕孙宗光杨凯姚志鹏陈亚男安新国董雅欠王正
环境监控与预警 2022年4期
关键词:监测数据阈值预警

嵇晓燕,孙宗光,杨凯,姚志鹏*, 陈亚男,安新国, 董雅欠,王正

(1.中国环境监测总站,北京 100012;2.北京金水永利科技有限公司,北京 100012)

地表水水质自动监测预警是指通过地表水水质自动监测数据对水质状况的历史和现状进行定性、定量分析和评价,对其未来发展状况进行预测,并对可能出现的恶化趋势进行预报,适时给出水质状态恶化的各种警告信息,以便对未出现或即将出现的水质问题给出防范措施[1]。国家地表水环境质量监测网已建设了1 900余个地表水水质自动监测站,结合各省市建立的水质自动监测站,我国已经初步形成了覆盖范围广泛、监测指标比较全面的地表水水质自动监测网络,为我国地表水水质自动监测预警提供了数据基础。

目前,国内外对地表水水质自动监测预警的研究主要有3个方向:一是社会经济环境复合系统的作用机理研究;二是计算机技术在水环境预警领域的应用研究;三是水环境预警的理论和方法研究[2]。在国家地表水环境质量监测网建设过程中,我国开展了地表水水质自动监测预警理论研究,并结合国家水质自动监测网的建设,在监测数据质量异常判定、突发事件水质预警、跨界重点断面水质预警等领域进行了有益探索,并实现了部分业务化应用。现基于我国地表水水质自动监测现状,以及前期水环境预警理论研究成果,结合人工智能技术在水环境预警领域的应用,探讨综合利用地表水环境质量数理和机理模型进行水质自动监测预警的方法体系。以期提升我国水环境风险预警能力和应急响应速度,为我国地表水环境的科学管理与风险应对提供技术支撑。

1 水质自动监测预警技术路线

地表水水质自动监测预警过程是以水质监测数据为基础,基于不同预警方法分别建立预警模型,并进行自动监测预警[3]。其技术路线见图1,包括以下4个主要步骤。

图1 地表水水质自动监测预警技术路线

(1)水质自动监测数据集成。通过自动站系统通讯协议或与水质自动监测平台的数据接口,实时集成水质自动监测数据,作为水质自动监测预警的数据基础[4]。

(2)水质异常数据判定清洗。水质自动监测预警需要通过自动快速的监测数据质量控制方法保障参与预警模型计算的数据质量。需要建立数据质量异常判定模型对在线监测数据进行分析,主动发现并清洗异常值,从而形成经过自动质控的地表水水质自动监测预警数据集,为水质自动预警运算提供准确有效的监测数据[5]。

(3)水质预警模型运行。根据不同水体的具体预警需求,选择和配置不同的模型组合,包括突变型预警模型和渐变型预警模型,通过预警模型对自动监测预警数据集进行分析并生成预警数据。首先需要进行预警模型建模,选择恰当的预警模型,并通过机器学习方法,利用历史数据对模型进行率定,建模完成后进入预警阶段,通过预警模型分析实时监测数据并产生预警结果。如产生水质预警,将启动预警信息处理流程,进行预警信息处理;如未产生预警,则等待新的自动监测数据,进入下一周期的预警流程。

(4)水质预警信息处理。预警模型运行中若产生警情,将提示预警信息,相关部门可以基于规则,启动相应的事件处理流程。

2 水质自动监测数据集成

水质自动监测数据是地表水水质自动监测预警的基础,根据系统部署架构的不同,地表水水质自动监测数据的集成主要通过2种方式[6]:(1)数据直接来源于水质自动监测站,通过自动站系统通讯协议直接传输入库;(2)数据来源于独立的水质自动监测平台,通过建立数据库接口等方式,从水质自动监测数据库获取。集成的地表水水质自动监测数据存储进入数据库并按照自动监测预警模型运行的数据结构进行组织,形成地表水水质自动监测预警数据集。地表水水质自动监测数据集成流图见图2。

图2 地表水水质自动监测数据集成流图

3 水质异常数据判定清洗

地表水水质自动监测数据的质量控制是准确进行水质预警的保障,直接关系到预警结果的可靠性,影响管理决策的科学性。因此,对自动监测数据进行异常值判定,及时发现并清洗异常数据,为水质预警提供准确有效的数据基础是整体方法体系中重要的一环,数据质量是否异常可以通过以下几方面判断[7]。

(1)监测仪器运行状态异常。参考水质自动监测站的数据审核规则,根据其仪器运行状态、仪器状态量、设备质控状态、运维状态、动力环境参数等信息,进行数据质量异常判定。在监测时段出现电源供电电压异常、水泵状态异常或监测设备处于运维状态等情况,则该数据判定为异常。在实际运行中,具体预警参数的设定可以基于审核规则并结合实际水质与水质自动监测站运行情况进行调整。

(2)监测数据超出仪器量程。监测数据超出仪器设备测量范围时,如出现pH值>14,或者污染物浓度结果为负值等情况,该数据应根据水质自动数据修约规则进行处理并确定是否判定为数据异常。

(3)监测数据长时间不变。正常水质在线监测数据会随时间出现波动,如果监测数据在连续几个监测周期内保持不变,数据图形为直线,通常是由于监测设备或系统故障导致,状态核实后可判定为数据异常。

(4)监测数据剧烈波动。监测数据在连续的几个监测周期内出现剧烈的上下波动,通常是由于设备故障导致,可以判定为数据异常。监测数据波动范围阈值可以根据断面水质数据统计特征设定,设定范围应远大于该断面水质的日常波动范围,避免出现异常值误判,导致对水质污染事件的漏报。

为了减少误报,保证预警准确性,通常需要对连续几组数据进行分析判定,异常值判定的周期和阈值应根据不同断面的数据特点设定。异常值应按规则进行剔除清洗或数据修约,经过异常判定与清洗的有效数据集则将参与水质预警计算。

4 水质预警模型建立与运行

在建立地表水水质自动监测预警体系过程中,需要将各种不同预警模型组合构成预警模型组,各模型间互相验证,实现多种方法、多个角度的监控预警,从而保证水质预警的可靠性与准确性,减少误报、漏报情况的发生[8]。

4.1 预警模型分类

从警情发生状态的角度,将地表水水质自动监测预警模型分为突变型预警和渐变型预警[1]。

4.1.1 突变型预警

突变型预警是针对某个时刻突然发生的水质异常情况进行预警,可分为单因子预警和多因子预警。其中单因子预警是指通过地表水水质自动监测的特定单一指标的数据及其变化情况进行分析,如果监测数据或其变化率突破阈值,意味着某种警情已经或即将发生,应及时发出预警信息。单因子预警主要是针对直接监测指标的变化进行预警,适用于已知污染物导致的水质污染事件,具有指向明确、反应灵敏的特点,其预警模型原理简单、见效快、容易实施。单因子预警模型可以分为固定阈值和动态阈值2种类型,由预警模型进行实时分析,当实时监测数据触发模型预警条件时进行预警[9]。

多因子预警则是指通过地表水水质自动监测的某几项指标组合进行的预警,首先需要合理选择预警指标组合,并根据所选定的指标组合监测数据进行实时综合分析和评价后发出预警。在无异常情况下,断面水质监测因子数据间的关系保持相对稳定,当发生突发性污染事件等水质异常情况时,即使污染物本身未被直接监测,但可能会对其他监测因子造成影响,改变原有数据规律,因此对监测因子组合数据关系进行分析可以发现潜在的水质异常[10]。在地表水水质自动监测预警体系中,多因子预警是对单因子预警的有力补充,能够在自动监测指标有限的情况下尽可能多地发现潜在风险。

4.1.2 渐变型预警

在水质自动监测预警工作中,可根据实际需要,采用不同模型分别进行建模和调度运行,组成综合预警模型组进行水质预警。预警模型所产生的预警信息可以与数据审核流程相结合,通过数据审核排除因仪器故障或质控等原因导致的预警,从而保证预警信息的准确性,并协助提升数据审核效率。地表水水质自动监测预警方法体系见表1。

表1 地表水水质自动监测预警方法体系

4.2 水质突变型预警

4.2.1 单因子预警模型

4.2.1.1 固定阈值预警模型

固定阈值类模型是指预先设定预警阈值,如根据水质评价等级、水质考核目标等预设固定阈值,当水质监测数据超出固定阈值时进行预警。固定阈值类模型实现简单,可以作为整体预警体系中的基础模型,但是由于其不能动态反映水体水质变化规律,在地表水水质自动监测预警体系中应与其他预警模型结合使用。

4.2.1.2 动态阈值预警模型

动态阈值预警模型是指基于对监测数据的动态统计设定动态预警阈值,在水质自动监测数据超出阈值时进行预警。该方法根据不同水体的水质、水期的周期性变化规律及近期水质变化情况动态设定阈值,预警结果更符合断面的水质实际情况,弥补了固定阈值模型不能及时反映断面水质实际变化的不足。动态阈值预警模型可分为以下3种。

(1)周期统计阈值预警。在建模阶段,根据断面历史监测数据,按季节、水期等周期性指标对监测数据进行统计,根据统计结果形成经验型统计阈值,当实时监测数据超出统计阈值时进行预警。周期统计阈值可以按照不同季节(水期)水质监测数据的均值加上标准差倍数的方式确定,所设定的标准差倍数应按照断面水质特征进行分析。

(2)滑动平均阈值预警。计算近期水质监测数据的滑动平均值,确定断面近期水质变化范围并动态设定预警阈值,当实时监测数据超出预警阈值时进行预警。滑动平均预警阈值按照监测数据的滑动平均值加标准差倍数确定,滑动平均时间窗口、标准差倍数应按照断面特征具体分析[3]。

(3)相邻数据突变预警。当实时监测数据相对于相邻历史数据发生较大程度的突变时,在排除数据质量因素后发出预警。相邻数据突变预警的变化率阈值可以在建模阶段根据断面水质历史数据按照水质监测数据的正态分布特征设定,避免产生大量的误报、漏报情况。相邻数据突变预警实例见图3。

夏商周时期的陶瓷作品多作为日常生活用品而存在和发展的,直到宋朝时期才逐渐的作为陈设出现于空间之中,然后经历了元明清的不断变化发展之后,几乎成为了生活中最为常见与平常的陈设物品。陶艺对工艺技法、形态、釉色等都有十分严格的要求,它是被视作一种品味和地位的代表,一般涵盖了花瓶、文具、瓷板画等器物,它们在空间陈设中起着重要的作用。

图3 相邻数据突变预警实例

由图3可见,密度图显示总氮质量浓度发生数据突变,由0.6 mg/L上升为1.0 mg/L,上升幅度达67%,超出相邻数据突变预警阈值,并且突变持续2个监测周期以上,从而提出动态阈值预警。

动态阈值预警模型考虑了水质的周期性变化,也包含了对近期水质变化的分析,可以实现水质监测指标超标前的提前预警。在建立地表水水质自动监测预警体系的过程中,可结合动态阈值预警模型和固定阈值预警模型,建立综合的单因子预警模型组。

4.2.2 多因子预警模型

4.2.2.1 多因子协同突变预警模型

当水质受到污染排放等突发因素影响时,不同监测因子的数据将发生协同变化,多因子协同突变预警模型是在综合分析所选定指标组合间变化关系后产生预警。部分指标的突变关系和对应的警情分析见表2[1]。

表2 部分指标的突变关系和对应的警情分析①

4.2.2.2 稀有数据组合预警模型

稀有数据组合预警模型是当预警因子组合中的部分或全部因子的监测数据进入该因子组合历史数据的小概率分布区域时进行报警[11]。在建模过程中,首先通过皮尔逊相关系数等方法分析水质监测数据中多因子间的相关性,并选择相关性较高的因子组合作为预警指标组合,然后通过聚类分析算法计算出特定因子组合监测数据特征在历史上发生的频率。在预警过程中对因子组合数据的分布概率进行监测,即针对组合监测数据,根据统计标准差计算多维空间距离,计算出当前组合监测值在历史中发生的频率并以密度图形式展示,若当前数据组合发生频率低于预警阈值,则判断为异常并进行预警[12]。

稀有数据组合预警实例见图4(a)(b)。由图4可见,高锰酸盐指数和氨氮因子组合产生稀有数据组合预警,即该因子组合数据在历史上发生的频率低于预警阈值。分析对应的监测数据可以发现,高锰酸盐指数突变的同时,氨氮质量浓度也呈现上升趋势,导致因子组合模式异常而发出预警。

图4 稀有数据组合预警实例

4.3 水质渐变型预警

4.3.1 状态预警模型

4.3.1.1 数据持续恶化预警模型

数据持续恶化预警是在监测数据持续恶化(污染物浓度上升,或溶解氧浓度下降)时进行预警,可采用线性回归法确认数据处于持续恶化状态,当监测数列的拟合斜率大于阈值时进行预警[13]。数据持续恶化预警实例见图5。由图5可见,通过对一段时间内的监测数据分析,确定高锰酸盐指数呈现恶化趋势并发出预警。

图5 数据持续恶化预警实例

4.3.1.2 数据关系变化预警模型

数据关系变化是针对部分水质监测因子间基于机理、统计等原理而存在特定的数据关系的情况,当预警因子监测数据渐变导致数据关系状态发生变化时进行预警。数据关系变化预警的一个典型场景是在湖库水华发生前,叶绿素a与总磷、pH值、溶解氧均无显著的相关关系,而在水华发生后,它们的相关关系显著增强,表现为直接或间接的线性关系[14]。因此,可以通过该规律,对叶绿素a与总磷、pH值、溶解氧数据进行状态分析,当发现数据关系发生变化时发出预警。

4.3.2 趋势预警模型

4.3.2.1 水质趋势预测预警模型

在水质趋势预测预警中,通过预测模型对未来水质数据进行预测,水质预测结果变化趋势超出阈值时发出预警。根据不同水体特点和基础数据状况,可以结合面源模型、水动力模型建立机理预测模型组,然后通过数理模型对机理模型预测结果进行修正,并根据最终预测结果进行水质趋势预测预警[15]。通过SWAT(Soil and Water Assessment)面源模型、EFDC(Environmental Fluid Dynamics Code)水动力模型等建立多模型水质预测机制,并对氨氮质量浓度进行预测,水质趋势预测预警实例见图6。由图6可见,氨氮质量浓度出现趋势性变化,峰值质量浓度为1.68 mg/L,可以推测为上游污染团过境并发出预警。

图6 水质趋势预测预警实例

4.3.2.2 预测偏离预警模型

预测偏离预警是通过数理模型对特定监测指标进行滚动预测,所得预测值作为预警基准值,然后以实际监测数据与预测数据进行比对,若实际监测数据与预测值偏离较大,则可能由于外来污染导致水质状态发生变化并发出预警[16]。预测偏离预警应采用基于时间序列、多元回归、神经网络等不同原理的多种数理模型组合进行预测,以避免单一模型原理缺陷导致的结果偏离[17]。

长短期记忆神经网络模型(Long Short-Term Memory neural network,LSTM)是一种具有时间循环结构的神经网络模型,适用于对时间序列数据样本进行预测分析。而误差分析模型(Differential Analysis,DA)是通过差值分析对水质指标的实际监测值与模型预测值的差值序列进行分析以确定预警阈值。采用LSTM-DA模型进行预测偏离预警,首先以历史数据进行机器学习,完成模型驯化与率定。在建模完成后,基于实时水环境监测数据,计算未来一段时间内的水质预测数据序列,在实际监测数据与预测值偏离超出阈值时进行预警。基于LSTM-DA模型的预测偏离预警实例见图7。该模型通过预测偏离能够发现多数监测数据峰值并发出预警[18]。

图7 基于LSTM-DA模型的预测偏离预警实例

5 水质预警信息处理

在水质预警模型运行中,如果产生了水质预警,则应同时生成对警兆、警情、警义的描述以及对警源的分析等预警说明,并结合监测数据形成完整的预警信息。所生成的预警信息应首先由数据管理人员进行审核,排除因仪器故障或质控等原因导致的预警,在确认预警确由水质原因触发后,应根据应急流程推送至相关人员,并基于不同的警素和警度启动相应的事件处理流程。

6 结论

基于我国地表水水质自动监测现状,初步探讨了地表水水质自动监测预警方法体系。以经过异常值判定与清洗等质控措施的水质自动监测预警数据集为基础,采用综合预警模型组开展水质预警,并对水质预警信息进行分析发布。地表水水质自动监测预警模型可分为突变型预警和渐变型预警;根据预警因子和原理不同,突变型预警又分为单因子预警与多因子预警等模型,渐变型预警则包含状态预警和趋势预警等模型。不同模型类别可采用多种不同原理的模型实现,可根据实际情况结合多种模型建立综合预警模型组,从多个角度对地表水水质的短期形势和长期趋势进行综合研判,形成综合性的地表水水质自动监测预警体系。

猜你喜欢
监测数据阈值预警
预警型智能包装在食品安全中的应用和设计
土石坝坝体失稳破坏降水阈值的确定方法
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
法国发布高温预警 严阵以待备战“史上最热周”
浅谈环境监测垂直管理的优势
辽宁强对流天气物理量阈值探索统计分析
环保验收监测异常数据的分析与处理探讨
一种改进的小波阈值降噪方法
预警个啥
北京经济社会发展月度监测数据(2008年11月)