基于神经网络模型的永安市小流域水环境质量预测的研究

2023-11-22 03:38涂新前
皮革制作与环保科技 2023年20期
关键词:高锰酸盐溶解氧监测数据

涂新前

(三明市永安生态环境保护综合执法大队,福建 三明 366000)

引 言

“十四五”以来,国家地表水监测网络采用“9+X”监测评价新体系,实行手工监测和自动监测数据融合评价考核模式,监测评价和质量控制方法发生了全新变化。2022年为了进一步完善地表水环境质量考核体系,进一步解决汛期面源污染等深层次的问题,推动实现水环境质量的持续改善,生态环境部创新性提出了汛期污染强度的考核制度,精准识别汛期面源污染强度高造成河流水质波动反弹的水体,助力对面源污染治理进行精准施策。良好的水环境状态是人类社会经济可持续发展的前提和必备因素,在河流水环境不断被污染和破坏的前提下,水质的预测工作格外关键[1]。对河流水质污染指标未来变化趋势的准确预测是水环境管理和治理一个重要手段,但在实际工作中存在着空白。

水质预测工作是根据采集到的历史水质监测数据、水文气象数据和实时水质自动站监测数据,通过构建预测模型等手段预测未来的水质变化趋势,以达到掌握水质现状及发展趋势的目的[2]。时间序列预测模型主要包括多元线性回归模型(MLR)、自回归差分移动平均模型(ARIMA)和人工神经网络法等[3]。然而由于天然河流水质指标变化通常具有不稳定性和非线性的特点,传统的统计学预测模型在水质预测方面存在一定难度。

本文基于永安市文川溪和巴溪两条重点流域历史监测数据和水质自动监测实时数据,结合气象参数、水文数据、入河排污口在线监测数据,将溶解氧、高锰酸盐指数、氨氮、总磷等4项指标作为预测对象,基于长短期记忆神经网络构建水质预测模型,对永安两条流域考核断面水质指标浓度未来变化进行预测。

1 水质模型的构建

水质预测与时间序列相关,即预测结果除了与当前时刻的输入水质指标变化有关,还与之前某一时刻或一段时间内的输出水质指标变化相关。水质问题基于时间序列存在一定的周期性和规律性,传统的全连接深度学习模型难以将时序上的关联性考虑在内。循环神经网络是一类以序列数据为输入,在序列演进方向进行递归的神经网络。与普通全连接神经网络相比,其对时序关联的问题进行了考虑,增加了记忆单元。

普通循环神经网络(RNN)模型虽然能够建立时间顺序的关联关系,但难以将跨度较大的时间关联关系纳入模型之中,对模型预测能力有较大影响。门控循环神经网络在普通循环神经网络的基础上,调整了网络结构,增加了门控机制,以控制信息在神经网络中的传递。通过门控机制来控制模型中记忆单元需要保留的信息有多少和丢弃的信息有多少,以及需要更新多少新信息到记忆单元中等。这使得具有门控机制的循环神经网络可以训练与学习相对较长跨度,具有长时间依赖关系。常见门控循环神经网络模型有:长短期神经网络(LSTM)和门控循环单元(GRU)[4]。

LSTM模型是由循环神经网络(RNN)改进后得到的,LSTM模型在RNN的基础上增加了3个门控机制,分别是“遗忘门”“输入门”和“输出门”。LSTM模型能够记忆长期依赖关系,其中输入门和遗忘门是关键。GRU模型结构相比LSTM模型更简单。GRU模型舍弃了一个门控机制,将LSTM模型中的输入门和遗忘门融合成一个新门控机制,称为更新门。更少的参数使得GRU模型训练效率更高,LSTM模型则更能记住长距离依赖,两者各有优劣,往往与具体的数据集、研究区域相关,需要经过实验来进行比较。LSTM模型在气象、环境质量和水文等多个领域得到应用,其中在黄河、鄱阳湖抚河、西丽水库等流域建立了相应的水质预测模型 。

1.1 LSTM的水质预测模型整体流程

设各水质指标按时间(t)顺序排列,将各指标数据构成一个时间序列Ci(t)=[Ci(1),Ci(2)…Ci(t)],i对应不同的水质指标,如Ci可以代表溶解氧、氨氮、总磷等,Ci(t)代表相应水质指标第t时刻的监测浓度。若以t时刻为当前时刻,n为滑动时间,则水质指标Ci的t-n时刻到t时刻的时间序列表示为:

使用单指标进行水质预测时,依据滑动时间n的大小将时间序列Ci(t)传入LSTM模型的输入层,可以得到该时间序列下一时刻t+1的预测值Pi(t+1)。例如当t=6时,预测模型使用前五个时刻的监测数据预测第六个时刻的值,即使用时间序列表示为:

预测下一时刻t+1的预测值Pi(t+1),以此类推。该模型使用Logistic作为激活函数(б),值域为(0,1),LSTM模型原理图如图1所示。

图1 LSTM模型原理图

1.2 GRU的水质预测模型整体流程

GRU采用门控机制融合历史信息与当前时刻观测记录(C)获得下一时刻的预测值p,能够有效建模时间序列的长程依赖性。输入的历史时间序列C和未来时刻预测值Y分别表示为[5]:

式中:t为时刻;d为滞后窗口;n为预测步长。

GRU模型在构建实测值和预测值间映射关系的函数f:

GRU模型中重置门和更新门使用sigmoid函数来激活(б)。GRU模型原理图如图2所示。

图2 GRU模型原理图

1.3 水质预测模型工作的基本流程

使用水质预测模型进行水环境质量预测整体工作流程为:(1)对输入模型多元数据集进行数据清洗;(2)根据历史监测数据定义一个训练集;(3)初步构建水质预测原始模型,确定模型中各项指标基本参数;(4)使用前期已有的监测数据对预测模型进行训练,基于输出相关误差评价对模型相应参数进行更新;(5)输入水质要素序列Ci的前n个数据监测值组成的序列Ci(t)到训练好的水质模型中,获得Pi的第t+1的预测值Pi(t+1);(6)随着在线实时监测数据不断输入模型,不断反向训练计算输出误差,采用反向传播算法将误差传递给模型隐藏层神经元更新权重参数。通过不断对模型训练和迭代,逐步提高模型预测的精度,当满足预设精度要求时训练完成。水质预测模型工作流程如图3所示。

图3 LSTM模型工作流程

2 永安市主要流域概况

永安市溪流密布,河流众多,主要有沙溪、尤溪、九龙江三大水系,辖区内汇流面积50平方公里以上有21条,见图4。其中沙溪、巴溪和文川溪汇流面积达500平方公里以上。

图4 永安市水系分布图

巴溪、文川溪、胡贡溪、益溪和后溪等五条主要支流汇入沙溪,流域面积占83%。文川溪发源于连城县曲溪乡经小陶镇进入永安境内,经小陶镇、洪田镇、燕西街道吉山村汇入沙溪;巴溪发源于永安市西洋乡,流经桂口村进入永安市城区汇入沙溪,流经城区10公里,永安市小流域主要概况如表1所示。河水温年变动5~33 ℃,常年平均水温为18~22 ℃。永安年平均降雨量1 538.9毫升,其中3~6月降雨量877.6毫米,占全年年降雨量50%以上,日最大降水量244.7毫米,全市多年平均径流深为755~1 061 毫升,分布特点与降水情况接近。

表1 永安市小流域主要概况

3 模型数据的输入

模型采用多元化数据采集方式,分别接入文川溪口、洪田贵湖、山峰电站、巴溪口等四个水质自动站数据。选取的水质指标为水温、pH值、溶解氧(DO)、总磷(TP)、氨氮(NH3-N)、高锰酸盐指数(CODMn)。接入两条小流域汇流流域内的9家企业的排放口(入河排污口)实时监测数据,及两条流域汇流区域内西洋镇、大炼村、上吉村、洪田镇、小陶镇等8个气象站数据(气温、气压、风速、降水)和未来7天气象数据预测;同时接入流域内外洋电站、黄历电站、洪田电站等12座水电站实时下泄流量数据。流域内面源污染主要来源于水稻种植、烟叶种植、蔬菜种植、果林、竹林和城镇生活源。

4 输入数据的处理

模型所使用的监测数据的质量,直接决定着模型预测结果的可靠性和准确率。预测模型将用到大量实时和人工监测数据,主要包括水质自动站数据、水质人工监测数据等,为了保证输入数据的有效性和足够敏感性,避免某些异常数据导致模型在计算时产生偏离。手工监测数据全部经人工审核后导入模型,自动监测数据均采用福建省生态云平台审核后的有效数据,以确保监测数据的质量,进而完成多源数据的融合入库。

基于水环境质量预测模型建设,实现对水质监测站点的监测指标(高锰酸盐指数、氨氮、总磷和溶解氧)进行预测,研判未来水质情况,实现针对各断面水质的短期预报。

5 模型评价指标

本文对于水质预测模型的预测结果做出合理评价,采用水质自动监测站实测值和模型预测结果的均方误差(MSE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)来进行量化。

均方误差(MSE)计算公式为:

均方根误差(RMSE)计算公式为:

平均绝对百分比误差(MAPE)计算公式为:

式(6)(7)(8)中pi为模型预测值,Ci为实测值,n为训练集个数。

6 结果与分析

6.1 LSTM模型预测实例

训练的数据为2021年5月至2022年文川溪口、巴溪口、洪田贵湖、山峰电站等四个水质自动站数据,同时输入2018年1月至2022年6月以来文川溪和巴溪的山峰电站、洪田贵湖、下洋村、文川溪口、巴溪口等10个监测断面手工数据进行修正,将2022年7月~12月数据作为水质模型的测试数据,2023年1月~7月作为模型预测的验证数据。为了充分验证LSTM模型的性能,使用相同数据以GRU模型作为对比模型。表2和表3展示不同模型对文川溪和巴溪两种不同类型水质中高锰酸盐指数、氨氮、总磷、溶解氧的预测结果。

表2 不同模型对巴溪水质指标预测效果对比

表3 不同模型对文川溪水质指标预测效果对比

通过对比表2和图5中LSTM模型和GRU模型在巴溪流域对高锰酸盐指数、氨氮、总磷、溶解氧的预测结果,可以较为直观地看出LSTM模型对高锰酸盐指数、氨氮、溶解氧的预测结果与实测值拟合效果较好;GRU模型对总磷的预测结果与实测值拟合效果较好。

由表2可知,LSTM模型对4项水质指标较GRU模型的预测精度高。以GRU作为比较模型,高锰酸盐指数MSE和RMES提高29.6%和15.9%,氨氮MSE和RMES降低64.3%和29.7%,总磷MSE和RMES提高2%和28.9%,溶解氧MSE和RMES提高49.6%和28.2%。

通过对比表3和图6中LSTM模型和GRU模型在文川溪流域对高锰酸盐指数、氨氮、总磷、溶解氧的预测结果,可以较为直观地看出LSTM模型对高锰酸盐指数、氨氮、总磷、溶解氧预测的趋势结果与实测值拟合效果较好。GRU模型对总磷、溶解氧的预测趋势结果与实测值拟合效果较好。

由表3可知,LSTM模型对4项水质指标的预测精度高于GRU模型。以GRU作为比较模型,高锰酸盐指数MSE和RMES提高54.3%和33.3%,氨氮MSE和RMES提高20%和10%,总磷MSE和RMES提高20%和9.1%,溶解氧MSE和RMES提高13.8%和7.4%。

通过对比LSTM模型和GRU模型分别对文川溪和巴溪的预测结果评价,LSTM模型相比GRU模型在水环境质量预测运用中具有更高的准确率。

6.2 LSTM模型效果评价

由表4可知,LSTM模型在预测文川溪和巴溪两条流域时,文川溪除高锰酸盐指数的MEAP比巴溪高10.8%,氨氮、总磷和溶解氧的MEAP分别低了29.5%、8.1%和18.6%;文川溪高锰酸盐指数、氨氮、总磷和溶解氧的MSE值比巴溪低0.86、0.22、0.003、和0.02;文川溪高锰酸盐指数、氨氮、总磷和溶解氧的RMSE值比巴溪低0.55、0.47、0.03、和0.01。

表4 LSTM模型对不同河流类型水质指标预测效果对比

LSTM模型在预测文川溪氨氮和总磷时均方误差大幅低于其他指标,预测精度较高。该流域建设了背景断面、消减控制断面和入河考核断面3座水质自动监测站,8个水电站水流量的输入和汇流区域内5个重点入河排污口在线数据实时输入,使得模型对文川溪的预测精度进一步提高。巴溪流域的模型预测效果不如文川溪,主要原因在于巴溪有10公里流经的区域在城区,城市内管网收集率不高、管网破损、污染来源多样,该流域仅在入沙溪河口建设了一个水质自动监测站,其他数据更多依靠人工监测数据的输入,给模型的预测过程增加了不确定性。

7 结论

从两个模型的预测数据和评价指标可知,LSTM水质预测模型特有的门控机制可处理长时间序列监测数据,同时拥有更多的记忆单元,可将水质季节性变化、节假日效应等因素考虑在内,提高了模型的预测能力,该模型在永安市小流域中预测趋势结果较GRU模型更有优势。LSTM模型在预测多种评价指标时,对于所预测的各时刻数据均表现出较高的精确度及稳定性。对于途径城区区域的河流,GRU模型在预测总磷和溶解氧方面精度较好,因此在实际应用过程中,需要根据不同河流的情况结合不同模型进行综合判断,不能依靠单一模型,需要多模型结合提高预测的准确度。

随着水质自动监测系统的不断建设,自动监测逐渐替代人工监测,水质监测数据的获取量呈几何倍数增长,使得LSTM模型能够获得大量的数据进行训练,提高预测的精度,LSTM模型基于多元数据的输入,使水质预测准确度得到明显提高。

在实际应用中,建立水环境质量预测预警平台,随着模型的不断自我学习和迭代优化,可以输出未来七天流域水质指标的预测结果,提前发现流域潜在的水质变化,第一时间发出相关河流水质预警,同时可以对超标的河流进行污染过程复盘,提高相关部门应对水环境风险的能力,进一步完善治理规划体系,推动水流域环境保护高质量发展。

猜你喜欢
高锰酸盐溶解氧监测数据
从多元函数角度探讨高锰酸盐指数准确度的影响因素
全自动高锰酸盐指数分析仪在水环境监测中的应用
浅析水中溶解氧的测定
GSM-R接口监测数据精确地理化方法及应用
高锰酸盐指数测定中若干问题的探讨
污水活性污泥处理过程的溶解氧增益调度控制
城市河道洲滩对水流溶解氧分布的影响
镀锡板高锰酸盐体系钝化膜的制备及表征
GPS异常监测数据的关联负选择分步识别算法
基于小波函数对GNSS监测数据降噪的应用研究