基于ARIMA模型的辽河流域水质主要指标预测研究

2021-02-21 03:33丁振军
绿色科技 2021年24期
关键词:原始数据差分氨氮

郭 杨,丁振军

(辽宁省生态环境监测中心,辽宁 沈阳 110161)

1 引言

水资源是人类生存不可或缺的物质资源,也是生态环境的重要组成部分,水资源水体的质量一直受到人们的广泛关注。辽河流域是全国七大流域之一,是国家重点治理的“三河三湖”之一。辽河流域的水环境质量的好坏直接影响流域人们的健康。随着辽宁省水污染治理力度的加大,辽河流域水质明显改善。根据2020年中国环境公报显示,辽河流域为轻度污染,主要污染指标为化学需氧量、高锰酸盐指数和五日生化需氧量[1]。在水环境质量管理和控制的工作中,需要了解和掌握水环境质量在未来的变化趋势,辽河流域水质能否继续保持良好态势,是否存在超标风险,对全省未来水环境形势进行预判对未来水污染防治工作方向可以提供参考。

2 预测方法

目前较为常用的水质预测方法有灰色系统理论法[2~4]、人工神经网络法[5,6]和时间序列分析法[7]等。其中时间序列法是指基于历史数据利用统计方法建立模型预估未来水质情况。时间序列预测方法分为自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARIMA)等,尤其以ARIMA模型最为经典,它融合了时间序列和回归分析优点,并且适用于平稳时间序列,在预测分析中应用最为广泛。童俊以氨氮为例,构建SVR-ARIMA组合模型预测了金泽水库取水口的水质[8]。Parmar等使用自回归整合移动平均时间序列模型预估了未来的水质参数值,为水质管理决策提供基础[9],罗学科等采用ARIMA-SVR组合方法预测了巢湖水域pH值和溶解氧浓度[10]。顾杰等基于ARIMA模型与BP神经网络算法对嘉兴市河道水质进行了预测[11]。李娜等利用ARIMA预测了太湖水体Chl-a浓度[12],江南等采用ARIMA乘积季节模型拟合序列,建立氟化物时间序列预测模型,预测了氟化物月均浓度[13]。谢建辉等利用AMIMA模型预测了化学需氧量和氨氮两个指标未来1天的浓度[14]。杜鑫运用ARMA模型对辽河流域东陵大桥断面COD水质变化趋势进行了预测,结果显示COD呈现增长态势[15]。“十三五”期间,辽河流域治理取得较大成就,水生态环境质量改善明显。但随着经济结构的转型升级,水资源开发利用率高,辽河流域人均水资源量不足全国1/3,水污染防治形式依然十分严峻。为更好掌握未来水质变化情况,有必要基于历史监测数据对辽河流域水质状况进行预测,为水污染治理规划提供引导方向,减少盲目性,以实现精准治污。

3 预测过程

建立ARIMA模型的步骤一般包括确定时序是平稳的→找到一个(或几个)合理的模型(即选定可能的p值和q值)拟合模型→从统计假设和预测准确性等角度评估模型→预测。本次预测选取辽河流域部分水质类别为Ⅳ类以上的断面作为研究对象,基于2016~2020年监测数据,对COD、氨氮、总磷等主要指标建立时间序列进行预测。选取预测一个断面的氨氮浓度为例来说明预测过程。

3.1 验证序列的平稳性

将数据转化为时间序列,画出时序图判断平稳性,如原始数据平稳无需对数据进行变换,原始数据不平稳对数据进行差分,观察差分后数据是否为平稳。在R语言中加载forecast包和tidyverse包:library(forecast)library(tidyverse),读取断面数据:water <-read.csv("断面.csv",sep = ",",header = T),将数据转化为时间序列格式:waterts <-ts(water$氨氮,start=c(2015,1),end=c(2020,12),frequency=12),查看氨氮数据趋势图:plot.ts(waterts)(图1、图2)。

图1 原始数据时序图

图2 数据一阶差分后时序图

原始数据呈现出两个先升后降的趋势。需对原始数据进行差分,差分阶数为1:waterdiff <-diff(waterts, differences=1),查看差分后数据趋势:plot.ts(waterdiff)。原始数据一阶差分后数据点似乎呈现出平稳分布状态。

3.2 选择模型

平稳后查看ACF和PACF的结果:acf(waterdiff,lag.max = 30);pacf(waterdiff,lag.max = 30)(图3、图4)。

图3 ACF

图4 PACF

一般结合ACF和PACF图选择参数p和q。我们通过程序包中的auto.arima()函数自动计算合适的(p,d,q)值:auto.arima(waterts,trace=T)。根据auto.arima()计算结果,选用(1,1,1)非季节性模型进行参数估计:waterarima1 <-arima(waterts,order=c(1,1,1),method="ML")。

3.3 模型检验

对残差序列进行白噪声检验:Box.test(waterarima1$residuals,type="Box-Pierce",lag = 1);Box-Pierce test;data:waterarima1$residuals;X-squared=0.17719,df=1,p-value=0.6738,得出p=0.6738>0.05,残差序列白噪声检验说明,模型显著成立,ARIMA(1,1,1)模型对该时间序列拟合成功。

3.4 预测

采用forecast()函数预测1年后数据:waterforecast <-forecast(waterarima1,h=12),并将预测结果作图:plot(waterforecast),预测显示为蓝线,浅灰色和深灰色区域分别代表95%置信区间河80%置信区间(图5)。

图5 氨氮预测结果

4 预测结果

ARIMA(1,1,1)能够用于氨氮浓度预测。基于以上条件对选取的全部断面的其他主要指标浓度进行了预测。结果显示,在经济环境、自然条件状况及环保治理力度不变的情况下,未来一年预测的断面中,COD、BOD5、高锰酸盐指数浓度总体保持稳定,个别断面氨氮、总磷浓度存在升高的趋势,在“十四五”期间应重点关注主要污染物浓度存在上升趋势的断面,提前做好相关管控计划,避免水质反弹恶化,实现精准施策。

5 结语

本次研究采用ARIMA模型对辽河流域部分断面的主要指标未来浓度进行了预测,取得较好结果。水环境防治的重要依据就是对水质的污染情况进行预测并制定相应的治理措施,达到提前对水环境进行变化趋势分析的效果。ARIMA是对单因素短期预测效果较好,但在实际中,一方面,河流水质受水体内部各物质之间存在相互影响;另一方面,辽河流域水质也受降水等自然情况及水资源开发利用、环保治理力度等人为因素的影响,因此在河流水质情况预测时要充分考虑各因素的影响来筛选出合适的预测方法。

猜你喜欢
原始数据差分氨氮
AQ2+间断化学分析仪测定水体中氨氮的方法
弗罗里硅土处理低质量浓度氨氮废水研究
碱改性凹凸棒石去除水源水中氨氮的试验研究
一类分数阶q-差分方程正解的存在性与不存在性(英文)
基于国产管式透气膜的养殖粪污沼液氨氮回收工艺装置构建及效能
一个求非线性差分方程所有多项式解的算法(英)
一类caputo分数阶差分方程依赖于参数的正解存在和不存在性
论航空情报原始数据提交与应用
基于差分隐私的数据匿名化隐私保护方法
对物理实验测量仪器读数的思考