孙铬遥,段晶晶,赵 晶
(华北水利水电大学水资源学院,河南 郑州 450046)
水质评价是以实际监测数据为基础,选择合适的评价指标,采用某评价方法,依据水质标准,对水质进行定性、定量评价,从而对水体污染程度作出判断[1-2]。评估结果有利于管理部门了解水质并采取关键保护措施来改善水体状况。国内水质评价研究有近30年的历史,近10年来随着水环境问题的不断加剧,水质评价也得到了更为广泛的关注。目前主要的水质评价方法有单/多因子指数评价[3]、模糊数学评价法[4]、聚类评价法[5]、人工神经网络法[6]等。以上方法应用于水质评价中各有优缺点,如单因子指数评价法结果趋于保守;模糊数学评价法主要通过监测数据在模糊数集中的隶属函数来确定水质级别,把体现污染的实测值转换为反映水质的参数,但该方法在计算时采用线性加权平均法,评价结果容易将流域水质状况平均化处理,造成评价结果出现偏差;灰色聚类评价法和人工神经网络法分析过程复杂且无法定性评价水质类别。众多学者针对以上方法的不足进行了改进,但由于水环境本身具有动态性和复杂性的特点,加之监测数据收集不全,如何在不确定性的条件下[7],提高水质评价精度,就成为了现阶段水质评价的关键。
以往的许多研究虽取得一定成效,但由于评价方法及理论基础的差异,所得结果仍存在较大争议,至今尚无明确的统一标准。为对水体水质进行较为精确的评价,本文引入了贝叶斯方法。贝叶斯模型法通过计算赋权之后的后验概率和,以最大概率原则确定所属水质类别[8],可以集成流域中各水质参数的评价结果,有效转换为反映水质总体状况的整体结果,综合评价方法结果更全面。目前众多学者将贝叶斯理论引入水质评价领域并取得一定的研究成果[9-10],但上述贝叶斯模型实质为“等权重”的贝叶斯模型,忽略了各评价因子对水环境质量贡献的差异性。李韶慧等[11]已将熵权法和层次分析法引入贝叶斯模型,结果明显优于等权贝叶斯模型。
信阳市南湾水库位于淮河最大支流浉河上游,是信阳市主要灌溉和饮用水源。但是目前部分流域的污染已影响到了信阳市的饮用水安全。因此,合理评价南湾水库水质情况,对保障信阳市居民饮水安全、用水安全具有重要意义,亟需开展水质评价。为此,本文在传统贝叶斯模型的基础上引入AHM-CRITIC组合赋权,构建基于AHM-CRITIC赋权的贝叶斯评价模型,评价南湾水库水环境质量,并与其他方法进行了对比分析,以期对南湾水库水质评价及科学管理提供参考。
河南省信阳市位于秦岭—淮河,中国南北气候分界线上,面积近7 000 km2,占全市总面积的37.1%,是长江淮河两大流域的分水岭。信阳市南湾水库位于浉河流域,水库坝址位于信阳市西南笔架山(即贤山,又名贤隐山、贤首山或笔架山)与蜈蚣岭之间的浉河干流、距离市中心8.5 km的南湾村附近。该水库于1955年底建成,1956年蓄水,控制流域面积1 100 km2,占浉河流域面积(2 070 km2)的53%左右,是淮河上游一座集防洪、灌溉、发电、水厂养殖及供水等多种功能于一体的大型水库。南湾水库水源地共有水域面积80余km2,库容16.3亿m3,水库水面最大长度19.5 km,最大宽度5.5 km,最大水深30 m。2005年河南省人民政府批准的《河南省水功能区划报告》上,南湾水库被划为饮用水源地,设计饮用水供水量37.5万m3/d,服务人口100多万人。
南湾水库主要水系有:①五道河支流,发源于三角山满箭垛,流程20 km,至桃园村入水库;②浉河支流,发源于四望山东麓,流程16 km,至浉河港镇入水库;③沙河支流,发源于四望山西麓,经湖北省广水市郝店镇的花山、蔡河镇的楼坊等地进入浉河区谭家河乡界河,经尚河、刘河、土门至西双河与谭家河汇流后入库,流程44 km,其中,湖北境内的花山、飞沙河、许家冲水库控制的流域面积为215.5 km2;④谭家河支流,也是目前浉河正源,发源于鸡公山管理区的金山,经新店、万冲、老湾和谭家河乡的灵官、南湾、大桥至西双河与沙河汇流后入库,流程27 km;⑤其他支流,如董家河、叶家河沟、夏家冲、郝家冲、马家河等,流程较短。
图1 南湾水库水系
近年来,由于缺乏饮用水源地保护的长效机制,南湾水库库区周边环境综合整治的效果不明显,南湾水库水质呈下降趋势并逐年加重。
南湾水库水质变化大致可分为5个阶段:①1990年以前,南湾水库水质清澈透明、掬手可饮,为地表水Ⅰ类水质;②1990—2003年,随着库区经济快速发展,大量生产废弃物、生活垃圾、污水进入库体,水质下降为地表水Ⅱ类;③2003—2009年,经济迅猛发展,南湾水库旅游业、餐饮业日益发展繁荣,上游乡镇养殖业发展迅速,入库污染物明显增多,水质基本满足地表水Ⅲ类水质,部分水域“总磷、总氮”指标大幅度升高;④2009—2015年,随着信阳市政府一系列保护管理办法出台实施,水源保护工作逐步进入依法治理的新时期,通过实施系列综合整治项目,水质退化趋势得到了有效的遏制,南湾水库水源保护工作逐步进入良性循环阶段,湖体水质基本维持III类标准;⑤2017年至今,根据信阳市环境监测站对南湾水库取水口的监测数据分析,南湾水库总氮、总磷偶有超标某些时段不满足Ⅲ类水标准。本文所有的水质监测数据均由南湾水库管理局提供。
主成分分析法(Principal Component Analysis,PCA)是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,一个变量就有一个主成分[12]。
目前主成分分析广泛应用于水质评价指标的选取当中,用其确定的主要水质指标可消除评价指标间的相关影响,在保留绝大部分信息的情况下用几个指标可代替原指标。其用贡献率作为各主成分的权数,较为客观、合理。因此本文选用主成分分析法确定本次研究所需要的水质指标。
1.3.1AHM赋权
AHM(Attribute Hierarchical Model)属性层次模型是计算各评价指标的主观权重[13],通过各项指标的一一对比,进而确定出所有指标的排序。AHM赋权确定评价权重的步骤如下。
步骤一权重分析。
建立n阶AHP判别矩阵为:
K=(kij)n×n
(1)
式中kij表示衡量要素i与要素j之间的重要性。
步骤二构造属性判别矩阵。
在AHM中,相对属性Iij构成n阶属性判别矩阵L=(lij)n×n,且相对属性lij与标度kij之间具有式(2)的转换关系:
(2)
式中β——属性测度转换参数,通常取β=1或β=2;k——大于2的正整数;m——大于等于2的正整数。
步骤三指标相对属性权重计算。
根据AHM计算步骤,通过式(3)计算各指标的相对属性权重WAHM。
(3)
(4)
式中i=1,2,…,n,n为指标的数量。
1.3.2CRITIC权重赋值
CRITIC(Criteria Importance Through Inter-criteria Correlation)权重赋值法用来计算各评价指标的客观权重,该方法是基于评价指标的对比强度和指标之间的冲突性来综合衡量指标的客观权重[14-15]。
步骤一计算标准差。
(5)
步骤二构建相关系数矩阵。
(6)
步骤三求各指标的权重值WCRI。
(7)
式中Cj——第j个指标的信息量,即第j个评价指标在整个评价指标体系中的作用。
1.3.3加权权重的确定
在求得主观权重WAHM和客观权重WCRI后,采用乘数合成归一法求加权权重。
(8)
式中WAHM、WCRI——式(3)、式(7)算出的主观权重和客观权重。
贝叶斯模型是将参数看做随机的变量,能在新增的条件下,将先验概率有效地转化为后验概率[16-17],进而得出统计结果的决策手段。全概率条件下贝叶斯公式为:
(9)
式中Bi——水质类别;A——样本水质指标;P(Bi)——先验概率;P(Bi|A)——后验概率;P(A|Bi)——条件概率。
贝叶斯水质评价即利用已有的信息,利用统计的办法推断出水质类别的相应可能性[18],并以最大可能性为评价结果。将贝叶斯公式应用于水质评价时,公式改写为:
(10)
式中xik——第k个样本的第i项指标的水质检测结果;yij——水质类别;i——所测样本指标数;j——水质类别(j=1,2,3,4,5);k——样本。
用贝叶斯模型进行水质评价步骤如下。
步骤一计算P(yij),即水质类别的先验概率,先按照GB 3838—2002《地表水环境质量标准》及地表水质标准基本项目标准限值(表 1),地下水划分为五类水(本文只展示主成分分析法得出的5个评价指标)。
表1 地表水质标准基本项目标准限制 单位:mg/L
步骤二计算P(xi|yij),实际水体污染物指标监测结果对应不同水质类别的可能性,采用几何概率中距离计算值法,以水质检测指标与标准水质指标距离的绝对值倒数进行计算可得:
(11)
式中,Lij=|xik-yij|(j=1,2,…,5)(i=1,2,…,5),Lij越小则表示所测指标属于对应水质类别的概率越大。
步骤三由式(10)计算P(yij|xi),代表每个水质指标分别属于各水质类别的概率大小。
步骤四利用式(8)算出的AHM-CRITIC组合的加权权重,考虑i个水质评价指标计算多指标下综合水质的后验概率Pj。
(12)
式中wi——式(8)算出的加权权重。
步骤五最终以最大概率原则确定水质类别。
(13)
改进内梅罗指数法是为削弱污染指数最大值的主导作用,引入最大权重污染指数、加权平均污染指数来修正最大污染指数的计算[19]。主要计算公式为:
(14)
(15)
(16)
通过SPSS的主成分因子分析功能对南湾水库2012—2020年各月 9个水质因子的实测数据进行主成成分因子分析,确定各水质变量对主成分的贡献率,保留主要因子来进行下一步的分析与评价。主成分分析得到的旋转因子荷载矩阵及其主因子贡献率见表 2。
表2 旋转因子荷载矩阵及其主因子贡献率
从表2中可以看出:特征值大于1的主成分有3个,三者的累积贡献率达到88.67%,其余成分包含信息较少,故舍弃。其中第一主成分可以表征无机污染指标;第二主成分可以表征氮、磷营养盐指标和有机污染指标;第三主成分表征金属元素污染指标。本文选取所在第1、2主成分的选择因子荷载矩阵中荷载值最大的5项指标作为本次研究的水质指标,即高锰酸盐指数、氨氮、总磷、总氮、化学需氧量。该5项水质指标能够直接影响水质的好坏,因此可以这5项指标为代表对南湾水库进行水质评价。
由图2、3可以看出南湾水库化学需氧量浓度在2012—2020年的变化并无明显趋势,其浓度在2013年8月—2013年10月、2018年8月—2018年10月最高;高锰酸盐指数和总氮浓度在9 a内变化较为稳定;总磷浓度在2012—2020年间呈现出减小的趋势;总氮和氨氮浓度在9 a内呈现出起伏不定的状态,其中总氮浓度在2017年12月—2018年3月最高,氨氮在2014年2月—2014年4月浓度最高,高于9 a内其他时间的氨氮浓度。
图2 南湾水库2012—2020年高锰酸盐指数和化学需氧量逐月变化过程
图3 南湾水库2012—2020年总氮、氨氮和总磷逐月变化过程
2.2.1指标权重的确定及分析
以南湾水库库区2012年1月—2020年12月的实测数据为基础,由式(1)—(8)分别计算,得到基于AHM法和CRITIC法的权重值,并由乘数合成归一法得到组合权重。其指标权重对比结果见图 4。
图4 基于3种赋权方法权重对比
由图4可以看出:AHM法中的高锰酸盐指数和氨氮权重值最大,都为0.312 3,可为判断高锰酸盐指数和氨氮是否过高。而CRITIC法中化学需氧量权重值最大,为0.300 7,该方法计算结果偏大,主要是考虑了南湾水库库区2012—2020年化学需氧量比年际相对值计算得到标准差值较大,指标变异强度较高造成的,并认为化学需氧量所蕴含的信息量越大。选择AHM-CRITIC组合赋权能同时考虑了高锰酸盐指数、氨氮和化学需氧量的权重,能够赋予其更多优势,从而获取更加准确的结果。
2.2.2库区水质评价
根据AHM-CRITIC组合权重及式(9)计算多指标下综合水质的后验概率,见表 3。最后按最大概率的原则并结合表1确定南湾水库近9 a的水质评价结果,见图 5。
图5 2012—2020年组合赋权贝叶斯水质评价结果
表3 多指标下南湾水库综合水质后验概率
续表3 多指标下南湾水库综合水质后验概率
2012—2015年,南湾湖水质基本维持Ⅲ类标准;2016—2020年,偶有时段不满足Ⅲ类标准,甚至出现Ⅳ类水。2016年6月,2017年10月,2018年6、8月,2019年2、10、12月,2020年1月为Ⅳ类水。2020年水质较2019年有所改善,主要原因有:①2020年天然来水量较多年平均来水量多41.9%,而2019年天然来水量较多年平均来水量少39.8%,说明丰水年径流携带的污染物含量低,由于丰水年降雨量集中,库区流量增大,污染物运移和自净能力强,因而水质较好;②2020年主要入库支流的水质较2019年有所改善。
2.3.1不同方法水质评价结果的对比
为了验证本文组合赋权贝叶斯法的有效性,分别应用传统等权重贝叶斯模型、AHM-CRITIC组合赋权贝叶斯模型、单因子指数法和改进内梅罗指数法对南湾水库2020年逐月的水质进行评价,评价结果见图 6、 7。
图6 不同方法水质评价结果对比
图7 不同方法水质评价结果占比
a)由图 6、 7可知,4种方法的水质评价结果较为一致。采用组合赋权贝叶斯法时,多数月份比采用等权重贝叶斯法高一个类别,其水质评价结果以Ⅲ类水为主。在等权重贝叶斯评价结果中,Ⅱ类水占70%左右;而在其他3种方法中,Ⅲ类水均占70%左右,Ⅱ、Ⅳ类水均不足30%。基于AHM-CRITIC组合赋权贝叶斯方法与单因子指数法和改进内梅罗指数法略有差异,而与等权重贝叶斯法差异较大。
b)由于单因子指数法是《地表水环境质量标准》规定的水质评价方法,改进内梅罗指数法也是一种常见的水质评价方法,故可分别用等权重贝叶斯法和组合赋权贝叶斯法与2种方法对比分析可靠性。组合赋权贝叶斯法较等权重贝叶斯法而言,与单因子指数法和改进内梅罗指数法更为吻合且更符合实际情况,充分反映了主、客观因素对水质结果的影响,在水质评价方面具有较强的优越性。
c)组合赋权贝叶斯法综合考虑了主客观因素的影响,更准确地反映了各水质指标赋权的重要程度。将AHM与CRITIC组合赋权结合形成组合权重,既考虑了水质污染物自身混乱程度所提供的有效信息,又减少了赋权的主观随意性,可使主、客观信息达到统一,赋权过程更加科学,水质评价结果更加准确。
2.3.2断面水质
通过上述分析得AHM-CRITIC组合赋权贝叶斯法能较好的用于南湾水库水质评价,为验证组合赋权贝叶斯法的有效性及特点,按照组合赋权贝叶斯法对南湾水库主要入库断面进行评价。
根据南湾水库主要入库断面(董家河、飞沙河、谭家河、五道河、席家河、小浉河)的水质实测数据,以最大概率原则确定水质类别,组合赋权贝叶斯水质评价结果见表 4。可以看出2020年南湾水库6个主要支流断面中,董家河断面在2月为Ⅴ类水,1、3、8、11月为Ⅳ类水,其余月份为Ⅲ类水;飞沙河断面在3月为Ⅳ类水,4、11月为Ⅱ类水,其余月份均为Ⅲ类水;谭家河断面在2、4、9、10、12月为Ⅱ类水,其余月份均为Ⅲ类水;五道河断面在3、5、7、9、11、12月为Ⅱ类水,其余月份均为Ⅲ类水;席家河断面在12月为Ⅰ类水,1、3、4、7、10、11月为Ⅱ类水,其余月份均为Ⅲ类水;小浉河断面在8月为Ⅳ类水,9月为Ⅲ类水,其余月份均为Ⅲ类水。
可见董家河是几条支流水系中水质最差的河流。根据水质实测数据,董家河水质差于III类水质标准的主要超标因子为TP(总氮)和TN(总磷)。飞沙河水质在不考虑TN的前提下,能够达到III类水质要求,总体水质较好。谭家河水质较差,主要超标因子有TN、TP和COD,上游污染较重。五道河水质在不考虑TN的前提下,基本能够达到III类水质要求,水质较好。席家河和小浉河水质差于III类水质目标,总体水质不容乐观。
2.3.3影响因素分析
上述情况可能与居民生活垃圾排放、水土流失和土地利用有关。有研究表明,水质与土地利用类型之间存在显著相关关系[20-21],其中水体污染物的含量与城镇用地,耕地呈显著正相关关系,而与林地,草地则呈负相关关系[22]。南湾水库上游周边的董家河、谭家河、浉河港、十三里桥4个乡镇属南湾水库汇水区的居民10多万人,其中紧邻库区周边的6个村约有2万居民,每年约产生生活污水80多万t,生活垃圾近6 000 t,一旦到洪水季节,堆存的生活垃圾很可能被冲刷入库,生活垃圾的污染隐患没有完全根除。另一方面,信阳近几年在大力发展茶产业,上游乡镇通过“林改茶”“农改茶”等措施来扩大茶园面积。目前,南湾水库上游属南湾水库汇水区的茶园面积约40万亩,水库上游的涵养林遭到破坏,造成水土流失。因水土流失导致的淤泥沉积量每年达150万m3,大量蕴藏在土壤中的有机质随水土流失进入库区,加剧了水库水体富营养化趋势。同时,茶园种植要施用大量的化肥、农药,每亩茶园每年要施用化肥(碳酸氢铵)60 kg、农药0.17 kg,其中化肥、农药仅约30%左右被有效吸收,其余均被雨水冲刷入库。
以上原因造成南湾水库及主要入库支流水质呈波动变化。2020年6条入库支流中董家河水质超标(4个月份为IV类水、1个月份为Ⅴ类水),主要原因是董家河镇污水处理站位于董家河入库口,现污水处理站出水水质虽满足一级 A 排放标准,但远超地表水Ⅲ类标准。氨氮、总氮、总磷和 COD 等污染物持续排入董家河,污染水体,且水流速度在此减缓,水体交换周期长,因而水质较差,在枯水期董家河下游河段水体多次出现水质超标的情况;2020年小浉河、飞沙河有1个月为IV类水,其他月份水质均在Ⅲ类及以上。IV类水出现的主要原因是:①河流周边生活污水收集管网建设不完善,受两岸分布密集的居民点影响,生产生活污水排放量高;②河流上游分布着大面积的农田、茶园,不断挤占林地面积,森林覆盖率逐年下降,加重了水土流失。区域内化肥、农药有残留,降雨初期地表径流裹挟地表腐殖土及土壤残留的化肥和农药入河,都有导致河流高锰酸盐指数、氨氮、总磷和COD 超标的风险。
构建基于AHM-CRITIC组合赋权的贝叶斯评价模型,分析南湾湖6条主要入库支流水质及6个主要入库断面水质;并将评价结果与等权重贝叶斯法、单因子指数法和改进内梅罗指数法进行比较,研究结论如下。
a)AHM-CRITIC组合赋权贝叶斯评价模型采用主客观赋权的方法,充分考虑了各污染物含量对水体的影响程度和各评价因子对水质贡献的差异性。它强调各评价因子之间的联系,区分了各评价因子对水质贡献率的差异,减弱了异常值对评价结果的影响。同时可根据实际情况赋予不同指标不同的权重,具有很强的适用性与灵活性,更能真实反映水库水体水质,结果更为合理,可为改善水体水质提供技术依据。通过与其他3种方法的水质评价结果进行对比分析发现,组合赋权贝叶斯法与现在普遍适用的水质评价方法结果基本一致,较为准确地反映水质情况,值得在同类水质评价问题中应用。
b)基于组合赋权贝叶斯对南湾水库水质进行评价,2012—2015年,南湾湖水质基本维持Ⅲ类标准,2016—2020年,偶有时段不满足Ⅲ类标准,甚至出现Ⅴ类水。2020年南湾水库6个主要支流断面中,董家河断面在2月为Ⅴ类水,1、3、8、11月为Ⅳ类水;飞沙河断面在3月为Ⅳ类水;小浉河断面仅8月为Ⅳ类水。谭家河断面、五道河断面、席家河断面水质较好,各月均为Ⅲ类及以上。