丁 瑶,石 清,杨舒茗,杨坤红
(1.中国市政工程西南设计研究总院有限公司,成都 610081;2.成都市环境保护科学研究院,成都 610072; 3.成都市污染源监测中心,成都 610011)
水质是地表水管理的一个重要组成部分,因此科学、高效评估水环境质量是一个关键性问题[1-2]。常见的水环境质量评价方法有单因子评价[3-4]、综合污染指数[3,5]、模糊数学理论[3,6]等。内梅罗污染指数是一种兼顾极值或突出最大值的计权型多因子环境质量指数,在水质综合指数评价方面应用最为广泛[7]。然而,单一的内梅罗污染指数方法难以实现地表水监测数据的分类、建模和深入解译。
SOM由芬兰学者Kohonen[8]于1982年提出,在流域水环境污染评价中得到有效且广泛的应用。Tobiszewski等[9]、Gu等[10]和Yotova等[11]众多学者利用SOM进行地表水污染物评级研究。Kumar等[12]应用SOM和成分分析法对斐济地表水和沉积物中重金属污染进行评价。SOM技术作为一种非线性科学,具有自主性和包容性等优点。
主成分分析方法(Principal Component Analysis,PCA)属于因子分析范畴,是一种识别事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示其本质,简化复杂的问题。Yang等[13]、Zeng等[14]、Celen等[15]利用PCA对流域各监测进行综合评价,并分析水质污染可能的来源。
特大城市下的环境共性问题是全球性的[16],强烈的城市化进程导致了诸如不稳定强降雨、废水排放、空气污染以及土壤重金属污染等一系列环境问题。深入了解特大城市下环境问题、成因及解决途径,可为中国的城镇化走上高质量发展的可持续道路提供支撑。成都市属成渝特大城市群,是长江经济带的重要战略区域,是距长江源头最近的特大城市,其水质健康直接影响着长江下游地区的用水安全。因此,本研究以成都市主要流域为研究对象,采用人工自组织映射(SOM)聚类分析[17]、主成分分析[18]等多元统计手段对内梅罗污染指数评价结果进行数据智能分析和深入挖掘,以阐明水环境质量时空变化特征和探析污染可能的来源,为地方制定管理与治理措施提供科学依据,促进水环境质量持续改善。
成都市地处四川盆地西部、青藏高原东缘,东北与德阳市、东南与资阳市毗邻,南面与眉山市相连,西南与雅安市、西北与阿坝藏族羌族自治州接壤。地理位置介于东经102°54′~104°53′、北纬30°05′~31°26′之间,行政面积为14335km2[19]。成都市是中国七大特大城市之一,常住人口达2094万,其城市化率为77%。2020年末,成都市GDP达1.77万亿元,位居全国第八(包括香港地区)[20]。
成都市位于长江流域上游(图1),位于亚热带湿润季风气候区内,年平均气温15.2℃~16.6℃,年降雨量800~1400mm。成都市横跨岷江和沱江两大水系。岷江曾被认为是长江正源,其干流经紫坪铺水库调节流至都江堰后,被鱼嘴分为金马河流域和锦江流域,占全市总面积55.1%。沱江流域虽自成一脉,但其源属岷江水系,同根同源,占全市总面积44.9%[20]。根据2011~2020年《成都市水资源公报》数据可知,2011年至2020年成都市地表水资源量总体呈波动上升的趋势(图2(a)),“十二五”期间平均地表水资源量为85.4亿m3/a,“十三五”期间为104.4亿m3/a。2020年成都市岷沱江出境断面水质主要指标稳定达地表水Ⅲ类,氨氮和总磷无显著季节性变化,而CODMn反之(图2(b))。
图1 成都市区位与监测断面点位图Fig.1 Location of Chengdu and monitoring sections
图2 (a)2011~2020年成都市地表水资源量,(b)2020年岷江与沱江出境断面逐月CODMn、氨氮和总磷质量浓度Fig.2 (a)Surface water resources in Chengdu in 2011~2020,(b)Monthly concentrations of CODMn,ammonia nitrogen and total phosphorus at boundary sections of Minjiang River and Tuojiang River in 2020
选取2011~2020年成都市河流75个监测断面的逐月监测数据(图1),数据由成都市污染源监测中心提供。每个监测断面水质参数为22项,包括pH、溶解氧(DO)、高锰酸盐指数(CODMn)、化学需氧量(CODCr)、生化需氧量(BOD5)、氨氮(NH3-N)、总磷(TP)、总氮(TN)、铜(Cu)、锌(Zn)、氟(F)、硒(Se)、砷(As)、汞(Hg)、镉(Cd)、六价铬(Cr6+)、铅(Pb)、氰化物(cyanide)、挥发酚(Valatile phenol)、石油类(oil)、阴离子表面活性剂(LAS)和硫化物(sulfide)。水样的采集与分析测试严格依照《地表水和污水监测技术规划》(HJ/T91-2002)执行。对各监测点数据根据年份进行均值化处理;对未检出数据取检出限半值处理;对缺失的数据采用插值法补充[21]。利用Excel 2021对数据进行预处理,利用ArcGIS 10.6进行绘图,采用origin 2021和SPSSAU对数据进行正态分布、参数与非参数检验和主成分分析,采用MATLAB 6.5的自组映射工具箱(SOM toolbox 2.0)完成聚类分析工作。
1.3.1 内梅罗污染指数法
内梅罗指数的基本计算式为[7]:
(1)
式中:Pi为P监测点的水环境综合污染指数;Cimax为某监测点的最大单项污染指数;Ciave为某监测点的各单项污染指数的平均值。
(2)
式中:Ci为第i种参数的单项相对污染指数;Cip为在P监测点位的实际检测值;Li为第i种污染物的标准值(其中溶解氧根据金世博修正式来计算Ci值)。
对于溶解氧[22]:
(3)
式中:Cim为饱和溶解氧数值,其计公式如下:
(4)
式中:P为当地实测大气压,取95 kPa;P0为标准大气压,取101.325 kPa;T为检测点河水年均温度℃,取17.2 ℃。
1.3.2 自组织映射聚类分析方法
以研究区域内2011~2020年市控及以上75个监测断面(图1)为对象 ,由于“十三五”相较“十二五”期间监测断面有所调整,模型输入年均样本数为610个。将数据进行标准化(normalization)处理,使得数据均值为0,方差为1。自组织映射(SOM)的输入层含有22个神经元,链接22个水质参数,输出层为二维六边形网络,最终SOM图的神经元个数为120个(竞争层最少节点数据量=5×INT)。利用SOM toolbox V2.0工具箱完成训练过程,根据K-means算法,将610个样本根据DBI指数最小原则实现自动选择分类[23-24]。
1.3.3 主成分分析
利用KMO(Kaiser-Meyer-Olkin)和球形检验(Bartlett)检验该研究区域数据是否适合进行主成分分析(PCA),若KMO>0.6,且Bartlett检验的P<0.05,那么PCA对该组数据起到良好的分析效果,反之亦然。根据PCA分析结果,在特征值>1的指导下,分离出有效主成分[25-26]。
1.3.4 污染等级的划分
根据《地表水环境质量标准》(GB3838-2002)中Ⅲ类标准进行内梅罗污染指数等级划分,结果见表1。
表1 水质类别等级划分Tab.1 Classification of water quality grades
2011~2020年75个监测断面中清洁等级断面有45个,较清洁等级断面有8个,轻污染等级断面有1个,中污染等级断面21个,无重污染等级断面(图3)。从图中可以判断沱江-毗河流域的T17污染最重,其超标因子为DO、CODCr、BOD5、NH3-N、TP和LAS;其次是金马河-西河流域的JM10,其超标因子为CODCr、NH3-N、TP和oil;再者是锦江流域府河干流的J7,其超标因子为NH3-N、TP和oil。
图3 内梅罗污染指数评价结果Fig.3 Evaluation results of Nemerow pollution indexes
2011~2020年75个监测断面的610个样本被分成10类,记为Ci(i=1,2,3,……,10)(图4(a))。图4(b)显示各聚类包含的神经元,不同颜色区域对应不同分类,神经元上的数字表示该神经元所属的编号。图4(c)中神经元上的数字表示该神经元的编号,共120个神经元,从左边第一个神经元开始依次从列往下标注,直到最后一个神经元编号为120。图4(d)中的神经元上的数字的意义是以该神经元为最佳匹配神经元的样本数目。由图3(b)(c)和(d)可知,C1包含的神经元编号为6,7,19,20,22,32,33,34,35,36,45和47共12个神经元,包含33个监测数据样本,以此类推。最终,2011~2020年成都市河流地表水监测数据样本共分成8组。
图4 SOM聚类结果Fig.4 SOM clustering results
根据水质2011~2020年逐月内梅罗指数评价结果,分别计算2011~2020年“清洁”“较清洁”“轻污染”“中污染”和“重污染”断面比例,见图5(a)。根据研究区域2011~2020年610个样本的SOM聚类分析结果,统计逐年和上中下游隶属于不同组分的个数与比例,见图5(b)。C5和C7分组各有186个数据样本,占到总样本数的60.98%,换而言之,研究区域半数以上的数据隶属于C5和C7分组。
研究区域水质从2011~2020年逐年向好发展,尤其是在2019年和2020年有大幅度提升。“清洁”断面占一半以上(54.2%~94.6%),并且逐年上升,到2020年达到了94.6%。2011年至2017年,“轻污染”与“重污染”比例在30%以上,到2018年下降至23.3%,2019年下降至10.8%,2020年仅剩“轻污染”(2.7%)。
各监测断面逐年的水质变化呈现出从复杂到单一。“十二五”期间的数据样本隶属于多个组类,而“十三五”期间的数据样本主要隶属于C5和C7分组(图5(b))。以上说明通过环境管理与治理能力的提升,水环境质量得到明显改善。
图5 成都市河流2011~2020年监测断面水环境质量评价与聚类结果Fig.5 Asessment and clustering results of water quality of monitoring sections in Chengdu in 2011-2020
三条流域水质空间变化特征有所不同。沱江流域支流水质明显差于干流,金马河流域的支流杨柳河水质较差,锦江流域的支流江安河水质较差,且在江安河汇入后干流水质下降(图3)。
上游区域的点位水质较稳定,中下游的水质变化浮动大。所处上游的数据样本有132个隶属于C5,占57.64%;所处中游的有80个隶属于C7分组,56个隶属于C3分组,两类共占到59.13%;所处下游的有51个隶属于C7分组,29个隶属于C3类分组,两类共占到52.98%。上游的数据样本主要隶属于C5类分组,而中下游主要为C3和C7分组(图5(b))。
研究区域下游水质普遍较差。根据偏度系数和峰度系数判断出,DO、CODMn、CODCr、BOD5、和F指标数据符合正态分布,使用方差分析(ANOVA)进行参数检验;而其他指标数据不符合正态分布,使用K多个独立样本检验(Kruskal Wallis)进行非参数检验,得各水质参数质量浓度均值以及组间显著性,结果见表2。BOD5、NH3-N、TP、As、Hg和LAS参数都显示了组间(上游、中游和下游)有着极显著差异。中下游的BOD5、TP和As质量浓度高于上游,NH3-N、Hg和LAS质量浓度呈现下游>中游>上游。从均值上可以看出,下游水质普遍差于中上游,可以说明研究区域深受人类活动干扰,污染物质的输入已经超过了地表水的自净能力,导致径流到达下游水质变差。
表2 流域上下游3个分区水质参数均值及组间显著性Tab.2 Mean value and inter-group significance of water quality parameters in three sub-regions (upper,middle and lower reaches)of river basin
续表2
本研究KMO值为0.702,满足>0.6的条件,且Bartlett检验的P<0.05,PCA对该组数据起到良好的分析效果。在特征值>1的指导下,分离出5个主成分(表3),发现Se、As、Hg、Cd和Volatil pheno指标的共同度<0.4,说明主成分和PCA分析之间的关系非常薄弱,PCA不能有效的提取出研究信息。根据Yang等[27]和Su等[28]人的研究结果,将因子载荷>0.75,0.75≤因子载荷<0.5和0.5≤因子载荷<0.3的因子载荷分别划分为“强”、“中”和“弱”3个等级。再将20个水质参数与内梅罗污染指数(P)进行主成分分析,PC1与PC2的累计方差解释率大于50 %,提取PC1与PC2分析内梅罗污染指数的关键因子,见表3和图6。该研究区域大部分水质参数的共同度较高(0.779~0.927),CODMn高达0.927,其次是DO和LAS为0.909,主成分分析法在该研究区域的总体应用效果较好。而Se、As、Hg、Cd和Valatile phenol共同度为0,说明主成分与之间的关系非常薄弱,主成分分析不能有效提取这5个参数的研究信息。
表3 研究区域水质参数的载荷系数Tab.3 Load coefficients of water quality parameters in study area
续表3
图6 全流域内梅罗污染指数与地表水 水化学指标主成分分析Fig.6 Analysis of Nemerow pollution indexes and main chemical components of surface water in whole basin
依据图6所示,PC1同时在P和CODMn、CODCr、BOD5、NH3-N和TP水质参数上的强正负载,说明了内梅罗污染指数受CODMn、CODCr、BOD5、NH3-N和TP因子影响。
PC1的方差解释率为43.9%,其在CODMn、CODCr、BOD5、NH3-N和TP水质参数上有较强的正载负荷,在DO水质参数上有较强的负载负荷,在F、oil和LAS水质参数上有中等的正载负荷,这个因子属于典型的混合源[18]。DO、CODMn、CODCr、BOD5、NH3-N和TP的强载荷指示了农业面源、生活污水和畜禽养殖等污染问题[29]。而F、oil和LAS的中负载指示了工业废水和生活废水污染[30]。
PC2的方差解释率为10.6%,其在Cu、Zn水质参数上有中等的正载负荷,在Cr6+上有中等的负载负荷,这3个水质参数在研究区域范围内质量浓度并不高,没有超出Ⅲ类水质标准,说明仅个别点位轻微上升。Cu和Zn广泛存在于自然界中,主要来源于土壤侵蚀和工业废水,也有研究表明Cu由汽车刹车时所释放,而Zn是汽车轮胎中的物质[31]。因此,城市地域中的Cu和Zn更多来自于交通污染。而Cr6+毒性很大,其在天然环境中含量很低,主要来源于电镀、化工、印染和制革等行业的工业废水[32]。
PC3的方差解释率为9.9%,其在Cr6+和sulfide水质参数上有中等的正负载,在Pb水质参数上有中等的负载荷。其中,sulfide主要来源于工业“三废”[33],Pb可能来源于自然环境,也可能来源于工业污水的排放[34]。
PC4的方差解释率为9.4%,其在cyanide水质参数上有较强的正载荷,在LAS上有中等的正载荷。其中,cyanide具有剧毒,主要来源于冶金、化工、电镀、石油炼制、制药等工业污染[35]。LAS在农业、建筑业、石油、化妆品以及纺织业中有较多的应用[36]。
PC5的方差解释率为7.1%,其在F水质参数上有中等的正载荷,在sulfide水质参数上有中等的负载荷。F是人体必需的化学元素,主要来源于雨水或是人为污染,可来源于氟化工厂、磷肥厂、冶炼厂或水泥厂等[37-38]。
2011~2020年水质逐月内梅罗指数评价结果中基本没有“重污染断面”,仅在2015年4月的正公路(J7)断面出现“重污染”,内梅罗污染指数高达11.20,NH3-N质量浓度为5.56mg/L,TP质量浓度为31.2mg/L,CODCr质量浓度为49.2mg/L,显著高于该点位其他月份和其他断面数值,主要推测点位附近建筑工地生活污水下河所引起。J7位于锦江流域支流江安河上,随着成都市“南拓”城市发展进程,江安河沿岸建筑施工不断,在2018年以前水质较差,随着2019年发起的“黄龙溪攻坚行动”,对江安河流域进行了专项整治工作,使得二江寺(J25)和黄龙溪(J8)断面在2019年和2020年水质大幅度改善。
本文基于内梅罗污染指数、SOM与PCA方法开展成都市主要流域水体综合水质评价,揭示其水质时空变化特征,并识别水质污染的可能来源。
(1)采用内梅罗指数法评价2011~2020年成都市河流水体75个监测断面污染等级,其中以清洁等级断面为主(60.0%),无重污染等级断面,但中污染等级断面有21个(28.0%);CODMn、CODCr、BOD5、NH3-N和TP是主要污染因子。
(2)结合SOM聚类分析方法阐明成都市河流水环境质量时间变化特征。“十二五”期间污染断面比例为~36.9%,“十三五”期间污染断面比例由43.0%大幅度下降至2.7%,至2020年底,清洁等级断面占到94.6%,“十三五”相较“十二五”期间水环境质量有显著提升,说明“十三五”期间水环境管理措施成效显著。
(3)结合ANOVA检验和Kruskal Wallis检验分析成都市河流水环境质量空间变化特征。金马河与沱江流域的支流污染较为突出,而锦江流域是干流;支流在一定程度上影响干流水质;上游水体中各指标较为稳定,中下游污染较为复杂,且下游水质普遍有所恶化,说明河流水质深受人类活动干扰,应持续控制人为污染下河。
(4)通过PCA分析提取5个主成分,其中PC1与PC2的累计方差解释率大于50%;根据每个成分上不同水质参数的正负载负荷,初步判断PC1为混合来源,反映出农业、生活、养殖以及工业污染特征,而PC2反映出城市交通和工业污染特征。为保证成都市水环境质量持续提升,要着重治理生活污水排放,不能松懈对“工业三废”的监管力度,同时加强农村和城市面源污染控制。
研究结果可为地方制定管理与治理措施提供科学依据,从而促进水环境质量持续改善,最终为特大城市的生态环境保护决策作参考。