*徐燕 唐周
(1.上海市浦东新区环境监测站 上海 200135 2.中国电力工程顾问集团华东电力设计院有限公司 上海 200001)
随着城市化进程的加快,河流水体污染日益严重,环境问题层出不穷。污染物的排放使河流水体超过其自净能力,造成城市生态水环境的严重破坏[1]。一般来说,河流水体的污染类型主要可划分为[2]:点源污染(如生活污水或工业废水排放)、面源污染(如农业化肥的施用)和自然来源(土壤和岩石风化)。
后海湾位于中国香港新界西北部与深圳市南山区的东部对开海域,是极具生态及旅游价值的湿地,近海水质主要受点源污染和农业面源污染影响[3],且伴随着深圳河的污染物输入[4]。新界西北部河流作为深圳河的重要支流,直接或间接汇入后海湾。研究这些河溪的污染状况、时空分布特征及污染来源,可有效为流域水质管理提供有效决策支持。
(1)研究区域概况。新界是中国香港三大地理分区之一,区域内丘陵起伏且河流交错纵横。本研究选择后海湾水质管制区共13条河溪,其中梧桐河(IN)、双鱼河(RB)和平原河(GR)位于北区,元朗河(RB)、锦田河(KT)、天水围明渠(TSR)及锦绣花园明渠(FVR)位于元朗区,其余6条小溪(DB)则位于流浮山一带。
(2)数据来源及预处理。本研究原始数据来源于香港环保署数据开放共享平台,共选取近15年(2005-2019年)各河溪24个监测位点的12个水质参数(分别为COD、NH3-N、NO3-N、Fe、DO、Chla、BOD、Cu、TP、E.coli、SS和TOC)。对于部分点位的水质参数小于检出限以检出限代替[6]。个别数据缺失时,取同一检测时间内的所有其他点位单个水质浓度平均值代替。
(3)水质评价方法。单因子水质指数[5]Pi由一个整数、小数点后一位有效数字组成,可表示为:Pi=X1X2,式中,X1和X2分别代表第i项水质指标的水质类别和第i项水质指标的评价数据在该类水质变化区间中的位置。
(4)聚类分析。聚类分析(CA)以研究变量间的相似性程度为依据,将数据划分为若干个类别,作为一种探索性分析方法,不同聚类方法所得到的结果不尽相同,较为常用的为层次聚类分析(HCA)[6]。本研究采用欧氏距离(Euclidean Distance)来计算样点间相似性,并通过Ward's method来度量不同集群间的距离,该方法确保每个分析步骤中所形成的不同集群间平方和尽可能小[7-8]。
(5)主成分/因子分析。主成分/因子分析(PCA/FA)是一种用于降低数据集的维度而不会丢失大部分原始数据信息的方法。通过将相关矩阵对角化,将原始变量转化为不相关的正交变量,且新变量为原始变量的线性组合,被称之为主成分(PCs)[9]。为了极化因子载荷,常采用FA分析,即通过旋转由PCA定义的轴来产生一组新变量,称为公因子(VFs)。本研究利用最大方差法(Varimax)旋转PCs,保留特征值大于1的VFs作为主因子。
(6)绝对因子得分-多元线性回归模型(APCS-MLR)。受体模型APCS-MLR包括两个步骤,分别为绝对因子得分(APCS)计算和多元线性回归(MLR)。在水污染物溯源解析领域的基本假设为所有可能存在的污染源对某个点位不同水质参数的贡献线性相关。PCA/FA分析后,需经APCS转换为绝对因子得分,而后经MLR得到各水质参数对于不同污染源的相关系数从而计算浓度。
单因子水质评价。以地表水环境质量标准(GB3838-2002)VI类为目标水质,选择BOD、COD、NH3-N、DO和TP年平均值进行水质单因子评价,评价结果以水质指数表示,并通过图1(Heat map)进行水质类别可视化。
图1 单因子水质评价
有机污染指标BOD、COD及DO的单因子评价结果显示,锦田河(KT)、元朗河(YL)、和锦绣花园明渠(FVR)水质极差,且部分点位随年份变化水质无明显好转,基本均处于劣V类。营养盐指标NH3-N和TP的单因子评价结果显示,锦田河(KT)、元朗河(YL)、平原河(GR)下游(GR1、GR2)和锦绣花园明渠(FVR)水质超标率均达到或接近100%。此外,NH3-N的单因子评价结果显示双鱼河(RB)、梧桐河(IN)和天水围门渠(TSR)均自上游至下游水质不断恶化,总体超标率分别为46.7%、44.3%和40%。
比较各单因子水质评价结果,总体水质超标率由低到高顺序依次为:TP(63.1%)<NH3-N(50.6%)<BOD(41.7%)<DO(30.6%)<COD(21.4%)。
通过水质评价,发现后海湾沿岸河溪(样点DB1~DB8)水质较好且样点间有较好的相关性,不宜与其他样点整体进行污染来源分析,因此本研究选择其余18个样点的样本数据进行污染源定性和定量分析。
①主成分/因子分析
PCA/FA适合度检验,KMO值为0.788,Bartlett球形检验值为17742.433,且显著性水平P<0.01,说明通过PCA可以有效降低样本数据集的维度。当公因子(VFs)因子载荷绝对值大于0.75、0.5~0.75和0.3~0.5时分别表示该因子在对应的VFs上具有强、中和弱载荷[10]。
经PCA/FA分析,共提取出4个公因子,累计方差解释率为68.15%,反应了大部分原始水质参数信息。公因子VF1解释了37.73%的总方差,该公因子中强载荷的因子有NH3-N、TP、TOC,中等载荷的有COD。通常水体中的有机物和氮磷多来自于未经处理的生活污废水排放及农业面源[11],因此VF1可表示未经处理的生活污废水及农业面源的影响。公因子VF2解释了12.26%的总方差,强载荷的因子有E.coli,中等载荷有BOD和NO3-N。水体中外源输入的E.coli多来自于动物粪便,而动物粪便通常易生物降解。管制区内畜禽养殖业较多,当地政府正加强推行教育计划,以控制当地畜禽农场所导致的污染[12]。因此,VF2可表示畜禽废水的影响。公因子VF3解释了9.56%的总方差,该公因子中强载荷的有Fe,中载荷的有Cu和SS。基岩在风化作用的影响下,随着降雨过程通过地表径流进入自然水体,导致水体中的Fe、Cu等金属离子含量明显增高[13],同时地表径流还会将SS带入水体中。此外,河流底泥的再悬浮也会使其中的金属离子和SS释放到水体中,导致其浓度升高。因此,VF3可表示地表径流及底泥扰动的影响。公因子VF4解释了8.60%的总方差。强载荷的因子有Chla,中等载荷的有DO。Chla主要与浮游植物有关,且浮游植物光合作用和增殖过程中会分别产生和消耗DO,因此,VF4可代表浮游植物生长的影响。
②基于APCS-MLR模型的污染源贡献率解析
本研究采用Haji等[14]提出的将负贡献率转化为绝对值的改进方法进行计算。将APCS-MLR模型结果(表1)与PCA/FA法相结合,各污染源贡献率分别为未经处理的生活污废水及农业面源(F1,28.57%)>浮游植物生长(F4,16.44%)≈地表径流及底泥扰动(F3,16.27%)>畜禽废水(F2,12.25%)。未经处理的生活污废水及农业面源NH3-N和TP贡献率达到64.88%和61.30%,且有机污染指标贡献率也偏高。Chla指标在浮游植物生长的影响中贡献率达69.79%,Fe及SS指标在地表径流及底泥扰动中贡献率达51.87%和46.58%,畜禽废水中E.coli贡献率占37.87%,说明PCA/FA法识别的污染来源具有可靠性。
表1 PCA/FA水质参数旋转载荷及APCS-MLR受体模型贡献率
本研究以地表水环境质量标准IV类为目标水质,通过Heat map进行水质评价数据的可视化,各河流断面水质超标率由低到高顺序依次为:TP(63.1%)<NH3-N(50.6%)< BOD(41.7%)<DO(30.6%)<COD(21.4%),TP及NH3-N污染较为严重,且不同样点间水质差异明显。基于水质评价结果,筛选特征样点通过PCA/FA法定性分析其污染来源,并通过APCS-MLR模型进行污染源的定量解析,各污染源贡献率分别为未经处理的生活污废水及农业面源(F1,28.57%)>浮游植物生长(F4,16.44%)≈地表径流及底泥扰动(F3,16.27%)>畜禽废水(F2,12.25%)。
致谢
本研究感谢来自香港环境保护署开放数据平台提供的数据支持。