基于绝对主成分-多元线性回归(APCS-MLR)模型的浙江长潭水库污染源解析

2023-05-05 06:21丁程成晁建颖郑治波崔益斌生态环境部南京环境科学研究所江苏南京004台州市黄岩区长潭水库事务中心浙江台州3800
生态与农村环境学报 2023年4期
关键词:溪流库区入库

刘 庄,丁程成,晁建颖,郑治波,崔益斌① (.生态环境部南京环境科学研究所,江苏 南京 004;.台州市黄岩区长潭水库事务中心,浙江 台州 3800)

了解水质时空分布规律、分析污染物来源是改善水环境质量的前提条件[1],污染来源解析对提高水体生态健康水平和环境质量至关重要[2],通过污染来源解析可以获知不同污染源对水质变化的相对贡献量,使环境治理措施更加具有针对性[3]。常用的水体污染溯源技术主要包括同位素分析[4-5]和三维荧光指纹谱分析[6-7]等。这些方法一般只针对特定类型的污染物开展溯源且受到相关条件限制,如氮同位素只能对氮进行溯源,而作为影响水体富营养化的另一种重要元素磷,由于在自然界只存在一种稳定同位素磷-31,无法通过磷开展同位素溯源[8];三维荧光谱分析一般只能对荧光类溶解性有机物进行溯源,且在应用过程中容易受到pH值、金属离子和温度等外界因素以及地球生物化学作用的影响[7]。在污染溯源过程中,一定的数据量是分析准确度的重要保证,但同位素与三维荧光谱分析测试成本较高、数据获取难度大,导致获得大范围、长时间序列的数据较为困难,这在很大程度上增加了这些研究方法溯源结果的不确定性。此外,同位素和三维荧光谱溯源都非常依赖特定区域、特定类型污染源的同位素特征数据库和荧光指纹图谱库[9-10]。在数据积累不充分的地区开展研究,分析精度将受到很大影响。

运用多元统计中的主成分分析(PCA)和因子分析(FA),根据观测指标间的相互关系把复杂变量归结为数量较少的综合特征因子,可以从受体的角度对污染来源进行解析[11],这一方法数据获取成本低,能够根据环保部门例行监测点位较长时间序列的数据开展污染源解析,从而降低分析结果的不确定性。而同位素和三维荧光谱解析由于成本较高,常常只能基于少量监测点位短时间甚至单次监测数据进行研究。单独的PCA/FA难以定量描述不同污染来源对各个水质指标的影响程度,1985年THURSTON等[12]提出了绝对主成分分析与多元线性回归相结合的APCS-MLR污染源解析模型,在对标准化后的原始数据开展主成分分析和因子分析的基础上,进一步运用绝对主成分分析转换得到因子的绝对主成分得分值(absolute principal component scores,APCS),再结合多元线性回归模型(multiple linear regression,MLR)计算各因子对水质指标的贡献率。APCS-MLR模型最初应用于大气污染源解析,近年来已经广泛应用于土壤、地下水和地表水等多种类型的污染源解析。在土壤污染源解析研究中,运用该方法开展重金属污染来源分析取得了较好效果[13-14],多环芳烃(PAHs)来源分析也取得初步成效[15];除此以外,APCS-MLR模型近年来在水污染来源解析研究中也得到广泛应用。ZHANG等[16]在成都平原东北部地区开展了地下水污染源解析;GHOLIZADEH等[17]对美国佛罗里达南部的3条主要河流开展了污染源解析;ZHOU等[18]以及LIU等[19]对香港海域的水污染源及其时空分布格局进行了分析;赵洁等[20]以及郑倩玉等[21]分别对辽河、松花江哈尔滨段的污染源开展了分析。

为解析浙江长潭水库氮、磷等污染物的来源,笔者基于连续多年的例行水质监测数据分析长潭水库水质的时空变化特征,构建APCS-MLR源解析模型,对库区主要污染物来源及其贡献率进行分析,以期为长潭水库的氮、磷污染物和水体富营养化控制提供科学依据。

1 研究区概况

长潭水库位于台州市西部黄岩区,是台州市最大、最重要的水源地,也是浙江省六大重点水库之一[22]。长潭水库水质管理目标为GB 3838—2002《地表水环境质量标准》中的Ⅱ类,但近10 a来,TN平均质量浓度为0.528 mg·L-1,已经劣于Ⅱ类水质标准;TP平均质量浓度为0.015 mg·L-1,虽未劣于Ⅱ类水质标准,但月例行水质监测值中有20次劣于Ⅱ类标准,超标率为5.56%,且测得的20个TP超标数据中有14个出现在2017—2019年,表明长潭水库的TP污染近年来有加重的趋势。长潭水库总库容7.32亿 m3,是一座以防洪、灌溉、供水为主,兼顾发电等综合功能的大型水库[23],日供水能力77万 m3,是台州市最主要的饮用水源地[24]。近年来库区藻类群落演替加速,蓝藻、绿藻比重有所上升[25-26],一些年份春季常出现Chl-a异常增高现象,显示水库已经面临水体富营养化的威胁,迫切需要厘清水体污染物来源,有针对性地制订污染控制方案。

长潭水库流域涉及宁溪镇、上垟乡、上郑乡、屿头乡、平田乡全部以及富山乡、北洋镇一部分,土地利用类型以林地为主(占73.36%),但也有相当一部分农田和园地(以果园为主),其中农田占11.47%,园地占5.78%,且农田和园地大多分布于入库溪流的河谷两岸。主要入库溪流包括永宁溪、柔极溪、瑞岩溪、日溪、上垟溪、小坑溪、象岙溪和桐外岙溪(图1),流域范围内有5万多常住人口,其中永宁溪流域人口数量最多,涉及宁溪镇、上郑乡和富山乡3个乡镇,常住人口占全流域人口的比重达60.97%。各乡镇中宁溪镇人口最多,占流域总人口的43.01%(表1)。

图1 长潭水库流域土地利用及监测点位分布Fig.1 Landuse and environmental monitoring points of Changtan Reservoir catchment

表1 长潭水库流域各乡镇常住人口数量Table 1 The permanent population of villages and towns in Changtan Reservoir catchment

2 数据来源与研究方法

2.1 数据来源

研究数据来自长潭水库库区3个监测点以及8条入库溪流8个监测点的长期水质监测数据,库区水质监测时间为2010—2020年(每月监测1次)。由于入库溪流从2013年才开始设立水质监测站,入库溪流水质监测时间为2013—2020年(逢双月每2个月监测1次)。水质指标包括CODMn、CODCr、BOD5、NH4+-N、NO3--N、TN、TP浓度共7项(库区监测点增加Chl-a浓度共8项),水质指标的测定方法按照HJ 535—2009《水质 氨氮的测定 纳氏试剂分光光度法》、HJ/T 84—2001《水质 无机阴离子的测定 离子色谱法》、HJ 636—2012《水质 总氮的测定 碱性过硫酸钾消解紫外分光光度》、GB/T 11893—1989《水质 总磷的测定 钼酸铵分光光度法》、GB/T 11892—1989《水质 高锰酸盐指数的测定》等标准和技术规范,监测数据由台州市环境监测中心站提供。

长潭水库库区的3个监测点分别是坝口、温潭和大众旺,坝口位于长潭水库大坝附近,离岸边较远;温潭位于永宁溪入库口附近,永宁溪是8条入库溪流中水量最大的一条,永宁溪下游的宁溪镇是长潭水库流域内人口最多的乡镇;大众旺位于库区南部,靠近上垟溪、小坑溪和象岙溪的入库口;8个入库溪流监测点分别位于各入库溪流入库口附近(图1)。

2.2 研究方法

2.2.1绝对主成分分析

APCS-MLR模型构建的第1步是提取水质指标的主成分,作为污染源判别和量化的依据,提取的主成分得分计算公式为

(1)

(2)

由于Ajk是标准化的值,不能直接用于计算主成分(PCS)的原始贡献,必须把标准化的主成分得分转化为绝对主成分得分(APCS)才能计算主成分对污染因子的贡献。APCS的计算方法为

Sjk=Ajk-A0j,

(3)

(4)

(5)

式(3)~(5)中,Sjk为k样本的j绝对主成分得分;A0j为0值下的j主成分得分;Z0i为i污染因子浓度设为0时标准化后的值。

2.2.2多元线性回归

以实测污染因子浓度为因变量,以绝对主成分APCS为自变量,与污染因子浓度之间进行多元线性回归分析,获得回归方程。

(6)

式(6)中,Cik为k样本i污染因子浓度的实测值,mg·L-1或μg·L-1;aji为污染源j对污染因子i的回归系数;Sjik为k样本i污染因子的j绝对主成分得分值;bi为i污染因子多元线性回归方程中的常数项,一般认为是未被识别源的贡献。

2.2.3污染源贡献率计算

污染源j对污染因子i的平均贡献率可用式(7)计算,未识别源的贡献率可用式(8)计算。

(7)

(8)

3 结果与讨论

3.1 长潭水库水质总体特征

3.1.1流域水质时空分异特征

长潭水库库区内设3个监测点位,为分析库区水质的季节变化规律,计算2010—2020年3个点位主要水质指标的月均值(图2)。总体而言,库区有机污染物年内波动较小,CODMn、CODCr、BOD5在5月均值偏高,冬季偏低; TN和NO3--N浓度表现出相似的季节变化规律,3月和4月浓度最高,这主要因为春季台州地区气温较高但降雨偏少,库区蓄水量减少,导致污染物浓度增高;相比TN和NO3--N浓度,NH4+-N浓度的季节性变化不明显,这是因为NH4+-N在水体中不稳定,浓度变化幅度大且缺乏规律性(表2~3),随机变化掩盖了季节变化规律;NO3--N浓度远高于NH4+-N浓度。多年平均值显示,库区NO3--N平均浓度是NH4+-N的3.38倍,说明长潭水库的氮以NO3--N为主。TP浓度的多年月均值变化曲线呈双峰型,6月最高,5、6月以及9、10月明显高于其他时段,与台州地区的雨季基本吻合,说明长潭水库的TP与降雨密切相关;Chl-a浓度5月最高,9月也偏高,这是因为春、秋季温度适宜藻类生长,尤其是春末雨季到来前是藻类繁殖高峰,加之降雨较少,导致Chl-a浓度异常增高,甚至出现零星水华。

图2 2010—2020年长潭水库库区主要水质指标的月均值Fig.2 The monthly means of main water quality indices in Changtan Reservoir between 2010-2020

从流域空间格局看,库区水体CODMn、CODCr、平均BOD5平均值总体高于入库溪流,而入库溪流氮、磷浓度则高于库区,尤其是NO3--N、TN和TP浓度显著高于库区水体(表2);此外,永宁溪的NO3--N入库通量占比达52.19%,TN入库通量达48.96%,表明永宁溪对库区的氮浓度有很大影响(表4)。

表4 长潭水库不同入库溪流的污染物入库通量Table 4 Reservoir-going pollutant flux of different inflow rivers in Changtan Reservoir catchment

从库区内部空间格局(表2和图3)看,温潭和大众旺大部分水质指标的平均浓度高于坝口,这是因为坝口离入库溪流较远,受到入库溪流水质影响较小;尤其需要注意的是,温潭的NO3--N和TN浓度显著高于其他2个站点,同时永宁溪也是各条入库溪流中NO3--N和TN浓度最高的,温潭位于永宁溪入库口附近,永宁溪是流量最大的入库溪流,其沿岸也是整个长潭水库流域人口最集中的区域,宁溪镇就位于永宁溪下游,其常住人口占长潭水库流域总常住人口的比例达43.01%,表明永宁溪沿岸尤其是宁溪镇的生活源对库区氮污染有较大影响。

表2 2010—2020年长潭水库库区与入库溪流主要水质指标的平均值Table 2 The average values of main water quality indices at different monitoring points in Changtan Reservoir and it′s inflow rivers between 2010-2020

表3 2010—2020年长潭水库库区与入库溪流主要水质指标的变异系数Table 3 The coefficients of variation of main water quality indices at different monitoring points in Changtan Reservoir and it′s inflow rivers between 2010-2020

3.1.2不同水质指标间的相关性

运用Pearson相关系数对库区水体的8个主要水质指标开展相关分析(表5)。结果显示,Chl-a浓度与CODMn、CODCr以及BOD5极显著相关(P<0.01),明显高于与其他水质指标的相关性,说明库区水体中的有机污染物与藻类生长密切相关。

表5 长潭水库库区主要水质指标间的相关系数Table 5 Correlation coefficients between main water quality indices of Changtan Reservoir

3.2 污染源识别

采用Z-score数据标准化方法,对原始数据进行标准化处理,针对各个变量的相关性进行KMO-Bartlett检验,结果显示KMO值为0.614,Bartlett球形度检验显著性P<0.01,表明部分变量之间有较强的相关性,适合开展主成分分析和因子分析。运用SPSS 22.0软件开展主成分分析,依据特征值>1 的标准,共提取3 个主成分,累积方差贡献率为57.22%(表6)。

表6 长潭水库库区3个主成分的方差解释Table 6 Total variance explained by three principal components of Changtan Reservoir

为简化因子载荷矩阵的结构以利于污染源解析,进一步运用因子分析法将提取的3个主成分作为主因子,运用正交变换对初始因子载荷矩阵进行旋转,使各因子载荷尽量趋近于0或1两极,得到旋转后的因子载荷分布(图4)。其中F1的特征值为1.93,旋转后方差贡献率为23.50%,主要载荷变量包括CODMn、CODCr、BOD5和Chl-a浓度,因此F1以有机污染物为主。对大多数水体而言,有机污染物主要来自工业和生活源,但长潭水库作为重点水源保护地,流域范围内涉水工业企业已全部外迁,外源有机污染已经得到有效控制。此外,2010年以来,入库溪流CODMn、CODCr、BOD5和Chl-a浓度平均值均低于库区(表2),说明入库溪流等外源污染已经不是长潭水库有机污染物的主要来源。与此同时,库区不同水质指标的相关分析(表5)则显示,Chl-a浓度变化与CODMn、CODCr、BOD5显著相关且相关系数明显高于其他指标。此外,Chl-a浓度与CODMn、CODCr、BOD5的最高值均出现在5月藻类生长最旺盛的时期(图2),表明库区有机污染水平的增高主要是由于藻类生长导致,因此F1可以定义为库区内生源污染(由于水体内藻类等水生生物生长而产生的污染)。

图4 长潭水库库区8个水质指标方差最大化旋转后的因子载荷分布Fig.4 Factor loadings for eight water quality indices after varimax rotation in Changtan Reservoir

F2的特征值为1.51,旋转后方差贡献率为18.87%,主要载荷变量包括TN、NO3--N和NH4+-N浓度,说明F2反映的是氮污染。库区水质与入库溪流水质对比(表2)显示,入库溪流的TN、NO3--N和NH4+-N平均浓度均高于库区,说明库区氮污染以外源为主,水体中的氮一般来自生活源和农业面源。对长潭水库库区3个点位和入库溪流的TN、NO3--N平均浓度的分析显示,温潭的TN、NO3--N平均浓度显著高于其他2个点位,永宁溪的TN、NO3--N平均浓度也高于其他入库溪流。温潭位于永宁溪入库口附近,而永宁溪沿岸是流域内人口最集中的区域,宁溪镇位于温潭监测点上游不远处(图1),因此生活污水排放与库区氮污染密切相关。

F3的特征值为1.13,旋转后方差贡献率为14.85%,主要载荷变量为TP,说明F3反映的是磷污染,入库溪流的TP浓度显著高于库区,靠近岸边的温潭和大众旺TP平均浓度显著高于坝口。水体中磷大多附着于沉积物颗粒,河口附近沉积物含量高导致这些区域TP浓度偏高,说明TP同样以外源为主,主要来自入库溪流输入。作为重点饮用水源保护区,长潭水库流域近年来严格控制含磷洗涤剂的使用,但流域内依然存在一定面积的农田和果园,化肥、农药使用造成的农业面源污染还难以完全杜绝,尤其是果园磷肥施用较多。库区水质的季节变化(图2)也显示,TP浓度在雨季偏高,而TN和NO3--N浓度的最高值则出现在雨季前,TP的高浓度是降雨径流冲刷导致,与农业面源的流失特征一致,TN和NO3--N的高浓度更多是由于雨季到来前蒸发量大导致,符合生活污染源排放相对稳定,浓度与水体水量关系密切的特征。综上所述,可以将F2定义为生活源,F3定义为农业面源。

3.3 不同污染源污染贡献率计算结果

运用SPSS 22.0 软件进行多元线性回归,获得多元线性回归方程中每个绝对主成分以及常数项的系数(表7),完成APCS-MLR模型的构建。为验证模型的可靠性,基于该函数关系,计算各水质指标数值,并将预测结果与实测值进行比较(图5)。可以看出,模型计算的库区内各水质指标浓度与实测浓度的拟合度R2在0.53~0.87之间,表明两者具有较好的一致性,预测值与实测值比值接近于1,说明该模型较可靠,可用于长潭水库污染源解析。

表7 绝对主成分与各水质指标多元线性回归方程的系数Table 7 Coefficients of MLR equation between APCS and water quality indices

基于APCS-MLR 模型和式(7)~(8),计算长潭水库3类污染源对各主要水质指标的贡献率(表8),结果显示内生源对CODMn、CODCr、BOD5和Chl-a浓度的贡献率分别为75.52%、51.39%、67.00%和63.65%。因此,有机污染物与叶绿素主要来自库区内生源。生活源对NH4+-N、NO3--N和TN浓度的贡献率分别为38.54%、46.80%和77.69%,对TP浓度的贡献率仅为5.06%;农业面源对TP浓度的贡献率为44.51%,但对NH4+-N、NO3--N和TN浓度的贡献率仅为7.70%、14.00%和2.48%。因此长潭水库库区氮污染物主要来自生活源,磷污染物主要来自农业面源。

表8 不同污染源对长潭水库库区各水质指标的贡献率Table 8 Contributions of different pollution sources to the main water quality indices in Changtan Reservoir %

以上计算结果显示,长潭水库的人为污染源主要是生活源和农业面源,其中农业面源来自农田和果园,生活源来自各类居民点。农田和果园(主要对应图1中的园地)基本上位于各条入库溪流的河谷两岸,人口和居民点也主要位于河谷两岸,大部分位于永宁溪两岸,尤其是永宁溪下游的宁溪镇,人口最密集,因此各条入库溪流沿岸的农田和果园要重点关注磷污染控制,主要居民点则要重点关注氮污染控制。

4 结论

(1)长潭水库可辨识的污染源主要包括内生源、生活源和农业面源3大类,内生源是有机污染物及Chl-a的主要来源,生活源是各种氮污染物的主要来源,农业面源则是TP的主要来源。

(2)长潭水库TN和TP浓度偏高且主要来自外源输入,入库溪流的TN和TP浓度远高于库区,如果缺乏有效控制措施,预计库区内氮、磷浓度将不断升高,未来库区水体存在富营养化的风险,各条入库溪流尤其是永宁溪沿岸的居民点和农田、果园,作为氮、磷的主要来源,应当重点关注。

(3)研究表明,基于主成分分析和多元回归的APCS-MLR模型能够充分利用例行环境监测数据,以较小的成本解析水体污染的来源和贡献率,且可适用于各种类型污染物来源的解析,为污染溯源提供了更为便利的技术途径。

致谢:衷心感谢台州市生态环境局黄岩分局以及台州市环境监测中心站在长潭水库水质数据资料收集方面给予的大力帮助!

猜你喜欢
溪流库区入库
溪流
丹江口库区加强文物保护(之一)
重磅!广东省“三旧”改造标图入库标准正式发布!
溪流到了大海
溪流到了大海
中国食品品牌库入库企业信息公示①
担当
突变理论在库区移民后期扶持成效评估中的应用
库区防护工程社会稳定风险识别
广东河源万绿湖库区的“双音话”