翟晓燕,张永勇
(1.中国水利水电科学研究院水利部防洪抗旱减灾工程技术研究中心,北京 100038;2.中国科学院地理科学与资源研究所陆地水循环及地表过程重点实验室,北京 100101)
流域水质恶化已成为流域管理中的突出水问题之一,可导致水体功能、生态和环境系统遭受灾害性影响,直接损害居民公共健康和经济财产,严重威胁了水安全[1-4]。2018年我国约34%的水功能区水质不达标[5],其中淮河流域约39%的河段水质劣于Ⅲ类水,省界断面达标测次比例约为52%[6]。据统计,每年因水污染导致的经济损失高达2 400亿元[7-8]。2011年我国政府提出了水资源管理的“三条红线”和“三项制度”,2015年颁布实施了《水污染防治行动条例》,主要江河湖泊水功能区的水质状况得到明显改善。然而,水污染仍然是淮河流域重要的水问题之一[9-11]。开展流域水质指标时空变化诊断与影响因素分析,可为探索流域水质演变规律和成因提供依据,也对流域水污染治理具有重要的现实意义。
受工业市政废水排放、城镇生活污水、营养物流失、土地利用变化、闸坝修筑及调控等多重因子影响,流域水质分布呈现显著的时空异质性[12-16]。统计分析是一种简便有效的信息挖掘技术,可根据大量监测站长序列实测数据挖掘潜在的流域水质问题及其成因。其中,趋势检测技术,如Mann-Kendall趋势检验, Sen趋势度分析法, Spearman’s Rho检验等,已被广泛用于水情变化和水污染等问题,尤其是非参数检验方法,因其对于数据结构的要求较少,具有更好的适用性[17-20]。已有研究多未考虑水质指标的空间相关性,而是去除空间临近、可能存在自相关性的站点,人为减少了流域样本数量,影响了流域水质指标时空特征分析的准确性[21]。此外,聚类分析方法可将大量断面/站点尺度多个水质指标的变化识别为具有相似特征的典型水质类型,从流域尺度综合刻画水污染状况,已逐渐用于辨识水污染关键要素及其主要影响因子[22-23]。Cao等[24]结合欧式距离和动态时间规整距离,通过动态k均值聚类将养殖水塘中溶解氧(DO)序列分为2类,DO预测结果的均方根误差相比于未聚类序列减小了7.6%;任婷玉等[25]采用自组织映射神经网络,将63个湖泊2006—2016年的9种水质指标分为3类,分别有6、27和30个湖泊污染程度较严重、中等和较轻。
本文利用淮河流域2008—2018年22个水质断面周监测数据,综合采用seasonal Mann-Kendall(SMK)趋势检验、莫兰指数、动态k均值聚类、回归分析等多种统计分析技术,检测关键水质指标的时空变化特征,辨识典型水质类型及其与不同时空尺度土地利用类型的关系,明晰淮河流域水污染关键要素,以期为淮河流域水质演变特征分析和水污染防治提供科学依据。
淮河流域(111°55′E~121°25′E,30°55′N~36°36′N)是我国水污染最严重的地区之一。淮河干流发源于河南省桐柏县主峰太白顶西北侧,流经湖北、河南、安徽、山东和江苏5省,自西向东汇入长江。研究区地处我国南北气候过渡带,年平均气温为11~16℃,多年平均降水量为883 mm,多年平均径流深为230 mm。流域总面积约27万km2,以废黄河为界,分为淮河水系(71%)和沂沭泗水系(29%),多年平均降水量分别为910 mm和836 mm,多年平均径流深分别为237 mm和215 mm。受点源排污和农业非点源等影响,流域内水环境状况不容乐观,主要受污染影响的水质指标包括高锰酸盐指数(CODMn)和氨氮(NH3-N)、DO质量浓度等。
收集研究区22个水质断面(图1)2008—2018年周监测数据,其中淮河水系18个断面,沂沭泗水系4个断面(徐州李集桥、枣庄台儿庄大桥、邳州邳苍艾山西大桥、临沂涝沟桥),选取pH值和DO、CODMn、NH3-N质量浓度作为主要水质指标进行分析,数据来源于中国环境监测总站(http://www.cnemc.cn/)。收集研究区2010年和2015年土地利用类型数据,主要的土地利用类型均为旱地(55.85%和55.24%)、水田(17.89%和17.58%)和农村居民点(8.66%和8.72%),数据来源于中国科学院地理科学与资源研究所资源环境科学与数据中心(https://www.resdc.cn/)。基于ArcGIS 9.3提取各水质监测断面5种尺度圆形缓冲带(半径分别为0.5 km、1 km、2 km、5 km、10 km)内主要的土地利用类型面积占比,用于分析水质类型与2008—2012年和2013—2018年土地利用类型的关系。
采用SMK检测各水质指标的周尺度和年尺度变化趋势,适于水质指标序列存在潜在的季节性、相关性和缺失值等问题[9,26]。设X={Xi|i=1,2,…,n}为n年实测水质指标序列,Xi={xij|j=1,2,…,m}为子样本m周水质指标序列(本文中m取值为52)。假设实测水质指标为服从相同分布的随机变量,且不随时间单调变化。检验的统计值S由式(1)计算,若序列中存在缺失值,sgn(xig-xih)=0。
(1)
标准化后的统计值Z服从渐进的标准正态分布,显著性水平p=0.05,相应的临界值为1.96,若|Z|>1.96,拒绝原假设,认为在该显著性水平下变化趋势是显著的。进一步采用seasonal Kendall坡度值B估计水质序列变化趋势的幅度,该指标不易受极值的影响[27]。
(2)
采用全局莫兰指数I诊断各水质指标序列的总体空间分布结构,采用局部莫兰指数Ii识别断面i各水质指标序列的空间分布模式[28],I和Ii取值范围均为[-1,1],计算公式如下:
(3)
(4)
水质空间分布模式包括“高-高”“低-低”“高-低”“低-高”,分别表示断面为显著的高聚集中心且周边指标值较高、断面为显著的低聚集中心且周边水质指标值较低、断面为显著的高聚集中心但周边指标值较低、断面为显著的低聚集中心但周边指标值较高。
采用主成分分析法和动态k均值聚类法辨识典型水质类型。各水质断面的不同水质指标间可能存在相关性,采用主成分分析法将各水质指标降维转换为独立的综合指标,按主成分累积方差贡献率不低于85%的准则确定主成分和样本矩阵[22,29]。以聚类组内水质指标的离差平方和最小为目标函数(式(5)),采用动态k均值聚类法将样本矩阵分为k个互斥的水质类型,通过迭代计算使得最终聚类分组不再变化,即各聚类组内的水质指标特征较为接近,聚类组间的水质指标特征差异较大。
(5)
式中:J为目标函数;x′i为第i个综合指标;cj为第j个聚类中心;Cj为第j个聚类组的综合指标数;k为聚类组数;‖·‖为欧式距离。
(6)
其中
式中:si为断面i水质指标的轮廓系数;bi为断面i的水质指标与其最邻近聚类组断面水质指标的平均欧式距离,表征聚类组间分离度;ai为断面i的水质指标与其所在聚类组内其他断面水质指标的平均欧式距离,表征聚类组内凝聚度。
采用线性回归模型探索各水质类型与不同尺度土地利用类型的相关性,其中不同尺度土地利用类型用各水质断面5种尺度圆形缓冲带内主要的土地利用类型面积占比表示,并对Pearson相关系数r进行显著性检验,检验选取的显著性水平p=0.05。
3.1.1时间变化趋势
淮河流域2008—2018年22个水质断面的年变化趋势如图2所示。5个断面的pH值呈显著减少趋势(-0.03~-0.10 a-1);2个断面的DO质量浓度呈显著减少趋势(-0.14~-0.12 mg/(L·a)),2个断面呈显著增加趋势(0.35~0.62 mg/(L·a));9个断面的CODMn质量浓度呈显著减少趋势(-1.37~-0.17 mg/(L·a)),2个断面呈显著增加趋势(0.20~0.23 mg/(L·a));12个断面的NH3-N质量浓度呈显著减少趋势(-0.61~-0.01 mg/(L·a)),驻马店班台呈显著增加趋势(0.04 mg/(L·a))。
(a)pH值
各断面周尺度显著性变化趋势主要集中在非汛期(10月至次年5月,即第41周至次年第22周),部分断面水质指标周尺度变化坡度如图3所示(图中“周序数”表示一年52周中的序数)。淮河流域pH值基本在6~9之间,且呈减少趋势(水体酸化),其余3个水质指标整体呈轻微改善趋势;淮河水系各水质指标周尺度变化坡度略大于沂沭泗水系,CODMn质量浓度的变化坡度绝对值最大,NH3-N、DO质量浓度和pH值次之。淮河水系pH值和DO质量浓度的最大变幅分别为-0.25 a-1和-1.51 mg/(L·a),均出现在永城黄口(第39周和第41周),CODMn和NH3-N质量浓度的最大变幅分别为-2.81 mg/(L·a)和-2.43 mg/(L·a),均出现在亳州颜集(第12周和第21周);沂沭泗水系pH值和DO、CODMn、NH3-N质量浓度的最大变幅分别为-0.26 a-1、1.03 mg/(L·a)、-0.50 mg/(L·a)、-0.31 mg/(L·a),分别出现在枣庄台儿庄大桥(第1周)、邳州邳苍艾山西大桥(第10周)、临沂涝沟桥(第21周)、徐州李集桥(第28周)。
(a)pH值
3.1.2空间分布模式诊断
2008—2018年淮河流域pH值和DO、CODMn、NH3-N质量浓度的全局莫兰指数分别为0.38、0.45、0.34和0.29,均达到0.05的显著性水平。4个指标在淮河流域各断面间均呈现显著的空间正相关性,即邻近断面间的水质指标总体呈现相同的变化趋势。各断面水质指标的局部空间自相关性诊断结果如图4所示。信阳淮滨水文站、阜南王家坝和驻马店班台为3个低pH值聚集中心(p分别为0.00、0.02、0.00),主要分布在淮河干流上游和洪汝河下游;阜阳张大桥、周口鹿邑付桥闸和亳州颜集为3个低DO质量浓度聚集中心(p分别为0.00、0.00、0.01),主要分布在沙颍河和涡河;阜阳张大桥和亳州颜集为两个高CODMn(p分别为0.01和0.00)和NH3-N(p均为0.00)质量浓度聚集中心,主要分布在沙颍河和涡河。
图4 水质指标空间分布模式
受近年来点源污染治理、水量水质联合调度等影响,全流域水质指标空间分布受外部干扰的程度有所减弱,空间异质性降低,尤其是DO质量浓度由随机分布(1994—2005年)逐渐变为空间正相关模式,淮河流域水污染问题的局部性缓解主要受区域人类活动和自然因素的影响[9,21]。沙颍河和涡河是受人类活动影响(如点源排污、闸坝调控等)最为剧烈的两条支流,易于形成水污染聚集中心[9],与本文研究结果一致。淮河干流上游和洪汝河下游地区土地利用以水田为主,受氮、磷肥等营养物流失影响,水体逐渐酸化,逐渐形成低pH值聚集中心[31]。
淮河流域DO质量浓度与CODMn、NH3-N质量浓度间存在显著的负相关关系(Pearson相关系数r≤-0.50),CODMn质量浓度与NH3-N质量浓度间存在显著的正相关关系(r=0.82),如表1所示。
表1 水质指标间Pearson相关系数
表2 水质指标聚类评估结果
各类型水质指标分布如图5和图6所示。类型1的pH值和DO、CODMn、NH3-N质量浓度平均值分别为7.69、7.60 mg/L、4.43 mg/L和0.70 mg/L,主要特征为弱碱性(pH值略大于7)、CODMn和NH3-N质量浓度均偏低、DO质量浓度介于类型2和3之间;类型2的各水质指标平均值分别为8.07、4.84 mg/L、10.63 mg/L和5.00 mg/L,主要特征为偏碱性(相比于类型1,pH值平均偏高4.97%)、DO质量浓度偏低、CODMn和NH3-N质量浓度偏高;类型3的各水质指标平均值分别为8.10 mg/L、8.49 mg/L、5.77 mg/L和0.58 mg/L,主要特征为偏碱性(相比于类型1,pH值平均偏高5.33%)、DO质量浓度偏高、CODMn和NH3-N质量浓度均偏低。各水质类型的水质指标分布存在显著差异,反映不同水质类型的变化特征。
图5 不同水质类型空间分布
(a)pH值
类型1各断面的DO质量浓度在Ⅰ、Ⅱ类水标准限值内(占比均为50%),CODMn和NH3-N质量浓度主要在Ⅱ、Ⅲ类水标准限值内(占比均为30%~50%),类型1主要分布在淮河上游和淮河干流;类型2各断面的DO质量浓度在Ⅲ、Ⅳ类水标准限值内(占比均为50%),CODMn质量浓度在Ⅳ、Ⅴ类水标准限值内(占比均为50%),NH3-N质量浓度均在劣Ⅴ类水标准限值内,类型2主要分布在沙颍河;类型3各断面的DO质量浓度主要在Ⅰ类水标准限值内(占比为80%),CODMn质量浓度主要在Ⅲ、Ⅳ类水标准限值内(占比均为40%~50%),NH3-N质量浓度主要在Ⅱ、Ⅲ类水标准限值内(占比均为40%~50%),类型3主要分布在淮河中游和沂沭泗水系。
类型2仅有2个水质断面,未进行土地利用影响分析。类型1各断面水质指标(表3)中,pH值与2013—2018年不同尺度缓冲区内水田存在显著正相关关系(r≥0.66,p<0.05),与部分缓冲区内旱地存在显著负相关关系(r≤-0.64,p<0.05);DO质量浓度与2008—2012年10 km缓冲区内其他林地存在显著正相关关系(r=0.72,p<0.05);CODMn质量浓度与5~10 km缓冲区内旱地存在显著正相关关系(r>0.65,p<0.05);NH3-N质量浓度与2013—2018年5~10 km缓冲区内旱地存在显著正相关关系(r>0.65,p<0.05)。
表3 类型1水质指标与土地利用类型Pearson相关系数
类型3各断面水质指标(表4)中,除2013—2018年10 km缓冲区外,DO质量浓度与各时期城镇用地存在显著负相关关系(r<-0.80,p<0.05);CODMn质量浓度与2013—2018年其他林地存在显著负相关关系(r<-0.75,p<0.05);除10 km缓冲区外,NH3-N质量浓度与各时期城镇用地存在显著正相关关系(r≥0.79,p<0.05);pH值与各时期土地利用均无显著相关性。
表4 类型3水质指标与土地利用类型Pearson相关系数
类型1和类型3的水质指标与不同时空尺度土地利用类型关系密切。类型1水质状况主要受农田影响,尤其是旱地施肥造成的农业面源污染已成为淮河上游和淮河干流地区主要污染源之一,与已有研究结果[14]基本一致。此外,水田和旱地对水体酸碱度的影响与其施肥品种有关,氮肥等酸性肥料中的游离酸可造成土壤和水体酸化,而有机肥可增加土壤有机质和养分,缓冲酸化[31-32]。类型3水质状况主要受城镇用地影响,随着城镇发展水平逐渐提高,入河污染物负荷大幅增加,加剧了水污染的恶化态势,成为淮河中游和沂沭泗水系地区DO和NH3-N污染主要来源之一。
a.淮河流域各断面水质指标周尺度显著性变化趋势主要集中在非汛期(第41周至次年第22周),分别有23%、9%、41%和55%断面的pH值显著减少、DO质量浓度显著增加、CODMn和NH3-N质量浓度显著减少,淮河水系水质指标变化坡度大于沂沭泗水系。
b.淮河流域各断面间水质指标均呈现显著的空间正相关性,3个低pH值聚集中心主要分布在淮河干流上游和洪汝河下游,3个低DO质量浓度聚集中心和2个高CODMn和NH3-N质量浓度聚集中心主要分布在沙颍河和涡河。
c.淮河流域共划分3种典型水质类型。类型1为弱碱性、低CODMn和NH3-N质量浓度断面,分布在淮河上游和淮河干流;类型2为偏碱性、低DO质量浓度、高CODMn和NH3-N质量浓度断面,分布在沙颍河;类型3为偏碱性、高DO质量浓度、低CODMn和NH3-N质量浓度断面,分布在淮河中游和沂沭泗水系。
d.类型1水质指标主要与2013—2018年水田和旱地等显著相关,其中水田对pH值影响较大,旱地对其余指标影响较大;类型3的DO和NH3-N质量浓度与各时期不同缓冲区城镇用地显著相关,CODMn质量浓度与2013—2018年其他林地显著相关。