黄熠锋,张梦迪,倪佳峰,骆倩倩,朱琪敏,黄宏,2*
(1.温州医科大学 公共卫生与管理学院,浙江 温州 325035; 2.温州医科大学 健康评价中心,浙江 温州 325035)
对水环境污染进行空间聚类和异常值探测,可以为水环境综合整治提供决策依据,具有现实意义[1-2]。水环境污染的空间聚类是相关研究的热点之一。从方法学角度来看,除了传统的经典统计学聚类方法[1]外,还有模糊聚类法[3]、灰色聚类法[4]等。水污染聚类方法的进步,为更准确地掌握水污染的空间分布特征提供了有效工具。
空间自相关是指同一变量在不同空间位置上的相关性,是空间变量属性值聚集或发散程度的一种度量[5-6]。空间自相关性使用全局和局部2种统计量来度量:前者用于探测整个研究区域的空间模式,后者计算每一个空间单元与邻近单元就某一属性的相关程度[7-8]。自提出以来,空间自相关得到了广泛应用,涉及水资源学[9]、土壤学[10]、环境生态学[11]、社会学[12]等领域。空间自相关分析在水污染空间聚类和异常值探测研究中也具有很大的潜力[12-13]。
空间对象不仅具有空间位置属性,还具有描述其基本特征的非空间属性[14-15],以往水环境污染的空间聚类方法存在一定的局限性[16-17]。首先,以往聚类方法主要考虑空间对象的非空间属性,但脱离空间属性进行水污染的空间聚类分析是片面的。其次,现有的基于空间自相关的水污染空间聚类研究较少关注尺度变化对结果的影响,而实际上空间差异对空间尺度的变化是敏感的。
为进一步完善水污染空间聚类和异常值分析方法,拟运用增量全局空间自相关技术分析研究空间自相关的尺度效应,并选取空间自相关程度最高对应的距离阈值作为后续局部空间自相关的距离参数,进而通过全局空间自相关分析进行空间聚类和异常值分析。选择浙江省温州市温瑞塘河流域作为研究区域,以底泥重金属为研究对象,以展示方法的有效性和可靠性。
1.1.1 研究区域概况
温瑞塘河位于浙江省温州市温瑞平原,属于典型的平原河网。由于历史上电镀、皮革等行业粗放式发展、环境保护长期滞后,温瑞塘河重金属污染较为严重[18-19]。2014年以来,温州市大力推进“五水共治”(治污水、防洪水、排涝水、保供水、抓节水),水环境质量得到了显著改善。但是,由于平原河网具有流速缓慢、水环境容量较低、容易淤积等特点,温瑞塘河的重金属污染问题仍然引起了广泛关注[20-22]。
1.1.2 数据来源
2017年4月,在温瑞塘河温州市区河段布设39个采样点(图1)。使用蚌式抓斗采泥器采集表层(0~10 cm)沉积物,经自然风干后剔除杂物,干燥后研磨过100目(0.15 mm)尼龙筛[20]。采用HCl-HNO3-HF-HClO4混酸消解法消解样品[23],随后用石墨炉原子吸收光谱仪(GF-AAS)测定Zn和Ni的含量。在分析测试中,选用水系沉积物国家标准物质(GBW-07312)进行质量控制。
图1 温瑞塘河沉积物采样点分布
采用全局Moran’sI和局部Moran’sI这2个统计量来分别描述温瑞塘河底泥重金属含量的全局空间自相关性和局部空间自相关性。空间距离权重构建、全局Moran’sI和局部Moran’sI的计算在OpenGeoDa空间统计分析软件中进行。
1.2.1 空间权重
构建空间权重矩阵是进行空间自相关分析的基础。空间权重主要有邻接权重、距离权重和最近K点权重3种。对于离散点,常用的方法是基于距离标准构建,即若两点之间的距离小于指定的临界值,则权重为1,否则为0[5,24]。目前,在空间自相关分析中尚无距离尺度的取决标准,具有较大的随意性。一般地,距离尺度不能小于样点对的最小间距,也不能大于样点对最大间距的一半[25]。
1.2.2 增量全局空间自相关
全局Moran’sI可以全区域测度空间要素属性值聚合或离散的程度,取值范围在[-1, 1]。依照文献[26]中的方法,计算全局Moran’sI的值:>0,指示空间正相关,空间要素在整体空间上趋于聚合;<0指示空间负相关,空间要素在整体空间上趋于离散;=0指示空间要素在整体空间上趋于随机分布。
为检验空间自相关的显著性,对全局Moran’sI值进行标准化,得到指标Z(I)。以正态分布90%置信区间双侧检验阈值为界限,Z(I)>1.64指示显著的正空间自相关,Z(I)<-1.64指示显著的负空间自相关,-1.64≤Z(I)≤1.64指示空间自相关不显著。
式中:E(I)为观测变量自相关性的期望,V(I)代表方差。在OpenGeoDa软件中,经蒙特卡罗法模拟999次得到Z(I)。
在进行空间自相关时,选择合适的距离阈值是非常重要的。鉴于目前仍无选择距离阈值的标准,引入增量全局空间自相关技术。增量全局空间自相关分析,是指测量一系列距离阈值的全局空间自相关,并为每项距离计算相关的距离阈值、局部Moran’sI、预期指数、方差、Z(I)和P值等。以具有统计显著性的峰值全局Moran’sI对应的距离阈值作为进行全局空间自相关分析的最佳距离阈值,同时也可作为后续局部空间自相关分析的距离参数[27-28]。
1.2.3 局部空间自相关
局部Moran’sI可进一步确定空间要素属性值的空间聚集区或孤立区所在的位置,以及异常点所在的位置。依照文献[29]中的方法计算局部Moran’sI的值。
局部Moran’sI可以识别局部空间聚集区域和局部空间孤立区域,前者包括“高—高聚焦”和“低—低聚焦”2种类型,后者包括“高—低孤立”和“低—高孤立”2种类型。
温瑞塘河温州市区段表层沉积物样品重金属含量的描述性统计如表1所示。与研究区域的土壤重金属背景值[30]相比,Zn和Ni的平均值分别是土壤背景值均值的11.74和2.38倍,可见温瑞塘河沉积物Zn和Ni存在一定程度的污染情况。Zn的偏度和丰度分别为2.64和8.35,Ni的偏度和丰度分别为1.76和3.68,说明其含量均偏离正态分布。一般认为,变异系数(CV)≤10%为弱变异性,10%
表1 温瑞塘河底泥Zn和Ni含量的描述性统计
在空间统计学中,一般要求数据符合或者接近正态分布,特别是空间自相关分析统计量的计算涉及均值与方差,因此,需要将偏离正态分布的原始数据进行转换。引入环境变量常用的Box-Cox变换,并进行Spapiro-Wilk检验[25]。研究区域Zn和Ni含量的原始数据均不符合正态分布,经Box-Cox变换之后全部通过Spapiro-Wilk检验,可以用于后续的空间自相关分析。
根据39个采样点的空间位置,确定最小距离尺度为2.5 km、最大距离尺度为8.0 km。为研究空间自相关分析中的尺度效应,在增量全局空间自相关分析中,分别选取2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0 km为距离阈值,共构建12个距离权重矩阵。采用增量全局空间自相关分析方法对Zn、Ni含量进行分析。由图2可见,Zn和Ni都表现出较强的空间自相关性,全局Moran’sI随着距离阈值的增加呈现出波动性变化。Zn的全局Moran’sI在小于5.0 km的尺度范围内大于0,峰值出现在3.0 km处,同时在3.0~4.0 km距离尺度范围内Z(I)均大于或者接近1.64(图2中a)。这说明在4.0 km距离尺度范围内Zn具有显著的空间正相关性。当距离尺度大于5 km时,Zn体现出了空间负相关性,但是并未达到显著水平。原因主要是,较大的区域尺度掩盖了小区域的重金属含量变化。对于Ni,其全局Moran’sI在小于7.0 km的尺度范围内大于0,峰值也出现在3.0 km处,同时在2.5~5.5 km距离尺度范围内Z(I)均大于1.64(图2中b)。这说明在5.5 km距离尺度范围内Ni具有显著的空间正相关性。当距离尺度大于7 km,Ni表现出了空间负相关性,但也未达到显著水平。
图2 不同距离阈值下温瑞塘河底泥Zn和Ni含量的全局Moran’s I
总的来说,温瑞塘河底泥Zn和Ni含量的空间分布并非呈随机状态,在一定的距离尺度范围内具有显著的空间自相关性,即温瑞塘河底泥重金属含量存在空间聚集区[6]。与许多研究报道的土壤重金属和养分类似,温瑞塘河底泥重金属含量的空间自相关性随着距离尺度阈值的改变而改变,这也就意味着其空间自相关性存在显著的尺度效应[16-17]。相比之下,Ni的空间正自相关性比Zn强,而且空间正相关的尺度也比较大。根据不同距离阈值下的全局Moran’sI和Z(I),确定Zn和Ni空间自相关分析的最佳距离阈值均为3 km,并以此作为后续局部空间自相关分析的距离参数[27-28]。
根据增量全局空间自相关分析的结果,以3.0 km为距离阈值,对温瑞塘河底泥Zn和Ni含量进行局部空间自相关分析。结果表明,在调查的39个河段中,底泥Zn和Ni含量的局部Moran’sI大部分呈现非显著性,占比分别为74%和69%。对于Zn,达到显著性水平的“高—高聚集”“低—低聚集”“低—高孤立”和“高—低孤立”分别占8%、8%、3%和8%;对于Ni,达到显著性水平的“高—高聚集”“低—低聚集”“低—高孤立”和“高—低孤立”分别占13%、13%、0%和5%。从空间聚类角度,温瑞塘河流域底泥Zn和Ni均呈现“高—高聚集”和“低—低聚集”并存的格局。“高—低孤立”和“低—高孤立”分别指示“区域热点”和“区域冰点”,即“高值异常点”和“低值异常点”。从空间异常值角度,Zn呈现“高值异常点”和“低值异常点”并存的格局,而Ni则只有“区域高值异常点”。
由图3中a可见,温瑞塘河流域底泥Zn的“高—高聚集”主要分布在研究区域南部(共3个采样点),这些河段的底泥Zn含量较高且周围河段的底泥Zn含量也比较高。原因是这一带属于梧田工业区,历史上皮革、电镀等行业较为集中,含锌废水的排放量较大[20]。Zn的“低—低聚集”主要分布在研究区域北部(共3个采样点),这些河段的底泥Zn含量较低,且周围河段的底泥Zn含量也比较低。原因是这一带属于温州市中心,受到工业污染的影响比较小。Zn的“高值异常点”比较分散(共3个采样点),即个别河段底泥Zn含量较高而周围河段的Zn含量较低,原因与局部点源污染有关[32]。由图3中b可见,温瑞塘河流域底泥Ni的“高—高聚集”主要分布在研究区域南部(共5个采样点),其中2个位于梧田工业区,受工业污染影响,另外3个位于三垟街道,历史上电镀、印染等行业比较发达[20]。Ni的“低—低聚集”主要分布在研究区域北部的温州市中心(共5个采样点),这跟Zn的“低—低聚集”分布特征相吻合。Ni有2个“高值异常点”(共2个采样点),位于研究区域北部的温州市中心,被包围在“低—低聚集”区,指示所在河段可能受点源污染影响。
图3 温瑞塘河底泥Zn和Ni含量的空间聚类和异常值分析结果
全局空间自相关能够描述空间变量的整体分布状况,判断是否存在空间聚集区和空间孤立区,而局部空间自相关分析则能进一步指出空间聚集区和空间孤立区的位置[5]。实例研究表明,采用局部空间自相关分析方法,能够识别出温瑞塘河流域底泥重金属含量的空间聚类和异常值所在的具体位置。从污染防控角度,底泥重金属“高—高聚集”指示该区域的污染是面上的,需要从区域尺度开展环境综合整治;底泥重金属“高值异常点”指示该区域可能存在孤立的点污染源,需要摸排并切断污染源。
将增量全局空间自相关技术和局部空间自相关技术相结合,进一步完善了水环境污染的空间聚类和异常值分析方法,研究结果可为采取针对性的污染防控措施提供决策依据。温瑞塘河流域底泥Zn和Ni的平均值分别是土壤背景值均值的11.74和2.38倍,Zn和Ni含量的空间分布并非随机状态,在一定的距离尺度范围内具有显著的空间自相关性,并且受距离阈值的影响,最佳距离阈值均为3 km。采用局部空间自相关分析方法,识别出底泥重金属含量的空间聚类和异常值所在的具体位置。底泥重金属“高—高聚集”指示该区域的污染是面上的,需要从区域尺度开展环境综合整治;底泥重金属“高值异常点”指示该区域可能存在孤立的点污染源,需要摸排并切断污染源头。