李婉君,许惠燕,梁建霞,陈文杰
(1.中山市生态环境监控中心,广东 中山 528400;2.广州伊创环保科技有限公司,广东 广州 510000;3.中山市中能检测中心有限公司,广东 中山 528400;4.中山市绿鹏环境科技有限公司,广东 中山 528400)
目前,多变量统计方法被广泛应用于水质评价中。多元统计方法可以将所有的水质信息同时包含在计算中,可以从数据集中提取显著性的推论。结合聚类分析(CA)方法对河流、湖泊和地下水水质进行评价。CA方法基于水质在空间和时间上的相似性,因此可以评估采样位置和采样频率[4]。此外,还使用熵权来衡量CA分析中每个聚类中关键参数随时间变化的重要性,找出导致聚类间差异的关键参数。
珠三角是一个充满活力的经济区,经济增长率高,工业、商业和服务活动大,包括许多工业园区和手工业生产设施,广泛分散在不同规模的地区类型。工业园区和集群的发展与环境上的技术基础设施条件不同步。许多工业园区和集群尚未投资建立集中废水处理系统。随着社会经济的发展,地表水因接收生活、工业废水和农业径流而水质日益下降。生活和工业废水可能含有生产过程中的有害物质:农药和化肥的残留可能存在于径流和流入地表水中[5]。因此,有必要监测受社会经济发展活动影响地区的水质。本研究利用珠三角区域58个监测点的数据,应用多元统计分析方法分析水质波动。研究结果可为环境管理部门对有效地表水水质监测系统的审查和重新评价提供有用的信息。
以58个地点8个采样周期的每个标准的平均值进行水质特征评价,并以箱线图形式描述水质参数随时间的变化。使用SPSS软件在5%显著性水平下使用Kolmogorov-Smirnov检验正态分布。CA结果以树状结构呈现,根据联动距离将水质相似的采样地点或采样时间归为同一组。连杆距离表示连杆距离与最大距离之商。当连杆距离/最大距离×100 = 60时,认为簇间的链接距离具有聚类意义。在聚类分析中,根据采样频率对各聚类的水质特征进行加权,采用熵信息法对其重要性进行排序。信息系数越大,熵权越低,对水质的影响越小。因此,熵权可以衡量簇内参数的有序度。水质参数的权重越高,影响越大。反之,参数的加权值越小,影响越不显著。
4—12月的温度在25.3~35.3 ℃,而不同地点的温度在28.6~31.4 ℃ 之间波动,58个地点8个月的平均温度为 30.1 ℃。pH值随时间和空间变化在5.2~9.0和5.9~7.9之间,58个位点的八个月的中位数为7.1(图1a)。部分部位pH偏碱性,超过8.5的允许限值,但仍在允许限值9以内。EC和TDS波动较大(图1c和d)。采样周期和地点的EC波动范围分别为15~59200 mS/cm和38~47400 mS/cm,达到58个地点8个月的平均值5390 mS/cm。此外,TDS随时间和空间的波动分别为8~34300 mg/L和17~26070 mg/L,58个地点8个月的平均TDS为 2820 mg/L。
DO质量浓度随月份和采样点波动较大,分别为0.2~10.8 mg/L 和0.6~7.8 mg/L,平均值为 4.6 mg/L,研究区域DO≥6 mg/L 的允许限度。DO在4月和7月波动较大(图1e)。此外,58个调查点的BOD变化范围为1.6~48.8 mg/L,采样月间BOD变化范围为0~79 mg/L 。雨季月份(5—9月)的生化需氧量比旱季月份波动更大(图1f)。大多数位置的BOD超过了 4 mg/L 的允许限度。同样,月间和采样点间的COD介于8~91 mg/L 和3~139 mg/L 之间,平均值为 17.5 mg/L(图1g)。TSS具有季节性变化,雨季通常高于旱季,大多数位置的TSS超过允许限度(20 mg/L)。
各位置Fe质量浓度最高为 4.4 mg/L,平均为 1.8 mg/L,所有含铁样品均超过 0.5 mg/L 的允许限值。Fe含量在雨季高于旱季(图1o)。高浓度Cl-集中在广州市区域,质量浓度超过允许限值 250 mg/L。其余的位置都有Cl-,但浓度在允许的限度内。Cl-的波动趋势与EC和TDS相似,高Cl-导致高EC和TDS(图1c和图1d)。研究区域Pb均在允许限值 0.02 mg/L 范围内,在整个采样过程中,所有位置的Cd和As分别在0.005和 0.01 mg/L 的允许限度内(图1l和图1n)。
表1 特定聚类中的水质情况
表2 在已识别的聚类中的水质参数的权重