许文博,杨 旭,陈振宙
(黑龙江大学水利电力学院,黑龙江 哈尔滨 150080)
水是生命之源,在人类的生产、生活中起着至关重要的作用,水资源的开发、利用及保护深深影响着人类社会与经济的发展。随着人民生活水平不断提高以及经济的飞速发展,人们对用水安全及用水保障的要求不断提高,对优质水资源的保障更为关注[1]。但随着经济快速发展的同时,也造成了一定的水环境污染,对人们的用水安全造成威胁,因此保护水资源变得尤为重要。针对水库水资源保护工作的有效开展,对水库水质进行长期有效的监测及评价是非常有必要的,对水库的水质进行评价分析可以了解水库整体的水体质量状况,并为水库水资源开发、利用和保护提供基础支撑。
常用的水质评价方法有模糊综合评价法、内梅罗综合指数法、综合水质标识指数法、人工神经网络法、集对分析法等等。汤玉强[2]等采用内梅罗指数法对北戴河国家湿地公园水质进行研究分析,验证了内梅罗指数法在水质评价中的适用性。林涛[3]等采用综合水质标识指数法对近几年珠江口水系的水质变化进行分析,结果表明综合水质标识指数法在大流域水质评价中具有优势。庄清[4]等使用人工神经网络法验证了磨盘山水库水质等级为Ⅰ级。冯莉莉[5]等研究了集对分析法在水质评价中的应用,并使用该方法对大明湖水质进行分析。水质评价的方法有很多,每个评价方法都有其相应的优点,但也会存在着不足,如模糊综合评价法及人工神经网络法处理数据花费时间相对较长,工作量比较大,集对分析法在水质评价中也存在一定的不足,当某个水质指标浓度越大,其对应的权重系数也越大,导致最终的水质等级受该指标的影响较大。主成分分析法可以从很多变量中筛选出主要污染因子,用较少的新的综合变量代替原来较多的变量,并且这些新的综合变量可以尽可能多的保持原有的信息,从而减少了工作的复杂性,另外,此方法能更客观地确定各水质指标的权重,避免主观随意性。使用该方法可以较直接地看出水质的变化情况,客观的反映水体的质量状况。为水污染治理提供一定的参考价值[6-7]。
目前,我国已经把生态文明建设摆在更加突出的位置,水生态文明建设是生态文明建设重要的一环[8]。在这一背景下,加强水体的质量状况研究是非常有必要的。本文以黄壁庄水库为研究对象,基于主成分分析方法,对其水体的质量状况进行评价分析,从而为水库的综合利用及治理提供依据。
黄壁庄水库坐落于河北省石家庄市鹿泉区黄壁庄村附近的黄壁庄村滹沱河干流上,黄壁庄水库为大型水利枢纽工程,对黄壁庄村的发展乃至石家庄的发展起着重要的作用,其主要作用为防洪,同时可以为城市提供用水,为农业提供灌溉以及进行发电等功能。黄壁庄水库处于滹沱河干流的出口处,总库容为12.10 亿m3,水面面积比较大,属于宽浅型水库。此外,库区附近有着较多的村落以及厂矿企业,给库区的水生态保护造成很大的挑战[9]。
以2018 年1 月~12 月黄壁庄水库水质监测数据为依据,选取溶解氧(DO)、高锰酸盐指数(CODMn)、五日生化需氧量(BOD5)、氨氮(NH3-N)、总磷(TP)、总氮(TN)、粪大肠菌群7 项水质指标[10],并基于地表水环境质量标准(GB 3838-2002)[11]中的5 类水质标准限值,进行水库水质评价分析。
1.3.1 原始数据标准化
因水质指标具有不同的量纲和数量级,因此将DO、CODMn、BOD5、NH3-N、TP、TN、粪大肠菌群及水质标准中5 类水质指标原始数据无量纲化处理,见式(1)。
式中:xij为第i个评价对象的第j个指标;、vj分别是第j个指标的样本均值和样本标准差,i=1,2,…,n;j=1,2,…m。
1.3.2 建立相关系数矩阵R
相关系数矩阵中两项指标间数值的绝对值越接近于1,表明两项指标间存在越强的相关性,通过主成分分析所取得的效果越好。并结合KMO 和巴特利特检验来判断指标间的相关性程度。一般而言,KMO 的值应大于等于0.6,显著性(Sig)值应小于等于0.05,能够表明各因素之间的相关性程度较高,通过主成分分析方法得出的结果具有意义。
相关系数矩阵R=(rij)m×m
式中:rij=rji,rij为第i个指标与第j个指标的相关系数,(i,j=1,2,…m)。
1.3.3 确定主成分及建立主成分得分表达式
计算相关系数矩阵R的特征值i=(i,j=1,2,…m),得出i的方差贡献率和累计方差贡献率。其中,1≥2≥…≥m≥0。以特征值大于1 且累计方差贡献率大于85%为标准确定为主成分。
分析成分矩阵,成分矩阵中载荷的大小反映了各水质指标与各主成分之间的相关性程度。其中,正值表示水质指标与主成分之间是正相关的关系,负值表示水质指标与主成分之间是负相关的关系,其数值的绝对值越接近1,说明该水质指标与对应的主成分的关联性越强。
建立主成分得分表达式,见式(3)。其中,wij表示主成分中各变量的权重,可以基于式(4)建立得分系数矩阵。
式中:Ti为第i个主成分;aij为成分矩阵中第i个主成分的第j个水质指标的数值。
1.3.4 计算综合得分
综合得分排名可以反映各月份的水质状况。利用主成分分析法所得出的综合得分数值越大,表明该月份水库水质相比较其他月份就越差。
式中:T为综合得分;Ci为第i个主成分的方差贡献率。
上述计算步骤在SPSS 软件中进行。
2.1.1 数据标准化
对所选取的DO、CODMn、BOD5、NH3-N、TP、TN、粪大肠菌群及水质标准中5 类水质指标进行标准化处理,见表1。
表1 原始数据标准化处理结果
2.1.2 变量相关性检验
从 表2 可 以 看 出,DO 与CODMn、BOD5、NH3-N、TP及粪大肠菌群之间的相关性为负相关,这是因为CODMn、BOD5、NH3-N 等水质指标均为耗氧性指标[12]。CODMn与BOD5、NH3-N、TP 及粪大肠菌群之间具有显著的正相关关系,BOD5与NH3-N、TP 及粪大肠菌群之间也具有明显的正相关性,大部分指标之间存在着较强的相关性,适合应用主成分分析法进行水质评价分析。
表2 相关性系数矩阵
从表3 可知,KMO=0.714>0.6,Sig.=0.000<0.05,各水质指标间存在较强的相关性,运用主成分分析进行水质评价可以得到理想的结果。
表3 KMO 和巴特利特检验
2.1.3 确定主成分及建立主成分得分表达式
从表4 可知。成分1 及成分2 的特征值分别为5.588、1.022,对应的方差贡献率分别为79.833%、14.602%。成分1及成分2 的特征值均大于1 且累计贡献率为94.435%,说明前两个成分可以解释原始数据的94.435%的信息,因此提取前两个成分作为主成分进行水质评价分析。
表4 特征值及贡献率
表5 为成分矩阵,显示了各水质指标在主成分1 及主成分2 上的载荷情况,综合表4 与表5 可知,主成分1 的贡献率为79.833%,DO、CODMn、BOD5、NH3-N、TP、粪大肠菌群在主成分1 中占有较高的载荷,表明主成分1 对水质状况的影响较大且主要反映水库受有机物污染,TN 在主成分2 上的载荷较大,表明主成分2 主要反映水库富营养化状况。
表5 成分矩阵
表6 为得分系数矩阵,并基于式(3)建立主成分得分表达式。
基于式(5),计算出黄壁庄水库1 月~12 月与地表水环境质量标准中规定的五类水质的综合得分,并基于地表水环境质量标准中五类水质的综合得分判定水库各月份的水体质量状况。从表7 中可以看出,基于主成分分析法清晰的反映出水库各月份的水体质量状况:水质达到Ⅰ类水标准有1 月、2 月、3 月、4 月、5 月、6 月、11 月、12 月,共8 个月;7 月、9 月、10 月水质状况均为Ⅱ类;8 月份水质类别为Ⅲ类。针对该水库Ⅱ类水及Ⅲ类水主要集中在7 月~10 月,主要因为该地区夏季高温多雨,水库中藻类大量繁殖导致水库富营养化现象,以及库区附近有较多的村落与厂矿企业,对水库水质有一定影响,主要为水体的有机污染,应采取针对性方案加强水库水污染治理。
表7 水质综合评价结果
(1)针对黄壁庄水库水体质量状况问题,采用主成分分析法对水库水质进行评价分析,客观且清晰的反映出水库各月份的水体质量状况,为水污染控制及治理提供依据。
(2)水质综合评价结果显示,2018 年该水库水体质量状况良好,水库水质标准达到Ⅰ类的有8 个月,水库水质标准为Ⅱ类的有3 个月,水库水质标准为Ⅲ类的有1 个月。
(3)该水库夏季水质状况相对较差,通过分析,水库主要面临富营养化问题及水体有机污染,仍需采取有效措施加强水库水质的保护。