基于PCA法的松花江哈尔滨段水质评价研究

2015-09-17 07:46卢小燕
关键词:松花江水质评价百分比

卢小燕

(哈尔滨师范大学,黑龙江省普通高等学校地理环境遥感监测重点实验室)

0 引言

松花江哈尔滨段为哈尔滨市生活生产排放污水的受纳水体,沿此江段的中游段分布着多家处理哈市市政排污和企业排污的污水处理厂以及其它排污口.由于松花江哈尔滨段水体环境作为哈市市民生存的基本环境,其担负着向哈市市民提供生活用水和生产用水的重任,因此确保此江段水质达标和对此江段进行水质评价具有重大意义.现今常用水质评价方法有:主成分分析法(PCA法)、污染超标倍数法、单因子评价指数法、综合水质指数法、分级加权平均法[1]、模糊综合评价法[2]、灰色系统理论法和人工神经网络法[3]等.在这些水质评价方法中,PCA法是将多维因子进行降维处理并得到贡献率较大的能够代表众多因子的主成分因子后而进行定量综合评价的一种方法.相较于其它方法,PCA法的优势有:数据处理更具客观性[4]、具有最大限度减少原始数据信息损失和简化数据结构[5]等.该文依据这几种方法的特点,在保证客观实际的基础上,选用PCA法对松花江哈尔滨段进行水质评价研究.

1 模型基础

PCA法是一种能够对多维水质评价因子进行降维技术处理的数学统计方法,可对断面进行污染程度分级和确定主要水污染成分,其基本原理[8-9]为:设有n个水样,每一水样共有p个描述性指标变量,进而得到一个n×p阶的水质数据矩阵:

对原始变量X1,X2,…Xp简化为新综合变量Z1,Z2,…,Zm(m≤p),获取这两种变量的线性组合.新综合变量的表达式为:

式中的为Mmp为各主要成分的载荷值.由上述公式得到的各新综合变量分别称为原始变量的第1~m个主要成分,其中,Z1方差百分比>Z2方差百分比>…>Zm方差百分比.

PCA 法分析步骤为[8-10]:

(1)根据研究需要进行水质评价断面和水质污染指标的选取;

(2)对个别逆向的水质污染指标进行倒数变换处理;

(3)对经变换处理后的指标数据和其它指标数据统一进行标准化,从而避免不同指标间量纲的干扰;

(4)计算各水质污染指标的相关矩阵;

(5)计算获取第1~m个主要污染成分的初始特征值、方差百分比、累积方差百分比以及初始因子载荷矩阵;

(6)求算提取出来的主成分的载荷值;

(7)根据相应的主成分函数式,计算出提取出来的主成分的等分和综合得分情况;

(8)对断面进行水质污染程度的分析评价.

2 松花江哈尔滨水质评价

2.1 研究区自然简况

该文水质评价区域为松花江哈尔滨段,全长466 km.此江段多分汊、沙洲和江心滩地,河段比降约为0.5‰ ~10‰[6],平均江宽和水深分别为377 m、4.45 m,属于平原型宽浅河道,其中阿什河和河长大于300 km的呼兰河为其一级支流.松花江哈尔滨段径流量年内分配极不均匀[7],径流的年际变化与降水年际变化基本上相似:8月份最大,2月份最小,分别占年径流量的18% 和3%.同时,松花江哈尔滨段冰封期较长,约为130~140 d,期内径流量和河流流速均较小,为枯水期.

2.2 断面及指标选取

该文水质监测断面确定为哈尔滨市环境监测中心站的例行监测断面:朱顺屯、阿什河口内、阿什河口下、呼兰河口内、呼兰河口下和大顶子山6个监测断面,具体分布见图1.所用原始数据为哈尔滨市环境监测中心站提供的2014年上半年冰封期(1月 ~2月)的八个水质污染指标:BOD5(X1)、NH3-N(X2)、CODCr(X3)、TN(X4)、TP(X5)、高锰酸盐指数(X6)、石油类(X7)、DO(X8).

图1 监测断面示意图

2.3 水质评价过程

2.3.1 原水质监测数据标准化处理

首先对逆向的水质污染指标DO进行倒数变换处理,然后对 BOD5、NH3-N、CODCr、TN、TP、高锰酸盐指数、石油类和经变换处理后的DO数据统一进行标准化,标准化结果见表1.

2.3.2 相关性分析

利用 SPSS17.0(中文版)计算 BOD5(X1)、NH3-N(X2)、CODCr(X3)、TN(X4)、TP(X5)、高锰酸盐指数(X6)、石油类(X7)、DO(X8)八个水质污染指标的相关系数矩阵,对它们的初始特征值、方差百分比、累积方差百分比进行分析,并根据累计方差百分比确定主要成分的数目.具体见表2、表 3.

从松花江哈尔滨段2014年1~2月的水质污染指标数据的相关性分析可以看出:一月和二月的相关系数范围分别在0.522~0.991和0.387~0.997之间,绝大部分水质污染指标具有较强的相关性质,证明本研究方法适用;一月份NH3-N和TN、二月份NH3-N和石油类的相关性最强,分别高达 0.991、0.997.

SPSS17.0(中文版)均从表3中自动从每个月中提取出了m=2个主成分.其中:一月份第1、2 主成分的特征值(6.762、1.055)和二月份第1、2 主成分的特征值(6.869、1.087)均满足大于1的原则;一月份第1、2主成分方差百分比分别为 84.522%、13.193%,累积方差百分比达到97.715%,二月份第1、2主成分方差百分比分别为,85.863%、13.585%,累积方差百分比达到99.448%,均满足累积方差百分比大于85% 的原则,说明它们已经较高程度的包含了8个水质污染评价指标的全部信息,且包含信息量最大的第1主成分对松花江哈尔滨段上半年冰封期(1~2月)的水质变化的影响最显著.

表1 数据标准化

表2 相关系数矩阵

表3 特征值和解释的方差

2.3.3 初始因子载荷值和主成分载荷值的确定

上述提取的两个主成分的初始因子载荷值可由SPSS17.0(中文版)直接运行获取,见下表4.从表中可以看出:一、二月份第1主成分分别与石油类、BOD5的相关系数最大,一、二月份第2主成分分别与CODCr、石油类的相关系数最大.

表4 初始因子载荷矩阵

主成分载荷值在SPSS17.0(中文版)中输入以下公式并直接运行确定,输出结果见表5.

式中Vm和λm分别表示第m主成分的初始因子载荷值和初始特征值,其中m=1、2.

表5 主成分载荷值

根据PCA法的原理及主成分载荷值得到相应的主成分函数式和综合评价函数式如下:

式中的r1和r2分别代表第1、2主成分的方差百分比.

2.3.4 水质综合评价结果

根据主成分函数式和综合评价函数式,计算出六个评价监测断面和整个松花江哈尔滨段的2014年1~2月水质污染综合得分(见表6),并对其水质污染程度给予定量描述,污染的严重性随着得分的增大而增大,可对水质评价样点的污染程度进行分级[2-3].

表6 各监测断面水质评价结果

由表6水质评价结果可以看出,2014年1~2月松花江哈尔滨段的水质污染程度排序分别为:阿什河口内 >呼兰河口内 >大顶子山>呼兰河口下 >阿什河口下 >朱顺屯、阿什河口内 >呼兰河口内 >呼兰河口下 >大顶子山 >阿什河口下 >朱顺屯.从第1主成分得分排名看,2014年1~2月均为阿什河口内的得分远大于剩余5个监测断面,表明1月该断面处的水质因子石油类、高锰酸盐指数和NH3-N含量相对较高,2月该断面处的水质因子CODCr、BOD5和高锰酸盐指数含量相对较高;从第2主成分得分排名看,2014年1~2月均为呼兰河口内的得分最高,表明1月该断面处CODCr污染较重,2月该断面处高锰酸盐指数污染较重.监测断面的实际监测数据也证实了基于PCA法得到的分析结果较真实地反映了松花江哈尔滨段的实际状况,沿此江段的中游段的阿什河口内断面和呼兰河口内断面附近分布着多家处理哈市市政排污和企业排污的污水处理厂以及其它排污口.

3 结束语

该文借助SPSS17.0(中文版)软件,并采用PCA法对2014年1~2月松花江哈尔滨段6个例行监测断面的水质特征进行了评价分析.对评价结果分析得出:

(1)从原始水质监测数据中分别提取出了1月份累积方差百分比为97.715% 的2个因子和2月份累计方差百分比为99.448%的2个因子,经分析识别得到松花江哈尔滨段这两个月的2个主成分因子:1月份——石油类、高锰酸盐 指 数 和 NH3-N,CODCr、BOD5;2 月 份——CODCr和 BOD5,高锰酸盐指数、TP.

(2)在2014年上半年冰封期内(1~2月),阿什河口内和呼兰河口内污染比较严重,这一结果与研究流域内的实际排污情况相吻合,说明PCA法一种能够有效对松花江哈尔滨段水质进行综合评价的方法.

(3)在整个水质综合评价的过程中,PCA法能够确定造成2014年上半年冰封期内(1~2月)水体污染的主要成分,从而在尽量减少原始信息损失的同时使水质评价的数据结构得到了简化,以及确保了评价结果的客观性.

[1] 伊元荣,海米提·依米提,王涛,黄景炎,胡小韦,古丽格娜.主成分分析法在城市河流水质评价中的应用[J].干旱区研究,2008,25(4):497-501.

[2] 王艾,冯少元,郑艳侠.主成分分析法在温榆河水质评价中的初步应用[J].北京水务,2011(2):49-52.

[3] 万金保,曾海燕,朱邦辉.主成分分析法在安乐河水质评价中的应用[J].中国给水排水,2009,25(16):104-108.

[4] 鲁斐,李磊.主成分分析法在辽河水质评价中的应用[J].水利科技与经济,2006,12(10):660-662.

[5] 王群妹,梁雪春.基于主成分分析的水质评价研究[J].水资源与水工程学报,2010,21(6):140-154.

[6] 宋连彬,赵广忠,鞠贵权.松花江哈尔滨段水文监测断面分析[J].黑龙江水利科技,2011,39(2):15-16.

[7] 宋小燕,穆兴民,高鹏,等.松花江哈尔滨站近100年来径流量变化趋势[J].自然资源学报,2009,24(10):1803-1809.

[8] 吉祝美,方里,张俊,等.主成分分析法在SPSS软件中的操作及在河流水质评价中的应用[J].中国给水排水,2012,25:68-73.

[9] 邹海明,蒋良富,李粉茹.基于主成分分析的水质评价方法[J].数学的实践与认识,2008,38(8):85-90.

[10]刘小楠,崔巍.主成分分析法在汾河水质评价中的应用[J].中国给水排水,2009,25(18):105-108.

猜你喜欢
松花江水质评价百分比
松花江
浞河浮游藻类的调查研究与水质评价
滻灞河水质评价方法研究
普通照明用自镇流LED灯闪烁百分比测量不确定度分析
基于概率统计和模糊综合评价法的水质评价模型及其应用——以拉萨河水质评价为例
松花江緑石硯
趋势攻略之趋势线:百分比线
松花江上
模糊数学评价法在水质评价中的应用
环保车型最多的美国城市