李步东 ,朱长军,杨少波,曲 珍
(1.河北工程大学 能源与环境工程学院,河北 邯郸 056038; 2. 西藏自治区水文水资源勘测局日喀则水文水资源分局,西藏 日喀则 857000)
为了更加深入、准确的了解河流存在的水环境问题,国内外相关学者将各类数学和统计学评价方法应用在水质评价和水体污染源解析等研究中。目前,国内外对河流水质评价的方法主要有单因子评价法、综合污染指数法、模糊综合评价法、水污染指数法、主成分分析法和多元统计分析法等[1]。水环境质量评价对水环境的治理提供了重要的依据,不同的水环境质量评价方法所适用的条件和评价结果会略有不同。Singh等[2]认为,河流水质评价需要确定各污染源以及定量化的污染贡献率。郑倩玉等[3]采用主成分分析(PCA)对松花江流域哈尔滨段水质污染现状进行综合评价,并根据主成分分析计算得到的相关数据进行APCS-MLR(绝对主成分多元线性回归分析)量化主成分对各污染物的贡献率。万金保等[4]认为主成分分析(PCA)利用线性变换将多个原始变量转化为少数几个相互独立的综合指标(即主成分),提高了分析结果的客观性和可靠性。
本文根据辽宁省水环境监测中心2015年全年水质监测数据,按照辽河的水文规律,将6~8月划分为丰水期、4~5月和9~11月划分为平水期,枯水期为12~翌年3月,并分别对辽河丰、平、枯三个时期进行水质分析,利用主成分分析法分析污染物的主要来源以及APCS-MLR(绝对主成分多元线性回归分析)量化各主成分对每种污染物的污染贡献率,以达到为辽河水环境质量评价提供更加准确的结果,同时为辽河的水污染治理与环境保护提供科学的依据和方向。
以辽河7个监测断面(如下图所示)溶解氧、高锰酸盐指数、化学需氧量、五日生化需氧量、氨氮、类大肠杆菌等表征耗氧有机物的水质指标,以及砷和石油类等代表东北老工业区污染的水质指标为基础。利用主成分分析法对辽河水质进行综合评价,然后利用绝对主成分回归分析进行辽河污染物源解析,所有水质指标均严格按照地表水环境质量标准(GB3838-2002)的规定进行分析。
主成分分析法(principal components analysis)核心思想就是运用降维的方式,把多个因子转化成少数的几个代表性的综合因子,但这几个因子已经足够代表大部分原来的信息。最终实现减少变量个数的目的[5]。通常,主成分分析需要进行数据标准化、计算数据矩阵协方差或相关矩阵、求出协方差矩阵特征值和特征向量和确定主成分及综合得分四个步骤。假设拥有n个初始变量,表示x1,x2,xn,Y1,Y2,…Yn,表示主成分后的变量,R为变量间的相关系数矩阵,则有以下方程组成立:
图 辽河监测断面分布图Fig. Distribution of monitoring sites of Liao River
(1)
一般,假如前k个数据的累计方差贡献率超过了85 %,那么这前k个数据便是提取出来的主成分。
2.2.2 绝对主成分多元线性回归分析
APCS-MLR则是在主成分分析法的基础上对水质指标进一步分析计算,是对水体进行水质评价和水体污染源解析的有效方法之一[2, 6~8],其原理是利用主要的指标评价水质,根据主成分分析过程中得到的标准化数据、特征向量以及因子得分系数,经过式(2)~(4)计算得到绝对主成分得分(APCS)[6~9]。 然后继续利用SPSS 19.0的分析—回归功能,以绝对主成分得分为自变量,以污染物浓度为因变量进行多元线性回归分析(如式5所示),得到回归方程的回归系数,从而确定各主成分对污染物的贡献率[10~12]。
(2)
(3)
APCSjk=(Az)jk-(A0)j
(4)
(5)
式中:a0为MLR常数项,Aj为回归系数。
辽河6个监测断面的丰、平、枯水期的主成分载荷矩阵及总方差的解释如表1所示。本文在提取主成分时选取特征值大于1作为标准,对丰水期、枯水期各提取了三个主成分,平水期提取了两个主成分。基本涵盖了8个污染物的全部信息。其中,丰水期第一主成分(PCA1)、第二主成分(PCA2)和第三主成分(PCA3)总方差贡献率分别为49.891%、27.632%和17.121%;显而易见,第一主成分对辽河丰水期的水质影响最大,可以视为丰水期辽河水体的主导污染物。从因子载荷值看,与第一主成分相关性较大的有NH3-N和As;由此可以推断辽河水体的主要污染源为农业种植和畜禽养殖等面源污染以及冶金行业的污废水排放。第二主成分相关性较为显著的有BOD5和石油类。说明该期间辽河水质污染问题主要由石化企业导致的。第三主成分显著相关的有高锰酸盐指数和CODCr;说明该期间耗氧有机污染物是主要污染类型;辽河沿程周边多为人口众多的大中城市,另外,该区域的工业区规模较大,尤其是造纸行业和畜牧业占有较大比例,生活污水与工业废水中含有大量的耗氧有机物,是辽河有机污染物的主要来源。
辽河平水期第一主成分和第二主成分总方差贡献率分别为55.087%和26.992%;与第一主成分显著相关的为BOD5和石油类。该期间水质污染源与丰水期第二主成分所推断的污染源类似,石化企业的废水排放为主要污染源。平水期第二主成分显著性较强的为DO,说明水体中DO浓度较低,导致该现象的原因可能为城市生活污水和企业污、废水集中排放,水体中耗氧物质急剧增加使得水体耗氧速率远大于复氧速率,DO明显降低。
辽河枯水期第一主成分、第二主成分和第三主成分总方差贡献率分别为48.574%、23.568%和16.090%;与第一主成分显著性相关的为高锰酸盐指数、CODCr和BOD5,其与丰水期第三主成分显著相关性指标类似,说明两者主要污染源相似。枯水期第二主成分显著性相关的为DO和As,由此可以推测枯水期第二主成分主要受到冶金行业与城市生活污水和企业污、废水集中排放的影响。枯水期第三主成分显著性相关的为石油类和粪大肠菌群,说明枯水期第三主成分污染物来源可能为生活污水、畜禽养殖以及石油化工等。
表1 辽河主成分载荷矩阵及总方差的解释Tab.1 Interpretation of principal component loading matrix and total variance of Liao River
根据各主成分载荷矩阵和其对应的特征值,可以求得辽河各监测断面的主成分综合得分,再参考主成分综合得分与水质类别对比表(见表2)[13],即可得到辽河每个监测断面不同时期的水质类别(见表3)。
从辽河丰水期第一主成分和第二主成分得分来看,双台子河闸断面的得分最高,远超过其他监测断面,说明与第一主成分和第二主成分相关性较大的NH3-N、As、BOD5和石油类在该断面含量较多,双台子河闸是第一主成分与第二主成分所代表污染物的主要来源; 丰水期第三主成分得分最高的为通江口监测断面,说明与第三主成分显著相关的高锰酸盐指数和CODCr在该监测断面含量较高。
辽河平水期第一主成分与第二主成分得分最高的仍为双台子河闸监测断面,说明与第一主成分相关的BOD5和石油类和第二主成分相关的DO在双台子河闸监测断面污染较为严重。
辽河枯水期第一主成分得分最高的为辽中监测断面,其次是双台子河闸监测断面,说明与枯水期第一主成分相关的污染物主要来源于辽中监测断面;枯水期第二主成分得分最高的为通江口监测断
面,说明通江口监测断面是第二主成分所代表污染物的主要来源;枯水期第三主成分得分最高的为双台子河闸监测断面,说明该监测断面是第三主成分所代表污染物的主要来源。
综上所述,双台子河闸监测断面水质最差,污染程度远超过其它监测断面,同样,在辽河丰水期、平水期和枯水期各监测断面主成分综合得分来看,双台子河闸监测断面得分最高,马虎山监测断面在丰、平、枯水期得分均为最低,说明马虎上监测断面水体污染相较于其他断面较轻。从整体上看,辽河水体污染非常严重,基本为Ⅳ类或Ⅴ类水质。从辽河沿程监测断面水质类别来看,辽河水质整体上呈现出上游比下游污染程度低的趋势。
表2 主成分分析法水质分级标准Tab.2 Water quality classification standard of principal component analysis
表3 各监测断面不同时期水质综合评价Tab.3 Comprehensive evaluation of water quality in all section in different periods
根据主成分分析可知,辽河主要污染物为高锰酸盐指数、CODCr、BOD5、NH3-N和石油类。为了进一步量化各主成分对每种污染物的污染贡献率[14~16],采用APCS-MLR对污染源贡献率进行计算,具体结果如表4所示。对于PCA/APCS来说,污染源的贡献率不一定在0~100%区间内,该值小于零或者大于100%的原因往往与污染源的排入对其他非影响指标的稀释有关[17~19]。除枯水期的砷指标外,其它评价指标的R2(相关系数)值均大于0.7,说明进行多元线性回归分析在统计学上是有效的。
辽河水体丰水期第一主成分对NH3-N、As和石油类的贡献率分别为49.09%、58.65%和24.71%。由主成分分析结果可知,丰水期第一主成分包含的污染物主要来源为农业种植和畜禽养殖等面源污染以及冶金行业的污废水排放;第二主成分主要影响BOD5和石油类,对其贡献率分别为13.62%和12.18%,该污染物主要来源于沿岸石油化工企业的工业废水排放有关;第三主成分影响DO、高锰酸盐指数、CODCr、BOD5和粪大肠菌群,对其污染贡献率分别为26.80%、53.68%、66.14%、14.93%和20.55%,该污染物的主要来源为城镇生活废水、工业废水以及畜牧业排放的废水等。
辽河水体平水期第一主成分对DO、高锰酸盐指数、CODCr、BOD5以及NH3-N的贡献率为45.61%、30.48%、56.16%、26.93%和160.89%。根据主成分分析可知,平水期第一主成分的污染物主要受到石化企业污废水排放的影响;第二主成分对DO、高锰酸盐指数、CODCr、BOD5以及石油类的贡献率分别为10.13%、35.79%、21.19%、94.75%、70.65%,影响该污染物的主要原因可能为城市生活污水和企业污、废水集中排放。
辽河水体枯水期第一主成分对高锰酸盐指数、CODCr、BOD5、NH3-N、石油类以及粪大肠菌群的贡献率分别为100.25%、101.26%、128.36%、93.71%、54.33%和79.76%,污染物主要来源于丰水期第三主成分相似。第二主成分对DO、高锰酸盐指数、CODCr、NH3-N以及石油类的贡献率分别为42.39%、31.16%、25.75%、164.60%和27.34%,污染物主要受到冶金行业与城市生活污水和企业污、废水集中排放的影响。第三主成分主要影响石油类,对其污染贡献率为24.58%,污染物主要来源为石油化工等。
表4 各时期主成分对污染物的贡献率Tab.4 Contribution rate of principal components to pollutants in all periods
4.1 利用主成分分析与绝对主成分得分—多元线性回归分析对辽河水体进行水环境质量评价及其水体污染源分析,结果表明水体主要污染物包括高锰酸盐指数、CODCr、BOD5、NH3-N和石油类。丰水期第一主成分对NH3-N、石油类的贡献率分别为49.09和24.71;平水期第一主成分对高锰酸盐指数、CODCr、BOD5和NH3-N的贡献率为30.48%、56.16%、26.93%和160.89%;枯水期第一主成分对高锰酸盐指数、CODCr、BOD5、NH3-N和石油类的贡献率分别为100.25%、101.26%、128.36%、93.71%和54.33%。
4.2 丰水期第一主成分的污染物主要来源于农业种植和畜禽养殖等面源污染以及冶金行业的污废水排放;平水期第一主成分的污染物主要来源于石化企业污废水排放;枯水期第一主成分的污染物则偏向于城市生活污水和工业废水的排放以及畜牧业造成的污染。
4.3 辽河7个监测断面中,马虎山断面的水质优于其他监测断面,双台子河闸断面水质最差,辽河水质整体上为Ⅳ类或Ⅴ类水质,总体上呈现出中游水质较好,下游水质最差的趋势。该评价结果明确指出辽河水体的污染物来源,为辽河水质的治理提供了明确的方向。