王欲敏,曾德芳,阙思思,罗晗郁,周文强
(重庆交通大学水利水运工程教育部重点实验室,重庆 400074)
三峡库区位于我国长江上游下段,库区内地形复杂,山峦重叠,地形陡峻,谷深水急。三峡工程水利枢纽工程是综合治理长江中下游防洪问题而实施的项目。随着三峡库区经济的快速增长,水体污染负荷增加,地表径流影响整个库区水体,从而影响周边城市水环境质量[1]。2010年,三峡水库完成175 m水位蓄水后,河道干支流流速变缓、滞留时间延长、水体自净能力减弱,在污染物排放相同情况下,库区水环境受到了更严重的污染[2],每年6月—9月为145 m防洪限制水位,水位变幅呈反季节变化,由此引发的水环境污染问题进一步突显[3]。据调查,三峡库区仅71%的水域符合水质标准,29%的水域受到严重污染,污染区域达30多km,而三峡库区支流众多,不易监管。因此,保护和改善库区水质状况成为重中之重[1]。
研究表明,重金属对三峡库区的水体也造成了严重的污染,三峡工程修建完成后,由于大量的船舶聚集在库区,船舶的废气和废水直接排入水体,导致了水体重金属浓度的上升[4]。其他的非点源污染也是三峡水质恶化的重要原因,如农药[5]、磷污染物[6]、氨氮及CODMn[7]等。水质恶化一直是三峡库区最为关注的问题,富营养化往往会威胁到该地区的可持续发展。
针对库区水体污染问题,学者们开展了大量研究,如分析影响三峡库区富营养化的主要因素[8]、研究三峡水库蓄水后水质的变化[9]、筑坝对库区水质的不同影响等[10]。而这些研究大多集中在评价库区水体污染的状态及影响因素、分析库区污染物的来源和输入特点等,对水质影响因素和水质指标(pH、DO、CODMn、氨氮)之间的相关性研究较少。
鉴于此,本文收集了三峡库区水质指标和潜在的库区水质影响因素等相关历史资料数据,通过分析两者间存在的关系,找出影响库区水质的主要因素以及得出库区水质及其影响因素间的相关性。本研究有利于库区水污染的规划、管理和决策,同时,也能为后续的三峡库区水质趋势预测研究做铺垫。
本文采用年平均值的方式归纳整理三峡库区10年间(2008年—2017年)具有代表性的水质指标数据及其潜在影响因素指标数据。水质指标选用《中国环境监测水质周报》[11]中的评价指标,包括pH、DO、CODMn、氨氮;潜在的水质影响因素从《长江流域水资源公报》[12]、《长江泥沙公报》[13]及《长江三峡工程生态与环境监测公报》[14]中选出,主要包括降雨量、入库输沙量、出库输沙量、淤积量、工业废水排放量、城镇生活污水、三峡过闸货物量、船舶油污水、船舶油污水中石油类、船舶生活污水等。各类指标变量如表1所示,其具体数据如图1、图2、表2所示。
表1 三峡库区水质指标及其影响因素
表2 2008年—2017年三峡库区污水排放量
图1 三峡库区水质指标
图2 三峡库区水质潜在影响因素
典型相关分析[15-16]是研究两组变量之间相关关系的多元统计方法,与主成分分析类似,典型相关分析也是提取数组中具有代表性的综合变量,不同之处在于典型相关分析是从总体上把握两组变量的相关关系而不是一组变量。典型相关分析已在多个领域得到应用[17-19],具体思路是通过对两组变量进行降维的方式,分别提取出两组变量中具有代表性的两个综合随机变量,得出的两个综合随机变量称为一对典型变量,利用这对典型变量的相关性来反映原来两组变量的相关关系。
典型相关分析基本定义如下。给定两个带有限矩的随机变量的列向量:X=(x1,…,xn)′和Y=(y1,…,ym)′,定义互协方差矩阵:∑XY=cov(X,Y)为n×m的矩阵,求出向量a和b使得随机变量a′X和b′Y的相关性ρ=corr(a′X,b′Y)最大。其中两个随机变量U=a′X和V=b′Y是第一对典型变量。再寻求另一个最大化相关但与第一对典型变量不同的向量,得出第二对典型变量,此步骤会进行min{m,n}次。
本文采用的相关分析方法是Spearman(斯皮尔曼)等级相关分析[20],图3是在BP神经网络模型中完成的三峡库区水质及其影响因素的相关分析的结果。三峡库区的水质不是和所有的潜在影响因素都存在着相关性,且不同的水质影响指标的影响程度和相关程度也不尽相同。由图3可知,库区水质的影响因素主要有入库输沙量(y2)、淤积量(y4)、工业废水排放量(y5)、城镇生活污水(y6)、三峡过闸货物量(y7)和船舶生活污水(y10),这些影响因素与水质间都存在着较高的相关性,而降雨量(y1)、出库输沙量(y3)、船舶油污水(y8)和船舶油污水中石油类(y9)与各类水质指标间的相关性水平较低。
图3 相关分析结果
pH的影响因素:pH与入库输沙量(y2)、淤积量(y4)、工业废水排放量(y5)和船舶生活污水(y10)存在正向相关性,与城镇生活污水(y6)、三峡过闸货物量(y7)存在负向相关性。
DO的影响因素:DO与工业废水(y5)、船舶生活污水(y10)存在负向相关性,随着城镇生活污水(y6)的增大,DO也随之增加。
CODMn的影响因素:CODMn与入库输沙量(y2)、淤积量(y4)和船舶生活污水(y10)存在正向相关性,与城镇生活污水(y6)、三峡过闸货物量(y7)存在负向相关关系。
氨氮的影响因素:氨氮与其他任何影响因素都没有显著的相关性。
pH逐年呈现下降趋势,泥沙会吸附水体中的磷污染物[21-22],磷酸盐又是碱性,因此,随着泥沙含量的降低,库区水体的pH也在减小;工业废水排放量和船舶生活污水排放量的减少也使得pH下降,说明三峡库区排放的工业废水和库区船舶生活污水总体呈碱性;而城镇生活污水的增加使得pH下降,说明城镇生活污水总体呈现酸性。
DO主要受到水温、含盐量等的影响[23-24],库区DO与工业废水排放量呈负相关性、与城镇生活污水呈正相关性,说明了库区工业废水和城镇生活污水的总体含盐量在降低;此外,库区航道等级的不断提升也可能是DO增加的因素。CODMn和pH的影响因素有些类似,与库区的入库输沙量、淤积量以及船舶生活污水呈正向相关性,与城镇生活污水和三峡过闸货物量呈负向相关性,而CODMn呈现逐年下降的趋势,说明库区前3项因素比后两项因素对CODMn的影响更大。
相关分析结构表明,三峡库区水质受到许多因素的影响,库区水质也与各种因素间相关,虽然能够反映库区水质与其影响因素两两间的相关关系,但并不能直接反映三峡库区的水质与其影响因素两整体的相关程度。因此,本节运用典型相关分析将三峡库区水质和库区水质的影响因素作为两个整体进行分析,进一步探究库区水质与其影响因素间的相关关系。其中仍将pH、DO、CODMn及氨氮(4项)用于表征三峡库区水质状况,将对4项水质指标影响最显著的因素入库输沙量(y2)、淤积量(y4)、工业废水(y5)、城镇生活污水(y6)、三峡过闸货物量(y7)、船舶生活污水(y10)这6项表征水质影响因素。
3.2.1 典型相关性及显著性检验
通过对三峡库区水质及其影响因素两组数据进行典型相关分析,提取出4对典型相关变量,得出了4个典型相关系数,分别是1.000、0.960、0.895、0.683。在总体系数是否为0的假设性检验中,前3个典型相关系数满足显著性要求(P<0.05),意味着X和Y两组分析项之间有着紧密的正向相关关系,即三峡库区水质与其影响因素两整体间存在着显著的相关关系(表3)。通过典型相关分析,得出的前两个典型相关系数系数(1.000)大于简单分析得出的相关系数,说明典型相关分析结果更能反映三峡库区水质及其影响因素间的关系。后续将重点考虑呈现出显著性的前3对典型变量。
表3 典型相关性及显著性检验
3.2.2 标准化典型相关系数及典型相关模型
因各项指标的单位不同,为去除量纲的影响,需对数据进行标准化后再进行计算得出结果。前3个典型相关系数满足显著性要求,所以只需计算前3对典型相关变量,结合典型相关系数运用SPSS软件计算得出3对典型相关模型,如式(1)~式(3)。
第一对典型相关模型:
(1)
第二对典型相关模型:
(2)
第三对典型相关模型:
(3)
根据典型相关模型方程,第一对典型相关变量中,典型变量U1主要由pH(x1)、DO(x2)和CODMn(x3)所主导,典型系数为0.701、0.834和-0.901,其中最具主导作用的是CODMn;典型变量V1由入库输沙量(y2)和淤积量(y4)主导,典型系数为7.510和-7.837。考虑到入库输沙量的典型系数符号为正,pH和DO的典型系数符号为正,CODMn的典型系数符号为负,可以认为入库输沙量的增大会使pH、DO增加,使CODMn减小;同样考虑到淤积量典型系数符号为负,可以认为淤积量的增大会使pH、DO减小,使CODMn增加。
第二对典型变量中,典型变量U2由pH(x1)、CODMn(x3)起主导作用,典型系数为1.625和-1.474;典型变量V2由入库输沙量(y2)、淤积量(y4)、城镇生活污水(y6)和船舶生活污水(y10)起主导作用,对应的典型系数为-8.318、-7.195、8.995和-9.884。考虑到入库输沙量的典型系数符号为正,pH和CODMn典型系数符号分别为正和负,可以认为入库输沙量的增大会使pH增加,使CODMn减小;同样考虑到城镇生活污水、船舶生活污水和淤积量的典型系数符号为负,认为城镇生活污水、船舶生活污水和淤积量的增大会使pH减小,使CODMn增加。
第三对典型变量中,典型变量U3主要由pH(x1)起主导作用,典型系数为-1.469;典型变量V3由入库输沙量(y2)和淤积量(y4)起主导作用,对应的典型系数为4.120和-3.915。考虑到入库输沙量的典型系数符号为正,pH的典型系数符号为负,可以认为入库输沙量的增大会使pH减小;考虑到淤积量和pH的典型系数符号相同,认为淤积量的增大会使pH增加。
通过3对典型相关模型方程得出的模型可以看出,pH对U1、U2、U3这3个典型变量起着主导作用,可以认为pH在这4项水质指标中是最能反映三峡库区水质状况的指标;同样的,对V1、V2、V3这3个典型变量同时起到主导作用的指标是入库输沙量和淤积量,可以认为在三峡库区水质的影响因素中入库输沙量和淤积量是占有最大比重的两项指标。
3.2.3 典型结构分析
典型结构分析是通过典型载荷和交叉载荷的数值来衡量原始变量与典型变量的相关程度和方向,典型载荷是反映原始变量与自身典型变量间的相关关系的指标,其数值的绝对值越大,代表原始变量对自身典型变量的解释程度越高,而交叉载荷则是原始变量对另一个典型变量的相关关系指标。
典型载荷计算如式(4)~式(7)。
cov(xi,uj)=cov(xi,a1jx1+a2jx2+…+apjxp)=
cov(xi,a1jx1)+cov(xi,a2jx2)+…+
(4)
(5)
cov(yi,vj)=cov(yi,b1jy1+b2jy2+…+bpjyp)=
cov(xi,b1jy1)+cov(xi,b2jy2)+…+
(6)
(7)
交叉载荷计算如式(8)~式(11)。
cov(xi,vj)=cov(xi,b1jy1+b2jy2+…+bpjyp)=
cov(xi,b1jy1)+cov(xi,b2jy2)+…+
(8)
(9)
cov(yi,uj)=cov(yi,a1jx1+a2jx2+…+apjxp)=
cov(yi,a1jx1)+cov(yi,a2jx2)+…+
(10)
(11)
由表4可知,pH(x1)、DO(x2)和CODMn(x3)与第一典型变量U1的相关性很高,典型载荷系数(相关系数)为-0.832、0.717和-0.861,说明pH、DO和CODMn可以很大程度反映三峡库区的水质状况。在交叉载荷中,pH、DO和CODMn与第一典型变量V1同样具有很强的相关程度,说明三峡库区水质影响因素对pH、DO和CODMn的影响程度最大。水质影响因素入库输沙量(y2)、淤积量(y4)、工业废水排放量(y5)和三峡过闸货运量(y7)与第一典型变量V1具有很强的相关程度,典型载荷系数为-0.719、0.731、-0.679和-0.737,说明4项指标在三峡水质影响因素中占有主导地位;在交叉载荷中,入库输沙量(y2)、淤积量(y4)、工业废水排放量(y5)和三峡过闸货运量(y7)与第一典型变量U1同样有着很强的相关程度,说明这4项指标对三峡库区水质状况的影响最为显著,典型变量的关系结构如图4所示。
表4 典型结构分析
图4 相关变量关系结构图
3.2.4 典型冗余度分析及解释能力
典型冗余度[25]反映的是各典型变量对各变量组方差解释的百分比,第一典型冗余表示典型变量对自身变量组解释的百分比,第二典型冗余表示典型变量对另一变量组解释的平均比例,典型相关系数的平方表示两组典型变量间共同变异的百分比。典型冗余度分析结果如表5所示。
表5 典型变量的解释能力
从冗余分析结果可知,两组变量(X、Y)的第一典型冗余为0.899和0.596;第二典型冗余为0.842和0.645,表明这3对典型变量均能较好预测自身组内变量,也能有效预测对方的变量组,说明了三峡库区水质及其影响因素不仅能被自身的典型变量解释,同时也能被对方的典型变量解释。而3对典型相关变量的共同解释百分比(1.000、0.922、0.801)均高于0.700,再次说明三峡库区水质与其影响因素间存在着相关关系,且相关性非常显著。
通过对三峡库区的4项水质指标及其潜在的水质影响因素进行相关分析,结果表明,影响三峡库区水质的因素主要为库区入库输沙量、淤积量、工业废水排放量、城镇生活污水、过闸货物量、船舶生活污水。本研究对三峡库区的4项水质指标(pH、DO、CODMn、氨氮)与6项水质影响因素(工业废水排放量、城镇生活污水、过闸货物量、船舶生活污水、入库输沙量、淤积量)两个整体间进行了典型相关分析,得出3对典型相关变量及3个典型相关系数。它们的典型相关系数(1.000、0.960、0.895)均大于简单相关分析得出的所有相关系数,说明要研究三峡库区的水质及其影响因素间的关系,需要先从两个整体系统进行分析,再逐步分析系统中每个指标间的单一关系。
在典型相关模型中,pH对U1、U2、U3这3个典型变量起着主导作用,即pH在这4项水质指标中是最能反映三峡库区水质状况的指标;入库输沙量和淤积量对V1、V2、V3这3个典型变量同时起到主导作用,即入库输沙量和淤积量在三峡库区水质的影响因素中占有最大比重的两项指标。在典型结构分析中,得出pH、DO及CODMn能够很大程度反映三峡库区的水质状况,且受水质影响因素的影响程度最大;工业废水排放量、三峡过闸货运量、入库输沙量和淤积量在三峡水质影响因素中占有主导地位,且对库区水质状况的影响最显著。在冗余分析中,再次得出三峡库区4项水质指标与6项水质影响因素间存在显著的相关性。
三峡库区还有其他的水质评价指标,且影响库区水质状况的因素也远不止本文所涉及的,因此,在三峡库区水质影响因素方面研究还有待加深。另外,水质指标间以及水质影响因素间可能存在着内部的影响,如pH会影响CODMn的含量,入库输沙量也对淤积量产生影响,因此,还需考虑将两个部分进行整体的相关性分析,才更能说明二者的联系。