基于相关分析的望虞河沿线引水传播时间研究

2011-04-30 01:56吴浩云万定生李士进陆铭锋
水利信息化 2011年3期
关键词:站点计数水质

吴浩云 ,周 强 ,万定生 ,李士进 ,陆铭锋 ,陈 方

(1.水利部太湖流域管理局,上海 200434;2.河海大学 计算机与信息学院,江苏 南京 210098)

0 引言

“引江济太”工程是实现“静态河网、动态水体、科学调度、合理配置”战略目标的重大举措,最终目标是通过望虞河将长江水引入太湖,改善太湖水环境,由此带动其他水利工程的优化调度,加快水体流动,提高水体自净能力,缩短太湖换水周期,实现流域水资源优化配置。“引江济太”是一项十分复杂的系统工程,涉及的水利工程众多。其中太湖流域调水系统中,常熟和望亭水利枢纽直接影响着引水过程,受长江潮位的影响,望虞河引水时常熟水利枢纽要视潮位高启低闭,一般情况下,常熟水利枢纽在 1 天内 2 开 2 关,而望亭水利枢纽一般是连续开闸或关闸。为此需要研究常熟水利枢纽与望亭立交闸的优化调度方式,在此过程中需要分析常熟水利枢纽的引水对望虞河沿线主要监测站点及望亭立交闸下水质何时产生影响[1-4]。对于水流传播时间的研究,国内外专家学者做了很多的工作,李士进[5]等人采用派生动态时间弯曲(DDTW)原理分析洪峰传播时间,并应用于洪峰传播时间预报,李强[6]等人提出了逐步回归法分析洪水的传播时间。

在“引江济太”工程中,长江水从常熟水利枢纽引入,通过望虞河最后经望亭水利枢纽到达太湖。在此过程中,望虞河沿线相邻监测站点之间水质序列变化规律具有一定相似性和传播性,上游站点水质的变化必然会影响到下游站点的水质,因此通过分析上下游水质序列之间的相关性,研究上游水质对下游水质何时产生影响。由于望虞河沿线全长 60.8 km,不仅引水距离比较长,而且沿线涵闸和河流湖泊众多,这就给分析引水到达望亭水利枢纽的传播时间增加了难度。考虑到以上因素,先分析望虞河沿线相邻站点的传播时间,再通过累加的方式计算常熟水利枢纽的引水到达望亭水利枢纽的传播时间。因为计算的传播时间是以“天”为单位的,仅仅通过时间累加方式计算从常熟水利枢纽到达望亭水利枢纽的传播时间难免会有误差,而且考虑到常熟水利枢纽和张桥站点是目前调度的重要站点,因此在此基础上分别分析了从常熟水利枢纽、张桥到望亭水利枢纽的传播时间。最后通过绘制各个站点之间的水质序列变化规律的相似性曲线图,来验证所得传播时间的正确性。

本文通过结合相关分析和 Borda 计数方法[7]分析望虞河沿线各站点之间的传播时间,并利用绘图方式验证所得到的传播时间。通过以上方法计算出从常熟引水到影响望亭立交闸水质需要的时间,提出望亭立交闸最佳的开闸排水时机,从而能够在短时间内稀释太湖较差水质,遏止蓝藻继续暴发的势头和水质恶化,改善太湖流域水环境。

1 望虞河沿线时间传播分析

为了满足引江济太调水过程中实时调度与分析的需要,根据望虞河沿线主要监测站点的水质数据,分析从常熟水利枢纽引水经望虞河到达望亭水利枢纽的时间。从常熟水利枢纽(简称 CS,以下监测站点的简称类似)到达望亭水利枢纽(WT)要途经虞义桥(YYQ)、张桥(ZQ)和大桥角新桥(DQJ)3 个主要水文监测站点,具体环境如图 1 所示。由于相邻各站点之间水质变化规律具有一定相似性和传播性,因此利用相关分析方法分析相邻站点之间的传播时间,可得到从常熟水利枢纽到达望亭水利枢纽的传播时间。

图1 望虞河及其周边环境

1.1 相关分析原理

相关分析是对 2 个对等的变量数据,用数学方法测定反映它们之间变动的联系程度和方向的一种统计方法。相关系数是对等变量相关程度的一种指标,常用的线性相关系数主要有 Pearson 简单、Spearman 等级和 Kendall τ 等相关系数,本文采用Pearson 简单相关系数。

Pearson 简单相关系数用于度量定距变量间的相关关系,计算公式如下:

式中:n 为样本容量;r 为 2 个向量 x ={x1, x2, …, xn}与 y ={y1, y2, …, yn}的相关系数;分别表示 x与 y 中元素的均值。

相关系数 r 的取值范围为 | r |≤1,其绝对值越接近于 1,表示相关性越强;越接近于 0,表示相关性越弱。如果 | r | =1 则表示 2 组变量完全线性相关;如果 r = 0,则表示 2 个现象完全不相关(不是线性相关)。判断 2 变量线性相关密切程度的具体标准为:0≤| r |< 0.3 ,称为微弱相关;0.3≤| r |< 0.5,称为低度相关;0.5≤| r |< 0.8,称为显著相关;0.8≤| r |< 1,称为高度相关。

1.2 基于相关分析的传播时间分析模型

从常熟水利枢纽引长江水通过望虞河沿线要经过多个水文监测站点,最后到达太湖入湖口望亭水利枢纽。各站点之间都有一段的距离,水流从 1 个站点传播到其他站点需要一定的时间,所以水流影响到各个站点的水质在时间上也就各不相同,即水质变化具有一定的传播性。常熟水利枢纽所引的长江水是经过监测达标后的水,水质总体上没有较大的波动且水质较好。但是由于望虞河沿线受到污水的影响,望虞河沿线其他站点(除常熟水利枢纽之外)水质变化曲线均呈现先上升然后下降,最后变为稳定状态的变化规律。由于相邻站点之间距离相对较短受到影响的因素较相似,所以相邻站点水质变化具有一定的相似性。根据水质序列具有的传播性和变化的相似性,本文采取了相关分析的方法建立模型并计算各个站点之间的传播时间。

在进行相关分析之前,首先根据历年在常熟水利枢纽引水期间望虞河沿线各站点水质变化规律,选取合适的水质数据用于分析。由于常熟枢纽闸内的水质通常都是达标的,而望虞河沿线的其他站点水质会随着引水量的增加,出现浓度先升高后降低直至达标这样的变化过程,因此在分析常熟水利枢纽与虞义桥之间的传播时间时,选取的是虞义桥水质达标以后的数据,而望虞河沿线其他站点选取的是常熟水利枢纽开始引水后水质从未达标至稳定达标后的一段数据。而且为了便于计算,各站点每年各选取不超过 15 条水质数据组成一段水质序列。在对 2 个站点进行水质序列相关分析时,采用的数据是上游站点选取 1 组数据,对应选取下游站点 4 组数据,包括对应于上游站点同一天的数据和传播 1,2,3 天后的数据。

然后分别计算不同传播时间情况下,上游与下游站点水质序列的相关系数,根据相关系数分别计算不同传播时间下的 Borda 计数得分(相关系数最高的 Borda 计数得分为 4,其他根据相关系数从高到低依次减小),最后分别根据 Borda 计数的最高分数确定从上游影响到下游需要的时间。

2 实验结果与分析

常熟水利枢纽所引的长江水中影响太湖水质的指标主要有高锰酸盐指数 (CODMn)、总氮 (TN)、氨氮 (NH3-N)、总磷 (TP) 4 个指标,其中 CODMn是影响入湖水质是否达标的最重要水质指标,而且水质变化规律受到望虞河西岸的污水影响较小,因此这里以 CODMn水质指标为例进行分析,其他水质指标也可以采用同样的方法。

本文通过相关分析方法并利用 CODMn水质数据,分析长江水从常熟水利枢纽到达望亭水利枢纽所需要的时间。在此分析过程中,根据相邻站点水质变化的相似性,采取分段分析方法分析从常熟枢纽到达望亭水利枢纽的传播时间,即分别分析从常熟到虞义桥、虞义桥到张桥、张桥到大桥角新桥和大桥角新桥到达望亭水利枢纽的传播时间。在计算传播时间的过程中,首先根据每年选取的数据,通过相关分析模型分别计算每年的相关系数 ri,i =1, 2, 3, 4, 5,然后整合所有年份的数据计算总的相关系数 r,最后综合各年的相关系数与所有年总的相关系数一起计算 Borda 计数得分,从而估计出各站点之间的传播时间,结果如表1 和 2 所示。

表1 不同传播时间下相邻站点之间相关分析结果

表2 不同传播时间下相邻站点之间相关分析结果

从表1 和 2 可以看出,在 2003~2007年5 年引水期间,计算从常熟水利枢纽与虞义桥的不同传播时间下 2 个站点的水质序列相关系数和 Borda 计数得分,发现常熟枢纽闸内与虞义桥同一天(即传播时间为 0 天)水质序列的相关系数的 Borda 计数总得分为最高 20 分,其他传播时间下相应的 Borda 计数总得分分别只有 15,10 和 17,这说明从常熟水利枢纽引水当天就可以到达虞义桥。同样,根据 Borda计数方法可以得到虞义桥到张桥、张桥到达大桥角新桥和大桥角新桥到达望亭水利枢纽的传播时间分别是 0,1~2 和 0~1 天。

然后分别绘制相关系数的 Borda 计数得分最高的 2 组水质序列的相似性变化曲线图,具体如图 2 所示,可以验证通过相关系数和 Borda 计数方法所得结果的准确性。由图 2 (a) 可以看出,常熟枢纽闸内与虞义桥同一天的水质变化情况很相似,这进一步验证了常熟枢纽闸内与虞义桥之间的传播时间不超过 1 天。图 2(b~f)可以说明虞义桥与张桥之间的传播时间不超过 1 天,张桥与大桥角新桥的时间间隔为 1~2 天,大桥角新桥与望亭水利枢纽的时间间隔为 0~1 天。

综上所述,根据相邻站点之间水质变化规律的相似性,分段分析从常熟水利枢纽引水开始之后逐个影响下游站点水质所需要的时间,并分别计算各个相邻站点之间的传播时间,再通过累加的方式可以初步估计出从常熟水利枢纽引水到达望亭水利枢纽所需要的时间为 3~4 天。

但由于计算望虞河沿线传播时间是以“天”为单位,仅仅通过累加相邻站点之间的传播时间可能有误差,而且在选择起始站点时要考虑与目前调度相结合,所以应该考虑以常熟水利枢纽为基准,计算常熟水利枢纽到望亭水利枢纽的传播时间,另外还要考虑以张桥为基准到望亭水利枢纽的传播时间。在分析从常熟水利枢纽到望亭水利枢纽的传播时间时,由于常熟枢纽闸内的水质较好且变化很平稳,无法直接与望亭立交闸下的水质进行相关分析分析,所以分析从虞义桥到达望亭水利枢纽的传播时间。

图2 水质序列变化曲线图

从虞义桥到达望亭水利枢纽和从张桥到达望亭水利枢纽的传播时间如表3 所示。从表3 可以看出,在 2003~2007年5 年的引水期间,其中虞义桥与相对传播 3 天后的望亭立交闸下的水质序列相关系数的 Borda 计数总得分为最高21,而其他传播时间下的 Borda 计数总得分分别只有 12,12 和 15,从而可以估计常熟引水从虞义桥达到望亭水利枢纽需要 3 天的时间。而张桥与相对传播 2 和 3 天后的望亭立交闸下的水质序列相关系数的 Borda 计数总得分分别为 19 和 18,而传播 0 和 1天的 Borda 计数总得分分别只有 10,13,因此可以得出从张桥到达望亭水利枢纽的转播时间为 2~3天。同时张桥与望亭立交闸下 2003~2007 年水质序列的总相关系数比较高,这也说明距离比较短的站点之间的水质序列很相似。由图 2 (g) 也可以看出,虞义桥与相对延迟 3 天后的望亭立交闸下水质序列变化曲线最相似,这也验证了从虞义桥到达望亭水利枢纽需要 3 天时间。图 2 (h~i) 也说明了张桥与相对延迟 2~3 天后的望亭立交闸下水质变化很相似,验证了通过用相关系数和 Borda 计数得分得到的传播时间。从图 2 (j) 中可以看出常熟水利枢纽内的水质与望亭立交闸下水质差异较为明显,很难直接对这 2 个站点的水质序列进行分析,因此必须通过其下游站点的传播时间分析,来推测从常熟水利枢纽到达望亭立交闸下的传播时间。由于常熟水利枢纽与虞义桥之间的传播时间不超过 1 天,因此可以推断出常熟水利枢纽至望亭水利枢纽的时间间隔为3~4 天。

表3 不同传播时间下虞义桥、张桥分别与望亭立交闸下水质相关分析结果

4 结语

本文根据 CODMn水质在引水期间的变化规律,首先通过相关分析和 Borda 计数方法分别计算望虞河沿线各相邻站点之间的传播时间,并通过累加的方式初步获得常熟水利枢纽与望亭水利枢纽的传播时间。然后根据实际调度需要分别计算出从常熟水利枢纽到望亭水利枢纽和张桥到望亭水利枢纽的传播时间。最后又通过绘图的方式验证所得相邻站点之间的传播时间准确性。本文采用的相关分析和Borda 计数方法简单,计算方便,且易于编程实现,绘图验证的方法简洁直观,通过结合这 2 种方法可以保证所得传播时间的准确性,为引江济太的实时调度与分析提供决策依据。

通过图 2 (j) 可以看出,望亭立交闸下水质与常熟水利枢纽闸内的水质差异较大,很难直接对它们进行传播时间分析,主要原因是从常熟枢纽引水受望虞河污染水质的影响,因此当前的重要任务是要加强望虞河及周边环境保护力度。数据的缺失和异常可能会影响传播时间的研究结果,若增加对各监测站点水质数据测量次数,特别是在引水时期,根据实际情况和需要调整测量频率,比如每 6 或 4 h测 1 次。通过增加测量频度,不仅能更精确计算出望虞河沿线水质传播时间,同时也为今后预报望亭立交闸下水质达标时需要的引水量提供准确依据。

[1]刘宁. 对引江济太调水试验工程的初步认识和探讨[J]. 中国水利,2004 (2): 36-38.

[2]吴浩云. 引江济太调水实验关键技术研究和应用[J]. 中国水利,2008 (1): 6-8.

[3]高怡,毛新伟,徐卫东.“引江济太”工程队太湖及周边地区的影响分析[J]. 水文,2006, 26 (1): 92-94.

[4]戴甦,王船海,金科. 引江济太水质水量联合调度研究[J]. 中国水利,2008 (1): 15-17.

[5]李士进,张晓花,万定生,等. 基于 DTW 的测站水位影响关系估计[J]. 江南大学学报(自然科学版),2007, 6 (6): 678-682.

[6]李强,尚志荣,郭洪财. 洪水传播时间分析[J]. 东北水利水电,2003,21 (8): 41-43.

[7]李士进,朱跃龙,张晓花,等. 基于 BORDA 计数法的多元水文时间序列相似性分析[J]. 水利学报,2009,40 (3): 378-384.

猜你喜欢
站点计数水质
古人计数
递归计数的六种方式
古代的计数方法
基于Web站点的SQL注入分析与防范
一月冬棚养虾常见水质浑浊,要如何解决?这9大原因及处理方法你要知晓
2017~2018年冬季西北地区某站点流感流行特征分析
图像识别在水质检测中的应用
这样“计数”不恼人
首届欧洲自行车共享站点协商会召开
怕被人认出