陈 方,吴鹏飞,刘金涛,3,甘升伟,周川莉
(1.水利部太湖流域管理局水文水资源监测局,江苏无锡214024;2.河海大学水文水资源学院,江苏南京210098;3.河海大学水文水资源与水利工程科学国家重点实验室,江苏南京210098)
太湖湖西区位于太湖流域上游,是太湖主要的水量来源,而太湖是太湖流域水资源调控中心。因此,湖西区入湖水量不仅与流域防洪关系密切[1],也与流域水资源优化配置关系紧密。由于经济社会快速发展,土地利用情况改变、河道整治、水资源调度等原因,近年来湖西区入湖水量出现变化[1- 3]。湖西区入湖水量变化也引起了一系列环境问题,例如太湖污染负荷增加,致使太湖富营养化趋势未能得到有效遏制[4]。因此,在最严格的水资源管理制度下,落实湖西区入湖水量控制具有现实意义。
为实现湖西巡测段入湖水量的动态监测,环太湖水量监测工作早在20世纪60年代便得以开展,并在5个水利分区(含湖西区)设置巡测控制线。湖西巡测段存在大量入湖口门,部分口门无法适用传统的一潮推流法等流量估算方法[5],特别是一些环湖闸门调度变化较大,导致每年的测验任务繁重[6]。因此,为研究区域入湖水量变化规律,优化测验口门数目,建立一个简单高效的入湖水量估算模型是迫切需要解决的问题。
主成分分析是一种针对多变量的统计分析技术,通过降维消除数据的相关性,可以达到简化数据的目的。由于水文研究中普遍存在影响因子过多的现象,主成分分析方法被广泛应用于水质、降水、流量等指标的计算和预测过程[7- 9]。本文通过对湖西巡测段入湖口门的相关关系进行研究,运用主成分分析和回归分析相结合的方法,试图遴选出参与模型预测的最优口门数目,建立湖西巡测段入湖水量估算的回归模型,以期为太湖流域的入湖水量控制管理提供理论参考。
湖西区区域集水面积7 896 km2,年平均降水量1 408 mm。根据1986年~2015年间的巡测资料,湖西区多年平均入湖水量为48.45亿m3,占太湖总入湖水量的54.9%,是太湖的主要来水区。
湖西入湖巡测段包括陈东港桥段和浯溪桥段2个分段以及大港桥、雅浦桥、龚巷桥、湖山桥等4个单站(见图1)。陈东港桥段包括乌溪桥至茭渎桥共14个桥断面;浯溪桥段包括分水桥至师渎桥共9个桥断面。除雅浦桥和龚巷桥位于常州境内外,其余测段、单站均位于无锡境内。
图1 湖西区主要巡测段及站点分布
研究中,采用主成分分析遴选出代表性口门,建立回归模型。主成分分析法是为了消除各口门间的相关性,实现主要影响口门的遴选,以得到综合各所遴选口门信息的主成分变量,再对提取出的主成分使用多元回归分析建立模型。假设有n年系列的样本,p个口门的指标数据参与主成分分析,具体计算步骤如下[10- 12]:
(1)原始指标数据标准化。数量级和量纲的差别往往会给不同数据间的计算带来误差,因此需要对数据式进行标准化处理。即
(3)第i个主成分的贡献率为fi,以此计算累计贡献率F,通过对F进行分析判断选取主成分的个数。本文中,将F>80%作为主成分个数m的评判标准,则
(2)
(4)使用式(3)求主成分
(3)
式中,eij是ei的第j个分量。
(5)对主成分与考察因变量进行回归分析。
使用1986年~2015年的统计资料分析湖西区入湖水量变化。湖西区在30 a研究期内的多年平均入湖水量为48.45亿m3,其中1986年~2000年的多年平均入湖水量为38.86亿m3,2001年~2010年多年平均入湖水量为56.59亿m3,2011年~2015年多年平均入湖水量为60.93亿m3。结合图2可以发现,2000年以后的湖西区入湖水量明显增多,且呈持续上升的趋势。
图2 1986年~2015年湖西区入湖水量变化
鉴于早年入湖站点资料有限,同时湖西巡测段各站点间的相关规律可能随着入湖水量的增加出现变化,本文使用2001年~2015年数据建立入湖水量计算模型。为增加建模样本的数量,提高代表性,选取2001年~2014年流量数据作为主成分回归建模的数据基础,以2015年流量数据验证模型有效性。由于2015年是太湖流域少有的丰水年,使用当年数据验证模型能更为可靠地检验模型。
湖西区的4个单站对入湖水量贡献极小,例如2014年4站总入湖水量为1.22亿m3,仅占2014年湖西区入湖水量66.03亿m3的1.85%。在丰水年的2015年,4站总入湖水量4.83亿m3占湖西区入湖水量75.33亿m3的6.4%。因此从优化口门数量角度出发,对陈东港桥段和浯溪桥段的23个站点进行遴选后建模估算湖西巡测段入湖水量。
采用主成分分析法研究2001年~2014年入湖水量数据,得到23个主成分的特征值、贡献率和累计贡献率。根据计算结果,前3位主成分的贡献率(分别为38.41%,28.54%,14.00%)累计达到80.95%。研究认为,累计贡献率超过80%时的主成分可充分代表全部站点信息。因此,确定了3个主成分,能够最大限度地包含原有23个站点的信息。
计算所选择的3个主成分的荷载矩阵,保留相关系数绝对值大于0.8的项组成所需主成分因子,选定了由11个站点组成的3个主成分因子。主成分F1的贡献率最高,是湖西区入湖水量的最主要影响因素。F1的荷载主要集中在陈东港段,包括官渎桥、双桥、定跨桥、八房桥和陈东港桥(相关系数为0.878,0.861,0.860,0.858,0.890)。主成分F2由湖山桥站和犊山闸站组成(相关系数为0.804,0.811)。贡献率排在第三位的主成分F3包括分水桥、浯溪桥、茭渎桥和社渎桥4个站点(相关系数为0.897,0.861,0.881,0.870)。
根据以上分析结合式(3)得出3个主成分因子的组成。即
F1=0.295Q官渎桥+0.29Q双桥+0.289Q定跨桥+
0.289Q八房桥+0.299Q陈东港桥
(4)
F2=0.134Q湖山桥+0.811Q犊山闸
(5)
F3=0.5Q分水桥+0.48Q浯溪桥+
0.491Q茭渎桥+0.485Q社渎桥
(6)
使用选取的3个主成分代替原自变量进行多元回归分析,得到主成分与因变量的回归模型
Y=-45.516-3.649F1-1.172F2+10.317F3
(7)
使用2015年30个测次的实测流量数据验证上节得出的回归模型并进行合理性分析。表1与图3对比了实测流量与估算流量。可以看出,绝大多数情况下实测流量与估算流量相对误差较小,二者拟合度较好,变化趋势基本一致。
研究对比发现,算得的流量值普遍小于实测值。这是因为2015年是太湖流域的丰水年,实际流量较其他年份大,各站间的流量相关性与正常年份略有不同,所以计算值出现偏差,但误差仍在允许范围内;编号27~29的3个测次连续出现相对误差较大的情况,主要是由于这3个测次发生在年末、水量较小所致。由此可见,本文建立的模型适用性良好,能够有效地计算湖西区入湖水量。
表1 2015年实测流量与估算流量误差对比
图3 2015年湖西区巡测段实测流量与预测流量对比
本研究发现太湖湖西区入湖水量有不断增加的趋势,研究其入湖水量与各站点间的相关关系,通过主成分回归建立了湖西巡测段入湖水量估算模型,消除了原有变量间的共线性,仅保留三个主成分作为自变量。检验结果证明,模型在保证计算精度的基础上实现了湖西巡测段口门数量的优化,达到了降维以简化算法的目的。因此,使用主成分分析方法优化站点数量、计算入湖水量,可为水资源管理、区域防洪提供一定理论依据。