朱 聪,王文圣,程开宇,杨 娟
(1.中国水电顾问集团华东勘测设计研究院,浙江 杭州 310014;2.四川大学水利水电学院,四川 成都 610065)
月径流的变化常常受多种因素的影响,这些因素与月径流之间存在着复杂的非线性关系。在月径流展望预测 (即根据历史月径流资料,同时预测下一年各月的月平均径流量)中,常用的统计方法很难描述多因子间的复杂关系。常规统计预测方法的一个共同特点是:先对数据的分布特征作某种假定,再按照一定准则寻找最优模拟,最后对建立的模型进行证实。由于过于形式化、数学化,受束缚大,该类方法对月径流这类高维非线性、非正态系统的适应能力不强。
针对上述问题,近20年来,国际统计界提出了“直接从审视数据出发—通过计算机分析模拟数据—设计软件程序检验”这样一条探索性数据分析方法,投影寻踪 (Projection pursuit,PP)方法就是这类方法的突出代表。投影寻踪技术[1-2]是一种处理多因素复杂问题的统计方法,其基本思路是:把高维数据通过某种组合投影到低维子空间上,对于投影的构形,采用投影指标函数来衡量投影显现某种结构的可能性大小,寻找出使投影指标函数达到最优(能反映高维数据结构或特征)的投影值,然后根据该投影值分析高维数据的结构特征,或根据该投影值与研究系统输出值之间的散点图,构造适当的数学模型,来预测系统的输出。
本文基于投影寻踪分析与随机分析提出了一种新的耦合预测模型:运用投影寻踪技术将年内12个月径流由遗传算法优化得投影值,获取投影值与年径流的相关关系;建立年径流预测模型,由预测的年径流推算对应的投影值;寻找与最近邻的h个模式,由最近邻回归进行年内月径流展望预测。将耦合模型应用于宝珠寺水电站和三峡水电站入库月径流展望预测,研究结果表明该耦合模型可行且预测效果较好。
设 Q0i,j(i=1,2,…,n;j=1,2,…,12),为i年j月径流量;n为年数;y0i为i年径流量。建立耦合模型的步骤如下。
(1)数据归一化
式中,Q0j,max为j月径流最大值;ymax为年径流最大值;Qi,j、yi分别为归一化月、年径流。
(2)线性投影。将12维月径流量投影到一维线性空间,得到投影指标值
式中,zi为 i年投影特征值;=(a1,a2,…,a12)T为投影方向。
其相关关系可视具体情况而定。
(4)对年径流建立预测模型,并预测来年年径流量y^。本文采用最近邻抽样回归模型[4]进行预测,最近邻抽样回归模型思路:构造特征矢量Dt=(yt-1,yt-2, …, yt-p), 相应后续值 yt(t=p+1, p+2, …,n);在Dt中,寻找k个与当前特征矢量Di最近邻(根据 Dt和Di间的欧式距离来判断)的特征矢量D1(i),D2(i),…,Dk(i);用下式计算 Di的后续值
式中,Wj(i)为抽样权重。
式中,Q0l,j为抽取的第 l年各月径流分配模式;Wl(j)为第j个月、第l个分配模式对应的抽样权重,算法如式(7)。
以宝珠寺水电站的入库代表站三磊坝站38年(1964年~2001年)的年、月径流资料为例。用其前34年(1964年~1997年)的月径流资料建立模型,计算得到最优投影方向=(0.065 2,0.128 9,0.161 0,0.208 2,0.213 6,0.198 0,0.207 9,0.440 9,0.484 9,0.248 0,0.426 9, 0.329 5), 并计算其投影指标值{zi}34, 建立zi与归一化年径流量 yi的关系:zi=2.441yi+0.126。其相关关系非常密切,见图1。
图1 投影指标值与归一化年径流量的关系
本例中,年径流预测最近邻数k=4,月径流展望预测最近邻数h=4。取后4年(1998年~2001年)作为检验年,预测结果见表1及图2。
表1 宝珠寺水电站1998年~2001年径流预测结果
图2 1998年~2001年月平均流量展望预测过程
类似地,用宜昌站前46年(1950年~1995年)月径流资料建模,计算得最优投影方向⇀a=(0.331 8,0.210 9, 0.455 4, 0.569 2, 0.435 0, 0.141 0,0.178 4, 0.072 8, 0.012 0, 0.204 9, 0.122 7,0.103 2),得到各年投影指标值 {zi}46。建立zi与归一化年径流量yi的关系:zi=1.246yi+0.973。
本例中,年径流预测的最近邻数k=4,月径流展望预测的最近邻数h=2。展望预测后5年(1996年~2000年)月径流量,结果见表2和图3。
表2 三峡水电站1996年~2000年年径流预测结果
图3 1996年~2000年月平均流量展望预测过程
模型计算结果分析如表3。耦合模型在宝珠寺水电站应用中,虽然投影值与年径流关系密切,但由于采用的月径流资料是一个小水文站前的资料,年际变化较大,使得预测效果一般;而在三峡水电站应用中,采用的月径流资料年际变化与小站的资料相比,比较稳定,模型预测效果较好。其次,从图3可以看出,预测过程会与其他模型类似,非汛期预测效果较好,汛期的预测效果较差,尤其在第一个例子中,某些年份还在汛期出现双峰,年际变化复杂,使预测精度下降,但年内月径流展望预测本身具有一定的难度,原因在于月径流分配形式取决于未来一年各月各日的降水量。而两个例子都显示,遇见期为1年时,该模型能较好地拟合出月径流变化趋势,展望预测效果较好。
表3 耦合模型月平均流量展望预测阶段误差
将投影寻踪回归分析与随机分析相结合建立了一种新型耦合模型,该模型计算步骤简洁合理,具有较强的理论性和较高的稳健性。将耦合模型应用于月径流展望预测实例研究,结果表明是可行的。
[1]金菊良,魏一鸣,丁晶.投影寻踪门限回归模型在年径流预测中的应用[J].地理科学,2002,22(2):171-175.
[2]王顺久,张欣莉,丁晶,等.投影寻踪聚类模型及应用[J].长江科学院院报,2002,19(6):53-55.
[3]金菊良,丁晶.水资源系统工程[M].四川科学技术出版社,2002:65-67,162-163.
[4]王文圣,向红莲,丁晶.最近邻抽样回归模型在水文水资源预报中的应用[J].水电能源科学,2001,19(2):8-10,14.