任东风,胡馨予,齐 欢,董华飞
(1.辽宁工程技术大学 测绘与地理科学学院,辽宁 阜新 123000;2.沈阳市勘察测绘研究院 软件开发部,辽宁 沈阳 110000)
洪水预报是通过计算模型参数建立准确的水文模型.根据收到的实测降雨资料,工作人员利用建立的水文模型对流域内的洪水流量进行预测.但由于受降雨、气候、径流及下垫面时空分布变异性的影响,洪水预报具有高度的不确定性.暴雨不仅在任何时候都有空间分布的变化,而且流域内土壤、植被、地形、地貌、地质、水文地质等条件的空间分布是不均匀的.人类活动的影响一般是时空的[1],故而研究洪水预报根本问题在于对降雨、气候、产汇流以及下垫面等洪水基本因子的确定以及研究.朱颖元[2]等提出特定地域内洪水发生的时间和量级具有周期变化的特征,因此历史洪水一定程度上包含当地气候和下垫面变化等因素的信息,在此基础上将各流域水文站洪水预报方案将降雨产汇流过程视为整体黑箱系统,建立预报根据雨量站雨量输入-流域水文站流量输出的关系模型进行洪水预报,利用灰色关联分析法与多元线性回归方程模型寻找流域范围附近雨量站与流量之间存在的联系.殷峻暹[3]基于GIS 的城市雨洪预报模型提出将数学计算模型与GIS 系统有机的结合在一起模拟雨洪模型.在灰色关联分析方法与多元线性回归方程在洪水预报中的应用方面,李正最[4]认为灰色关联分析与多元线性回归模型在模型形式、参数辨识、方法处理等方面是一致的,这2 种方法在短期洪水预报中有效.夏军[5]基于时间序列多信息利用的可拓原理和灰色系统理论的相关分析思想,提出一种适用于缺乏输入因子数据或影响因子选取困难的中长期水文预报方法.陈意平[6]等认为灰色关联分析为水利系统的中长期预报提供了一种新方法.
本文以辽河分支绕阳河流域的东白城子站为例,根据历年洪水数据,对流量和各个雨量站进行灰色关联性分析,判断流域流量与雨量站之间的关联强度,建立多元线性回归方程,进行洪水洪峰流量方程验证和预测.
辽西地区主要分布3 大水系,即大凌河、小凌河、辽河.辽河水系包括绕阳河、柳河、养息牧河、秀水河[7].绕阳河是辽河水系重要的河流之一,是辽河最下游右侧的一条大支流,发源于辽宁省阜新县扎兰营子查喀尔山(海拔590 m)[8],在盘锦市盘山县万金滩汇入辽河.东白城子站以上有韩家杖子水文站,15 处雨量站,流域面积2 138 km2,主要支流包括苇塘河和二道河,植被生长不良,土壤质量差,水土流失严重,近些年来发生较大洪水年份有1969年、1975 年、1984 年、1994 年、1998 年、2005 年、2009 年、2013 年等.年降水量460~520 mm,从6月到9 月是一个汛期.这个地区有许多暴雨,其中大部分是在长期干旱之后.暴雨时空分布不均,降雨强度变化较大.这条河洪水主要是由大雨引起的.洪峰多出现在夜间,汇流时间短,波动大,峰高小,基本上属于高渗透产流[9].径流系数较小,一般在0.05~0.31.东白城子水文站2013 年7 月16 日洪水过程线,见图1.
图1 东白城子水文站2013 年7 月16 日洪水过程Fig.1 flood hydrograph of dongbaichengzi hydrological station on July 16,2013
灰色关联分析是一种通过灰色关联度顺序来描述因素间关系的强弱、大小、次序的系统理论分析方法[10].该方法利用各变量之间的发展态势的相似度或相异度来表示关联程度[11],相似度越高,代表变量之间的关联程度越高.本文对雨量站和流域流量采用灰色关联分析,计算各雨量站与流域流量的关联值,分析每个雨量站对流量变化的影响程度,选择关联值超过阈值0.75 的雨量站为主要影响因素,将这些起主要作用的因素作为多元线性回归模型的模型参数.灰色关联分析的基本原理如下:
(1)确定分析数据序列.设置1 个母序列x0(t)和若干子序列xi(t),t=1,2,…,n,由此构成数据矩阵[12]为
式中,子序列为自变量,母序列为因变量.
(2)数据序列的无量纲处理.利用无量纲解决父序列单位与子序列单位之间的差异,表示的数据含义不同的问题,增强数据序列间的可比性,与代表新形成的母序列和子序列[13].
(3)计算母序列与子序列的绝对差值,构成各因子的差序列,计算式为
(4)计算母序列与子序列的关联系数
式中,Δmin和Δmax为式(3)中最小值和最大值,k∈(0,1)为分辨系数,其值不会影响母序列和子序列的关联度分析,本文取值为0.5[14].
(5)计算关联度为
式中,ζ0i为母序列与子序列的关联程度,其值越高,说明二者的关联程度越高,拟合程度越高.
多元线性回归模型是指用2 个或2 个以上因子作自变量来描述因变量的变化.根据灰色关联分析模型计算各变量之间的关联度,选取与分析变量关系紧密的因素,设置为因变量.通过设置自变量参数的回归方程对因变量进行预测,模型公式为
式中,Y为流量;a与C为回归系数;x为设定的自变量.
回归系数可根据数据资料按最小二乘法确定.对式(6)应用最小二乘法可导出
式中,xik为第i个预测因素的第k年数值(i=1,2,…,m;k=1,2,…,n);yk为预测对象的第k年观测值,i=1,2,…,n;n为年数;m为预测因素总个数.
本文将灰色关联模型分析挑选的主要雨量站作为自变量,使用SPSS20.0 软件,采用自变量全部进入回归模型方法,对因变量流域洪峰流量进行预测.该方法具有简单便捷、推算速度快、外推性等优点.
实时洪水预报误差修正,利用实时系统获取的观测信息和预报误差可利用的其他信息,对水文模型中有一定影响的误差因素进行实时修正是必要的[15].图2 表示模型机与实时校正结合进行洪水预报的结构框图.图2 中,I(t)和Q(t)为ε时间之前测得的模型输入和输出;QQ为可用于实时校正的其他信息;QC(T+L)为未校正模型计算结果;QC(T+L/T)为未校正模型计算结果[16].
图2 实时校正预报Fig.2 real-time correction forecast
实时校正技术的研究方法很多,可分为模型误差校正、模型参数校正、模型输入校正、模型状态校正和综合校正.模型误差修正以自回归方法为典型例子,即根据误差序列建立自回归模型,然后用实时误差预测未来的误差[17].
自回归修正(Auto Regression Updating)方法对模型残差数列
采用残差自回归估计式
那么预报结果的校正式为
式中,
式中,et为t时刻的模型计算误差;ξt+L为t+L时刻经实时校正后的预报系统残差;c1,c2,…,cp为模型常系数;p为模型回归阶数;为估计的t+L时刻误差.
校正模型假设t+L时刻的模型误差与t时刻以前的模型误差有关.误差的预测估计式,依赖于回归系数的确定.设已知观测数列
模型计算数列
可得模型误差数列
分别代入式(8)有
令
则式(11)的向量矩阵形式
式(12)的参数向量不随时间改变,那么可用最小二乘法来确定如下
对式(13)求导得
本文用到灰色关联分析方法、多元线性回归模型以及自回归误差修正模型,首先利用灰色关联分析方法筛选出对河流流量影响较大的雨量站;再通过多元线性回归模型建立多元线性回归方程,利用自回归误差修正模型对多元线性回归方程进行误差校正;最后得出该流域降雨雨量与河流流量的回归方程.绕阳河洪水预报模型结构见图3.
图3 绕阳河洪水预报模型结构Fig.3 flood forecast model structure of Raoyang River
通过水文自动预报系统获取降水等资料.水情数据自动采集上报系统是一个以遥测终端为主的实时水情数据采集、传输和处理系统、通讯网络、信息中心3 部分组成[18],见图4.
图4 水情自动测报系统架构Fig.4 architecture of automatic hydrological forecast system
系统实时采集和处理阜新市各站的雨量、流量、水位等水文、水文、气象资料,通过无线方式传输到水文局监测中心的关系数据库,再利用阜新市水情防汛值班应用系统通过GIS 手段对区域内雨量数据进行图形显示、查询、分析.阜新市水情防汛值班应用系统是阜新水文局联合辽宁工程技术大学自主研发的水情防汛系统.该系统主要实现雨情信息的查询、显示、统计分析、预警等功能,通过实时的降雨量数据生成等值面、等值线,将雨量信息清晰的显示在地图上,并当降雨,流量等信息超过阈值时,发送预警短信,方便工作者分析阜新市雨情信息的空间分布情况,系统功能见图5.
图5 二维系统功能Fig.5 system function
本文研究东白城子站洪水预报,采用许家、双庙、上招束沟、大兴庄、东白城子、韩家杖子6 个雨量站,流域见图6.
图6 东白城子站流域Fig.6 drainage basin of dongbaicheng sub station
根据2013 年7 月13 日和2005 年8 月10 日2次洪水过程线和数据库中水情数据为依据,提取降雨量和洪水流量数据,洪水过程线见图7.图7 中Y轴的降雨量代表时段范围内的面雨量,指东白城子站流域内各个雨量站在时段内测得的降雨量推求出来的区域内点平均降雨量;流量是指流域在某一时刻实测的洪水流Δt量大小.降雨经过复杂的产流和汇流两个过程注入流域从而影响流域流量,但降雨产汇流过程受到距离、地形地貌以及下垫面等因素的影响,因而降雨量与流域流量之间具有一定的时间滞后性,洪水洪峰的形成相对于降雨也有一定的时间滞后性,即降雨汇流时间Δt.
图7 2013 年绕阳河东白城子站洪水过程Fig.7 flood hydrograph of East Baichengzi Station of Raoyang River in 2013
本文只研究各雨量站降雨量与流量之间的关系,不考虑地形地貌、下垫面等因素的影响,应剔除时间滞后性的影响,因此将降雨量值平移Δt时长,使降雨量峰值与洪水-峰值对应.根据阜新市水文局提供的洪水资料数据,2013年洪水中Δt为9 h,2005 年洪水中Δt为9 h,图7 中红色线代表平移后的降水量,再依据降雨量与流量一一对应关系,读取各站点降雨数据及对应流量数据,作为灰色关联分析和多元线性回归模型建立的数据基础,见表1.
表1 降雨量-流量数据Tab.1 rainfall-flow data
东白城子站流量的变化与多个雨量站降雨量值相关,本文选取6 个与绕阳河流域流量相关的雨量站,通过这6 个雨量站的灰色关联分析计算,最终确定各雨量站对绕阳河流域流量的影响程度,用于多元线性回归方程设定参考系数,从而进行洪水流量预测.设定流量为随时间变化的母序列x0(t),将许家、双庙、上招束沟、大兴庄、东白城子、韩家杖子雨量站作为影响因素子序列xi(t).
将流量及其影响因素作灰色关联分析的过程:首先设置数据序列,见表2;再利用表2 和式(2)对数据序列进行无量纲化处理,获得初始值矩阵见表3;根据式(3),对初始值矩阵求绝对差值序列见表4,确定该矩阵中最大值和最小值(其中Δmin=0,Δmax=3.250 3),代入式(4),获得关联系数矩阵,结果见表5;最后,根据式(5),得到因素关联度值,见图8.
表2 流量及其影响因子Tab.2 flow and its influencing factors
表3 初始值Tab.3 initial value
表4 绝对差值Tab.4 absolute difference
表5 关联系数Tab.5 relevance coefficient
图8 洪水流量与影响因子的关联度值Fig.8 relevance degree value of flood discharge and influencing factors
通过对绕阳河流域流量影响因子的灰关联分析可知,关联度大小依次为双庙>上招束沟>大兴庄>韩家杖子>东白城子,其中,双庙、上招束沟对绕阳河流域流量的影响效果较大.流域流量与附近各个雨量站的关联度值都超过阈值0.75,因此6 个雨量站都作为多元线性回归模型自变量参数对绕阳河洪水流量进行预测.
利用多元线性回归模型预测阜新市东白城子站的洪水流量,选择6 个雨量站因素作为输入的模型参数,使用SPSS20.0 统计软件,选取全部进入法计算回归方程
式中,X1,X2,X3,X4,X5,X6分别为许家、双庙、上招束沟、大兴庄、东白城子、韩家杖子雨量站降雨量.由于该方程的回归系数R为0.998,R2为0.996,说明影响因子之间有较强的相关性,回归方程有意义,可以采用方程对东白城子站洪水流量进行预测.
通过建立的洪水流量影响因子的回归模型,根据东白城子站2003 年和1994 年的2 次洪水过程中的降雨量,推测两场洪水的洪峰流量,并将预测结果与实际值进行对比与验证,验证结果见表6.由表6 可以看出,洪峰实际值与预测值的误差在许可误差范围内,实验结果显示预测效果良好.
表6 洪水洪峰拟合度分析Tab.6 analysis of flood peak fitting degree
根据阜新水文局提供的各流域历年洪水实测数据,分析雨量站降雨量和洪水流量,得到结论:
(1)采用灰色关联模型计算各雨量站对流域流量波动的影响程度,选取关联度高的雨量站作为主导因素,通过SPSS 软件对主导因素和流量建立多元线性回归模型,对洪水的洪峰流量进行有效预测.
(2)对比实测值和预测值的大小,确定回归方程的实用性.验证结果表明:多元线性回归方程适用于辽西季节性河流的洪峰流量预测,该洪水预报模型可为辽西季节性河流的洪水预报提供一定的参考.