莫崇勋,王大洋,朱新荣,阮俞理,莫桂燕,林怡彤
(1.广西大学土木建筑工程学院,广西南宁530004;2.广西大学工程防灾与结构安全教育部重点实验室,广西南宁530004;3.广西大学广西防灾减灾与工程安全重点实验室,广西南宁530004)
Fisher最优分割法在澄碧河水库汛期分期中的应用
莫崇勋1,2,3,王大洋1,2,3,朱新荣1,2,3,阮俞理1,2,3,莫桂燕1,2,3,林怡彤1,2,3
(1.广西大学土木建筑工程学院,广西南宁530004;2.广西大学工程防灾与结构安全教育部重点实验室,广西南宁530004;3.广西大学广西防灾减灾与工程安全重点实验室,广西南宁530004)
在深入分析澄碧河流域汛期变化特性的基础上,以澄碧河水库为例,选取暴雨日数、旬平均雨量、旬最大3天雨量、旬多年平均入库流量、年最大洪峰出现次数等5个指标,采用Fisher最优分割法进行汛期分期研究,将汛期分为前汛期、主汛期和后汛期3个时期。结果表明,Fisher最优分割法不仅能够考虑多个指标,而且能够有效避免常规方法在阈值选取和最优分期数目确定上存在主观性强的缺点;与之前对澄碧河水库分期的相关结果对比,该方法则更为客观科学,分期结果也更加合理可靠。
Fisher最优分割法;汛期分期;澄碧河水库
洪水资源作为水资源的重要组成部分,如何充分的利用,进而实现洪水资源化成为近些年研究的热点问题[1-3]。相比传统的“非此即彼”的汛期分期方法,科学合理地进行汛期分期研究具有十分重要的意义。目前,汛期分期主要研究方法有定性分析法、统计分析法和聚类分析法3大类。其中聚类分析以其较强的物理数学背景,充分的理论基础表现出明显优势。聚类分析法种类较多,如模糊集合分析法[4]、分形法[5]、变点分析法[6]、系统聚类法[7]、灰色定权聚类法[8]、投影寻踪法[9]等;但这些方法多少都存在着一些缺陷。模糊集合法和分形法只考虑单因子指标;变点分析法和系统聚类法虽可考虑多指标,但在变点个数和指标阈值确定方面存在较强的主观性;投影寻踪法在构造指标函数时存在一定差异,且这种差异会对分期计算结果产生较大影响。鉴于此,Fisher最优分割法在不改变汛期时序性的基础上,既能综合考虑汛期的多因子指标,且能科学地展现出分期数目变化对计算结果变化的影响趋势,从而确定最优的分期数目,表现出较强的优势。目前Fisher最优分割法已经广泛应用于农业、气象和地质灾害预报等领域[10-11]。因此,本文在相关研究的基础上,采用Fisher最优分割法对澄碧河水库进行汛期分期研究,并以此与相关的研究结果进行对比,以期达到合理分期的目的;同时也为了更好地利用洪水资源,实现洪水资源化,从而有效缓解水资源短缺问题提供决策参考。
1.1 基本原理
1.2 具体分割步骤
(1)归一化数据。由于不同类型的数据存在数量级上的差异,因此会对结果产生不同程度的影响。为避免此影响,需将待分割的样本数据进行如下归一化处理
(1)
(2)定义分段直径。分段直径是反映分段内部差异程度的指标,差异越大,则直径越大;反之亦然。设样本分段后的某一分段为{xs,xs+1,…,xt},(t>s),则有
(2)
(3)
(3)定义损失函数。设样本P(n,k)被分成k段,其中一种分段方式为G1={i1,i1+1,…,i2-1},G2={i2,i1+1,…,i3-1},…,Gk={ik,ik+1,…,n};1=i1 (4) 故若已知n和k的值,则最优分割为 (5) 与之相对应的分割点即为最优分割点。 (4)递推公式。根据文献[11],有序样本的最优分割总是建立在截断末尾子段的最优k-1分割的基础上的,且存在以下两个核心公式 (6) (7) (5)求解最优分割。由递推公式可知,若样本容量n和分割数k确定,则需求出使得损失函数L[b(n,k)]达到最小的分割点ik,即可确定ik的位置 L*[b(n,k)]=L*[b(ik-1,k-1)]+D(ik,n) (8) 之后可得第k段分割为Gk={ik,ik+1,…,n},接着求得分割点ik-1,使得L[b(ik-1,k-1)]达到最小。即 L*[b(ik-1,k-1)]=L*[b(ik-1-1, (9) 从而得到第k-1段Gk-1={ik-1,ik-1+1,…,ik-1}。同理,可以相应求出每一段的最优分割结果。 (6)确定最优分割数目。根据分割结果绘制出损失函数随对应分割数目k变化而变化的趋势曲线图L*[b(n,k)]~k,曲线的拐弯处对应的分割数即为最优的分割数。于是可绘制出上述曲线的斜率差值图δ(k)~k,其表达式为 (10) 表1 汛期分期划分指标及归一化数据 2.1 工程概况及指标选取 澄碧河水库位于广西百色市的右江支流澄碧河下游,总库容11.21亿m3,为大(1)型水利枢纽工程。澄碧河总长127 km,水库流域多年平均降水量1 560 mm,降雨年内分布较为不均,4月~9月降水量占全年降雨量的85%以上,而10月~次年3月降水量明显减少。澄碧河洪水主要源于降水,故本文选取的资料为1963年~2011年的逐日降水和实测入库径流资料,并选取反映汛期变化特征的暴雨日数、旬平均雨量、旬最大3天雨量、旬多年平均入库流量、年最大洪峰出现次数等5个指标作为分期的依据,具体见表1。 2.2 汛期分期计算步骤 步骤1: 归一化数据。根据1.2中(1)的方法对上述5个指标进行归一化处理,归一化后的数据见表1。 步骤2: 计算分段直径。根据式(2)(3),计算每一分段的直径D(i,j),其中i=1,2,…20;j=i+1,…,21。 步骤3:计算损失函数。根据损失函数的性质和两个核心公式可以计算出每一种分割情况下的损失函数值L*[b(n,k)]。计算先由L*[b(n,2)]开始,L*[b(n,2)]表示在容量为n的样本被分割为2段(k值)时的最小损失函数值。 步骤4:计算最优分割数。按照表2寻找最优k分割,并由式(10)确定δ(k)的值(见表2)。 2.3 最优分割数的确定 根据表2中的数据分别绘制L*[b(n,k)]~k曲线图和斜率差值图δ(k)~k(见图1)。 由图1可知,L*[b(n,k)]~k曲线图在k=3时处于明显的拐弯处,且斜率差值曲线在k=3时达到最大值。因此,样本最优分割数为3,对应分段结果为{1-5}{6-15}{16-21}。结果表明,澄碧河汛期分为3期时最合理。即前汛期4月上旬~5月中旬,主汛期5月下旬~8月下旬以及后汛期9月上旬~10月下旬。 表2 最优分割结果 图1 L*[b(n,k)]~k和 δ(k)~k曲线 2.4 对比分析 结合文献[12]相关研究成果,将不同研究方法确定的澄碧河汛期分期结果进行对比分析,具体(见表3)。由表3可知,Fisher最优分割法计算结果与数理统计法、模糊集合法、灰色定权聚类法计算结果基本一致。但数理统计法和模糊集合法只能考虑单因子指标影响,且前者在指标阈值确定,后者在隶属度阈值确定上都存在较强的主观性。灰色定权聚类法虽然能考虑多个因子指标,但在阈值确定上同样存在主观性,且聚类结果是否为最优解有待进一步商榷。Fisher最优分割法则是在考虑多因子指标的基础上,从数据本身出发,以其较强的数学背景优势,有效避免了主观确定相关阈值的问题,且能合理地确定最优的分割数目,故分段结果更为合理可靠。 表3 不同研究方法结果对比 (1)本文采用Fisher最优分割法对澄碧河水库进行汛期分期研究,同时将汛期分期结果与以往研究结果进行对比分析。结果表明,Fisher最优分割法分期结果与以往研究结果基本一致,且其能有效避免在相关阈值选取和最优分期数目确定上的主观性,弥补了常规方法的不足。Fisher最优分割法结果也更加科学,为汛期分期研究提供了一种客观、合理、可靠的研究方法。 (2)Fisher最优分割法因其数学背景较强,故在计算步骤上难免会存在复杂繁琐的缺点。计算机恰好具有有效解决复杂繁琐问题的优势,因此很好地改善了这一缺点;从而使Fisher最优分割法变得高效、快捷、可操作性强。 (3)本文在选取反映汛期变化特征的指标时是按照各个指标权重相等考虑的;而各个指标对汛期变化的影响程度可能不同。建议在进一步的研究中,可以先通过权重分析对不同指标赋予相应权重,之后再进行最优分割计算研究。 [1]李致家, 董增川, 梁忠民, 等. 大流域洪水预报与洪水调度管理方法研究[J]. 水力发电, 2004, 30(1): 12- 15. [2]刘攀, 郭生练, 王才君, 等. 水库汛限水位实时动态控制模型研究[J]. 水力发电, 2005, 31(1): 8- 11. [3]周惠成, 张改红, 王本德. 基于防洪预报调度调整水库汛限水位的研究[J]. 水力发电, 2006, 32(5): 14- 17. [4]莫崇勋, 刘方贵, 孙桂凯. 水库汛期模糊划分及其分期汛限水位的确定[J]. 水力发电, 2009, 35(8): 13- 14, 21. [5]魏炜, 莫崇勋, 刘俐, 等. 流域降雨量分形方法在水库汛期分期中的应用[J]. 人民黄河, 2014(10): 39- 41. [6]刘攀, 郭生练, 王才君, 等. 三峡水库汛期分期的变点分析方法研究[J]. 水文, 2005(01): 18- 23. [7]高波, 刘克琳,王银堂,等. 系统聚类法在水库汛期分期中的应用[J]. 水利水电技术, 2005(06): 1- 5. [8]蒋海艳, 莫崇勋, 魏炜, 等. 灰色定权聚类法在水库汛期分期中的应用[J]. 水力发电, 2012, 38(12): 8- 10 . [9]陈曜, 王顺久. 基于投影寻踪的汛期分期探讨[J]. 水文, 2009(3): 16- 18. [10]和宏伟, 张爱玲. Fisher最优分割法在云南地震分期中的应用[J]. 地震研究, 1994, 17(3): 231- 239. [11]王艳. 最优分割算法的计算机程序实现与武汉市洪涝灾害预测[D]. 武汉: 华中师范大学, 2007. [12]莫崇勋. 水库土石坝工程技术洪水分期调度关键技术及应用研究[M]. 北京: 科学出版社, 2014. (责任编辑陈 萍) ApplicationofFisherOptimalPartitiononFloodSeasonStaginginChengbiheReservoir MO Chongxun1,2,3, WANG Dayang1,2,3, ZHU Xinrong1,2,3, RUAN Yuli1,2,3, MO Guiyan1,2,3, LIN Yitong1,2,3 Taking Chengbihe Reservoir as a study example, five indicators of rainstorm days, ten-day mean rainfall, biggest three days rainfall in a period of ten days, ten-day average inflow for years and times of flood peak every year are introduced to calculate flood season of Chengbihe Reservoir by adopting Fisher optimal partition method based on the analysis of flood season characteristics of Chengbihe Basin. The flood season is divided three periods of pre-flood season, main-flood season and post-flood season. The results show that the Fisher optimal partition method can not only consider multiple indicators, but also can effectively avoid the subjectivity in the selection of threshold and optimal number of dividing. Comparing with the results of other study methods, the Fisher optimal partition method is more objective and scientific and the results are more reasonable and believable. Fisher optimal partition method; flood season staging; Chengbihe Reservoir 2016- 12- 08 国家自然科学基金资助项目(51569003);广西自然科学基金资助项目(2015GXNSFAA139248);广西防灾减灾与工程安全重点实验室系统性研究项目(2014ZDX01);广西水利厅科技项目(201507);广西高等学校优秀中青年骨干教师培养工程项目(桂教人[2014]39号);广西研究生教育创新计划资助项目(YCSW2017052) 莫崇勋(1974—),男(壮族),广西忻城人,教授,博士生导师,主要从事水文水资源研究(通讯作者). TV697.13 :A :0559- 9342(2017)06- 0019- 04
k-2)]+D(ik-1,ik-1)2 基于Fisher最优分割法的澄碧河水库汛期分期
3 结 语
(1. College of Civil Architectural Engineering, Guangxi University, Nanning 530004, Guangxi, China;2. Key Laboratory of Disaster Prevention and Structural Safety of Ministry of Education, Nanning 530004, Guangxi, China; 3. Guangxi Key Laboratory of Disaster Prevention and Engineering Safety, Nanning 530004, Guangxi, China)