基于BP-DEMATEL算法的冰情预报因子敏感性分析

2022-10-13 01:00孙亚翡路锦枝周中元
水利学报 2022年9期
关键词:气温因子因素

孙亚翡,王 涛,路锦枝,2,周中元

(1.中国水利水电科学研究院 流域水循环与调控国家重点实验室,北京 100038;2.清华大学 水利水电工程系,北京 100084)

1 研究背景

在北半球60%的河流遭受河冰的影响[1],在中国北纬30°以北地区都有不同程度的冰情现象[2-3]。冰塞和冰坝严重时造成冰凌洪水灾害,带来诸多经济和社会问题[4]。典型的如我国黄河宁蒙河段,宁蒙河段为黄河倒“U”字河段最北端,特殊的河流流向导致其“封冻自下而上,解冻自上而下”的不利形势,易形成凌汛灾害。国内冰情观测、冰情模拟和冰情预报相关研究起步于20世纪五六十年代,其中早期的冰情预报多采用指标法、经验相关法等传统的统计学方法[5]。近年来,人工智能在冰情预报中的应用备受重视:Massie采用无递归的级联前馈神经网络预测冰坝发生情况[6],该网络无需设置网络层数和隐层神经元数目,但易陷入过拟合;王涛等进一步应用误差反向传播的BP(Back Propagation)神经网络[7]及模糊理论[8-9]较为成功的预测流凌、封河、开河时间[10-11]和冰坝[12]发生情况等,并在宁蒙河段防凌工作中得以应用;Sun[13]提出了叠加树模型框架(SETM),采用人工神经网络和自适应神经模糊推理系统模型预报开河时间和开河水位;Mahabir的研究聚焦于冰坝溃决后洪水水位预测[14]。此外,王军等[15]通过对冰盖所受热力-水力作用耦合分析,采用开河前冰盖临界挠度预报黄河河曲段开河日期和开河方式,路锦枝等[16]在其研究基础上优化模型并应用到黑龙江漠河江段。

近年来受气候变化、河道冲淤和水利工程调控等因素影响,黄河宁蒙河段冰情影响机制不断变化,使得预报难度增大[17]。预报因子的选择是影响预报精度和可靠性的关键一步。早期的指标法、经验相关法考虑因素不全,冰情并非仅受单一因素影响,而是由多种因素相互作用、综合影响所致。陈守煜选取封冻期累计正气温、水位均值、流量均值和最大冰厚为预报因子[18]。相比之下苑希民[19]、于庆峰[20]在开河日期预报因子选取时更加关注开河前短期时段气温和流量数据。王涛[7,10]选取预报因子时除本站冰情因素外另考虑了上下游水文站冰水情参数,并在文献[8]中采用相关性分析说明了气温、水位、流量三因子中,气温与水温的相关性最强,此外文献[16]中用计算和实测数据验证了气温对冰厚、冰温变化的影响。这从侧面说明了气温在冰情发展演变中的关键作用,为预报主要影响因子的选取提供参考。

现有河冰研究的相关文献中缺乏对冰情预报影响因子的研究,亟需明晰冰情过程中各因子之间的相关性和影响权重,从而提取关键影响因子提高预报精度。决策与实验室方法(Decision-making Trial and Evaluation Laboratory,简称DEMATEL)[21]通过系统中各要素之间的逻辑关系和直接影响矩阵,计算出每个要素对其它要素的影响度以及被影响度。传统DEMATEL模型在实际使用时有明显不足,易受研究者主观影响。Mao等结合灰色系统理论、粗糙集理论等用于研究不确定性的方法针对DEMATEL模型进行改进,应用于冰凌灾害的风险因素的评估中[22],但并未从根源上解决DEMATEL模型的主观性缺点。采用BP神经网络模型改进DEMATEL模型,可通过BP神经网络获得影响因素指标之间的关系权值,从根本上避免主观评价因素影响强度,再利用传统DEMATEL方法分析影响因素,使结果更加客观。目前该模型已在交通管理[23]、资源与环境管理[24]、建筑[25]、生态安全[26-27]等领域得到应用,但在水科学领域的应用甚少[28],且在水情和冰情方面还未有应用先例。

鉴于此,本文将研究区域定为黄河内蒙古河段,在黄河内蒙古河段典型站点气候水文资料基础上,尝试开展基于BP-DEMATEL算法的冰情影响因子敏感性分析,分析影响冰情变化的不同因子,识别出各因子影响权重并将其应用到内蒙古河段巴彦高勒、三湖河口两站的冰情预报中,因篇幅限制,数据选取和分析仅以内蒙古段巴彦高勒水文站观测断面为例进行详细说明。

2 冰情预报因子选取

黄河凌汛灾害是冬春季节大江大河中最突出的自然灾害,备受中央和水利部的重视,刘家峡、龙羊峡、万家寨和小浪底水库相继建成运用以后对黄河的防凌产生了积极影响,万家寨水库以下河段连续多年凌情稳定,如今凌汛灾害主要集中在黄河最北端的内蒙古河段[17]。通过对黄河内蒙河段历年冰情资料及冰情机理分析可知:冰情过程不仅受到以气温和流量为首的热力因素和动力因素的影响,还有河道形态和人类活动等因素影响。

热力因素包括气温、水温、太阳辐射等。其中气温为表征热力状况的基本要素,是影响河道流凌、封冻、解冻和开河的主要因素。气温包括日平均气温、累计正气温、累计负气温等多种表现形式。气温对河流的影响是双向的:一方面负气温累积可加快封河和延缓开河趋势;另一方面正气温累积作用于冰盖消融加速开河过程,气温对冰情的影响是多日累积作用的结果。故而建立多日累计气温值与冰情现象的相关关系,而累计气温的选取针对不同的研究目标也有所不同[16,18-19,29-30]。冰厚厚度同累积气温有强相关度,故最大冰厚也是开河过程中的影响因子[10,18-19]。另外,气温转负[7,10,19,31]、水温[32]降至冰点是流凌的关键,王涛[8]验证了中国传统二十四节气对冰情预报的重要参考意义,故针对不同站点流凌时间,采用小雪节气的水温与气温[7,32]作为巴彦高勒站流凌预报因子之一。流凌对封河亦产生影响,故在封河预报因子中考虑流凌日期[32]及流凌前后累计负气温和流量[16,19,30]。

动力因素包括流量、水位、流速等。流量、水位、流速呈一定的函数关系,流量的动力作用表现为流速的大小和水位的涨落。河流的动力因素影响到河道的冻结、融化和输冰的速度。故流凌、封河、开河前的流量、水位是影响相应冰情的重要动力因素[10,18-19,33]。除此之外,冰厚增长期内的流量和水位也影响着冰盖的增长,可引入中国农历节气“三九”“四九”来表示冰厚快速增长期[7,31]。内蒙古河段因受河道走势影响多年来开河为从上游向下游推进,开河期间上游释放大量槽蓄水,影响下游的开河形势,故在开河预报因子中也考虑上游流量的影响[10,31]。

河道形态因素包括河流曲率、河道流向、坡度、河道中支流分叉及断面特征等。河道特征通过影响水流特征和过流能力来影响冰情变化,凌汛险情一般发生在河道从低纬度流向高纬度河段、狭窄曲折,局部有江心岛相连,分岔和串沟较多,河槽宽窄变化及深浅变化相差悬殊等河段。人为影响因素主要指在河道上修建水库、分滞洪区、引水渠和控导工程等水工建筑物改变原河道的流量分配过程,实现人为调控水流。本次研究中站点河道形态和走势相对稳定,研究中不予考虑,人为因素复杂多变,主观性强,本研究中只通过调控的流量以量化体现。

通过以上分析,巴彦高勒流凌、封河、开河日期预报考虑如下因子:

表1 流凌日期预报因子

表2 封河日期预报因子

表3 开河日期预报因子

3 BP-DEMATEL模型构建

决策与实验室方法(Decision-making Trial and Evaluation Laboratory),简称DEMATEL模型,由美国Battelle实验室的学者提出,是一种运用图论和矩阵工具对影响因素进行系统分析的模型方法。本研究在传统DEMATEL模型的基础上引入BP神经网络(Back Propagation),提出新的人工智能和决策实验室方法相结合的BP-DEMATEL方法,弥补传统DEMATEL方法主观性强的劣势,增加研究的客观性和准确度。

3.1 传统DEMATEL模型DEMATEL建模的实质是把系统看作一个带权值的有向图,用矩阵形式来表示因素与因素之间的联系:矩阵对角线上元素的取值一般为0,意为要素对其本身的影响不参与比较判断。除对角线上数值意义可忽略外,矩阵其余元素值均表示因素间的相对强度。这样通过系统中各要素之间的逻辑关系可得到一个直接影响矩阵,计算出每个要素对其它要素的影响度以及被影响度,从而计算出每个要素的原因度与中心度,进而确定要素间的因果关系和每个要素在系统中的地位。

传统DEMATEL方法实施步骤:

(1)从研究目的出发,确定研究指标,量化各元素间的相互关系,得到直接影响关联矩阵。

(2)归一化直接影响关联矩阵。

(3)由归一化后的直接影响关联矩阵计算得到全关联矩阵(综合影响矩阵)。

(4)由全关联矩阵得到各个要素的中心度、原因度,绘制因果关系图表。

传统DEMATEL方法的关键在于建立关于因素间影响程度的直接关联矩阵,然而在现有文献的研究中,建立直接关联矩阵的方法大多都是调查问卷和专家打分评定,具有较强主观性,且操作实施过程繁琐冗长,这一缺点大大限制了DEMATEL模型的应用。

3.2 BP-DEMATEL模型基于传统DEMATEL方法的不足做出改进,尝试引入BP神经网络来得到直接关联矩阵。BP网络的训练过程就是通过学习求解权值矩阵使误差达到极小的过程,网络的初始权值为随机赋值,正向传播时,输入信号通过隐含层作用于输出节点,经过非线性变换,产生输出信号,若实际输出与期望输出不相符,则转入误差的反向传播过程。误差反传是将输出误差通过隐含层向输入层逐层反传,并将误差分摊给各层所有单元,以从各层获得的误差信号作为调整各单元权值的依据。经过反复学习训练,确定与最小误差相对应的权值,训练随即停止。在BP-DEMATEL方法中,BP网络和DEMATEL模型的连结点就是最优网络的权值矩阵W(输入层与隐层)和权值矩阵w(隐层与输出层)。对两个数值矩阵进行数据处理,进而用于衡量因子之间的相互影响以及因子对输出结果的影响强弱。此外,由于梯度下降法网络逼近速度慢,且容易陷入局部最小,本研究采用Levenberg-Marquart(L-M)算法改进传统BP网络,即用平方误差代替均方误差,使误差平方和最小。

基于此,提出的BP-DEMATEL方法计算步骤如下:

(1)将影响因子矩阵作为BP网络的输入向量,冰情结果作为目标输出向量,训练得到输入层与隐层的权值矩阵W和隐层与输出层的权值向量w。

(2)计算整体权值向量ω

ω=(ω1,ω2,…,ωl)

(1)

式中:ω为数值矩值W和w中元素分别取绝对值的乘积;l为输入影响因子个数。

(3)计算各冰情影响因子的直接关系矩阵

(2)

(4)归一化直接关系矩阵

(3)

(5)计算全关联矩阵

T=X(I-X)-1

(4)

式中I为l维单位矩阵。

BP-DEMATEL方法保留了传统DEMATEL方法的优点,且用BP神经网络来求解各指标之间的直接关联矩阵,从而代替DEMATEL模型中调查问卷或专家打分环节,将该模型应用于冰情预报因子参数辨识中,使求得的各因子权重和关联性更具客观性。

4 冰情影响因子的参数辨识

采用冰情预报参数辨识BP-DEMATEL模型,开展以流凌、封河和开河预报的各因子开展参数辨识,得到因子的影响权重,明确冰情演变不同阶段的关键要素,为冰情预报参数的选取提供依据。下面以巴彦高勒站冰情预报因子参数辨识为例进行详细说明,研究均采用多年调节水库龙羊峡水库运行后1986—2020年35年冰水情资料。

4.1 流凌影响因子权重分析流凌影响因子采用BP-DEMATEL模型训练得到权重关系见表4。从表4可以看出,热力因素为流凌先决条件,流凌起始日期取决于气温。决定巴彦高勒站流凌日期的首要因子是气温稳定转负日期,同时该站流凌情况受到上游水温的影响也不可忽视。此外发现二十四节气中小雪节气(11月22或23日)同巴彦高勒流凌日相近,故而当天水、气温数据可作为流凌日期预报的参考。

表4 流凌影响因子权重关系表

4.2 封河影响因子权重分析封河影响因子采用BP-DEMATEL模型训练得到权重关系见表5。影响因子F7、F8、F9属于动力因素,均为结果组;其余因子为热力因素,均属原因组,说明热力因素起到主导作用。巴彦高勒站封河的首要因素为封河前累计负气温,之后分别为:流凌后流量、气温稳定转负日期和流凌期累积负气温等,表明封河首要决定因素仍为热力因素,但动力因素流量影响在加强。

表5 封河影响因子权重关系表

4.3 开河影响因子权重分析开河影响因子采用BP-DEMATEL模型训练得到权重关系见表6。排在首位的影响因子为最大冰厚,冰厚一定程度反应了封河期气温情况,因此为结果组表征热力因素;之后的影响因子分别为:开河前上游流量、累积负气温、三九四九气温、开河前本站流量等,热力因素表现为原因组,动力因素为结果组。开河因子权重分析结果显示:天然河道开河过程是热力因素为主导下的热力因素和动力因素共同作用的结果。当动力因子作用强就显示为武开河,相反为文开河。

表6 开河影响因子权重关系表

5 基于BP-DEMATEL模型参数辨识的黄河内蒙古河段冰情预报

在基于BP-DEMATEL模型参数辨识基础上开展黄河内蒙古河段冰情过程预报,将综合权重值前60%的影响因子定义为预报的关键因子,分别以前60%关键因子、全部因子和后40%非重要因子为冰情预报因子,采用L-M算法改进BP神经网络模型进行冰情预报对比,以黄河最北端巴彦高勒和三湖河口两水文站流凌、封河和开河日期为例进行预报分析。采用1986—2017年32年数据为神经网络模型的学习集,预报2018—2020年流凌和封河日期。冰情预报中预见期过长影响预报精度,预见期过短会延误防凌决策,本研究中流凌、封河和开河预见期选取分别采用35年平均流凌、封河和开河日8天前的水文和气象资料,如果气象资料采用预报值,预见期可延长。因巴彦高勒站和三湖河口站2019年、2020年开河日期为1986年以来最早,超出了学习样本序列,故选取2016—2018年开河日为预报目标,其余年份数据作为学习集,预报结果见表7—8。

表7 巴彦高勒流凌、封河、开河预报结果

采用关键因子预报结果为:巴彦高勒站流凌日期预报预见期分别为6 d、22 d、6 d,预报误差分别为1 d、2 d、2 d;三湖河口站流凌日期预报预见期分别为20 d、5 d、9 d,预报误差分别为9 d、1 d、1 d,其中2018年预报误差较大,原因为2018年流凌日期为近35年最晚,预见期过长。巴彦高勒站封河日期预报预见期分别为6 d、16 d、12 d,预报误差分别为1 d、1 d、2 d;三湖河口站封河日期预报预见期分别为6 d、20 d、13 d,预报误差分别为2 d、1 d、2 d。巴彦高勒开河日期预报预见期分别为5 d、11 d、12 d,预报误差分别为2 d、0 d、1 d;三湖河口开河日期预报预见期分别为6 d、2 d、6 d,预报误差分别为-1 d、0 d、0 d。根据《水文情报预报规范》[34]可知,巴彦高勒站预报值和实测值的误差均小于允许误差,预报全部合格;三湖河口站仅2018年流凌日期预报不合格,综合合格率为94%,属甲等预报方案。

对比全部预报因子、综合权重值后40%的因子对流凌、封河、开河日期进行预报的结果表明:用BP-DEMATEL模型选取出的关键因子得到的预报结果优于其它两种预报因子的预报结果。

表8 三湖河口流凌、封河、开河预报结果

6 总结

冰情发展过程受到复杂的热力、动力、河道条件和人类活动等因素交互作用,各因子的影响权重及因子之间的耦合关系研究甚少,该问题制约了对冰情机理的探索和冰情预报精度的提升。鉴于此,本研究建立了BP-DEMATEL算法开展冰情预报因子参数辨识的新模型,在系列冰情资料分析基础上,提出了系列流凌、封河和开河的热力、动力等影响因子,通过BP-DEMATEL模型开展影响冰情发展因子的敏感性分析,应用到黄河内蒙古河段典型水文站冰情发展过程的分析中,得到了影响冰情演变各因子的权重,明晰了因子之间的因果关系。巴彦高勒水文站分析结果表明:河道流凌的决定性影响因子为热力因素;封河影响因子中热力因素为原因组,且影响度最大,动力因子为结果组;开河为热力因素主导下热力与动力共同驱动的结果。并采用不同权重的因子开展流凌、封河和开河的预报,结果表明:采用影响权重大、相关性强的关键因子作为预报参数,预报值与实测值吻合更好。采用关键因子预报结果为:巴彦高勒站预报合格率100%,三湖河口站预报合格率为94%。

随着对黄河冰情规律进一步探索和各站点水文监测数据的积累完善,模型识别出的各因子权重关系将进一步得到验证和修正,冰情演变过程的影响因素将进一步明晰。BP-DEMATEL已应用到黄河内蒙河段冰情因子分析中,其应用经验表明该模型也可推广到其它北方河渠中,为探明冰情影响机理和提高预报精度提供帮助和参考。

猜你喜欢
气温因子因素
腹部胀气的饮食因素
基于FY-3D和FY-4A的气温时空融合
山药被称“长寿因子”
直径不超过2的无爪图的2—因子
巧解难题二则
英语教学中的文化因素
与气温成反比的东西
扮靓爱车拒绝潜伏危险因子
《流星花园》的流行性因素
实时气温