马盼盼,白 涛,武连洲,黄 强
(西安理工大学 西北旱区生态水利工程国家重点实验室培育基地,陕西 西安710048)
随着气候变化和人类活动等影响的深入,水文过程变化愈加复杂[1-2]。径流预测对分析流域洪水和干旱致灾过程,以及水资源合理开发与水库的安全、经济运行等具有重要的指导意义。国内外径流预测方法众多,大致可分为传统方法和现代方法两类。传统方法如成因分析法[3]和水文统计法[4]等,主要是根据径流变化特性来开展研究;现代方法则是随着计算机技术的发展而新拓展的[5],目前应用广泛的现代方法有人工神经网络、模糊推理、支持向量机、小波变换等[6-13],这些方法在径流预测中虽效果较好,但存在一些问题,如人工神经网络不能较好地处理和描述径流随机变化的模糊信息;模糊推理不能自动地将历史长系列资料中总结的经验转化为推理规则库,缺乏有效的方法来改进隶属函数以提高预测精度[14]。
自适应神经模糊推理系统(adaptive network-based fuzzy inference system,ANFIS)是在神经网络的基础上,增加模糊推理系统的模糊规则,将水文要素的不确定性通过模糊推理进行诠释,再通过神经网络进行模拟、预测。ANFIS在预测方面的发展正逐步推进,并显示了很强的优越性。有关ANFIS在水文领域的应用,国外开始较早且发展较快,ANFIS在径流预测[15-16]、蒸发估计[17]、河段洪峰量[18]估算等方面均取得较好的成果,且ANFIS与其他算法或模型结合应用也具有巨大的发展空间[19-20]。国内ANFIS的应用相对缓慢,近年来ANFIS开始用于水质、水位、洪水及径流量预测[21-26];林剑艺等[27]、马细霞等[28-30]、路剑飞等[31]分别从ANFIS参数分析、优越性比较及ANFIS与其他算法或模型结合等方面进行了研究,但ANFIS在河川径流预测方面的应用,仍待进一步拓展。
本研究选取黄河源区出口水文站军功站为研究对象,建立ANFIS径流预测模型,旨在深入、系统地分析ANFIS模型结构及输入输出参数对预测结果的影响,为揭示黄河上游河川径流规律、水库群优化调度和水资源优化配置提供参考依据。
ANFIS由Jang[32]于1993年首次提出,是人工神经网络与模糊推理系统的结合,其通过神经网络自身的训练和学习,在初始建立模糊规则的基础上多次重复,自动调整变量、隶属函数和图形参数,使之适应FIS对应的输入、输出关系,完成网络系统参数的最佳设置。本研究采用Sugeno型模糊推理方法进行模糊推理,使用IF-THEN规则描述模糊信息,输出模糊值后,将其转化为精确量。
若一阶Sugeno模糊模型的ANFIS结构有2个输入,设其各输入变量具有2条模糊规则,则对一阶Sugeno模糊系统,模糊规则表示如下:
rule 1:若x=A1,y=B1,则f1=p1x+q1y+r1;
rule 2:若x=A2,y=B2,则f2=p2x+q2y+r2。
式中:x、y分别为2个输入变量;Ai、Bi(i=1,2)为x、y的模糊集合,与输入层相对应的隶属度函数有关;pi、qi、ri(i=1,2)为一阶Sugeno模糊模型的结论参数,在结论推出层产生;fi(i=1,2)为结论参数的线性组合形式,用来表示模糊规则。
采用神经网络+Sugeno型模糊推理的算法建立径流预测ANFIS模型。通常,ANFIS模型结构包括5层,即输入层、规则层、归一化层、结论推出层和输出层,其结构层次如图1所示。
第一层:输入层,将采集的实际样本作为输入,经模糊化处理后,输出对应模糊集的隶属度。有:
(1)
(2)
(3)
(4)
式中:aAi、bAi、cAi(其中i=1,2)和aBi、bBj、cBj(其中j=1,2)均为前提参数。
第二层:规则层。开展模糊规则运算,计算每条规则的适用度。计算公式为:
(5)
第三层:归一化层。对第二层的输出结果进行归一化处理。如第i条规则的归一化适用度为:
(6)
第四层:结论推出层。计算各自适应节点输出值。计算公式为:
(7)
第五层:去模糊化计算层。计算模糊系统的总输出,即所有规则的输出之和,用O2表示为:
(8)
ANFIS模型的计算流程见图2。
图1 ANFIS模型的结构层次Fig.1 Structure of ANFIS model
图2 ANFIS模型的计算流程Fig.2 Flow chart of ANFIS model
杜富慧等[33]在基于ANFIS的黄河灵口流域水文预报模型研究中,选定模型输入变量为平均降雨强度、雨强距离指数和植被指数;Badrzadeh等[34]在应用ANFIS进行洪水预测时,以降雨径流资料为输入,预测效果较好。本研究区域地面径流主要来源于降雨,因此以日尺度径流资料为模型输入,日径流量为输出变量,进行黄河上游径流预测研究。
ANFIS模型求解过程即为模型参数的率定过程。ANFIS参数包括确定参数和待定参数, Jang[32]首次提出用混合学习算法全局搜寻系统最优参数,对确定参数通过梯度下降法返回误差值,继而依据误差大小改变隶属度函数图形参数,更新参数值,依次反复最终确定前提参数,最后由最小二乘法求解确定结论参数[35];对待定参数的率定,首先由用户基于经验设定初值,后改变参数值,比较不同参数值对应的模型预测精度,依据预测精度要求修正参数值,直到模型参数达到最优,确定预见期为1 d的径流预测模型的各待定参数,然后再延长模型预见期,计算预测结果的误差,分析不同预见期下模型运行的合理性,并通过误差分析与合理性分析确定径流预测的最长预见期。
ANFIS模型的径流预测过程如图3所示。
图3 基于ANFIS模型的径流预测流程Fig.3 Runoff forecasting flowchart base on ANFIS model
选取前3时段的径流资料,即以t-3、t-2、t-1时段实测径流为ANFIS模型的输入变量;初步选定训练次数为50次;输入变量的隶属函数选择三角形隶属函数、钟形隶属函数和高斯隶属函数,其数目分别初步选定为2,3,4条。基于各个待定参数的不同选择,初步拟定9个预测方案,其参数设定见表1。
表1 基于各个待定参数的预测方案集Table 1 Solution sets of runoff prediction based on parameters to be determined
军功水文站位于黄河上游青海省玛沁县,1977年8月建站,是黄河源区国家一级水文站,距离河口4 057 km,是龙羊峡等水库入库径流控制站,集水面积达98 414 km2。该站以上区域径流量占黄河总径流量的13.5%,是黄河流域径流的重要组成部分,对龙羊峡以上水库群调度和水资源配置具有重要的作用。军功水文站实测数据系列长,资料可靠。本研究以军功水文站为研究对象,采用黄河水利委员会相关部门提供的2010-2015年共计2 191个时段的日尺度实测数据,经三性审查可作为基本资料进行ANFIS模型的预报研究。
选定各阶段样本资料,并确定训练集、验证集、测试集的数据比例为4∶1∶1,以选定的各阶段样本实测资料为依据求解ANFIS模型,获得各方案计算结果。鉴于篇幅所限,本研究仅列出各方案测试阶段的计算结果。绘制各方案测试阶段预测径流值与实测径流值的对比结果如图4所示,并选定均方根误差RMSE、相关性系数R2个指标,对比分析各方案预测结果的差异性,并采用RMSE和R及平均绝对误差(MAE)、拟合度系数(CE)等4个指标分析最终预测结果的精度。各指标的计算公式如下:
(1)均方根误差(RMSE)。
(9)
(2)相关系数(R)。
(10)
(3)平均绝对误差(MAE)。
(11)
(4)拟合度系数(CE)。
(12)
9种预测方案预测结果的RMSE与R见图4。图4表明,基于ANFIS模型得到的各径流预测方案的预测值与实测值之间无明显差异;进一步比较各方案的RMSE和R2个指标值,选定其最优值为:RMSE=6.31,R=0.999 8。综合预测值与实测值拟合图以及2个指标值,选定最优方案为方案6,即训练次数为50次、每个输入变量有4条钟形隶属函数、预测未来1 d的方案为径流预测的最佳方案。
敏感性分析是通过逐一改变相关变量数值的方法来解释关键指标受某些因素变动影响的规律。本研究的敏感性分析,是通过改变相关参数来揭示ANFIS径流预测模型受各系统参数变动影响的大小。在上述选定的最优方案的基础上,分析ANFIS模型参数变化对预测精度的影响。
3.2.1 输入变量 目前,ANFIS模型输入变量的选择尚无具体标准。总结以往经验,本研究在已选定的最优方案基础上,分别以滞时τ=3,2,1 d,即t-3、t-2、t-1时段,t-2、t-1时段及t-1时段的径流量为径流预测模型的输入,以预见期为1 d的径流量为模型输出。实测径流与模型预测径流值的拟合结果见图5。
图4 黄河上游军功水文站预测径流与实测径流的对比Fig.4 Comparison of predicted and measured runoffs in Jungong station
图5 不同输入变量时预测1 d径流量与实测径流量的对比Fig.5 Comparison of 1-day predicted runoff and measured runoff with different input variables
基于模型预测时效性的考虑,分析图5不同输入变量时模型预测值与实测值的拟合结果及RMSE、R2个指标值,选定最优输入为:滞时为2 d,即t-2、t-1时段的径流量,其RMSE=3.14,R=0.999 95。
3.2.2 训练次数 采用滞时为2 d的径流资料为模型输入,每个输入变量选用4条钟形隶属函数,以预见期为1 d的径流量为输出,分析训练阶段训练次数与ANFIS训练结果的均方误差的关系,结果见图6。图6显示,随训练次数增加,均方根误差逐渐减小,约训练50次后均方根误差的变化开始趋于平稳,且在训练约100次时,均方根误差达最小;随着训练次数的增大,模型计算效率降低。
3.2.3 隶属度函数 隶属度函数的分析包括隶属度函数的数目和隶属度函数的类型。假定隶属度函数为钟形隶属度函数,训练次数为100次,隶属度函数数目分别取2~7条,分别确定模型预测精度,并确定最优隶属度函数数目。然后选定最优隶属函数数目,以此为基础,选用常用隶属函数类型,即钟形隶属函数、三角形隶属函数、高斯隶属函数和双边高斯型隶属函数进行比较分析,确定最优隶属函数类型。图7显示了不同隶属函数数目对应预测值的均方根误差及其径流预测值。
图6 训练次数与均方根误差的关系Fig.6 Relationship between training time and mean square error
由图7可知,随隶属度函数数目增多,径流预测值的RMSE逐渐减小,在输入变量的隶属函数数目为4后,RMSE基本趋于稳定;随着训练次数增大,预测值RMSE稍有减小,但模型的计算速率显著降低。由此选定的最优隶属函数中,每个输入变量有4个钟形、三角形、高斯及双边高斯隶属函数。
训练前后隶属函数图像的变化体现了模型训练前后原有径流信息的改变。在图8中,x1、x2分别表示2个输入变量,即t-2、t-1的径流量,训练前后各输入变量隶属度函数的变化显而易见。
图8 训练前后各隶属函数图像的变化Fig.8 Changes of membership function images before and after training
图8表明,区别于其他类型的隶属度函数,三角形隶属度函数图像在训练前后差异很小,保留的原有数据信息更符合实际情况,因此选定三角形隶属函数为最优隶属函数类型。
综合上述参数敏感性分析结果,本研究选定的基于最优参数的ANFIS径流预测模型为:以滞时为2 d的径流量为输入变量,训练100次,每个输入变量取4条三角形隶属度函数,输出变量为预见期为1 d的径流量。
基于确定的最佳方案,通过ANFIS模型的参数敏感性分析确定基于最优参数的径流短期预测ANFIS模型。其中,预见期为1 d时,模型预测精度见表2。
表2 基于ANFIS模型预见期为1 d时的短期径流预测结果Table 2 Prediction short-term runoff in 1-day forecast period base on ANFIS model
由表2可知,预见期(ε)为1 d时,本研究建立的径流短期预测ANFIS模型的预测合格率达100%,预测精度较高。基于此,延长预见期至ε=2,3,4和5 d,进一步确定ANFIS的合理预测范围,结果见表3。
表3 延长预见期后ANFIS模型短期径流的预测结果Table 3 Prediction of shirt-tem runoff in different foreseeable periods base on ANFIS model
表3表明,在合理的预见期内,ANFIS径流预测模型的预测效果好且精确度高;随着预见期延长,实测径流与预测径流拟合度趋低,预测误差显著增大。当预见期延长至5 d时,根据《水文情报预报规范(GB/T 22482-2008)》的规定,预测径流与实测径流的相对误差已超过20%的精度要求。因此,预见期不要超过4 d,否则预测精度不能满足规定要求。
1)以黄河源区的军功水文站为研究对象,建立了短期径流预测ANFIS模型,基于模型参数设定了9个预测方案;采用实测径流与预测径流对比及评价指标(RMSE、R)进行分析比较,最终选择训练次数为50次、每个输入变量有4条钟形隶属函数、预测未来1 d的方案6为径流预测的最佳方案。
2)对ANFIS径流预测模型的输入、训练次数、隶属度函数个数和类型等参数进行敏感性分析,获得了最优参数组合的ANFIS径流预测模型,其预测结果全部合格且精度较高;延长短期径流预测的预见期至4 d,预测结果仍能满足精度要求,说明ANFIS模型具有较好的适用性,可为黄河源区径流规律演变、水库群规划施工调度和全流域水资源配置提供重要参考。
3)河川径流影响因素众多,下一步将继续开展ANFIS模型结构以及人类活动、降雨、气温等因素对黄河源区径流演变的影响研究。