王增学,周志华,邹晓天,杨笑冰
(1.吉林省水文水资源局吉林分局,吉林 吉林 132013;2.吉林省蛟河市水资源管理办公室,吉林 蛟河 132500)
中长期水文预报是指根据前期水文气象要素,用成因分析与数理统计的方法,对未来较长时间的水文要素进行科学的预测。中长期水文预报的预报对象主要是径流、江河湖海的水位、旱涝趋势、冰清及泥沙等。随着我国现代化建设的不断发展,国民经济各部门对水文预报提出的要求越来越高,不仅要求有较高精度的短期预报,而且要求预见期更长的中长期预报[1~3]。
经过前人的不断努力和探索,目前中长期水文预报方法已日趋成熟。中长期水文预报方法大体可分为传统方法和新方法两大类[4]。前者是大多数生产部门采用的方法,主要包括逐步回归、多元回归、线性回归、自回归等,后者主要包括模糊分析、人工神经网络、灰色系统分析、投影寻踪技术等。
在水文中长期预报中,由于影响因素的复杂性,需要考虑多个预报因子对预报对象的影响,并建立预报对象与预报因子间的线性方程,这就是多元线性回归。多元线性回归是假定在各预报因子和预报量之间呈线性关系的情况下,使预报值和实测值之间误差达到最小,并认为未来是按这种关系发展,从而进行预报。它是中长期预报的一个重要手段。
模型的基本方程式:
这里 b0,b1,…,bp,σ2都是与 x0,x1,…,xp无关的未知数,称为回归系数,ε是随机误差(或随机干扰),这就是P元线性回归模型。
人工神经网络(Artificial Neural Networks,缩写ANN)是对人脑若干基本特性通过数学方法进行的抽象和模拟,是一种模仿人脑结构及其功能的非线性信息处理系统。人工神经网络按拓扑结构分为前馈网络、反馈网络和混合网络。BP网络是由Rumelhart和Mccullane针对含有隐层的、具有非线性连续函数的多层前馈网络权值调整问题而提出的误差反向传播算法(Back-Progagation Network,简称BP网络)。它是人工神经网络中最为重要的网络之一,也是迄今为止应用最为广泛的网络算法。
BP人工神经网络在实际应用中,就是通过对不同神经元的训练和对比,本着尽可能地减小系统规模、缩短系统学习时间以及降低系统复杂性的原则,确定的一个具有恰当规模的网络模型[5]。BP神经网络本质上是一种误差函数的梯度下降算法,它的学习原则是通过方向传播来调整网络的权值和阈值使误差平方和最小。实践证明,这种模型具有很强的映射能力,有关水文专家研究发现,三层结构的BP网络就能满足水文预报的一般要求。三层BP网络拓扑结构如图1所示。
图1 BP神经网络的拓扑结构
BP人工神经网络的特点是具有大规模并行处理信息的能力,分布式的信息存贮,自组织、自学习和自适应能力,泛化能力,非线性映射能力,联想功能和容错性等,而且善于联想、概括、类比和推理,能从大量的分析资料中分析提炼实用的统计规律。根据建立指标体系和从环境检测中心获得的系列资料,对系列资料进行学习,来识别水资源承载能力的因子与其他变量之间的复杂关系,从而实现水资源承载能力的预测。
投影寻踪 (Projection Pursuit,PP)是国际统计届于20世纪70年代中期发展起来的一种新的、有价值的高新技术,是统计学、应用数学和计算机技术的交叉学科,是用来分析和处理高维观测数据,尤其是非线性、非正态高维数据的统计方法,属当今前沿领域[6~8]。它的原理是把高维数据按照一定的方向投影到低维子空间上,以投影指标函数来分析原始数据结构特征,并寻找使投影指标函数达到最优的投影值,以达到分析研究高维数据的目的。它具有稳健性、抗干扰性和准确度高等优点,因而在诸多领域得到了广泛的应用。在水文水资源的应用中,灾情评估、水资源评价、水质评价、水资源规划、水文预报等方面的研究都取得了可喜的成果。
投影寻踪预测技术建模的基本步骤:1)对数据进行归一化处理(即原数据减去样本均值再除以样本标准差);2)选择一个初始投影方向;3)将预报因子在选择方向上投影;4)进行R阶Hermite岭函数拟合;5)用最小二乘法求R阶Hermite多项式权重系数;6)计算出预报对象的拟合值;7)重复步骤2)~6),共随机生成种群为NN的投影方向;8)采用遗传算法选择最佳投影方向,并检验模型精度是否达到要求;9)利用最佳投影方向进行预报拟合。
该文以长江宜昌站1956—1990年的流量资料作为研究对象。以12月平均流量为预报对象,8—11月4个月的平均流量为预报因子,利用1956—1984年共29年资料作为样本建立模型,预留1985—1990年6年资料进行预报检验。采用多元逐步回归、人工神经网络预测技术和投影寻踪预测技术分别建立水文预报模型。拟合结果相对误差对比见表1。
表1 3种预报模型拟合结果相对误差对比
3种中长期水文预报模型拟合结果和实测流量对比见图2。
经统计,多元线性回归预测模型的拟合结果在5%以内的占46.7%,在10%以内的占70%,最大相对误差为19.15%,平均相对误差为6.88%;神经网络预测模型的拟合结果均在1%以内,最大相对误差为0.16%,平均相对误差为0.12%;投影寻踪预测模型的拟合结果在5%以内的占40%,在10%以内的占70%,最大相对误差为18.53%,平均相对误差为7.71%。从拟合结果可以看出:3种中长期水文预报模型都是可行的,且相对误差小,精度均比较高,其中神经网络预测模型的模拟结果最好。
图2 3种预报模型拟合结果和实测流量值对比图
利用各预测模型,分别对1985—1990年12月流量进行预报,各模型预报结果相对误差见表2。
表2 各预报模型预测结果相对误差对比
由预报模型的预测结果可以看出,3个预报模型预测的精度均在20%以内,其中多元回归预测模型和神经网络预测模型的预报结果均在10%以内,预报效果很好、精度较高。
水文过程是个很复杂的动态过程,水文序列既有确定性成分,也有随机成分,对应地,各预测模型也均有其各自的优缺点和不确定性,使得这些方法难以对整个水文过程进行有效地拟合和预测,因此,可以考虑将各种预测方法进行组合,建立水文中长期耦合预,来提高水文过程的预测精度。
[1]范钟秀.中长期水文预报[M].南京:河海大学出版社,1999.
[2]王钦钊,向奇志.中长期水文预报方法的探讨[J].江西水利科技,2006(02).
[3]杨旭,栾继虹,冯国章.中长期水文预报研究评述与展望[J].西北农业大学学报,2000(06).
[4]汤成友,官学文,张世明.现代中长期水文预报方法及其应用[M].北京:中国水利水电出版社,2008.
[5]许莉,赵嵩正,杨海光.水资源承载力的BP神经网络评价模型研究[J].计算机工程与应用,2008,44(8).
[6]于国荣,叶辉,夏自强,赵小勇.投影寻踪自回归模型在长江径流量预测中的应用[J].河海大学学报(自然科学版),2009(03).
[7]高玲,王淑英,林雪飞.投影寻踪回归模型在水文预报中的应用[J].黑龙江水专学报,2000(02).
[8]张欣莉,丁晶.参数投影寻踪回归及其在年径流预测中的应用[J].四川大学学报(工程科学版),2000(03).