线性回归模型和灰色预测系统GM(1,1)模型在旱灾预测中的比较应用

2018-04-20 02:53殷鹏远
地下水 2018年1期
关键词:旱灾回归系数年份

殷鹏远

(辽宁省锦州水文局,辽宁 锦州 121000)

根据系统已有的数据,按一定的方法建立模型,对系统的未来变化情况做出预测,是预测研究的主要工作。预测的方法很多,预测是否准确的关键,是能不能按照已有的数据和数据变化的趋势建立适当的数学模型,当模型能很好地反映数据的内在变化规律,则模型的预测数据就会与实际的数据比较吻合,反之则存在较大的误差。

从系统论的观点来看,影响一个系统的各个参数之间都存在一定的关系,有些是很确定的关系,这种确定关系通常可以用一个数学表达式来描述。还有很多复杂系统的参数之间存在不完全确定的关系,这些关系的相互作用,就表现为系统特征参数之间变化的随机性和不确定性。对大多数的预测所研究的对象,是系统各个参数之间具有复杂和不完全确定关系的系统。

在研究预测的模型中,最简单和常用的是系统的两个特征参数变化和分布关系呈现接近线性的关系,对这样的模型,一般是采用一元线性回归的方法,即最小二乘法。灰色系统理论是一门新兴的理论,灰色系统理论认为:由于任何一个系统的各个因素之间都存在互相的关联和影响,呈现部分已知,部分未知的状态,所以,灰色系统理论把客观对象视为一个灰色的物质系统,在研究系统时,通过系统的表征信息,利用关联分析、灰数生成、灰色建模等信息加工手段,探求系统内在的规律,预测系统未来的发展状态。灰色预测就是运用灰色系统理论,通过灰色建模来对系统特征参数变化进行预测的一种实用方法。

1 数据来源

有关河南干旱灾害的资料很多,从干旱史料看,年代越久远,记载越简略,年代越近,记载也逐渐较详。本次着重研究了2009年以前的642 a,即公元1368—2009年间642年的干旱灾害。数据采集主要来源于河南省水文总站编纂的《河南省历代旱涝等水文气候史料》和《河南省历代大水、大旱年表》、河南省水利厅水旱灾害专著编辑委员会编纂的《河南水旱灾害》三本资料以及河南省农业信息网。考虑到指标的代表性、可行性及关联性,并遵循Anderson 原则“基于指标的信息应反映区域地理差异”,本文拟选择将目标定在豫西重灾区代表城市洛阳市,研究洛阳市以及行政边界与之毗邻的郑州市的干旱情况历史演变规律,收集统计该二地市过去642年的干旱年纪录,建立旱灾年份统计表(见表1、表2)。

2 线性回归模型的建立与求解

2.1 线性回归模型的建立

1)回归模型与参数的确定。一元线性回归研究因变量和一个自变量之间的线性关系。其回归模型为:

y=b0+b1x

式中: y为因变量;x为自变量;b0为常数项;b1为回归系数。

2)回归系数的显著性检验。回归系数的显著性检验主要有t检验法、F检验法和相关系数检验法,下面着重介绍相关系数检验法。

相关系数检验法是指在做相关数检验时,取下面的统计量

式中:R成为相关系数。当相关系数的绝对值小于一定的临界值时,接受原假设。

3)回归系数的区间估计

由最小二乘法得到的是回归系数的点估计,实际问题中常要求给出回归系数的置信区间。常数项和回归系数的置信水平为1-α的置信区间可由下面两式给出

4)预测。经检验回归系数的显著性检验以后,就可以利用回归方程式进行预测。一般当给定预测精度时,就可以得到回归系数的预测区间。

表1 洛阳市旱灾年份统计表(1350—2009)

表2 郑州市旱灾年份统计表(1350—2009)

2.2 线性回归模型的求解

利用表1、表2数据作因变量与自变量的散点图。分析因变量和自变量的关系,详见图1。

图1 洛阳和郑州旱灾年份散点图

回归统计MultipleR0.954334RSquare0.910753AdjustedRSquare0.908769标准误差68.04749观测值47

从图1的散点图可以看出,在某一个区间内,洛阳旱灾年份(因变量)与编号(自变量)之间具有明显的函数关系;同时,郑州旱灾年份(因变量)与编号(自变量)之间也有明显的函数关系。

然后,为进一步确定他们之间的函数关系,建立一元回归模型:

y=b0+b1x

以编号为自变量,以旱灾发生年份为因变量(这里为了简单起见,仅以洛阳市为例,郑州市同理),对洛阳旱灾年份进行回归分析。利用matlab得到求解结果如下(见表3~表5和图2):

表4 方差分析

表5 误差分析

图2 回归分析正态分布图

由以上结果可以得出:洛阳旱灾年份回归方程为y=15.681x+1 345。

另外:由于R=0.954 334>0.95,F=459.217(具有很大的数值),说明回归显著。可以用y=15.681x+1 345来预测洛阳旱灾年份。

表6 方法结果对比

2.3 线性回归模型的应用

根据所建立的模型以及模型分析,来预测未来洛阳市旱灾发生年份,以期积极主动地采取措施进行防旱抗旱工作提供科学依据。用y=15.681x+1 345进行预测,可以得到:

3 模型对比

本文通过洛阳市旱灾年份计算实例,采用线性回归模型和基于GM(1,1)模型的灰色灾变预测对干旱年份进行预测,同时对数据预测精度进行一个比较分析,结果见表6。

从表6可以看出,由于例子的数据分布关系基本接近线性关系,所以不论是一元线性回归还是灰色理论的GM(1,1)模型所得到的方程,都能很好地反映数据之间的变化关系,按方程得到的计算值与实际值之间的误差都不大。从相对误差大小比较的角度,对出的两个例子,用灰色理论的GM(1,1)模型对数据的预测精度较一元线性回归都要稍高一些,这主要是由于灰色理论的GM(1,1)模型所得到的白化方程是一种指数形式的表达式,对数据变化的适应性更好一些。

4 结语

灰色系统理论把客观对象视为一个灰色的物质系统,在研究系统的变化规律时,通过抓住系统的表征信息,利用灰数生成,灰色建模的信息加工手段,研究系统内部因素间的变化规律,利用得到的灰色模型,来预测系统未来的发展,灰色预测在很多领域都有应用。上面的两个例子表明,对基本符合线性关系的数据,采用灰色理论的GM(1,1)模型较一元线性回归的预测精度要高。用灰色理论的GM(1,1)模型进行建模时,并不直接采用已知的数据,而是通过对已知数据的再加工、即对灰数生成的数据进行处理来挖掘数据之间的内在联系,通过这种加工得到的数据及所建立的灰色模型,可以更好地揭示特定系统的运行机制和本质特征。灰色预测建模是少数据建模,对GM(1,1)模型可以仅需4个数据,对离散数据的分布没有要求。对本文所举的洛阳市旱灾年份预测实例,应该说是灰色预测在离散数据接近线性分布情况下应用的特例,从例子的结果看出:灰色建模和灰色预测在一些特定的情况下,是一种较一元线性回归预测精度更好的实用预测方法。

[1]陈万金,信乃铨.中国北方旱地农业综合发展与对策[M].北京:中国农业科技出版社.1994.72-84.

[2]熊见红.长沙市农业干旱规律分析及旱情预报模型探讨[J].湖南水利水电.2003(3):29-31.

[3]张书滨. 江西省农业旱情预测模型的建立与应用[J].南昌大学学报.2009.(6):179-182.

[4]杨宝中,等. 河南省干旱特点及水资源开发利用的研究[J].华北水利水电学院学报.2008.29(4):1-4.

[5]房稳静,等. 河南省冬小麦干旱灾害的空间分布研究[J].气象与环境科学.2007,(2):

[6]程炳岩.河南气候概论[M].北京:气象出版社.1995.

[7]韩中庚.数学建模方法及其应用.北京:高等教育出版社.2005.

[8]河南省水文总站. 河南省历代旱涝等水文气候史料[M].郑州:河南省水文总站.1982.

[9]河南省水文总站. 河南省历代大水、大旱年表[M].郑州:河南省水文总站.1999.

猜你喜欢
旱灾回归系数年份
特殊的一年
板栗“旱灾”后生产管理技术
多元线性回归的估值漂移及其判定方法
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
葫芦岛市旱灾风险评价
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
黑龙江省旱灾等级划分及旱情分布研究
什么是闰年?
一样的年份
德州市2014年旱灾应对措施与经验分析