基于一元线性回归分析的大坝预测模型的建立及其引用建模样本数量对预测效果的影响

2014-07-14 02:53杨颜江杨雷
中国科技纵横 2014年6期
关键词:回归分析模型

杨颜江+杨雷

【摘 要】 本文主要介绍一元线性回归分析的基本原理和方法,并结合实例分析。在建模过程中采用不同数量的检测数据进行建模,得出用该模型预测变形的合理性,引入变量多的模型的预测的效果较好。

【关键词】 回归分析 沉降预测 模型

0 引言

随着国内外病险坝的逐渐增多,要求实时或及时了解大坝的安全状况,掌握变形规律。而预测大坝沉降的方法有多种,本文主要介绍了检测统计模型中的一元线性回析归分析方法,并且将其运用在大坝变形预测分析中。

1 一元线性回归分析的基本原理和方法

我们可以用一条直线来表示x和y的关系,并借助最小二乘法,可得到一元线性回归的回归方程[5]:

=a+bx (1.1)

a,b又叫做回归方程的回归系数。

下面根据最小二乘法原则来确定a,b的取值。

对于每一个,由方程(1.1)可以确定一个回归值=a+b。这个回归值与实际观测值之差-=-a-b,刻划了与回归直线=a+bx的偏离程度。对于所有的,若与的偏离程度越小,则直线和所有的试验点拟合得:

(1.2)

由最小二乘法可知要使达到极小值,只要对上式分别对a,b求偏导,并令它们等于零,于是可以推导出a,b的值:

(1.3)

(1.4)

上式中和分别表示、的算术平均值,则式(1.3-1.4)可变为如下简单的形式:

(1.5)

2 预报原理

如果回归方程通过了统计检验,而且其拟合得比较好,那么就可以利用所求得的回归方程对有关测量数据进行预报和控制。下面先讨论预报问题。

对任一给定的,由回归方程可得回归值:

, (2.1)

是处的观测值:

(2.2)

所谓预报,就是在一定的显著水平下,寻找一个正数,使得实际观测值以的概率落在区间()内,即:

, (2.3)

其中

(2.4)

上式表明,利用回归方程预报实际观测值的偏差不仅与显著水平有关,与N有关,而且与观测点有关。

在没有重复试验的情况下,剩余平方和可以提供的无偏估计。

(2.5)

(2.6)

给出了的无偏估计。

在重复试验的情况下,误差平方和可以提供的无偏估计。

3 回归模型的建立过程

一元线性回归模型虽然简单,但它的统计思想非常重要,所以我们有必要对一元线性回归模型及应用方面作一些讨论。

第一步,提出因变量与自变量。

第二步,搜集数据。

第三步,根据数据画散点图。

第四步,设定理论模型。

第五步,计算。

第六步,回归诊断,分析计算结果。

第七步,模型的应用。当所建模型通过所有检验之后,就可结合实际问题进行应用。

4 应用实例分析

某拱坝,为双曲薄拱坝,最大坝高68.7m,坝顶最小厚度2.5m,坝底厚度5m,坝顶长150m,河谷宽约90m,半径28.2~59.65m,该坝与1952年开始观测,1955年底前水库一直未蓄水,仅有气温作用。其中位移为拱冠位移,气温是由距坝3km的某县的气象站所得。一共选取15期数据来进行分析。

1)用数据2~10期进行建模分析,图1为1~10期数据散点图,从位移的散点图可以看出,位移与温度呈线性关系,所以可以建立一元线性回归模型进行分析,位移量为因变量,气温为自变量。

由以上理论分析计算得以下结果见表1。

从计算得结果表1可以看出,=-0.522,=1.8833,有效样本容量n=9。y的标准差=2.70123。

从表2中可知,相关系数r=-0.993,单侧检验显著性sig≈0.000,说明y与x有显著的线性相关,这与散点图的直观分析是一致的。

从表3中看到,决定系数r2=0.986,从相对水平上看,回归方程能够减少因变量y的98.6%的方差波动。回归标准差=0.34651,从绝对水平上看,y的标准差从回归前的2.70123减少到回归后的0.34651。

从表4中看到,F=479.153,显著性sig≈0.000,说明y对x的线性回归高度显著,这与相关系数的检验结果是一致的。

从表5中得到回归方程为,回归系数检验的t值=-21.890,显著性sig≈0.000,与F检验和相关系数r的检验结果一直。另外常数项的置信度95%的区间估计为(1.437,1.984),系数的置信度95%的区间估计为(-0.367,-0.295)。

2)利用数据1-10进行回归建模分析,同样可得与模型1模的方式相同,计算得出结果相关系数r=-0.995,说明y与x有显著的线性相关,与散点图的直观分析是一致的。在统计检验方面,决定系数r2=0.990,从相对水平上看,回归方程能够减少因变量y的99.0%的方差波动。回归标准差=0.33265,从绝对水平上看,y的标准差从回归前的3.11219减少到回归后的0.33265。在方差分析方面,F=779.791,显著性sig≈0.000,说明y对x的线性回归高度显著,这与相关系数的检验结果也是一致的。表8为模型系数计算表。

从表8中得到回归方程为,回归系数检验的t值=-27.925,显著性sig≈0.000,与F检验和相关系数r的检验结果一直。另外常数项的置信度95%的区间估计为(1.476,1.976),系数的置信度95%的区间估计为(-0.364,-0.308)。用此模型对11~15期数据预测结果如下。

结果分析:在增加一个自变量的情况下所作出的预测更加稳定,精度也更高,从图3中可以看出。另外,从两模型的残差比较图4上看,模型2的残差大部分要比模型1更小,从对两个模型的回归诊断上可以发现模型2的R为0.995大于模型1的0.993,模型2决定系数0.990也大于模型10.986,且模型2y的回归后的标准差0.33265要小于模型1的0.34651,由此可见:模型2在增加了一个观测数据的情况下所建立的回归模型要比模型1更显著,更优,这点从残差比较图中可以明显看出。比较两个模型的拟合图如图2,好像并不能看出哪个模型更优,甚至由两个模型中实测值与模型对2~9期数据的拟合相对误差表比较似乎更倾向于模型1比模型2更优,但是由后期两个模型对11~15期数据的预测精度。

5 结语

综上所述,回归模型运用于大坝变形预测是可行的,并且选用自变量多的方式进行建模的预测结果优于少自变量建模预测的结果。笔者对多个大坝变形实例进行试验,大多数可以得到比较理想的预测效果。

参考文献:

[1]吴中如.水工建筑物安全监控理论及其应用.北京:高等教育出版社,2001.

[2]王孝仁,王松桂编译.实用多元统计分析[M].上海科学技术出版社,1990,195-264.

[3]徐培亮.大坝变形预测方法的扩展.测绘学报,1987,16(4):280-290.

[4]RogerAH,CharlesRJ.杨奇译.矩阵分析[M].北京:机械工业出版社,2005.

[5]何晓群,刘文卿.应用回归分析.中国人民出版社.

[6]张正禄,汪宏晨.滑坡变形分析与预报的新方法[J].武汉大学学报-信息科学版,2009,34(12):1387~1389.endprint

【摘 要】 本文主要介绍一元线性回归分析的基本原理和方法,并结合实例分析。在建模过程中采用不同数量的检测数据进行建模,得出用该模型预测变形的合理性,引入变量多的模型的预测的效果较好。

【关键词】 回归分析 沉降预测 模型

0 引言

随着国内外病险坝的逐渐增多,要求实时或及时了解大坝的安全状况,掌握变形规律。而预测大坝沉降的方法有多种,本文主要介绍了检测统计模型中的一元线性回析归分析方法,并且将其运用在大坝变形预测分析中。

1 一元线性回归分析的基本原理和方法

我们可以用一条直线来表示x和y的关系,并借助最小二乘法,可得到一元线性回归的回归方程[5]:

=a+bx (1.1)

a,b又叫做回归方程的回归系数。

下面根据最小二乘法原则来确定a,b的取值。

对于每一个,由方程(1.1)可以确定一个回归值=a+b。这个回归值与实际观测值之差-=-a-b,刻划了与回归直线=a+bx的偏离程度。对于所有的,若与的偏离程度越小,则直线和所有的试验点拟合得:

(1.2)

由最小二乘法可知要使达到极小值,只要对上式分别对a,b求偏导,并令它们等于零,于是可以推导出a,b的值:

(1.3)

(1.4)

上式中和分别表示、的算术平均值,则式(1.3-1.4)可变为如下简单的形式:

(1.5)

2 预报原理

如果回归方程通过了统计检验,而且其拟合得比较好,那么就可以利用所求得的回归方程对有关测量数据进行预报和控制。下面先讨论预报问题。

对任一给定的,由回归方程可得回归值:

, (2.1)

是处的观测值:

(2.2)

所谓预报,就是在一定的显著水平下,寻找一个正数,使得实际观测值以的概率落在区间()内,即:

, (2.3)

其中

(2.4)

上式表明,利用回归方程预报实际观测值的偏差不仅与显著水平有关,与N有关,而且与观测点有关。

在没有重复试验的情况下,剩余平方和可以提供的无偏估计。

(2.5)

(2.6)

给出了的无偏估计。

在重复试验的情况下,误差平方和可以提供的无偏估计。

3 回归模型的建立过程

一元线性回归模型虽然简单,但它的统计思想非常重要,所以我们有必要对一元线性回归模型及应用方面作一些讨论。

第一步,提出因变量与自变量。

第二步,搜集数据。

第三步,根据数据画散点图。

第四步,设定理论模型。

第五步,计算。

第六步,回归诊断,分析计算结果。

第七步,模型的应用。当所建模型通过所有检验之后,就可结合实际问题进行应用。

4 应用实例分析

某拱坝,为双曲薄拱坝,最大坝高68.7m,坝顶最小厚度2.5m,坝底厚度5m,坝顶长150m,河谷宽约90m,半径28.2~59.65m,该坝与1952年开始观测,1955年底前水库一直未蓄水,仅有气温作用。其中位移为拱冠位移,气温是由距坝3km的某县的气象站所得。一共选取15期数据来进行分析。

1)用数据2~10期进行建模分析,图1为1~10期数据散点图,从位移的散点图可以看出,位移与温度呈线性关系,所以可以建立一元线性回归模型进行分析,位移量为因变量,气温为自变量。

由以上理论分析计算得以下结果见表1。

从计算得结果表1可以看出,=-0.522,=1.8833,有效样本容量n=9。y的标准差=2.70123。

从表2中可知,相关系数r=-0.993,单侧检验显著性sig≈0.000,说明y与x有显著的线性相关,这与散点图的直观分析是一致的。

从表3中看到,决定系数r2=0.986,从相对水平上看,回归方程能够减少因变量y的98.6%的方差波动。回归标准差=0.34651,从绝对水平上看,y的标准差从回归前的2.70123减少到回归后的0.34651。

从表4中看到,F=479.153,显著性sig≈0.000,说明y对x的线性回归高度显著,这与相关系数的检验结果是一致的。

从表5中得到回归方程为,回归系数检验的t值=-21.890,显著性sig≈0.000,与F检验和相关系数r的检验结果一直。另外常数项的置信度95%的区间估计为(1.437,1.984),系数的置信度95%的区间估计为(-0.367,-0.295)。

2)利用数据1-10进行回归建模分析,同样可得与模型1模的方式相同,计算得出结果相关系数r=-0.995,说明y与x有显著的线性相关,与散点图的直观分析是一致的。在统计检验方面,决定系数r2=0.990,从相对水平上看,回归方程能够减少因变量y的99.0%的方差波动。回归标准差=0.33265,从绝对水平上看,y的标准差从回归前的3.11219减少到回归后的0.33265。在方差分析方面,F=779.791,显著性sig≈0.000,说明y对x的线性回归高度显著,这与相关系数的检验结果也是一致的。表8为模型系数计算表。

从表8中得到回归方程为,回归系数检验的t值=-27.925,显著性sig≈0.000,与F检验和相关系数r的检验结果一直。另外常数项的置信度95%的区间估计为(1.476,1.976),系数的置信度95%的区间估计为(-0.364,-0.308)。用此模型对11~15期数据预测结果如下。

结果分析:在增加一个自变量的情况下所作出的预测更加稳定,精度也更高,从图3中可以看出。另外,从两模型的残差比较图4上看,模型2的残差大部分要比模型1更小,从对两个模型的回归诊断上可以发现模型2的R为0.995大于模型1的0.993,模型2决定系数0.990也大于模型10.986,且模型2y的回归后的标准差0.33265要小于模型1的0.34651,由此可见:模型2在增加了一个观测数据的情况下所建立的回归模型要比模型1更显著,更优,这点从残差比较图中可以明显看出。比较两个模型的拟合图如图2,好像并不能看出哪个模型更优,甚至由两个模型中实测值与模型对2~9期数据的拟合相对误差表比较似乎更倾向于模型1比模型2更优,但是由后期两个模型对11~15期数据的预测精度。

5 结语

综上所述,回归模型运用于大坝变形预测是可行的,并且选用自变量多的方式进行建模的预测结果优于少自变量建模预测的结果。笔者对多个大坝变形实例进行试验,大多数可以得到比较理想的预测效果。

参考文献:

[1]吴中如.水工建筑物安全监控理论及其应用.北京:高等教育出版社,2001.

[2]王孝仁,王松桂编译.实用多元统计分析[M].上海科学技术出版社,1990,195-264.

[3]徐培亮.大坝变形预测方法的扩展.测绘学报,1987,16(4):280-290.

[4]RogerAH,CharlesRJ.杨奇译.矩阵分析[M].北京:机械工业出版社,2005.

[5]何晓群,刘文卿.应用回归分析.中国人民出版社.

[6]张正禄,汪宏晨.滑坡变形分析与预报的新方法[J].武汉大学学报-信息科学版,2009,34(12):1387~1389.endprint

【摘 要】 本文主要介绍一元线性回归分析的基本原理和方法,并结合实例分析。在建模过程中采用不同数量的检测数据进行建模,得出用该模型预测变形的合理性,引入变量多的模型的预测的效果较好。

【关键词】 回归分析 沉降预测 模型

0 引言

随着国内外病险坝的逐渐增多,要求实时或及时了解大坝的安全状况,掌握变形规律。而预测大坝沉降的方法有多种,本文主要介绍了检测统计模型中的一元线性回析归分析方法,并且将其运用在大坝变形预测分析中。

1 一元线性回归分析的基本原理和方法

我们可以用一条直线来表示x和y的关系,并借助最小二乘法,可得到一元线性回归的回归方程[5]:

=a+bx (1.1)

a,b又叫做回归方程的回归系数。

下面根据最小二乘法原则来确定a,b的取值。

对于每一个,由方程(1.1)可以确定一个回归值=a+b。这个回归值与实际观测值之差-=-a-b,刻划了与回归直线=a+bx的偏离程度。对于所有的,若与的偏离程度越小,则直线和所有的试验点拟合得:

(1.2)

由最小二乘法可知要使达到极小值,只要对上式分别对a,b求偏导,并令它们等于零,于是可以推导出a,b的值:

(1.3)

(1.4)

上式中和分别表示、的算术平均值,则式(1.3-1.4)可变为如下简单的形式:

(1.5)

2 预报原理

如果回归方程通过了统计检验,而且其拟合得比较好,那么就可以利用所求得的回归方程对有关测量数据进行预报和控制。下面先讨论预报问题。

对任一给定的,由回归方程可得回归值:

, (2.1)

是处的观测值:

(2.2)

所谓预报,就是在一定的显著水平下,寻找一个正数,使得实际观测值以的概率落在区间()内,即:

, (2.3)

其中

(2.4)

上式表明,利用回归方程预报实际观测值的偏差不仅与显著水平有关,与N有关,而且与观测点有关。

在没有重复试验的情况下,剩余平方和可以提供的无偏估计。

(2.5)

(2.6)

给出了的无偏估计。

在重复试验的情况下,误差平方和可以提供的无偏估计。

3 回归模型的建立过程

一元线性回归模型虽然简单,但它的统计思想非常重要,所以我们有必要对一元线性回归模型及应用方面作一些讨论。

第一步,提出因变量与自变量。

第二步,搜集数据。

第三步,根据数据画散点图。

第四步,设定理论模型。

第五步,计算。

第六步,回归诊断,分析计算结果。

第七步,模型的应用。当所建模型通过所有检验之后,就可结合实际问题进行应用。

4 应用实例分析

某拱坝,为双曲薄拱坝,最大坝高68.7m,坝顶最小厚度2.5m,坝底厚度5m,坝顶长150m,河谷宽约90m,半径28.2~59.65m,该坝与1952年开始观测,1955年底前水库一直未蓄水,仅有气温作用。其中位移为拱冠位移,气温是由距坝3km的某县的气象站所得。一共选取15期数据来进行分析。

1)用数据2~10期进行建模分析,图1为1~10期数据散点图,从位移的散点图可以看出,位移与温度呈线性关系,所以可以建立一元线性回归模型进行分析,位移量为因变量,气温为自变量。

由以上理论分析计算得以下结果见表1。

从计算得结果表1可以看出,=-0.522,=1.8833,有效样本容量n=9。y的标准差=2.70123。

从表2中可知,相关系数r=-0.993,单侧检验显著性sig≈0.000,说明y与x有显著的线性相关,这与散点图的直观分析是一致的。

从表3中看到,决定系数r2=0.986,从相对水平上看,回归方程能够减少因变量y的98.6%的方差波动。回归标准差=0.34651,从绝对水平上看,y的标准差从回归前的2.70123减少到回归后的0.34651。

从表4中看到,F=479.153,显著性sig≈0.000,说明y对x的线性回归高度显著,这与相关系数的检验结果是一致的。

从表5中得到回归方程为,回归系数检验的t值=-21.890,显著性sig≈0.000,与F检验和相关系数r的检验结果一直。另外常数项的置信度95%的区间估计为(1.437,1.984),系数的置信度95%的区间估计为(-0.367,-0.295)。

2)利用数据1-10进行回归建模分析,同样可得与模型1模的方式相同,计算得出结果相关系数r=-0.995,说明y与x有显著的线性相关,与散点图的直观分析是一致的。在统计检验方面,决定系数r2=0.990,从相对水平上看,回归方程能够减少因变量y的99.0%的方差波动。回归标准差=0.33265,从绝对水平上看,y的标准差从回归前的3.11219减少到回归后的0.33265。在方差分析方面,F=779.791,显著性sig≈0.000,说明y对x的线性回归高度显著,这与相关系数的检验结果也是一致的。表8为模型系数计算表。

从表8中得到回归方程为,回归系数检验的t值=-27.925,显著性sig≈0.000,与F检验和相关系数r的检验结果一直。另外常数项的置信度95%的区间估计为(1.476,1.976),系数的置信度95%的区间估计为(-0.364,-0.308)。用此模型对11~15期数据预测结果如下。

结果分析:在增加一个自变量的情况下所作出的预测更加稳定,精度也更高,从图3中可以看出。另外,从两模型的残差比较图4上看,模型2的残差大部分要比模型1更小,从对两个模型的回归诊断上可以发现模型2的R为0.995大于模型1的0.993,模型2决定系数0.990也大于模型10.986,且模型2y的回归后的标准差0.33265要小于模型1的0.34651,由此可见:模型2在增加了一个观测数据的情况下所建立的回归模型要比模型1更显著,更优,这点从残差比较图中可以明显看出。比较两个模型的拟合图如图2,好像并不能看出哪个模型更优,甚至由两个模型中实测值与模型对2~9期数据的拟合相对误差表比较似乎更倾向于模型1比模型2更优,但是由后期两个模型对11~15期数据的预测精度。

5 结语

综上所述,回归模型运用于大坝变形预测是可行的,并且选用自变量多的方式进行建模的预测结果优于少自变量建模预测的结果。笔者对多个大坝变形实例进行试验,大多数可以得到比较理想的预测效果。

参考文献:

[1]吴中如.水工建筑物安全监控理论及其应用.北京:高等教育出版社,2001.

[2]王孝仁,王松桂编译.实用多元统计分析[M].上海科学技术出版社,1990,195-264.

[3]徐培亮.大坝变形预测方法的扩展.测绘学报,1987,16(4):280-290.

[4]RogerAH,CharlesRJ.杨奇译.矩阵分析[M].北京:机械工业出版社,2005.

[5]何晓群,刘文卿.应用回归分析.中国人民出版社.

[6]张正禄,汪宏晨.滑坡变形分析与预报的新方法[J].武汉大学学报-信息科学版,2009,34(12):1387~1389.endprint

猜你喜欢
回归分析模型
适用于BDS-3 PPP的随机模型
p150Glued在帕金森病模型中的表达及分布
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
城乡居民医疗费用的相关性与回归分析
3D打印中的模型分割与打包
FLUKA几何模型到CAD几何模型转换方法初步研究