基于加权多项式回归模型的变形预报★

2019-03-06 07:40董洪鹏王继刚
山西建筑 2019年6期
关键词:期数观测建模

徐 欢 董洪鹏 王继刚

(淮海工学院测绘与海洋信息学院,江苏 连云港 222059)

1 概述

变形是指变形体在各种因素的影响下,其形状、大小以及位置在时空域中发生的变化[1]。变形在一定范围内是允许的,但是一旦超过其所能承受的变形范围时,往往会演变成灾难。为了能够发现变形体的变形,有效的方法就是对变形体开展变形监测工作,获得变形数据,分析其变形的原因,然后对未来变形体的变形做出预报[2]。目前变形监测预报模型有很多,如统计模型、时间序列模型、灰度系统模型、人工神经网络等[3]。在这些模型中,多项式回归模型就是一种最常用的模型。该模型建模时不必考虑过多的因素,通常仅仅需要变形量是等间隔的时间序列(不等间隔的可以等间隔化)这一条件。该模型具有很好的适应性,在具体使用时往往采用低阶模型,这样参数少,容易求解。在实际建模过程中,我们往往考虑观测值是等精度观测的,从建模角度来讲是客观合理的,但是从预报的角度来说,就有失公允,因为距离变形预报时刻越近的观测值,对预报的准确性和可靠性价值就越高,相反,距离变形时刻越远的观测值,其重要性明显降低,因此建模时应顾及到观测数据对预报的重要性,而解决这一问题可以使用权,用权来调整数据的重要性。

鉴于此,本文讨论了加权多项式回归模型,核心问题讨论权的分配,并分析了该法的预报特点,期望能为变形预报提供有益的参考。

2 多项式回归模型

2.1 多项式回归模型概述

回归模型是指利用回归分析方法研究一个因变量与一个或多个自变量之间的函数模型。最常用的回归模型是线性回归模型,因为线性模型简单实用,而且非线性模型往往可以化为线性模型。多项式模型是线性模型的一种,其数学表达式为:

yt=a0+a1t+a2t2+…+antn,t∈(0,+∞)

(1)

其中,y为变形量;t为等间隔的观测期数;a0,a1,a2,…,an均为相应的系数。可见多项式模型相对于一般的线性模型来讲比较简单,只涉及到了观测期数这一个自变量,因此该模型获得了广泛的应用。

因为高次的多项式模型存在着稳定性较差的缺点,在生产实践中,我们往往不是直接应用式(1),而是应用低阶多项式,通常选用二阶多项式:

yt=a0+a1t+a2t2

(2)

式(2)物理意义明显,系数a1就是变形体的变形速率,而系数a2就相当于变形的加速度。

在变形监测数据处理中,当有三期及三期以上的观测值,我们就可以用线性回归模型理论建模,通常运用最小二乘法求得系数,进而实现预报。假设观测了n期,则系数矩阵如下:

(3)

为了便于区别,我们在下文中使用此方法建立的多项式模型称为经典模型。

2.2 加权改进

在式(3)中我们可以对观测值赋予权,并且认为各个元素间是不相关的,得到权阵P,那么式(3)可以改为[4]:

(4)

其中,P为对角阵,简洁记为P=diag(p1,p2,…,pn)=diag(pi),i=1,2,…,n。

可见,式(3)默认是所有建模数据精度相同,P是单位阵,也是式(4)的一个特例。

此处必须指出,加权的目的是调节数据的重要性,数据在变形预报中重要性越大,权就应该越大,这和测量平差中权有所不同,在平差中权的作用是将观测值等精度化。下面根据变形量特性及观测数据距离预报时间的长短来构建权函数,进而得到权阵。

(5)

实际使用中,不宜分过多的组,4组左右为宜,因为一般变形体的变形可以分为缓慢变形、变形发展、变形加剧和急剧变形四个阶段[5];另外也可以从期数角度考虑,不同期数可以分为一组,组内的各期观测值赋予相同的权。注意权之比p1∶pi要控制在适当的范围内。

2)倒指数权。为了改善分段函数不连续性的缺点,可以改用倒指数函数来构造权,我们知道变形曲线往往可以用倒指数曲线来拟合,倒指数曲线函数关系式为:

(6)

其中,y为变形量;i为等间隔的观测期数,运用可化为一元线性回归的模型理论求得系数d和b。考虑到权是一个比例系数,则此法定义得到的权为:

(7)

3)直线型。距离预报时刻越近的观测值赋予越大的权,直线函数赋权最为简单,可以直接定义:

pi=i,i为对应的观测期数

(8)

式(8)中是截距为零的直线,考虑最大权值和最小权值比不宜过大,可以通过改变直线的截距来改变观测值的权之比。

3 算例分析

本文选用了文献[6]的观测数据,截取了其中的前30期数据,见表1。计算策略是利用前20期的数据进行建模,后10期的数据进行预报和检验。采用了经典方法和上述三种加权方法进行了建模和预报,结果也一并列入表1。

为了便于比较基于加权改进模型与经典模型预报精度的特点,表2给出了这四种方法的预报均方差。

分析表1,表2,可以得出结论:

1)加权改进多项式回归模型仍然保留多项式回归模型的优良特性,只是对参与建模数据的重要性做了适当调整,结果依然能够得到物理意义明确的常数项,一次项和二次项。无论是何种预报方法,随着预报时间往后推移,预报误差都有明显的增大趋势。

表1 30期观测计算数据

表2 四种方法预报精度统计 mm

2)与经典模型相比,在所选的相同预报时间内,除了第一期经典模型预报精度略高于三种加权改进的模型外,其他九期,加权模型都高于经典的多项式回归模型,因此,总的来说加权改进多项式回归模型能有利于提高预报精度。

3)整体来看,三种加权方法预报精度最高的是直线函数加权法,倒指数函数加权法次之,分段函数加权法最差。这说明不同的加权方法,赋予观测数据的重要程度不同,因此,在具体选用何种加权法时,要深入研究变形体的特征,以便得到更准确的权,从而得到更可靠的预报值。

4 结论与讨论

变形监测分析核心问题在于预报,对未来可能的变形做出科学预报,才能达到防灾减灾的目的,也才有可能为今后类似的工程设计提供依据。由于变形体的变形涉及到各种复杂因素的影响,及时准确预报变形,一直是学术界探讨的主题。在众多预报变形的模型中,多项式回归模型以其考虑因素少,方程阶数低和物理意义明显的优点而受到一线工作者的青睐。在经典的多项式回归模型中,我们把所有的观测值重要性看成一样的,对预报来说,考虑的不尽周全,因为距离预报时刻越近的观测值,其蕴含的信息对预报来说就愈有价值。因此,可以根据观测值的重要程度,赋予观测值一个权值,进而改善预报精度。本文提出的基于分段函数、倒指数函数和直线函数加权改进的多项式回归模型,并没有改变多项式回归模型的优良特性,也没有对数学建模的方法做实质性的改变,只是通过权来调整了数据的重要性。实现加权改进的算法核心是定权,三种加权改进的方法简单易行有效。当然在实践中,可以根据本文的思路,基于变形体的变形特征和距离变形预报时刻的远近等因素考虑其他的加权方法。加权多项式回归模型几乎没有增加算法的复杂度,但可以有效地提高预报精度,为变形预报提供了有益的尝试。

最后需要指出的是权的给定还存在着明显的主观性,如何更加客观地赋权,要依赖对变形体变形的进一步研究。同时,当建模存在不等精度观测值时,该如何根据数据对预报的重要程度赋权,值得进一步研究。

猜你喜欢
期数观测建模
更正说明
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
跟踪导练(一)6
天文动手做——观测活动(21) 软件模拟观测星空
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
2018年18个值得观测的营销趋势
可观测宇宙
高分辨率对地观测系统
三元组辐射场的建模与仿真