变形监测缺失数据序列灰色建模方法探讨

2016-10-17 02:37王奉伟
测绘工程 2016年12期
关键词:平均法样条插值

周 清,王奉伟

(1.东华理工大学 测绘工程学院,江西 南昌 330013;2.江西省数字国土重点实验室,江西 南昌 330013)



变形监测缺失数据序列灰色建模方法探讨

周清1,2,王奉伟1

(1.东华理工大学测绘工程学院,江西 南昌 330013;2.江西省数字国土重点实验室,江西 南昌 330013)

在测量工作中,由于气候环境、观测方法、观测仪器以及观测人员自身因素等多方面的原因,可能造成观测数据的丢失或者不完全。文中针对这类数据的处理,采用加权平均法和三次样条插值法对缺失数据进行修复,建立GM(1,1)模型,并与非等间隔预测模型进行对比。通过两组仿真数据和两组实测数据验证发现:对于呈指数增长的序列和高增长序列修复之后建模预测精度更高;三次样条插值法数据修复后GM(1,1)建模预测精度较加权平均法预测精度更高;对于低增长序列,直接采用非等间隔建模预测精度更高。

缺失数据;非等间隔建模法;加权平均法;三次样条插值

对于时间序列而言,由于数据本身的相关性,若数据中存在缺失值,就会使得观测序列本身的相关性产生变化,如果没有合理的数据处理方法,那么必然会导致数据分析的不可靠,使得变形预报工作的准确度大大降低[1]。因此,针对变形监测工作中数据缺失这一情况,寻找一种合理的数据处理方法,使观测数据能够被合理利用而不至于完全丢失,同时又能满足精度和准确度的要求,则显得尤为重要。对于变形监测数据而言,通常采用灰色预测模型进行建模。GM(1,1)模型是灰色系统理论的重要内容,由于建模过程简单,模型表达式简洁,便于求解,能较好地对系统行为特征值进行预测,在很多领域得到了广泛的应用[2-7]。对于缺失数据序列的处理,本文分别采用直接将序列看成非等间隔序列进行建模和对数据进行修复后建立GM(1,1)模型,并对预测精度进行比较分析。

1 非等间隔GM(1,1)模型

设有非等间隔的数据序列为

(1)

(2)

对X(0)作1-WAGO生成,得到生成序列为

(3)

其中:

(4)

X(1)的GM(1,1)模型的白化微分方程形式为

(5)

其中α,μ为待定参数,通过最小二乘有

(6)

式中:

(7)

解方程(5)得

(8)

由式(4)得

(9)

两式相减得到差分还原公式为

(10)

2数据修复建模方法2.1加权平均法

加权内插法是以待求点为中心,确定一个邻域范围,用落在邻域范围内的点根据加权平均的方法内插出待求点的值,即

(11)

2.2三次样条插值

设采样数据为

(12)

(13)

在此区间存在插值函数

(14)

式中的函数个数为k,还有4k个待定系数,需要建立4k个方程才能确定方程中的各系数。为了保证三次样条插值曲线的连续性,式(14)要满足条件

(15)

(16)

为保证插值函数在离散数据点处的1阶导数存在且连续,需满足条件

(17)

为保证插值函数在离散数据点处的2阶导数存在且连续,需满足条件

(18)

由式(15)~(18)可知,为求解式(14)得系数4k还需要建立2个方程,并且不能只对插值函数在中间节点建立约束方程,同时也要对插值多项式在两端点的状态建立约束方程,也就是两个边界条件

(19)

由式(15)~(19)联合可以求解式(14)4k个系数。

对缺失数据进行修复之后,采用传统的GM(1,1)模型对修复后的序列进行建模。

3实例分析3.1低增长指数序列

表1 各模型预测结果与实际值对比(实例1)

从实例1的预测精度可以看出,对于低增长的指数序列,对数据进行修复之后建立GM(1,1)模型预测精度明显高于直接进行非等间隔GM(1,1)模型的预测精度;并且三次样条插值法对数据修复之后建模预测精度较加权平均法修复后建模预测精度更高。

3.2高增长指数序列

实例2:以x=e0.5(i-1),i=1,2,…,10生成原始数据,x(0)={1.000,1.648 7,2.718 3,4.481 7,7.389 1,12.182 5,20.085 5,33.115 5,54.598 2,90.017 1}。由于数据增长较快,这是一个高增长指数序列。假设第5个数据丢失,分别采用非等间隔GM(1,1)模型,加权平均法修复后GM(1,1)模型,三次样条插值修复后GM(1,1)模型对第11到第14个数据进行预测,结果见表2。

表2 各模型预测结果与实际值对比(实例2)

从实例2的预测精度可以看出,对于高增长指数序列,对数据修复之后建模预测精度明显高于直接进行非等间隔建模的预测精度;三次样条插值法对数据修复之后建模预测精度较加权平均法修复后建模预测精度更高。

3.3实测低增长序列

实例3:利用文献[9]某炼钢厂钢炉的沉降观测点的10期沉降观测数据,x(0)={2.79,4.34,5.17,6.97,7.63,8.4,9.13,9.74,10.09,10.46},由于数据变化平缓,为低增长数列。假设第4个数据缺失,分别采用非等间隔GM(1,1)模型,加权平均法修复后GM(1,1)模型,三次样条插值修复后GM(1,1)模型对第8到第10个数据进行预测,结果见表3。

从实例3的预测精度可以看出,对于低增长的序列,对数据直接进行非等间隔建模的预测精度明显高于对数据修复之后建模的预测精度,三次样条插值法对数据修复之后建模预测精度和加权平均法修复后建模预测精度相当。

表3 各模型预测结果与实际值对比(实例3)

3.4实测高增长序列

实例4:数据来源于文献[10],原始数列x(0)={2.718,7.389,20.086,54.598,148.41,403.43,1 096.61}。由于数据增长较快,这是一个高增长序列。假设第3个数据缺失,分别采用非等间隔GM(1,1)模型,加权平均法修复后GM(1,1)模型,三次样条插值修复后GM(1,1)模型对第6、7个数据进行预测,结果见表4。

表4 各模型预测结果与实际值对比(实例4)

从实例4的预测精度可以看出,对于高增长序列,对数据修复之后建模预测精度明显高于直接进行非等间隔建模的预测精度,三次样条插值法对数据修复之后建模预测精度较加权平均法修复后建模预测精度更高。

4 结 论

通过实例分析发现,对于呈指数增长的序列及高增长序列,对数据修复之后建模预测精度明显高于直接进行非等间隔建模的预测精度,三次样条插值法对数据修复之后建模预测精度较加权平均法修复后建模预测精度更高;对于低增长的序列,对数据直接进行非等间隔建模的预测精度明显高于对数据修复之后建模的预测精度,三次样条插值法对数据修复之后建模预测精度和加权平均法修复后建模预测精度相当。

[1]BARZI F, WOODWARD M.Imputations of missing values in practice: results from imputations of serum cholesterol in 28 cohort studies[J].American journal of epidemiology,2004,160(1):34-45.

[2]李大军,孙旭红,汤拥军.PGM(1,1)灰色预测模型及其应用[J].华东地质学院学报,2002,25(1):40-43.

[3]周世健,赖志坤,藏德彦,等.加权灰色预测模型及其计算实现[J].武汉大学学报(信息科学版),2002,27(5):451-455.

[4]何伟,李明,阚起源.抗差加权非等时距GM(1,1)模型在大型建筑物沉降预测中的应用[J].测绘工程,2014,23(4):62-64.

[5]周永领,黄其欢.非等间距WGM-AR模型在基坑周边建筑物沉降预测中的应用[J].测绘工程,2014,23(6):43-45.

[6]曹昶,樊重俊. 非等间距无偏GM(1,1)模型在建筑沉降预测中的应用[J]. 测绘工程,2013,22(6):55-57.

[7]朱成林,花向红,邱卫宁,等. 改进的灰色建模及在沉降监测点重建中的应用[J]. 测绘工程,2009,18(3):69-72.

[8]张菊清,陈再辉,魏建忠.DEM空间数据抗差内插模型及其分析[J].测绘科学,2007,32(6):33-34.

[9]黄声享,刘经南,柳响林.小波分析在高层建筑动态监测中的应用[J].测绘学报,2003,32(2):153-157.

[10] 王国兴. GM(1,1)模型的改进及应用[J].应用泛函分析学报,2013,15(3):211-217.

[责任编辑:刘文霞]

The gray modeling method in missing datasequence of deformation monitoring

ZHOU Qing1,2,WANG Fengwei1

(1.School of Surveying and Mapping Engineering, East China University of Technology,Nanchang 330013,China;2,Jiangxi Province Key Lab for Digital Land,Nanchang 330013,China)

For the measurement work, because of the climatic environment, observation method, observation instrument and the factors of the observation, the data can be lost or incomplete. This paper proposes to repair the missing data by using weighed averaging method and the spline interpolation method.Then the GM(1, 1)model is established.Compared two methods with the non-equal interval forecasting model,the experimental results show that the models of repairing missing data have higher prediction accuracy for exponential growth and high growth sequence.But for the two methods,the prediction accuracy of the spline model is higher than the weighted averaging method.For the low growth sequences,the prediction accuracy of the non-equal interval method is higher than the other.

missing data; non-equal interval modeling method; weighted average method; spline

2015-12-22

江西省数字国土重点实验室开放研究基金资助项目(DLLJ201516);国家自然科学基金资助项目(41401437)

周清(1988-),女,硕士研究生.

P207;TU196

A

1006-7949(2016)12-0070-04

猜你喜欢
平均法样条插值
基于平均法的金属橡胶隔振器非线性振动特性研究
一元五次B样条拟插值研究
具有初边值条件的集值脉冲微分方程的平均法
基于Sinc插值与相关谱的纵横波速度比扫描方法
三次参数样条在机床高速高精加工中的应用
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
基于样条函数的高精度电子秤设计
平均法处理自由落体频闪数据的研究
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析