减弱观测误差对回归模型的影响研究

2012-08-09 01:58周兴东
长江科学院院报 2012年12期
关键词:计算结果监测点阈值

赵 卿,周兴东

减弱观测误差对回归模型的影响研究

赵 卿1,2,周兴东1

(1.江苏师范大学测绘学院,江苏徐州 221116;2.江西省数字国土重点实验室,江西抚州 344000)

对变形监测序列进行数据建模分析时,含有误差的监测数据会对模型的建立产生较大的影响。提出一种“事件”模型改变原始观测序列的表达形式,通过对原始观测数据进行转换,对变形监测数据按照某种规则进行分类划分,划分后的数据能够适应Cox模型。根据经验或者实际情况,适当调节“事件”模型参数,在一定程度上可以减弱观测误差带给Cox回归模型的影响,算例分析进一步论证了该模型计算结果的准确度能够进一步地提高计算结果的准确度。

观测误差;变形监测;事件模型;Cox回归模型

变形监测对观测精度有很高的要求,而监测过程中不可避免受到外界条件干扰(如水汽等)而带来观测误差,通过平差的方法可以消除每期观测结果含有的偶然误差,但是在整个监测时期内,监测点的观测序列中含有的误差仍然无法消除[1-2],而且较大的误差会对后续建模分析产生很大影响[3];实际监测工作中,小波变换进行消噪是目前处理含有噪声信息的监测序列较为常用的办法[3]。该方法对减弱误差对观测序列的影响,具有很好的效果[4]。本文提出一种“事件”模型来变换监测序列,通过调节模型参数,可以减弱观测误差对数据分析结果的影响,应用Cox回归模型计算[5-6]得到对变形数据分析的新方法。

1 建立“事件”模型

建立“事件”模型的假设为:上次“事件”的发生对下一次“事件”的发生迟早会产生很大影响[5,7]。在变形监测数据分析过程中,监测点在某时刻的变形信息,在一定程度上要受到前一时期内变形结果的影响。基于此假设,在变形监测数据分析中,对监测资料中的位移量建立如下“事件”模型。

(1)设监测资料中第i监测点在监测时刻j的位移量数据为δij(i=1,2,…,n;j=1,2,…,m),计算该监测点在相邻观测时刻间的平均位移速率vij(i=1,2,…,n;j=1,2,…,m-1),并以矩阵的形式表达,即

式中,Vi(i=1,2,…,n)表示第i个监测点的位移序列。

(2)根据监测资料中各个监测点的平均位移速率vij(i=1,2,…,n;j=1,2,…,m-1),计算该监测资料的位移速率阈值

或者凭多年观测经验,给定一个位移速率的阈值v0,定义“监测点位移速率vij和给定阈值v0的比较结果”为“事件”,用eij(i=1,2,…,n;j=1,2,…,m-1)表示。

(3)对于第i个监测点,如果满足“vij<v0”,则称监测点i在时刻j为“事件未发生”状态,相应的eij=0;如果满足“vij>v0”,则称监测点i在时刻j为“事件发生”状态,相应的eij=1,即,以监测点位移速率vij与阈值v0的比较结果,决定各监测点的“事件”状态,并把式(1)表达成“事件矩阵”其中,Ei(i=1,2,…,n)表示第i个监测点的“事件”状态序列。

通过上述步骤(1)—(3),可以将原始观测数据位移δij转化成“事件”eij,完成“事件”模型的建立。

2 “事件”模型的优势

分析“事件”模型的建立的过程,可以发现该模型在一定程度上可以减弱观测误差的影响。

变形监测的过程,不可避免地会有各类误差源的干扰,尤其是在观测条件较差的环境里,致使计算得到的位移数据带有误差。通过适当调整位移速率的阈值v0,可以有效减弱观测误差的影响。

例如,由于观测条件较差(受水汽较大等影响),第i监测点在j时刻的Xij坐标含有误差,设真值为为观测值,观测精度为σij,真误差为εij,则

假定本期与上期观测为等精度观测,间隔为δtij=tij-ti,j-1,则本期的位移为

平均速率的精度为

按照常规的分析计算(如回归分析、时间序列等方法),以位移为研究对象,可以明显看到由于观测误差εij影响,致使回归模型在此刻的输入数据δij中含有εij-εi,j-1误差;如果建立“事件”模型,根据需要,调整位移速率的阈值v0,使得第i监测点在j时刻的“事件”状态保持一致,不受原始观测值含有的误差之影响。例如调整阈值v0为

v0的调节范围在,可以始终让第i监测点在j时刻的“事件”状态为eij=0作为模型输入,则可以有效减弱原始观测误差σ的影响。

由于各个观测值含有的真误差εij未知,则在调节阈值v0范围时,参考式(7),可以取2倍于平均速率的中误差作为调节限差;由于每个监测时期的观测精度σij及时间间隔δtij不同,所以调节限差εv大小,可以取

式中:

为了使调节限差的结果不至于影响所有监测点的情况,需要严格控制调节限差εv大小,可以取

3 算例分析

3.1 事件模型的建立

结合我国某大坝为例[8],取该变形体上某部位的16个监测点数据为例,由于观测该监测部位的视线不得不穿过水面,致使观测结果受水汽的影响较大,观测数据含有大量的噪声,如图1所示。通过对原始观测数据序列的拟合,计算得到16个监测点各自在x方向的观测精度,如图2所示。

图1 监测点位移过程线Fig.1 Process of disp lacement atmonitoring points

图2 原始观测中误差Fig.2 Mean square errors of the original observations

根据式(2)计算得到平均位移速率阈值v0=1.90 mm/d;由于观测值的真误差无法得到,故采用式(9)计算可以调整限差εv的大小。最大天数间隔为max{δtij}=14 d,根据图2,最小原始观测中误差min{σij}=3.26 mm,根据式(10)得到εv=±0.66 mm/d。

为了书写及表述方便,选取监测点P3~P7这5个监测点自2003年4月11日至2004年7月11日间部分数据。位移数据及平差后各监测时刻的真误差估计值如图3所示。

图3 位移过程线及各时期真误差估计值Fig.3 Displacement process and estimated true errors in each period

在没有受到观测误差影响前,根据式(3)及平均位移速率阈值v0=1.90 mm/d,得事件矩阵ME;如果考虑每个监测时刻观测误差的影响,顾及式(6),其事件矩阵为M′E;根据式(10),调节εv大小,本例前面计算得到εv∈[-0.66,0.66],根据式(8)适度调整阈值v0=1.90+0.22=2.12 mm/d,据此计算事件矩阵M″E,如图4所示。

图4 各计算结果的状态矩阵Fig.4 Statusmatrices in three form s

比较图4中的3个事件矩阵可以看出,由于受到原始观测误差的影响(如图3中的“Err”线所示),致使事件状态矩阵M′E与ME有较大差异,如果按照事件状态矩阵M′E进行分析计算(如回归分析、时间序列等),那么计算结果会受到原始误差很大的影响;而通过“事件”模型调节εv大小,适度调整阈值v0,得到事件矩阵M″E,可以发现,事件矩阵M″E与ME仅存在少量差异,在进行Cox回归模型计算时[6],分析结果受原始误差的影响将会得到有效的控制。

3.2 Cox回归模型计算结果

仿照图4数据变换过程,对图1的观测序列计算事件状态矩阵,分别将事件状态矩阵的3种计算结果ME,M′E和M″E代入Cox回归模型计算[6,9],结果如表1所示。

表1 3种不同事件矩阵的Cox回归模型计算结果Table 1 Results calculated by Cox regression model from three different statusmatrices

从表1可以看出,由于观测序列含有偶然误差的影响,致使M′E矩阵代入Cox回归模型计算得到的风险比超过ME的计算结果,而经过模型参数调节得到的M″E矩阵,其回归模型计算结果,接近M′E矩阵的Cox模型计算结果,即调节模型参数后的事件矩阵,减弱了原始观测数据中误差对Cox回归模型计算结果的影响。

结合“风险比”的解释意义,实际上,随着监测时间的推移,该变形体整体的位移速率呈逐步下降的趋势,按照M′E矩阵(即受原始数据观测误差的影响)的计算结果,平均约递减92.0%;按照M″E矩阵(即调节事件模型参数后)的计算结果,平均约递减95.8%,接近以ME矩阵(即原始数据不含有观测误差)为准的计算结果96.5%。

4 结 语

对于变形观测工作来讲,由于受观测条件影响(如水汽较大),致使观测结果不可避免地受到一定影响。可以建立“事件”模型对原始数据进行转换,把原始监测数据转换成“事件状态”数据,通过调节模型参数、速率阈值参数的大小,在一定程度上可以减弱观测误差带给Cox加固归模型的影响,能够进一步提高计算结果的准确度。

[1] BONALDIP,FANELLIM,GIUSEPPETTIG.Displacement Forecasting for Concrete Dams via Deterministic Mathematical Models[J].InternationalWater Power andDam Construction,1977,29(9):42-45.

[2] FANELLIM,GIUSEPPETTIG.Techniques to Evaluate Effects of Internal Temperatures in Mass Concrete[J].InternationalWater Power and Dam Construction,1975,(6):162-168.

[3] 文鸿雁,张正禄.小波分析与傅立叶变换相结合在探测周期性变形中应用[J].测绘通报,2004,(4):14-16.(WEN Hong-yan,ZHANG Zheng-lu.Detection of the Periodical Signal in the Deformation Analysis with Wavelet and Fourier Transformation[J].Bulletin of Surveying and Mapping,2004,(4):14-16.(in Chinese))

[4] 陈 刚,赵 斌,胡友健,等.无电离层延迟组合GPS数据的小波预处理方法研究[J].测绘学报,2009,38(6):477-481.(CHEN Gang,ZHAO Bin,HU Youjian,et al.Research on GPS Pre-processing Method for Ionosphere-free Combination Data Using Wavelet[J].Acta Geodaetica et Cartographica Sinica,2009,38(6):477-481.(in Chinese))

[5] PURER E,STEINER N.Application of Statistical Methods in Monitoring Dam Behavior[J].InternationalWater Power and Dam Construction,1986,(12):33-35.

[6] COX D R.Regression Models and Life Tables(with Discussion)[J].Journal of the Royal Statistical Society,Series B,1972,(34):187-220.

[7] MARUBINI E,VALSECCHIM G.Analyzing Survival Data Form Clinical Trials and Observational Studies[M].Chichester,UK:John Wiley&Sons,1994.

[8] 赵 卿.大坝变形分析多测点统计模型的应用研究[D].武汉:武汉大学,2010:92-100.(ZHAO Qing.Research and Application of the Multi-point Statistical Model on Dam-deformation Analysis[D].Wuhan:Wuhan University,2010:92-100.(in Chinese))

[9] 赵 卿,黄声享.一种分析大坝整体位移变化规律的新方法[J].武汉大学学报(信息科学版),2009,12(34):1419-1422.(ZHAOQing,HUANG Sheng-xiang.A Way for Overall Analysis on Dam’s Displacement[J].Geomatics and Information Science of Wuhan University,2009,12(34):1419-1422.(in Chinese) )

(编辑:曾小汉)

Impact of Reducing Observation Errors on Regression M odel

ZHAO Qing1,2,ZHOU Xing-dong1
(1.School of Geodesy and Geomatics,Jiangsu Normal University,Xuzhou 221116,China;2.Jiangxi Provincial Key Lab for Digital Land,Fuzhou 344000,China)

Errors of deformation monitoring data has great impact on the modeling of the data sequences.A new model called Event-Model,which changes the expression of the original observation data,was proposed.First,the deformation rate at each monitoring point in the original data was calculated,and then the rates were divided into several ranges.By converting the original observation data into events,the numerical data were divided into categorical datawhich were composed of thematrix,named EventMatrix in this paper,which could be fitted to the Cox regression model.Each group of categorical data contained certain ranges.On the basis of experiences and the actual situation such as the average displacement rate calculated previously,parameters in the“Event-Model”were adjusted to avoid or weaken the effect of observation errors.Themean square error of the observation data could be treated as adjusted parameters instead of unknown true errors in practice.The influence ofmonitoring data containing observation errors on the follow-up Cox regressionmodel can be reduced to some extent and improve the accuracy of the calculation results.

observation errors;deformation monitoring;eventmodel;Cox regression model

TV698.1

A

1001-5485(2012)12-0020-04

勘误启事

10.3969/j.issn.1001-5485.2012.12.005 2012,29(12):20-23

2011-10-08;

2012-02-20

江苏师范大学博士学位教师科研支持项目(10XLR23,10XLR16);江西省数字国土重点实验室开放研究基金资助项目(DLLJ201203)

赵 卿(1983-),男,江苏徐州人,讲师,博士,主要从事变形监测与灾害预报的研究,(电话)18752128985(电子信箱)zhaoqing7@QQ.com。

《长江科学院院报》2012年第10期《纤维混凝土在水利工程中的应用》一文中的作者单位:“b.流域水利河南省高校工程技术研究中心”应为“b.小流域水利河南省高校工程技术研究中心”(P114)。特此说明,并对该文作者致歉。

猜你喜欢
计算结果监测点阈值
天津南港LNG接收站沉降监测点位布设
抚河流域综合治理监测布局优化
全站仪极坐标法监测点稳定性分析方法研究
不等高软横跨横向承力索计算及计算结果判断研究
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于自适应阈值和连通域的隧道裂缝提取
比值遥感蚀变信息提取及阈值确定(插图)
趣味选路
室内表面平均氡析出率阈值探讨
我省举办家畜血吸虫病监测点培训班