杨希
摘要:本文根据吉林省的相关地质灾害数据(近10年),对该地区的地质灾害风险评价问题进行了分析,采用的是统计方法,在此基础上,对区内容易发生地质灾害的地段进行了划分。
关键词:风险评价;地质灾害;系统聚类;阈回归;权重
1、加权聚类划分方法划分灾害易发区
1. 1加权聚类分析模型的建立
设有一个容量一共为n的样本数据,其中的每一个样品都需要测得它的p项指标,从而就可以得出其原始数据阵为:
其中,xij (i=1,....n.j=1...,n)代表的是第i个样品中,第j个指标的实际观测数据。那么,为了能够精确的计算出Xi样品点和Xj样品点之间所具有的相似程度值,同时也为了能够更好、更精确的反映出每一项指标对于这种相似程度的影响不同,我们还选用了马氏距离公式,这种公式是带有加权系数的,即:
在具体实施的时候,需要先把n个样品自然的分成一类,然后再逐次的缩小,这个时候,离差平方和也就会不断的增加,然后,再选择使T的增幅最小的2个类别进行合并,一直到我们需要的所有样品都最后归为1类才停止。
1. 2权重如何确定
1)对于所有的指标来说,要与研究的目标来进行紧密的相关分析,并要以具体的相关系数值来作为其权重所具有的初始值,即
2)对第一项指标进行适当的调整为,如果这个时候,分类的精确度就出现了下降,则进行反方向的调整,反之,就继续进行同方向上的调整,一直到能够达到允许的精度为止;
2、对灾害的影响因素进行阈回归分析
在这个过程中,首先要判断出各个不同的因素对于灾害的具体影响形式,然后再运用所建立起来的阂回归模型,对不同的影响要素在不同规模的数值之下所造成的灾害特点进行分析,最后再选择一个最为适当的方法,最大程度上来避免多重共线性、异方差和序列相关的出现,这样就可以在残差的分析基础上来最终确定出模型的具体结构和参数。
2.1确定出引起灾害的最主要要素
在选择因变量的时候,以灾害点的密度作为主要考虑因素。首先要计算出zhd和fg之间所具有的相关系数,然后再计算出zhd和ln(fg+l)之间的实际相关系数值,除此之外,zhd和1/fg+1、zhd和fg的平方之间的相关系数值也需要计算出来。通过这些相关系数值之间的比较就可以很容易的看出:zhd和fg之间实际上是属于线性相关的。
2.2基于数值规模的阈回归模型的建立
为了能够反映出各种不同的因素在不同的数值规模下,对于灾害的不同影响程度,通常要以虚拟变量的形式来引人相关的阈值。而灾害点的密度再进行取值的时候,可以划分成4个区间,因此这时候就需要引进3个不同的虚拟变量,以Dj(j=1,2,3)来表示;其中的D1、D2和D3分别代表不同的灾害点密度下所具有的状态。于是就可以建立包含了所有可能的解释变量的模型:
2. 3模型估计
一般我们要避免在各个解释变量之间可能出现多重共线性的问题,通常采用的方法是逐步回归分析,这种方法同时也可以很好的选择出对于灾害密度具有最为显著影响的几个因素。由于在模型当中使用了很多的截面数据,因此对于各种不同类型的区域来说,它们在地质条件上存在的差异性往往就可以造成灾害的波动状态,这个时候就可以采用加权最小二乘法(WLM)估计模型来消除这种异方差的现象,结果见表1。
根据我们以上的分析,最后就可以确定出最终的估计模型结构,具体来说是一个阈回归ARCH的形式,而残差的检验结果也表明了其状态已经转变成了正态白噪声,.
而模型的参数估计结果也可以参见表2中的数据。
在表2当中,回归模型的R2为0. 992,调整后的R2可以达到0. 999,AIL统计量与SC统计量则分别是2. 324和2. 376,因此拟合的效果是非常好的,另外,DW的统计量也达到了2. 065,已经十分接近2,因此也不存在序列相关的现象。
结束语
综上所述,采用阈回归模型可以对发生不同灾害程度之下的各个相关影响因素做出更好的区分,同时我们也对相邻单元的具体灾害发展的态势进行了拟合,可以发现拟合的精度也能够达到99. 99。因此,选择一个合理的统计方法十分重要,这对于地质灾害在风险评价方面的效果会非常显著。
参考文献
[1]马寅牛,张业成,张春山,等.地质灾害风险评价的理论与方法[J].地质力学学报,2004 , 10(1) :7-18.
[2] 张春山,张业成,马寅牛,等.区域地质灾害风险评价要素权值计算方法及应用—以黄河上游地区地质灾害风险评价为例[J].水文地质工程地质,2006, 33(6):84-88.
[3] 尚敏,陈剑平,王征亮,等.向家河大桥库岸地质灾害危险性分区的可拓学评价[J].岩上力学,2007, 28(11): 2445-2450.endprint