基于互联网信息快速估计汶川地震有感范围

2014-12-14 01:21帅向华胡素平郑向向
地震地质 2014年4期
关键词:汶川插值函数

帅向华 胡素平 郑向向

1)中国地震台网中心,北京 100045

2)中国地震局地震预测研究所,北京 100036

3)中国国土资源航空物探遥感中心,北京 100083

0 引言

据中国工业和信息化部发布的数据,截至2011年底,中国成为世界上网民人数最多的国家,拥有超过5.13亿网民。互联网的发展推进了信息的透明化,也提供了新的信息获取途径(帅向华等,2013)。随着国家对公共安全的逐步重视和公众对公共安全的主动参与,当地震等灾害性事件发生以后,互联网对其反应也愈来愈快,而且,信息的可靠性也愈来愈强。例如,昆仑山口西地震、江西九江地震、四川汶川地震、青海玉树地震等,互联网逐渐表现为重要的信息渠道。但是,到目前为止,还没有相关研究把这些信息渠道作为地震应急的重要信息来源。因此,充分利用互联网资源,研究基于互联网技术、空间定位技术,获取、分析地震灾害相关信息和信息空间化等相关方法和技术,可以为地震灾害速判提供动态修正依据,为应急工作提供有效的决策支持信息。本文重点研究如何利用互联网上的信息来进行地震有感范围的快速确定。

目前,关于震后有感范围的确定尚无有效方法,信息来源主要采取电话收集方法,有感范围的表达也仅限于对涉及的部分区域作一些点状文字描述,导致震后有感范围的发布处于缺失状态。而实际上,震后有感范围的快速确定对于应急救灾、灾民疏散、平息地震谣言、安抚社会公众具有重要的作用。本文通过对互联网上公众对地震灾害的快速反应信息进行分析处理、空间定位,并且对信息按照感觉强弱分类为无感、有感和强有感,迅速确定地震有感和强有感的范围,特别是强有感范围可以初步作为地震灾区的大致范围,为地震应急初期提供第一时间的灾情信息。

1 互联网数据收集

地震发生之后,互联网上很快汇集了大量有感信息,这些有感信息可以为快速获取地震有感范围提供基础数据。通过对互联网上的地震信息进行分析,发现这些有感信息主要来自社区论坛。本文收集了汶川地震后3h的4 515条数据来进行分析研究,数据来源于天涯社区。表1中列出汶川地震后天涯社区的部分有感信息。

表1 从互联网收集的汶川地震(2008-05-12 14:28)有感范围信息Table 1 Information about the felt area of the Wenchuan earthquake(2008-05-12 14:28)from the Internet

2 数据分析

2.1 信息发布的时间特征分析

汶川地震后3h收集的4 515条有感信息按时间间隔15min来进行统计,如表2和图1所示。

从表2和图1可以看出,震后15~75min期间,互联网上发布的有感信息最为集中,而其他时间段发布的有感信息则较为均衡。

对震后3h的4 515条数据时间发展进行信息量累计分析,发现震后30min信息量趋于不再明显增长。因此,选择汶川地震后3h的网络有感信息即可基本反映互联网上针对该地震的有感状态反应。

图1 震后每隔15min的有感信息数量分布Fig.1 The quantity distribution of the felt information after the earthquake in every 15 minutes.

表2 震后3h有感信息数Table 2 The quantity of the felt information within 3 hours after the earthquake

2.2 信息发布的地域特征分析

收集到的震后3h的4 515条有感信息中,带有地名信息和有感描述性语言的有2 289条。通过对这2 289条数据按照地名进行分类和提取,发现这些信息中共涉及到199个地名。图2给出了这2 289条有感信息的空间分布和数量分布。

按照每个地名包含的有感信息条数进行统计,其中有感信息较多的前20个地名如图3。这20个地名有3个直辖市、15个省会城市和其他大中城市深圳、桂林。由此可见,有感信息数量的多少与地域的城市化发展程度存在必然的联系,即地域越发达,互联网的普及发展越快,网民的数量和素质也较高。

2.3 信息的有感强度分析

对带有地名和有感描述的2 289条信息,根据有感描述信息特点进行分类,可分为无感、有感、强有感3类。其中,无感信息226条,涉及地区32个;有感信息1 498条,涉及地区121个;强有感信息565条,涉及地区46个。将199个有感地区和全国基础地理地图进行叠加分析,如图4所示。图4中,红色点表示强有感,黄色点表示有感,绿色点表示无感。有感信息数呈明显的东、西不对称分布,西部为较不发达地区,并且人口密度小,而东部比较发达,人口密度也很大。从整个分布情况来看,强有感地区的分布还是很集中的,将199个信息点和汶川地震调查烈度分布图对比分析,26个强有感信息点包含在汶川地震烈度Ⅵ度以上范围,其他18个分布在靠近烈度Ⅵ度包络线附近,其中分布在浙江、湖南等地强有感数据点是由于信息提供者所处的位置及个体感官差异所造成的,这些数据在后续的数据处理中作为数据异常点剔出。由此可见,通过强有感信息点的分布可以大致给出汶川地震的破坏趋势和范围,这个范围比烈度Ⅵ度区稍大一些,如图4所示。

3 有感范围计算

3.1 有感范围计算方法的确定

图2 汶川震后3h内199个地区有感信息数Fig.2 The statistics of the quantity of felt information reported from 199 regions within 3 hours after the Wenchuan earthquake.

图4 汶川地震后3h的有感强度数据点分布(地震烈度资料据中国地震局,2008)Fig.4 The data point distribution of felt intensity within 3 hours after the Wenchuan earthquake(Seismic intensity data is from China Earthquake Administration,2008).

地统计学是以区域化变量理论为基础,以变差函数为主要工具,研究在空间或时间分布上既有随机性又有结构性变化的自然现象的科学(于晓艳等,2011;刘爱利等,2012)。其核心为通过对采样数据的分析及对采样区地理特征的认识,来选择合适的克里格(Kriging)插值,利用观测值之间的空间自相关性预测未采样点的区域化变量值并创建统计表面。地震灾害的分布本身具有空间相关性,本文从互联网上采集到的有感信息点的分布反映了地震波在各个区域的传播所造成的影响,这些信息点分布在不同的空间地域,具有空间相关性。因此,在对这些信息点进行曲面拟合时选用地统计方法要优于传统的统计学插值方法。

克里格插值是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法。其实质是利用区域化变量的原始数据和变异函数的结构特点,对未知样点进行线性无偏最优估计。无偏是指偏差的数学期望为0,最优是指估计值与实际值之差的平方和最小(刘爱利等,2012)。

3.2 数据预处理分析

地震发生后各地反馈的有感数据很多,这就不可避免地会出现数据冗余和异常数据点。对于预测表面,数据冗余以及异常数据点的出现可能引起多方面的不利影响,包括半变异建模和邻域分析的取值等。因此,选取有效数据点进行空间插值就很有必要。

选取有效数据点的过程即剔除或改正冗余数据和异常数据点的过程。对于数据冗余问题,首先生成灾情采样点分布图,然后将同一位置附近出现的多个灾情采样点只保留一个点值,将其余点值进行剔除;对于数据异常点,则采用聚类和熵的方法生成Voronoi图来识别可能的异常点,熵值是量度相邻单元相异性的指标,通常距离近的事物比距离远的事物具有更大的相似性,因此,局部的异常点可以通过高熵值的区域识别出来。借助ArcGIS生成Voronoi图,图中颜色和周围所有邻接面域颜色皆不同的面域所代表的点可能就是数据异常点,ArcGIS会通过斜线将这些面域标记出来,可以将被标记的面域所包含的点剔除,以获得空间插值所需的相关的数据(郑向向,2012)。

据此,对图2中分布在199个地区的2 289条有感数据进行预处理,从中选择了193个地区的193条数据进行灾情拟合来获取区域的受灾情况。本文仅列出部分地震有感数据举例说明,如表3所示。其中数据预处理后剔除的数据为湖北宜城、湖南澧县、吉首、益阳和衡阳以及浙江省的龙泉共6个地区数据异常点。

对数据集分别选用确定性插值方法(反距离权方法、径向基函数方法)和地统计学插值方法(克里格插值)进行了空间插值,并对其结果进行比较分析。利用ArcGIS的地统计学模块进行插值分析,对于确定性插值,需要首先在ArcGIS提供的地统计学模块下计算插值所需的最优权重,然后按确定的权重完成对数据的插值;对于地统计学插值,则需要对数据进行正态分布检验、数据总体趋势分析和变异函数确定。

表3 互联网上发布的汶川地震有感强度部分数据Table 3 Part of the felt intensity data of Wenchuan earthquake published from the Internet

变异函数的计算一般要求数据符合正态分布,否则可能存在比例效应。使用ArcGIS地统计分析模块提供的检验工具对数据进行正态分布检验,若数据的直方图呈钟形曲线,则表示该数据集呈正态分布(ESRI,2011;郑向向,2012)。图5表明汶川地震有感强度数据集呈正态分布。

为了去除数据集本身存在的趋势,采用ArcGIS地统计分析模块的“趋势分析”对数据集进行了趋势分析。趋势分析将研究区域平面上的采样点转化为以属性值为高度的3维视图。趋势分析图中的每一根竖棒代表1个数据点的值(高度)和位置。将这些点投影到一个EW向和一个NS向的正交平面上。通过投影点可以做出1条最佳拟合线(一个多项式),并用它来模拟特定方向上存在的趋势(王艳妮等,2008;李璐等,2011)。在图6中,蓝色线和绿色线呈倒置的U形,由此可见数据集在2个方向上存在很明显的趋势,所以选择1个二阶多项式对全局趋势进行拟合,在随后进行表面预测时这些趋势将要被剔除。

地统计学分析的核心是根据样本点来确定研究对象(某一变量)随空间位置的变化规律,以此推算未知点的属性值,这个规律就是变异函数(张仁铎,2005)。半变异函数图可以反映数据的相关程度,只有数据空间相关,才有必要进行空间插值,半变异函数模型决定了空间插值的精度。利用 ArcGIS的“半变异函数/协方差云”工具对数据集的空间相关性和方向影响的分析结果如图7所示。半变异函数/协方差云图显示该数据集存在一定的空间自相关,并且SW方向上相距1.7个步长单位的位置比其他方向上的位置的差异更大,这种现象就是各向异性,这就要求在对表面进行插值时,要选取考虑到各向异性的半变异函数模型(汤国安等,2006)。

图5 汶川地震有感强度数据集直方图分布Fig.5 Histogram distribution of felt intensity dataset of the Wenchuan earthquake.

图6 汶川地震有感强度数据趋势分析Fig.6 Data trend analysis of felt intensity dataset of Wenchuan earthquake.

图7 汶川地震有感强度数据半变异函数/协方差云函数图Fig.7 Semivariogram/covariance graph of felt intensity dataset of Wenchuan earthquake.

3.3 汶川地震有感范围插值结果分析

基于3.2中对数据所做的预处理及探索性分析,确定使用克里格方法,其中插值模型为球形插值,步长大小为1.7个步长单位,步长组数为12对。为了得到最优插值结果,从2个指标评价了不同的插值方法,一是插值精度,二是插值结果与实际灾情的吻合程度。

采用交叉验证方法对插值方法进行精度比较,该方法对最优模型的要求是:标准平均值(Mean Standardized)最接近于0,均方根预测误差(Root-Mean-Square)最小。从表4得知,克里格插值方法得到的插值结果标准平均值为0.006 5,与反距离权插值和径向基函数插值方法比较该值最接近于0,克里格插值方法的均方根预测误差也是3种方法中最小的。由此可见,克里格插值方法在对有感强度数据进行插值时比确定性插值的2种方法在插值误差上具有一定的优势。

表4 各插值方法交叉验证结果Table 4 Verification results by different interpolation methods

另一方面,将插值结果与汶川地震实际灾情进行对比,结果表明,克里格插值结果(图8)比反距离权插值和径向基函数插值结果更符合实际灾情分布①中国地震局,2008,2008年5月12日四川汶川8.0级地震灾害直接损失评估报告。。根据图8统计各区域的有感强度(表5),可以快速掌握各区域的大致受灾程度。

图8 汶川地震有感强度分布图Fig.8 Felt intensity distribution of Wenchuan earthquake.

表5 不同有感强度的分布区域统计Table 5 Statistics of regions with different felt intensity in China

从图8可以看出,强有感范围略大于汶川地震烈度Ⅵ度区的外包络线。经统计,根据互联网信息插值得到的强有感范围比烈度Ⅵ度区以上区域面积约大17×104km2。因此,强有感范围可以作为初步的灾区范围确定依据,为地震应急提供第一时间的灾情信息。

综上所述,地统计学插值比确定性插值方法更适合于灾情的插值计算,尤其是由克里格方法得到的有感范围与实际受灾范围吻合度较高,插值精度也是3种插值方法中最高的。但也存在部分区域与实际灾情分布有出入,即粤、浙、沪等部分区域出现绿色部分被黄色部分包裹现象,主要原因是由于网络信息发送者为个体点,在反馈震感信息时看到或得到的信息有限或者其所处地理位置影响其感觉(帅向华等,2009)。

4 结论

地震发生之后,大量的地震经历者和目击者,会迅速通过互联网去分享地震经历和目击现场状况,而且随着移动终端的普及,这种现象会越来越普遍。本文收集了汶川地震后3h的大量地震灾情相关信息,提取其中4 515条有感信息,利用GIS空间分析功能,通过插值拟合面状区域得到地震有感范围和强有感范围。所确定的有感范围与地震实际影响范围比较吻合,而强有感范围比汶川地震的Ⅵ度烈度区范围略大,如果结合专家经验对插值结果进行人为修正,则可以基本确定Ⅵ度烈度区的外包络线。因此,本文的研究方法为地震有感影响范围的快速获取和地震烈度的快速修正提供了很好的思路。

猜你喜欢
汶川插值函数
云上远眺新汶川
二次函数
第3讲 “函数”复习精讲
二次函数
函数备考精讲
基于Sinc插值与相关谱的纵横波速度比扫描方法
健康中国的汶川实践
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
Blackman-Harris窗的插值FFT谐波分析与应用