张勇,赵学志,肖爽
基于通信大数据的地震影响初步判断*
张勇,赵学志,肖爽
(上海市地震局,上海 200062)
破坏地震发生之后,在最短的时间内,判断地震可能造成的有感范围、极震区范围,对地震应急工作的开展是至关重要的。历次地震中,多次发生地震影响范围的判断失误,甚至破裂方向出现巨大偏差,大大影响震后应急工作的开展。主要介绍通过通信大数据判断大致的地震破裂方向、有感范围和极震区范围的方法,为震后应急提供比较准确的救援支持。
破裂方向;有感范围;极震区;通信大数据
破坏地震发生之后,前期的数小时内,外界得不到灾区任何信息,我们称之为黑箱期。黑箱期内,我们需要快速判断破裂方向、有感范围和极震区,提供给应急救援队伍,使其快速进入地震破坏最严重的区域开展地震应急救援工作。
在历次地震中,黑箱期内多次使用活断层判断影响场方向,但是因为活断层未完全探明或者隐伏断层的存在,这样的判断方法出现了很大的偏差,如鲁甸地震方向判断为北东向,实际为北西向;景谷地震方向判断为北东向,实际为北西向。因影响场判断的错误,灾害评估也因此出现了巨大的偏差,应急救援队伍甚至前进的方向都出现了错误,导致这几次地震救援效率大大降低,也使人民的生命和财产损失更加巨大。因此,如何在黑箱期内,迅速判断地震的破裂方向、有感范围和极震区是地震发生后的重中之重[1]。我们之前使用传统的根据破裂带判断影响场的方法容易出现巨大错误,因此我们急需寻找一种更加可靠的方法,迅速判断地震影响情况,开启应急指挥技术系统[2],迅速开展应急救援,大大降低地震灾害带来的损失。
多次地震后,使用活断层的方法偏差太大。经过研究,我们发现地震发生后,移动基站的退服情况、电网的中断、手机入网中断、手机数据通信的分布与地震影响场分布情况存在很大的关系。
这些判断影响场的方法准确性比较高,但是数据的获得难度太大,移动基站数据、电网数据、手机断网数据牵涉到隐私、涉密、价格等问题,电网公司和运营商都不允许将数据提供给我们地震系统[3]。因此,我们经过多次调研,发现可以通过第三方公司获得手机数据通信大数据,该方法可靠度高,而且也能以便宜的价格获得到该类数据。
数据主要来源于第三方移动推送服务商。现在不管是安卓还是IOS系统,它们的APP软件都嵌入了各种消息SDK,推送服务商可以以一定时间间隔动态采集经过用户授权的设备、位置、搜索内容等相关信息。使用消息SDK平台的用户规模巨大,装机的SDK用户数达到百亿,覆盖数十亿终端,日常用户近十亿,在线用户数也超过了数亿。数据收集到之后,我们还需要对这些基础数据进行脏数据去除、去重、格式转换等数据清洗,再通过数据挖掘针对海量数据使用分布式计算方法进行业务逻辑处理,挖掘得到结果集。
因数据量非常大,我们采用Geohash编码[5]进行空间检索,将二维的经纬度转换成字符串,每一个字符串代表了某一矩形区域,也就是说,这个矩形区域内所有的经纬度坐标都共享相同的Geohash字符串。因此,相当于将整个上海平面均分为若干矩形方格,5位的编码可分割为10 km2的矩形块,即上海可以分成近1 000个Geohash块;而6位编码能精细到约0.34 km2,即上海可以分成近20 000个Geohash块。
当地震发生后,网络设施、电力设施、人员速度及位移等都可能受到相应的影响,这些也能在数据层上有一定的表现。此时,我们就可以通过Geohash数据块中的数据进行分析,构建模型,我们主要可以通过7个指标进行判断。地震影响判断指标关系如图1所示。
图1 地震影响判断指标关系图
地震影响判断指标为以下几个:①活跃基站数。统计某个时间切片、某个Geohash块中设备连接的活跃基站数量骤减,或者远低于之前平均水平,说明该范围发生大规模基站退服。②活跃WiFi热点数量。某个时间切片、某个Geohash块中,移动设备上报的WiFi热点数量骤减,或者远低于之前平均水平,说明该范围发生大规模无线热点断电。③无线网络联网设备数量。联网的移动设备定时上报连接状态,某个时间切片、某个Geohash块中,通过无线网络联网的设备数量骤减时,说明该范围内发生大规模无线网络断网。④汇总在线设备数量。某个时间切片、某个Geohash块中汇总在线设备数量发生骤减,或者远低于之前平均水平,说明该范围发生大规模数据阻塞。⑤平均移动速度。通过获得移动设备的位置数据,再对比前后两个时间间隔的位移,可以计算每个设备的平均移动速度。某个时间切片、某个Geohash块中整体平均移动速度骤增,或远高于之前平均水平时,说明该范围内发生大规模人群迁徙。⑥瞬时移动速度。某个时间切片、某个Geohash块中整体瞬时移动速度骤增,说明该范围内发生大规模人群快速移动。⑦异常震动设备数量。可通过移动设备加速度传感器检测第三轴方向加速度,某个时间切片、某个Geohash块中异常震动设备数量骤增,或远高于之前平均水平时,说明该范围内发生大规模异常震动。
将上海市划分为成百上千个Geohash块后,对各个数据块中的数据进行收集、整理,最后再判断各项数据指标,就可以判断地震影响场的方向,大致判断地震的影响范围。
从图2可以看到,将上海分割成个Geohash块后,判断其数据指标。深灰色块代表活跃基站数、活跃WiFi热点数量、无线网络联网设备数量、汇总在线设备数量骤减,说明地震对这几个区域造成了破坏,地震烈度可能达到八度。淡灰色块代表平均移动速度、瞬时移动速度、异常震动设备数量骤增,说明这几个区域大范围人员有震感,地震烈度为四至七度。再将深灰色块和淡灰色块的范围分别连接起来,可以大致画出两个椭圆,小椭圆为极震区范围,大椭圆为有感范围。这个就是简单判断的影响场范围,而椭圆的方向就是本次地震的破裂方向。如果地震强度较大,造成的破坏也巨大,就可能出现三层椭圆的情况。外面两层椭圆和之前的情况相同,但是最内层我们无法收集到数据,说明手机通信中断,地震烈度可能达到九度或者更高。
图2 上海被分割成Geohash块示意图
本文主要介绍了通过通信大数据来简单判断地震影响场方向、范围的方法。通过将上海分割成若干个Geohash块后,再对各个块中得到的通信数据进行收集、整理、判断之后,根据连接的基站数、终端位移等条件判断并显示,简单、准确地给出地震的三个影响程度,判断地震影响场的方向。地震影响范围和影响场范围确定之后,地震应急救援人员就能第一时间赶到地震破坏最严重的地方开展救援工作,大大提高应急救援工作效率和准确率,加强地震工作能力,最大限度地减轻地震灾害给人们带来的损失。
[1]程显洲.基于AHP与差异权重聚类的地震灾害快速评估模型研究[D].兰州:中国地震局兰州地震研究所,2013.
[2]姜立新,帅向华,张建福,等.地震应急指挥管理信息系统的探讨[J].地震,2003,23(2):115-120.
[3]马犇,张洁,何琳,等.市级地震应急指挥技术系统建设规范研究[J].电脑编程技巧与维护,2014(18):4-5.
[4]张勇,王小明,程显洲.上海地震灾害情景构建数据库建设[J].地震地磁观测与研究,2018,39(1):154-158.
[5]金安,程承旗,宋树华,等.基于Geohash的面数据区域查询[J].地理与地理信息科学,2013,29(5):31-35.
2095-6835(2018)20-0043-02
P315.9
A
10.15913/j.cnki.kjycx.2018.20.043
上海市科学技术委员会科研计划项目(编号:18DZ1200500);上海市地震局科技专项(编号:2018专 4);大中城市地震灾害情景构建重点专项(编号:2016QJGJ02)资助
张勇(1986—),男,上海人,本科,工程师,主要从事地震应急工作。
〔编辑:严丽琴〕