孙静 李亚龙 万杰 王伟
摘要:随着互联网经济的快速发展,大数据技术成为信息化时代的热点。大数据应用的本质是数据和数据分析在业务活动中的具体表现,如何将大数据平台和技术应用到地震科研学习中,提高预测水平,是地震行业迫切需要解决的问题。
关键词:互联网经济;大数据技术;地震科研
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)35-0003-03
Abstract:With the rapid development of Internet economy, big data technology has become a hot topic in the information age. The essence of large data application is the concrete performance of data and data analysis in business activities. How to apply large data platform and technology to seismic scientific research and learning to improve the prediction level is an urgent problem for the seismic industry.
Key words:Internet Economy; Big Data Technology; Earthquake Research
多年以来地震预测几乎完全依赖对震频的监测,并在可能发生类似地震时以此作为预测的依据。虽然还有很多潜在的地震预警信号,比如水温、动物异常,但是预测的准确率还是太低了。随着大数据技术的兴起,开启了一种新的地震预报形式,通过基于大数据技术的分析,把某场地震的所有数据和其他地震关联起来,可以极大提高预测准确度,构建出精度极高的地震活动预测模型。
1 大数据及相关技术介绍
1.1 大数据简介
大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。它的特点是数据量大、数据种类多、 要求实时性强、数据所蕴藏的价值大。在各行各业均存在大数据,但是众多的信息和咨询是纷繁复杂的,我们需要搜索、处理、分析、归纳、总结其深层次的规律。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。大数据可应用于各行各业,将人们收集到的庞大数据进行分析整理,实现资讯的有效利用。总的来说,大数据是对大量、动态、能持续的数据,通过运用新系统、新工具、新模型的挖掘,从而获得具有洞察力和新价值的东西。以前,面对庞大的数据,我们可能会一叶障目、可见一斑,因此不能了解到事物的真正本质,从而在科学工作中得到错误的推断,而大数据时代的来临,一切真相将会展现在我们面前。
1.2 数据挖掘技术
数据挖掘是一种技术,将传统的数据分析方法与处理大量数据的复杂算法相结合(图1),从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人們事先不知道的、但又是潜在有用信息和知识的过程。
数据挖掘的过程如图2所示。
数据挖掘的任务主要分为以下四类,如图3所示。
l 预测建模
一种基于类标号的学习方式,这种类标号若是离散的,属于分类问题;若是连续的,属于预测问题,或者称为回归问题。从广义上来说,不管是分类,还是回归,都可以看作是一种预测,差异就是预测的结果是离散的还是连续的。
l 聚类分析
就是“物以类聚,人以群分”在原始数据集中的运用,其目的是把原始数据聚成几类,从而使得类内相似度高,类间差异性大。
l 关联分析
数据挖掘可以用来发现规则,关联规则属于一种非常重要的规则,即通过数据挖掘方法,发现事务数据背后所隐含的某一种或者多种关联,从而利用这些关联来指导商业决策和行为。
l 异常检测
根据一定准则识别或者检测出数据集中的异常值,所谓异常值就是和数据集中的绝大多数数据表现不一致。
2 地震科研不断发展为大数据的应用提供了条件
2.1 密集地震观测网将地震带进大数据时代
大数据就是巨量数据,巨量数据的产生是设备和传感器从精密到简单,从笨重到智能、从昂贵到低廉、从量少到量大。在互联网时代,互联网智能技术和微电机传感器技术使地震观测设备也遵循大数据产生的规律,这完全适应了烈度速报应用和地震预警需求,从而产生了密集地震观测网,将地震行业带进了大数据时代。
(1) 地震烈度速报
在汶川特大地震发生之前,虽然我国的地震速报能在震后迅速提供地震三要素,但是还没有建立常规运行的地震烈度速报系统,因此无法提供有效的地震烈度速报图,导致不能有效进行应急救援和应急响应。当一个地震发生时,目前是能够立刻知道地震发生的震中位置、发震时间和震级大小。但是地震的发生不是在一个简单的点上,对于一个破坏性地震来说,一般都会在地下形成一个破裂带,造成地面破坏范围可能是以震中为圆点半径为几百公里之长。提供的三要素只告诉我们哪里发生了地震,却并没有提供哪个地方的震动最强烈的信息,而当破坏性地震发生时,政府却需要立即知道哪个地区的震动最强烈、破坏最严重,需要准备什么样的救援物资。这就需要地震部门能及时给出不同地区的烈度分布情况,它对抢救生命和应急救援意义重大。这就需要建立有效的密集地震监测网,获得地震以后的地震烈度速报。
(2) 地震预警
地震预警是在日本3.11地震之后被越来越多的人提起,其含义主要就是超快地震速报。因此,目前所说的地震预警就是地震警报。当某一个地方发生地震时,相对电磁波的每秒30万千米,地震波的每秒几千米要慢得多,所以人们可以将地震发生得消息用电话、手机、电视、网络、广播等迅速传播出去,这样离地震发生地比较远的,由于收到报警时地震波还未到达,这时可以采取紧急措施逃生和关闭水、电、气等,减少损失,避免次生灾害。综上所述,地震预警就是以信息技术和地震观测技术为基础的新技术。但是由于地震预警是在发生在破坏性地震之后向远处发出地震警报,从破坏性地震发生到发出警报是需要时间的,这个时间是地震波从发震处到达地震台的时间和地震台处理地震信号判断震级的时间。也就是说,虽然地震发生了,但是却不能立即发出警报,它需要地震台网收到地震信号并判定为破坏性地震时,才能发出警报。这段时间对应的S波传播距离,称之为盲区,而为了缩小盲区,也是需要建立密集的观测网。如果用传统的技术建立台站,需要巨额的投资。
(3) MEMS传感器烈度计和智能设备
MEMS技术是以智能手机开发的地震烈度计和动态地震烈度网技术,这种技术适合布设大量密集的地震观测网。
综上所述,密集的地震观测网符合大数据产生的规律,从传统精密的地震仪到简单的MEMS烈度计,从价格不菲的设备到价格便宜的MEMS设备,从精度高的仪器到智能化的设备,从稀疏少量的台站到密集的地震观测网,观测的数据从少量的数据到巨量数据。
2.2 大量的观测数据为大数据挖掘提供了基础
目前,我国的地震前兆观测网络系统是由近千个地震前兆台和三千多套观测设备组成,手段可以分为电磁、流体和形变,每个手段都有很多种观测项,而每种观测项又分为一个或多个分项,数据库中观测数据是以测量分项的形式保存下来的,因而数据的类型多样。除此之外,观测数据还呈现多型号仪器、多个台站,多个区域产出的数据并存的情况,这些组合也使得数据具有多属性的特点。这种情况导致了观测数据会出现不一致性和重复性,甚至还会存在数据比较杂乱的现象。当需要使用这些数据时,传统的方法是没办法操作的,这就需要利用大数据的挖掘技术来提取有用的数据。
另外,我国的观测数据开始于邢台地震,从最初的人工观测、模拟观测,到“九五”后的数字观测,到目前的“十五”网络化观测,经历了50年的时间,积累了大量基于时间的观测资料。但是由于存在人工或模拟读数,数据保存不是很完整,比较分散,虽然各省的地震局都在花大力气收集这些资料并采用数据库的方式统一管理,但是完整的获取这部分资料仍然比较困难。这也必须引入数据挖掘技术提炼出有效的数据资料。
3 大数据在地震科研中的作用
3.1 数据处理简单化
在传统的小数据时代,数据处理算法的研究在数据限制无法突破情况下越来越深入,其算法也日渐复杂。当数据量以指数级往上增长时,大数据的简单算法准确率大幅提高,这时就比小数据的复杂算法更有效。
3.2 大数据使快速决策成为可能
以前地震台网处理数据和确定决策都会非常慎重,都要通过分析和收集数据来验证得到的结果;如果一些数据存在问题,导致原先的结果可能是有问题的,这时决策就要非常慎重。所以在这样的情况下,小数据时代要得到快速、有效的决策结果是不可能的。
而以密集台网为基础的大数据,可以准确而简单的知道地震发生的时间、地点和震级而无须重复检查和复核,在这种情况下地震工作人员能快速做出决定,地震预警可以在几秒之内发出,地震烈度速报可以在几分钟之内发出。以此为基础,应急指挥部就能快速决策以减轻破坏性地震的灾害和抢救生命。
3.3 大数据催生了地震新业态和新模式
大数据的最大贡献之一就是使人类通过依靠计算模型做决定转变成依靠数据做决定,从而催生了新业态和新的工作模式。
(1) 密集的地震观测网带来的改变和創新
通过密集的地震观测网可以得到大量的中小地震观测数据,以中小地震为基础生成地下动态结构反演成像,每次地震成像就形成了动态“地下云图”,可以动态的监视地下结构的变化。目前,地震预测研究认为地震预报的战略之一就是探索地震形成的机理,这就需要地震工作者动态的监视地下变化。这是以前稀疏台网产出的小量数据所无法实现的,这就需要密集的观测台网输出的大数据提供数据基础。
(2) 大数据为地震前兆的探寻提供新的方法
现代互联网和新技术的迅速发展,发明了各种新的传感器以及先进的信息技术,为地震前兆的研究提供了廉价的设备,为密集观测提供了条件。密集的观测产出大量的数据,因此这些巨量数据也将地震前兆观测带进了大数据时代,这时探寻前兆观测和地下变化以及地震之间的关联都会有新的突破,将推动地震科研的创新。
(3) 大数据给地震应急救援提供基础
目前兴起的“互联网+地震”,科研产生地震互联网大数据,,它可以又快又准确地得到和地震有关的数据信息,大大加快了破坏性地震的应急和救援时的速度、能力。
(4) 物联网大数据在地震中的应用
物联网是新一代信息技术的重要组成部分,其用户端扩展和延伸到任何物品与物品之间,实现物品之间的通信和信息交换,可以源源不断的收集数据、产出数据,一切都可以数据化。通过物联网上收集的大数据可以发现和地震现象之间的关联,得到地震学的新发现,为地震研究带来了新的发展前景。
4 结论
大数据是多变、大量、高速的信息,它能促成更强的决策能力、洞察力和最佳处理,为地震预测、地震应急提供了一种全新的技术和思路。利用大数据的特性,推进技术融合、数据融合、业务融合,实现跨地域、跨部门、跨业务的协同管理和服务,更好地开展地震前兆观测工作,提高地震预测的准确性。
参考文献:
[1] 王秀英,张玲,张聪聪.探讨地震前兆观测中的大数据挖掘与应用[J].震灾防御技术,2015(1):39-45.
[2] 刘军.大数据处理[M].北京:人民邮电出版社,2015.
[3] 潘希. 2017 年大数据发展趋势十大预测发布[N]. 中国科学报,2016-12-13(4).
[4] 张晁军,陈会忠,李卫东,等. 大数据时代对地震监测预报问题的思考[J]. 地球物理学进展,2015,30(4):1561-1568.
[5] Marx V. Biology: the big challenges of big data[J]. Nature,2013,498(7453):255-260.
[通联编辑:王力]