基于大数据的地质资料信息化发展

2018-01-30 16:35刘春娥
电子技术与软件工程 2017年15期
关键词:数据量资料数字

刘春娥

摘要:在当前大数据时代的背景下,地质数据海量数据的发现和提取难度加大,地质数据信息的开发将面临信息开发和知识服务的双重挑战。对大数据中地质数据及其应用工作,面临新时代下地质资料管理的复杂背景,切实强化大数据信息化研究,进行地质资料管理,实现合理、有效的针对性分析,挖掘具有内在价值的地质资料,使得地质资料管理由被动向体现知识服务的转变,能够以更充分、更有效利用地质资料,最终为社会发展提供更有力的支持和服务。

【关键词】地质大数据 地质资料 信息化发展

地质资料的数字资源主体是地质调查工作形成的各种资料数据,这是一种不同的数据格式,数据是地质工作者的辛勤工作的结果,针对地理、地质环境变化的记录,是社会和国家安全的重要信息资源,包含难以估量的社会价值和经济价值。伴随着互联网和信息技术的发展,大数据越来越受到人们的关注和重视。来自大数据的信息风暴正在改变我们的生活和工作,并迎来一个变革的重大时代,这将带来思想和管理的变革。在大数据的地质数据信息时代做好工作,实现地质数据的高效管理、信息化运作,通过合理的分析和挖掘地质资料、强化地质资料管理以及知识服务充分体现地质数据的内在价值和实用价值,进而能够更加充分、更加有效地利用地质资料,从而能够为社会发展提供更多的有效的支持和服务。

1 大数据所具备的一般特征

1.1 数据量极其的庞大

对于一般的数据量而言,大数据它们的起初的计算量是相当庞大的,这也是之所以“大”的重要原因。一般来说,它们的计量单位最起码是在PB这个层级,甚至有些数据量之大之多会一跃达到EB或者ZB层级(需要解释的是1TB等同于1024GB,1PB等同于1024TB,1EB等同于1024PB,1ZB等同于1024EB),如果换算成具体的数据量,也就是说大数据能达到100万GB、10亿GB、1万亿GB的层级,或者随着计算机技术的不断强大而呈现千倍跃升趋势。依照当今全球算得上权威的一些具备国际视野的数据公司进行的最前卫和最前沿的研究探索和统计分析结论,2013年全世界形成了0.49ZB的庞大数据量,而2014年上升为0.8ZB,到了2016年甚至越过1ZB大关,达到1.82ZB,这个是相当体量的数据量。著名的计算机公司IBM公司就数据的问题做过一个非常细微的研究和讨论,他们公司通过大量的计算和统计最后给出了一个令人震惊、但比较准确的论点,就是我们整个入类所获取的全部数据中,90%是过去两年内产生的;而且,这个公司通过预测,2020年全球产生的数据体量将达到现在的44倍之多。

1.2 价值密度低

我們知道,随着经济的快速发展以及互联网技术的广泛而又大范围的应用,物联网等新技术、新业态紧随着产生或者发张壮大成为一个新鲜的事物并得到广泛应用,而这种结果会导致全人类的信息资源越来越多,所能够形成的信息意识也越来越大,无处不在的信息和汗牛充栋的信息量无疑已经走进寻常百姓家。然而,很多信息的潜在价值和利用价值是比较低的,很多人所掌握的是比较碎片化的信息,因此利用起来比较麻烦。这就给日益发展壮大的大数据产业带来很大的难题,因为这需要计算能力超强的机器还需要非常先进的计算机算法,这样才能真正体现数据的的意义和价值。

1.3 速度快时效高

处理速度和时间效率要求非常的高,是我们当前的研究人员甚至是数据使用的公司人员对一些传统统计数据进行分析挖掘所要实现的基本要求,也是其表现出来的显著特点。我们都知道,在当前这个时代,科学技术对于数据利用发挥巨大的作用,通过一定的技术架构和比较规范的技术使用路径人类是很难一次性去处理体量庞大的数据的,也得不到相应的价值信息。通过前面的系统分析,我们可以得出一个结论,就是在大数据这个时代,对人类能力或者说头脑提出了新的挑战,也提供了前所未有的发展的空间和巨大的潜力。

2 地质资料数字资源特征

2.1 大量

信息技术的不断完善,使得各种计算机设备、物联网、云计算和云存储技术逐渐提高了记录数据的覆盖范围,并产生了大量的数据。截至2016年12月31日,全国地质数据采集信息己达139830个,占据TB存储空间的14.9%,数据量为320 TB,包括生产数据、原始数据等备份数据交换。

2.2 高速

对大数据的发展趋势是数据挖掘的前期工作,地质数据的实时数据处理的结果,完整的产品数据提供及时、有效的数字资源服务的应用程序,所以生产必须在数据处理快速高效的基础上和过程中去实现,越来越成为前端数据挖掘的同时,感知预测提前提供的直接服务对象进而实现个性化服务。

2.3 多样

在大数据时代的数据格式也越来越多样化,包括不同类型的数据,如文本、音频、图像、视频等,目前,全国地质图书馆数字资源主要包括早期的纸介质的地质数据以及相当一部分的电子数据,近年来通过信息化手段使得电子地质调查数据从包括文档数据的电子数据、数据表和数据库文件,从空间数据的类型分为矢量数据和栅格数据,等等,同时,这些专业的数据分类也很广,包括海洋地质调查、区域矿产勘查、调查,实现远程探测水环勘探,地质科研,技术研究及相关专业。

2.4 价值

数据的大量地质调查结果是投入的人力和财力数以万计,它包含了无法估量的社会价值和经济价值,所以这些珍贵的馆藏地质调查结果的数字资源进行安全有效的存储和保鲜的需要,保证数字资源本身的安全性,长期有效的使用。

3 大数据背景下地质资料信息化发展现状和面临的挑战

3.1 地质资料信息化发展的需要以及当前所处于的现状

当前发展的阶段,紧随着计算机技术以及信息技术广泛而深入的融入到社会的方方面面,各种各样的数据的产生、集聚、融合、发酵、爆发就顺理成章地引发了“大数据时代”的来临,成为我们人类面对的挑战和享受的红利。在这个高度发达、高度集中的大数据时代,地质行业以其特殊的属性和特有的数据管理、开发运用以及社会服务等方面的实践应用和探索,也会随着发生翻天覆地的变化。我们知道,地质资料数据与传统方式或者算法获得的数据资源进行比较,它具有特定的载体、特有的格式、特殊的渠道。对于一直通过手动测量、计算机简单储存运算的地质数据而言,超体量的大数据资源,无疑对数据的管理和应用提出了新的高度,带来新的挑战。一方面,地质行业对大数据有着很强的依赖性,这个是时代进步的产物,也是工业化、信息化的发展结晶,想必现在至不久的将来会有越来越多的地质资料信息服务要求。另一个方面,信息技术发展到一定的高度对管理和服务提出了更高的要求,一旦相应的配套跟不上会产生不必要的麻烦。如何有效地进行储存、查找和高效进行运用成为重要的课题。endprint

3.2 地质资料海量数据的发现与提取难度加大

在大数据这个时代,计算机硬件不断更新升级,软件资源也随之翻新配套,使得各种各样的数据量的陡然剧增,在某些方面由于现有技术和认识的瓶颈问题甚至会出现数据“涨库”的现象发生,一般意义上来说,随着大数据将越来越多的地质资料予以信息化处理而汇聚成庞大的信息化资源,这就需要相关的配套设施和措施要加速进行和迅速的推进,如果不能达到要求,但需要一个地质资料信息的时候,尽管能够进行相应的检索,但检索出来数据之多、体量之大难以进行有效的应用,甚至有些数据会被埋没在海量的干扰项之中,如何快速地进行海量数据的检索而又能够准确快速高效地找到有用的信息也成为当前所面临的问题。

4 大数据支持下的地质信息化关键要素

4.1 地质云平台

简单的讲,地质云就是借助通过一般地勘测、统计、分析所得到的地质、矿产、物理等数据,或者是通过一些高科技手段以及技术诸如遥感等信息技术所获得的数据,对地质、水文等相关环境资源以及灾害信息的相关数据的汇总和集合。比如说,当我们想了解一个区域的地形地貌、资源储备等地质数据的时候,我们会通过勘测、汇集或者通过大数据应用和服务,把能够获取到的数据进行充分的整合、传输、分析、研究、提取,建立一个基于地质数据、應用于地质服务的平台,这种平台就是地质云平台。它往往能够实现从数据到信息、信息到知识、知识到智慧的转换,为多角度、多层次的服务于生产生活打下坚实基础。

4.2 大数据应用服务系统

建立一个大型的地质数据的应用服务系统,使用3S的技术、网络技术、云计算技术等,如集成地质资料信息集成、深加工产品服务,研究和发展大型地质数据和相关分析,更方便地进行数据挖掘使得获取到的数据更有价值、有具实效性,而往往通过这样途径所获取的数据能够为我们提供全方位的生产生活服务和智能决策支持。

4.3 S技术标准体系

众所周知,在一些空间信息管理、转化、共享、应用等方面某些关键技术发挥了极其重要的基础作用,无独有偶,在地质大数据建设方面同样需要这样的一些技术和服务。而且,在数据应用过程中必须遵循一定的技术标准和行业标准,只有这样才能够使得地质大数据的应用能形成统一的格式、界面或者是安全、开放的标准,只有这样才能为数据的开放共享、安全运用奠定坚实的基础。当然,在统一、规范的过程中,会涉及一些诸如智能识别、遥感地质、描述分类、协作共享、服务协议等方面的标准和规范,要注重这些项目的统一与协调发展。同时,建立系统完善的技术标准体系,要注重包含地质资料的分类、收集、存储、互动和服务等一些基本的要素,在此基础上构建基本标准和信息共享与服务标准。

5 大数据时代地质资料信息化建设的有效策略

5.1 做好数字化转换

数字化是信息化建设的前提和基础,做好数字转换的信息,可以通过数字技术的应用给支持信息系统。中国目前有比较丰富的地质资料,只根据数据管理的传统方法是保证所有的地质数据的有效应用非常困难,所以数字发展成为地质资料的地质数据。在数字化转型过程中的地质资料,相关人员需要在原始地质资料做一份好的工作,许多地质数据的分类可以通过扫描,在输入和输入的形式,但仍然存在的地质数据转化利用现代数字技术的一小部分,在处理这部分数据的过程中,工作人员可以编辑目录,这样我们就可以在一定程度上,提高地质资料管理和搜索效率。

5.2 强化知识创新

我国部分地区已经建立了数字档案馆,通过互联网进行信息共享。但需要注意的是,随着现代信息技术的提高,传统的数字档案显示出一定的滞后性,因此在数字图书馆建设过程中的地质资料,除了对数字图书馆的基础建设工作,也是提高数字信息管理的功能,增加系统的数字图书馆服务,加强和整合知识的分类。尤地质数据数字数据库主要提供知识服务,需要对其进行适当扩充,不断提高知识服务的需求。

(1)提高数字图书馆的主动服务,为用户服务的过程中,主动管理和查询信息,满足用户需求,提高用户的感知信息,从信息,更有利于深入的知识;

(2)加强对普通的知识管理,在编辑和在炼制过程中地质资料中的应用,简化了现有的信息,合理整合,提高创新知识,使地质数据在网络环境下得到更好的开发和利用。

5.4 做好保障支撑

网络技术的飞速发展彻底改变了传统的办公和管理模式。由于地质资料的保密性,各级采集机构应根据数字资源地质数据的特点,对网络系统的内外网进行单独的网络建设。内部网络物理隔离,并参考分类网络的建设和管理,接收的主要实现方式,对数字资源加工等为主要业务的地质数据管理;外部网络用于互联网门户网站发布的服务支持,实现传播、共享、查询和在线地质数据资源编辑。因此,利用光纤链路提供基本支持,机房专用用户管理采用屏蔽线提供客户端的网络链路保护。数据一方面,以加强备份速度的安全措施为参考,设置全备份策略、备份和全局差分增量备份相结合,有效保护数字资源安全。另一方面,要加强信息安全措施,提高管理技术机密和保密意识水平,不定期组织计算机分类的自我审核,分区和加强对工作环境的管理,实现工作区域没有任何互联网连接。

参考文献

[1]盛扬燕,周涛[译].大数据时代[M].杭州:浙江人民出版社,2012.

[2]刘晓鸿,地质大数据应用与地质信息化发展的思考[J].中国矿业,2016,11.

[3]王黔驹,地质资料信息化建设对策[J],中国国土资源经济,2016 (01).

[4]朱卫红,美国地质资料信息服务发展研究[J].中国矿业,2013,22(09).

[5]丁克永等,地质资料信息服务集群化产业化的理论与实践[M].北京:科学出版社.2014.endprint

猜你喜欢
数据量资料数字
基于大数据量的初至层析成像算法优化
计算Lyapunov指数的模糊C均值聚类小数据量法
Party Time
PAIRS & TWOS
JUST A THOUGHT
宽带信号采集与大数据量传输系统设计与研究
数字变变变