张金安
摘 要:随着中国科技力量的不断增强,各项科学技术都在不断超前发展着,人们对于大数据处理这一词汇的熟悉度不断上升。目前,大数据处理技术的应用范围是非常广泛的,并且得到了很好的反响效果,因此备受各行各业青睐。本文就从地理信息档案管理方面来探讨大数据处理技术,本文的探讨环节是首先了解常见的大数据处理技术,基于这个基本信息再进一步对其在地理信息档案管理方面的应用进行深层次挖掘。
关键词:大数据处理技术;地理信息档案管理;应用分析
引言
目前我国的计算机网络技术发展日趋成熟,无论是网络信息量还是载体数量都在以一种飞快的速度增长着。大数据处理技术也是在这种特定的网络环境中发展出来的,从它的身上可以很明显地看到这个时代的网络特征,并且它本身的应用性能也是非常的高。测绘地理信息技术也属于高新技术的一种,它是在信息技术高度发展的形式下产生的,它的发展能够从更高层次满足人们对于地理信息的需求,从而实现更好服务人民的目标。所以说,将大数据处理技术应用在地理信息档案管理中是非常明智的一个决定。
一、概述
在当今这个时代,信息技术一种不可阻挡的洪流之势朝前开拓疆土,计算机网络技术的應用范围实际上是不断扩大的。庞大的数据量使得数据处理的工作难度日益上升。一旦对信息的处理不能够及时准确,就会给人们的日常生活带来了很大的困扰,所以说,在这种形势下,大数据处理技术就应运而生。这个时代的种种情况是数据处理技术出现的前提条件,缺一不可[1]。从理论上来看,大数据的含义是指在一定的时间段内通过常规的数据处理工具广泛抓取到的数据集合,这部分数据的数量是十分庞大的,类型繁多齐全并且传播速度极快。与收集到的传统数据相比,大数据所要求的层次水平更高这是由它的一些特性决定的。如庞大的数据中个性数据偏多,并且非机构化的数据成分占大比等。因此将大数据处理技术应用在地理信息档案管理中时,首先要对大数据有一个全面而深入的了解。这样才能够在了解其特性的情况下,更好地将其应用在档案管理中。
二、技术分析
(一)HDFS文件管理系统
HDFS文件管理系统是以Hadoop为技术核心的一种高新技术,它的推出具有十分重要的意义,这是因为它标志着在大数据时代下,有一种新型的,更便捷的文件管理系统应运而生。HDFS文件管理系统有一个突出特征,它是一种分布式的存储文件系统。与前者相比,它做出了更多的优化处理。存储系统以一种分布式的方式存在,可以更好地对存储信息进行分类管理,以便在信息输出时达到更高效,更快速的目的。所以说,HDFS这一文件管理系统在当时文件管理困难的情况下作为一种有效的解决措施受到很多人的青睐。
(二)云存储
云存储这个概念是在云计算的基础上进一步延伸出来的,这种网络存储技术出现的时间是非常短暂的,但是功能却是非常卓越。它的工作原理是通过群体应用,网络技术或者其他一些功能部分将分散在网络中的各个存储设备集合起来,在一个整体协调的环境中一同工作,使其成为一个集体向外提供储存数据或者业务访问的一个体系化系统。从简单意义上理解,云存储可以理解为人们将自己需要存放的资源放到一个特定的地方,这个地方被称为云,当人们有需要时,可以随时存取的一种新技术[2]。这项技术极大方便了人们的日常生活,因为人们对信息的存取可以完全自己掌控。一旦有需要就可以调阅,不会有时间上的延迟或者其他阻碍,这也是为什么云存储技术能够在短时间内快速发展壮大起来的主要原因之一。
(三)Elastic Search检索
这项检索技术在开发时采用的是java模式,并且它的接口端口部分都是以Web接口为基础的。检索功能非常强大,所支持的检索方式很广泛,包括全文检索和关键词检索,基于这些其它检索工具远远不能及的强大功能,Elastic Search检索得到了很多企业的认可并被广泛应用。这里值得一提的是,在对地理信息文档进行管理时,最困难的一个部分就是进行文档检索。Elastic Search检索配置具备搜索速度快,配置简单几乎为零等特点,这使其能够完美地解决这一问题。并且Elastic Search检索与传统的Java应用都是融合的,并不会产生排斥反应,所以与其他检索程序相比,Elastic Search检索具有更强的适用性。
三、应用分析
(一)平台建立
地理信息档案资源是一个非常庞大的概念,它所涵盖到的方面是非常多的,主要包括地图、卫星遥感影像地理位置的环境气候测量结果,建筑工程的工程测量信息,以及航空路线测绘成果等等都在其中。除了这些庞大的数据信息之外,信息种类的也是非常繁多的,不仅包括基本的文档文本,图片,还包括各类表格图表,音视频文件等。以上种种都是造成地理信息档案管理工作难度不断上升的主要原因,为了应对这些问题,在对信息档案中的许多异构不同源型数据进行处理时,可以考虑利用大数据处理技术来进行。实现这个目标主要是通过处理平台这一介质机构完成的,如何通过大数据处理技术来完善一个包含地理信息资源的处理平台,需要几个关键的步骤[3]。第一步,利用文件管理系统来对档案中的数据文件进行分类,通过分类后,数据就重新集合成一个个群体。整个群体内的所有节点需要同时进行工作,他们的任务就是负责存储和计算输入的数据。在后期时档案管理资源不断输入,那么原有的群体已经不能够满足存储的需要,所以必须要进行节点扩充,这样才能够扩大对数据的存储空间,从而提升计算性能满足计算需要。第二步。需要对半结构化或者是非结构化的数据进行处理。这里利用到的是Hbase处理技术,这项技术可以将原先那些不能够完善处理的数据重新转化为结构数据,转换完毕后在数据管理类别的指导下就能够顺利管理入库。最后一步是对数据行分布式计算。通过上述三个环节,一个功能完整的地理信息档案大数据处理平台就建立了。
(二)信息数据化
近些年来,网络信息资源的数据整体趋势是暴涨的,新旧信息的数量加起来是一个非常庞大的数字,想要实现对其管理的目标,以人力绝对无法达到,只能通过大数据处理技术这一智能化技术来实现[4]。想要更好地将大数据处理技术应用在地理信息档案资源的管理中,首先要明确的就是要进行数据的挖掘和知识发现。这是当今时代大数据技术应用的发展方向,也是档案管理部门如何能够创新服务的必经之路。地理信息档案储存馆内有大量的异构不同源数据的存在,这一部分数据要再经历清洗,抽取,集成,转换等一系列环节之后才能够输入到文件系统当中。在这之后再次进行分类或者是处理,才能够搭建起一个处理平台的雏形。那么此时对数据进行挖掘和知识发现的客观环境已经出现,这时就能进行这个环节。
四、结束语
结合上文所讲,读者能够初步认识到大数据处理技术的基本概念,种类及应用的意义所在,这也是本文的旨意所在。通过本文的剖析希望能够对相关人员有一定的借鉴意义,助力于大数据处理技术在地理信息档案管理领域的发展。
参考文献
[1] 梅树红,何琪.大数据时代测绘地理信息档案资源的建设与应用[J].测绘与空间地理信息,2016,39(5):166-168.
[2] 邹春林.大数据时代测绘地理信息档案资源的建设与运用[J].城市建筑,2017(3):385-385.
[3] 乌玮,李明.新时代测绘地理信息业务档案管理浅谈[J].地理信息世界,2018,v.25;No.129(03):122-125+130.
[4] 何伟.大数据时代的档案信息资源共享平台建设研究[J].办公室业务,2016(3):135-135.