大数据在自然资源中的应用

2021-11-14 10:05刘玉珠董万虎
地理空间信息 2021年10期
关键词:数据挖掘分析

刘玉珠,叶 茂,董万虎,张 锦

(1.浙江省测绘科学技术研究院,浙江 杭州 310030;2.中国地质大学 地理与信息工程学院,湖北 武汉 430074)

自然资源是指具有经济价值或者可以产生一定 社会价值的自然要素[1]。由于自然资源在空间分布上不均匀,在时间尺度上变化明显等特点,所以对于自然资源的监测和分析一直是自然资源方面研究的重点和难点[2]。利用大数据技术可以快速从各类大数据环境中得到所需要的数据[3]。从处理数据的基本流程的角度来看,大数据与传统数据没有明显的区别,大数据与传统数据的主要差异在于大数据的数据获取途径十分多样,数据种类丰富,数据量巨大。另外,大数据相较于传统数据对于数据的各个方面也有着新的要求。自然资源数据本身就具有非常高的实效性,并且通过多年的自然资源数据的积累,自然资源数据量丰富,有遥感图像、测绘地图、文字记录等多种形式[4-7]。自然资源数据所具备的特点符合大数据技术的各项要求,可以通过将大数据技术应用到自然资源的监测和分析中,建立有效的自然资源监测和分析体系,优化自然资源监管效率,提高自然资源的利用率。

1 大数据

业界大数据归纳出4个特征称之为4V(量Volume,多样Variety,价值Value,速Velocity):①海 量的数据是最为突出的特征;②数据的类型多样,数据的来源也多种多样,不仅仅只有传统的数据种类和数据获取手段,还包括了网络信息、空间信息等;③商业价值高,大数据具有非常高的商业价值潜力,对于大数据的数据挖掘和数据分析可以有效的发挥其商业价值。当然与之相对应的是其价值密度低,没有有效的管理和分析就无法发挥大数据的价值; ④数据的处理速度十分迅速,由于大数据本身具有一定的实效性,往往有些数据只有在一定的时间范围内可以发挥作用,这就要求大数据需要较快的数据处理、分析的速度。

对于大数据来说,最大的技术难点是如何从海量的数据中获取有价值的数据,并对数据进行分析和利用。因此,大数据的发展需要网络架构和数据处理技术的发展作为支撑。大数据经过多年的发展,已经在当今这个数据爆炸的时代获得位置。大数据的优势在于可以分析出数据的真实内涵,并为相关部门和企业的决策提供支持。因此,大数据并不是指软件或者硬件的组合,大数据真正意义上的本质是可以帮助用户发现数据背后的价值。大数据产业发展的关键是结合不同的行业、不同的领域发挥大数据的作用。

2 自然资源大数据

将大数据应用到自然资源的日常管理中,是我国的实际国情所决定的。以往我国的自然资源管理体系松散,有关自然资源的部门繁多,各个部门之间的数据无法有效共享,造成了自然资源无法被高效管理和利用。日前,国务院机构改革方案落地,组建新的自然资源部统一管理国土、海洋、森林、矿产等自然资源。中国960万km2的陆地和300万km2的海洋国土上,土地、水、森林、草地、矿产等绝大多数自然资源的调查、开发利用空间规划以及监管均由这个新部门负责。自然资源部正式组建解决了数据共享的体制问题,以自然资源部为依托可以有效的将国土、海洋、森林、矿产等自然资源有关的数据相互整合。自然资源数据形式多样、分布分散、数据量巨大,有着极高的潜在商业价值。通过大数据技术可以将多种类型、不同来源的自然资源数据有效整合,并发掘海量的自然资源数据深层信息。将大数据应用到自然资源中,从政府层面来说,可以提高政府在自然资源方面的决策能力,优化自然资源的监管,提高政府的服务能力。从市场角度来说,可以更加显著的提高自然资源市场的活力。自然资源大数据是目前自然资源领域的前进趋势[8-9]。

3 自然资源大数据平台建设

3.1 整体架构

如图1所示,自然资源大数据平台技术整体架构分为5个层次:数据源、数据存储、分析计算、数据展示和用户层。

图1 整体架构图

数据源部分表示各种来源和不同种类的资源资源数据,并利用DataX、DbSync和Timetunel技术将自然资源数据快速传递到下一层。

数据存储部分是对各种自然资源大数据进行存储,在数据存储过程中主要使用关系型数据库MySQL和存储集群Hadoop Hbase。

分析计算部分是指在这一部分,利用统计分析、数据挖掘、深度学习以及GIS等多种计算分析手段对数据进行系统、全面的分析。

数据展示部分将数据的分析结果通过各种方法传递给用户,用户可以通过数据展示部分查询数据及数据分析计算的结果。用户使用需注册账号,每个用户只有唯一的账号来获取数据。

用户层指自然资源大数据面向的各种类型的用户。

3.2 大数据评价分析

对自然资源数据进行评价分析后主要有3种数据。第一种是基础数据,基础数据指与自然资源相关的主管部门在日常工作中获取的自然资源相关成果,包括高精度的地形图、大范围的遥感图像及各种记录自然资源信息的文字文档等。第二种是统计数据,统计数据是指对基础的自然资源数据进行各种技术手段如数学方法、GIS等的处理之后得到的数据,这部分数据主要反映了自然资源在宏观层面上的数量情况,如矿产总量、河流总长、森林面积等。第三种数据称为分析预测数据,这部分数据就是将自然资源数据通过分析、对比之后得到的自然资源的动态变化信息,并可以通过分析自然资源数据的变化规律对未来自然资源的变化情况进行预测,如耕地面积的增减、海岸线的变化等。

3.2.1 自然资源数据统计分析

自然资源数据统计分析利用不同种类的数据处理方法对自然资源数据进行分类、统计、分析、评价等,不但从宏观上反映自然资源数据的数量信息,也从客观上展现了自然资源的各种特性。自然资源数据经过统计分析后可以使原本杂乱、无规律的数据被相互整合,对外显示出一个统一的信息。用户可以在原本庞大的自然资源数据中得到所需要的那一部分自然资源数据。

3.2.2 自然资源数据挖掘

自然资源数据挖掘就是从自然资源数据中提取潜在的、有应用价值的信息的过程,提取出来的信息可以与自然资源相关也可以与自然资源无关。自然资源数据挖掘的方法包括自然资源数据聚类、自然资源数据关联规则等。利用自然资源数据挖掘的方法可以从蕴含着各种信息的自然资源数据中发现相关规律并分析相关的内涵。自然资源数据挖掘可以为有关自然资源重要的决策提供技术支撑、数据支持。

3.2.3 自然资源数据动态分析

自然资源数据动态分析有3种:第一种称为新旧自然资源数据变化对比分析,利用如高分辨遥感图像等数据将现在和过去的自然资源数据进行比较,发现自然资源数据的动态变化情况;第二种是模型分析,利用不同时期的海量自然资源数据构建自然资源动态变化模型,直接通过模型得到自然资源的变化。第三种是预测分析,预测分析是指在建立模型的基础上分析自然资源数据的变化规律,并快速、准确地对自然资源数据的下一步变化情况作出预测。

3.3 关键任务

首先是自然资源数据标准的统一。自然资源大数据平台建设的关键是数据的整合、交流。由于过去各个关于自然资源的部门相互独立,各个部门之间数据没有一个统一的标准,不同部门的数据格式各异,这给自然资源数据的融合造成了极大的困难。自然资源大数据平台建设的第一步就是统一自然资源数据的标准,这是自然资源大数据平台的关键部分。只有先 统一自然资源数据的标准,才能使庞大的自然资源数据统一到数据库中互相融合,也便于集中管理。

其次是加强企业的参与。自然资源大数据平台的建设离不开企业的参与,企业是市场经济的主体,而市场在资源配置中起着决定性的作用。只有有效的利用企业在自然资源大数据方面的技术优势,通过各种方式让企业参与到自然资源大数据平台的建设中来,才能更好地完善自然资源大数据平台。同时还应该注重企业、社会、政府之间自然资源数据的交流、共享,充分利用如快递、电商等网路平台的空间位置数据,丰富自然资源大数据平台的数据来源。企业的有效参与,可以帮助自然资源数据得到更多更广的应用,同时加速自然资源大数据平台的建设。

最后是成果的管理和应用。自然资源大数据平台的建设是由政府主导企业和社会各界共同参与的,自然资源大数据平台的成果也是由政府、企业及社会共享。由于自然资源数据的特殊性,自然资源大数据平台应由政府统一管理,政府拥有自然资源大数据平台的所有权限,充分发挥自然资源大数据平台的优势帮助政府制定自然资源的相关政策,同时向市场和社会公众开放部分自然资源大数据平台的权限,积极探索自然资源大数据平台的商用可能。

4 结 语

随着自然资源数据的积累和各种自然资源数据分析手段的发展,自然资源进入到了大数据时代。将大数据技术应用到自然资源中可以有效的提高自然资源数据的管理效率,降低管理成本。开展自然资源大数据建设技术研究,对各种自然资源数据进行收集、整理,探索自然资源大数据建设中的关键技术,对自然资源进行分析、评价,并建设自然资源大数据管理与应用系统,提升自然资源大数据的管理、分析能力,促进自然资源管理工作的可持续发展,推进供给侧结构性改革,培育适应经济社会发展需要的主导产业。自然资源大数据技术可以为其他有关自然资源的研究提供技术支撑,并为今后的自然资源研究提供新的研究思路。

猜你喜欢
数据挖掘分析
探讨人工智能与数据挖掘发展趋势
隐蔽失效适航要求符合性验证分析
电力系统不平衡分析
基于并行计算的大数据挖掘在电网中的应用
数据挖掘技术在中医诊疗数据分析中的应用
电力系统及其自动化发展趋势分析
一种基于Hadoop的大数据挖掘云服务及应用
中西医结合治疗抑郁症100例分析
在线教育与MOOC的比较分析
数据挖掘的分析与探索