大数据时代下的GIS发展

2017-04-15 03:52:40刘志洋李雅婷
地下水 2017年1期
关键词:空间数据数据管理水文

刘志洋,李雅婷

(1.西北大学附属中学,陕西 西安 710027;2.西北大学城市与环境学院,陕西 西安 710127)

大数据时代下的GIS发展

刘志洋1,李雅婷2

(1.西北大学附属中学,陕西 西安 710027;2.西北大学城市与环境学院,陕西 西安 710127)

随着网络技术迅速发展,带有地理位置信息的数据在数据容量、数据类型、数据结构等方面日益复杂。从大数据与GIS的概念出发,通过分析大数据对GIS发展的影响,从数据采集、数据管理、空间分析与可视化三个方面对大数据GIS的发展进行阐述探讨。提出通过完善水文空间数据基础设施以及在水文数据分析与挖掘方面,建立分布式并行或云计算构架等方式构建水文空间数据管理基础设施,以支撑水文数据统一管理与共享,加快GIS与大数据技术结合,实现大数据为GIS所带来的重大社会价值。

大数据;GIS;发展

近年来,快速发展的信息技术引发数据在容量与形式等方面爆炸式增长。研究表明,整个人类文明过程中所积累的全部数据,有90%是过去近几年产生的,并预测到2020年全世界所产生的数据规模将达到2009年的44倍[1],其中80%的数据具有空间位置属性[2],学界把这种数据容量大、结构复杂、形式多样的短时间内常规手段难以获取、处理与分析的数据集合统称为大数据。目前,大数据已经普遍存在能源、交通运输业、服务业等领域,且积累了TB级甚至EB级的数据量[3]。海量数据一直是GIS关注的重要问题,对于从基于空间位置的海量数据到大数据的跨越,其数据量容量发生指数增长,数据获取方式、数据类型、数据管理方式、空间分析与可视化等为传统GIS应用产生了巨大影响与挑战。

1 大数据与GIS

1.1 基本概念

大数据,指数据容量超出常规的数据库工具获取、存储、管理和分析能力的数据集[4]。它是信息时代的产物,主要包括社交网络、网站信息、移动信息设备等各种介质产生的数据。IBM认为当前大数据具有5V特征,即:数据容量大(Volume)、数据产生速度快(Velocity)、数据形式和来源多样(Variety)、数据的真实性难辨(Veracity)、数据隐含价值大(Value)[5]。大数据的实际价值不限于庞大的数据信息,更多在于通过专业化处理后浮现的隐含信息。

当前,传统GIS存储、管理与分析大数据时面临的主要问题有:量大、机构复杂的大数据,颠覆了传统GIS的关系型数据管理构架;用户对GIS大数据的实时性、响应时间要求越来越高;在对大数据的空间分析与可视化时,由于其数据量特别大导致计算量呈指数级增加。

1.2 大数据GIS的特征

区别于其他信息管理系统,GIS具有空间数据管理、空间分析与数据可视化的功能。大数据并没有改变传统GIS的基本特征,但是对其提出了新的要求。随着大数据时代的到来,大数据将促进GIS产业技术升级和服务模式变革。因此,对大数据的存储、分析以及处理等问题的研究变得越来越重要,以促使GIS取得更多的经济效益和社会效益。

大数据下的GIS应该具有的基本特征:(1) 大数据管理方式动态性、易扩展。相比传统的静态离散的数据集,数据存储和管理从传统的面向离线式分析的组织与存储方式转换为可扩展的面向实时分析与挖掘的动态处理与管理过程。同时,大数据GIS的数据存储管理系统需要具备易扩展性以解决动态无限增长的数据的存储和数据查询问题。(2) 大数据驱动的空间分析与挖掘能力。将传统的空间分析方法由模型驱动逐渐转变为数据驱动大数据GIS的空间分析,不仅要有建立模型的能力,更要有挖掘新模式、新知识、新规律的能力。(3) 结合地理计算的可视化分析。传统GIS可视化的重点表现在符号、尺度、三维等问题上。大数据GIS的可视化不仅仅是图形显示功能还是数据分析和挖掘的一个重要手段[6-7]。通过交互可视手段对数据和事件进行分析和决策,进而对复杂情景进行更深层的认识。

2 大数据时代下的GIS发展

大数据技术的发展和大数据时代的到来对GIS的发展产生极大影响。在大数据时代,GIS数据采集的方式、存储和管理的形式、空间分析和数据挖掘方法必将发生巨大的变革。GIS作为一门以空间分析为核心、以指导决策为目的的综合性学科,空间数据对GIS的重要性不言而喻。因此,要想在大数据时代发挥GIS的最大功效,需要对数据采集、管理、分析与可视化的等方面进行不断改进,并且只有将GIS与大数据技术相结合,才能从根本上解决GIS庞大的数据量所面临的各种问题。

2.1 大数据与GIS数据采集

大数据GIS的数据形式多样,主要有地图数字化、遥感影像、传感器实时监测设备、RFID设备、历史资料等媒介产生的各种数据。首先,由于大数据源的种类各异,获取数据的方法也各不相同,在运用GIS对大数据进行采集识别过程中,需要建立多源数据的关联和识别模型、多源多态数据的自动识别方法等,同时将不同来源、不同形式的大数据综合分析,以多角度、全面地描述事物对象。其次,需要建立完善的正确性条件和约束性规则以确保数据的完整性和同一性。最后,建立数据监管部门,以确保数据的真实性。

2.2 大数据与GIS数据管理

数据管理是GIS的基本功能之一,大数据的分布式管理构架将影响GIS数据管理模式。为适应大数据时代,传统GIS的数据管理可以从以下方面考虑:(1) 在数据管理模式方面,相对于静态、有限的、离散的数据集,大数据GIS的数据存储管理系统需要具备扩展性,以处理动态无限增长的数据的存储和查询问题。虽然Hadoop技术是在对大数据处理中所使用的常用解决方案,但它无法有效地多线程并进的算法逻辑。随着大数据管理架构不断完善,大数据下GIS空间数据管理架构逐渐走向多样性。(2) 在数据结构方面,传统的GIS数据管理是以矢量数据与栅格数据的格式为主的关系型数据形式,对非结构化、可扩展的大数据难以适应。但近年来以无需提前声明数据结构、自由添加字段的键-值数据为代表的非关系型数据库迅速发展,这对定义GIS数据结构提供了较好的解决方案。(3) 连接数据库与应用层的接口方面。GIS需要从应用层中读取PB量级的数据,同时还需使上层应用能够快速、准确地访问数据库的各个节点,所以建立兼容性强的数据访问接口必不可少。

2.3 大数据与GIS空间分析

空间模型是传统空间分析重要思想,它考虑的是如何建立一个更高精度的数学模型。区别于传统GIS空间分析,大数据GIS更多关注从不同空间或者时间尺度上挖掘数据中隐含的规则或知识。为了克服大数据的不确定性,在进行GIS空间分析时应尽可能地使用多源数据,并对多源数据进行融合,以充分发挥大数据所隐含的信息优势。大数据GIS的空间分析需要具备空间建模功能,还应具备挖掘新模式、新知识、新规律的能力。

3 水文大数据对GIS发展的思考

水文是研究自然界水体时空分布变化规律的科学。目前,我国在江河、湖泊布设的水文资料实时监测站,收集的水文数据容量截止2012年已经超过100BT[8]。目前,GIS在水情实时监测、水资源调度、水资源管理、水文专题分析等方面的应用较为广泛。随着水文传感器的发展,水文数据收集的数据容量也会成指数增长,所以在水文大数据环境下,GIS水文的发展与应用如何发展将成为GIS学者与水文学者面临的共同问题。笔者认为基于水文大数据的GIS整体发展方向可以从下面两方面进行考虑:

(1)完善水文空间数据基础设施,包括水文数据实时采集、管理、分析与可视化等硬件设备、软件条件。水文涉及气象、降雨、水情、水质、泥沙等多个方向。水文数据获取获取方式不同、数据容量大、形式多样、结构各异造成数据综合管理比较困难,影响数据共享以及水文数据价值的发挥。因此,在硬件方面,除了增加全国范围内水文监测设备的数量,还要提高设备监测的精度。在水文数据管理等方面,基于大数据GIS的非结构化空间数据管理优势,构建水文空间数据管理基础设施,以支撑水文数据统一管理与共享。

(2)在水文数据分析与挖掘方面,需建立分布式并行或云计算构架。对水文大数据分析的关键是处理好数据抽取和模式分析等过程中产生的大量计算问题[9],基于分布式并行计算或者云计算提供了较好的解决方案,实现以数据驱动为基础的新模型发现和知识挖掘将成为大数据水文分析的重要应用领域[10]。

4 结语

目前,地理空间数据表达、管理与分析技术已经相当成熟,但随着大数据时代的来临,对GIS社会化的应用又提出了更高的要求。基于空间位置的社交网络、社交关系、物联网、云计算、城市计算等作为典型大数据的重要性会越加凸显,并将极大地推进GIS的应用研究。同时这些大数据要在GIS中充分发挥其作用,地理信息部门、企业要对其技术有足够的认识与技术积淀,并加快GIS与大数据技术的结合发展,以得到大数据为GIS所带来的大价值。

[1]方巍, 郑玉, 徐江. 大数据:概念、技术及应用研究综述[J]. 南京信息工程大学学报.2014(5):405-419.

[2]Shekhar S, Xiong H. Encyclopedia of GIS[M]. Springer US, 2008.

[3]维克托·迈尔·舍恩伯格,肯尼思·库克耶.大数据时代: 生活、工作与思维方式的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社.2012.

[4]甄峰, 秦萧, 王波. 大数据时代的人文地理研究与应用实践[J]. 人文地理.2014(3):1-6.

[5]李清泉, 李德仁. 大数据GIS[J]. 武汉大学学报:信息科学版.2014, 39(6):641-644.

[6]Wong P C, Thomas J. Visual analytics[J]. Computer Graphics & Applications IEEE.2004, 24(5):20-21.

[7]Kovalerchuk B, Schwing J. Visual and spatial analysis : advances in data mining, reasoning, and problem solving[J]. 2005, 8(6):547-583.

[8]冯钧, 许潇, 唐志贤,等. 水利大数据及其资源化关键技术研究[J]. 水利信息化.2013(4):6-9.

[9]莫荣强, 艾萍, 吴礼福,等. 一种支持大数据的水利数据中心基础框架[J]. 水利信息化.2013(3):16-20.

[10]郭玉双. 基于大数据环境的水文GIS应用发展初探[J].中国科技投资.2016(18).

2016-08-14

刘志洋(1998-),男,陕西西安人,西北大学附中高三学生。

P333.9

B

1004-1184(2017)01-0178-02

猜你喜欢
空间数据数据管理水文
2022年《中国水文年报》发布
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
水文
水文水资源管理
水文
元数据驱动的多中心空间数据同步方法研究
基于文件系统的分布式海量空间数据高效存储与组织研究