付治河
习近平总书记在党的十九大报告中提出:“推动互联网、大数据、人工智能和实体经济深度融合,建设数字中国、智慧社会。”
当今社会已进入大数据时代,人类活动及社会发展已积累了海量数据资源,伴随着物联网和云计算的普及,数据资源还将以指数级的速度扩张。
大数据的特征是存储体量大、种类多、挖掘信息的速度快、产生的价值大。如何利用大数据思维,构建新型基础测绘数据,更好地服务包括自然资源在内的各行各业,成为测绘地理信息转型升级的关键,因此,河南省测绘地理信息局适时提出建设河南省时空信息框架。
现实生活中的数据超过80%都与地理位置有关。时空数据是同时具有时间和空间维度的数据,包括时间、空间、专题属性三维信息,具有多源、海量、更新快速的综合特点。
新形势下,自然资源部国土测绘司武文忠司长明确指出:围绕自然资源部核心职责的履行,积极转换理念和角色,让测绘保障这一技术手段更好用、更得力。在产品类型上,从目前的4D 产品向一体化时空数据库转变,实现“一库多能、按需组装”的个性化服务;要积极探索“统一规划、分级实施、协同更新”的新型基础测绘生产模式,实现一个地理实体只测一次的目标。
为了实现测绘地理信息转型升级目标,测绘工作需要从面向产品到面向应用转变。
传统测绘产品来源单一,由测绘地理信息部门生产制作,形成了多种类型的数据库,包括多比例尺地形数据库、多时相的影像库、地理国情数据库、自然资源和空间地理数据库,而应用相对较少,都是以4D产品、电子地图的形式提供服务,各行各业使用测绘数据的门槛较高。
在目前的技术背景和应用需求下,我们认为新型测绘地理信息数据应该来自测绘、住建、交通、水利等多部门,兼容不同结构,形成标准统一、具备时空特征的基础、通用数据库。新型数据成果可以降低时空数据的使用门槛,方便服务各行各业,让测绘工作从之前的重生产轻应用向统一管理、丰富应用转变。
河南省利用传统的数据组织和生产方式,积累了丰富的数据资源,即覆盖全省的基础测绘数据、地理国情普查和监测数据。其中,1 ∶1 万地形图数据覆盖全省六次,地理国情普查和监测数据覆盖全省三次,形成了多个版本的基础地理信息数据库。但是每个版本之间的数据没有关联关系,难以实现时序性表达,不能支撑数据关联挖掘。比如,要进行沿黄河生态带的规划,需要提取大堤范围内的人口、经济数据。这种貌似简单的需求,需要先调取、整合、空间化不同数据库中的数据,再进行统计,才能得到最终成果,需要耗费较长时间和较多人力。这说明,原有的空间数据库及其组织方式,逐渐不能满足新的需求。
● 时空大数据应用场景
用新型基础测绘要求作为衡量尺度,以往建立的多时相、多尺度、多分辨率的数据资源,尚存在很多不足,主要体现在以下几个方面:
(1)地理底图服务无法满足跨部门信息关联整合。原来的测绘地理信息数据是一种二维、三维的信息表现形式,与其他部门的一维表格数据形式很难融合和关联,在应用中需要花费大量时间和精力整合地理信息数据和行业专题数据。因此,要降低地理信息的使用和共享难度,与其他种类数据在同一个维度上进行交换共享。
(2)数据分类无法提供智能化的地图服务。现代社会对空间数据的需求多样化、个性化,测绘地理信息数据在数据种类、颗粒度和表现形式上,无法满足社会经济、大众需求的发展需要,急需提供可定制的数据产品和服务。
以制图方式为例,在面对不同行业个性化定制的需求时,不能及时快速实现制图表达。比如:河南大学的建筑物,文物部门认为是文物,教育部门认为是个教育场所,消防部门则认为是个重点安全保障单位。不同部门有不同的认知,需要针对不同部门,解决如何快速制图的难题。
(3)电子地图更新需要解决大数据带来的多源数据协同问题。测绘地理信息数据作为经济社会的基础设施,其显著特点是具有唯一性。唯一性特点是以时空数据为底,关联各行各业中方方面面的数据,形成数据协同和关联挖掘能力的保障。
各行各业的数据,尚未统一到一个底板上,数据本质是分散、没有关系的。比如:一个人,一间房,一个公司,难以找到其共同基础。但是,所有数据都与时间和空间相关,时空信息具备天然的唯一性,因此可以时空信息为底,承载其他所有数据,建立统一的时空底板,具备多源数据协同、关联挖掘的能力。
● 时空数据库建设内容
(4)数据组织无法支撑多尺度数据联动更新问题。测绘地理信息数据是有尺度的,传统比例尺是特定历史条件下的产物,已不适合当前的大数据时代。传统的多尺度基础地理信息数据分别更新生产的方法效率低下,需要经过地图更新、地图缩编等一系列步骤。急需找到一种数据组织方式,能够实现增量更新,记录其更新地物和时间,解决更新效率和时序关系问题。
根据近两年的研究和探讨,在原有河南省基础空间数据库基础上,河南省测绘地理信息局提出进一步研究新型测绘产品,提升地理信息资源综合管理能力,建设以地理实体为核心的、统一时空基准的综合河南省时空大数据库,建成河南省智慧时空基础设施省级节点,发挥时空大数据的载体功能,为河南省省级大数据建设提供基础时空数据支撑。
时空大数据库建设并非简单将原有基础测绘数据加上时间标记,而是采用一种全新的数据组织形式管理和应用数据,即以新型地理实体为核心建设时空大数据库,实现省市一体化生产时空大数据,满足多层次需求,实现共建互惠。
时空大数据库的建设内容主要有两部分:一是对现有基础测绘数据进行实体化、时空化改造;二是研发地理实体数据生产和数据库管理系统,以及数据服务系统。其中,最重要的是对数据进行实体化。
地理实体,即现实世界中具有共同性质的自然或人工地物,是具有社会意义和经济意义的最小地理单元,可以是一条路、一栋建筑或者一个公园。在这个地理实体中,定义了唯一标识,记录空间坐标和地址信息。也就是说,它是一个具有唯一标识的地理单元。唯一标识,就像人口库中的身份证号和法人库中的信用代码。通过身份证号,能够查询特定人是否有房有车、违法记录、出行信息等与个人相关的全部信息。同样,通过地理实体唯一编码,能查到与这一地理实体相关联的建筑物、公司甚至个人信息。不同的是,它具有更加广泛的承载和关联能力,是统一的时空基准,是所有数据关联的桥梁。
● 实现数据增量化更新
地理实体的核心作用是以新型地理实体数据产品概念为出发点,解决地理信息唯一性的问题,为用户提供具有唯一标识码的地理信息数据产品。通过维护这一套唯一标识码,建立一个新型地理信息应用基准,存储、管理省市县各级、各比例尺、各时期数据,基于全省统一编码与各类专题数据挂接,支持检索地理实体任一时间或指定比例尺数据,实现空间地理信息与专业属性的松耦合联系,实现图形数据与属性信息的分离和各自维护目标。
通过地理实体,数据不仅是给人看的地图,更是便于计算机识别和挖掘的信息,还能够实现增量更新,只记录不同年份发生变化的部分,以便表达不同年份数据的时序关系。
以一条道路为例,不变时,变化时,消失时,以往是通过整图幅进行更新,工作量大且针对性不强。地理实体库建成后,则发生变化才更新。比如,道路的C、D、E点发生变化,只需更新记录C、D、E路段和更新年份,不发生变化的路段不予更新。所有年份数据保存在一个数据库,可随时抽取查看,解决了数据增量化更新和时序化表达的难题,为多源数据更新提供了一个技术途径。
经实体化建设后,传统的空间数据转化为新型时空数据,具备了时空唯一性,使其可赋能各行各业或被各行各业所赋能,空间化处理、智能化制图、关联挖掘等问题迎刃而解。在服务政府方面,能够挂接人口、法人、经济、部件等各类数据,是政务大数据的时空基础,可实现跨部门信息整合和多源数据协同。
当前,河南省测绘地理信息局已完成河南省时空数据库建设总体方案设计及地理实体数据标准制定,并以漯河为试验区开展了地理实体数据生产,建立了完善的生产方案和作业规程,为全省时空数据框架建设做好铺垫。
2019 年初,自然资源部《地理实体空间数据规范》正式发布,地理实体数据正向我们走来。时空数据框架,带来了测绘地理信息的整体提升,从空间基准升级到时空基准,基础地理信息数据库升级到时空大数据库,地理信息公共服务平台升级为时空大数据平台,建立一个清晰、准确的时空数据底板(框架),可以为自然资源监管、综合治理、应急管理等方面提供更优质的服务。
● 时空数据框架,带来了测绘地理信息的整体提升