谢文瑄 陶迎春 祝晓坤 张翼然 丁月
(1. 北京市测绘设计研究院, 北京 100038; 2. 城市空间信息工程北京市重点实验室, 北京100038)
测绘地理信息数据建设是城市信息化建设的基础,成果可广泛应用于国土空间规划监督管理、自然资源管理、保护和利用等方面[1-2]。2018年以来,随着国家大数据战略的实施,上海、天津、武汉和重庆等众多城市,相继开展了地理信息数据资源体系建设、数据融合共享和平台研发等工作[3-5]。北京市委、市政府也启动并组织实施了北京大数据行动计划,以建设首善标准的城市大数据中心为目标,旨在全面升级北京市信息化建设水平,实现数据资源开放共享全覆盖,并通过大数据应用,促进城市精细化管理,提高科学决策能力,保障和服务民生,建设世界级智慧城市。
近年来,北京市各委办局结合自身业务需求,均在同步推进相关工作,积极推动系统内部、外部的空间数据资源梳理、空间大数据建设和打通共享工作,促进各类空间要素资源整合、技术应用水平提升,且已取得了显著的工作成效。随着工作的不断深入与细化,全市空间大数据建设和城市精细化管理对空间数据的需求越来越大、个性化特征越来越明显、要求越来越高[6],基础地理信息数据的广度、深度、精度和现势度均存在较大的提升空间。与此同时,相关从业人员开展了部分数据生产探索、产品体系设计和展示平台建设等多方面的研究,也取得了一定进展[7-10]。但目前仍然较为缺乏系统的行业专题数据建设技术研究和应用方向探索拓展等方面的工作。
基于此,本文立足于基础地理信息数据融合建设工作,聚焦行业特色,以政府部门不同的业务需求为导向,提出了行业专题地理信息数据建设技术方法、案例试验、成果分析和应用的全流程体系。力求提供全面、深入的数据服务,以期为全市时空大数据、智慧城市“一张图”和信息化数据库建设工作提供一定的参考。
在数据资源经过清洗、加工和分析等步骤后,最终形成能够支撑业务、辅助决策信息的全部流程,准确、清晰的业务需求分析是基础,也数据库建设的关键一步。为提升业务水平、提高决策的有效性,必须以涵盖多领域的数据为基础,依靠科学的方法,来辅助各委办局的业务和决策[11]。
因此,要聚焦行业特色,梳理业务需求,了解、收集各领域、各部门的数据资源,分析当前数据资源的优势与不足,结合数据应用需求场景,建立数据标准体系框架,同时选择适当的参考数据源,为进一步的数据加工建设奠定良好基础,以便于系统性地提供数据本底和信息挖掘支撑服务。如图 1所示,与部分委办局已形成了明确的业务需求。
图1 流程图
除已掌握的测绘地理信息数据、遥感影像等资源外,根据业务需求,在政府部门的协调下,可通过多种途径获取多专业、多层次、多角度的数据信息资料,如城市建设、市政交通、社会服务和政策法规等诸多方面(图 1)。进一步结合地理信息基础数据和各类技术处理方法,即可逐步建立满足政府部门需求的行业专题基础地理信息数据库。
通常,数据资源库的建设过程共包括数据调研与资料收集、数据库目录设计、技术标准制定、样例试验、数据生产加工、数据标准沉淀和数据成果汇总入库7个步骤。在数据生产加工阶段,要针对不同的需求背景和数据资源特征,采用不同的技术方法(图1)。
1.3.1基于各类图纸资料
图纸资料主要有工程设计图、施工图、示意图、地形图和航摄像片等内容。非地理信息格式的图纸资料通常有纸质版与电子版、有图廓与无图廓、含坐标系与不含坐标系等多种类型。针对不同类型的图纸资料,需采用不同的技术处理方法(图 2)。常用软件包括Photoshop、ArcGIS、AutoCAD和加拿大Safe Software公司开发的空间数据转换处理系统(feature manipulate engine,FME)。一方面,对图纸档案或无坐标系电子图纸,应先经过图像基础处理,然后依据空间位置准确的地理参考资料和若干同名点坐标,通过地理空间配准,给数据赋予地理空间参考坐标系。最后,根据具体的数据库目录结构和数据采集要求,严格按照精度要求,对所需的地理要素进行矢量化采集,形成地理信息初步成果。
图2 基于图纸资料的技术流程
另一方面,从专业设计单位获取的含坐标系电子版设计图纸要素齐全、内容全面,需要根据政府部门数据建设要求,提取关键要素,将dwg文件转换成为gdb或shapefile文件。然后补充相应的属性信息,导入地理信息数据库即可。
1.3.2基于台账数据
政府部门经常使用表格、文本等形式的台账来记录信息。当台账具有空间地理位置坐标值时,可直接通过空间展点方式进行落图,然后完成属性挂接即可。当台账不具备任何空间地理位置信息时,在这类数据的处理过程中,结合文本匹配技术,将地名、地址等关键信息与已有的地理空间数据的属性进行查询匹配,查找同名点,完成一部分台账的空间落图。对于无法完成匹配的台账信息,可结合其他基础地理信息数据、遥感影像和互联网底图资源,通过人工核对的方式,逐一进行空间落图(图3)。
图3 基于台账数据的技术流程
1.3.3基于多源异构空间数据
对于同种类型的专题数据,不同来源地理空间数据在坐标系统、要素表达形式、图斑数量、数据精度、属性结构和内容等方面各不相同。要根据数据空间位置和属性信息的适用性、权威性、时效性、准确性等判断依据,确定不同数据的优先级,对要素几何表达、属性结构进行调整,制定个性化的数据融合规则,消除差异,以实现数据规范化处理和空间整合,最终形成最优成果。
1.3.4基于外业调研数据
根据业务需求,若内业数据无法完全满足要求时,则要通过深入现场进行外业摸排和调研的方式获取第一手台账资料。首先是做好准备工作,包括明确外业摸排空间点位、设计外业路线、台账模板和调查问卷(图 1)。其次,开展外业调研工作,获取原始数据信息资源。最后对其进行梳理归纳,形成专题调研成果,为后续应用分析和报告撰写奠定基础。
针对北京市不同委办局、结合部门业务需求,明确数据内容与规格,充分发挥地理信息的优势,逐步构建具有行业特色的基础地理信息数据。可为后续结合多源空间数据进行深度分析、数据挖掘、提出政策建议奠定数据基础。
为全面推进全市市政交通基础设施数据库信息化建设工作,根据北京市规划和自然资源委员会的要求,信息化数据库设计包括轨道、交通、市政和案例拓展四类要素集,每类要素集包含不同的数据实体。首先,梳理了数据库目录结构(表1)。其次,形成了数据结构标准,形成统一、规范的属性字段要求。最后,结合我院基础地理信息数据、专业设计数据和行业拓展属性信息,根据实际情况,采用上述不同的数据生产加工方法进行数据入库处理,对交通基础设施信息化现状数据库进行了丰富、扩展。案例拓展(支持剖面分析)的地下市政基础设施要素图层有:地下桥桩、人防工程、盖板沟、地下停车场、过街通道、地铁。
表1 市政交通基础设施数据库目录初步设计
以城市轨道交通数据集为例,目前已形成了全市较为完善的轨道专题地理信息数据集,包括车辆段、出入口和隧道中心线等10个图层的地理信息矢量数据集。同时,通过与轨道设计单位对接,极大程度地完善了各类实体的属性信息,如各类设施的名称、类型、功能、尺寸和高程、状态等。后期应逐步建立市政交通基础设施数据库动态维护更新机制,依托图纸定期开展数据补充入库和更新维护,对于新建或改造的工程,也应及时将竣工数据入库,确保数据及时更新。
“疏解整治促提升”专项行动是提高城市治理能力和水平、持续改善人居环境的重要举措[12]。经与北京市发展和改革委员会对接,需对桥下空间、老年餐桌和核心区住宿业进行内业数据生产和外业摸排调研。首先,基于三维MESH模型数据和点位台账,对全市桥下空间面进行内业采集、对老年餐桌和住宿业点位进行落图。然后,通过外业调研摸清桥下空间、老年餐桌的现状情况和存在问题以及住宿业的疏解情况,充分拓展数据专题属性信息。最终形成了立足需求、制定问卷、深入现场调研,掌握现状、形成统计和分析报告的工作模式,成果可支撑政府部门的专项工作、对现存问题进行实时整改。
为参与落实《北京市机动车停车条例》规定、实现精细化停车管理的要求、提高停车资源空间化管理的水平,做好存量机动车停车设施信息报送调查用底图数据生产是摸清停车资源底数的前提条件和有效途径。通过与北京市交通委对接需求,明确了数据组织形式和属性字段规格、建立了地块分类体系标准。然后,参考基础测绘、地理国情普查和互联网信息等多源数据资料,开展了底图数据加工,详细记录了地名、地址、类型、年代等信息。
在现有行业专题数据的基础上,密切结合数据应用场景,立足委办局业务特色,对专题数据进行分析和信息挖掘,目的在于发现问题、为解决问题提出合理建议,以提高大城市精细化管理和服务水平。
在市政交通基础设施数据库中,以城市轨道交通数据集为例,可以依托轨道中心线要素图层,计算区域轨道覆盖密度(单位为km/km2),另外,也可对比出入口图层的设计图纸与实施结果之间的差异,分析规划实施率,评估城市轨道出入口的实际建设情况。与之相似,在市政交通专题中,以现状道路中心线数据为基础,计算道路实施率和道路实现率指标,评价城市道路交通状态。
在“疏解整治促提升”专项工作中,桥下空间面图层详细记录了桥下空间的位置、形态、面积、所属道路名称、所属道路等级、空间可利用状况、运行保障类型、当前存在的问题等信息,可全面分析区域桥下空间资源现状利用情况,对于城市环境美化提升、空间资源赋能挖潜具有重要的实际意义。同时,老年餐桌和住宿业的调研摸排与问题归纳成果,能够切实评估专项工作的推动进展和落实情况。
在停车设施报送工作中,以地块底图数据为基础,补充挂接地块单元内的楼栋数、住户数、停车位数和车辆数等多种属性信息,分析不同区域停车资源分布情况,再结合存量房屋建筑密度、老旧小区分布、手机信令等数据,发现停车位供需不匹配等问题,可为进一步实施道路居住停车认证、停车诱导、停车预约、有偿共享停车等工作提供支撑。
目前,常用的地理信息空间数据分析方法主要有:
(1)空间分析法。使用各类空间分析模型和空间操作,对数据库中的数据进行处理,挖掘不同数据在空间上的关联规则和特征。主要有空间检索、叠置分析、缓冲区分析、核密度分析和聚类分析等。
(2)统计分析法。着重于数据的非空间特性分析,如统计对象的规模、速度、范围、程度、频次等数量关系的分析研究,旨在揭示事物间的相互关系、变化规律和趋势特征。
(3)时序对比法。获取同种要素在不同时期的数据,依据时间序列对其进行对比分析,目的是揭示要素动态变化特性,探索发展规律和趋势。
(4)可视化方法。基于可视化软件的专题图件设计与制作,能拓宽传统图表功能,对数据的剖析更为清晰和深刻,对于发现数据内部或数据之间的规律能起到启发作用。
由于传统地理信息数据结构和内容不能完全满足当前城市信息化发展、精细化管理、个性化评估的要求,因此,有必要以行业应用为导向,对各类数据资源进行整合,通过内业深度加工、外业摸排调研的方法,将多源数据的优势结合起来,以期满足多途径应用场景。
本文较为全面的归纳了常用二维专题地理信息数据建设技术方法。以三个应用场景为例,初步建立了聚焦应用的行业专题地理信息数据集,形成了数据生产、外业摸排、内业分析相结合的专项工作推进机制。并且针对不同应用场景,提出了详细的信息挖掘与数据推广应用思路,为后续数据分析服务广度的扩展奠定了良好的基础。
但是,以行业应用为导向的基础地理数据建设是一项需要长期推进和维护的工作,目前数据尚未形成长效更新机制,现势性保障不足,今后应开展深入探讨、广泛试验。同时,在实际应用过程中,数据完全无法满足各类需求,今后应不断优化二维地理信息数据在不同尺度下的通用属性和专题拓展属性,以期最大限度的满足各类分析使用需求。