康二梅
(甘肃省基础地理信息中心,甘肃 兰州 730000)
数字地图制图的工艺流程较多,既有大量资料收集整理、数据融合、制图综合、要素符号化工作,也有体现科学性和艺术效果的制图表达及整饰等。现阶段大部分生产单位多尺度快速成图多基于多尺度制图数据库建设来实现,有效地将紧急工作进行了日常分配。但在多级数据联动更新自动化程度不高的条件下,又带来了新的问题:多尺度数据库维护成本过高、耗时过长。因此,如何基于一套制图要素数据,在制图专家知识库的辅助下快速成图技术研究成为热点[1-14]。
传统制图综合观念尚未发生根本转变,基于专家知识库的制图综合可以提高制图效率[15],但因制图综合知识的获取受限而无法有效利用。当前机器学习、深度神经网络学习等智能技术手段对模糊定义的方法和半结构化的知识处理还不能高效处理[16]。数据是制图基础,技术是实现手段。基于现有技术手段,要实现真正的自动化制图,还需更多的研究、突破更多的技术壁垒。本文以甘肃省为例,提出基于“一源图”的地图编制现代化生产体系,将多源的制图数据进行规则化处理,在目前专家知识有限、自动综合算法还不理想的情况下,实现多尺度地图快速自动化成图。
“一源图”是以固定数据精度标准建立制图要素数据库,进行地理实体要素由空间数据向制图数据的转化,并对制图要素相关数据统一管理,统一更新维护,实现一次建库,多级、多场景使用。通过对甘肃省域地理特征及现有数据的分析,确定以1∶10000比例尺精度标准,设计水系、交通、居民地、其他地理要素实体等制图要素数据标准,对各行业专业数据、地理国情普查监测数据、基本比例尺地形图数据等进行整理、分类、选取、融合,并对融合后的制图数据进行信息补偿,最终形成“一源图”,为任意比例尺精编提供统一的数据源,为后续的自动综合、制图标准化表达提供高质量的数据,为技术实现做铺垫。
全省地图制图要素数据涵盖普通地图全部要素内容和部分专题内容。具体包含自然村以上居民地、乡村以上道路、水系、乡级以上境界、山峰山脉、高程点、农林牧场、工矿及企事业单位等,专题数据包括文物旅游、自然保护区、地表覆盖、土地利用、石油管道、兴趣点等,还包括等高线、DEM和影像等内容。
为了保证各要素协调统一,需对使用数据进一步进行选取、分类、分级等预处理。除了依据常规数据的制作标准外,根据制图要素的特点,数据属性结构还应满足以下条件:
(1)制图要素分级属性项:根据需求对要素的行政等级进行制图要素分级属性处理,利用“CLASID”字段实现;
(2)制图表达分级属性项:对部分要素的重要程度等利用制图表达分级属性项进行分类,如水系数据进行行政等级和表达分级处理。将全省河流按一级到六级分级,字段为“LEVEL”(河流等级),同时,从河流源头到支流再到主流暂分为十级,并利用“FJ”(分级)字段实现;
(3)标准注记属性项:利用“NAME”属性项记录数据标准名称;
(4)更新及备注属性项:数据分级处理和更新维护过程中记录更新等备注属性项,如DSOURCE为数据来源、XGJL为修改记录、WTBJ为问题遗留说明等;
(5)地图制图要素数据分层及属性表:制图要素数据根据需求分为行政区划、居民地、交通、水系、地理要素、景区景点、兴趣点、专题数据和图斑等,针对制图需求并参照已有大比例尺数据库要素说明,将各要素进行数据分层和属性结构的调整。
综合考虑甘肃1∶10000基本比例尺地形图数据覆盖不全及现势性不够等现实情况,在地理国情普查及监测数据基础上,按1∶10000比例尺精度标准,融合1∶10000、1∶50000和1∶250000地形图数据,国土调查数据,水利普查数据,地名普查数据,公路网数据等。首先对多源数据进行分析,包括数据现势性、权威性,数据格式与数学基础等;然后对矢量数据进行预处理,包括空间基准统一、格式转换、数据裁切、合并以及对栅格数据、文本数据进行结构化处理等;最后根据数据的特征,进行融合匹配处理,生产一套集多源数据信息的融合成果。数据融合处理策略如下:
(1)甄选、提取、融合,融合匹配主要基于位置、名称和类型(编码)的对比分析,将位置基本一致、名称和类型(编码)基本相同的要素判定为同一实体,赋予唯一的标识码,完成数据融合匹配处理。
(2)对行政区划、居民地、交通、水系、地理要素、农林牧场、自然保护地、文物古迹、景区景点、森林公园、地质公园、石油管线、能源矿产等,逐一分析整理,直至将所有矢量数据融合完毕。
(3)由于要素数据尺度与精度各不一样,在自动化匹配融合时常通过缓冲区分析、叠置分析等判断要素的位置是否在一定误差范围内。如果在误差范围内,名称和类型(编码)一致,则给要素赋予同一标识码,判定其为同一地名实体;否则,不进行处理。
数据融合基本的思路(如图1所示):
图1 数据融合基本思路
数据融合是通过自动化和人工匹配方法,尽可能地将所有资料都统计出来,得到地理实体的信息统计表。多源数据的融合、整理、分级处理不仅解决了多源资料之间不一致问题,通过编码也解决了要素的多尺度显示问题。与此同时,利用分级属性对应相应地图符号,也能解决名称注记的合理显示、水系线符号渐变等难题,减少人工参与量,大幅提升了地图编制效率。交通要素分线状和点状两类。线状要素分铁路(LRRL)、公路(LRRL)、城市道路(LCTL)、乡村路(LVLL),铁路包括高速铁路和普通铁路,公路要素包括高速公路、国道、省道、县道、乡道和连接道(匝道和交换道)等,城市道路分主干路、次干路和支路;点状要素分火车站(LRRP)、高速公路出入口(LRDP)和机场(AIRP)。具体如下:
铁路以国情普查数据LRRL为本底数据,利用收集到的专题资料结合最新影像添加在建铁路。公路以国情普查数据LRDL为本底数据。比对公路数据与公路局年报数据,提取变化部分,对照变化部分数据,结合导航路网、最新影像对公路数据进行图形与属性的更新,并填写更新记录(如图2所示)。参照公路局年报数据,添加规划道路并赋予属性,便于后期道路更新。
图2 根据影像添加银西铁路(在建)
对公路数据符号化,并标注公路编码属性,检查道路连通性,避免道路出现不合理中断或编码不正确。同时,为制图表达方便,对公路数据中双线路提取中心线并赋予相应属性(如图3所示):
图3 交通要素双线处理单线前后对比
交通点状要素包括火车站(LRRP)、高速公路出入口(LRDP)和机场(AIRP)。依据《甘肃省第一次全国地理国情普查数据分类、分层及属性规定》,从BUCP(单位院落)层中提取高速公路出入口、飞机场等要素,要素属性沿用国情属性。对高速出入口和飞机场做分级处理,飞机场分公开机场和非公开机场,高速出入口根据制图综合分主要出入口和其他出入口。从“天地图·甘肃”数据中提取火车站数据,并分级为高铁站、普通客运车站和其他车站。
居民地要素分点状和面状两类,具体如下:
乡镇及以上行政点位以国情普查数据为本底数据。从BUCP(单位院落)层中提取政府驻地,参考地名普查数据、行政区划变更文件等复核和更新数据,避免属性错误或图形丢漏。
行政村点位以国情普查数据BOUP7为本底数据,全省地名普查数据为名称依据。基于位置关联,提取名称不同的数据。根据名称分两种情况:
(1)同音不同字,如嵋岘村、郿岘村;或名称相近,如王家沟村、王沟村。此类数据以民政厅提供名称为准;
(2)名字完全不相关,城区点位密集的地方会出现关联错误,如,阳关路社区、同德巷社区,此类问题需定位到具体位置,确认行政村是否存在、名称是否合适。
自然村根据《民政地名地理属性类别代码表》,从全省地名普查数据中提取。
合并数据为BOUP层,增加属性项(DSOURCE、修改记录、问题标记),详细记录数据来源、文件依据及遗留问题。
真形居民地(RESA)从国情普查数据LCRA(地表覆盖层)中提取一级类0500(房屋建筑),结合LCTL(城市道路)和最新影像,制作县级以上真形居民地(如图4所示):
图4 西峰区真形图形制作
复杂、不规整的数据导致在自动综合和成图时会出现更多的错误,增加后期人工工作量。面对此情况,需对融合后的制图数据进行信息补偿,本文通过“先补偿,后表达”的方式,完成制图补偿,再进行符号化表达,取得了较好的地图可视化效果。信息补偿规则包括几何数据标准化、多边形自相交标准化、拓扑弧段的延伸以及节点拟合、面内骨架线修复和提取骨架线融合、要素拓扑语义转换、弧段末稍修正、近似平行的重复道路数据预处理等。
首先是拓扑检查和补偿,制图综合过程中将各类地物转变为拓扑体时需要对拓扑关系进行修复。比如,实体修复、实体纠正、网络联通、分裂溶解、挂接、结点拟合、形状化简等。制图信息补偿主要有要素图形冲突处理和辅助要素生成。要素图形冲突处理主要包括移位、渐变处理、压盖处理、跳绘、自动注记等[17]。辅助要素主要分两种情况:(1)反映地理要素的顺序、位置及指向关系的符号方向自动生成,例如,火车站方向与铁路方向要一致、停车场进出方向、河流流向等;(2)晕带的生成,晕带又分为单侧晕带、双晕带、骑墙晕带等。除此之外,还有行政区划面普色需保证相邻的面颜色不同,同时每种颜色在地图中所占的面积比重大致相同。自然保护区界与其他境界重合时保留其他高等级的境界,街区面综合时保持直角特征,铁路与隧道重合时删除铁路实体并补充铁路休止符使其方向与铁路垂直,显示控制字段属性添加等。
基于“一源图”建设,甘肃省一体化制图平台依托插件式软件架构、图数统一表达模型、综合知识库和制图专家知识库,提供了制图要素自动综合、应急快速出图、地图精编等模块,大幅提升了地图编制效率。图5为1∶50000与1∶10000数据的叠加显示,平台直接加载融合处理后的1∶10000数据的显示(如图6所示)。多源、多尺度数据的融合不仅解决了多源资料之间不一致问题,通过编码也解决了水系多尺度显示的问题,与此同时,通过利用以前制图成果的分级属性,利用各级相应的粗细符号,也能解决水系符号化渐变的难题。
图5 数据叠加显示
图6 融合后的数据显示
多源制图要素数据的融合建设,形成了内容准确、属性完整、现势性强、精度高的全省地图制图要素数据,避免了已有成果的浪费,实现了全省地图制图要素数据、制图资料的统一存储与管理;基于综合知识库和制图知识库,实现了制图要素自动综合和多尺度地图快速成图。
图库一体的“一源图”技术体系设计区别于以往多级制图数据库出图方式,效率更高、维护成本低。在制图综合知识库、制图模板的辅助下,一幅普通全开地图的编制由原来25个工作日缩短为2个工作日,应急批量出图可在1小时内完成,从根本上改变了地图编制的传统作业模式,大幅提高了地图服务响应效率,形成了主动储备、高效服务的地图政务服务保障体系。目前甘肃省地图制图要素数据已应用到甘肃省市县挂图编制,甘肃省地图集编制和甘肃省政务、应急及公益地图日常服务保障中,解决了各项目工期短、任务重等困难。但目前多源异构的数据融合处理自动化程度还不够高,后续还需加大研究。