赵桂华
(1.北京航天宏图信息技术股份有限公司,北京 100195)
地理国情监测是全面了解国情、把握国事、制定国策的基础性工作[1-3]。2015年第一次全国地理国情普查完成后,2016年、2017年连续两年开展了基础性地理国情监测,其成果已在生态文明体制改革、民生保障、应急救灾、重大国情国力调查等多个领域中发挥了重要作用。从2016年起地理国情信息获取进入常态化监测阶段,在地理国情普查的基础上,采用与第一次全国地理国情普查相一致的内容体系,覆盖全国,面向通用目标,综合考虑多种需求进行年度监测,持续为各类应用提供地理国情信息支撑和业务化、常态化监测服务。本文结合2018年度基础性地理国情监测的生产实际,探讨了地表覆盖分类数据和地理国情要素成果的质量控制方法,并针对生产中出现的典型质量问题提出了应对策略,为常态化基础性地理国情监测项目提供技术支撑。
基础性地理国情监测[4]是指以第一次全国地理国情普查成果或年度地理国情监测成果为本底,以年度监测为手段,结合各种自然、人文地理要素的自然变化规律和周期以及社会经济发展需求制定监测内容,每年对地表覆盖分类和重要地理国情要素进行一次更新,对全国范围内各种自然、人文地理要素动态变化及其特点进行经常性、规律性监测。
2018年度基础性地理国情监测[5]主要利用时相符合基础性地理国情年度监测要求的高分辨率航空航天遥感影像,整合最新的基础地理信息数据以及相关部门专题数据,监测全国地理区情变化情况,对任务区范围内2017年监测成果进行更新,形成现势性强、高精度、全覆盖的地理国情信息数据库和标准权威的时间序列化地理国情信息产品。
2018年度基础性地理国情监测按照“内业为主、外业为辅”的原则开展工作,收集分析了2017年6月30日—2018年6月30日的各类资料,以国家统一提供的2017年基础性监测成果数据为本底数据,基于监测区域第一次全国地理国情普查成果数据和监测中获取的遥感影像数据,采用遥感影像解译、变化信息提取、数据编辑与整理、外业调查等技术方法,充分利用已收集的解译样本数据辅助内业解译,结合多行业专题数据,重点针对地表覆盖分类和地理国情要素内容采集各类变化信息、识别变化区域、补充新增内容,对本底数据进行更新。内业无法获取和难以识别的区域辅以外业调查,确保变化信息采集的准确性,使地理国情数据成果的现势性尽可能反映2018年时间点的状态。
2018年度基础性地理国情监测的生产流程主要包括影像资料和专题资料的收集整理、遥感影像正射纠正、内业变化信息采集、外业调查与遥感解译样本采集、内业编辑整理、元数据信息采集、任务区域接边处理、数据集汇总、质检验收与复核阶段、数据汇交建库阶段(入库前检查、预处理、入库、入库后处理)等。
基础性地理国情监测的生产环节众多,数据组织严密复杂,对生产中的每个环节成果进行质量控制和检查是保证基础性地理国情监测最终提交的数据成果质量符合国家标准、行业标准的重要手段。
2018年度基础性地理国情监测质量控制方法在持续遵循分级质量管理、全过程质量控制、标准统一、科学评价等原则的基础上,强化过程质量控制、严格成果质量检验,将质量问题消除在生产过程当中,确保监测成果质量满足数据成图和数据入库的要求。
质量控制严格执行“两级检查、一级验收制度”[6],生产单位负责一级检查,质检科负责二级检查,专门的测绘产品质量监督检验站负责一级验收,验收后成果由国家测绘产品质量检验测试中心复核,确保监测成果质量与全国监测成果质量保持同一水平。
基础性地理国情监测的内业成果包括地表覆盖分类数据、地理国情要素数据的本底数据集和变化信息数据集,国情监测元数据成果以及各类文档数据。地表覆盖分类数据包括种植土地、林草覆盖、房屋建筑(区)、铁路与道路、构筑物、人工堆掘地、荒漠与裸露地表和水域等。地理国情要素数据包括铁路与道路、构筑物、人工堆掘地、水域、地理单元等,还包括提取汇集形成的路网、水网数据对应的弧段层等内容。
地表覆盖分类数据集和地理国情要素数据集是主要的内业成果。对于地表覆盖分类数据集成果,主要检查数据集的空间参考系、时间精度、逻辑一致性、采集精度、分类精度、属性精度和表征质量等内容。对于地理国情要素数据集成果,主要检查要素数据的空间参考系、时间精度、逻辑一致性、位置精度、属性精度、完整性和表征质量等内容。
内业成果质量控制主要是对地表覆盖分类数据集和地理国情要素数据集的成果进行质量检查,改进质量控制方法,提高作业人员的理解力和作业技能,在检查、修改、再检查、再修改的不断磨合中,逐步提高成果数据的总体质量水平,把问题消灭在过程中,这样才能使问题不累积,确保最终的监测成果质量达到国家规定的标准。
地表覆盖分类和地理国情要素数据集的时间精度、采集精度、分类精度在生产前期主要采用人工检查的方式,在生产后期采集精度和分类精度主要采用人机交互检查的方式。通用内容检查[7]主要采用国情专业软件自动检查的方式,如检查大地基准、高程基准、地图投影等空间参考系数学要素,检查数据之间概念一致性、格式一致性、拓扑一致性等逻辑一致性要素。表征质量则主要采用人机交互检查的方式。
根据2018年某地区基础性地理国情监测生产的实际,本文主要采用3种检查方法对地表覆盖分类数据集、地理国情要素数据集、国情监测数据生产元数据成果进行质量检查。
1)人工检查。其重点是变化信息提取的完整性、属性判别的正确性、采集时的精度是否超限、变化信息与本底数据的关联检查等内容。
在内业变化信息提取、内业编辑整理阶段,地表覆盖分类数据集的采集精度主要是检查图斑与正射影像套合是否超限、图斑几何位置接边是否超限等问题;分类精度主要是检查图斑分类的正确性、变化识别的完整性;时间精度主要是检查原始资料数据源、监测数据成果是否符合时点要求。地理国情要素数据集的位置精度主要是检查与正射影像数据成果套合时位置超限、与地表覆盖分类数据套合明显不合理的要素、要素几何位置接边超限等错误;属性精度主要是检查地理国情要素分类的正确性、属性值错漏、属性不接边等。
现阶段,通过人工检查的方法核对监测变化元素、判断内业变化图斑提取的正确性仍是质量控制的主要方法。人工检查图斑提取边界的采集精度和图斑的分类精度是基础性地理国情监测生产中质量控制的重点与难点。根据实际生产经验,前期人工检查做得越好,后期软件检查与人机交互检查的工作量就越少,整体项目质量才能得到更好的保证。内业成果质量的重要指标依靠软件检查是不够的,因此前期的人工检查非常重要,是保障数据质量的关键环节。
2)软件自动检查。在项目生产过程中,国家下发了不同阶段的质检软件对数据质量进行统一把控。根据检查方案,利用质检软件,计算机可自动批量地对成果进行空间参考系、逻辑一致性的相关检查。数据预处理、成果汇交、入库检查等内业生产阶段成果主要采用软件自动检查的方式对质量进行控制。
2018年度地理国情监测项目,在完成项目的成果验收后、成果数据提交国检中心质检前,利用最新下发的地理国情监测数据入库检查工具对矢量数据进行了属性一致性、变化数据枚举值域、图层完整性、所有要素归属正确性、变化数据所有要素几何异常、道路要素数据不能自相交和自相重叠、乡道联通性、图层完整性等检查,并采用人工方法对软件查出的问题进行一一排查。在实际生产中,利用国家下发的地理国情监测软件对完成的数据成果进行检查是一个多次反复的过程,每次问题检查后均需采用人机交互的方式进行问题排查与修改,直至达到要求为止。
3)人机交互检查。现阶段,软件查出的问题还不能实现自动改正,必须采用人工方法对软件检查的结果进行逐条排查,对存在的问题进行改正。根据实际生产经验,在内业变化信息提取工作结束后,利用ArcGIS软件对内业数据成果进行拓扑检查,及时排查改正存在的重复面、缝隙等问题,可减少后期利用软件进行检查时的问题数量,有效提高工作效率。
在内业变化监测的过程中,由于内业环节较多,若上一个环节的质量不合格将连带到下一环节中,且需一并修改,因此内业质量控制尤为重要,这也是矢量生产的繁琐与互相关联之处。针对生产中出现的典型质量问题,本文通过分析提出了应对策略,为国情监测生产提供了一定的借鉴。
地表覆盖分类数据成果质量控制的重点是一级类、二级类的采集精度、分类精度以及其他普遍性问题。在地表覆盖分类内业变化图斑提取中,质检人员常遇见的问题包括采集精度不符合要求、地物要素图斑丢漏未更新等。
1)采集精度。地表覆盖分类数据的采集精度反映了采集的地物界线和位置与影像上地物的边界和位置的对应程度。根据项目技术设计书规定,在合格正射影像的基础上,影像上分界线明显的地表覆盖分类界线、地理国情要素边界以及定位点的采集精度应控制在5个像素以内,如存在高层建筑物遮挡、阴影等特殊情况,采集精度原则上应控制在10个像素以内。由于摄影时存在侧视角,应对具有一定高度的地物在影像上产生的投影差进行处理,以符合采集精度要求。生产中通常会出现建筑区、道路边线、水域等地表覆盖的边线采集不准确的情况,如图1、2所示。
2)分类精度。地表覆盖分类数据整体的分类精度需满足质量检验的合格标准。地表覆盖分类数据中,分界线明显的图斑,应严格按照归类要求正确归类;在没有明显分界线的过渡地带,地表覆盖分类数据中的图斑应至少保证符合上一级类型的归类要求。分类和采集指标在本底数据基础上有细化要求的类别,应进行细化更新。种植土地、林草覆盖类图斑应确保一级类正确,若在影像上发现原有种植土地、林草覆盖类图斑范围有明显变化,但难以确定是否发生跨一级类变化的,应通过外业核查等方式确定变更后的具体类型。
生产中常见的分类精度典型错误包括两期影像变化图斑漏更新、与外业分类范围不一致的错误更新、两期影像无变化图斑多余更新等情况。两期影像变化图斑漏更新情况如图3、4所示,图中黄色标记处为漏更新的建筑物。生产中出现的其他问题包括个别CHANGETYPE代码的填写错误、TAG属性赋值错误、图斑中存在重叠面等。
图1 道路边线采集精度超限
图2 房屋建筑采集精度超限
图3 2017年影像
图4 2018年影像
地理国情要素数据成果质量控制的重点是交通、水域、构筑物、地理单元等数据集中地理国情要素的位置精度、属性精度与完整性等问题。
1)位置精度。地理国情要素的位置精度主要是指地理国情要素的几何位移与不同行政单元之间的矢量接边情况是否符合GQJC 01-2018《基础性地理国情监测数据技术规定》[8]中的要求。生产中常见的位置精度典型错误包括道路中心线与桥梁、隧道、车渡等要素的中心线不重合;少数出入口位置不正确,出入口应采集在匝道与高速公路的相交处;道路中心线、河段结构线或中心线、堤防、高水界等在不同市/区/县之间的行政界线处不接边等。公路桥位置不正确的典型错误如图5所示,图中绿色为道路中心线,红色为公路桥的中心线,黄色为标注的问题。
2)属性精度。地理国情要素的属性精度主要是指分类代码值和属性值是否存在错误。常见的属性精度典型错误包括CC码填写错误,要素漏填GB码;地表路面更新但地理国情要素中道路漏更新;HYDL与HYDA线面拓扑关系错误;地表覆盖分类1001与要素高水界逻辑关系错误等。常年河分类码错误如图6所示,在图中常年河分类码误填为沟渠分类码。
3)完整性。地理国情要素的完整性主要是指地理国情要素数据集是否存在要素多余、要素遗漏等情况。生产中常见的完整性典型错误包括BUCP层漏采集资料中存在的居住小区、工矿企业、单位院落,个别村委会在城镇功能综合单元BUCP层多余表示,BUCP层单位名称与资料不一致等情况。
图5 公路桥位置不准确
图6 常年河CC码填写错误
地表覆盖分类和地理国情要素成果出现的错误,一方面是由于监测数据生产的专业性、复杂性,另一方面与项目的生产组织、作业人员的技术水平等因素有着不可分割的关系,因此这些质量问题可从以下方面进行克服:
1)重视阶段性培训,加强培训的针对性,做到培训内容与生产所处的阶段相结合,不断提高作业人员的技术水平和细致作风。
2)加强项目管理,强化全过程质量控制,把工作做细做实,这样才能保证成果数据集的质量,提交合格的成果。
3)严格人工检查要求,制定问题改后复查制度,提高全体人员的质量意识。
4)合理利用质检软件对成果数据的逻辑一致性、属性一致性、图层完整性等进行自动检查,采用人机交互检查的方式逐条对问题进行改正,实现把问题查清楚、查彻底、查全面,以保证成果数据集的质量符合技术设计书、技术规范等的要求。
本文以基础性地理国情监测地表覆盖分类和地理国情要素成果的质量检查方法和检查内容为依托,论述了成果质量控制的关键技术问题;并结合项目实施情况,对地表覆盖分类成果的采集精度和分类精度以及地理国情要素的位置精度、属性精度和完整性等质量元素常出现的典型问题进行梳理归纳,提出了应对策略,为常态化基础性地理国情监测项目提供了技术支撑。