测绘地理信息元数据自动化检查的设计与实践

2023-02-23 11:32王晓迪陈春希闫庆庆
北京测绘 2023年1期
关键词:数据项测绘成果

王晓迪 马 伟 陈春希 闫庆庆 董 帅

(国家测绘产品质量检验测试中心, 北京 100830)

0 引言

元数据(Metadata),即数据的数据,是关于数据和信息资源的描述性信息。测绘地理信息元数据是关于地理空间相关数据和信息资源的描述性信息[1]。它不仅是对数据简单的描述或索引,更关系到数据成果的最终应用。生产者通过其记录测绘地理信息数据说明;使用者利用其了解测绘地理信息数据的基本特征;管理者通过其可以对测绘地理信息数据进行有效的管理和利用;检查者通过其了解生产过程,并将其与相应成果数据对照检查。测绘地理信息元数据的质量关乎数字地理信息成果的应用及共享。其生产正确、应用正确,是相应数据成果的质量保障。因此,对测绘地理信息元数据的检查至关重要。

本文结合测绘地理信息元数据的内容与特点及检查要求对其内容分类。分析检查内容与方法,针对每类元数据提出相应的自动化检查方案,为高效、准确地完成测绘地理信息元数据质量检查提供参考。

1 测绘地理信息元数据内容特点与检查方法

1.1 内容

测绘地理信息元数据主要包含以下内容:

(1)记录相应数据成果的名称。项目名称、产品生产单位名称、参考资料名称等。

(2)描述相应数据成果的属性。比例尺、数据格式、影像分辨率等。

(3)固定相应数据成果的位置。经纬度坐标范围、图廓角点坐标、中央子午线等。

(4)关联相应数据成果的精度。高程中误差、平面位置中误差等。

(5)标示相应数据成果的进程。质量检查情况、外业调绘核查情况、完成日期等。

1.2 特点

测绘地理信息元数据主要有以下特点:

(1)内容不完全固定。具有一定的规律性[2],但其内容广泛,随相应成果数据变化而变化,因此,并非所有内容都是固定的。其在不同测区的中央子午线、参考资料名称等内容不尽相同。

(2)贯穿全流程。生产贯穿其相应成果数据生产全流程[3],全面反映其相应数据历程及状况。

(3)生产方式人机结合。有规律、重复的内容可通过软件自动化生产。存在变量的内容需要人工输入[4],如图名、成果数据量、平面位置中误差及高程中误差等。

1.3 检查方法

根据《基础地理信息数字产品元数据:CH/T 1007—2001》[5]以及项目技术设计要求,按《数字测绘成果质量检查与验收:GB/T 18316—2008》[6]中规定内容,检查元数据项及元数据各项内容错漏。检查内容如表1所示。

表1 元数据检查内容

测绘地理信息元数据生产人工输入易出错,同理,利用人工检查的方式也弊端凸显,效率低下且易产生人为误差。

依靠软件全过程自动化检查难以实现,主要原因有以下两点:

(1)测绘地理信息元数据的形式与内容具有多样性,常规的基础地理信息数字产品(4D产品)元数据内容可参考《基础地理信息数字产品元数据:CH/T 1007—2001》标准,但是难以满足不断涌现的新型数字测绘成果元数据的需求。

(2)不同项目的需求不同,对测绘地理信息元数据也有不同的数据规定,根据自身项目的特点扩展规则复杂。如地理国情监测元数据层中若只包含对地表覆盖分类数据内业采集情况的说明,不包括其他内容,则扩展元数据层名称为V_MIDCA_A。

2 测绘地理信息元数据分类

测绘地理信息元数据包含多方面内容,生产方式多样[7],因此单一的、通用的检查方法难以满足检查者的需要,应以不同的方法分类应对。这就需要对测绘地理信息元数据内容进行分类,而相关标准CH/T 1007—2001及《地理信息 元数据:GB/T 19710—2005》[8]中未对其分类进行明确规定。相关内容中,GB/T 19710—2005对元数据的分级侧重于从使用者的角度需要了解元数据的详细程度[9];CH/T 1007—2001从生产者的角度对数字栅格地图、数字正射影像图、数字高程模型和数字线划图四种成果对应的测绘地理信息元数据的内容和格式进行了详细要求,未对这四类元数据各自的内容进行分类。

结合测绘地理信息元数据内容及相关标准,按近年来国家重大测绘地理信息项目对测绘地理信息元数据的质量要求,依据其检查方法,可分为以下四种情况:部分项中相同的、具有一定规律性的内容可与项目设计要求的固定填写内容对照;坐标值、中央子午线等内容需按公式计算后与被检元数据项比对;误差、精度等值要通过关联误差统计表来查看;质量问题描述内容依据实际检查情况整理形成。因此,从检查者的角度可将测绘地理信息元数据内容分为四类:

(1)固定类[10]。具有相同参数即相同内容的元数据项,如比例尺、产品生产单位名称、数据格式、项目名称等。实例如:基础性地理国情监测元数据中V_MBIIA层(数据生产单位)。

(2)计算类。利用对应的图号、图幅等信息进行计算得到的元数据项,如根据标准分幅图号,可以计算得到对应的经纬度坐标、图廓角点坐标、中央子午线等[11];依据数据计算得到的分辨率等。实例如:基础性地理国情监测元数据中V_MDOPA层(平面位置中误差、高程中误差)。

(3)关联类。从已存在的元数据项或其相应成果数据中读取并录入有关的元数据项。如数据精度、生产日期、平面位置中误差等。

计算类与关联类相同之处是每个图号、景号等信息对应唯一的计算类和关联类元数据项,不同之处是计算类可以由其他元数据项(如标准分幅图号)进行计算而得到,关联类必须借助生产过程中其他的记录文件而获取。

(4)描述类。前三类测绘地理信息元数据项填写的内容值是相对确定的,可以通过程序进行计算或读取相关记录文件而得到。而描述类元数据项主要是根据元数据项定义的要求,对数据变量表达的内容用简洁明确的语言进行描述。实例如:基础性地理国情监测项目中,元数据成果中V_MFSVL层(外业调绘核查情况)中“问题及处理意见”一项,对外业调绘核查中遇到的问题及处理的意见进行描述,不同的问题及处理意见对应不同的描述。

3 测绘地理信息元数据自动化检查

3.1 检查模板

检查模板,是在元数据内容分类的基础上,依据不同项目设计要求进行元数据项的扩展及字段定义不同的约束条件形成的对元数据内容要求的集合(图1)。具体包括,元数据项及元数据内容、类型、计算公式、枚举值、阈值、逻辑关系等。通过以检查模板为驱动的检查,实现元数据完整性、正确性以及逻辑性的检查[12]。

图1 基于四类检查模板的自动化检查方法

(1)对于固定类的测绘地理信息元数据项,在检查模板中输入正确的固定类元数据项内容,读取被检查的元数据与元数据检查模板中的内容进行一致性的比对检查,内容一致为正确,反之为错误。

(2)对于计算类的测绘地理信息元数据项,在对应的检查模板中需读取其他相关元数据项,如标准图号等,计算得到此类元数据项的正确值,与被检查的元数据值进行比对检查。

(3)关联类的测绘地理信息元数据项在检查过程中无法读取生产过程中的记录文档来进行检查,因此,制定检查模板项时,可采用设置阈值或逻辑判断的方法。阈值检查法适用于元数据项存在限值的情况,逻辑判断法是利用元数据项之间的逻辑关系来进行判读。

阈值检查法通过内设阈值,与被检查的元数据项进行比对,在其阈值范围内为正确,反之为错误。如DEM元数据中“高程中误差”项,若比例尺为1∶2 000,且为山地,根据标准《基础地理信息数字成果 1∶500 1∶1 000 1∶2 000 数字高程模型:CH/T 9008.2—2010》中规定,高程中误差小于1.50即为合格成果,因此在制定此项检查模板时,需要结合 “比例尺”项内容(元数据中无地形类别项),设定限值2.0为阈值(在无法判读地形类别情况下,按照1∶2 000比例尺DEM最大高程中误差限值设定),与被检查项进行比较,填入的地理信息元数据项大于0且小于2.0为正确,反之为错误。

逻辑判断法是利用多个地理信息元数据项之间的逻辑关系检查。如某项目中, “二级检查完成日期”,需用“一级检查完成日期”与“验收日期”元数据项所填写的日期之间的逻辑关系判断。二级检查完成日期必定在一级检查完成日期与验收日期之间,如果填写的日期在这个范围内为正确,反之为错误。

(4)描述类测绘地理信息元数据项存在不确定性,没有统一的标准或参考,难以通过上述方法完成检查。需设置必要关键字,利用模糊查找的方法与必要关键字进行比较,排除部分内容后再使用人机交互的方法进一步检查。如基础性地理国情监测元数据成果中V_MFSVL层(外业调绘核查情况)中“问题及处理意见”一项,可设置“已处理”“已修改”等必要关键词,与被检查元数据项进行模糊查找,排除无必要关键词的元数据,将筛选出的疑似正确项结合人工检查进一步判定其是否正确。

3.2 检查流程设计

以各类元数据项对应得检查模板为基础的自动化检查流程,包括模板制作、元数据读写、元数据检查、结果展示四个部分。

(1)模板制作。检查模板以相关标准为基础,兼容如TXT、Excel、Access、MAT等格式。根据不同项目、不同成果类型,按照项目要求进行个性化的调整编辑、配置参数,实现模板属性项结构定义的增加、修改、删除及相关项的计算、设置阈值、关联等功能[13]。

(2)元数据读写。设置元数据读写端口,打开被检元数据,加载制定好的对应的模板。

(3)元数据检查。按表1设置检查项,分为自动检查项和交互检查项。自动检查项主要涉及元数据组织、可读性、格式、命名、存储、坐标系统和部分元数据内容检查。交互检查项主要涉及元数据内容检查,主观性高于自动检查项[14]。被检元数据匹配模板对应检查项执行检查步骤。

(4)结果展示。实现对结果的浏览、空间分析[15]、排查操作,包括放大、缩小、属性选择、定位问题出处等功能,以便核查。

检查流程如图2所示。

图2 检查流程

4 检查实例

4.1 检查概况

地理国情项目,成果中含有元数据成果,为必查项。对元数据成果进行检查,采用自动化检查及人机交互的方式,对元数据项错漏及元数据项内容错漏进行检查,分析其组织、命名、个数、顺序是否正确。

4.2 主要质量问题

(1)元数据中有多种参考资料的,填写时未用“/”隔开。属于固定类测绘地理信息元数据项错误,模板中按技术规定要求设置填写格式,自动化检查后显示在检查结果界面,无须进一步排查。

(2)元数据缺少图层MDOP。属于固定类测绘地理信息元数据项错误,模板中按技术规定要求设置层名,自动化检查后显示在检查结果界面,无须进一步排查。

5 结束语

测绘地理信息元数据是测绘地理信息数字产品中的一项重要成果,它全面反映了其相应成果数据生产过程、数据状况等信息。本文对测绘地理信息元数据项进行分析,总结出固定类、计算类、关联类、描述类这四类元数据项,并结合上述四类元数据项的特点,制定自动化检查的方案,实践证明本方案可行且通用,可有效提升各类元数据质检效率和成果质量。为取得更好的质量控制效果,自动化检查方案还需不断优化、扩展,例如:①加入质量评价流程,对在结果展示流程核查后确保无异议的检查结果进行统计分析,输出检查记录表及评分表;②在完成质量评价流程后实现元数据内容和结构的自动修复。在今后的质检工作中,还需继续深入研究,形成完整的元数据自动化检查评估体系。

猜你喜欢
数据项测绘成果
一种多功能抽签选择器软件系统设计与实现
非完整数据库Skyline-join查询*
浙江省第一测绘院
工程测绘中GNSS测绘技术的应用
基于Python的Asterix Cat 021数据格式解析分析与实现
工大成果
“走出去”成果斐然
“健康照明”成果聚焦
04 无人机测绘应用创新受青睐
无人机在地形测绘中的应用