地质图空间数据库自动检查系统的设计

2010-12-14 12:09韩坤英庞健峰丁孝忠范本贤逯永光
地球学报 2010年6期
关键词:属性数据质量检查空间数据

韩坤英,庞健峰,丁孝忠,范本贤,逯永光

1)中国地质大学地球科学与资源学院,北京 100083;

2)中国地质科学院地质研究所,北京 100037

地质图空间数据库自动检查系统的设计

韩坤英1,2),庞健峰2),丁孝忠2),范本贤2),逯永光2)

1)中国地质大学地球科学与资源学院,北京 100083;

2)中国地质科学院地质研究所,北京 100037

地质图空间数据库数据量大,内容复杂,为了保证数据库的质量,在地质图空间数据库的建立过程中,对数据的全面系统检查工作是非常必要的。对于地质图空间数据库,检查属性数据库的内容以及属性数据与空间图形数据的正确链接是难点之一,也是一项最耗时的工作。为了科学、快速地检查地质图属性数据,保证属性内容的正确性以及非空间数据与空间数据的正确对应,针对这一问题,在进行全国1:100万地质图空间数据库的检查时,设计开发了属性数据库的自动检查系统。本文以近期完成的全国1:100万地质图空间数据库的检查系统设计研究为例,主要介绍了地质图数据库属性数据自动检查系统的设计开发,其中详细介绍了各模块可以实现的主要功能。通过此项检查,能够提高入库数据的质量,为数据库后期的应用与共享提供可靠保障,从而为地质科学研究、矿产勘查及生态环境治理等提供科学的地质图数据资料。

地质图;空间数据库;属性数据库;检查系统

随着计算机信息技术的发展,在地学领域编制和建立了各种比例尺的数字地质图,为了有效的管理和应用这些数据资料,需要建立地质图空间数据库,实现地学信息的集成服务。众所周知,地学数据的基本特征赋予地学数据的复杂性,具有内容复杂,数据量大,多源、多维、多尺度等特性(肖克炎等,2000;吴信才等,2009)。地质图空间数据库不同于一般的关系型数据库,一般数据库只包括非空间数据,是由多个二维表构成,而地质图数据库包括空间数据和非空间数据(属性数据)两大部分,具有空间特性。无论何种数据库,数据的质量是数据库的关键,将直接影响数据库的可用性和精确性,错误的或不准确的数据信息将会产生错误的处理结果,导致错误或不准确的决策(姜作勤,2004)。因此数据的质量控制、数据库的质量检查工作非常重要。地质图数据的质量检查工作一般是在编制数字地质图的过程中和数据入库集成、建立管理系统时进行。数据质量检查是一项非常复杂和费时的工作。通常情况下,数据的完整性、拓扑关系、空间位置、属性数据及属性数据与空间实体的对应关系等需要开发计算机软件进行检查,而制图数据即图面内容的表示主要通过硬拷贝的纸质图由人工进行检查。属性数据也可以通过输出属性表进行人工检查,但是地质图的属性表非常复杂,人工几乎难以完成这样巨大的工作量。因此,改变传统工作方式,开发软件进行系统检查是非常必要的。

数据质量问题是普遍存在的,涉及到各行各业的各类数据产品。随着数据库技术及GIS技术的不断发展,为了提高数据的质量,针对某一类特定的数据,不同的部门也开发了不同的质量检查软件,如针对国家1:5万DLG(Digital Line Graphic,数字线画图)数据开发的质量检查软件,它是基于 ArcGIS平台开发的,软件的设计是针对ArcGIS的Personal geodatabase 数据格式,检查的标准是依据建立该数据库的数据标准;基于 ECAP规则的测井原始资料质量检查软件是一种将事件触发规则和面向对象、事件驱动的环境相结合的方法,是针对石油测井资料的检查;有效值法通常是用于属性数据的有效值检查,用于检查离散型数据,例如如果属性数据是电压的话,它的有效值应该是 200V,110V,12V等;中国地质环境监测院(2009)的地质数据质量检查与评价方法软件是一种基于模板的数据质量检查方法,主要是对于1:25万大比例尺地质图数据库的空间数据的检查(左志进等,2008;刘建军等,2006;张军等,2008;陈俊等,1998;谭福初等,2007;刘平芝,2005)。每一类数据都有其自己的特点,如数据应用的标准、数据格式、数据组织结构、数据命名等。中国1:100万地质图数据库是在MapGIS6.7平台上建立的,包含国际标准分幅的地质图64幅和地理底图64幅,有空间数据、属性数据及元数据。每幅图

根据要素不同分为不同的图层,每个图层又根据几何特征不同分为点、线、面三类几何实体。每个空间数据图层对应一个属性表。全国 1:100万地质图数据库包含1000多个图层文件,数据量大约2.0G。在进行数字地质图编制过程中应用了多源数据,又经过了多个处理程序,主要包括空间数据矢量化、空间数据的转换,空间数据的综合、图幅接边处理、属性数据与空间数据的联接等一系列的处理过程。所以,为了保证数据库的质量,对于1:100万地质图空间数据库必须设计一套检查方法,才能确保数据的质量。

1 地质图空间数据的检查方法

根据中国地质调查局颁发的“中国地质调查局地质调查技术标准《地质数据质量检查与评价》(2006.12)”中规定了定量数据质量元素主要包括数据完整性、逻辑一致性、空间定位准确性、专题数据准确性和图形整饰规范性等内容,在进行中国1:100万地质图空间数据检查时,又结合本数据库的特点,制定了检查的内容和检查的方法。

1.1 空间数据的错误类型分析

造成数据质量问题原因很多,其中在地质图数据库中常见的原因主要为物理介质的变化、多重数据源、数据输入、编辑过程中主观的判断、过松的输入规则、数据量大、不同功能领域的编码数据、数据格式转化、投影变换、数据抽象等等(李军等,2006;白玲等,2006;梁国玲等,2007)。地质图空间数据和属性数据的错误类型主要有:1)空间数据等的不完整或重复,包括点、线、面数据的丢失或重复,数据断线、多边形不封闭等;图层文件、数据表等不完整;2)空间数据位置不准确,点位不准确,线段过长或过短,结点不重合;相邻图幅之间要素接边有误差;3)拓扑关系错误;4)属性与空间数据联接错误;5)属性结构、字段类型及长度与规定不符,属性值数据错误或不完整;6)图面符号表达不清晰、压盖关系不合理;图框外整饰不规范等等。其中,属性数据的检查通过人工方法最难实现。

1.2 数据质量控制方法

空间数据的质量控制是一项复杂的过程,应该贯穿数据的输入和空间数据库建立的每一个环节(陈述彭等,1999)。目前,对于空间数据的检查一般分为传统的手工方法检查和编写处理软件进行检查。

1.2.1 传统手工方法检查

传统手工方法检查主要是针对以下几个方面进行。检查数据的范围是否在规定的范围之内;图层套合检查,同一图层弧段和界线的套合,不同图层间的套合,主要是水系和地层,断层和地层,断层和岩体,地层和岩体界线之间的套合关系;检查水体、海岸线、雪被与地质体边界线是否重合,在喷墨图上或计算机上检查地层之间、地层与岩体之间的压盖关系;检查地理底图图廓的精度;检查地质体的图面表示与属性内容是否一致;检查相邻图幅之间地质、地理内容的接边关系是否合理,检查接边属性是否正确;数据入库后检查按图幅显示是否完整;针对每幅图生成图例,按图例、图层检查属性及面元颜色、填充图案是否正确等。

1.2.2 利用计算机软件检查

利用检查软件对数据进行检查,检查是否存在重复图元和微小图元,并判断其正确性,拓扑关系检查主要是检查水系、地层、岩体、地质界线等的拓扑关系,此项检查主要是应用MapGIS主程序的功能进行检查。对于检查图层、属性结构、属性字段的正确性;地质年代代码与地质代号、色标号、花纹符号一致性;岩石代码与地质代号、色标号、花纹符号一致等关于属性数据库的检查,仅应用MapGIS主控程序来进行检查和修改是非常繁杂的,而且也难以实现,在检查过程中还会有人为的错误产生,而且工作量非常大。针对这种情况,因此基于MapGIS平台,设计开发了属性数据库的检查软件。

2 软件开发技术路线

2.1 开发平台

采用 MapGIS6.7作为开发平台。MapGIS提供了丰富的二次开发手段,主要包括了 API函数库、MFC(Microsoft Foundation Class)类库、COM组件和ActiveX控件等四种开发方式。API函数在使用方法上与Windows的API函数一样,独立于开发工具的。使用Visual C++,Viusal Basic,Delphi可以直接调用(欧少佳等,2005a,b;覃如府等,2005)。MapGIS 类库是为基于 MFC类库的C++开发者提供的多个可重用基类,它将应用程序所需的常见基本功能作了封装,使用便利,改动灵活。开发者只需从类库派生即可使自己的程序获得从窗口显示控制到图形查询编辑的各项功能。MapGIS COM组件是MAPGIS新一代体系结构的表现,功能更加强大,使用更加便利。具有二次开发方便、易于集成、无限扩展等特点。支持多种开发软件,包括Visual C++,Visual Basic,Delphi,Script,InterDev,Power Builder等,开发者可以多层次的访问 MapGIS组件的数据层、功能层和界面层。ActiveX 控件是 MapGIS完成组件化改造的成果之一,它们使得二次开发更为快捷便利,代码的可复用性更高。

地质图空间数据库自动检查系统是选用了Visual Basic6.0和MapGIS6.7的组件式技术结合进行设计和开发的。该程序所用的MapGIS组件和控件有MapGisBasCom1,MapGisDspCom,MapGis-MapCom,MapLayerCom和EditView,除此之外,还用 ADO数据库访问组件 Microsoft Active X Data Objects 2.1 Library。

2.2 标准属性数据库的建立

为了实现属性数据的检查,判断地质图空间信息的属性数据的结构、字段名称、数据项是否正确,需要有一套标准的属性数据库与其对照,进行衡量,才能判断该文件的属性内容是否正确,做出判断。因此,首先根据《1:100万地质图数据库的编图细则》,应用Access软件建立检查系统的标准属性数据库。这些标准属性信息库主要根据《1:100万地质图数据库的编图细则》规定的要求进行建立(图1)。包括地层的年代代码、岩石的分类代码、第四纪成因类型代码、地质界线、断层的分类代码及主要断层名称,地质图用于图面表达而规定的制图参数。在MapGIS系统中,空间要素划分为三种几何类型:点、线和多边形,所有的属性表都对应着空间图形。图2和图3分别列出了部分地层检查的标准规则、全国重要断裂检查的标准规则。这两个表分别代表了线和多边形二种类型。

图1 标准属性表的构成Fig.1 The content of standard attribute table

图2 地层的标准规则表Fig.2 The standard stratigraphic table

图3 全国重要断裂的标准规则表Fig.3 The standard table of important faults in whole China

2.3 系统工作流程

系统工作流程首先由文件操作模块读取地质图空间数据库文件到检查系统,将空间图形显示在基础操作模块的视图中;之后,字段检查和图元检查调用装入文件的属性数据和数据标准信息库的数据,进行校对,把异常图元记录并传递到修改模块;操作人员通过修改和基础操作功能,可以将图元属性数据结合图元空间位置,核定属性数据的正确性,并进行适当的修改;最后,由文件系统将修改后的属性数据保存到地质图数据库中,或者将检查的结果输出到文件中,以便进一步的研究,系统工作流程见图4。

图4 系统工作流程图Fig.4 The flow chart of the system

3 地质图数据库自动检查系统功能设计

3.1 总体框架

检查系统的主要功能模块包括文件操作、地图浏览、MapGIS文件检查、属性字段检查、属性修改等五个部分组成,框架结构见图5。

在进行数据检查时,首先要进入检查系统的初始窗口(图6),操作人员通过这个窗口,可以调用各个功能模块,进行属性数据的检查与修改等。

图5 系统主要功能模块框架结构图Fig.5 The framework of main function module

图6 检查系统初始窗口Fig.6 The interface of the checking system

3.2 主要功能设计及应用

3.2.1 文件模块

数据检查人员可以通过此模块进行文件的读取与保存,包括打开MapGIS的工程文件,点、线、面文件的分别调入,修改后数据文件的保存以及将检查结果导出到Access数据表等功能。

3.2.2 基础操作模块

与 MapGIS主控程序类似,此模块用来浏览打开的地质图文件(缩放,复位窗口等);能对选定的图元进行属性和参数的查看和修改;设置 MapGIS的系统参数和环境(如:还原显示,显示弧段,设置MapGIS系统目录等)。

3.2.3 属性字段模块

属性字段的正确性是图元属性检查的必要前提。因此,在图元检查前,应当保证字段名称、数据类型、数据长度等的正确性。该模块检查内容包括属性项、字段名称、数据类型、数据长度等是否与数据库统一设计要求一致。能够实现字段的检查和字段的修改两部分功能。在装入被检查的工程文件之后,首先应用检查文件模块进行数据属性结构的检查,如果属性的字段名称、数据长度等任何一项与标准不一致,系统便在左侧的列表框中提示哪一项有错误,在图7中所示,检查的是1:100万地质图数据库中其中一幅北京市(J-50)图幅,系统检测到该幅地质图中的地层属性中,地质代号SYMBOL一项数据长度错误,与规定的标准值不一致,必须进行修改后系统才能接着检查每一个图元。在这个模块中可以直接修改。

图7 1:100万北京幅(J-50)地质图属性结构检查窗口Fig.7 The checking interface of attribute structure for Beijing geological map (J-50)at 1:1M

图8 1:100万北京幅(J-50)地质图图元检查结果图Fig.8 The checking result graph of polygon feature for Beijing geological map (J-50)at 1:1M

图9 文件统改窗口Fig.9 The interface of unified correction

3.2.4 检查文件模块

如果被检查的文件属性结构正确,便可应用此模块进行每个图元属性值的检查。此项功能主要是对读入的每个图元的属性与属性标准信息库进行对照,如遇与属性标准信息库的值不一致,系统自动把不符合规范的图元排列出来(系统窗口的左边列表)。如图8所示,对所检查的北京幅(J-50)的地质面文件,所有的问题都在列表中一一列出,由列表中和空间图形中可以看出,其中有一个红色的地质体是晚侏罗纪花岗岩 J3γ,它的CODE1代码应该是103310,但系统检查的结果是 103311,此时可以在修改窗口下进行修改。对于检查的每项结果,都可以通过此窗口进行与空间图形对照修改。

3.2.5 文件统改模块

针对相同错误类型的图元,系统提供了根据条件进行统改见图9;并可以实现对检查模块提取出的有问题的图元进行核对和修改。

应用此软件对《中国 1:100万地质图数据库》中所有图幅进行了全部属性检查,如果是采用人工检查将很难完成。通过检查,保证了所有数据在属性结构、字段名称及类型、字段长度等方面的一致性以及数据文件的完整性,为今后数据库的应用提供了质量保障。

4 结语

1)数据的质量直接影响到数据的应用、决策的正确性。从数据的生产、数据集成和融合,数据质量问题是不容忽视的,国内外都制定了相应的系列标准,用来衡量和检查数据的质量。随着地质领域数据资源的增加,数据质量问题也越来越受到重视。

2)数据库建设已经成为地质科学研究领域的一项重要任务,中国 1:100万地质图数据库已经建立完成,目前正在编制的新一轮《中国区域地质志》将建立各种尺度的地质图数据库、构造图数据库、岩浆岩图数据库、第四纪地貌地质图数据库等,因此,为了确保数据库的质量,数据库的检查工作将是非常必要的,对于如此复杂的地质图空间数据库的检查光靠人工检查是不科学的,应用 GIS技术,开发程序检查可以提高检查速度,保证数据的质量,减少检查过程中人为的因素产生的错误。

3)此项成果是针对新近完成的中国 1:100万地质图数据库的检查开发的一个应用软件。在应用该软件检查数据的过程中进行了不断的完善,通过应用此软件的检查,将属性数据库中的错误率降至最低,从而保证了入库数据的质量。该软件将根据《中国区域地质志》系列地质图数据库的建库标准及数据结构的特点,在进一步修改的基础上,将应用于新一轮的《中国区域地质志》系列地质图数据库的检查与修改,对提高数据库的质量将具有很大的帮助。

白玲,王小平.2006.1:20万数字水文地质图空间数据库建库的质量控制[J].资源环境与工程,20(4):450-454.

陈俊,宫鹏.1998.实用地理信息系统[M].北京:科学出版社.

陈述彭,鲁学军,周成虎.1999.地理信息系统导论[M].北京:科学出版社.

姜作勤.2004.数据质量研究与实践的现状及空间数据质量标准[J].国土资源信息化,(3):23-28.

李军,姜作勤,童小华.2006.地质数据的抽样检查方法研究[J].地理信息世界,(2):8-11.

梁国玲,张永波,张礼中,周小元,张春英.2007.基于GIS的中国地下水资源空间数据库建设[J].地球学报,28(6):572-578.

刘建军,王东华,商瑶玲.2006.国家1:50 000 DLG数据库质量检查软件的设计和开发[J].地理信息世界,8(4):23-26.

刘平芝.2005.1:5万矢量地形数据空间拓扑关系的自动检查方法[J].测绘技术装备,7(1):19-21.

欧少佳,许惠平,陈华根,叶娜.2005a.中国岩石圈数据模型总体设计[J].地球学报,26(3):265-270.

欧少佳,许惠平,陈华根.2005b.中国岩石圈三维结构数据库数据可视化控件的设计与实现[J].地球学报,26(6):577-580.

覃如府,许惠平,欧少佳,叶娜.2005.基于GeoDatabase的中国岩石圈三维结构数据库设计[J].地球学报,26(6):581-586.

谭福初,裴亚波,李广兰.2007.ArcGIS在矢量测绘数据质量控制中的应用[J].北京测绘,(4):45-47.

吴信才,谢忠,周顺平,刘修国,郑贵洲,吕建军,张发勇,刘福江.2009.空间数据库[M].北京:科学出版社.

肖克炎,朱裕生,姜作勤,宋国耀.2000.矿产资源评价空间数据库中的地学数据模型设计问题[J].中国地质,(7):33-35.

张军,李洪奇.2008.基于ECAP规则的测井原始资料质量检查软件建模[J].科技导报,26(12):61-66.

中国地质调查局.2006.中国地质调查局地质调查技术标准《地质数据质量检查与评价》[S].北京:中国地质调查局.

中国地质环境监测院.2009.地质数据质量检查与评价方法软件工具使用手册[R].北京:中国地质环境监测院.

左志进,方德平,李兆雄.2008.国家1:5万DLG数据质量检查软件的设计与实现[J].四川测绘,31(2):89-92.

BAI Ling,WANG Xiao-ping.2006.Quality Control of the Clonstruction of 1:200000 Digital Hydrogeological Map Spatial Data Bank[J].Resources Environment &Engineering,20(4):450-454(in Chinese with English abstract).

CHEN Jun,GONG Peng.1998.Geographic Information System in Practice[M].Beijing:Science Press(in Chinese).

CHEN Shu-peng,LU Xue-jun,ZHOU Cheng-hu.1999.The Introduction of Geographic Information System[M].Beijing:Science Press(in Chinese).

China Geological survey.2006.Standard for geological survey technology of China geological survey.Quality inspection and evaluation for geological data[S].Beijing:China Geological survey.

China Institute of Geo-Environment Monitoring.2009.Manual for software of quality checking and evaluation on geological data[R].Beijing:China Institute of Geo-Environment Monitoring.

JIANG Zuo-qin.2004.Status for research and practice of data quality and spatial data criterion in quality[J].Land and Resources Information,(3):23-28(in Chinese).

LI Jun,JIANG Zuo-qin,TONG Xiao-hua.2006.Research on Sampling Inspection Method for Geological Data[J].Geomatics World,(2):8-11(in Chinese with English abstract).

LIANG Guo-Ling,ZHANG Yong-Bo,ZHANG Li-Zhong,ZHOU Xiao-Yuan,ZHANG Chun-Ying.2007.The Construction of Spatial Database for Groundwater Resource in China Based on GIS[J].Acta Geoscientica Sinica,28(6):572-578(in Chinese with English abstract).

LIU Jian-jun,WANG Dong-hua,SHANG Yao-ling.2006.Design and Development of Quality Checking Software for National 1:50 000 DLG Database[J].Geomatics World,8(4):23-26(in Chinese with English abstract).

LIU Ping-zhi.2005.The Automatic Checking Method for Topological relation Among the terrain vector data at 1:50000[J].Geomatics Technology and Equipment,7(1):19-21(in Chinese).

OU Shao-jia,XU Hui-ping,Chen Hua-gen.2005b.The Design and Implementaion of Geophysical Data Visualization Controls for Chinese 3D Lithosphere Structure Database[J].Acta Geoscientica Sinica,26(6):577-580(in Chinese with English abstract).

OU Shao-jia,XU Hui-ping,Chen Hua-gen.YE Na.2005a.Framework Design for Chinese Lithosphere Data Model[J].Acta Geoscientica Sinica,26(3):265-270(in Chinese with English abstract).

QIN Ru-fu,XU Hui-ping,OU Shao-jia,YE Na.2005.The Design of Chinese Lithosphere 3D Structure Database on the Base of GeoDatabase[J].Acta Geoscientica Sinica,26(6):581-586 (in Chinese with English abstract).

TAN Fu-chu,PEI Ya-bo,LI Guang-lan.2007.The Application of ArcGIS in Surveying Vector Data Quality Control[J].Beijing Surveying and Mapping,(4):45-47(in Chinese with English abstract).

WU Xin-cai,XIE Zhong,ZHOU Shun-ping,LIU Xiu-guo,ZHENG Gui-zhou,LV Jian-jun,ZHANG Fa-yong,LIU Fu-jiang.2009.Spatial Database[M].Beijing:Science Press(in Chinese).

XIAO Ke-yan,ZHU Yu-sheng,JIANG Zuo-qin,SONG Guo-yao.2000.Design Problems for geoscience data model in Geospatial Database of Mineral Resources Estimating[J].Geology in China,(7):33-35(in Chinese).

ZHANG Jun,LI Hong-qi.2008.Modeling of the Quality Check Software for Log Data Based on ECAP Rules[J].Sciences &Technology Review,26(12):61-66(in Chinese with English abstract).

ZUO Zhi-jin,FANG De-ping,LI Zhao-xiong.2008.Design and Application of Quality Checking Software for National 1:50 000 DLG Data[J].Surveying and Mapping of Sichuan,31(2):89-92(in Chinese with English abstract).

The Design of the Automatic Checking System for Geological Map Spatial Database

HAN Kun-ying1,2),PANG Jian-feng2),DING Xiao-zhong2),FAN Ben-xian2),LU Yong-guang2)
1)Faculty of Geosciences and Resources,China University of Geosciences,Beijing100083;
2)Institute of Geology,Chinese Academy Geology Sciences,Beijing100037

The geological map spatial database is large and complicated.To ensure the quality of the database,it is essential to check the data systematically during the database construction.In design of the geological map spatial database,the check of the content of the attribute database and the proper connection between the attribute data and the spatial map data constitute one of the difficult points and also the most time-consuming work.In order to ensure the correctness of the attribute data and the correct correspondence between space and non-space data,and to check the geological map attribute data quickly,the authors have designed the automatic checking system for attribute database of the national geological map (1:1M).With the recent spatial database of the national geological map (1:1M)as an example,this paper presents the design of automatic checking system for geological map spatial database and describes the function of the modules in detail.This checking system improves the data quality,provides a reliable guarantee for data application and sharing,and also supplies scientific geological map data to geosciences research,mineral exploration and ecological environment renovation.

geological map;spatial database;attribute database;checking system

TP311.131;TP274.3;TP311.1

A

1006-3021(2010)06-885-07

本文由地质大调查项目(编号:1212010511501;1212010911001;1212010811033)联合资助。

2010-08-20;改回日期:2010-09-16。责任编辑:闫立娟。

韩坤英,女,1966年生。博士,副研究员。主要从事区域地质综合编图、GIS及其应用研究。通信地址:100037,北京市西城区百万庄大街26号。电话:010-68994825。E-mail:kunyinghan@163.com。

猜你喜欢
属性数据质量检查空间数据
审计署赴江西省审计厅质量检查座谈会
基于GIS的房产测绘管理信息系统架构研究
无源多传感器综合数据关联算法研究
属性数据分析教学改革初探
中注协举办2016年证券资格会计师事务所执业质量检查人员培训班
加强会计信息质量检查促进会计基础工作规范
元数据驱动的多中心空间数据同步方法研究
网络中多敏感属性数据发布隐私保护研究
基于文件系统的分布式海量空间数据高效存储与组织研究
客户端空间数据缓存策略