范志坚,付 蓉
(1.云南省基础地理信息中心,云南昆明650034;2.云南省测绘工程院,云南昆明650033)
不同时期1∶10 000 DLG入库数据的处理
范志坚1,付 蓉2
(1.云南省基础地理信息中心,云南昆明650034;2.云南省测绘工程院,云南昆明650033)
不同时期、不同测区的1∶10 000 DLG数据,由于执行不同的生产标准,因此造成数据间的差异,并给数据入库带来巨大的困难。为满足入库数据标准,探索通过软件工具与测区数据处理方案相结合的方法来处理入库数据不一致的数据现状,以确保入库数据的一致性和可靠性,并介绍该处理方法的相关技术。
DLG数据;软件工具;处理方案;数据处理
自2000年以来,作为云南省基础测绘重要项目的1∶10 000基础地理信息数据已累计生产3 692幅(截至2009年12月),并以每年500幅左右的生产速度递增。为了有效管理和应用已生产的1∶10 000数字产品,本着边生产、边入库和边应用的方针,结合生产进度,对全省1∶10 000基础地理信息数据进行分批质检和入库,并通过空间数据库管理平台,实现对全省基础地理信息数据的统一管理。
2010年应入库的DLG数据为1 852幅,这些数据是不同测区不同时期生产的数据,如图1所示。这些数据之间存在的问题是:① 时间跨度长,从2006年5月至2009年12月;② 测区及设计标准多,共有9个测区及相应的设计标准;③ 图幅数量多,合计1 852幅;④ 不同测区相同地物要素所在层、字段名、GB码等不一致;⑤各测区相同内容的层命名不一致;⑥生产的数据格式与入库数据格式不一致等。因此,必须将上述数据按入库数据标准进行入库前数据处理。本文阐述了按入库数据标准进行入库前数据处理的具体方法和过程。
1.数据处理原则
1)一致性原则:数据中的图幅分层、要素分类编码标准、数据拓扑关系、概念和格式必须一致。
2)完整性原则:数据在覆盖范围、图幅总数量、要素、数据层与内部文件等几个方面要满足完整性要求。
图1 入库数据测区分布及测图时间
3)正确性原则:数据需要满足图形拓扑,以及属性项名称、类型、长度、顺序和属性值、分类等内容的正确性要求[1]。
2.数据格式转换
2009年12月以前生产的数据格式为Coverage格式,入库数据格式为MDB格式。按入库数据格式要求,需将DLG数据从Coverage格式转换到MDB格式。转换过程如图2所示。
图2 数据格式转换过程
3.对MDB格式数据的处理
1)冗余数据删除:将每个数据层的Coverage格式转换为MDB格式后,都有数据层名+_tic层或者面状要素数据层名+_label层,如图3所示,这些数据层为冗余数据层,应删除这些数据层。
图3 格式转换前后地物要素的对应关系
2)属性字段名与属性处理:由于各测区数据在实际生产过程中的生产标准不统一,从而导致各测区同层数据的属性字段名规定不同,以及相同属性内容存储于不同的属性字段名中。因此,需要统一到入库数据标准的属性字段名中。为了满足入库数据标准,应对属性字段名与属性进行属性的映射与内容转换,并进行属性字段名的添加、删除和赋属性值的工作,如表1所示。
表1 字段名及属性处理
3)图层拆分与整合:创建一个新的地物类数据层,针对相同地物类数据层中不同GB值的地物要素,通过GB值的选择,将其中需要的地物要素提取至新的地物类数据层中。如建立新线层brglk_arc (属性结构与入库数据标准相同),将bount_arc层(境界线层)中GB值为610612(国营农林牧场界)、620102(特殊地区界)、620602(自然保护区界)的地物要素通过GB值的提取,放至新创建的brglk_arc层中;或者通过GB值选择,将同一个地物类数据层中不同GB值的地物要素,放到已有相同地物要素不同的数据层中,如表2所示;或者通过GB值选择,将相同地物要素不同数据层中的数据整合到相同地物要素同一个数据层中,如表3所示。
表2 数据拆分对应表
表3 数据整合对应表
4)注记层说明注记的提取:在annpt注记层中含有图廓信息和说明性注记,图廓信息可以不入库,但说明性注记不能丢失,应对此层说明性注记数据进行数据的提取。可通过行政区划面状要素的形状以及空间包含关系来选择落在该区域的说明性注记点状要素数据。
5)代码GB值的归并统计和检查:不同测区生产的相同地物要素的GB值不一致,应对这些出现不一致的代码值进行归并。可根据9个测区设计书中用到的代码值,按入库数据的GB码标准,对9个测区的代码值进行代码值归并整理,形成《新旧GB代码转换与数据转层说明表》,如表2~表4所示。
6)图层重命名:将各测区相同内容不同层名的数据层,统一到同一种能满足入库标准要求的命名方式当中,如表4所示。
1)处理工具的开发:以ArcGIS Engine组件库为开发平台,在.NET环境下用C#语言开发。
2)处理方案的形成:依照国家规范,本着尽量精简库体容量和最大限度地保留原始数据属性信息的原则,综合分析基础库建成之后可能的应用方向,来制定数据处理方案,如数据库制图、框架库建立等。笔者根据测区数据情况分别制定了景东景谷测区、凤庆测区、华坪禄劝禄丰寻甸勐腊测区3种不同的数据处理方案。在这3种不同的方案中已包含原6位GB码属性字段名的添加、删除和赋属性值,以及新6位GB码赋值[2]、冗余数据删除、图层拆分与整合、注记层说明注记的提取、图层重命名等处理功能。
3)处理工具和处理方案的技术路线或流程如图4所示。
图4 技术路线或流程
处理工具对数据的处理过程如图5所示。
图5 数据处理过程
为了在数据处理过程中进行质量控制,以保证处理后的数据符合入库数据要求,笔者采用了对数据处理的每一步都进行验证数据的规则。这样就能在数据处理过程中第一时间发现问题并作出恰当的处理,以避免误差,保证数据质量。
依据不同测区的处理方案对处理后的数据在ArcMap 9.3环境下进行质量控制,并根据质量控制过程中发现的数据质量问题对测区处理方案进行反复修改,同时也对处理工具进行测试和修改,以确保数据经处理工具处理后数据的可靠性。质量控制的顺序一般为重要的数据层先检查,次要的数据层后检查,以次类推[3]。质量控制的内容包括[4-5]:①位置精度检查,将相同图幅号的Coverage格式数据与通过处理工具处理后的数据进行叠合,检查要素的位置偏差,是否符合规定要求;②属性精度检查,检查要素的属性项名称、类型、长度、顺序以及属性值等内容的正确性;③ 逻辑一致性检查,检查数据的点、线、面拓扑关系,要素图层划分,要素的相互关系及相邻图幅间接边等内容的正确性;④数据完备性检查,将相同图幅号的Coverage格式数据与通过处理工具处理后的数据进行叠合对照,检查数据覆盖范围内要素的完整性、要素图形与属性数据是否有遗漏;⑤ 数据文件检查,检查通过处理工具处理后的数据文件命名、数据格式等是否符合设计要求。
不同时期、不同测区基础地理信息数据DLG的入库数据处理是实现数据集中统一管理、提供应用服务的重要步骤。在进行数据处理过程中,由于各测区执行的标准不一致,造成生产的数据分层与命名、字段名、属性和GB码不统一,还有数据格式是Coverage格式,不是MDB格式,这都给数据入库带来巨大困难,并且在入库前数据处理的工作量非常巨大,尤其是在现阶段,数据生产部门主要采用Coverage格式进行数据生产。针对这种情况,本次对9个测区的1 852幅数据进行入库前数据处理,实现了不同时期、不同测区基础地理信息数据DLG的重构和处理。并通过对数据处理过程的技术总结,形成了可行的不同测区的数据处理方案,探索了通过软件工具与测区数据处理方案相结合的方法来处理入库数据不一致的数据现状,确保了入库数据的一致性和可靠性。
[1] 国家测绘局.CH/T 9005—2009基础地理信息数据库基本规定[S].北京:测绘出版社,2009.
[2] 中国国家标准化管理委员会.GB/T 13923—2006基础地理信息要素分类与代码[S].北京:中国标准出版社,2006.
[3] 钱海忠,武芳,郭健,等.基于制图综合知识的空间数据检查[J].测绘学报,2006,35(5):184-190.
[4] 国家测绘局.CH/T 1015.1—2007基础地理信息数字产品1∶10 000 1∶50 000生产技术规程[S].北京:测绘出版社,2007.
[5] 中国国家标准化管理委员会.GB/T 17941—2008数字测绘成果质量要求[S].北京:中国标准出版社,2008.
Data Processing of 1∶10 000 DLG at Different Times for Database
FAN Zhijian,FU Rong
0494-0911(2011)11-0041-03
P231.5
B
2011-04-15
范志坚(1966—),男,云南罗平人,高级工程师,主要从事空间数据处理和空间数据库的设计及应用工作。