戴海伦,王德冬,刘中秋,宋清泉,程立君,赵 翔
(1.北京吉威时代软件股份有限公司,北京 100043; 2.山东省遥感技术应用中心,山东 济南 250013;3.武汉大学 资源与环境科学学院,湖北 武汉 430079)
基础地理信息数据以数字线划图(Digital Line Graphics, DLG)和遥感图像等为载体,直观反映了地理空间要素的分布信息,为国民经济建设和空间决策提供了重要的依据和数据支持。近年来,我国社会经济持续高速发展,随之,地理要素也发生着快速变化。为维持基础地理信息数据集的现势性,使之及时反映地理要素的时空变化过程、保障数据使用价值,必须对其进行持续更新。如何利用不同来源的现势性资料对基础地理信息进行快速更新,已成为基础地理信息数据更新维护的主要任务和重要难题[1]。
为了全面掌握国家自然资源、经济社会状况在地理空间上的时空分布特征与基本规律,国家启动了地理国情普查和监测工作。地理国情普查的完成和后续监测陆续开展,为基础地理信息数据的更新提供了持续、可靠的现势性参考资料来源[2]。
地理国情普查数据集和基础地理信息数据集本质上属于异构数据,两者在要素分类体系、数据结构、坐标系统等方面均存在一定差异,为基础地理信息要素的变化检测和增量更新带来了一定技术困难。因此,针对地理国情普查成果应用和基础地理信息数据更新的实际需求,本文将研究基于地理国情数据集的基础地理信息数据更新方法,为基础地理信息数据库的增量式更新提供技术支撑,为区域空间规划管理、科学研究和社会公众服务等提供有力保障。
通过对地理国情普查成果数据和基础地理信息数据集及增量更新的需求分析,设计基于地理国情普查成果数据的基础地理信息数据增量更新技术路线,如图1所示。
图1 地理国情统计分析系统总体框架Fig.1 The overall framework of geographical national condition census data statistical analysis system
基于地理国情成果数据的基础地理信息数据增量更新包括以下5个关键技术步骤:①要素变化类型定义,根据实际应用情景需要,定义相应的要素变化类型,为要素变化信息提取及变化检测成果分析与应用奠定基础;②数据转换,将地理国情成果数据进行坐标系统、数据结构和语义等方面的转换,为实现两期异构要素的高精度匹配提供基础数据;③要素匹配,根据要素几何类型(点、线、面)分别从空间位置、形状和语义等角度设计要素匹配算法,实现两期异构数据集中的同名要素匹配,为变化信息提取提供依据;④变化信息提取,在要素匹配的基础上,根据要素几何类型分别设计要素变化信息识别和提取规则,提取变化信息;⑤增量更新,根据变化检测结果,将变化信息以增量的方式更新到基础地理信息数据集中,获得更新后的具有现势性的基础地理信息数据集。
基于地理国情普查成果数据特点及基础地理信息变化检测与增量更新需求,以下分别针对变化检测与增量更新中的关键技术进行阐述。
将地理国情普查成果数据集应用于基础地理信息的更新,首先需要进行数据转换,完成对国情普查成果数据的坐标系统、数据结构和语义转换,技术流程如图2所示。
图2 地理国情普查成果数据转换Fig.2 Conversion of geographical national condition census data
各技术环节的主要任务:①坐标系统转换,将国情成果数据使用的国家2000坐标系转换为基础地理信息数据集所使用的投影坐标系,为变化检测提供统一的数据基础;②数据结构转换,将国情要素按照对应的基础地理信息要素数据进行数据结构的转换,两者的对照关系见表1;③语义转换,在分析国情要素分类体系和基础地理信息要素分类体系的基础上,以本体论为理论基础,构建面向变化监测需要的地理要素本体库,完成地理国情要素向基础地理信息要素的语义转换,为同名要素匹配及变化更新奠定基础。
表1 基础地理信息与地理国情要素对照表Tab.1 The check list of basic geographic information and geographic national condition census data
基础地理信息要素与地理国情要素之间的匹配主要基于空间位置和形状的相似性匹配完成,为变化信息提取奠定基础。针对点、线、面要素的空间匹配,国内外相关学者展开了广泛而深入的研究[3-9]。针对基础地理信息要素变化检测与增量更新的实际工程应用需求,综合考虑算法精度和效率,根据要素几何类型,分别设计了不同类型几何要素的空间匹配特征及方法,见表2。
表2 要素匹配特征指标Tab.2 The feature index of elements matching
基于表2设计的特征指标进行要素匹配时,以其中一个数据集为基准,另一个数据集为参考,遍历基准数据集中要素对象,以空间查询为基础,完成对各要素在参考数据集中的同名要素匹配。对于基准数据集中的任意一个要素i,其在参考数据集中的匹配结果Mi取值范围为{0,1,N}(N>1)。
要素匹配时,以要素的对象编号为关键字,构建相应的同名要素匹配字典,将匹配结果在内存中进行存储,为变化信息的识别和提取奠定基础。
基于以上方法分别完成两个数据集之间的相互匹配:①以基础地理信息要素为基准,以国情要素为参考,完成基础地理信息要素对国情要素的匹配,得到匹配结果集O;②同时以国情要素为基准,完成国情要素对基础地理信息要素的匹配,得到匹配结果集N。
基础地理信息要素的变化可分为空间变化和属性变化。其中,属性变化主要是指要素的属性字段信息发生变化,如要素的名称等。要素空间变化类型主要参考现有相关研究结果[10-12]进行定义,见表3。
表3 要素空间变化类型Tab.3 Type for spatial changing elements
基于同名要素空间匹配结果,为了满足要素空间变化类型信息的提取,在同名要素匹配特征指标的基础上,设计了以下指标作为要素空间变化信息提取的识别特征,见表4。
表4 要素空间变化类型检测辅助指标Tab.4 Test auxiliary index of spatial changing elements
基于以上定义和方法基础,对于任意要素i,其对应的不同类型的变化类型定义如下:
①新生要素:Oi=0。②消亡要素:Ni=0。
③延长要素:Ni=1,且Oi=1,且|L|>TL,且L>0。④缩短要素:Ni=1,且Oi=1,且|L|>TL,且L<0。⑤扩大要素:Ni=1,且Oi=1,且|R|>TR,且R>0。⑥缩小要素:Ni=1,且Oi=1,且|R|>TR,且R<0。
⑦合并要素:Ni=n,n>1,且Oi=1,且新要素面积(长度)大于等于其匹配的旧要素集面积(长度)之和。
⑧分裂要素:Ni=1,且Oi=n,n>1,且旧要素面积(长度)大于等于其匹配的新要素集面积(长度)之和。
⑨变形要素:Ni=1,且Oi=1,n>1,且该新旧要素关系不属于③、④、⑤、⑥中的任意一种,且E>TRE。
⑩平移要素:Ni=1,且Oi=1,n>1,且该新旧要素关系不属于③、④、⑤、⑥、⑨中的任意一种,且:线要素Hij>Th,或面要素质心距离Dij>TD,则要素发生了平移。
按照以上规则,分别提取各种类型对应的变化信息,并加入到变化对象数组。
为了实现多时态基础地理要素的回溯,便于地理要素的变化分析,可在基础地理信息要素中启用时态数据管理,对所有要素图层加入两个时间型的要素生命周期字段:GDB_DateFrom和GDB_DateTo。其中,GDB_DateFrom表示该要素的生效时间,GDB_DateTo表示该要素的失效时间。
基于以上设计,根据变化检测结果,按照以下规则将发生变化要素以增量信息的方式写入基础地理信息要素图层中。
①新生要素:从地理国情要素集中将新生要素的图形和属性字段按照指定的数据格式和数据结构写入基础地理信息要素图层,并将新要素的GDB_DateFrom字段值赋为更新时点,将GDB_DateTo字段值赋为“9999-12-31”。
②消亡要素:将基础地理信息要素图层中的消亡对象标记为无效,即,将要素的GDB_DateTo字段值赋为更新时点。
③扩大缩小延长缩短变形平移合并分裂属性变化要素:将基础地理信息要素图层中对应的旧要素的GDB_DateTo字段值改为更新时点,将国情要素图层中对应的新要素插入到基础地理信息要素图层中,并将新要素的GDB_DateFrom字段值赋为更新时点,将GDB_DateTo字段值赋为“9999-12-31”。
基于C#4.0与ArcGIS,开发实现本文设计的变化检测与增量更新算法。选取山东省莱芜市某地作为实验区,对算法有效性进行验证和评估。其中,以基础测绘中的公路要素和居民地要素为增量更新测试对象,测试用机硬件配置为:Intel i5-6300 2.4GHZ CPU,4G 内存。变化检测与增量更新结果分别如图3和图4所示。
图3 线要素变化检测与增量更新实验结果(公路LRDL)Fig.3 Results of linear elements changing detection and incremental updating (road LRDL)
图3 所示,原始基础测绘数据集中的LRDL中共有153个要素,国情数据集中对应1104个要素,变化检测与增量更新操作共耗时5s。对变化检测的结果进行人工检验,其中变化类型检测错误的要素共37条,错误率约为3.4%。从图形上看,源自国情普查的数据内容更加丰富、详尽,通过增量更新不仅提高了原始数据的现势性,同时也提高了数据的准确性和完整性。
图4 面要素变化检测与增量更新实验结果(居民地RESA)Fig.4 Results of polygon elements changing detection and incremental updating(residential area RESA)
如图4所示,由于地理国情普查与基础测绘数据采集的标准和要求不同,导致两者数据集在图形的形状和空间分布上存在一定差异。原始基础测绘数据中的居民点图层共1 753个图斑,对应的地理国情数据集中有1 642个图斑。由于涉及复杂的空间形状相似性计算,居民地图斑的变化检测与增量更新耗时略长,总计约53 s。经人工检测,所有发生变化的图斑均被检测到;但从检测类型上看,约67个要素变化类型识别不合理。由于无论发生何种变化,都会被记录到变化要素集,因此不影响最终增量更新结果。图5是实验区的几种典型的变化检测结果。
图5 居民点几种典型的变化案例Fig.5 Several typical cases of residential changes
图5 中,红线为最新的国情要素,填充的多边形为2008年时点的基础测绘要素。由图5可知,本文设计的算法能够较为准确地识别出各种图斑变化。
本文立足于地理国情成果应用和基础地理信息数据更新的实际需求,提出了基于地理国情成果数据集的基础地理信息数据更新技术框架,设计了相应的数据转换、要素匹配、变化信息提取和增量更新系列方法。地理国情普查成果建库工作的完成以及地理国情监测工作的开展,将为基础地理信息数据集的更新提供及时、持续、可靠的参考数据集。本文的研究成果为基础地理信息数据库的增量式更新提供了重要的技术支撑,同时也将极大提高地理国情普查监测成果的应用价值。