温博格,何 津,陈 真,李晓飞,贾超卫
(1. 湖北大学资源环境学院,湖北 武汉 430062; 2. 珠海市规划局,广东 珠海 519000)
空间数据对比规则库研究
——以道路数据为例
温博格1,何津1,陈真2,李晓飞1,贾超卫1
(1. 湖北大学资源环境学院,湖北 武汉 430062; 2. 珠海市规划局,广东 珠海 519000)
Research on Rule Base for Comparing Spatial Data——Taking Transportation Data as an Example
WEN Boge,HE Jin,CHEN Zhen,LI Xiaofei,JIA Chaowei
摘要:随着GIS技术的发展,空间数据已被应用于各个领域,对空间数据的对比分析也提出了更高要求。本文提出了一种对比规则库的设计,可定义的空间、属性数据对比规则。通过对比规则库,可大大增强GIS系统数据对比分析功能的可扩展性、灵活性,提高操作人员的工作效率。本文还讨论了某省公路局历史数据对比分析系统的具体实现方案。
关键词:空间数据对比;规则库;道路交通
随着经济的飞速发展、城市化的不断推进,城市数量的增加和质量的提高带动了我国道路交通的迅猛发展。据不完全统计,我国2013年新建公路70 274 km。在道路交通蓬勃发展的同时,政府部门对系统庞大的道路交通网的规划与管理的难度越来越大。
每年交通部门需要投入巨大的人力物力对道路进行全方位的对比、分析与统计,以用于公路的有效管理和维护,更好地规划道路交通的发展。传统的对比分析通常针对特定业务对数据进行对比分析,作用单一。随着业务的不断扩展,对比分析方法的种类也不断增加,有时仅仅因为业务中的一个条件发生变化,就需要对应增加一类方法,致使操作步骤烦琐,大大降低了公路管理部门的工作效率,越来越难以满足信息量成爆炸式增长的道路交通发展[1-2]。
本文提出一种面向空间数据的对比分析规则库,基于兼具灵活性、扩展性和易用性的对比规则,以道路交通为例,为满足某省公路管理局道路交通方面的业务需求,实现基于规则库的道路交通数据对比、分析与统计方法,方便快捷有效地服务于某省公路管理局的历史数据资料的对比、分析和统计。
一、对比规则库分析
传统的空间数据对比分析采用人工对比的方式,依靠手工判断要素的属性和空间信息差异,其方式不够完善,人工投入大,时间耗费多,本文针对其不足提出了对比规则库的概念,将传统的对比分析方法集成在规则中,利用规则的灵活性、扩展性和易用性,实现公路管理局道路交通业务的信息化。用户根据业务需求将对比分析操作生成对比规则,在分析处理时选择相应规则,即可方便、灵活地进行复杂条件的综合判断[3]。
1. 规则的内容
规则库管理规则,规则定义了对比的内容及方法,规则包含以下3个部分。
(1) 标识字段
标识字段又称身份ID,具有唯一性,用于识别对比数据中的相同要素,即历年数据的唯一标识字段,如路段编码。它是对比规则的基础,每一条对比规则都必须选择至少一个唯一标识字段,用以识别对比数据集中的同一要素。
(2) 对比内容
对比内容是用户关注的变化信息。规则的对比内容分为两大类:属性信息和几何信息。属性信息是指空间数据中属性表的字段,是具有描述性的属性,如道路宽度;几何信息是指空间数据中要素的几何形状。
(3) 对比算子
算子定义了对比数据时所采用的算法[4]。本文对比规则算子由两类组成:属性数据对比算子、空间数据对比算子。
1) 属性数据对比算子是属性信息的比较运算,如大于、小于等。
2) 空间数据对比算子是几何信息的比较运算,如相交、重合等。
2. 对比规则类别
对比规则分为两大类别:
1) 属性数据对比规则,用于分析数据中属性信息发生变化的情况。
2) 空间数据对比规则,用于分析年数据中空间关系(空间位置和形状)发生变化的情况[5]。
3. 规则级别
规则级别有提示、警告、错误;通过对规则分级,对比规则不仅可以反映用户关注的变化,还可以用于数据审核。如定义一条规则,用于发现道路技术等级降低的道路,由于实际情况中道路技术等级不可能降低,因此符合该规则的道路数据属于错误情况。
二、对比规则库核心模块设计
1. 数据介绍
(1) 基础数据
本文使用的数据是某省公路局提供的历年道路数据,包括路段(polyline)、隧道(point)、桥梁(point)、渡口(point)等多种数据。
(2) 数据字典
数据字典记录规则库的元数据信息,它并不保存规则库实际的数据,而是保存管理这些实际规则数据的信息[5]。对比规则库根据具体业务需求的不同,将业务数据的描述保存在数据字典中。数据字典包括两部分:字段结构表和字段代码表。字段结构表包含数据属性字段的信息,如名称、编码、对应类型表名等;字段代码表包含枚举字段类型的所有值信息,如字段编码、名称、含义等,见表1、表2。
表1 数据字典表结构展示
表2 路段技术等级字段展示
2. 对比算子模块
对比算子模块是对比规则库的核心算法模块,本文主要从属性数据对比算子、空间数据对比算子两方面介绍对比算子模块。
(1) 属性数据对比算子
属性数据对比算子定义了属性信息的对比及筛选条件,主要有:=(等于)、<>(不等于)、>(大于)、<(小于)、>=(大于或等于)、<=(小于或等于)、介于、不介于、为空和不为空等。
用户可以在规则中根据逻辑关系(与、或、且非、或非)的任意组合,构成复合对比条件。
(2) 空间数据对比算子
空间数据对比算子实现空间要素的几何形状对比运算。本文经过试验总结出了几种常见的道路空间数据对比分析情况,并予以算法实现。主要有:
1) 道路打断,判断要素在经过数据库更新后被打断为两条或多条要素。
2) 道路编号变化,判断要素在经过数据库更新后编号属性值发生变化的情况。
3) 道路新增或删除,判断数据库经过更新后要素新增或删除情况。
4) 道路重复判断,在给定不同参数条件的基础上,判断要素可能出现的重复情况。
3. 规则库管理模块
规则库管理模块是规则库的核心模块,对比分析使用的空间对比规则、属性对比规则、属性筛选规则等均由统一的规则库管理维护,规则库采用微软最新的ADO.NET Entity Framework(EF)架构进行设计,对规则进行定义、更新、删除、维护和管理[6]。系统规则定义界面如图1所示。
图1 规则库定义界面
(1) 规则库对象模型设计
规则库设计采用EDM实体模型,将规则包含的各部分定义为独立的实体,如规则、规则类型、数据字典、对比字段、对比算子等。每个实体都包含各自的属性、关联关系(导航属性)、继承关系等,如图2所示。
图2 规则库类结构关系
(2) 规则关联
规则的关联表达的是规则之间及规则内实体之间的关系。一个关联关系包含多个属性:关联的名称、关联对象的导航属性(主键、外键)、关联对象的相互作用、对象是否关联删除,以及对象的关联多重性(即关联一个对象、多个对象、0或一个对象)。这种关联能够组合成复杂的逻辑关系,从而可以通过组合简单规则,以构建复杂的高级业务逻辑关系[7]。
(3) 规则存储
规则的存储运用EF架构,能够自动将对象映射到底层数据库,即将规则以类的形式存储在数据库中。其利用了抽象化数据结构的方式,将每个数据库对象都转换成应用程序对象(entity),而数据字段都转换为属性,关系则转换为结合属性,让数据库的E/R模型的转换为对象模型。
三、规则库实例——道路数据对比分析系统
空间数据对比规则库可应用于许多行业的基础地理数据的空间对比分析,本文基于道路历史数据对比分析系统,介绍基于规则库的路段要素属性对比查询、道路形状对比和疑似道路重复判断功能的系统实现。
1. 路段要素属性对比查询
本文采用基于规则库的方式来实现路段要素的属性对比,其核心是运用属性数据对比算子,定义丰富的属性对比分析。
以路段技术等级为例,每年同一条道路的路段技术等级相对于前一年只会提高不会降低,因此需要判断是否有路段技术等级降低的错误情况出现,可以定义如下规则:字段=“LDJSDJ”(路段技术等级);属性数据对比条件为大于(>),即第一年数据中同一条道路要素对应的字段(路段技术等级)的属性值比第二年的值大(值越高路段技术等级越低),比较结果如图3所示。根据此条规则,可以对历年数据进行路段技术等级错误检查与判断,通过将该业务需求定义为规则,保存在规则库中,操作人员直接调用,大大提高业务任务的效率及可操作性,使用简洁方便[8]。
图3 两年公路数据路段技术等级对比结果
2. 道路形状对比
道路形状对比是运用空间数据对比算子,针对道路空与间信息,对比查询历年道路的形状变化,用于统计分析历年公路数据的变化信息。根据要素位置信息、几何信息和属性信息综合对比判断道路形状的变化[9]。对比实例如图4所示,图4(a)为2012年某路段,图4(b)为2013年相同路段编码路段,图4(c)为2012年与2013年同一路段的形状对比。
3. 疑似道路重复判断
道路疑似重复判断主要用于道路测量、绘制、计算过程中可能会出现的一些重复路线,由于传统的判断重复道路采用人工目视查找判断,既需要人力又耗费时间,每当全省道路数据绘制完成后,需要在短时间完成重复道路的检查判断,往往需要投入大量人力物力[10]。本文采用基于规则的道路疑似重复判断,程序根据规则中的参数自动查找出疑似重复的道路,在此基础上提供给人工目视判断,虽然不能完全代替人工目视查找判断,不过基于计算机判断的疑似结果能够大大提高人工查找判断的效率,不仅节省了大量人力资源,更大大提高了时间效率,优点十分显著。对比实例如图5所示,图5(a)为2013年某路段疑似重复部分缩小显示结果,图5(b)为疑似重复部分放大显示结果。
图4 2013年公路数据形状变化结果
图5 疑似重复判断结果
四、结束语
空间数据对比规则库研究基于可定义的空间、属性数据的对比规则,增强了GIS系统数据对比分析功能的可扩展性、灵活性,提高了操作人员的工作效率。
本文介绍的道路数据对比分析系统以道路数据为例具体展示了对比规则库的使用。其在某省公路管理部门中,针对庞大的历史数据对比、分析需求,创建自定义规则进行计算,为规划、管理和维护交通道路提供了夯实的基础。
参考文献:
[1]张菊清,杨元喜.空间数据不确定性研究现状分析[J].地理空间信息,2009,7(3):4-8.
[2]李瑞敏,陆化善,郭敏.城市道路基础地理要素编码方法研究[J].公路工程,2009,34(5):37-40.
[3]胡丹,李洪兴,余先川.规则与规则库信息量的度量及其应用[J].中国科学(信息科学): F辑,2009,39(2):218-233.
[4]赵新昱,陈文伟,何义.基于算子空间的公式发现算法研究[J].国防科技大学学报(计算机软件与理论),2000(4):51-56.
[5]张远. 达梦数据库数据字典设计与实现[D]. 武汉:华中科技大学, 2011.
[6]陈永松. Entity Framework数据访问性能优化的几种方法[J]. 电脑开发与应用,2014(7):71-73.
[7]刘小生,任海峰,陈棉. 用空间分析方法进行空间关联规则提取[J]. 测绘通报,2007(5):19-21.
[8]童小华,邓愫愫,史文中.基于概率的地图实体匹配方法[J]. 测绘学报,2007,36(2):210-217.
[9]周顺平,柳怀颖.基于概率及符合指标的矢量数据对比[J]. 计算机应用,2010,30(10):2602-2604.
[10]蓝悦明,陈浩. GIS中道路重复检测算法的实现[J]. 武汉理工大学学报(信息与管理工程版),2011(6):339-345.
中图分类号:P208
文献标识码:B
文章编号:0494-0911(2016)03-0118-04
作者简介:温博格(1989—),男,硕士,主要研究方向为地理信息系统应用。E-mail:wenboge@qq.com通信作者: 何津。E-mail: he_jin@foxmail.com
收稿日期:2015-03-24
引文格式: 温博格,何津,陈真,等. 空间数据对比规则库研究——以道路数据为例[J].测绘通报,2016(3):118-121.DOI:10.13474/j.cnki.11-2246.2016.0102.