摘要:该文对森林景观管理系统的空间数据处理进行了分析,提出了基于ArcSDE的层次格网空间索引技术,层次网格索引是在传统网格索引的基础上, 进一步改进, 减少了传统网格索引的冗余和索引的大小。该技术在一定程度上减轻了空间数据网络传输和服务器的负担,提高了系统空间数据处理的性能。
关键词:森林景观管理系统;空间数据;格网空间索引
中图分类号:TP302 文献标识码:A 文章编号:1009-3044(2013)12-2768-03
1 概述
森林景观管理系统功能包括信息浏览、查询、编辑及打印,其中查询功能是系统实现的关键所在。查询功能主要是对属性数据与空间数据的处理,属性数据的处理相对较容易实现,而空间数据库的存储、管理、更新是实现森林景观管理系统功能的关键。森林景观管理系统空间数据引擎采用ArcSDE,后台数据库使用Oracle 10g,以Geodatabase的图层对象实现对空间数据的存储与组织,空间数据的符号化、标准化信息用地图文档的形式存储,最终实现森林景观管理系统空间数据适时动态的显示、查询和引用。
2 标准化系统空间数据
森林景观管理系统采用克拉索夫斯基椭球为空间参照系统,具体参数为:北京1954坐标系,采用高斯—克吕格投影类型。
1) 森林景观管理系统的源数据存储格式
森林景观管理系统的源数据存储格式为Shape格式存储的矢量数据,Shapefile文件格式非常简单、此文件格式主要采用非拓扑关系存储空间数据信息和属性信息,要素的几何信息存储形式为一系列矢量坐标的shape形式。
2) 森林景观管理系统的空间数据处理
森林景观管理系统采用Shape格式的矢量数据作为原始数据,主要是为满足塔河林业局森林景观管理系统的需要,为其提供更加丰富的数据,使其符合实际需求,系统首先将数据在ArcMap中对数据进行了处理,处理流程图如图1所示:
①数据的裁减:原始数据为整个塔河林业局,首先对林业局级的地理数据进行了处理,从原来的林业局级空间数据生成多个林场级数据。主要目的是为了能够在地图发布时可以单独对林场级数据进行操作。
②生成标注:为了在地图显示时,能够直接观察到地图的相关属性,对于部分图层根据其特定的属性值生成了标注图层,如林场标注、林班标注、小班标注等,并用关系类将标注图层与图层属性关联起来。
③边界数据处理:在对地图进行配置时,边界经常会重叠在一起,为了使得最终显示效果清晰明了,按照标准,当林场界和林班界,林班界和小班界重叠时,只绘出高一级的边界。例如,对于林班线图层和小班线图层发生重叠时,去掉小班线图层中林班线和小班线重叠的部分,只保留林班线图层的数据。
④数据配准:在操作处理完成地图数据数字化后要对数据配准进行严格检查,检查是否有地图要素被遗漏,是否有重复输入,是否有标记错误;还要对数据进行拓扑分析,相邻的图层要素拓扑关系是否正确,要素是否全部接边;是否有多余的悬挂线、破碎的多边形;多边形是否连通,标示点是否唯一。如果存在上述问题,则需要在ArcToolBox模块编辑修改,区域参数及属性可以反复进行修改,重新建立满足要求的拓扑关系。
⑤森林景观数据生成:森林景观的相关数据并没有包含在原始数据中,为了最终能够在地图上显示森林景观的相关信息,需要生成森林景观图层,系统利用小班图层的空间数据的优势树种属性生成了森林景观图层。
⑥标准地数据生成:标准地数据由塔河林业局提供了1个Excel格式数据,其中包括了标准地的基本信息:GPS坐标、林班号、小班号等。标准地图层的图形数据是根据标准地的GPS坐标生成,通过对Excel格式数据进行处理,最终生成dbf格式的属性数据,在ArcMap中将图形数据和属性数据进行关联,得到标准地数据。
3 数据组织
矢量数据(Vector Data)是用点,线,面及其X,Y坐标来构建点,线,面等具体空间要素的数据模型。森林景观系统的矢量数据按点状、线状、面状地形要素的特征分别建立林场、林班、小班、公共场所、居民点、边界线等空间数据库。
空间地理信息数据采用扫描和数字化获取。空间数据经过空间数据标准化后,系统主要从3个方面来对空间数据进行组织:基础地理数据、社会统计数据、林业专题数据。空间数据用ArcMap软件制作,属性数据库用Oracle 10g数据库构建。
4 基于ArcSDE的层次格网空间索引
ArcGIS对空间数据的存储主要通过ArcSDE来实现。ArcSDE,即数据通路,是ArcGIS的空间数据引擎,它是在关系数据库管理系统(RDBMS)中存储和管理多用户空间数据库的通路。ArcSDE支持的空间索引技术就是经过优化的格网空间索引,也即层次格网空间索引。ArcSDE为减少磁盘的输入/输出操作,对图层建立了空间索引表。为进一步加快空间查询速度,避免对整个表检索的目的,可以通过减少检索的记录数据,从而减少空间查询的时间。ArcSDE空间索引表包括格网单元、要素封装边界和要素Shape ID。此表的字段域详细说明信息见表1。
表1 空间索引表的字段域说明
[字段域\&说明\&SP_ FID\&空间要素的Shape ID,是空间要素的唯一标识,它与要素类中的空间要素的FID号相关联。\&GID\&格网单元标识号,也就是索引块标识号,用于唯一标识格网单元。\&EMINX, EMINY, EMAXX, EMAXY\&要素的封装边界。在图层中的每个空间要素都有一个封装边界,由包围Shape的最小边界框的左下角和右上角坐标确定的。 \&]
在空间索引表中,只有能够索引到要素的格网才拥有记录,空间实体对应情况表如图2所示。
最理想的情况是一个要素封装边界被包含在一个格网单元中,然而实际情况是要素的封装边界、大小变化较大,通常包含在多个格网单元中,因此需要采用多层格网索引,ArcSDE最多提供三层格网单元。由于层级格网索引的层数已定,那么针对本研究的关键性问题就是如何确定第一层格网数目以及每层格网长宽的取值。
4.1 第一层格网数目的确定
通过对森林景观管理系统中采集的塔河林业局林业空间数据的研究分析发现,可以将采集来的空间数据分成如下几种要素类:水系要素类、地物点要素类、交通线要素类以及各级行政区划要素类,各个要素类又可以形成相应的图层。对于点状的要素、线状要素类以及较大行政区划要素类如林业局要素类等,可以只采用一层格网索引的方式,就能够快速高效的查询对应图层。然而对于林班要素类和小班要素类来说,由于其分布较均衡但是面积大小不一的特点,所以要采取多层格网索引来提高检索的速度,减少查询冗余数据的时间损耗。这就需要对三层格网索引的大小,尤其是第一层格网数目制定最优的设置。在创建图层的过程中,用户可以根据需要自行的设置格网划分的长宽M、N值,用户在划分过程中需要满足如下格网划分的原则:
1) 格网的划分最大程度上使同一层中每个格网中的空间实体数量均衡;
2) 每一层格网划分后的空间实本数量应少于前一层格网中所包含的空间实体数量;
3) 尽量保证所划分的格网中空间实体较为均衡的分布。
4.2 每层格网长宽的取值
由于ArcSDE所支持的层次格网索引支持对图层的空间范围进行最多三次的划分,所以每次划分后格网的长宽值直接影响着空间索引的效率高低与否。如果采取下一次划分的长宽值是上一次划分长宽值的整倍数的方法,那么会发现一些低层次的空间实体的跨格网边线包含在高层次的格网中,所以高层次的格网长宽值最好并不是低层次格网长宽值的整数倍。此外,在划分过程中还应注意保证高层次的格网中的空间实体数目要少,只有这样才能保证高效的查询。经过归纳分析得出每层格网长宽取值原则如下:
1) 基于点层处理效率较高的特点,点层只需建立单级索引,格网大小可以选择得大一些;
2) 监视空间索引数据变化情况,若数据变化频繁,则索引的优劣需要重新评估,建立最优索引;
3) 根据实际应用及未知应用,都需要对Grid Index设置中的cell size参数进行调整和设置。
经过综合分析大量文献以及研究结果,对系统空间数据3层格网划分过程中,步长K值取3.5,这样不仅充分考虑到了格网大小的过渡变化,同样也考虑到了塔河林业局林班数据以及小班数据的实际情况,可以充分发挥3级格网索引的优势,提高了空间数据处理的性能。
4.3 格网大小参数设置
对于格网划分过程中cell size参数的设置可以通过Arc Catalog和SDE命令行两种方法来实现:
森林景观管理系统对于空间数据处理过程中,根据图层的信息改变Cell Size的参数设置,并没有获得性能上的明显提升。即对于森林景观管理系统中数据图层,在数据导入时,默认设置的Cell Size参数比较优化。
5 结束语
层次格网索引是在传统网格索引的基础上, 进一步改进, 减少了传统网格索引的冗余和索引的大小,减轻了网络传输和服务器的负担, 提高森林景观系统空间数据处理的整体性能。
参考文献:
[1] 邬伦,刘瑜,马修军.地理信息系统原理方法和应用[M].北京:科学出版社,2001:7-12.
[2] ArcGIS Server Administrator and Developer Guide[R].ESRI Corp,2004.
[3] 宋丽,王霓虹,李瑞改.基于GIS Server森林景观管理系统框架研究[J].微计算机信息,2009(1):229-231.
[4] 宋丽.塔河森林景观管理系统的研究[J].微计算机信息,2010(9):35-36.