邓韬 郑贵华
摘 要:叙述了GIS(地理信息系统)的功能及其技术特点、数据分层,并分析了地理数据的组织与数据结构。
关键词:GIS数据组织数据结构GIS技术特点
中图分类号:P208 文献标识码:A 文章编号:1674-098X(2012)06(b)-0115-02
GIS(地理信息系统)是基于计算机软硬件的、用于处理和管理与空间地理位置有关的综合空间信息系统,它是计算机图形学、数字图像处理和数据库技术相结合的产物,是集计算机科学、测绘遥感学、地理学、环境科学、空间科学、信息和管理科学于一体的新兴边缘学科。
1 GIS的功能及其技术特点
GIS可用来管理和分析一切与地理空间分布有关的环境、地质勘查、矿产资源管理、测绘、土地管理、公安、消防、电讯、国防、交通、教育等各个领域。GIS可定义为一个具有空间地理信息输入、存储、分析、输出功能的系统,是一个支持空间决策的系统。GIS按一定的空间拓扑关系,描述和存储各种空间要素,利用数据库管理系统的成熟技术,将地理属性数据管理和空间数据的拓扑关系相结合,使系统变得实用、灵活。GIS的功能大致可划分为数据输入、编辑,地图绘制,图形、数据输出,地图管理,空间数据拼接和提取等空间分析、计算,投影坐标转换,网络功能,数字地面模型等。
GIS的显著特点,就是在合理的空间拓扑关系上实现了地理的描述性属性数据和空间数据的有机连接,在属性数据管理上,运用了流行的关系数据库技术,使得GIS与外部关系数据库的连接十分容易。
2 GIS的空间数据组织与数据结构
GIS主要包括空间数据和与之相关联的属性数据。空间数据主要是指构成地图对象的几何图形,它主要由点、线、面等目标构成。属性数据主要由与地图对象相关联的文字信息、图像、声音、视频等构成。
在地理信息系统中,一般对地图进行分层组织。不同的图层,一般包含不同类型的地图对象。例如在一幅城市建设的地图上,可以将交通道路专门放在一个图层中,而将主要建筑物放在另外一个图层中。这样做,便于对同一类地图对象进行信息处理,而不受其它类型的对象干扰。例如,当用户只关心城市的交通状况时,就可以关闭建筑物等其它图层,只显示和查询处理交通层。当然,也可以将多个图层结合起来进行较复杂的信息处理。
地图图层由地图目标对象构成,而地图目标对象主要由点、线、面等基本目标组成,这些点、线、面都有它们的几何属性。这些几何属性描述了地图对象的坐标信息、颜色、线型、填充模式等特征。此外,地图对象还具有与之相关联的文字、图像、声音、视频等属性信息。由于这些属性信息都是与具体的地图目标对象相关联的,所以根据地理信息的这一特征,我们可以应用面向对象的方法来组织地理数据。
2.1 数据结构
数据结构是指数据之间的相互关系,即数据的组织形式,它是描述地理实体数据本身的组织方法,称之为内部数据结构。GIS内部数据结构主要有栅格数据结构、矢量数据结构两大类。其两类数据结构均可用来描述地理实体的点、线、面三种基本类型。
1)栅格数据结构
栅格数据结构是通过空间点的密集而规则的排列表示整体的空间现象的,其数据结构简单,定位存取性能好,可以与影像和DEM(数字高程模型)数据进行联合空间分析,数据共享容易实现,是地理信息系统重要的一种空间数据存储结构。
栅格结构是最简单、最直接的空间数据结构,也称之为网格结构(raster)或像元结构(Pixel),它是将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为像元或者像素,由行、列号定义,并包含一个代码,表示该像素的属性类型和量值。因此,栅格结构是以规则的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。
栅格结构中,点用一个栅格单元表示,线状地物则用沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有两个相邻单元在线上,面或区域用记录有区域属性的相邻栅格单元的集合表示,每个栅格单元可有多余两个的相邻单元同属一个区域。任何以面状分布的对象都可以用栅格数据逼近。遥感影像就属典型的栅格结构,每个像元的数字表示影像的灰度等级。
栅格结构表示的地表是不连续的,是量化和近似离散的数据。栅格数据的比例尺就是栅格大小与地表相应单元大小之比。
2)矢量数据结构
矢量数据结构是通过记录坐标的方式,尽可能地将点、线、面地理实体表现得精确无误。其坐标空间假定为连续空间,不必像栅格数据结构那样进行量化处理。因此矢量数据能更精确地定义位置、长度和大小。矢量结构的特点是定位明显、属性隐含。
点实体,矢量结构中只记录其在特定坐标系下的坐标和属性代码;线实体,就是用一系列足够短的直线首尾相接表示一条曲线,当曲线被分割成多而短的线段后,这些小线段可以近似地看成直线段,而这条曲线也可以足够精确地由这些小直线段序列表示,矢量结构中只记录这些小线段的端点坐标,将曲线表示为一个坐标序列,坐标之间认为是以直线段相连,在一定精度范围内可以逼真的表示各种形状的线状地物;“多边形”在地理信息系统中是指一个任意形状、边界完全闭合的空间区域。其边界将整个空间划分为两个部分:包含无穷远点的部分称为外部,另一部分称为多边形内部。区域的边界线,可被看作是由一系列多而短的直线段组成,每个小线段作为这个区域的一条边,因此这种区域就可以看作是由这些边组成的多边形了。
2.2 数据组织
数据是现实世界中信息的载体,是信息的具体表达形式,为了表达有意义的信息内容,数据必须按照一定的方式进行组织和存储。数据库是为一定目的服务,是以特定的数据存储的相互关联的数据集合,是数据按照一定的格式存放的仓库。GIS的数据库是某一区域内关于一定地理要素特征的数据集合。空间数据库与一般数据库相比,具有数据量特别大,不仅有地理要素的属性数据,还有大量的空间数据,其数据应用广泛。
数据库中的数据组织一般可分数据项、记录、文件和数据库四级。数据间的逻辑关系为一对一的关系,一对多的关系,多对多的关系。
数据项是定义数据的最小单位,也叫元素、基本项、字段等,数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域。
记录是由若干相关联的数据项组成,是处理和存储信息的基本单位,是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性。为了标识每条记录,都必须有记录的标识符,也叫“关键字”。
文件是一给定类型记录的全部具体值的集合,文件用文件名称标识。常用的数据文件有顺序文件、索引文件、直接文件和倒排文件。
顺序文件:是最简单的文件组织形式,对记录按照主关键字的顺序进行组织。当主关键字是数字型时,以其数值的大小为序;若主关键字是文字型的,则以字母的排列为序。
索引文件:除了存储记录本身(主文件)以外,还建立了若干索引表,这种带有索引表的文件叫索引文件。索引表中列出记录关键字和记录在文件中的位置(地址)。读取记录时,只要提供记录的关键字值,系统通过查找索引表获得记录的位置,然后取出该记录。
直接文件:又称随机文件,其存储是根据记录关键字的值,通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。查找时,通过同样的转换方法,可以直接得到所需要的记录。
倒排文件:是带有辅索引的文件,其中辅索引是按照一些辅关键字来组织索引的。倒排文件是一种多关键字的索引文件,其中的索不能唯一标识记录,往往同一索引指向若干记录。因而,索引往往带有一个指针表,指向所有该索引标识的记录。通过辅索引不能直接读取记录,而要通过主关键字才能查到记录的位置。
由于地理信息具有多维结构,而栅格结构中赋予每一个栅格的属性值是唯一的,这就要用多个栅格层数据来存储同一个地理区域的不同侧面信息。那么,如何在计算机中合理地组织这些栅格层数据以达到最优存储,空间最小,存取效率最高,如果每层像元的位置一一对应,则有三种可能的组织方式。
方法一:以像元为记录序列,不同层上同一像元位置上的各属性值表示为一个列数组。N层中只记录一层的像元位置,节约大量存储空间,因为栅格个数很多。
方法二:以层为基础,每层每个像元的位置、属性一一记录,结构最简单,但需要存贮空间最大,浪费存储。
方法三:以层为基础,每层内以多边形为序记录多边形的属性值和多边形内容像元的坐标。将同一层属性的制图单元的N个像元的属性只记录一次,便于地图分析和制图处理。
3 结语
矢量结构精度高,存储量小,易于建立拓扑关系,擅长管理线状物和拓扑搜索,易于网络分析,空间位置表达明显,属性隐含,图形显示质量好。但数据结构复杂,叠加操作困难,空间分析能力差、数学模拟困难、技术复杂(特别是软硬件)。
栅格结构精度稍低,图形数据量大,难于建立拓扑,属性表达明显,位置隐含,图形显示的可视性不如适量结构。但数据结构简单,易于遥感,空间操作分析容易和便于地表模拟,数学模拟方便,有发展潜力。
地理信息系统的主要任务是处理大量的空间数据以获得支持管理决策所需要的信息,就必然要存储和利用大量的、各种类型的数据。建立一个良好的数据库结构和文件组织形式,使其能够迅速、准确的进行空间分析、计算处理和查找所需要的数据,是衡量一个系统的主要标志之一。
因此,在设计数据库结构和组织文件形式时,应根据不同用途,使用要求、数据量、设备、技术水平等方面的条件来确定数据结构的组织形式、文件结构、文件类型、文件载体、文件维护等一系列要求,使系统具有处理速度快、占用存贮空间少,操作处理过程简单、查找容易、系统开销和费用低等特点。
参考文献
[1] 龚健雅.地理信息系统技术[M].北京.科学出版社,2001.
[2] 王亚民.现代地理信息系统及其应用[M].西安电子科技出版社,2006.
[3] MAPGIS地理信息系统参考手册[S].中国地质大学(武汉)信息工程学院.